Фінансові новини
- |
- 13.01.26
- |
- 15:13
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Переможцем конкурсу стала компанія Dobra Lithium Holdings, акціонери якої - Techmet та The Rock Holdings
Міністр закордонних справ Норвегії Еспен Барт Ейде оголосив про
виділення $400 млн допомоги Україні, які будуть спрямовані на
енергетичний сектор та функціонування української держави.
Німецький оборонний концерн Rheinmetall оголосив, що вже на початку 2026 року Україна має отримати перші бойові машини Lynx KF41
Міністр закордонних справ Норвегії Еспен Барт Ейде розповів про плани
його країни щодо співпраці з українськими виробниками зброї.
Україна розглядає запропонований США план створення вільної економічної зони на Донбасі.
Голова Асоціації деревообробних підприємств України, наголосив на необхідності системної інтеграції деревообробної та меблевої галузей, а також індустріального дерев’яного будівництва до державних програм відбудови й житлової політики.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
У Великій Британії заборонили використовувати штучний інтелект для
створення інтимних зображень із людьми, які не давали на це дозвіл.
Першим транспортним засобом із твердотілою батареєю, який можна офіційно
купити у США, став електромотоцикл Verge TS Pro. Його показали на CES
2026, і він одразу продемонстрував як переваги, так і головну проблему
цієї технології.
У центрі Львова запустили пілотну мережу 5G - вперше в Україні зі
швидкістю передавання даних близько 500 Мбіт/с на одного абонента.
Nissan Leaf поступився статусом найпопулярнішого електрокара в Україні
Дефіцит оперативної пам'яті для споживчих товарів назвали небаченим щонайменше за два десятиліття
Платформа Windows 11 on Arm нарешті отримала процесор, який здатен на
рівних конкурувати з чипами Apple. Новий Snapdragon X2 Elite Extreme
показав вражаючі результати в Geekbench і суттєво скоротив розрив між
Windows-ноутбуками та MacBook на Apple Silicon.
YouTube оновив інструменти розширеного пошуку. Тепер користувачі можуть
виключити Shorts, тобто відео тривалістю до трьох хвилин, із
результатів.
Top Lead за підтримки Міністерства цифрової трансформації України провела дослідження
використання штучного інтелекту українськими компаніями.
Йдеться про двоногі машини, призначені для виконання виробничих завдань нарівні з традиційним промисловим обладнанням.
Із 1 січня 2026 у зв'язку із збільшенням мінімальної заробітної плати в
Україні зросли деякі виплати роботодавцям, які адмініструє Державна
служба зайнятості.
Mercedes-Benz встановить на новий CLA систему допомоги водію на базі
програмної платформи NVIDIA DRIVE AV. Технологію представили на виставці
Consumer Electronics Show (CES) 2026 у Лас-Вегасі.
Universal Music Group (UMG) уклала партнерство з NVIDIA для впровадження
нової моделі штучного інтелекту у свій музичний каталог. Про це пише
The Verge.
За словами Джима Джонсона, віцепрезидента Intel і керівника Client
Computing Group, ключові акценти нової серії - енергоефективність,
зростання продуктивності CPU, більший інтегрований GPU, потужніші
ШІ-блоки та повна сумісність з x86-застосунками.
На CES 2026 компанія AMD анонсувала свій новий флагманський процесор Ryzen 7 9850X3D, який став найшвидшим у серії 9000X3D. Чип базується на архітектурі Zen 5 і оснащений технологією AMD 3D V-Cache другого покоління, що забезпечує виняткову ігрову продуктивність, особливо в порівнянні з конкурентами.