Фінансові новини
- |
- 07.12.25
- |
- 23:55
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


У розмові взяли участь президент Франції Емманюель Макрон, канцлер
Німеччини Фрідріх Мерц, голова Єврокомісії Урсула фон дер Ляєн та інші
лідери. 
Державна служба геології та надр України продала спеціальний дозвіл
на розробку Любинецької нафтогазової площі у Львівській області.
Верховна Рада не розглядатиме питання запровадження ПДВ для фізичних осіб-підприємців.
Європейська комісія в середу офіційно запропонувала внести Росію до
власного чорного списку країн з високим ризиком відмивання грошей і
фінансування терористичної діяльності.
Стабильное качество фарша — одно из ключевых условий для успешной кухни.
Независимо от формата заведения, будь то бистро или гастрономический
ресторан, консистенция, структура и свежесть мясной массы определяют
уровень блюда.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Netflix та Warner Bros. досягли угоди про придбання: компанію оцінили
у $27,75 за акцію та $72 млрд в капіталі ($82,7 млрд з урахуванням
боргу). Очікується, що угоду закриють після виділення підрозділу
Discovery Global в окрему публічну компанію, заплановане на третій
квартал 2026 року.
Аналітичне агентство Counterpoint опублікувало список найбільш
популярних смартфонів на світовому ринку в третьому кварталі 2025 року.
За 10 місяців 2025 року в Україні було реалізовано на 6% менше нових
комерційних автомобілів, ніж за аналогічний період минулого року.
Очікуване зростання потужностей ШІ-галузі посилило обговорення енергетичних обмежень технологічної інфраструктури.
У розпалі гострого дефіциту оперативної пам'яті американський гігант
Micron Technology оголосив про вихід з ринку споживчої продукції.
Європейські лоукости планують відновити польоти в Україну одразу після
того, як авіапростір стане безпечним для пасажирських рейсів.
Сукупний обсяг угод зі злиттів і поглинань за участю компаній, що
працюють у криптовалютному секторі, від початку 2025 року сягнув
рекордних $8,6 млрд, пише Bloomberg із посиланням на дані PitchBook
Data.
У листопаді 2025 року український ринок нових авто продовжив зміщуватися в бік електромобілів.
Соціологи зіткнулися з новим ризиком, оскільки великі мовні моделі (LLM)
здатні видавати себе за людей і проходити стандартні перевірки якості.
Понад третину нових легкових автомобілів, проданих у світі цього року, виготовлено в КНР.
Усі інші проєкти відходять на другий план заради покращення ChatGPT.
Функція працює лише між абонентами, які збережені одне в одного в контактах і використовують стандартний додаток для дзвінків.
Xiaomi EV продовжує стрімко нарощувати свої позиції на ринку електромобілів
Samsung офіційно показала свій перший потрійний складаний смартфон -
Galaxy TriFold. Модель стане доступною в Кореї 12 грудня, а згодом вийде
на ринки Китаю, Тайваню, Сінгапуру та ОАЕ. У першому кварталі 2026 року
смартфон також має з'явитись в США.