Фінансові новини
- |
- 30.05.26
- |
- 14:02
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Рада виконавчих директорів Світового банку схвалила новий проєкт SPIRIT
для України з загальним обсягом $880 млн, з яких $860 млн становитиме
позика самого банку, а решту $20 млн - гранти від Великої Британії та
Німеччини через цільовий фонд підтримки, відновлення, відбудови й
реформування України
Україна отримає транш у розмірі майже 2,8 млрд євро після того, як Рада
Євросоюзу ухвалила рішення про сьоме виділення коштів у рамках Механізму
підтримки ЄС Ukraine Facility.
Перша партія шведських винищувачів JAS 39 Gripen для України надійде
разом із далекобійними ракетами класу "повітря-повітря" Meteor.
Президент Володимир Зеленський під час візиту до Швеції розповів про новий пакет допомоги Україні, який виділила ця країна.
Прем'єр Швеції Ульф Крістерссон оголосив про майбутню передачу Україні
16 винищувачів Gripen, які були у використанні, і про плани продажу 20
одиниць нової моделі цього літака.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
YouTube
почав автоматично виявляти та позначати відео, створені або суттєво
змінені за допомогою генеративного штучного інтелекту.
Американський технологічний гігант Nvidia, який є провідним розробником
чипів для штучного інтелекту, планує збільшити щорічні витрати на
Тайвані до 150 млрд дол. оскільки вважає острів «епіцентром революції
ШІ».
Ринок нових легкових автомобілів у ЄС у квітні 2026 року зріс у річному вимірі на 5,1% і досяг 972,3 тис. одиниць, повідомляє Європейська асоціація автовиробників (ACEA).
Google
оновила Gemini for Home та додала нові функції автоматизації для
"розумного" дому на базі штучного інтелекту. Тепер система може
запускати різні сценарії залежно від того, що бачать домашні камери
відеоспостереження.
Китай обмежив закордонні поїздки для провідних спеціалістів зі штучного
інтелекту у приватних компаніях і нині для виїзду вони мають отримати
відповідний дозвіл від влади
Мільярдер та інвестор Марк К'юбан заявив, що продав більшу частину
своїх біткоїнів. За його словами, він розчарувався у здатності
криптовалюти виступати захисним активом під час геополітичних потрясінь і
послаблення долара.
У Китаї почали масово навчати гуманоїдних роботів для роботи на
фабриках, у магазинах та у сфері послуг.
Популярний мобільний відеоредактор CapCut, який за час існування
завантажили понад 1,2 млрд разів, оголосив про партнерство з Google. У
рамках співпраці можливості редактора інтегрують безпосередньо в чат-бот
Gemini.
Автомобільний концерн Stellantis, створений в результаті злиття Fiat
Chrysler і PSA Group, у четвер, 21 березня, представив п'ятирічний
стратегічний план FaSTLAne 2030 вартістю 60 млрд євро.
За 2025-2026 рік кількість ІТ-ФОПів знизилася на 21%, і це найбільше зниження з 2016 року.
SpaceX офіційно подала документи для виходу на біржу Nasdaq під тикером
SPCX. Як пише TechCrunch, компанія повідомила, що сукупні збитки
компанії з моменту заснування перевищили $37 млрд.
Світовий ринок електромобілів продовжує стрімко зростати, але
нерівномірно: фактично формується "K-подібна" динаміка, де одні регіони
різко прискорюються, а інші відстають.
Поки світовий авторинок лихоманить від китайської експансії та
падіння попиту на дорогі «електрички», старі німецькі друзі вирішили
триматися разом.
Японські дослідники створили бездротову систему зв'язку зі швидкістю передачі даних 112 Гбіт/c в діапазоні 560 ГГц.