Фінансові новини
- |
- 08.05.26
- |
- 09:26
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Велика Британія готується розпочати переговори щодо приєднання до
плану Європейського Союзу з надання Україні кредиту на суму 90 млрд
євро.
Франція запропонувала Греції угоду про передачу всіх її винищувачів
Mirage 2000 Україні в обмін на вигідні умови придбання винищувачів
Rafale у компанії Dassault Aviation.
Зазначається, що розгортання української системи Sky Map на авіабазі
Принца Султана, про яке раніше не повідомлялося, є ознакою того, як
українські військові значно просунулися вперед у технологіях дронів та
боротьби з ними
Посли-постійні представники країн-членів Європейського союзу схвалили як
останній законодавчий акт - зміни до регламенту про багаторічну
фінансову політику ЄС, який був необхідний для забезпечення виплати
Україні
Український президент наголосив, що відновлення "Дружби" Київ пов'язує з
розблокуванням Європейським Союзом кредиту у 90 млрд євро для потреб
України.
Посудомийна машина для багатьох сімей стала такою ж звичною, як
холодильник. Питання сьогодні - не «брати чи не брати», а під які
реальні потреби підбирати
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
Браузер Google Chrome почав автоматично завантажувати локальну
ШІ-модель розміром у 4 ГБ на пристрої користувачів для роботи Gemini
Nano. Про це пише Neowin із посиланням на звіт дослідника Александра Ханффа в The Privacy Guy.
Антимонопольні регулятори Європейського Союзу вимагають, аби Google
поділилася даними свого пошукового рушія з конкурентами, як-от OpenAI.
Бенчмарк AnTuTu опублікував рейтинг найпотужніших флагманських Android-смартфонів за квітень 2026 року.
Microsoft пояснила, чому оновлення Windows 11 останнім часом займають
набагато більше часу і в деяких випадках можуть потребувати кількох
перезавантажень - але компанія каже, що це не привід для занепокоєння.
Microsoft у своєму блозі оголосила
про атракціон небаченої щедрості. Компанія вирішила переглянути
механізм оновлень Windows 11, зробивши його значно менш токсичним для
користувача.
Microsoft нарешті визнала те, що геймери та ентузіасти зрозуміли ще
пару років тому: 16 ГБ оперативної пам'яті у 2026 році - це як
намагатися запхати вміст квартири у валізу ручної поклажі.
Антимонопольний комітет звернувся до операторів Vodafone, "Київстар" та
lifecell щодо зміни комунікації про "безлімітний мобільний інтернет".
Упродовж першого кварталу 2026 року український автопарк поповнили 50,1 тис вживаних легковиків, що були ввезені з-за кордону.
Компанія Google розширила можливості свого чат-боту Gemini.
Тепер він може генерувати готові файли, придатні до завантаження та
пересилання.
Ринок пам'яті увійшов у фазу різкого подорожчання, і це вже напряму б'є по собівартості смартфонів.
Аналітичні підрозділи Coinbase Institutional та Glassnode опублікували
прогноз на II квартал 2026 року, в якому оцінили стан крипторинку як
нейтральний.
Використання штучного інтелекту вже стало повсякденною практикою для
більшості студентів і працівників, однак ключовою конкурентною перевагою
на ринку праці в найближчі роки залишатимуться не технічні, а людські
навички - комунікація, лідерство, емоційний інтелект, критичне мислення
та здатність працювати з людьми.
В Києві з 27 квітня на майданчиках КП "Київтранспарксервіс" змінюються тарифи на паркування.
До 2031 року кількість мільярдерів у світі може
сягнути 3915. Найбагатші люди світу накопичують кошти прискореними
темпами через розвиток технологій, зокрема штучного інтелекту.