Фінансові новини
- |
- 05.02.26
- |
- 15:01
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Згідно з її даними, порівняно з попереднім кварталом, з урахуванням
сезонного фактору, реальний ВВП збільшився на 0,7% з урахуванням
сезонного фактору, а квартал тому цей показник складав 0,8%.
Рада ЄС у середу, 4 лютого, узгодила свою позицію щодо правової бази для
імплементації угоди Європейської Ради про надання Україні кредиту в
розмірі 90 мільярдів євро на 2026-2027 роки.
У США по бойовому випробували крилату ракету Rusty Dagger для України, створену за програмою ERAM.
Невиконані за підсумками 2025 року 15 індикаторів плану в рамках
програми Ukraine Facility можуть коштувати Україні близько EUR4 млрд,
йдеться у презентації консорціуму RRR4U (Resilience, Reconstruction and
Relief for Ukraine).
Кабмін спростив ввезення до України літій-іонних акумуляторів. Про це повідомила пресслужба Мінекономіки.
2026 рік остаточно закріпив за побутовою технікою статус повноцінних
гаджетів. Інтеграція в екосистему «розумного будинку» перестала бути
фантастикою і перетворилася на базове очікування користувачів.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Ілон Маск став першою людиною в історії зі статками понад $850 млрд
після угоди між SpaceX та xAI. За оцінками Forbes, злиття ракетобудівної
компанії з бізнесом Маска у сфері штучного інтелекту та соціальних
медіа збільшило його капітал на $84 млрд - до рекордних $852 млрд.
Intel має намір знову вийти на ринок пам'яті, уклавши партнерство з дочірньою компанією SoftBank - Saimemory.
Акції технологічних та софтверних компаній обвалилися на тлі побоювань,
що розвиток штучного інтелекту (ШІ) витіснить бізнес-моделі традиційних
розробників програмного забезпечення (ПЗ).
Українська defense tech компанія Swarmer подала заявку на первинне розміщення акцій (ІРО) на американській біржі Nasdaq.
Автомобіль перебуває в активному використанні вже 18 місяців без
тривалих простоїв. За цей час власник проїжджав у середньому майже 500
км щодня, що робить цей випадок особливо показовим з точки зору зносу.
Аналітики найближчим часом прогнозують суттєве подорожчання оперативної пам'яті та твердотільних накопичувачів, пише NotebookCheck
Згідно з документом, SpaceX та xAI спільно створять у космосі
потужний обчислювальний центр, величезні потреби в енергії якого будуть
компенсуватися за рахунок енергії Сонця
Міністерство оборони опублікувало алгоритм, як верифікувати термінал супутникового зв'язку Starlink в Україні для військових та цивільних.
Роскомнагляд заблокував понад 4,7 млн інтернет-сторінок у рамках боротьби із "забороненою інформацією".
Група вчених заявила про розробку нового типу волоконно-оптичних
чипів з потенційною щільністю інтеграції д 100 тис. транзисторів на
сантиметр.
В Google офіційно повідомили, що YouTube більше не дозволяє відтворювати
відео у фоновому режимі через сторонні мобільні браузери для
користувачів без платної підписки Premium.
Минулого року NVIDIA випустила GeForce NOW для Steam Deck, що
використовує операційну систему Steam OS на базі Linux, де сервіс
забезпечував ігри в 90 FPS при роздільній здатності до 1200p.
Apple та Samsung повністю домінували на світовому ринку смартфонів у
2025 році. Як свідчать дані Counterpoint Research, обидві компанії
четвертий рік поспіль зайняли всі десять позицій у рейтингу найбільш
продаваних моделей.
Ринкова капіталізація Microsoft різко скоротилася на рекордні $360 млрд
після публікації фінансового звіту, який показав значні витрати на
будівництво дата-центрів.