Фінансові новини
- |
- 19.06.26
- |
- 23:21
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Україна та Німеччина 18 червня підписали угоду в оборонній сфері, що
стосується спільної розробки системи ППО для перехоплення балістичних
ракет.
Учасники 35-го засідання Контактної групи з питань оборони України у
форматі "Рамштайн" оголосили про виділення близько $4 млрд нової
військової допомоги Україні, повідомив міністр оборони Михайло Федоров.
Велика Британція виділяє 752 мільйони фунтів стерлінгів, аби закупити
150 тисяч безпілотників та понад 350 ракет та радарів протиповітряної
оборони для України. Про це йдеться на сайті британського уряду.
Уряд Нідерландів у середу зобов'язався придбати для України безпілотники
та засоби протиповітряної оборони на загальну суму 500 мільйонів євро;
половина цих коштів виділятиметься через програму PURL.
Если Не отображаются комментарии в TikTok, это не всегда означает бан или поломку аккаунта.
Контроль особистих фінансів не означає жити в обмеженнях; він означає розуміти, що відбувається з грошима, і приймати рішення усвідомлено.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
Sandisk презентувала нову лінійку SSD для PS5 за шаленими цінами.
Фахівці компанії Zimperium повідомили про виявлення небезпечного
Android‑трояна під назвою Rokarolla, який здатний викрадати облікові
дані та іншу конфіденційну інформацію з понад 200 додатків для
банківських операцій та криптовалют
На Unreal Fest NVIDIA оголосила
про випуск бета-версії ACE Game Agent SDK. Цей фреймворк призначений
для створення локальних ігрових персонажів зі штучним інтелектом. SDK
постачається разом із набором плагінів NVIDIA ACE для Unreal Engine 5.
Microsoft нарешті вирішила звернути увагу на одну з найбільш
дратівливих особливостей своєї операційної системи. Компанія випустила
попередню збірку Windows 11 Insider Preview Build 26300.8687 для
експериментального каналу, яка обіцяє покласти край нескінченним циклам
оновлень.
Google офіційно випустила Android 17 для смартфонів та планшетів Pixel після чотирьох бета-версій. Оновлення вже почало поширюватися на сумісні пристрої.
Найбільший український мобільний оператор "Київстар" оголосив про запуск
роботи месенджерів Viber, WhatsApp та застосунку навігації Google Maps
через технологію Starlink Direct to Cell (D2C, прямий супутниковий
зв'язок зі смартфоном) у режимі Light Data, повідомив президент та СЕО
компанії Олександр Комаров
Попри те, що 68% українських IT-компаній залишаються прибутковими,
понад 31% юридичних осіб у сфері інформаційних технологій завершили 2025
рік зі збитками.
Кілька днів тому стало відомо, що новій главі XBOX Аші Шармі (Asha Sharma) поставлено завдання
збільшити прибутковість бренду, оскільки вище керівництво Microsoft
відмовляється надалі проводити безрезультатні вливання мільярдів
доларів.
Американські компанії активно нарощують найм фахівців зі штучного
інтелекту, однак скористатися цим бумом можуть переважно досвідчені
працівники.
Stellantis, Volkswagen і Renault об'єдналися, щоб закликати до
спрощення правил і запровадження стимулів для виробництва продукції з
маркуванням "Зроблено в Європі" та протидії китайським виробникам
електромобілів.
TSMC розробляє нову технологію пакування мікросхем під назвою CoPoS
(Chip-on-Panel-on-Structure), яка може знизити собівартість виробництва
чипів та покращити їхню продуктивність.
Компанія Google нарешті зрозуміла, що сучасні меню налаштувань
телевізорів нагадують лабіринт Мінотавра, тільки без нитки Аріадни. Нове
оновлення для Google TV
інтегрує ШІ-помічника Gemini безпосередньо в систему керування залізом.
Компанія SpaceX офіційно встановила
ціну на свої акції в межах найбільшого в історії США первинного
публічного розміщення. Виробник ракет Ілона Маска тепер входить до
списку найцінніших корпорацій планети.
Державна податкова служба України розробила законопроєкт про
податкову медіацію, що дозволить бізнесу та податковій частину спорів
вирішувати без суду.