У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.

OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.

У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.

Модель досягла визначних результатів у різних тестах:

* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.

Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.

Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.

Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.

OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.

Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.

Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".

Відео на тему:

За матеріалами: mezha.media

Ключові теги: OpenAI

ТОП-НОВИНИ

Влада планує нову податкову амністію для легалізації доходів

Державна служба фінансового моніторингу розробляє законопроєкт щодо нової податкової амністії.

ТОП-НОВИНИ

Законопроєкт Грема про "пекельні санкції" проти Росії отримав підтримку Сенату США

У ніч на 29 липня Сенат США ухвалив ключове рішення, яке необхідне для ухвалення "пекельних санкцій" проти Росії, які просував покійний сенатор Ліндсі Грем.

«Укренерго» підвищує тариф на передачу електроенергії: що зміниться з 1 серпня

Національна комісія, що здійснює державне регулювання у сферах енергетики і комунальних послуг (НКРЕКП), на засіданні у вівторок ухвалила рішення підвищити з 1 серпня тарифи Укренерго на передання електроенергії для бізнесу.

Брюссель просить заблокувати закон, ухвалення якого було однією з його вимог

Ухвалення законопроєкту - частина податкових зобов'язань, які взяла на себе Україна в межах програми з МВФ. Крім цього, оподаткування доходів з цифрових платформ - один з необхідних кроків на шляху до євроінтеграції.

Українські дрони отримають британський захист: Лондон передасть технології РЕБ

Україна отримає від Великої Британії технологію радіоелектронної боротьби для блокування виявлення українських дронів.

ПІДПИСКА НА НОВИНИ

ПРЕС-РЕЛІЗИ

Автономність та батарея нових флагманів Apple iPhone 18 Pro Max

Питання автономності залишається одним із ключових чинників під час вибору сучасного мобільного пристрою преміального сегмента.

Тилові вакансії «Азову»: посади для фінансистів

Ця тилова вакансія підходить для кандидатів, що не можуть виконувати бойові завдання у звʼязку із віком чи станом здоровʼя.

У РУБРИЦІ

Конфлікт навколо FIFA: Європа допускає бойкот ЧС через прихід приватних інвесторів

Європейські футбольні федерації розглядають можливість застосування крайнього заходу - бойкоту майбутніх чемпіонатів світу. Причиною стали плани президента FIFA Джанні Інфантіно залучити приватних інвесторів до комерційної діяльності організації, повідомляє Sky News.

Перший випадок неконтрольованої поведінки ШІ: система «гуляла» інтернетом 4 дні

Наразі цю модель ШІ деактивували, зашифрували та обмежили доступ до неї навіть для дослідників.

США запроваджують обмеження на іноземні роботи й сонячне обладнання через загрозу шпигунства

Під нові обмеження можуть потрапити не лише гуманоїдні роботи, а й роботи-пилососи вагою понад 2 кг. Власники вже придбаних пристроїв зможуть користуватися ними й надалі.

Конкурент ASML: Китай розпочав серійний випуск установок DUV-літографії

Як повідомляє The Information, китайська держкомпанія з Шанхаю почала масове виробництво установок DUV-літографії з імерсійним випроміненням.

Історичний рубіж: капіталізація Apple подолала позначку у $5 трлн

Ринкова вартість Apple Inc. під час торгів у вівторок вперше перевищила позначку в $5 трлн доларів.

Сам звів «античний амфітеатр» і заробляв на туристах: в Італії винесли вирок чоловіку

В Італії чоловік переконав місцеву владу, що виявив один із «найстаріших і найбільших амфітеатрів» світу, і водив туди туристів. Насправді він сам збудував цю споруду 20 років тому.

Конкурент Starlink: Amazon планує угруповання з 5105 супутників для мобільного зв’язку

Підрозділ Amazon Leo подав до Федеральної комісії зі зв'язку США (FCC) заявку на запуск 5105 супутників на низькій навколоземній орбіті.

• далі...

« Липень 2026 »
Пн	Вт	Ср	Чт	Пт	Сб	Нд
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

©1999-2022 Всі права на даний ресурс належать BIN
BIN™ не завжди поділяє думку авторів публікацій
Любе використання інформації агентств "Українські Новини" та "інтерфакс-Україна" ЗАБОРОНЕНО!

Бізнес

У США представили «живий» матеріал для 3D-принтерів із властивостями біологічних тканин

Дослідники з Техаського університету в Остіні створили новий матеріал для 3D-друку, який імітує одну з ключових властивостей людських тканин - здатність вибірково пропускати одні молекули та затримувати інші.

Керівник OpenAI вважає, що ера сингулярності штучного інтелекту вже настала

Генеральний директор OpenAI Сем Альтман заявив, що розвиток сфери штучного інтелекту вже досяг етапу, який донедавна існував лише на сторінках наукової фантастики.

Гонка ШІ прискорюється: NVIDIA і Microsoft виступили за відкриті моделі після Kimi K3

Провідні технологічні компанії, серед яких NVIDIA, Microsoft, Palantir та Meta Platforms, звернулися до американських політиків із закликом підтримати розвиток відкритих моделей штучного інтелекту, позиціонуючи такий підхід як ключовий фактор для збереження технологічного лідерства США.

Аналог Starlink з України готує масштабний запуск супутників на орбіту

Угруповання розробляють насамперед для потреб уряду та Збройних Сил України, а в перспективі - і для надання доступу країнам-союзницям.

Криптомайнінговий пул Poolin оголосив про банкрутство: активи виставили на продаж

Сінгапурська компанія Poolin, яка свого часу була найбільшим біткоїн-майнінговим пулом у світі, разом із дочірніми структурами Lonestar Dream Inc та Lonestar Taproot LLC подала заяву про банкрутство за процедурою Chapter 11 до Суду США у справах про банкрутство округу Нью-Джерсі.

Новий термоядерний реактор Texatron виходить на випробування після схвалення влади Техасу

Поки світ обережно спостерігає за прогресом великих державних проєктів, приватний сектор у Техасі вирішив, що вистачить чекати милості від природи чи бюджетних комітетів.

Google оштрафували на понад мільярд доларів: ЄС вимагає змінити Пошук і Google Play

Європейська комісія прийняла рішення у двох розслідуваннях щодо Google та виписала компанії два штрафи - один, на €460 мільйонів, за надавання переваги власному пошуковому сервісу над конкурентами та другий, на €430 мільйонів, за обмеження можливості Android-розробників перенаправляти користувачів на альтернативні способи оплати.

• далі...

	за	курс	uah	%
USD	1	44,8789	0,0488	0,11
EUR	1	51,0812	0,0119	0,02

	куп.	uah	%	прод.	uah	%
USD	44,6881	0,10	0,23	45,1658	0,09	0,21
EUR	50,9135	0,12	0,24	51,5338	0,13	0,24

	куп.	uah	%	прод.	uah	%
USD	44,8600	0,11	0,24	44,8900	0,11	0,24
EUR	51,1089	0,04	0,09	51,1252	0,04	0,09

Ім'я користувача:
Пароль:

Фінансові новини

Авторизация

OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини

ТЕГИ

ТОП-НОВИНИ

ТОП-НОВИНИ

ПІДПИСКА НА НОВИНИ

ПРЕС-РЕЛІЗИ

У РУБРИЦІ

Бізнес