Фінансові новини
- |
- 16.04.26
- |
- 21:56
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI анонсує нові моделі міркування o3 і o3-mini, які можуть мислити на рівні людини
09:18 25.12.2024 |

У фінальний день своєї 12-денної події "shipmas" компанія OpenAI представила o3, нову модель ШІ для розумових завдань, яка є наступником o1. Разом із нею було презентовано й компактний варіант - o3-mini, розроблений для виконання специфічних завдань. Цей реліз обіцяє значний прорив у можливостях ШІ моделювати розумові процеси та є наступним кроком до AGI.
OpenAI справді заявляє, що o3, за певних умов, наближається до AGI (штучного загального інтелекту) - системи, здатної виконувати більшість економічно важливих завдань, які зазвичай виконує людина. Хоча компанія підкреслює, що це ще не остаточний прорив, але результати тестів моделі o3 значно перевершують попередні моделі OpenAI.
У тесті ARC-AGI, який оцінює здатність ШІ освоювати нові навички поза межами навчальних даних, o3 отримала 87,5% у режимі високих обчислень, утричі перевершивши продуктивність o1 у найнижчому режимі.
Модель досягла визначних результатів у різних тестах:
* 96,7% на Американському математичному іспиті 2024 року;
* 87,7% у GPQA Diamond, відповідаючи на питання рівня магістратури з біології, фізики та хімії;
* Новий рекорд 25,2% у тесті Frontier Math від EpochAI, що значно перевершує конкурентів.
Попри ці досягнення, експерти, як-от співавтор ARC-AGI Франсуа Шолле, застерігають від переоцінки цих результатів, вказуючи на проблеми o3 з виконанням простих завдань і високі витрати на використання її передових режимів.
Ще одним значним покращенням в o3 є можливість налаштування часу обчислень, що дозволяє користувачам вибирати низький, середній або високий режими залежно від складності завдання. Хоча вищий режим забезпечує кращі результати, він також збільшує затримку: відповіді можуть займати від кількох секунд до хвилин.
Модель використовує процес "приватного ланцюга мислення", що дозволяє їй внутрішньо аналізувати завдання, пояснювати свій процес і надавати надійніші результати у таких галузях, як фізика, математика та програмування.
OpenAI визнає потенційні ризики, пов'язані з o3, з огляду на проблеми, виявлені у попередній моделі. Модель o1, наприклад, продемонструвала вищу схильність до обману користувачів порівняно з іншими моделями. Команди OpenAI зараз застосовують методику "дискримінаційного узгодження" для забезпечення відповідності o3 принципам безпеки.
Щоб мінімізувати ризики, OpenAI спочатку зробить доступною o3-mini для тестування дослідниками безпеки, тоді як o3 стане доступною пізніше у 2025 році. Генеральний директор Сем Альтман також виступає за створення федеральної системи тестування для оцінки потенційного впливу таких моделей.
Варто зазначити, OpenAI назвала сімейство моделей o3 замість o2, щоб уникнути потенційних конфліктів з британським телекомунікаційним оператором O2. Під час презентації Альтман визнав, що його компанія не дуже добре розбирається в брендах, сказавши: "З огляду на традиції OpenAI, яка дуже, дуже погано розбирається в назвах, модель буде називатися o3".
Відео на тему:
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Перший транш військової допомоги Україні, яка буде передана в рамках
кредиту ЄС на суму в 90 млрд євро, буде спрямований на закупівлю дронів
українського виробництва.
Партнери України за підсумками засідання Контактної групи з питань
оборони України (у форматі «Рамштайн») 15 квітня вирішили виділити для
Києва чотири мільярди доларів на посилення ППО і понад півтора мільярда
доларів - на безпілотники.
Велика Британія надасть Україні новий пакет оборонної допомоги, який
передбачає щонайменше 120 тисяч дронів цього року, заявив британський
уряд 15 квітня.
Під час українсько-німецьких урядових консультацій 14 квітня в Берліні
німецька компанія Quantum Systems оголосила про створення двох
додаткових спільних підприємств у рамках ініціативи «Будуй з Україною».
Україна та Німеччина підписали три угоди в оборонній сфері на чотири
мільярди євро. Вони спрямовані на посилення ППО, розвиток далекобійних
спроможностей та спільне виробництво дронів.
На початку 2026 року Національний банк України вперше зробив окремий
список небанківських фінансових компаній, які суттєво впливають на
ринок.
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
Компанія Anthropic,
один із головних конкурентів OpenAI, офіційно запровадила процедуру KYC
(Know Your Customer) для окремих користувачів своєї платформи Claude.
YouTube додав новий ліміт часу для перегляду Shorts. Фактично, він
дозволяє взагалі прибрати короткі відео із стрічки, пише The Verge.
Google представила Gemini Robotics-ER 1.6 - оновлення своєї моделі
робототехніки, орієнтованої на мислення, що дозволяє роботам розуміти
оточення з "безпрецедентною точністю".
Штучний інтелект (ШІ) - це фундаментальний зсув у галузі фінансів, він
дуже суттєво та в короткі терміни її змінить, заявив глобальний керівник
напряму цифрових банків у BBVA, однієї з найбільших фінансових груп
світу, Мурат Калкан.
У криптоіндустрії набирає обертів дискусія щодо майбутнього безпеки
біткоїна на тлі розвитку квантових обчислень. Група розробників на чолі з
Джеймсоном Лоппом опублікувала
пропозицію BIP-361, яка передбачає поетапне заморожування монет, що
залишаються вразливими до квантових атак - включно з потенційними
активами Сатоші Накамото у $74 млрд.
Онлайн-платформа для бронювання житла Booking.com підтвердила витік
особистих даних клієнтів. Йдеться про імена, email-адреси та деталі
бронювання, повідомляє TechCrunch.
Інвестиційний гігант BlackRock у своєму прогнозі на ІІ квартал 2026
року зафіксував різку зміну динаміки глобальних ринків: після кількох
років домінування технологічних гігантів і теми штучного інтелекту (ШІ)
інвестори почали переоцінювати ризики та шукати нові точки зростання.
Microsoft пришвидшила початкове налаштування Windows 11 (OOBE): як
зазначає Neowin, тепер дозволено пропускати обов'язкові оновлення, коли
систему запускають вперше на новому ПК.
Компанія SiFive, заснована у 2015 році інженерами з Каліфорнійського
університету в Берклі, які розробили проєкт мікросхеми з відкритим
вихідним кодом, залучила додаткові $400 млн у рамках раунду
фінансування, який перевищив пропозицію, оцінивши компанію в $3,65 млрд
Південна Корея вводить універсальний базовий доступ до мобільного
інтернету для громадян на швидкості до 400 Кбіт/с, повідомляє The
Register з посиланням на місцеву владу.
Криптоіндустрія прискорює розробку рішень для протидії потенційним
атакам квантових комп'ютерів.
Експорт електромобілів та гібридних авто з Китаю в березні цього року
зріс більш ніж удвічі, до рекордного рівня, оскільки глобальний
енергетичний шок, спричинений війною в Ірані, відновив інтерес до
електрокарів.
Amazon оголосила про плани запустити власний супутниковий
інтернет-сервіс Leo у середині 2026 року. Про це повідомив генеральний
директор компанії Енді Джессі у щорічному листі до акціонерів, пише
Engadget.
Схоже, епоха, коли мобільні процесори скромно тулилися в тіні
настільних рішень, остаточно добігає кінця. MediaTek, яка останні кілька
років активно витісняє конкурентів з преміального сегмента, готує
справжнього монстра - Dimensity 9600 Pro.