Фінансові новини
- |
- 18.12.24
- |
- 20:50
- |
- RSS
- |
- мапа сайту
Авторизация
OpenAI випустила o1 — першу модель зі здібностями до «міркування»
13:12 13.09.2024 |
Компанія OpenAI представила свою останню модель штучного інтелекту під кодовою назвою Strawberry та офіційною назвою OpenAI o1, повідомляє TechCrunch. Модель є частиною сімейства, що включає дві версії: o1-preview і o1-mini, причому остання розроблена як менша і більш ефективна, призначена в першу чергу для генерації коду.
Наразі OpenAI o1 доступна для передплатників ChatGPT Plus та Team, а ранній доступ для корпоративних та освітніх користувачів буде відкрито наступного тижня. Однак модель o1 поки що є відносно базовою. На відміну від свого попередника, GPT-4o, їй бракує можливостей веббраузингу чи аналізу файлів, і хоча вона має функції аналізу зображень, вони тимчасово вимкнені для подальшого тестування. Крім того, ця модель обмежена за швидкістю, дозволяючи лише 30 повідомлень на тиждень для o1-preview і 50 для o1-mini.
Недоліком нової моделі також є її вартість. o1-preview має високу ціну в API - $15 за 1 мільйон вхідних токенів і $60 за 1 мільйон вихідних токенів, що значно дорожче, ніж GPT-4o. Попри ці проблеми, OpenAI планує зробити o1-mini доступним для всіх користувачів безплатного ChatGPT, хоча конкретної дати релізу ще не оголошено.
Що відрізняє o1 від інших моделей генеративного ШІ, так це його здатність "перевіряти себе", витрачаючи додатковий час на розгляд різних аспектів запиту перед тим, як відповісти. Ця здатність дозволяє моделі "думати" більш ефективно, що робить її придатною для складних завдань, які вимагають вищого рівня синтезу, таких як аналіз електронних листів на предмет привілейованої інформації або мозковий штурм маркетингових стратегій.
За даними OpenAI, o1 використовує навчання з підкріпленням, заохочуючи модель "думати", перш ніж відповісти, імітуючи ланцюжок думок. Це підкріплюється системою заохочень і покарань, що допомагає моделі планувати наперед і виконувати кілька дій для отримання відповіді. Таким чином, в теорії, чим довше OpenAI o1 обробляє запит, тим кращою буде відповідь.
Новий алгоритм оптимізації OpenAI та спеціально підібраний навчальний набір даних, який включає наукову літературу та дані міркувань, ще більше розширюють можливості o1. Під час випробувань o1 перевершив GPT-4o в різних завданнях, включаючи вирішення 83% завдань на відбірковому іспиті Міжнародної математичної олімпіади (у порівнянні з 13% у GPT-4o) і потрапляння в 89-й процентиль на змаганнях з програмування Codeforces.
Хоча o1 перевершує свої можливості в таких сферах, як аналіз даних, наука та кодування, модель має певні обмеження. Наприклад, вона може бути повільнішою за інші моделі, відповідаючи на певні запити понад 10 секунд. Крім того, перші тестувальники повідомляли, що o1 може "галюцинувати" (генерувати неправильні, але впевнені відповіді) частіше, ніж GPT-4o, і менш схильна визнавати, що не знає відповіді.
Попри ці проблеми, OpenAI вважає, що o1 - це крок вперед у міркуваннях ШІ. Дослідники Google DeepMind продемонстрували аналогічні покращення точності моделі, даючи своїм моделям більше часу на обчислення відповідей, що підкреслює жорстку конкуренцію в галузі ШІ. Цікаво, що OpenAI вирішив не показувати необроблені "ланцюжки думок" o1 в ChatGPT, посилаючись на проблеми конкуренції, і замість цього вирішив показувати "згенеровані моделлю резюме" цих ланцюжків.
Як пише ITC.ua, під час презентації моделі o1 представники OpenAI продемонстрували її здатність швидко розв'язувати складні головоломки. Зокрема, модель за 30 секунд розв'язала заплутану задачу про вік принца та принцеси:
«Принцеса зараз така ж за віком, яким буде принц, коли принцеса буде вдвічі старша за вік принца тоді, коли вік принцеси становив половину суми їхнього теперішнього віку. Скільки років принцу та принцесі? Надайте всі можливі розв'язки цієї задачі.
Інтерфейс o1 розроблено так, щоби показувати етапи міркування моделі. Він використовує фрази на кшталт «Мені цікаво», «Я думаю про це» та «Добре, подивімось», створюючи ілюзію людського мислення. Творек підкреслює, що це не спроба прирівняти мислення ШІ до людського, а лише демонстрація глибшого підходу моделі до розв'язання проблем.
Остаточним випробуванням для OpenAI стане забезпечення широкої доступності o1 за більш прийнятною ціною. Компанія планує продовжувати вдосконалювати модель, експериментуючи з версіями, які могли б міркувати протягом тривалих періодів - від годин до днів або навіть тижнів - для подальшого поліпшення її здібностей до міркувань.
|
|
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :