Фінансові новини
- |
- 07.12.25
- |
- 03:27
- |
-
RSS - |
- мапа сайту
Авторизация
![]() | |
|
"Коли зачинились одні двері, відкриваються інші, але ми цього часто не помічаємо, втупившись у зачинені двері" Гелен Келлер |
OpenAI випустила o1 — першу модель зі здібностями до «міркування»
13:12 13.09.2024 |
Компанія OpenAI представила свою останню модель штучного інтелекту під кодовою назвою Strawberry та офіційною назвою OpenAI o1, повідомляє TechCrunch. Модель є частиною сімейства, що включає дві версії: o1-preview і o1-mini, причому остання розроблена як менша і більш ефективна, призначена в першу чергу для генерації коду.
Наразі OpenAI o1 доступна для передплатників ChatGPT Plus та Team, а ранній доступ для корпоративних та освітніх користувачів буде відкрито наступного тижня. Однак модель o1 поки що є відносно базовою. На відміну від свого попередника, GPT-4o, їй бракує можливостей веббраузингу чи аналізу файлів, і хоча вона має функції аналізу зображень, вони тимчасово вимкнені для подальшого тестування. Крім того, ця модель обмежена за швидкістю, дозволяючи лише 30 повідомлень на тиждень для o1-preview і 50 для o1-mini.
Недоліком нової моделі також є її вартість. o1-preview має високу ціну в API - $15 за 1 мільйон вхідних токенів і $60 за 1 мільйон вихідних токенів, що значно дорожче, ніж GPT-4o. Попри ці проблеми, OpenAI планує зробити o1-mini доступним для всіх користувачів безплатного ChatGPT, хоча конкретної дати релізу ще не оголошено.
Що відрізняє o1 від інших моделей генеративного ШІ, так це його здатність "перевіряти себе", витрачаючи додатковий час на розгляд різних аспектів запиту перед тим, як відповісти. Ця здатність дозволяє моделі "думати" більш ефективно, що робить її придатною для складних завдань, які вимагають вищого рівня синтезу, таких як аналіз електронних листів на предмет привілейованої інформації або мозковий штурм маркетингових стратегій.
За даними OpenAI, o1 використовує навчання з підкріпленням, заохочуючи модель "думати", перш ніж відповісти, імітуючи ланцюжок думок. Це підкріплюється системою заохочень і покарань, що допомагає моделі планувати наперед і виконувати кілька дій для отримання відповіді. Таким чином, в теорії, чим довше OpenAI o1 обробляє запит, тим кращою буде відповідь.
Новий алгоритм оптимізації OpenAI та спеціально підібраний навчальний набір даних, який включає наукову літературу та дані міркувань, ще більше розширюють можливості o1. Під час випробувань o1 перевершив GPT-4o в різних завданнях, включаючи вирішення 83% завдань на відбірковому іспиті Міжнародної математичної олімпіади (у порівнянні з 13% у GPT-4o) і потрапляння в 89-й процентиль на змаганнях з програмування Codeforces.
Хоча o1 перевершує свої можливості в таких сферах, як аналіз даних, наука та кодування, модель має певні обмеження. Наприклад, вона може бути повільнішою за інші моделі, відповідаючи на певні запити понад 10 секунд. Крім того, перші тестувальники повідомляли, що o1 може "галюцинувати" (генерувати неправильні, але впевнені відповіді) частіше, ніж GPT-4o, і менш схильна визнавати, що не знає відповіді.
Попри ці проблеми, OpenAI вважає, що o1 - це крок вперед у міркуваннях ШІ. Дослідники Google DeepMind продемонстрували аналогічні покращення точності моделі, даючи своїм моделям більше часу на обчислення відповідей, що підкреслює жорстку конкуренцію в галузі ШІ. Цікаво, що OpenAI вирішив не показувати необроблені "ланцюжки думок" o1 в ChatGPT, посилаючись на проблеми конкуренції, і замість цього вирішив показувати "згенеровані моделлю резюме" цих ланцюжків.
Як пише ITC.ua, під час презентації моделі o1 представники OpenAI продемонстрували її здатність швидко розв'язувати складні головоломки. Зокрема, модель за 30 секунд розв'язала заплутану задачу про вік принца та принцеси:
«Принцеса зараз така ж за віком, яким буде принц, коли принцеса буде вдвічі старша за вік принца тоді, коли вік принцеси становив половину суми їхнього теперішнього віку. Скільки років принцу та принцесі? Надайте всі можливі розв'язки цієї задачі.
Інтерфейс o1 розроблено так, щоби показувати етапи міркування моделі. Він використовує фрази на кшталт «Мені цікаво», «Я думаю про це» та «Добре, подивімось», створюючи ілюзію людського мислення. Творек підкреслює, що це не спроба прирівняти мислення ШІ до людського, а лише демонстрація глибшого підходу моделі до розв'язання проблем.
Остаточним випробуванням для OpenAI стане забезпечення широкої доступності o1 за більш прийнятною ціною. Компанія планує продовжувати вдосконалювати модель, експериментуючи з версіями, які могли б міркувати протягом тривалих періодів - від годин до днів або навіть тижнів - для подальшого поліпшення її здібностей до міркувань.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


У розмові взяли участь президент Франції Емманюель Макрон, канцлер
Німеччини Фрідріх Мерц, голова Єврокомісії Урсула фон дер Ляєн та інші
лідери. 
Державна служба геології та надр України продала спеціальний дозвіл
на розробку Любинецької нафтогазової площі у Львівській області.
Верховна Рада не розглядатиме питання запровадження ПДВ для фізичних осіб-підприємців.
Європейська комісія в середу офіційно запропонувала внести Росію до
власного чорного списку країн з високим ризиком відмивання грошей і
фінансування терористичної діяльності.
Стабильное качество фарша — одно из ключевых условий для успешной кухни.
Независимо от формата заведения, будь то бистро или гастрономический
ресторан, консистенция, структура и свежесть мясной массы определяют
уровень блюда.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Netflix та Warner Bros. досягли угоди про придбання: компанію оцінили
у $27,75 за акцію та $72 млрд в капіталі ($82,7 млрд з урахуванням
боргу). Очікується, що угоду закриють після виділення підрозділу
Discovery Global в окрему публічну компанію, заплановане на третій
квартал 2026 року.
Аналітичне агентство Counterpoint опублікувало список найбільш
популярних смартфонів на світовому ринку в третьому кварталі 2025 року.
За 10 місяців 2025 року в Україні було реалізовано на 6% менше нових
комерційних автомобілів, ніж за аналогічний період минулого року.
Очікуване зростання потужностей ШІ-галузі посилило обговорення енергетичних обмежень технологічної інфраструктури.
У розпалі гострого дефіциту оперативної пам'яті американський гігант
Micron Technology оголосив про вихід з ринку споживчої продукції.
Європейські лоукости планують відновити польоти в Україну одразу після
того, як авіапростір стане безпечним для пасажирських рейсів.
Сукупний обсяг угод зі злиттів і поглинань за участю компаній, що
працюють у криптовалютному секторі, від початку 2025 року сягнув
рекордних $8,6 млрд, пише Bloomberg із посиланням на дані PitchBook
Data.
У листопаді 2025 року український ринок нових авто продовжив зміщуватися в бік електромобілів.
Соціологи зіткнулися з новим ризиком, оскільки великі мовні моделі (LLM)
здатні видавати себе за людей і проходити стандартні перевірки якості.
Понад третину нових легкових автомобілів, проданих у світі цього року, виготовлено в КНР.
Усі інші проєкти відходять на другий план заради покращення ChatGPT.
Функція працює лише між абонентами, які збережені одне в одного в контактах і використовують стандартний додаток для дзвінків.
Xiaomi EV продовжує стрімко нарощувати свої позиції на ринку електромобілів
Samsung офіційно показала свій перший потрійний складаний смартфон -
Galaxy TriFold. Модель стане доступною в Кореї 12 грудня, а згодом вийде
на ринки Китаю, Тайваню, Сінгапуру та ОАЕ. У першому кварталі 2026 року
смартфон також має з'явитись в США.