Фінансові новини
- |
- 30.03.26
- |
- 13:52
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI випустила o1 — першу модель зі здібностями до «міркування»
13:12 13.09.2024 |
Компанія OpenAI представила свою останню модель штучного інтелекту під кодовою назвою Strawberry та офіційною назвою OpenAI o1, повідомляє TechCrunch. Модель є частиною сімейства, що включає дві версії: o1-preview і o1-mini, причому остання розроблена як менша і більш ефективна, призначена в першу чергу для генерації коду.
Наразі OpenAI o1 доступна для передплатників ChatGPT Plus та Team, а ранній доступ для корпоративних та освітніх користувачів буде відкрито наступного тижня. Однак модель o1 поки що є відносно базовою. На відміну від свого попередника, GPT-4o, їй бракує можливостей веббраузингу чи аналізу файлів, і хоча вона має функції аналізу зображень, вони тимчасово вимкнені для подальшого тестування. Крім того, ця модель обмежена за швидкістю, дозволяючи лише 30 повідомлень на тиждень для o1-preview і 50 для o1-mini.
Недоліком нової моделі також є її вартість. o1-preview має високу ціну в API - $15 за 1 мільйон вхідних токенів і $60 за 1 мільйон вихідних токенів, що значно дорожче, ніж GPT-4o. Попри ці проблеми, OpenAI планує зробити o1-mini доступним для всіх користувачів безплатного ChatGPT, хоча конкретної дати релізу ще не оголошено.
Що відрізняє o1 від інших моделей генеративного ШІ, так це його здатність "перевіряти себе", витрачаючи додатковий час на розгляд різних аспектів запиту перед тим, як відповісти. Ця здатність дозволяє моделі "думати" більш ефективно, що робить її придатною для складних завдань, які вимагають вищого рівня синтезу, таких як аналіз електронних листів на предмет привілейованої інформації або мозковий штурм маркетингових стратегій.
За даними OpenAI, o1 використовує навчання з підкріпленням, заохочуючи модель "думати", перш ніж відповісти, імітуючи ланцюжок думок. Це підкріплюється системою заохочень і покарань, що допомагає моделі планувати наперед і виконувати кілька дій для отримання відповіді. Таким чином, в теорії, чим довше OpenAI o1 обробляє запит, тим кращою буде відповідь.
Новий алгоритм оптимізації OpenAI та спеціально підібраний навчальний набір даних, який включає наукову літературу та дані міркувань, ще більше розширюють можливості o1. Під час випробувань o1 перевершив GPT-4o в різних завданнях, включаючи вирішення 83% завдань на відбірковому іспиті Міжнародної математичної олімпіади (у порівнянні з 13% у GPT-4o) і потрапляння в 89-й процентиль на змаганнях з програмування Codeforces.
Хоча o1 перевершує свої можливості в таких сферах, як аналіз даних, наука та кодування, модель має певні обмеження. Наприклад, вона може бути повільнішою за інші моделі, відповідаючи на певні запити понад 10 секунд. Крім того, перші тестувальники повідомляли, що o1 може "галюцинувати" (генерувати неправильні, але впевнені відповіді) частіше, ніж GPT-4o, і менш схильна визнавати, що не знає відповіді.
Попри ці проблеми, OpenAI вважає, що o1 - це крок вперед у міркуваннях ШІ. Дослідники Google DeepMind продемонстрували аналогічні покращення точності моделі, даючи своїм моделям більше часу на обчислення відповідей, що підкреслює жорстку конкуренцію в галузі ШІ. Цікаво, що OpenAI вирішив не показувати необроблені "ланцюжки думок" o1 в ChatGPT, посилаючись на проблеми конкуренції, і замість цього вирішив показувати "згенеровані моделлю резюме" цих ланцюжків.
Як пише ITC.ua, під час презентації моделі o1 представники OpenAI продемонстрували її здатність швидко розв'язувати складні головоломки. Зокрема, модель за 30 секунд розв'язала заплутану задачу про вік принца та принцеси:
«Принцеса зараз така ж за віком, яким буде принц, коли принцеса буде вдвічі старша за вік принца тоді, коли вік принцеси становив половину суми їхнього теперішнього віку. Скільки років принцу та принцесі? Надайте всі можливі розв'язки цієї задачі.
Інтерфейс o1 розроблено так, щоби показувати етапи міркування моделі. Він використовує фрази на кшталт «Мені цікаво», «Я думаю про це» та «Добре, подивімось», створюючи ілюзію людського мислення. Творек підкреслює, що це не спроба прирівняти мислення ШІ до людського, а лише демонстрація глибшого підходу моделі до розв'язання проблем.
Остаточним випробуванням для OpenAI стане забезпечення широкої доступності o1 за більш прийнятною ціною. Компанія планує продовжувати вдосконалювати модель, експериментуючи з версіями, які могли б міркувати протягом тривалих періодів - від годин до днів або навіть тижнів - для подальшого поліпшення її здібностей до міркувань.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Верховна Рада розгляне законопроєкт №11115 щодо регулювання діяльності
Telegram та інших цифрових платформ. Документ уже отримав одноголосну
підтримку профільного парламентського комітету. Про це повідомив автор
законопроєкту народний депутат Микола Княжицький.
Україна сподівається залучити у Міжнародної фінансової корпорації
розвитку США (DFC) кредит на $1,4 мільярда для закупівлі обладнання для видобутку газу.
Премʼєр-міністр України Юлія Свириденко зазначила 4 млн 764 тис. 661 грн
доходів в електронній декларації про майно та доходи за 2025 рік.
Державна служба статистики зафіксувала аномально різке зростання індексу
цін виробників у лютому - на 22,3% у місячному вираженні.
Процес продовження бронювання працівників на порталі "Дія" спростили і
тепер перебронювання відбувається автоматично і не потребує попереднього
анулювання чинного статусу.
Дізнайтеся, як обрати аромадифузор для спальні, ванної та вітальні: враховуйте тип, аромат, об'єм флакону та насиченість запаху для комфортної атмосфери
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
Європейський парламент більшістю голосів підтримав пропозиції до закону
про штучний інтелект, які, серед іншого, передбачають заборону додатків,
що генерують фейкові оголені зображення реальних людей.
Google запустив функцію Search Live у 200 країнах, з Україною включно:
вона дозволяє вести інтерактивні діалоги з Пошуком у режимі ШІ, з
використанням камери та голосу.
Поки власники сучасних смартфонів з острахом дивляться на прогноз
погоди, де обіцяють бодай -10°C, китайські вчені вирішили зайти з
козирів.
Google оголосила
про масштабне оновлення для Google TV, яке інтегрує три нові можливості
на базі Gemini. Мета нововведень - перетворити телевізор на активного
помічника, який забезпечує не лише розваги, а й інформативний контент.
Федеральна комісія зі зв'язку США (FCC) визнала всі нові моделі
маршрутизаторів, виготовлені за межами країни, загрозою національній
безпеці та включатиме їх до списку Covered List, повідомляє Engadget.
Microsoft повідомила про серію змін у Windows 11, які з'являться у
тестових збірках для учасників програми Windows Insider вже у березні та
квітні 2026 року. Компанія заявила, що оновлення базуються на аналізі
відгуків користувачів.
Вчені Кембриджу завершили перше дослідження стійкості біткоїна до збоїв
мережевої інфраструктури, зосередившись на інцидентах із підводними
кабелями. Результат виявився трохи неочікуваним - але здебільшого у
гарному сенсі.
Компанія Blue Origin, заснована Джеффом Безосом, подала до Федеральної
комісії зі зв'язку США (FCC) заявку на реалізацію масштабного проєкту
під назвою Project Sunrise, який передбачає запуск до 51 600 супутників
для формування орбітальної мережі дата-центрів.
Генеральний директор Cloudflare Меттью Прінс заявив під час виступу на
конференції SXSW, що до 2027 року обсяг трафіку від ботів перевищить
людський.
Китайські дослідники, схоже, знайшли спосіб обійти одну з найдорожчих
перешкод на шляху до квантового майбутнього. Йдеться про критичну
залежність від гелію-3 - надзвичайно рідкісного ізотопу, ціна якого
змушує фінансових директорів технологічних компаній нервово здригатися.
Американський мільярдер Ілон Маск оголосив про запуск проєкту Terafab -
спільного підприємства своїх компаній Tesla, SpaceX та xAI - для
будівництва «найбільшого у світі заводу з виробництва чипів».
Лідером ринку залишається CATL із часткою 39,2%. Компанія збільшила
чистий прибуток на 42% у 2025 році - до 72,2 млрд юанів (близько $10,5
млрд). Серед клієнтів - китайські автовиробники та європейські компанії,
зокрема Volkswagen і Mercedes-Benz.
Дискусія навколо впливу квантових обчислень на безпеку біткоїна
набирає обертів на тлі нових технологічних проривів і досліджень.
Google готує нові обмеження для встановлення застосунків поза
офіційним магазином Android, але не відмовляється від цієї
можливості повністю.