Фінансові новини
- |
- 12.01.26
- |
- 03:19
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI транскрибувала понад мільйон годин YouTube-відео для навчання GPT-4
22:43 08.04.2024 |

За даними The New York Times, OpenAI розробила модель аудіотранскрипції Whisper та транскрибувала понад мільйон годин відео на YouTube, щоб отримати високоякісні матеріали для навчання моделі GPT-4.
Повідомляється, що компанія знала, що такі дії є юридично сумнівними та знаходяться в «сірій зоні» авторського права. Однак вона вважає це добросовісним використанням матеріалів. Президент OpenAI Грег Брокман особисто брав участь у зборі відео, які були використані.
OpenAI вичерпала запаси корисних даних у 2021 році та обговорювала транскрипцію відео YouTube, подкастів і аудіокниг після перегляду інших ресурсів. До того часу компанія навчала свої моделі на даних, які включали комп'ютерний код із Github, бази даних ходів у шахах і вміст шкільних завдань із Quizlet.
Прессекретар OpenAI Ліндсей Хелд повідомила, що компанія курує «унікальні» набори даних для кожної зі своїх моделей, щоб «допомогти їм зрозуміти світ» і підтримувати конкурентоспроможність у глобальних дослідженнях. При цьому компанія використовує «численні джерела, включаючи загальнодоступні дані та партнерства для непублічних даних», і вона шукає можливість генерувати власні синтетичні дані.
Представник Google Метт Брайант заявив, що компанія «бачила непідтверджені звіти» про діяльність OpenAI, додавши, що «і наші файли robots.txt, і Умови використання забороняють несанкціоноване копіювання або завантаження вмісту YouTube».
Днями генеральний директор YouTube Ніл Мохан заявив, що використання даних платформи для навчання моделі OpenAI - це порушення умов використання. Тому Google вживає «технічних і юридичних заходів», щоб запобігти такому несанкціонованому використанню, «якщо у нас є для цього чітка правова або технічна підстава».
Згідно з джерелами Times, Google також збирала транскрипції з YouTube. Метт Брайант сказав, що компанія навчала свої моделі «деякому контенту YouTube відповідно до наших угод із творцями YouTube».
Meta також зіткнулася з обмеженнями доступності хороших навчальних даних, і її команда ШІ обговорювала недозволене використання захищених авторським правом творів, щоб наздогнати OpenAI. Після перегляду «майже доступних англомовних книг, есе, віршів і новинних статей в інтернеті» компанія розглядала такі кроки, як оплата ліцензій на книги або навіть пряма покупка великого видавництва. Крім того, вона була обмежена у способах використання даних споживачів через зміни, спрямовані на конфіденційність, які вона зробила після скандалу з Cambridge Analytica.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Сенатор-республіканець Ліндсі Грем заявив, що президент Дональд Трамп
дав "зелене світло" двопартійному законопроєкту про санкції проти Росії.
Littop Enterprises, Bordo Management і Bridgemont Ventures програли арбітражну справу щодо Укрнафти
Канада прагне суттєво збільшити обсяг зброї та військового спорядження, що виготовляється разом із Україною.
Гарантії безпеки для України ґрунтуватимуться на трьох головних принципах, наголосила фон дер Ляєн.
Прем'єр Британії Кір Стармер, президент Франції Еммануель Макрон і
президент Володимир Зеленський підписали декларацію про наміри
розгортання військ в Україні у разі укладення мирної угоди.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
YouTube оновив інструменти розширеного пошуку. Тепер користувачі можуть
виключити Shorts, тобто відео тривалістю до трьох хвилин, із
результатів.
На виставці NRF 2026 компанія Microsoft представила нову функцію -
Copilot Checkout. Вона дозволяє користувачам оформлювати покупки без
переходу на сторонні сайти.
Top Lead за підтримки Міністерства цифрової трансформації України провела дослідження
використання штучного інтелекту українськими компаніями.
Йдеться про двоногі машини, призначені для виконання виробничих завдань нарівні з традиційним промисловим обладнанням.
Із 1 січня 2026 у зв'язку із збільшенням мінімальної заробітної плати в
Україні зросли деякі виплати роботодавцям, які адмініструє Державна
служба зайнятості.
Mercedes-Benz встановить на новий CLA систему допомоги водію на базі
програмної платформи NVIDIA DRIVE AV. Технологію представили на виставці
Consumer Electronics Show (CES) 2026 у Лас-Вегасі.
Universal Music Group (UMG) уклала партнерство з NVIDIA для впровадження
нової моделі штучного інтелекту у свій музичний каталог. Про це пише
The Verge.
На CES 2026 компанія AMD анонсувала свій новий флагманський процесор Ryzen 7 9850X3D, який став найшвидшим у серії 9000X3D. Чип базується на архітектурі Zen 5 і оснащений технологією AMD 3D V-Cache другого покоління, що забезпечує виняткову ігрову продуктивність, особливо в порівнянні з конкурентами.
Попри намагання Павла Дурова дистанціюватися від Кремля, фінансова
звітність Telegram свідчить про глибоку залежність платформи від
російського капіталу
На CES 2026 NVIDIA представила нове покоління технології
масштабування DLSS 4.5. Оновлення представляє Dynamic Multi Frame
Generation, новий режим 6X Multi Frame Generation та модель другого
покоління для DLSS Super Resolution.
Продаж легкових машин у Великій Британії у 2025 році зріс за підсумками
третього року поспіль і вперше з доковідного 2019 року перевищив 2 млн
автомобілів.
NVIDIA представила Rubin — новий суперкомп’ютер для ШІ, який прискорює навчання та інференс моделей при нижчих витратах порівняно з попередніми системами
Компанія Qualcomm на виставці CES 2026 оголосила про випуск нового
процесора Snapdragon X2 Plus, який стане доступним у комп'ютерах нижчого
цінового сегмента порівняно з моделями серії X2 Elite.
Українські міста 2025 року отримали 107 тролейбусів, з них 75 нових, проти 34 тролейбусів (28 нових) у 2024 році