Фінансові новини
- |
- 30.05.26
- |
- 11:11
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI транскрибувала понад мільйон годин YouTube-відео для навчання GPT-4
22:43 08.04.2024 |

За даними The New York Times, OpenAI розробила модель аудіотранскрипції Whisper та транскрибувала понад мільйон годин відео на YouTube, щоб отримати високоякісні матеріали для навчання моделі GPT-4.
Повідомляється, що компанія знала, що такі дії є юридично сумнівними та знаходяться в «сірій зоні» авторського права. Однак вона вважає це добросовісним використанням матеріалів. Президент OpenAI Грег Брокман особисто брав участь у зборі відео, які були використані.
OpenAI вичерпала запаси корисних даних у 2021 році та обговорювала транскрипцію відео YouTube, подкастів і аудіокниг після перегляду інших ресурсів. До того часу компанія навчала свої моделі на даних, які включали комп'ютерний код із Github, бази даних ходів у шахах і вміст шкільних завдань із Quizlet.
Прессекретар OpenAI Ліндсей Хелд повідомила, що компанія курує «унікальні» набори даних для кожної зі своїх моделей, щоб «допомогти їм зрозуміти світ» і підтримувати конкурентоспроможність у глобальних дослідженнях. При цьому компанія використовує «численні джерела, включаючи загальнодоступні дані та партнерства для непублічних даних», і вона шукає можливість генерувати власні синтетичні дані.
Представник Google Метт Брайант заявив, що компанія «бачила непідтверджені звіти» про діяльність OpenAI, додавши, що «і наші файли robots.txt, і Умови використання забороняють несанкціоноване копіювання або завантаження вмісту YouTube».
Днями генеральний директор YouTube Ніл Мохан заявив, що використання даних платформи для навчання моделі OpenAI - це порушення умов використання. Тому Google вживає «технічних і юридичних заходів», щоб запобігти такому несанкціонованому використанню, «якщо у нас є для цього чітка правова або технічна підстава».
Згідно з джерелами Times, Google також збирала транскрипції з YouTube. Метт Брайант сказав, що компанія навчала свої моделі «деякому контенту YouTube відповідно до наших угод із творцями YouTube».
Meta також зіткнулася з обмеженнями доступності хороших навчальних даних, і її команда ШІ обговорювала недозволене використання захищених авторським правом творів, щоб наздогнати OpenAI. Після перегляду «майже доступних англомовних книг, есе, віршів і новинних статей в інтернеті» компанія розглядала такі кроки, як оплата ліцензій на книги або навіть пряма покупка великого видавництва. Крім того, вона була обмежена у способах використання даних споживачів через зміни, спрямовані на конфіденційність, які вона зробила після скандалу з Cambridge Analytica.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Рада виконавчих директорів Світового банку схвалила новий проєкт SPIRIT
для України з загальним обсягом $880 млн, з яких $860 млн становитиме
позика самого банку, а решту $20 млн - гранти від Великої Британії та
Німеччини через цільовий фонд підтримки, відновлення, відбудови й
реформування України
Україна отримає транш у розмірі майже 2,8 млрд євро після того, як Рада
Євросоюзу ухвалила рішення про сьоме виділення коштів у рамках Механізму
підтримки ЄС Ukraine Facility.
Перша партія шведських винищувачів JAS 39 Gripen для України надійде
разом із далекобійними ракетами класу "повітря-повітря" Meteor.
Президент Володимир Зеленський під час візиту до Швеції розповів про новий пакет допомоги Україні, який виділила ця країна.
Прем'єр Швеції Ульф Крістерссон оголосив про майбутню передачу Україні
16 винищувачів Gripen, які були у використанні, і про плани продажу 20
одиниць нової моделі цього літака.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
YouTube
почав автоматично виявляти та позначати відео, створені або суттєво
змінені за допомогою генеративного штучного інтелекту.
Американський технологічний гігант Nvidia, який є провідним розробником
чипів для штучного інтелекту, планує збільшити щорічні витрати на
Тайвані до 150 млрд дол. оскільки вважає острів «епіцентром революції
ШІ».
Ринок нових легкових автомобілів у ЄС у квітні 2026 року зріс у річному вимірі на 5,1% і досяг 972,3 тис. одиниць, повідомляє Європейська асоціація автовиробників (ACEA).
Google
оновила Gemini for Home та додала нові функції автоматизації для
"розумного" дому на базі штучного інтелекту. Тепер система може
запускати різні сценарії залежно від того, що бачать домашні камери
відеоспостереження.
Китай обмежив закордонні поїздки для провідних спеціалістів зі штучного
інтелекту у приватних компаніях і нині для виїзду вони мають отримати
відповідний дозвіл від влади
Мільярдер та інвестор Марк К'юбан заявив, що продав більшу частину
своїх біткоїнів. За його словами, він розчарувався у здатності
криптовалюти виступати захисним активом під час геополітичних потрясінь і
послаблення долара.
У Китаї почали масово навчати гуманоїдних роботів для роботи на
фабриках, у магазинах та у сфері послуг.
Популярний мобільний відеоредактор CapCut, який за час існування
завантажили понад 1,2 млрд разів, оголосив про партнерство з Google. У
рамках співпраці можливості редактора інтегрують безпосередньо в чат-бот
Gemini.
Автомобільний концерн Stellantis, створений в результаті злиття Fiat
Chrysler і PSA Group, у четвер, 21 березня, представив п'ятирічний
стратегічний план FaSTLAne 2030 вартістю 60 млрд євро.
За 2025-2026 рік кількість ІТ-ФОПів знизилася на 21%, і це найбільше зниження з 2016 року.
SpaceX офіційно подала документи для виходу на біржу Nasdaq під тикером
SPCX. Як пише TechCrunch, компанія повідомила, що сукупні збитки
компанії з моменту заснування перевищили $37 млрд.
Світовий ринок електромобілів продовжує стрімко зростати, але
нерівномірно: фактично формується "K-подібна" динаміка, де одні регіони
різко прискорюються, а інші відстають.
Поки світовий авторинок лихоманить від китайської експансії та
падіння попиту на дорогі «електрички», старі німецькі друзі вирішили
триматися разом.
Японські дослідники створили бездротову систему зв'язку зі швидкістю передачі даних 112 Гбіт/c в діапазоні 560 ГГц.