Фінансові новини
- |
- 10.05.26
- |
- 01:53
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI транскрибувала понад мільйон годин YouTube-відео для навчання GPT-4
22:43 08.04.2024 |

За даними The New York Times, OpenAI розробила модель аудіотранскрипції Whisper та транскрибувала понад мільйон годин відео на YouTube, щоб отримати високоякісні матеріали для навчання моделі GPT-4.
Повідомляється, що компанія знала, що такі дії є юридично сумнівними та знаходяться в «сірій зоні» авторського права. Однак вона вважає це добросовісним використанням матеріалів. Президент OpenAI Грег Брокман особисто брав участь у зборі відео, які були використані.
OpenAI вичерпала запаси корисних даних у 2021 році та обговорювала транскрипцію відео YouTube, подкастів і аудіокниг після перегляду інших ресурсів. До того часу компанія навчала свої моделі на даних, які включали комп'ютерний код із Github, бази даних ходів у шахах і вміст шкільних завдань із Quizlet.
Прессекретар OpenAI Ліндсей Хелд повідомила, що компанія курує «унікальні» набори даних для кожної зі своїх моделей, щоб «допомогти їм зрозуміти світ» і підтримувати конкурентоспроможність у глобальних дослідженнях. При цьому компанія використовує «численні джерела, включаючи загальнодоступні дані та партнерства для непублічних даних», і вона шукає можливість генерувати власні синтетичні дані.
Представник Google Метт Брайант заявив, що компанія «бачила непідтверджені звіти» про діяльність OpenAI, додавши, що «і наші файли robots.txt, і Умови використання забороняють несанкціоноване копіювання або завантаження вмісту YouTube».
Днями генеральний директор YouTube Ніл Мохан заявив, що використання даних платформи для навчання моделі OpenAI - це порушення умов використання. Тому Google вживає «технічних і юридичних заходів», щоб запобігти такому несанкціонованому використанню, «якщо у нас є для цього чітка правова або технічна підстава».
Згідно з джерелами Times, Google також збирала транскрипції з YouTube. Метт Брайант сказав, що компанія навчала свої моделі «деякому контенту YouTube відповідно до наших угод із творцями YouTube».
Meta також зіткнулася з обмеженнями доступності хороших навчальних даних, і її команда ШІ обговорювала недозволене використання захищених авторським правом творів, щоб наздогнати OpenAI. Після перегляду «майже доступних англомовних книг, есе, віршів і новинних статей в інтернеті» компанія розглядала такі кроки, як оплата ліцензій на книги або навіть пряма покупка великого видавництва. Крім того, вона була обмежена у способах використання даних споживачів через зміни, спрямовані на конфіденційність, які вона зробила після скандалу з Cambridge Analytica.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Велика Британія готується розпочати переговори щодо приєднання до
плану Європейського Союзу з надання Україні кредиту на суму 90 млрд
євро.
Франція запропонувала Греції угоду про передачу всіх її винищувачів
Mirage 2000 Україні в обмін на вигідні умови придбання винищувачів
Rafale у компанії Dassault Aviation.
Зазначається, що розгортання української системи Sky Map на авіабазі
Принца Султана, про яке раніше не повідомлялося, є ознакою того, як
українські військові значно просунулися вперед у технологіях дронів та
боротьби з ними
Посли-постійні представники країн-членів Європейського союзу схвалили як
останній законодавчий акт - зміни до регламенту про багаторічну
фінансову політику ЄС, який був необхідний для забезпечення виплати
Україні
Український президент наголосив, що відновлення "Дружби" Київ пов'язує з
розблокуванням Європейським Союзом кредиту у 90 млрд євро для потреб
України.
Посудомийна машина для багатьох сімей стала такою ж звичною, як
холодильник. Питання сьогодні - не «брати чи не брати», а під які
реальні потреби підбирати
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
NVIDIA оголосила
про інвестицію на $300 мільйонів у Corning для багаторічного
комерційного та технологічного партнерства з метою розширення
виробництва передових рішень оптичного зв'язку для живлення
інфраструктури штучного інтелекту.
Ford і Geely ведуть переговори щодо спільного проєкту в Іспанії, який може суттєво змінити роботу заводу Ford у Валенсії.
Браузер Google Chrome почав автоматично завантажувати локальну
ШІ-модель розміром у 4 ГБ на пристрої користувачів для роботи Gemini
Nano. Про це пише Neowin із посиланням на звіт дослідника Александра Ханффа в The Privacy Guy.
Антимонопольні регулятори Європейського Союзу вимагають, аби Google
поділилася даними свого пошукового рушія з конкурентами, як-от OpenAI.
Бенчмарк AnTuTu опублікував рейтинг найпотужніших флагманських Android-смартфонів за квітень 2026 року.
Microsoft пояснила, чому оновлення Windows 11 останнім часом займають
набагато більше часу і в деяких випадках можуть потребувати кількох
перезавантажень - але компанія каже, що це не привід для занепокоєння.
Microsoft у своєму блозі оголосила
про атракціон небаченої щедрості. Компанія вирішила переглянути
механізм оновлень Windows 11, зробивши його значно менш токсичним для
користувача.
Антимонопольний комітет звернувся до операторів Vodafone, "Київстар" та
lifecell щодо зміни комунікації про "безлімітний мобільний інтернет".
Операцію очолила поліція Дубая під егідою МВС Об'єднаних Арабських
Еміратів. У межах заходів затримали 275 осіб у Дубаї та ще одну - у
Таїланді.
Упродовж першого кварталу 2026 року український автопарк поповнили 50,1 тис вживаних легковиків, що були ввезені з-за кордону.
Компанія Google розширила можливості свого чат-боту Gemini.
Тепер він може генерувати готові файли, придатні до завантаження та
пересилання.
Ринок пам'яті увійшов у фазу різкого подорожчання, і це вже напряму б'є по собівартості смартфонів.
Аналітичні підрозділи Coinbase Institutional та Glassnode опублікували
прогноз на II квартал 2026 року, в якому оцінили стан крипторинку як
нейтральний.
Використання штучного інтелекту вже стало повсякденною практикою для
більшості студентів і працівників, однак ключовою конкурентною перевагою
на ринку праці в найближчі роки залишатимуться не технічні, а людські
навички - комунікація, лідерство, емоційний інтелект, критичне мислення
та здатність працювати з людьми.