Фінансові новини
- |
- 19.12.25
- |
- 20:14
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI транскрибувала понад мільйон годин YouTube-відео для навчання GPT-4
22:43 08.04.2024 |

За даними The New York Times, OpenAI розробила модель аудіотранскрипції Whisper та транскрибувала понад мільйон годин відео на YouTube, щоб отримати високоякісні матеріали для навчання моделі GPT-4.
Повідомляється, що компанія знала, що такі дії є юридично сумнівними та знаходяться в «сірій зоні» авторського права. Однак вона вважає це добросовісним використанням матеріалів. Президент OpenAI Грег Брокман особисто брав участь у зборі відео, які були використані.
OpenAI вичерпала запаси корисних даних у 2021 році та обговорювала транскрипцію відео YouTube, подкастів і аудіокниг після перегляду інших ресурсів. До того часу компанія навчала свої моделі на даних, які включали комп'ютерний код із Github, бази даних ходів у шахах і вміст шкільних завдань із Quizlet.
Прессекретар OpenAI Ліндсей Хелд повідомила, що компанія курує «унікальні» набори даних для кожної зі своїх моделей, щоб «допомогти їм зрозуміти світ» і підтримувати конкурентоспроможність у глобальних дослідженнях. При цьому компанія використовує «численні джерела, включаючи загальнодоступні дані та партнерства для непублічних даних», і вона шукає можливість генерувати власні синтетичні дані.
Представник Google Метт Брайант заявив, що компанія «бачила непідтверджені звіти» про діяльність OpenAI, додавши, що «і наші файли robots.txt, і Умови використання забороняють несанкціоноване копіювання або завантаження вмісту YouTube».
Днями генеральний директор YouTube Ніл Мохан заявив, що використання даних платформи для навчання моделі OpenAI - це порушення умов використання. Тому Google вживає «технічних і юридичних заходів», щоб запобігти такому несанкціонованому використанню, «якщо у нас є для цього чітка правова або технічна підстава».
Згідно з джерелами Times, Google також збирала транскрипції з YouTube. Метт Брайант сказав, що компанія навчала свої моделі «деякому контенту YouTube відповідно до наших угод із творцями YouTube».
Meta також зіткнулася з обмеженнями доступності хороших навчальних даних, і її команда ШІ обговорювала недозволене використання захищених авторським правом творів, щоб наздогнати OpenAI. Після перегляду «майже доступних англомовних книг, есе, віршів і новинних статей в інтернеті» компанія розглядала такі кроки, як оплата ліцензій на книги або навіть пряма покупка великого видавництва. Крім того, вона була обмежена у способах використання даних споживачів через зміни, спрямовані на конфіденційність, які вона зробила після скандалу з Cambridge Analytica.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Саміт Європейського Союзу затвердив рішення про спільне запозичення для України на суму 90 млрд євро.
Президент України Володимир Зеленський повідомив, що поки що не зміг
отримати розгорнуту відповідь про алгоритм дій США в рамках гарантій
безпеки Україні на випадок повторної агресії РФ.
Власники 99,06% ВВП-варантів, які перебувають в обігу на загальну суму $2,635 млрд, підтримали їх повний обмін на звичайні єврооблігації України, йдеться у біржовому повідомленні України у четвер.
З 1 січня 2027 року платники єдиного податку з доходом від 1 млн грн повинні будуть сплачувати 20% ПДВ
Кабінет міністрів України дозволив Міністерству фінансів понаднормово
запозичити 55 млрд грн. Їх планують використовувати на початку
наступного року.
Кожен власник складу рано чи пізно стикається з банальною проблемою -
місця не вистачає. Товарів стає більше, асортимент росте, а стіни
приміщення залишаються на місці.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Google розширила можливості Gemini, додавши функцію перевірки відео на
використання генеративного ШІ, але це працює лише для контенту,
обробленого власними інструментами компанії.
У звіті за квартал компанія зафіксувала рекордний дохід у розмірі $13,64
млрд, що значно більше за $8,71 млрд у той самий період минулого року.
Зростання пояснюється активними закупівлями пам'яті для дата-центрів з
боку OpenAI, Meta, Microsoft та Google.
Компанія Google анонсувала
нову модель Gemini 3 Flash, яка орієнтована на високу швидкість роботи,
ефективність і низьку вартість без втрати якості штучного інтелекту.
Як уточнив Комаров, з прифронтових регіонів на південному сході та сході
отримано та відправлено більше 100 тис. повідомлень з підключенням до
D2С, а загалом за цей час користувачам вдалося надіслати та отримати
понад 540 тис. SMS за підключення до сигналу "Kyivstar | SpaceX".
Повна заборона продажу автомобілів з двигунами внутрішнього згоряння в ЄС відкладається
Mercedes зробить сучасні фари ремонтопридатними в рамках ініціативи
Tomorrow XX, спрямованої на розвиток циркулярної економіки. Якщо зараз
лінзи, накладки, рамки, корпуси та електроніка мають клейові з'єднання,
то в майбутньому їх замінять різьбовими.
Китайський гігант Xiaomi почав піднімати ціну на свою продукцію і перш за все підвищення торкнеться планшетів.
Йдеться про застосунок, пов'язаний із Sei - блокчейном рівня Layer 1,
який створили спеціально для торгівлі цифровими активами. Застосунок
попередньо встановлюватимуть на всі нові смартфони Xiaomi, що
продаватимуться за межами материкового Китаю та США.
За словами спікерів, одразу після початку повномасштабного вторгнення РФ
у лютому 2022 року Україна перенесла критичні масиви даних до
дата-центрів на території ЄС. Уже в 2023 році стратегія була
трансформована в бік створення суверенних національних дата-центрів із
підтримкою транскордонних рішень резервного копіювання.
Google анонсувала новий експериментальний веббраузер під назвою
Disco, що орієнтований на інтеграцію ШІ у процес перегляду сторінок.
Першою функцією браузера стала GenTabs - віджети, створені на основі
відкритих вкладок, історії чатів і запитів користувача.
AMD може розглядати 2-нм техпроцес Samsung для випуску майбутніх
чипів. Про це повідомляють джерела з Південної Кореї.
Європейський Союз розглядає можливість п'ятирічної відстрочки своєї
заборони на використання двигунів внутрішнього згоряння після сильного
тиску з боку деяких найбільших автомобільних країн регіону.
Зловмисники застосовують нову схему для поширення шкідливого ПЗ Atomic
macOS Stealer (AMOS), використовуючи довіру користувачів до чат-ботів на
зразок ChatGPT від OpenAI чи Grok від xAI. Про це повідомляє Huntress у
своєму дослідженні.
У листопаді український автопарк поповнили понад 11 тис.
автотранспортних засобів на акумуляторних джерелах живлення (BEV). Це
майже втричі більше, ніж у листопаді торік.