Фінансові новини
- |
- 05.12.25
- |
- 20:07
- |
-
RSS - |
- мапа сайту
Авторизация
OpenAI транскрибувала понад мільйон годин YouTube-відео для навчання GPT-4
22:43 08.04.2024 |

За даними The New York Times, OpenAI розробила модель аудіотранскрипції Whisper та транскрибувала понад мільйон годин відео на YouTube, щоб отримати високоякісні матеріали для навчання моделі GPT-4.
Повідомляється, що компанія знала, що такі дії є юридично сумнівними та знаходяться в «сірій зоні» авторського права. Однак вона вважає це добросовісним використанням матеріалів. Президент OpenAI Грег Брокман особисто брав участь у зборі відео, які були використані.
OpenAI вичерпала запаси корисних даних у 2021 році та обговорювала транскрипцію відео YouTube, подкастів і аудіокниг після перегляду інших ресурсів. До того часу компанія навчала свої моделі на даних, які включали комп'ютерний код із Github, бази даних ходів у шахах і вміст шкільних завдань із Quizlet.
Прессекретар OpenAI Ліндсей Хелд повідомила, що компанія курує «унікальні» набори даних для кожної зі своїх моделей, щоб «допомогти їм зрозуміти світ» і підтримувати конкурентоспроможність у глобальних дослідженнях. При цьому компанія використовує «численні джерела, включаючи загальнодоступні дані та партнерства для непублічних даних», і вона шукає можливість генерувати власні синтетичні дані.
Представник Google Метт Брайант заявив, що компанія «бачила непідтверджені звіти» про діяльність OpenAI, додавши, що «і наші файли robots.txt, і Умови використання забороняють несанкціоноване копіювання або завантаження вмісту YouTube».
Днями генеральний директор YouTube Ніл Мохан заявив, що використання даних платформи для навчання моделі OpenAI - це порушення умов використання. Тому Google вживає «технічних і юридичних заходів», щоб запобігти такому несанкціонованому використанню, «якщо у нас є для цього чітка правова або технічна підстава».
Згідно з джерелами Times, Google також збирала транскрипції з YouTube. Метт Брайант сказав, що компанія навчала свої моделі «деякому контенту YouTube відповідно до наших угод із творцями YouTube».
Meta також зіткнулася з обмеженнями доступності хороших навчальних даних, і її команда ШІ обговорювала недозволене використання захищених авторським правом творів, щоб наздогнати OpenAI. Після перегляду «майже доступних англомовних книг, есе, віршів і новинних статей в інтернеті» компанія розглядала такі кроки, як оплата ліцензій на книги або навіть пряма покупка великого видавництва. Крім того, вона була обмежена у способах використання даних споживачів через зміни, спрямовані на конфіденційність, які вона зробила після скандалу з Cambridge Analytica.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


У розмові взяли участь президент Франції Емманюель Макрон, канцлер
Німеччини Фрідріх Мерц, голова Єврокомісії Урсула фон дер Ляєн та інші
лідери. 
Державна служба геології та надр України продала спеціальний дозвіл
на розробку Любинецької нафтогазової площі у Львівській області.
Верховна Рада не розглядатиме питання запровадження ПДВ для фізичних осіб-підприємців.
Європейська комісія в середу офіційно запропонувала внести Росію до
власного чорного списку країн з високим ризиком відмивання грошей і
фінансування терористичної діяльності.
Стабильное качество фарша — одно из ключевых условий для успешной кухни.
Независимо от формата заведения, будь то бистро или гастрономический
ресторан, консистенция, структура и свежесть мясной массы определяют
уровень блюда.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Netflix та Warner Bros. досягли угоди про придбання: компанію оцінили
у $27,75 за акцію та $72 млрд в капіталі ($82,7 млрд з урахуванням
боргу). Очікується, що угоду закриють після виділення підрозділу
Discovery Global в окрему публічну компанію, заплановане на третій
квартал 2026 року.
Аналітичне агентство Counterpoint опублікувало список найбільш
популярних смартфонів на світовому ринку в третьому кварталі 2025 року.
За 10 місяців 2025 року в Україні було реалізовано на 6% менше нових
комерційних автомобілів, ніж за аналогічний період минулого року.
Очікуване зростання потужностей ШІ-галузі посилило обговорення енергетичних обмежень технологічної інфраструктури.
У розпалі гострого дефіциту оперативної пам'яті американський гігант
Micron Technology оголосив про вихід з ринку споживчої продукції.
Європейські лоукости планують відновити польоти в Україну одразу після
того, як авіапростір стане безпечним для пасажирських рейсів.
Сукупний обсяг угод зі злиттів і поглинань за участю компаній, що
працюють у криптовалютному секторі, від початку 2025 року сягнув
рекордних $8,6 млрд, пише Bloomberg із посиланням на дані PitchBook
Data.
У листопаді 2025 року український ринок нових авто продовжив зміщуватися в бік електромобілів.
Соціологи зіткнулися з новим ризиком, оскільки великі мовні моделі (LLM)
здатні видавати себе за людей і проходити стандартні перевірки якості.
Понад третину нових легкових автомобілів, проданих у світі цього року, виготовлено в КНР.
Усі інші проєкти відходять на другий план заради покращення ChatGPT.
Функція працює лише між абонентами, які збережені одне в одного в контактах і використовують стандартний додаток для дзвінків.
Xiaomi EV продовжує стрімко нарощувати свої позиції на ринку електромобілів
Samsung офіційно показала свій перший потрійний складаний смартфон -
Galaxy TriFold. Модель стане доступною в Кореї 12 грудня, а згодом вийде
на ринки Китаю, Тайваню, Сінгапуру та ОАЕ. У першому кварталі 2026 року
смартфон також має з'явитись в США.