Фінансові новини
- |
- 14.05.26
- |
- 18:05
- |
-
RSS - |
- мапа сайту
Авторизация
Генеративний ШІ «божеволіє» після п’яти ітерацій навчання на матеріалах, створених ШІ – дослідження Стендфордського університету
09:47 14.07.2023 |
Нове дослідження виявило обмеження сучасних генеративних моделей штучного інтелекту, таких як ChatGPT чи Midjourney. Моделі, які навчаються на даних, згенерованих ШІ, тексти або зображення, мають тенденцію «божеволіти» після п'яти циклів навчання. Зображення вище показує наочний результат таких експериментів.
MAD (Model Autophagy Disorder) - абревіатура, що використовується дослідниками Райс та Стенфордського університету для опису того, як якість видачі моделей ШІ деградує при багаторазовому навчанні на даних, згенерованих ШІ. Як випливає з назви, модель «поїдає сама себе». Він втрачає інформацію про «хвости» (крайні точки) вихідного розподілу даних і починає виводити результати, які більше відповідають середньому представленню.
Навчання LLM (великих мовних моделей) на власних (або аналогічних) результатах створює ефект конвергенції. Це легко побачити на наведеному вище графіку, яким поділився член дослідницької групи Ніколас Пейпернот. Послідовні ітерації навчання на даних, згенерованих LLM, призводять до того, що модель поступово (але досить різко) втрачає доступ до даних, які лежать на периферії графіка.
Дані на краях спектра (те, що має менше варіацій і менш представлене) практично зникають. Через це дані, що залишаються у моделі, тепер менш різноманітні та регресують до середнього значення. Згідно з результатами, потрібно близько п'яти ітерацій, допоки «хвости» вихідного розподілу не зникнуть.
Не підтверджено, що така аутофагія впливає на всі моделі ШІ, але дослідники перевірили його на автокодувальниках, змішаних моделях Гауса та великих мовних моделях. Всі вони широко поширені та працюють у різних сферах: передбачають популярність, обробляють статистику, стискають, обробляють та генерують зображення.
Дослідження говорить, що ми не маємо справу з нескінченним джерелом генерації даних: не можна необмежено отримувати їх, навчивши модель один раз і далі ґрунтуючись на її власних результатах. Якщо модель, що отримала комерційне використання, насправді була навчена на власних вихідних даних, то ця модель, ймовірно, регресувала до середнього значення і є упередженою, тому що не враховує дані, які були б у меншості.
Ще одним важливим моментом, висунутим результатами, є проблема походження даних: тепер стає ще важливішим мати можливість відокремити «вихідні» дані від «штучних». Якщо ви не можете визначити, які дані були створені LLM або програмою для створення зображень, ви можете випадково включити їх у навчальні дані для свого продукту.
На жаль, цей «поїзд» багато в чому пішов: існує ненульова кількість немаркованих даних, які вже були створені цими типами мереж і включені в інші системи. Дані, створені ШІ, стрімко поширюються, і 100% способу відрізнити їх немає, тим більше для самих ШІ.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Міністр закордонних справ Георгіос Герапетрітіс заявив, що "будь-яке
перетворення Середземного моря на театр військових дій не буде
терпітися".
Міністр оборони США Піт Гегсет заявив, що Пентагон направив своїх
військових до України, щоб навчитися застосовувати дрони на полі бою.
Кабінет міністрів України видав постанову, якою розширив перелік країн, громадяни яких можуть набувати громадянство України у спрощеному порядку.
Міністри оборони України і Німеччини Михайло
Федоров та Борис Пісторіус підписали в Києві лист про наміри щодо
запуску Brave Germany - спільної програми для розвитку оборонних
технологій та підтримки інноваційних стартапів.
Велика Британія готується розпочати переговори щодо приєднання до
плану Європейського Союзу з надання Україні кредиту на суму 90 млрд
євро.
Українська бізнес-делегація відвідає Белград 19-21 травня 2026 року в
рамках візиту до Сербії віцепрем'єра України Тараса Качки, повідомила
Торгово-промислова палата України.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
Україна розпочала розгортання власної супутникової мережі. Два перші апарати вже перебувають на орбіті.
Міністерство торгівлі США дозволило приблизно десятьом китайським
компаніям закупівлі ШІ-чипів H200 американської Nvidia Corp., пише
Reuters із посиланням на джерела.
Американська компанія Tesla повністю припинила
виробництво своїх флагманських електромобілів Model S та Model X, які
протягом 14 років були символом переходу світу до електромобільності.
Представники компаній, таких як Volkswagen, BMW і Mercedes-Benz та
постачальники галузі, зустрічаються з посадовими особами Європейського
Союзу, щоб домогтися подальшого пом'якшення запропонованих правил щодо
викидів CO2.
Google оголосила про нову функцію Pause Point у складі Android 17. Вона додає обов'язкову 10-секундну паузу перед запуском будь-якого застосунку, який користувач позначив як відволікаючий.
Колектив Meta протестує проти використання програми, яку компанія
встановила на робочі ПК для відстеження рухів їхніх комп'ютерних миш.
Google і SpaceX ведуть переговори про запуск орбітальних дата-центрів у
космосі, повідомляє The Wall Street Journal із посиланням на джерела,
знайомі з ситуацією.
Компанія Google оголосила
про запуск нової системи на базі ШІ Gemini Intelligence, яка
інтегрується в Android‑пристрої. За словами компанії, вона буде
допомагати користувачам виконувати повсякденні завдання, зберігаючи
контроль над даними та конфіденційність.
Samsung додала в Device Care можливість автоматичного блокування
застосунків, які надсилають забагато рекламних сповіщень - їх
автоматично переводитимуть у "режим сну" доки користувач сам не скасує
команду
Ринок електромобілів в Україні поступово відновлюється після провалу,
зафіксованого на початку року, пов'язаного зі скасуванням податкових
пільг на них.
Україна впроваджує ШІ-рішення у війну разом з американською компанією
Palantir Technologies. Про це повідомив міністр оборони України Михайло
Федоров після зустрічі із CEO Palantir Technologies Алексом Карпом.
Фахівці підрозділу Threat Intelligence Group компанії Google заявили, що
зафіксували спробу кібератаки, в якій злочинці використали штучний
інтелект для створення експлойту нульового дня проти популярного
веб-інструменту адміністрування систем.
Поки більшість світу все ще намагається зрозуміти, чим 5G кращий за
старий добрий LTE, у Китаї вирішили не чекати, поки маркетинговий пил
вляжеться.
Апетит сучасних систем штучного інтелекту до електроенергії вже давно
перестав бути проблемою лише екологів та перетворився на головний біль
для інженерів.