Фінансові новини
- |
- 15.06.26
- |
- 14:03
- |
-
RSS - |
- мапа сайту
Авторизация
Генеративний ШІ «божеволіє» після п’яти ітерацій навчання на матеріалах, створених ШІ – дослідження Стендфордського університету
09:47 14.07.2023 |
Нове дослідження виявило обмеження сучасних генеративних моделей штучного інтелекту, таких як ChatGPT чи Midjourney. Моделі, які навчаються на даних, згенерованих ШІ, тексти або зображення, мають тенденцію «божеволіти» після п'яти циклів навчання. Зображення вище показує наочний результат таких експериментів.
MAD (Model Autophagy Disorder) - абревіатура, що використовується дослідниками Райс та Стенфордського університету для опису того, як якість видачі моделей ШІ деградує при багаторазовому навчанні на даних, згенерованих ШІ. Як випливає з назви, модель «поїдає сама себе». Він втрачає інформацію про «хвости» (крайні точки) вихідного розподілу даних і починає виводити результати, які більше відповідають середньому представленню.
Навчання LLM (великих мовних моделей) на власних (або аналогічних) результатах створює ефект конвергенції. Це легко побачити на наведеному вище графіку, яким поділився член дослідницької групи Ніколас Пейпернот. Послідовні ітерації навчання на даних, згенерованих LLM, призводять до того, що модель поступово (але досить різко) втрачає доступ до даних, які лежать на периферії графіка.
Дані на краях спектра (те, що має менше варіацій і менш представлене) практично зникають. Через це дані, що залишаються у моделі, тепер менш різноманітні та регресують до середнього значення. Згідно з результатами, потрібно близько п'яти ітерацій, допоки «хвости» вихідного розподілу не зникнуть.
Не підтверджено, що така аутофагія впливає на всі моделі ШІ, але дослідники перевірили його на автокодувальниках, змішаних моделях Гауса та великих мовних моделях. Всі вони широко поширені та працюють у різних сферах: передбачають популярність, обробляють статистику, стискають, обробляють та генерують зображення.
Дослідження говорить, що ми не маємо справу з нескінченним джерелом генерації даних: не можна необмежено отримувати їх, навчивши модель один раз і далі ґрунтуючись на її власних результатах. Якщо модель, що отримала комерційне використання, насправді була навчена на власних вихідних даних, то ця модель, ймовірно, регресувала до середнього значення і є упередженою, тому що не враховує дані, які були б у меншості.
Ще одним важливим моментом, висунутим результатами, є проблема походження даних: тепер стає ще важливішим мати можливість відокремити «вихідні» дані від «штучних». Якщо ви не можете визначити, які дані були створені LLM або програмою для створення зображень, ви можете випадково включити їх у навчальні дані для свого продукту.
На жаль, цей «поїзд» багато в чому пішов: існує ненульова кількість немаркованих даних, які вже були створені цими типами мереж і включені в інші системи. Дані, створені ШІ, стрімко поширюються, і 100% способу відрізнити їх немає, тим більше для самих ШІ.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Військово-Морські Сили ЗСУ отримали ще один протимінний корабель від
Королівства Нідерланди. Про це повідомив Командувач ВМС віце-адмірал
Олексій Неїжпапа.
ЄС 15 червня проведе міжурядові конференції з Україною і Молдовою, де ЄС та країни відкриють перший переговорний кластер.
Міжнародний валютний фонд погодився виділити Україні черговий транш
кредиту, попри невиконання Києвом однієї з умов. Про це повідомило
агентство Bloomberg з посиланням на джерела.
Середня зарплата піхотинця становитиме 300 тисяч гривень на місяць, максимальна - до 460 тисяч грн.
Президент Володимир Зеленський заявив, що в Україні є ресурс для того, щоб збільшити зарплату військовослужбовцям.
Більшість людей звикли вважати банк найнадійнішим місцем для будь-яких фінансових операцій, у тому числі для обміну валюти.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
Кілька днів тому стало відомо, що новій главі XBOX Аші Шармі (Asha Sharma) поставлено завдання
збільшити прибутковість бренду, оскільки вище керівництво Microsoft
відмовляється надалі проводити безрезультатні вливання мільярдів
доларів.
Американські компанії активно нарощують найм фахівців зі штучного
інтелекту, однак скористатися цим бумом можуть переважно досвідчені
працівники.
Stellantis, Volkswagen і Renault об'єдналися, щоб закликати до
спрощення правил і запровадження стимулів для виробництва продукції з
маркуванням "Зроблено в Європі" та протидії китайським виробникам
електромобілів.
TSMC розробляє нову технологію пакування мікросхем під назвою CoPoS
(Chip-on-Panel-on-Structure), яка може знизити собівартість виробництва
чипів та покращити їхню продуктивність.
Компанія Google нарешті зрозуміла, що сучасні меню налаштувань
телевізорів нагадують лабіринт Мінотавра, тільки без нитки Аріадни. Нове
оновлення для Google TV
інтегрує ШІ-помічника Gemini безпосередньо в систему керування залізом.
Компанія SpaceX офіційно встановила
ціну на свої акції в межах найбільшого в історії США первинного
публічного розміщення. Виробник ракет Ілона Маска тепер входить до
списку найцінніших корпорацій планети.
Державна податкова служба України розробила законопроєкт про
податкову медіацію, що дозволить бізнесу та податковій частину спорів
вирішувати без суду.
Платіжний гігант Mastercard оголосив
про запуск сервісу Agent Pay for Machines (AP4M), який дозволяє
ШІ-агентам та програмним системам самостійно здійснювати платежі через
глобальну мережу компанії.
McDonald's почала тестувати штучний інтелект для прийому замовлень на "МакДрайв". Як передає ABC News, у майбутньому компанія сподівається замінити звичний досвід замовлення у людини на нову технологію.
Ілон Маск (Elon Musk) поділився новими подробицями проекту
орбітальних дата-центрів SpaceX, які мають перетворити космос на
майданчик для роботи штучного інтелекту.
Інженерка-програмістка Ерін Маус із Північної Кароліни домоглася
офіційного дозволу не використовувати штучний інтелект на роботі,
посилаючись на свої релігійні переконання
Американська Google, що входить до Alphabet Inc., замовила в Intel Corp.
виробництво понад 3 млн своїх тензорних процесорів (TPU) у 2028 році,
повідомляє The Information з посиланням на джерела.
Впродовж травня український автопарк поповнився 18 тис. вживаних легкових автомобілів, ввезених з-за кордону.
Spotify розглядає нові напрямки для розвитку свого сервісу, який
планують перетворити на повноцінний музичний хаб для фанів. Серед
планів, як зазначає Bloomberg, "живі" відеотрансляції концертів і продаж
квитків.