Фінансові новини
- |
- 17.12.25
- |
- 08:23
- |
-
RSS - |
- мапа сайту
Авторизация
Генеративний ШІ «божеволіє» після п’яти ітерацій навчання на матеріалах, створених ШІ – дослідження Стендфордського університету
09:47 14.07.2023 |
Нове дослідження виявило обмеження сучасних генеративних моделей штучного інтелекту, таких як ChatGPT чи Midjourney. Моделі, які навчаються на даних, згенерованих ШІ, тексти або зображення, мають тенденцію «божеволіти» після п'яти циклів навчання. Зображення вище показує наочний результат таких експериментів.
MAD (Model Autophagy Disorder) - абревіатура, що використовується дослідниками Райс та Стенфордського університету для опису того, як якість видачі моделей ШІ деградує при багаторазовому навчанні на даних, згенерованих ШІ. Як випливає з назви, модель «поїдає сама себе». Він втрачає інформацію про «хвости» (крайні точки) вихідного розподілу даних і починає виводити результати, які більше відповідають середньому представленню.
Навчання LLM (великих мовних моделей) на власних (або аналогічних) результатах створює ефект конвергенції. Це легко побачити на наведеному вище графіку, яким поділився член дослідницької групи Ніколас Пейпернот. Послідовні ітерації навчання на даних, згенерованих LLM, призводять до того, що модель поступово (але досить різко) втрачає доступ до даних, які лежать на периферії графіка.
Дані на краях спектра (те, що має менше варіацій і менш представлене) практично зникають. Через це дані, що залишаються у моделі, тепер менш різноманітні та регресують до середнього значення. Згідно з результатами, потрібно близько п'яти ітерацій, допоки «хвости» вихідного розподілу не зникнуть.
Не підтверджено, що така аутофагія впливає на всі моделі ШІ, але дослідники перевірили його на автокодувальниках, змішаних моделях Гауса та великих мовних моделях. Всі вони широко поширені та працюють у різних сферах: передбачають популярність, обробляють статистику, стискають, обробляють та генерують зображення.
Дослідження говорить, що ми не маємо справу з нескінченним джерелом генерації даних: не можна необмежено отримувати їх, навчивши модель один раз і далі ґрунтуючись на її власних результатах. Якщо модель, що отримала комерційне використання, насправді була навчена на власних вихідних даних, то ця модель, ймовірно, регресувала до середнього значення і є упередженою, тому що не враховує дані, які були б у меншості.
Ще одним важливим моментом, висунутим результатами, є проблема походження даних: тепер стає ще важливішим мати можливість відокремити «вихідні» дані від «штучних». Якщо ви не можете визначити, які дані були створені LLM або програмою для створення зображень, ви можете випадково включити їх у навчальні дані для свого продукту.
На жаль, цей «поїзд» багато в чому пішов: існує ненульова кількість немаркованих даних, які вже були створені цими типами мереж і включені в інші системи. Дані, створені ШІ, стрімко поширюються, і 100% способу відрізнити їх немає, тим більше для самих ШІ.
ТЕГИ
ТОП-НОВИНИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :
ПРЕС-РЕЛІЗИ
У РУБРИЦІ
Бізнес
| У ChatGPT відтепер можна редагувати зображення в Photoshop. Функція безкоштовна й доступна в Україні |


Він також анонсував, що Британія незабаром розпочне виробництво нових
безпілотників-перехоплювачів Octopus у Великій Британії, таким чином,
щомісяця тисячі нових безпілотників назад будуть передаватися Україні.ОП, політика, міжн. Тег Британія
Євросоюз оприлюднив план гарантій безпеки для України, що передбачає
шість ключових пунктів, та застеріг проти змін її кордонів силою,
наголосивши на праві українського народу самостійно ухвалювати рашення
щодо своєї території.
Комітет Верховної Ради України з питань фінансів, податкової та митної
політики рекомендував парламенту прийняти законопроєкт щодо зміни назви
розмінної монети України на шаг.
Це рішення є важливим кроком до гармонізації податкового
регулювання в Україні із сучасними європейськими підходами та кращими
міжнародними практиками, закріпленими в рамках ОЕСР та Директиви ЄС
DAC7.
Росія здійснила атаку на цивільне судно, яке транспортувало до Єгипту українську соняшникову олію.
Стабильное качество фарша — одно из ключевых условий для успешной кухни.
Независимо от формата заведения, будь то бистро или гастрономический
ресторан, консистенция, структура и свежесть мясной массы определяют
уровень блюда.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Китайський гігант Xiaomi почав піднімати ціну на свою продукцію і перш за все підвищення торкнеться планшетів.
Компанія Samsung повідомила своїх клієнтів про суттєве підвищення
контрактних цін на оперативну пам'ять DDR5. Про це в соцмережі X
повідомляє відомий в галузі інсайдер Jukan, який посилається на
тайванські ЗМІ.
Йдеться про застосунок, пов'язаний із Sei - блокчейном рівня Layer 1,
який створили спеціально для торгівлі цифровими активами. Застосунок
попередньо встановлюватимуть на всі нові смартфони Xiaomi, що
продаватимуться за межами материкового Китаю та США.
За словами спікерів, одразу після початку повномасштабного вторгнення РФ
у лютому 2022 року Україна перенесла критичні масиви даних до
дата-центрів на території ЄС. Уже в 2023 році стратегія була
трансформована в бік створення суверенних національних дата-центрів із
підтримкою транскордонних рішень резервного копіювання.
Google анонсувала новий експериментальний веббраузер під назвою
Disco, що орієнтований на інтеграцію ШІ у процес перегляду сторінок.
Першою функцією браузера стала GenTabs - віджети, створені на основі
відкритих вкладок, історії чатів і запитів користувача.
AMD може розглядати 2-нм техпроцес Samsung для випуску майбутніх
чипів. Про це повідомляють джерела з Південної Кореї.
Європейський Союз розглядає можливість п'ятирічної відстрочки своєї
заборони на використання двигунів внутрішнього згоряння після сильного
тиску з боку деяких найбільших автомобільних країн регіону.
У листопаді український автопарк поповнили понад 11 тис.
автотранспортних засобів на акумуляторних джерелах живлення (BEV). Це
майже втричі більше, ніж у листопаді торік.
Компанія Adobe запустила свої програми Adobe Photoshop, Adobe Express та Adobe Acrobat для чат-боту ChatGPT.
Уряд ухвалив постанову, яка дає можливість запустити повний цикл
оформлення європротоколу оформлення незначних дорожньо-транспортних
пригод в застосунку "Дія", повідомила премʼєр-міністр України Юлія
Свириденко.
Серед нововведень є шаблони для відео з готовими музичними доріжками
та текстовими накладками.
Водночас прискорюється передача багатства між поколіннями. У 2025
році 91 спадкоємець (64 чоловіки та 27 жінок) успадкував рекордні $297,8
млрд, що на 36% більше, ніж у 2024 році. Загальна кількість
мультипоколінних мільярдерів досягла 860 осіб із активами $4,7
трильйона.
Google почала вести переговори з рекламодавцями щодо запуску реклами у
чат-боті Gemini. Перші рекламні оголошення у штучному інтелекті можуть
стартувати у 2026 році, пише Android Authority.
Китайська компанія Biwin розпочала продаж перших накопичувачів нового формату - Mini SSD, назва якого говорить сама за себе.