Нове дослідження виявило обмеження сучасних генеративних моделей штучного інтелекту, таких як ChatGPT чи Midjourney. Моделі, які навчаються на даних, згенерованих ШІ, тексти або зображення, мають тенденцію «божеволіти» після п'яти циклів навчання. Зображення вище показує наочний результат таких експериментів.

MAD (Model Autophagy Disorder) - абревіатура, що використовується дослідниками Райс та Стенфордського університету для опису того, як якість видачі моделей ШІ деградує при багаторазовому навчанні на даних, згенерованих ШІ. Як випливає з назви, модель «поїдає сама себе». Він втрачає інформацію про «хвости» (крайні точки) вихідного розподілу даних і починає виводити результати, які більше відповідають середньому представленню.

Навчання LLM (великих мовних моделей) на власних (або аналогічних) результатах створює ефект конвергенції. Це легко побачити на наведеному вище графіку, яким поділився член дослідницької групи Ніколас Пейпернот. Послідовні ітерації навчання на даних, згенерованих LLM, призводять до того, що модель поступово (але досить різко) втрачає доступ до даних, які лежать на периферії графіка.

Дані на краях спектра (те, що має менше варіацій і менш представлене) практично зникають. Через це дані, що залишаються у моделі, тепер менш різноманітні та регресують до середнього значення. Згідно з результатами, потрібно близько п'яти ітерацій, допоки «хвости» вихідного розподілу не зникнуть.

Не підтверджено, що така аутофагія впливає на всі моделі ШІ, але дослідники перевірили його на автокодувальниках, змішаних моделях Гауса та великих мовних моделях. Всі вони широко поширені та працюють у різних сферах: передбачають популярність, обробляють статистику, стискають, обробляють та генерують зображення.

Дослідження говорить, що ми не маємо справу з нескінченним джерелом генерації даних: не можна необмежено отримувати їх, навчивши модель один раз і далі ґрунтуючись на її власних результатах. Якщо модель, що отримала комерційне використання, насправді була навчена на власних вихідних даних, то ця модель, ймовірно, регресувала до середнього значення і є упередженою, тому що не враховує дані, які були б у меншості.

Ще одним важливим моментом, висунутим результатами, є проблема походження даних: тепер стає ще важливішим мати можливість відокремити «вихідні» дані від «штучних». Якщо ви не можете визначити, які дані були створені LLM або програмою для створення зображень, ви можете випадково включити їх у навчальні дані для свого продукту.

На жаль, цей «поїзд» багато в чому пішов: існує ненульова кількість немаркованих даних, які вже були створені цими типами мереж і включені в інші системи. Дані, створені ШІ, стрімко поширюються, і 100% способу відрізнити їх немає, тим більше для самих ШІ.

За матеріалами: ITC.ua

ТОП-НОВИНИ

«Укренерго» підвищує тариф на передачу електроенергії: що зміниться з 1 серпня

Національна комісія, що здійснює державне регулювання у сферах енергетики і комунальних послуг (НКРЕКП), на засіданні у вівторок ухвалила рішення підвищити з 1 серпня тарифи Укренерго на передання електроенергії для бізнесу.

ТОП-НОВИНИ

Брюссель просить заблокувати закон, ухвалення якого було однією з його вимог

Ухвалення законопроєкту - частина податкових зобов'язань, які взяла на себе Україна в межах програми з МВФ. Крім цього, оподаткування доходів з цифрових платформ - один з необхідних кроків на шляху до євроінтеграції.

Українські дрони отримають британський захист: Лондон передасть технології РЕБ

Україна отримає від Великої Британії технологію радіоелектронної боротьби для блокування виявлення українських дронів.

Україна шукає рішення після зупинки заходу суден до портів – Висоцький

Захід суден до українських морських портів станом на 22 липня тимчасово призупинився через безпекову ситуацію, однак уряд працює над заходами для забезпечення стабільності експорту.

НБУ планує запровадити систему ризик-маркування для всіх платежів

Національний банк України (НБУ) пропонує зобов'язати надавачів платіжних послуг присвоювати кожній платіжній операції маркер низького, середнього або високого ризику, причому операції з високим ризиком мають автоматично зупинятися до з'ясування деталей та отримання підтвердження користувача, свідчить проєкт постанови регулятора.

ПІДПИСКА НА НОВИНИ

ПРЕС-РЕЛІЗИ

Автономність та батарея нових флагманів Apple iPhone 18 Pro Max

Питання автономності залишається одним із ключових чинників під час вибору сучасного мобільного пристрою преміального сегмента.

Тилові вакансії «Азову»: посади для фінансистів

Ця тилова вакансія підходить для кандидатів, що не можуть виконувати бойові завдання у звʼязку із віком чи станом здоровʼя.

У РУБРИЦІ

Історичний рубіж: капіталізація Apple подолала позначку у $5 трлн

Ринкова вартість Apple Inc. під час торгів у вівторок вперше перевищила позначку в $5 трлн доларів.

Сам звів «античний амфітеатр» і заробляв на туристах: в Італії винесли вирок чоловіку

В Італії чоловік переконав місцеву владу, що виявив один із «найстаріших і найбільших амфітеатрів» світу, і водив туди туристів. Насправді він сам збудував цю споруду 20 років тому.

Конкурент Starlink: Amazon планує угруповання з 5105 супутників для мобільного зв’язку

Підрозділ Amazon Leo подав до Федеральної комісії зі зв'язку США (FCC) заявку на запуск 5105 супутників на низькій навколоземній орбіті.

В Україні оновили правила відпочинку водіїв комерційного транспорту: головні зміни

В Україні набрали чинності оновлені правила щодо робочого часу та часу відпочинку водіїв, які виконують комерційні перевезення вантажів та пасажирів.

У США представили «живий» матеріал для 3D-принтерів із властивостями біологічних тканин

Дослідники з Техаського університету в Остіні створили новий матеріал для 3D-друку, який імітує одну з ключових властивостей людських тканин - здатність вибірково пропускати одні молекули та затримувати інші.

Керівник OpenAI вважає, що ера сингулярності штучного інтелекту вже настала

Генеральний директор OpenAI Сем Альтман заявив, що розвиток сфери штучного інтелекту вже досяг етапу, який донедавна існував лише на сторінках наукової фантастики.

Гонка ШІ прискорюється: NVIDIA і Microsoft виступили за відкриті моделі після Kimi K3

Провідні технологічні компанії, серед яких NVIDIA, Microsoft, Palantir та Meta Platforms, звернулися до американських політиків із закликом підтримати розвиток відкритих моделей штучного інтелекту, позиціонуючи такий підхід як ключовий фактор для збереження технологічного лідерства США.

• далі...

« Липень 2026 »
Пн	Вт	Ср	Чт	Пт	Сб	Нд
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

©1999-2022 Всі права на даний ресурс належать BIN
BIN™ не завжди поділяє думку авторів публікацій
Любе використання інформації агентств "Українські Новини" та "інтерфакс-Україна" ЗАБОРОНЕНО!

Бізнес

Криптомайнінговий пул Poolin оголосив про банкрутство: активи виставили на продаж

Сінгапурська компанія Poolin, яка свого часу була найбільшим біткоїн-майнінговим пулом у світі, разом із дочірніми структурами Lonestar Dream Inc та Lonestar Taproot LLC подала заяву про банкрутство за процедурою Chapter 11 до Суду США у справах про банкрутство округу Нью-Джерсі.

Новий термоядерний реактор Texatron виходить на випробування після схвалення влади Техасу

Поки світ обережно спостерігає за прогресом великих державних проєктів, приватний сектор у Техасі вирішив, що вистачить чекати милості від природи чи бюджетних комітетів.

Google оштрафували на понад мільярд доларів: ЄС вимагає змінити Пошук і Google Play

Європейська комісія прийняла рішення у двох розслідуваннях щодо Google та виписала компанії два штрафи - один, на €460 мільйонів, за надавання переваги власному пошуковому сервісу над конкурентами та другий, на €430 мільйонів, за обмеження можливості Android-розробників перенаправляти користувачів на альтернативні способи оплати.

Uber та Lyft отримали право звільняти водіїв: рішення суду Нью-Йорка

Федеральний суддя постановив, що місто Нью-Йорк не може забороняти компаніям Uber Technologies та Lyft деактивувати водіїв у своїх додатках без попереднього повідомлення, визнавши цей новий закон неконституційним.

Усі потужні моделі ШІ демонстрували спроби обману людей — дослідження

Дослідники британського Інституту безпеки штучного інтелекту (AISI) зробили тривожний висновок: буквально кожна потужна LLM-модель, яку вони тестували, в тій чи іншій формі намагалася обманути людину-оцінювача.

BMW відмовляється від механічної трансмісії: чому «механіка» йде в минуле

Поки фанати бренду оплакують кожну нову модель без третьої педалі, керівництво баварського концерну вказує на фактори, які роблять життя МКПП практично неможливим у сучасному світі.

В Україні посилили контроль за продажем авто: запрацював інструмент для виявлення схем

Бюро економічної безпеки України спільно з Державною податковою службою та Головним сервісним центром МВС запровадило аналітичний інструмент, який дає змогу виявляти схеми ухилення від сплати податків під час імпорту та продажу автомобілів.

• далі...

	за	курс	uah	%
USD	1	44,9277	0,0709	0,16
EUR	1	51,0693	0,0047	0,01

	куп.	uah	%	прод.	uah	%
USD	44,5868	0,04	0,08	45,0716	0,06	0,13
EUR	50,7940	0,01	0,02	51,4084	0,01	0,01

	куп.	uah	%	прод.	uah	%
USD	44,9700	0,10	0,22	45,0000	0,10	0,22
EUR	51,1533	0,10	0,19	51,1695	0,10	0,20

Ім'я користувача:
Пароль:

Фінансові новини

Авторизация

Генеративний ШІ «божеволіє» після п’яти ітерацій навчання на матеріалах, створених ШІ – дослідження Стендфордського університету

ТЕГИ

ТОП-НОВИНИ

ТОП-НОВИНИ

ПІДПИСКА НА НОВИНИ

ПРЕС-РЕЛІЗИ

У РУБРИЦІ

Бізнес