Фінансові новини
- |
- 15.05.26
- |
- 04:28
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Міністр закордонних справ Георгіос Герапетрітіс заявив, що "будь-яке
перетворення Середземного моря на театр військових дій не буде
терпітися".
Міністр оборони США Піт Гегсет заявив, що Пентагон направив своїх
військових до України, щоб навчитися застосовувати дрони на полі бою.
Кабінет міністрів України видав постанову, якою розширив перелік країн, громадяни яких можуть набувати громадянство України у спрощеному порядку.
Міністри оборони України і Німеччини Михайло
Федоров та Борис Пісторіус підписали в Києві лист про наміри щодо
запуску Brave Germany - спільної програми для розвитку оборонних
технологій та підтримки інноваційних стартапів.
Велика Британія готується розпочати переговори щодо приєднання до
плану Європейського Союзу з надання Україні кредиту на суму 90 млрд
євро.
Українська бізнес-делегація відвідає Белград 19-21 травня 2026 року в
рамках візиту до Сербії віцепрем'єра України Тараса Качки, повідомила
Торгово-промислова палата України.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
Україна розпочала розгортання власної супутникової мережі. Два перші апарати вже перебувають на орбіті.
Міністерство торгівлі США дозволило приблизно десятьом китайським
компаніям закупівлі ШІ-чипів H200 американської Nvidia Corp., пише
Reuters із посиланням на джерела.
Американська компанія Tesla повністю припинила
виробництво своїх флагманських електромобілів Model S та Model X, які
протягом 14 років були символом переходу світу до електромобільності.
Представники компаній, таких як Volkswagen, BMW і Mercedes-Benz та
постачальники галузі, зустрічаються з посадовими особами Європейського
Союзу, щоб домогтися подальшого пом'якшення запропонованих правил щодо
викидів CO2.
Google оголосила про нову функцію Pause Point у складі Android 17. Вона додає обов'язкову 10-секундну паузу перед запуском будь-якого застосунку, який користувач позначив як відволікаючий.
Колектив Meta протестує проти використання програми, яку компанія
встановила на робочі ПК для відстеження рухів їхніх комп'ютерних миш.
Google і SpaceX ведуть переговори про запуск орбітальних дата-центрів у
космосі, повідомляє The Wall Street Journal із посиланням на джерела,
знайомі з ситуацією.
Компанія Google оголосила
про запуск нової системи на базі ШІ Gemini Intelligence, яка
інтегрується в Android‑пристрої. За словами компанії, вона буде
допомагати користувачам виконувати повсякденні завдання, зберігаючи
контроль над даними та конфіденційність.
Samsung додала в Device Care можливість автоматичного блокування
застосунків, які надсилають забагато рекламних сповіщень - їх
автоматично переводитимуть у "режим сну" доки користувач сам не скасує
команду
Ринок електромобілів в Україні поступово відновлюється після провалу,
зафіксованого на початку року, пов'язаного зі скасуванням податкових
пільг на них.
Україна впроваджує ШІ-рішення у війну разом з американською компанією
Palantir Technologies. Про це повідомив міністр оборони України Михайло
Федоров після зустрічі із CEO Palantir Technologies Алексом Карпом.
Фахівці підрозділу Threat Intelligence Group компанії Google заявили, що
зафіксували спробу кібератаки, в якій злочинці використали штучний
інтелект для створення експлойту нульового дня проти популярного
веб-інструменту адміністрування систем.
Поки більшість світу все ще намагається зрозуміти, чим 5G кращий за
старий добрий LTE, у Китаї вирішили не чекати, поки маркетинговий пил
вляжеться.
Апетит сучасних систем штучного інтелекту до електроенергії вже давно
перестав бути проблемою лише екологів та перетворився на головний біль
для інженерів.