Фінансові новини
- |
- 19.12.25
- |
- 19:48
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Саміт Європейського Союзу затвердив рішення про спільне запозичення для України на суму 90 млрд євро.
Президент України Володимир Зеленський повідомив, що поки що не зміг
отримати розгорнуту відповідь про алгоритм дій США в рамках гарантій
безпеки Україні на випадок повторної агресії РФ.
Власники 99,06% ВВП-варантів, які перебувають в обігу на загальну суму $2,635 млрд, підтримали їх повний обмін на звичайні єврооблігації України, йдеться у біржовому повідомленні України у четвер.
З 1 січня 2027 року платники єдиного податку з доходом від 1 млн грн повинні будуть сплачувати 20% ПДВ
Кабінет міністрів України дозволив Міністерству фінансів понаднормово
запозичити 55 млрд грн. Їх планують використовувати на початку
наступного року.
Кожен власник складу рано чи пізно стикається з банальною проблемою -
місця не вистачає. Товарів стає більше, асортимент росте, а стіни
приміщення залишаються на місці.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Google розширила можливості Gemini, додавши функцію перевірки відео на
використання генеративного ШІ, але це працює лише для контенту,
обробленого власними інструментами компанії.
У звіті за квартал компанія зафіксувала рекордний дохід у розмірі $13,64
млрд, що значно більше за $8,71 млрд у той самий період минулого року.
Зростання пояснюється активними закупівлями пам'яті для дата-центрів з
боку OpenAI, Meta, Microsoft та Google.
Компанія Google анонсувала
нову модель Gemini 3 Flash, яка орієнтована на високу швидкість роботи,
ефективність і низьку вартість без втрати якості штучного інтелекту.
Як уточнив Комаров, з прифронтових регіонів на південному сході та сході
отримано та відправлено більше 100 тис. повідомлень з підключенням до
D2С, а загалом за цей час користувачам вдалося надіслати та отримати
понад 540 тис. SMS за підключення до сигналу "Kyivstar | SpaceX".
Повна заборона продажу автомобілів з двигунами внутрішнього згоряння в ЄС відкладається
Mercedes зробить сучасні фари ремонтопридатними в рамках ініціативи
Tomorrow XX, спрямованої на розвиток циркулярної економіки. Якщо зараз
лінзи, накладки, рамки, корпуси та електроніка мають клейові з'єднання,
то в майбутньому їх замінять різьбовими.
Китайський гігант Xiaomi почав піднімати ціну на свою продукцію і перш за все підвищення торкнеться планшетів.
Йдеться про застосунок, пов'язаний із Sei - блокчейном рівня Layer 1,
який створили спеціально для торгівлі цифровими активами. Застосунок
попередньо встановлюватимуть на всі нові смартфони Xiaomi, що
продаватимуться за межами материкового Китаю та США.
За словами спікерів, одразу після початку повномасштабного вторгнення РФ
у лютому 2022 року Україна перенесла критичні масиви даних до
дата-центрів на території ЄС. Уже в 2023 році стратегія була
трансформована в бік створення суверенних національних дата-центрів із
підтримкою транскордонних рішень резервного копіювання.
Google анонсувала новий експериментальний веббраузер під назвою
Disco, що орієнтований на інтеграцію ШІ у процес перегляду сторінок.
Першою функцією браузера стала GenTabs - віджети, створені на основі
відкритих вкладок, історії чатів і запитів користувача.
AMD може розглядати 2-нм техпроцес Samsung для випуску майбутніх
чипів. Про це повідомляють джерела з Південної Кореї.
Європейський Союз розглядає можливість п'ятирічної відстрочки своєї
заборони на використання двигунів внутрішнього згоряння після сильного
тиску з боку деяких найбільших автомобільних країн регіону.
Зловмисники застосовують нову схему для поширення шкідливого ПЗ Atomic
macOS Stealer (AMOS), використовуючи довіру користувачів до чат-ботів на
зразок ChatGPT від OpenAI чи Grok від xAI. Про це повідомляє Huntress у
своєму дослідженні.
У листопаді український автопарк поповнили понад 11 тис.
автотранспортних засобів на акумуляторних джерелах живлення (BEV). Це
майже втричі більше, ніж у листопаді торік.