Фінансові новини
- |
- 06.02.26
- |
- 08:52
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Згідно з її даними, порівняно з попереднім кварталом, з урахуванням
сезонного фактору, реальний ВВП збільшився на 0,7% з урахуванням
сезонного фактору, а квартал тому цей показник складав 0,8%.
Рада ЄС у середу, 4 лютого, узгодила свою позицію щодо правової бази для
імплементації угоди Європейської Ради про надання Україні кредиту в
розмірі 90 мільярдів євро на 2026-2027 роки.
У США по бойовому випробували крилату ракету Rusty Dagger для України, створену за програмою ERAM.
Невиконані за підсумками 2025 року 15 індикаторів плану в рамках
програми Ukraine Facility можуть коштувати Україні близько EUR4 млрд,
йдеться у презентації консорціуму RRR4U (Resilience, Reconstruction and
Relief for Ukraine).
Кабмін спростив ввезення до України літій-іонних акумуляторів. Про це повідомила пресслужба Мінекономіки.
2026 рік остаточно закріпив за побутовою технікою статус повноцінних
гаджетів. Інтеграція в екосистему «розумного будинку» перестала бути
фантастикою і перетворилася на базове очікування користувачів.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Ілон Маск став першою людиною в історії зі статками понад $850 млрд
після угоди між SpaceX та xAI. За оцінками Forbes, злиття ракетобудівної
компанії з бізнесом Маска у сфері штучного інтелекту та соціальних
медіа збільшило його капітал на $84 млрд - до рекордних $852 млрд.
Intel має намір знову вийти на ринок пам'яті, уклавши партнерство з дочірньою компанією SoftBank - Saimemory.
Акції технологічних та софтверних компаній обвалилися на тлі побоювань,
що розвиток штучного інтелекту (ШІ) витіснить бізнес-моделі традиційних
розробників програмного забезпечення (ПЗ).
Українська defense tech компанія Swarmer подала заявку на первинне розміщення акцій (ІРО) на американській біржі Nasdaq.
Автомобіль перебуває в активному використанні вже 18 місяців без
тривалих простоїв. За цей час власник проїжджав у середньому майже 500
км щодня, що робить цей випадок особливо показовим з точки зору зносу.
Аналітики найближчим часом прогнозують суттєве подорожчання оперативної пам'яті та твердотільних накопичувачів, пише NotebookCheck
Згідно з документом, SpaceX та xAI спільно створять у космосі
потужний обчислювальний центр, величезні потреби в енергії якого будуть
компенсуватися за рахунок енергії Сонця
Міністерство оборони опублікувало алгоритм, як верифікувати термінал супутникового зв'язку Starlink в Україні для військових та цивільних.
Роскомнагляд заблокував понад 4,7 млн інтернет-сторінок у рамках боротьби із "забороненою інформацією".
Група вчених заявила про розробку нового типу волоконно-оптичних
чипів з потенційною щільністю інтеграції д 100 тис. транзисторів на
сантиметр.
В Google офіційно повідомили, що YouTube більше не дозволяє відтворювати
відео у фоновому режимі через сторонні мобільні браузери для
користувачів без платної підписки Premium.
Минулого року NVIDIA випустила GeForce NOW для Steam Deck, що
використовує операційну систему Steam OS на базі Linux, де сервіс
забезпечував ігри в 90 FPS при роздільній здатності до 1200p.
Apple та Samsung повністю домінували на світовому ринку смартфонів у
2025 році. Як свідчать дані Counterpoint Research, обидві компанії
четвертий рік поспіль зайняли всі десять позицій у рейтингу найбільш
продаваних моделей.
Ринкова капіталізація Microsoft різко скоротилася на рекордні $360 млрд
після публікації фінансового звіту, який показав значні витрати на
будівництво дата-центрів.