Фінансові новини
- |
- 03.03.26
- |
- 18:30
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Загальна сума державного та гарантованого державою боргу України станом
на кінець січня 2026 року сягнула 215,0 млрд дол. США, збільшившись за
місяць на 1,67 млрд дол.
Кабмін розширив експериментальний проєкт зі створення власних груп
протиповітряної оборони на підприємствах критичної інфраструктури. Про
це повідомила прем'єр-міністерка Юлія Свириденко.
Від 2 березня банкноти номіналами 1, 2, 5 і 10 гривень зразків 2003-2007
років замінюються на відповідні обігові монети, повідомив Національний
банк України.
Україна нещодавно досягла домовленості з Експортно-імпортним банком
Китаю (China EXIM) про реструктуризацію залучених раніше під державні
гарантії кредитів, повідомив заступник голови місії Фонду в Україні
Тревор Лессард
Думка,
що Україна неодмінно буде в ЄС, давно є домінуючою у Європі, а зараз
посилюється розуміння, що процес вступу має бути швидшим за звичний.
У дорослому віці вивчення англійської рідко починається з нуля. Хтось
уже має кращий рівень, але не може заговорити, хтось роками ходив на
групові заняття й так і не дійшов до впевнених листів чи робочих
дзвінків іноземною.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Telegram отримав нові функції. Вони вже доступні для звичайних користувачів, і тих, хто платить за Premium.
OpenAI оголосила про новий раунд фінансування на $110 млрд - один із
найбільших в історії Силіконової долини, який підвищив оцінку компанії
до $730 млрд.
Samsung оголосила про розширення можливостей супутникового зв'язку для
окремих смартфонів Galaxy, включно з новою серією Galaxy S26, завдяки
співпраці зі світовими операторами телекомунікацій у Північній Америці,
Європі та Японії.
Компанія NVIDIA оголосила про співпрацю з провідними телекомунікаційними
компаніями для розробки шостого покоління мобільних мереж, які будуть
орієнтовані на використання штучного інтелекту.
Китайські науковці розробили новий акумулятор для електромобілів із
щільністю енергії понад 700 Вт·год/кг, що потенційно дає запас ходу
понад 1000 км на одному заряді.
Американський технологічний гігант NVIDIA оприлюднив фінансові
результати за IV квартал 2025 року та так званий 2026 фінансовий рік,
продемонструвавши стрімке зростання на фоні глобального попиту на
інфраструктуру штучного інтелекту (ШІ).
Український фонд стартапів приєднався до
глобальної мережі Microsoft for Startups Investor Network, що дозволить
IT-проєктам отримати до $150 тис. кредитів на сервіси Microsoft Azure.
HP повідомила, що оперативна пам'ять тепер формує понад третину
собівартості її персональних комп'ютерів. За словами фінансової
директорки Карен Паркхілл, якщо торік витрати на пам'ять і накопичувачі
становили 15-18% від загальної вартості компонентів
Компанії Microsoft та SpaceX оголосили про співпрацю для розвитку
глобального доступу до інтернету. Проєкт передбачає використання
супутникового інтернету Starlink для підключення громадських центрів у
різних країнах, зокрема 450 хабів у Кенії.
Компанія SpaceX оприлюднила
амбітні плани щодо розвитку своєї технології Direct to Cell, яка дозволить звичайним смартфонам підключатися до супутників без жодного додаткового обладнання.
Dell, Lenovo та інші провідні виробники ПК готують нові ноутбуки
Copilot+, які використовуватимуть процесори NVIDIA на архітектурі ARM.
Фінський стартап Donut Lab оприлюднив результати першого незалежного
тестування своєї твердотільної батареї.
Meta та AMD анонсували угоду вартістю $100 мільярдів. У її межах
компанія Марка Цукерберга планує закупити ШІ-чипи для забезпечення
дата-центрів потужністю до 6 гігаватів, а також може отримати 10% акцій
виробника процесорів
На мові програмування, написаній у 1950-х, досі тримаються 95% трансакцій у банкоматах США