Фінансові новини
- |
- 15.06.26
- |
- 18:59
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Всі 27 країн-членів ЄС погодили відкриття першого кластера переговорів про вступ України та Молдови до блоку.
Військово-Морські Сили ЗСУ отримали ще один протимінний корабель від
Королівства Нідерланди. Про це повідомив Командувач ВМС віце-адмірал
Олексій Неїжпапа.
ЄС 15 червня проведе міжурядові конференції з Україною і Молдовою, де ЄС та країни відкриють перший переговорний кластер.
Міжнародний валютний фонд погодився виділити Україні черговий транш
кредиту, попри невиконання Києвом однієї з умов. Про це повідомило
агентство Bloomberg з посиланням на джерела.
Середня зарплата піхотинця становитиме 300 тисяч гривень на місяць, максимальна - до 460 тисяч грн.
Більшість людей звикли вважати банк найнадійнішим місцем для будь-яких фінансових операцій, у тому числі для обміну валюти.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
Кілька днів тому стало відомо, що новій главі XBOX Аші Шармі (Asha Sharma) поставлено завдання
збільшити прибутковість бренду, оскільки вище керівництво Microsoft
відмовляється надалі проводити безрезультатні вливання мільярдів
доларів.
Американські компанії активно нарощують найм фахівців зі штучного
інтелекту, однак скористатися цим бумом можуть переважно досвідчені
працівники.
Stellantis, Volkswagen і Renault об'єдналися, щоб закликати до
спрощення правил і запровадження стимулів для виробництва продукції з
маркуванням "Зроблено в Європі" та протидії китайським виробникам
електромобілів.
TSMC розробляє нову технологію пакування мікросхем під назвою CoPoS
(Chip-on-Panel-on-Structure), яка може знизити собівартість виробництва
чипів та покращити їхню продуктивність.
Компанія Google нарешті зрозуміла, що сучасні меню налаштувань
телевізорів нагадують лабіринт Мінотавра, тільки без нитки Аріадни. Нове
оновлення для Google TV
інтегрує ШІ-помічника Gemini безпосередньо в систему керування залізом.
Компанія SpaceX офіційно встановила
ціну на свої акції в межах найбільшого в історії США первинного
публічного розміщення. Виробник ракет Ілона Маска тепер входить до
списку найцінніших корпорацій планети.
Державна податкова служба України розробила законопроєкт про
податкову медіацію, що дозволить бізнесу та податковій частину спорів
вирішувати без суду.
Платіжний гігант Mastercard оголосив
про запуск сервісу Agent Pay for Machines (AP4M), який дозволяє
ШІ-агентам та програмним системам самостійно здійснювати платежі через
глобальну мережу компанії.
McDonald's почала тестувати штучний інтелект для прийому замовлень на "МакДрайв". Як передає ABC News, у майбутньому компанія сподівається замінити звичний досвід замовлення у людини на нову технологію.
Ілон Маск (Elon Musk) поділився новими подробицями проекту
орбітальних дата-центрів SpaceX, які мають перетворити космос на
майданчик для роботи штучного інтелекту.
Інженерка-програмістка Ерін Маус із Північної Кароліни домоглася
офіційного дозволу не використовувати штучний інтелект на роботі,
посилаючись на свої релігійні переконання
Американська Google, що входить до Alphabet Inc., замовила в Intel Corp.
виробництво понад 3 млн своїх тензорних процесорів (TPU) у 2028 році,
повідомляє The Information з посиланням на джерела.
Впродовж травня український автопарк поповнився 18 тис. вживаних легкових автомобілів, ввезених з-за кордону.
Spotify розглядає нові напрямки для розвитку свого сервісу, який
планують перетворити на повноцінний музичний хаб для фанів. Серед
планів, як зазначає Bloomberg, "живі" відеотрансляції концертів і продаж
квитків.