Фінансові новини
- |
- 12.11.25
- |
- 12:33
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


"Сьогодні вранці провели позачергове засідання Уряду. Ухвалили
рішення відсторонити Германа Галущенка від виконання обовʼязків міністра
юстиції", - зазначила премʼєр-міністерка Юлія Свириденко.
Уряд і профільний парламентський комітет Данії у вівторок погодили
деталі нового, 28-го за ліком пакета військової допомоги Україні на
загальну суму 1,4 мільярда данських крон (217 мільйонів доларів).
Серед них такі як: "Труха Україна" (понад 3 млн підписників),
"Всевидящее ОКО: Україна" (1,1 млн), "Реальна війна" (1,5 млн), "Times
of Ukraine: Новини Україна" (2,5 млн), "Інсайдер UA" (2 млн).
Національне антикорупційне бюро (НАБУ) та Спеціалізована антикорупційна
прокуратура (САП) повідомили про підозру колишньому віцепрем'єр-міністру
Олексію Чернишову у незаконному збагаченні в межах спецоперації "Мідас".
"Цими днями працюватиму в Туреччині та на Близькому Сході для того,
щоб розблокувати процес обмінів. Була домовленість - і треба її
реалізувати. Завдання Президента України чітке - українці мають
повертатись додому з полону", - повідомив секретар РНБО.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Що таке STRUM, як працює підписка СТРУМ і чому вона швидше закриває потреби «Азову». Переваги, кроки, спільнота та заклик до дії.
Основна зміна полягає у впровадженні функції "Help me edit". Вона
дозволяє змінювати фотографії за допомогою простих текстових команд,
наприклад "зроби усмішку" або "перетвори фото на ренесансний портрет".
Nano Banana зберігає упізнаваність облич і тварин.
Google планує інвестувати 5,5 мільярда євро в будівництво дата-центру в Німеччині, а також розширення свого бізнесу у країні.
У Circus розглядають можливості розміщення CA-1 у лікарнях,
університетах та на промислових підприємствах. Компанія також співпрацює
з українською програмою оборонних технологій BRAVE1 для тестування
автономного приготування їжі для солдатів у польових умовах.
У своєму нещодавньому звіті за листопад компанія Google повідомила про
зростання кількості шкідливих програм, що маскуються під VPN. Ці
фальшиві застосунки імітують інтерфейс відомих брендів, використовують
привабливу рекламу та вводять користувачів в оману.
Кілька європейських країн розпочали розслідування щодо можливих
ризиків національній безпеці, пов'язаних з електробусами китайського
виробника Yutong. Головне занепокоєння полягає в тому, що такі автобуси
теоретично можуть бути віддалено деактивовані виробником.
Apple розробляє нові функції супутникового зв'язку для майбутніх моделей
iPhone. Як повідомляє Марк Гурман, в компанії вивчають варіанти
подальшої інтеграції технологій, які почали використовуватись у 2022
році з запуском Emergency SOS.
У традиційному зверненні до акціонерів Berkshire перед Днем подяки,
опублікованому в понеділок, Баффет заявив, що "йде в тінь". Він більше
не писатиме щорічні листи для акціонерів і не братиме участі в щорічних
зборах акціонерів.
Єврокомісія планує внести зміни до Загального регламенту захисту даних
(GDPR), щоб спростити роботу компаній, які розробляють штучний інтелект.
Як повідомляє Politico, відповідні пропозиції увійдуть до пакета
"Digital Omnibus", який ЄС представить 19 листопада.
Новий чип LPDDR6 створений на 12-нм техпроцесі Samsung Foundry і
забезпечує швидкість передачі даних до 10,7 Гбіт/с - на 26% більше, ніж у
попереднього покоління LPDDR5X (8,5 Гбіт/с). До того ж він став на 21%
енергоефективнішим.
У третьому кварталі 2025 року технологія 3 нм забезпечила 23% доходів
компанії, перевищивши результати 5-нм вузла. Попри зростання попиту на
2-нм рішення, саме 3-нм процес наразі є ключовим джерелом прибутку.
Компанія Microsoft формує нову команду MAI Superintelligence Team, яка
розроблятиме штучний інтелект для медичної діагностики, значно
потужніший за людські можливості.
Функція Deep Search дозволить користувачам ставити складніші запитання
вбудованому чат-боту Google Finance та отримувати детальні, обґрунтовані
відповіді з цитуванням джерел.
Казахстан активно розвиває напрямок штучного інтелекту. У 2025 році в
Національному центрі Alemcloud запустили суперкомп'ютер на базі GPU
Nvidia H200. Новий кластер став найбільшим обчислювальним рішенням у
Центральній Азії.
Завдяки новому заводу компанія планує щороку видобувати зі старих
акумуляторів до 20 000 тонн критично важливих металів – кобальту, літію,
нікелю і міді.