Фінансові новини
- |
- 17.04.26
- |
- 22:21
- |
-
RSS - |
- мапа сайту
Авторизация
Прорив у матричному множенні має призвести до швидших та ефективніших моделей штучного інтелекту
22:49 11.03.2024 |

Дослідники напрямку Computer Science відкрили новий спосіб множити великі матриці швидше, усунувши раніше невідому неефективність, що призвело до найбільшого покращення ефективності множення матриць за останні десять років. Це може врешті прискорити роботу моделей штучного інтелекту, які значною мірою покладаються на множення матриць.
Множення двох прямокутних числових масивів, відоме як матричне множення, відіграє вирішальну роль у сучасних моделях ШІ, включаючи розпізнавання мови та зображень, його використовують чатботи від усіх основних розробників, генератори зображень зі штучним інтелектом та моделі синтезу відео. Крім ШІ, матрична математика важлива для сучасних обчислень (згадаймо обробку зображень і стиснення даних), що навіть незначне підвищення ефективності може призвести до економії обчислень і електроенергії, повідомляє ArsTechnica.
Графічні процесори (GPU) виконують завдання множення матриць завдяки здатності обробляти багато обчислень одночасно. Вони розбивають великі матричні задачі на менші сегменти та розв'язують їх одночасно за допомогою алгоритму.
Вдосконалення цього алгоритму стало ключем до прориву в ефективності множення матриць протягом останнього століття - ще до того, як з'явилися комп'ютери. У жовтні 2022 року була винайдена нова методика моделлю ШІ Google DeepMind під назвою AlphaTensor, зосередившись на практичних алгоритмічних вдосконаленнях для конкретних розмірів матриць, таких як матриці 4х4.
На противагу цьому, нове дослідження групи вчених з Університету Цінхуа, Каліфорнійського університету в Берклі та Массачусетського технологічного інституту, спрямоване на теоретичні вдосконалення з метою зниження показника складності ω для підвищення ефективності для всіх розмірів матриць. Замість того, щоб шукати негайні практичні рішення, такі як AlphaTensor, нова методика спрямована на фундаментальні вдосконалення, які можуть змінити ефективність множення матриць у більш загальному масштабі.
Традиційний метод множення двох матриць n на n вимагає n³ окремих множень. Однак нова методика, яка вдосконалює «лазерний метод», представлений Фолькером Штрассеном у 1986 році, зменшила верхню межу експоненти (позначається як вищезгаданий ω), наблизивши її до ідеального значення 2, яке представляє теоретично мінімальну кількість необхідних операцій.
Традиційний спосіб множення двох сіток, заповнених числами, може вимагати виконання обчислень до 27 разів для сітки 3х3. Але з цими вдосконаленнями процес прискорюється коштом значного скорочення необхідних кроків множення. Це дає змогу звести до мінімуму кількість операцій до трохи більше ніж удвічі більшого розміру однієї зі сторін сітки в квадраті, скоригованого на коефіцієнт 2.371552. Це дуже важливо, тому що це майже досягає оптимальної ефективності подвоєння розмірів квадрата, що є найшвидшою швидкістю, на яку ми коли-небудь могли сподіватися.
Прорив 2023 року став можливим завдяки виявленню «прихованих втрат» у лазерному методі, коли корисні блоки даних ненавмисно відкидалися. У контексті множення матриць, «блоки» означають менші сегменти, на які велика матриця поділяється для полегшення обробки, а «маркування блоків» - це техніка категоризації цих сегментів, щоб визначити, які з них зберегти, а які відкинути, оптимізуючи процес множення для швидкості та ефективності. Модифікувавши спосіб маркування блоків, дослідники змогли зменшити кількість відходів і значно підвищити ефективність.
Яке ж це має практичне застосування? Для моделей ШІ зменшення кількості обчислювальних кроків у матричній математиці може призвести до скорочення часу навчання та ефективнішого виконання завдань. Це дасть змогу швидше навчати складніші моделі, що потенційно призведе до вдосконалення можливостей ШІ та розробки складніших застосунків зі штучним інтелектом. Крім того, підвищення ефективності може зробити ШІ-технології доступнішими завдяки зниженню обчислювальної потужності та споживання енергії, необхідних для виконання цих завдань.
Точний вплив на швидкість роботи моделей ШІ залежить від конкретної архітектури системи та від того, наскільки сильно її завдання покладаються на множення матриць. Підвищення алгоритмічної ефективності часто потрібно поєднувати з оптимізацією апаратного забезпечення, щоб повністю реалізувати потенційний приріст швидкості. Але все ж таки, з часом, коли вдосконалення алгоритмічних методів накопичуються, ШІ буде ставати швидшим.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Перший транш військової допомоги Україні, яка буде передана в рамках
кредиту ЄС на суму в 90 млрд євро, буде спрямований на закупівлю дронів
українського виробництва.
Партнери України за підсумками засідання Контактної групи з питань
оборони України (у форматі «Рамштайн») 15 квітня вирішили виділити для
Києва чотири мільярди доларів на посилення ППО і понад півтора мільярда
доларів - на безпілотники.
Велика Британія надасть Україні новий пакет оборонної допомоги, який
передбачає щонайменше 120 тисяч дронів цього року, заявив британський
уряд 15 квітня.
Під час українсько-німецьких урядових консультацій 14 квітня в Берліні
німецька компанія Quantum Systems оголосила про створення двох
додаткових спільних підприємств у рамках ініціативи «Будуй з Україною».
Україна та Німеччина підписали три угоди в оборонній сфері на чотири
мільярди євро. Вони спрямовані на посилення ППО, розвиток далекобійних
спроможностей та спільне виробництво дронів.
На початку 2026 року Національний банк України вперше зробив окремий
список небанківських фінансових компаній, які суттєво впливають на
ринок.
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
Компанія Anthropic,
один із головних конкурентів OpenAI, офіційно запровадила процедуру KYC
(Know Your Customer) для окремих користувачів своєї платформи Claude.
YouTube додав новий ліміт часу для перегляду Shorts. Фактично, він
дозволяє взагалі прибрати короткі відео із стрічки, пише The Verge.
Google представила Gemini Robotics-ER 1.6 - оновлення своєї моделі
робототехніки, орієнтованої на мислення, що дозволяє роботам розуміти
оточення з "безпрецедентною точністю".
Штучний інтелект (ШІ) - це фундаментальний зсув у галузі фінансів, він
дуже суттєво та в короткі терміни її змінить, заявив глобальний керівник
напряму цифрових банків у BBVA, однієї з найбільших фінансових груп
світу, Мурат Калкан.
У криптоіндустрії набирає обертів дискусія щодо майбутнього безпеки
біткоїна на тлі розвитку квантових обчислень. Група розробників на чолі з
Джеймсоном Лоппом опублікувала
пропозицію BIP-361, яка передбачає поетапне заморожування монет, що
залишаються вразливими до квантових атак - включно з потенційними
активами Сатоші Накамото у $74 млрд.
Онлайн-платформа для бронювання житла Booking.com підтвердила витік
особистих даних клієнтів. Йдеться про імена, email-адреси та деталі
бронювання, повідомляє TechCrunch.
Інвестиційний гігант BlackRock у своєму прогнозі на ІІ квартал 2026
року зафіксував різку зміну динаміки глобальних ринків: після кількох
років домінування технологічних гігантів і теми штучного інтелекту (ШІ)
інвестори почали переоцінювати ризики та шукати нові точки зростання.
Microsoft пришвидшила початкове налаштування Windows 11 (OOBE): як
зазначає Neowin, тепер дозволено пропускати обов'язкові оновлення, коли
систему запускають вперше на новому ПК.
Компанія SiFive, заснована у 2015 році інженерами з Каліфорнійського
університету в Берклі, які розробили проєкт мікросхеми з відкритим
вихідним кодом, залучила додаткові $400 млн у рамках раунду
фінансування, який перевищив пропозицію, оцінивши компанію в $3,65 млрд
Південна Корея вводить універсальний базовий доступ до мобільного
інтернету для громадян на швидкості до 400 Кбіт/с, повідомляє The
Register з посиланням на місцеву владу.
Криптоіндустрія прискорює розробку рішень для протидії потенційним
атакам квантових комп'ютерів.
Експорт електромобілів та гібридних авто з Китаю в березні цього року
зріс більш ніж удвічі, до рекордного рівня, оскільки глобальний
енергетичний шок, спричинений війною в Ірані, відновив інтерес до
електрокарів.
Amazon оголосила про плани запустити власний супутниковий
інтернет-сервіс Leo у середині 2026 року. Про це повідомив генеральний
директор компанії Енді Джессі у щорічному листі до акціонерів, пише
Engadget.
Схоже, епоха, коли мобільні процесори скромно тулилися в тіні
настільних рішень, остаточно добігає кінця. MediaTek, яка останні кілька
років активно витісняє конкурентів з преміального сегмента, готує
справжнього монстра - Dimensity 9600 Pro.