Фінансові новини
- |
- 27.02.26
- |
- 16:49
- |
-
RSS - |
- мапа сайту
Авторизация
ШІ-агенти провалюють 70% офісних завдань — дослідження CMU та Salesforce
15:59 30.06.2025 |

Попри амбітні обіцянки розробників, сучасні ШІ-агенти рідко справляються з офісною роботою. Згідно з новими дослідженнями Університету Карнегі-Меллон (CMU) та Salesforce, штучний інтелект успішно виконує лише 30-35% багатокрокових завдань, як-от перегляд вебсторінок, написання коду чи взаємодія з колегами, пише The Register.
CMU розробив симуляційне середовище TheAgentCompany, яке імітує невелику ІТ-компанію з типовими робочими сценаріями. У тестуванні брали участь провідні моделі, зокрема Gemini 2.5 Pro (30,3% успішності), Claude 3.7 Sonnet (26,3%), GPT-4o (8,6%) та Amazon Nova Pro (1,7%). Деякі агенти навіть вдавалися до обману, наприклад перейменовували користувачів, аби "імітувати" виконання завдань.
Salesforce запропонувала власний бенчмарк CRMArena-Pro, сфокусований на завданнях у сфері обслуговування клієнтів та продажів. Найуспішніші моделі досягли 58% точності в простих завданнях, але в багатокрокових сценаріях результат падав до 35%. У всіх випадках моделі майже не мали уявлення про конфіденційність, що ставить під сумнів їхню придатність у корпоративному середовищі.
Дослідницька компанія Gartner також попереджає про agent washing - маркетингове маскування простих чатботів або RPA-систем під повноцінних агентів. З 1000+ компаній, що пропонують "агентські" рішення, лише близько 130 справді використовують відповідні технології.
Попри нинішні обмеження, прогноз Gartner передбачає, що до 2028 року 15% щоденних бізнес-рішень ухвалюватимуть ШІ-агенти, а подібні функції пропонувати третина усього корпоративного ПЗ. Але експерти застерігають не будувати високих очікувань: до рівня умовного віртуального помічника JARVIS з фільмів про "Залізну Людину" ще далеко - більшість агентів досі не здатні самостійно виконувати складні інструкції або взаємодіяти з UI в реальному часі.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Верховна Рада у вівторок, 24 лютого, 230 голосами ухвалила закон, який
скасовує обов'язковість другого підпису на первинних документах
бухгалтерського обліку.
Європейський Союз розраховує "до Великодня" забезпечити Україні перший
оборонний пакет, профінансований з кредиту на 90 млрд євро.
Канада оголосила про передачу Україні 449 броньованих автомобілів
Roshel Senator та LAV 6. Про це йдеться у заяві уряду Канади до
четвертих роковин повномасштабного вторгнення РФ.
Голова фінансового комітету ВР Данило Гетманцев заявив, що вже у квітні
Україна може зіткнутися з ситуацією, коли "не буде чим фінансувати
видатки", бо держава вже витрачає кошти, заплановані на друге півріччя.
Національна комісія з цінних паперів та фондового ринку (НКЦПФР) може
стати основним регулятором ринку віртуальних активів в Україні,
Національний банк - допоміжним, сказав голова податкового комітету
Верховної Ради
У дорослому віці вивчення англійської рідко починається з нуля. Хтось
уже має кращий рівень, але не може заговорити, хтось роками ходив на
групові заняття й так і не дійшов до впевнених листів чи робочих
дзвінків іноземною.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Американський технологічний гігант NVIDIA оприлюднив фінансові
результати за IV квартал 2025 року та так званий 2026 фінансовий рік,
продемонструвавши стрімке зростання на фоні глобального попиту на
інфраструктуру штучного інтелекту (ШІ).
Український фонд стартапів приєднався до
глобальної мережі Microsoft for Startups Investor Network, що дозволить
IT-проєктам отримати до $150 тис. кредитів на сервіси Microsoft Azure.
Науковці з Міського університету Гонконгу та Південного університету
науки та технологій розробили екологічну водну батарею, яка стабільно
працювала протягом 120 000 циклів.
HP повідомила, що оперативна пам'ять тепер формує понад третину
собівартості її персональних комп'ютерів. За словами фінансової
директорки Карен Паркхілл, якщо торік витрати на пам'ять і накопичувачі
становили 15-18% від загальної вартості компонентів
Компанії Microsoft та SpaceX оголосили про співпрацю для розвитку
глобального доступу до інтернету. Проєкт передбачає використання
супутникового інтернету Starlink для підключення громадських центрів у
різних країнах, зокрема 450 хабів у Кенії.
Компанія SpaceX оприлюднила
амбітні плани щодо розвитку своєї технології Direct to Cell, яка дозволить звичайним смартфонам підключатися до супутників без жодного додаткового обладнання.
Dell, Lenovo та інші провідні виробники ПК готують нові ноутбуки
Copilot+, які використовуватимуть процесори NVIDIA на архітектурі ARM.
Meta та AMD анонсували угоду вартістю $100 мільярдів. У її межах
компанія Марка Цукерберга планує закупити ШІ-чипи для забезпечення
дата-центрів потужністю до 6 гігаватів, а також може отримати 10% акцій
виробника процесорів
На мові програмування, написаній у 1950-х, досі тримаються 95% трансакцій у банкоматах США
OpenAI використовує внутрішню версію ChatGPT для виявлення
співробітників, які можуть передавати конфіденційну інформацію
журналістам.
Світові продажі автомобілів на водневих паливних елементах (Fuel Cell
Electric Vehicle, FCEV) у 2025 році зросли на 24,4% у порівнянні з 2024
роком.
Після великого оновлення Gemini в Chrome минулого місяця доступ до AI
Mode тепер з'явився у настільному браузері Google отримує ще одне
оновлення - тепер безпосередньо в адресному рядку.
Протистояння між очільником OpenAI
Семом Альтманом та засновником SpaceX Ілоном Маском перейшло в нову
площину - боротьбу за майбутню інфраструктуру штучного інтелекту.
U.S.-India Connection не просто пара нових дротів під водою, а амбітна спроба замкнути «цифрове кільце» навколо Землі, з’єднавши США, Азію, Австралію та Африку новими оптоволоконними магістралями.