Фінансові новини
- |
- 16.04.26
- |
- 01:35
- |
-
RSS - |
- мапа сайту
Авторизация
ШІ-агенти провалюють 70% офісних завдань — дослідження CMU та Salesforce
15:59 30.06.2025 |

Попри амбітні обіцянки розробників, сучасні ШІ-агенти рідко справляються з офісною роботою. Згідно з новими дослідженнями Університету Карнегі-Меллон (CMU) та Salesforce, штучний інтелект успішно виконує лише 30-35% багатокрокових завдань, як-от перегляд вебсторінок, написання коду чи взаємодія з колегами, пише The Register.
CMU розробив симуляційне середовище TheAgentCompany, яке імітує невелику ІТ-компанію з типовими робочими сценаріями. У тестуванні брали участь провідні моделі, зокрема Gemini 2.5 Pro (30,3% успішності), Claude 3.7 Sonnet (26,3%), GPT-4o (8,6%) та Amazon Nova Pro (1,7%). Деякі агенти навіть вдавалися до обману, наприклад перейменовували користувачів, аби "імітувати" виконання завдань.
Salesforce запропонувала власний бенчмарк CRMArena-Pro, сфокусований на завданнях у сфері обслуговування клієнтів та продажів. Найуспішніші моделі досягли 58% точності в простих завданнях, але в багатокрокових сценаріях результат падав до 35%. У всіх випадках моделі майже не мали уявлення про конфіденційність, що ставить під сумнів їхню придатність у корпоративному середовищі.
Дослідницька компанія Gartner також попереджає про agent washing - маркетингове маскування простих чатботів або RPA-систем під повноцінних агентів. З 1000+ компаній, що пропонують "агентські" рішення, лише близько 130 справді використовують відповідні технології.
Попри нинішні обмеження, прогноз Gartner передбачає, що до 2028 року 15% щоденних бізнес-рішень ухвалюватимуть ШІ-агенти, а подібні функції пропонувати третина усього корпоративного ПЗ. Але експерти застерігають не будувати високих очікувань: до рівня умовного віртуального помічника JARVIS з фільмів про "Залізну Людину" ще далеко - більшість агентів досі не здатні самостійно виконувати складні інструкції або взаємодіяти з UI в реальному часі.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Велика Британія надасть Україні новий пакет оборонної допомоги, який
передбачає щонайменше 120 тисяч дронів цього року, заявив британський
уряд 15 квітня.
Під час українсько-німецьких урядових консультацій 14 квітня в Берліні
німецька компанія Quantum Systems оголосила про створення двох
додаткових спільних підприємств у рамках ініціативи «Будуй з Україною».
Україна та Німеччина підписали три угоди в оборонній сфері на чотири
мільярди євро. Вони спрямовані на посилення ППО, розвиток далекобійних
спроможностей та спільне виробництво дронів.
Прем'єр-міністр Норвегії Йонас Ран Стере заявив,
що перші з шести винищувачів F-16, які його країна обіцяла Києву,
незабаром будуть готові до експлуатації.
Кабмін призначив Ореста Мандзія головою Державної митної служби. Про це повідомила прем'єр-міністерка Юлія Свириденко.
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
Штучний інтелект (ШІ) - це фундаментальний зсув у галузі фінансів, він
дуже суттєво та в короткі терміни її змінить, заявив глобальний керівник
напряму цифрових банків у BBVA, однієї з найбільших фінансових груп
світу, Мурат Калкан.
У криптоіндустрії набирає обертів дискусія щодо майбутнього безпеки
біткоїна на тлі розвитку квантових обчислень. Група розробників на чолі з
Джеймсоном Лоппом опублікувала
пропозицію BIP-361, яка передбачає поетапне заморожування монет, що
залишаються вразливими до квантових атак - включно з потенційними
активами Сатоші Накамото у $74 млрд.
Онлайн-платформа для бронювання житла Booking.com підтвердила витік
особистих даних клієнтів. Йдеться про імена, email-адреси та деталі
бронювання, повідомляє TechCrunch.
Інвестиційний гігант BlackRock у своєму прогнозі на ІІ квартал 2026
року зафіксував різку зміну динаміки глобальних ринків: після кількох
років домінування технологічних гігантів і теми штучного інтелекту (ШІ)
інвестори почали переоцінювати ризики та шукати нові точки зростання.
У березні український автопарк поповнився понад 3,3 тис. гібридних легкових автомобілів (HEV і PHEV).
Microsoft пришвидшила початкове налаштування Windows 11 (OOBE): як
зазначає Neowin, тепер дозволено пропускати обов'язкові оновлення, коли
систему запускають вперше на новому ПК.
Компанія SiFive, заснована у 2015 році інженерами з Каліфорнійського
університету в Берклі, які розробили проєкт мікросхеми з відкритим
вихідним кодом, залучила додаткові $400 млн у рамках раунду
фінансування, який перевищив пропозицію, оцінивши компанію в $3,65 млрд
Криптоіндустрія прискорює розробку рішень для протидії потенційним
атакам квантових комп'ютерів.
Експорт електромобілів та гібридних авто з Китаю в березні цього року
зріс більш ніж удвічі, до рекордного рівня, оскільки глобальний
енергетичний шок, спричинений війною в Ірані, відновив інтерес до
електрокарів.
Amazon оголосила про плани запустити власний супутниковий
інтернет-сервіс Leo у середині 2026 року. Про це повідомив генеральний
директор компанії Енді Джессі у щорічному листі до акціонерів, пише
Engadget.
Схоже, епоха, коли мобільні процесори скромно тулилися в тіні
настільних рішень, остаточно добігає кінця. MediaTek, яка останні кілька
років активно витісняє конкурентів з преміального сегмента, готує
справжнього монстра - Dimensity 9600 Pro.
Компанія Google
оновила підходи до безпеки в чат-боті Gemini, зокрема у взаємодії з
користувачами, які можуть переживати психічну кризу.
Google почала розгортати оновлення для Chrome з підтримкою вертикальних вкладок і покращеним режимом читання.
Обсяг вітчизняного ІТ-ринку оцінюється у 7,85 млрд дол. США; торік галузь сплатила 50,5 млрд грн податків.