Фінансові новини
- |
- 16.01.26
- |
- 14:53
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Через прайс-кепи імпорт електроенергії з Євросоюзу здійснюється лише на 30%
Польща передасть Україні до дев'яти своїх винищувачів МіГ-29 - технічні переговори про це все ще тривають.
Деталі візиту не розголошувалися з міркувань безпеки. Востаннє очільниця МВФ відвідувала Україну в лютому 2023 року.
Світовий банк прогнозує, що зростання економіки України цього року
стабілізується на рівні 2%, згідно з базовим сценарієм, який передбачає,
що вторгнення Росії триватиме до кінця року.
Соболев назвав головні виклики для економіки та основні драйвери економічного зростання
Голова Асоціації деревообробних підприємств України, наголосив на необхідності системної інтеграції деревообробної та меблевої галузей, а також індустріального дерев’яного будівництва до державних програм відбудови й житлової політики.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Кількість абонентів "Київстару", які зареєструвалися для використання
технології Starlink Direct to Cell (D2C, прямий супутниковий зв'язок зі
смартфоном) від часу її запуску у листопаді 2025 року, перевищила 3 млн
абонентів, найактивніше сервісом користуються в Києві, Львові, Вінниці,
Хмельницькому та Дніпрі
Згідно з угодою, тайванські компанії з виробництва мікросхем та
технологій інвестують щонайменше $250 млрд у виробничі потужності в США,
а уряд Тайваню гарантуватиме цим компаніям кредит на $250 млрд.
США впроваджують 25% мита на певні чипи для штучного інтелекту, вироблені на Тайвані, зокрема NVIDIA H200. Як передає
Bloomberg, уряд буде стягувати мито з мікросхем, які ввозяться до США
перед остаточною відправкою китайським клієнтам та на інші закордонні
ринки.
Wikimedia Enterprise створено у 2021 році для надання великим
компаніям платного доступу до розширеної версії API Wikipedia. Ця версія
адаптована для комерційного використання та роботи з системами штучного
інтелекту.
Платформа X Ілона Маска заявила, що Grok більше не генеруватиме оголені
зображення людей. Компанія заявляє, що нові обмеження були впроваджені
для акаунта чат-бота у соціальній мережі й подібна функціональність
тепер недоступна навіть платним користувачам.
Відсьогодні YouTube запускає новий пакет інструментів для батьків з
України, які зможуть краще контролювати що і як довго їхні діти
дивляться на платформі. Серед них - налаштування часу перегляду для
Shorts та нагадування про сон чи перерву.
Компанія NVIDIA оголосила про фінальний запуск технології DLSS 4.5 Super Resolution, який відтепер доступний усім користувачам відеокарт GeForce RTX.
Адміністрація президента Дональда Трампа ухвалила нові критерії дозволу
продажів ШІ-процесорів NVIDIA H200 китайським покупцям. Про це пише
Bloomberg.
Міністр оборони США Піт Хегсет заявив, що чат-бот Grok, розроблений
компанією xAI, впровадять в інфраструктуру Пентагону. Цей процес стане
частиною ширшої ініціативи з використання генеративного ШІ у військових
системах.
Американська Google (належить Alphabet Inc.) розпочне розробку і
виробництво нових версій своїх флагманських смартфонів у В'єтнамі цього
року, повідомляє японське видання Nikkei із посиланням на джерела.
У Великій Британії заборонили використовувати штучний інтелект для
створення інтимних зображень із людьми, які не давали на це дозвіл.
Першим транспортним засобом із твердотілою батареєю, який можна офіційно
купити у США, став електромотоцикл Verge TS Pro. Його показали на CES
2026, і він одразу продемонстрував як переваги, так і головну проблему
цієї технології.
У центрі Львова запустили пілотну мережу 5G - вперше в Україні зі
швидкістю передавання даних близько 500 Мбіт/с на одного абонента.
Nissan Leaf поступився статусом найпопулярнішого електрокара в Україні