Фінансові новини
- |
- 17.06.26
- |
- 06:16
- |
-
RSS - |
- мапа сайту
Авторизация
![]() | |
|
"Ви ніколи не перетнете океан, якщо не наберетеся мужності втратити берег з поля зору" Христофор Колумб |
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Уряд представив Бюджетну декларацію на
2027-2029 роки, в якій закладено два сценарії розвитку подій - залежно
від перебігу війни
Міжнародний арбітраж, створений за Конвенцією ООН з морського права,
ухвалив рішення у справі України проти РФ, підтвердивши порушення Росією
норм міжнародного права в Чорному, Азовському морях і Керченській
протоці та відкинувши російські претензії на їхній статус.
Всі 27 країн-членів ЄС погодили відкриття першого кластера переговорів про вступ України та Молдови до блоку.
Військово-Морські Сили ЗСУ отримали ще один протимінний корабель від
Королівства Нідерланди. Про це повідомив Командувач ВМС віце-адмірал
Олексій Неїжпапа.
ЄС 15 червня проведе міжурядові конференції з Україною і Молдовою, де ЄС та країни відкриють перший переговорний кластер.
Більшість людей звикли вважати банк найнадійнішим місцем для будь-яких фінансових операцій, у тому числі для обміну валюти.
Дізнайтеся, як облаштування тренажерного залу в офісі підвищує продуктивність команди. Поради щодо вибору професійного фітнес-обладнання від бренду Besport.
Найбільший український мобільний оператор "Київстар" оголосив про запуск
роботи месенджерів Viber, WhatsApp та застосунку навігації Google Maps
через технологію Starlink Direct to Cell (D2C, прямий супутниковий
зв'язок зі смартфоном) у режимі Light Data, повідомив президент та СЕО
компанії Олександр Комаров
Попри те, що 68% українських IT-компаній залишаються прибутковими,
понад 31% юридичних осіб у сфері інформаційних технологій завершили 2025
рік зі збитками.
Два оновлення для браузера Google Chrome, які вийдуть цього
літа, усунуть обхідні шляхи для запуску старих блокувальників реклами,
на кшталт uBlock Origin
Кілька днів тому стало відомо, що новій главі XBOX Аші Шармі (Asha Sharma) поставлено завдання
збільшити прибутковість бренду, оскільки вище керівництво Microsoft
відмовляється надалі проводити безрезультатні вливання мільярдів
доларів.
Американські компанії активно нарощують найм фахівців зі штучного
інтелекту, однак скористатися цим бумом можуть переважно досвідчені
працівники.
Stellantis, Volkswagen і Renault об'єдналися, щоб закликати до
спрощення правил і запровадження стимулів для виробництва продукції з
маркуванням "Зроблено в Європі" та протидії китайським виробникам
електромобілів.
TSMC розробляє нову технологію пакування мікросхем під назвою CoPoS
(Chip-on-Panel-on-Structure), яка може знизити собівартість виробництва
чипів та покращити їхню продуктивність.
Компанія SpaceX офіційно встановила
ціну на свої акції в межах найбільшого в історії США первинного
публічного розміщення. Виробник ракет Ілона Маска тепер входить до
списку найцінніших корпорацій планети.
Державна податкова служба України розробила законопроєкт про
податкову медіацію, що дозволить бізнесу та податковій частину спорів
вирішувати без суду.
Німецький суд постановив, що Google несе пряму відповідальність
за неправдиву інформацію, яку поширює сервіс AI Overview - частина
пошукової системи, яка генерує короткі ШІ-відповіді на запити.
Платіжний гігант Mastercard оголосив
про запуск сервісу Agent Pay for Machines (AP4M), який дозволяє
ШІ-агентам та програмним системам самостійно здійснювати платежі через
глобальну мережу компанії.
McDonald's почала тестувати штучний інтелект для прийому замовлень на "МакДрайв". Як передає ABC News, у майбутньому компанія сподівається замінити звичний досвід замовлення у людини на нову технологію.
Ілон Маск (Elon Musk) поділився новими подробицями проекту
орбітальних дата-центрів SpaceX, які мають перетворити космос на
майданчик для роботи штучного інтелекту.
Інженерка-програмістка Ерін Маус із Північної Кароліни домоглася
офіційного дозволу не використовувати штучний інтелект на роботі,
посилаючись на свої релігійні переконання