Фінансові новини
- |
- 24.05.26
- |
- 03:17
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Держдепартамент США ухвалив рішення
схвалити можливий продаж Україні обладнання для зенітно-ракетного
комплексу HAWK. Орієнтовна вартість пакета становить 108,1 млн доларів.
Суд у Казахстані дозволив примусове стягнення з російського Газпрому
$1,4 млрд на користь НАК "Нафтогаз України" за рішенням міжнародного
арбітражу, повідомив голова правління компанії Сергій Корецький.
Україна та Європейський Союз парафували текст Меморандуму про
взаєморозуміння щодо макрофінансової допомоги на суму 8,35 млрд євро в
рамках 90-мільярдного кредиту ЄС.
Що
ж так налякало багатьох правозахисників та юристів? Ми зібрали найбільш
скандальні, на думку критиків, статті, що з'явилися у новому Цивільному
кодексі.
З 15 липня 2026 року в Києві планують запровадити нові тарифи на проїзд у
комунальному громадському транспорті. Разовий квиток коштуватиме 30
гривень - майже в чотири більше, ніж зараз, повідомила пресслужба КМДА.
Українська бізнес-делегація відвідає Белград 19-21 травня 2026 року в
рамках візиту до Сербії віцепрем'єра України Тараса Качки, повідомила
Торгово-промислова палата України.
Мільярдер та інвестор Марк К'юбан заявив, що продав більшу частину
своїх біткоїнів. За його словами, він розчарувався у здатності
криптовалюти виступати захисним активом під час геополітичних потрясінь і
послаблення долара.
У Китаї почали масово навчати гуманоїдних роботів для роботи на
фабриках, у магазинах та у сфері послуг.
IBM та Міністерство торгівлі США оголосили про запуск першої в країні спеціалізованої квантової фабрики з виробництва чипів.
Популярний мобільний відеоредактор CapCut, який за час існування
завантажили понад 1,2 млрд разів, оголосив про партнерство з Google. У
рамках співпраці можливості редактора інтегрують безпосередньо в чат-бот
Gemini.
Автомобільний концерн Stellantis, створений в результаті злиття Fiat
Chrysler і PSA Group, у четвер, 21 березня, представив п'ятирічний
стратегічний план FaSTLAne 2030 вартістю 60 млрд євро.
За 2025-2026 рік кількість ІТ-ФОПів знизилася на 21%, і це найбільше зниження з 2016 року.
SpaceX офіційно подала документи для виходу на біржу Nasdaq під тикером
SPCX. Як пише TechCrunch, компанія повідомила, що сукупні збитки
компанії з моменту заснування перевищили $37 млрд.
Поки світовий авторинок лихоманить від китайської експансії та
падіння попиту на дорогі «електрички», старі німецькі друзі вирішили
триматися разом.
Японські дослідники створили бездротову систему зв'язку зі швидкістю передачі даних 112 Гбіт/c в діапазоні 560 ГГц.
Новий звіт "Американського індексу задоволеності клієнтів" (American
Customer Satisfaction Index, ACSI) свідчить про поразку Apple iPhone на
власній території. Користувачі Samsung Galaxy більш задоволені своїми
смартфонами.
Google додала до AI Studio
можливість створювати нативні Android-застосунки за текстовим описом.
Сервіс автоматично генерує Kotlin-код і використовує Jetpack Compose для
інтерфейсу.
Microsoft вирішила відмовитися від кодів підтвердження, надісланих
через SMS, для персональних акаунтів. Натомість компанія пропонує
користувачам використовувати опції без паролів, включно з ключами
доступу (passkeys). Про це сповіщає Windows Latest.
На Google I/O 2026 у Маунтін-В'ю компанія Google представила найбільше
переосмислення Search за останні роки. AI Mode тепер працює на Gemini
3.5 Flash і отримав три принципово нові можливості: фонові інформаційні
агенти, кастомні міні-застосунки та Universal Cart - єдиний агентний
кошик для покупок.
Цього літа Google почне розгортати Gemini Intelligence для
Android-пристроїв, однак нові ШІ-функції мають настільки високі системні
вимоги, що скористатись ними зможуть лише власники найпотужніших
смартфонів.