Фінансові новини
- |
- 03.04.26
- |
- 08:45
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Кабінет Міністрів запускає нову програму - "Точка опори", яка
дозволить роботодавцям зберегти робочі місця у період простою після
обстрілів.
Апеляційна палата ВАКС залишила без змін вирок для колишнього голови Державної фіскальної служби Романа Насірова.
Три структурні маяки, які Україна мала виконати до кінця березня 2026
року у рамках програми розширеного фінансування (EFF) Міжнародного
валютного фонду (МВФ) залишились не виконаними, свідчать дані на сайті
консорціуму RRR4U.
Президент України Володимир Зеленський та виконувач обов'язків
прем'єр-міністра Болгарії Андрей Гюров у понеділок, 30 березня,
підписали у Києві двосторонню безпекову угоду строком на десять років.
Верховна Рада розгляне законопроєкт №11115 щодо регулювання діяльності
Telegram та інших цифрових платформ. Документ уже отримав одноголосну
підтримку профільного парламентського комітету. Про це повідомив автор
законопроєкту народний депутат Микола Княжицький.
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
IBM та Arm оголосили про стратегічну співпрацю, спрямовану на розробку серверних систем із підтримкою двох архітектур.
Серед відкритих альтернатив Google Docs і Microsoft Office є
чимало варіантів, однак більшість з них не пропонують повноцінного
редагування документів в браузері за участі кількох користувачів.
Американська Amazon.com Inc. веде переговори про купівлю супутникової Globalstar, пише Financial Times із посиланням на джерела.
Масовий збій роботаксі в китайському місті Ухань призвів до того, що
близько сто самокерованих автомобілів зупинилися посеред дороги під час
руху.
У дописі в блозі Google
Research дослідники заявили, що майбутній квантовий комп'ютер може
зламати криптографію еліптичних кривих, форму методу шифрування з
відкритим ключем, яка використовується в більшості криптовалют.
Потужності найбільшого у світі контрактного виробника мікросхем TSMC уже
повністю розписані на кілька років уперед на тлі зростаючого попиту на
чипи з боку великих технологічних компаній.
У лютому 2026 року експорт українських ІТ-послуг досяг $544 млн. Це на 7,1%, або на $36 млн, більше, ніж у січні 2026 року.
Британці вирішили, що покладатися лише на супутники у 2026 році - це
якось несерйозно, особливо коли мова йде про залізницю. Поки ми звикаємо
до того, що GPS може «глючити» через РЕБ або просто зникати в тунелях, у
Сполученому Королівстві вивели на колії перший у світі прототип
квантової навігаційної системи.
Wccftech повідомляє про відчутне зниження ціни DDR5 на Amazon, Newegg та в інших ритейлерів США.
Функція Quick Share в One UI 9 отримає підтримку бездротового обміну
файлами через NFC. Для цього користувачам буде достатньо розмістити два
смартфони один біля одного, передає Android Authority.
Європейський парламент більшістю голосів підтримав пропозиції до закону
про штучний інтелект, які, серед іншого, передбачають заборону додатків,
що генерують фейкові оголені зображення реальних людей.
Google запустив функцію Search Live у 200 країнах, з Україною включно:
вона дозволяє вести інтерактивні діалоги з Пошуком у режимі ШІ, з
використанням камери та голосу.
Поки власники сучасних смартфонів з острахом дивляться на прогноз
погоди, де обіцяють бодай -10°C, китайські вчені вирішили зайти з
козирів.
Google оголосила
про масштабне оновлення для Google TV, яке інтегрує три нові можливості
на базі Gemini. Мета нововведень - перетворити телевізор на активного
помічника, який забезпечує не лише розваги, а й інформативний контент.