Фінансові новини
- |
- 03.03.26
- |
- 22:36
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Загальна сума державного та гарантованого державою боргу України станом
на кінець січня 2026 року сягнула 215,0 млрд дол. США, збільшившись за
місяць на 1,67 млрд дол.
Кабмін розширив експериментальний проєкт зі створення власних груп
протиповітряної оборони на підприємствах критичної інфраструктури. Про
це повідомила прем'єр-міністерка Юлія Свириденко.
Від 2 березня банкноти номіналами 1, 2, 5 і 10 гривень зразків 2003-2007
років замінюються на відповідні обігові монети, повідомив Національний
банк України.
Україна нещодавно досягла домовленості з Експортно-імпортним банком
Китаю (China EXIM) про реструктуризацію залучених раніше під державні
гарантії кредитів, повідомив заступник голови місії Фонду в Україні
Тревор Лессард
Думка,
що Україна неодмінно буде в ЄС, давно є домінуючою у Європі, а зараз
посилюється розуміння, що процес вступу має бути швидшим за звичний.
У дорослому віці вивчення англійської рідко починається з нуля. Хтось
уже має кращий рівень, але не може заговорити, хтось роками ходив на
групові заняття й так і не дійшов до впевнених листів чи робочих
дзвінків іноземною.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Telegram отримав нові функції. Вони вже доступні для звичайних користувачів, і тих, хто платить за Premium.
OpenAI оголосила про новий раунд фінансування на $110 млрд - один із
найбільших в історії Силіконової долини, який підвищив оцінку компанії
до $730 млрд.
Samsung оголосила про розширення можливостей супутникового зв'язку для
окремих смартфонів Galaxy, включно з новою серією Galaxy S26, завдяки
співпраці зі світовими операторами телекомунікацій у Північній Америці,
Європі та Японії.
Компанія NVIDIA оголосила про співпрацю з провідними телекомунікаційними
компаніями для розробки шостого покоління мобільних мереж, які будуть
орієнтовані на використання штучного інтелекту.
Китайські науковці розробили новий акумулятор для електромобілів із
щільністю енергії понад 700 Вт·год/кг, що потенційно дає запас ходу
понад 1000 км на одному заряді.
Американський технологічний гігант NVIDIA оприлюднив фінансові
результати за IV квартал 2025 року та так званий 2026 фінансовий рік,
продемонструвавши стрімке зростання на фоні глобального попиту на
інфраструктуру штучного інтелекту (ШІ).
Український фонд стартапів приєднався до
глобальної мережі Microsoft for Startups Investor Network, що дозволить
IT-проєктам отримати до $150 тис. кредитів на сервіси Microsoft Azure.
HP повідомила, що оперативна пам'ять тепер формує понад третину
собівартості її персональних комп'ютерів. За словами фінансової
директорки Карен Паркхілл, якщо торік витрати на пам'ять і накопичувачі
становили 15-18% від загальної вартості компонентів
Компанії Microsoft та SpaceX оголосили про співпрацю для розвитку
глобального доступу до інтернету. Проєкт передбачає використання
супутникового інтернету Starlink для підключення громадських центрів у
різних країнах, зокрема 450 хабів у Кенії.
Компанія SpaceX оприлюднила
амбітні плани щодо розвитку своєї технології Direct to Cell, яка дозволить звичайним смартфонам підключатися до супутників без жодного додаткового обладнання.
Dell, Lenovo та інші провідні виробники ПК готують нові ноутбуки
Copilot+, які використовуватимуть процесори NVIDIA на архітектурі ARM.
Фінський стартап Donut Lab оприлюднив результати першого незалежного
тестування своєї твердотільної батареї.
Meta та AMD анонсували угоду вартістю $100 мільярдів. У її межах
компанія Марка Цукерберга планує закупити ШІ-чипи для забезпечення
дата-центрів потужністю до 6 гігаватів, а також може отримати 10% акцій
виробника процесорів
На мові програмування, написаній у 1950-х, досі тримаються 95% трансакцій у банкоматах США