Фінансові новини
- |
- 23.04.26
- |
- 20:25
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Зазначається, що розгортання української системи Sky Map на авіабазі
Принца Султана, про яке раніше не повідомлялося, є ознакою того, як
українські військові значно просунулися вперед у технологіях дронів та
боротьби з ними
Посли-постійні представники країн-членів Європейського союзу схвалили як
останній законодавчий акт - зміни до регламенту про багаторічну
фінансову політику ЄС, який був необхідний для забезпечення виплати
Україні
Український президент наголосив, що відновлення "Дружби" Київ пов'язує з
розблокуванням Європейським Союзом кредиту у 90 млрд євро для потреб
України.
Уряд визначив Державну спеціальну службу транспорту Міноборони (ДССТ)
замовником робіт із захисту критичної інфраструктури: очікує, що так
роботи будуть виконуватися швидше.
Європейський Союз планує надати Україні перший транш з кредиту ЄС на
суму 90 млрд євро у кінці травня чи на початку червня 2026 року.
АЗОВ.ONE та Obmify оголосили спільний збір: чим допомогти, як підтримати, куди підуть гроші. Донатьте і беріть участь у розіграші за посиланням в статті
Китайські виробники електромобілів цього року можуть впровадити
інтелектуальні системи водіння на основі LiDAR-них датчиків у моделях
вартістю від 60 000 юанів - про це повідомляє технологічна компанія на
базі штучного інтелекту Robosense
Місія Artemis II продемонструвала роботу лазерного зв'язку між
космічним кораблем Orion і Землею зі швидкістю до 260 Мбіт/с. Дані
передавалися під час польоту навколо Місяця
Нова архітектура міжчіпових з'єднань дозволяє Google за допомогою
фреймворків JAX і Pathways масштабуватись до понад мільйона TPU в одному
тренувальному кластері.
SpaceX у підготовці до IPO розголошує інвесторам потенційні ризики,
пов'язані з бізнесом компанії, включно з амбітними планами стартапу
побудувати центри обробки даних для штучного інтелекту у космосі, які
можуть бути комерційно невигідними.
В блозі OpenAI зазначається, що ChatGPT Images 2 навчився створювати
складніші зображення, краще дотримуватися інструкцій, зберігати обрані
деталі і правильно генерувати текст.
Google відкрила нову хвилю безплатного навчання зі штучного інтелекту
для українців. Йдеться про 20 тис. ліцензій на програму "Сертифікація
Google із професійного використання ШІ" на платформі Coursera.
У недавній публікації у блозі Microsoft офіційно заявила, що Microsoft
Defender достатній для більшості користувачів і жодне додаткове
антивірусне програмне забезпечення для Windows 11 не потрібне.
Сервіс Google Фото отримав новий набір інструментів для редагування
обличчя із налаштуванням інтенсивності - для видалення недоліків шкіри,
корекції губів, відбілювання зубів тощо.
Світ електромобілів - це не лише про великі екрани та автопілоти, а
насамперед про те, наскільки важкою та дорогою буде «батарейка» під
підлогою.
Згідно із повідомленням відомства, мова йде про документи, які
використовуються у випадках змін під час перевезення, зокрема, при
перевантаженні, зміні пункту призначення, розбіжностях у вантажі чи
інших операційних ситуаціях.
Окружний суд Токіо засудив 39-річного Ватару Такеучі до 1,5 року
ув'язнення та оштрафував його на 1 мільйон єн ($6300) за публікацію
спойлерів.
США вкотре продемонстрували, що коли мова йде про напівпровідники та
національну безпеку, капіталістичні правила вільного ринку
відправляються на лаву запасних.
Дослідники NVIDIA опублікували статтю "ReSTIR PT Enhanced: алгоритмічні
вдосконалення для швидшого та надійнішого трасування шляху ReSTIR".
Apple офіційно оголосила зміну керівництва: Тім Кук залишає посаду
генерального директора компанії. З 1 вересня 2026 року його місце займе
Джон Тернус, нинішній старший віцепрезидент з апаратного забезпечення.