Фінансові новини
- |
- 18.12.25
- |
- 02:29
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :
У РУБРИЦІ
Бізнес
| У ChatGPT відтепер можна редагувати зображення в Photoshop. Функція безкоштовна й доступна в Україні |


Згідно з планом, російський скраплений природний газ (СПГ) буде
заборонено в ЄС на початку 2026 року після того, як закон набуде
чинності. Натомість імпорт трубопровідного газу буде поступово припинено
до 30 вересня 2027 року.
The New York Times дізнались деталі заходів стримування з боку партнерів
України, які готують у рамках триваючих переговорів довкола "мирного
плану" Трампа.
Він також анонсував, що Британія незабаром розпочне виробництво нових
безпілотників-перехоплювачів Octopus у Великій Британії, таким чином,
щомісяця тисячі нових безпілотників назад будуть передаватися Україні.ОП, політика, міжн. Тег Британія
Євросоюз оприлюднив план гарантій безпеки для України, що передбачає
шість ключових пунктів, та застеріг проти змін її кордонів силою,
наголосивши на праві українського народу самостійно ухвалювати рашення
щодо своєї території.
Комітет Верховної Ради України з питань фінансів, податкової та митної
політики рекомендував парламенту прийняти законопроєкт щодо зміни назви
розмінної монети України на шаг.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Повна заборона продажу автомобілів з двигунами внутрішнього згоряння в ЄС відкладається
Mercedes зробить сучасні фари ремонтопридатними в рамках ініціативи
Tomorrow XX, спрямованої на розвиток циркулярної економіки. Якщо зараз
лінзи, накладки, рамки, корпуси та електроніка мають клейові з'єднання,
то в майбутньому їх замінять різьбовими.
Китайський гігант Xiaomi почав піднімати ціну на свою продукцію і перш за все підвищення торкнеться планшетів.
Компанія Samsung повідомила своїх клієнтів про суттєве підвищення
контрактних цін на оперативну пам'ять DDR5. Про це в соцмережі X
повідомляє відомий в галузі інсайдер Jukan, який посилається на
тайванські ЗМІ.
Йдеться про застосунок, пов'язаний із Sei - блокчейном рівня Layer 1,
який створили спеціально для торгівлі цифровими активами. Застосунок
попередньо встановлюватимуть на всі нові смартфони Xiaomi, що
продаватимуться за межами материкового Китаю та США.
За словами спікерів, одразу після початку повномасштабного вторгнення РФ
у лютому 2022 року Україна перенесла критичні масиви даних до
дата-центрів на території ЄС. Уже в 2023 році стратегія була
трансформована в бік створення суверенних національних дата-центрів із
підтримкою транскордонних рішень резервного копіювання.
Google анонсувала новий експериментальний веббраузер під назвою
Disco, що орієнтований на інтеграцію ШІ у процес перегляду сторінок.
Першою функцією браузера стала GenTabs - віджети, створені на основі
відкритих вкладок, історії чатів і запитів користувача.
Європейський Союз розглядає можливість п'ятирічної відстрочки своєї
заборони на використання двигунів внутрішнього згоряння після сильного
тиску з боку деяких найбільших автомобільних країн регіону.
Зловмисники застосовують нову схему для поширення шкідливого ПЗ Atomic
macOS Stealer (AMOS), використовуючи довіру користувачів до чат-ботів на
зразок ChatGPT від OpenAI чи Grok від xAI. Про це повідомляє Huntress у
своєму дослідженні.
У листопаді український автопарк поповнили понад 11 тис.
автотранспортних засобів на акумуляторних джерелах живлення (BEV). Це
майже втричі більше, ніж у листопаді торік.
Компанія Adobe запустила свої програми Adobe Photoshop, Adobe Express та Adobe Acrobat для чат-боту ChatGPT.
Уряд ухвалив постанову, яка дає можливість запустити повний цикл
оформлення європротоколу оформлення незначних дорожньо-транспортних
пригод в застосунку "Дія", повідомила премʼєр-міністр України Юлія
Свириденко.
Серед нововведень є шаблони для відео з готовими музичними доріжками
та текстовими накладками.
Водночас прискорюється передача багатства між поколіннями. У 2025
році 91 спадкоємець (64 чоловіки та 27 жінок) успадкував рекордні $297,8
млрд, що на 36% більше, ніж у 2024 році. Загальна кількість
мультипоколінних мільярдерів досягла 860 осіб із активами $4,7
трильйона.