Фінансові новини
- |
- 10.02.26
- |
- 03:27
- |
-
RSS - |
- мапа сайту
Авторизация
ИИ выявляет наркоторговцев в Instagram с точностью до 95%
09:50 14.09.2021 |

Американские специалисты разработали мультимодальную систему машинного обучения, способную выявлять в Instagram страницы и публикации торговцев наркотиками путем анализа различного контента, в том числе фотографий.
Автором исследования , получившего название «Выявление незаконных наркоторговцев в Instagram с помощью крупномасштабного мультимодального объединения данных» (Identifying Illicit Drug Dealers on Instagram with Large-scale Multimodal Data Fusion), является группа специалистов Университета Западной Вирджинии и Кейсовского университета Западного резервного района.
В рамках проекта исследователи создали базу данных под названием «Выявление наркоторговцев в Instagram» (Identifying Drug Dealers on Instagram, IDDIG), а которую вошли 4 тыс. страниц пользователей соцсети, из них 1,4 тыс. принадлежали торговцам наркотиками, а остальные играли роль контрольной группы.
Как показали результаты первых тестирований, разработанная специалистами система выявляла наркоторговцев в Instagram с точностью до 95%. Кроме того, система подтолкнула к созданию проекта по выявлению сообществ на основе хэштегов, предназначенного для обнаружения изменяющихся признаков связанной с продажей наркотиков деятельности с помощью географических факторов и идентификации конкретных типов наркотиков.
Деятельность наркоторговцев в Instagram не всегда очевидна. Зачастую они рекламируют свои услуги в комментариях и с помощью хэштегов, а не в публикациях, которые было бы намного легче обнаружить как машине, так и человеку. В связи с этим разработанная специалистами система также анализирует хэштеги и комментарии.
В дополнение к анализу текста с использованием языковой модели BERT и классификации изображений с помощью нейросети ResNet система также использует мультимодальное слияние данных на уровне функций, как предложено в документе IEEE «Дискриминантный корреляционный анализ: объединение в реальном времени на уровне функций для мультимодального биометрического распознавания» (Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition) за 2016 год.
Система начинает работу по выявлению наркоторговцев с отслеживания публикаций с одним или несколькими из двухсот хэштегов, относящихся к наркотикам, с помощью API для поиска хэштегов.
Фотографии в публикациях с этими хэштегами затем классифицируются с помощью бинарной модели классификации на базе VGG-16. Если изображения совпадают с изображениями известных наркотиков, они сохраняются в системе, а публикация конвертируется в объект JSON для дальнейшего извлечения.
Далее система изучает комментарии и другую информацию (как текст, так и изображения) на страницах пользователей, опубликовавших искомые хэштеги и чей контент был отмечен как связанный с наркотиками. Таким образом в набор данных были добавлены 10 тыс. публикаций и более 23 тыс. страниц пользователей.
С целью обхода обнаружения правоохранительными органами относящиеся к наркотикам хэштеги постоянно меняются. Поэтому каждый новый хэштег в отмеченной публикации, отсутствующий в списке относящихся к наркотикам хэштегов, фиксируется и вносится в систему для последующего использования.
В конечном итоге набор данных обрабатывается с помощью пакета NetworkX языка программирования Python. Обрабатывая хэштеги так, будто они относятся к одной публикации, исследователи смогли сгенерировать связанный с наркотиками неориентированный граф для анализа с помощью NetworkX.
Исследователи протестировали набор данных IDDIG на разных протоколах, в том числе Multimodal Data Fusion, Multisource Data Fusion и Quadruple Fusion, и смогли идентифицировать связанные с наркотиками публикации и пользователей с точностью до 95%, если сравнивать с обработкой данных человеком.
BERT (Bidirectional Encoder Representations from Transformers) - разработанная компанией Google нейросетевая модель-трансформер, на которой в настоящее время строится большинство инструментов автоматической обработки языка.
IEEE (Institute of Electrical and Electronics Engineers) - Институт инженеров электротехники и электроники. Международная некоммерческая ассоциация специалистов в области техники, мировой лидер в области разработки стандартов по радиоэлектронике, электротехнике и аппаратному обеспечению вычислительных систем и сетей.
VGG16 - модель сверточной нейронной сети для выделения признаков изображений. Была предложена специалистами Оксфордского университета К. Симоняном и А. Зиссерманом. Модель достигает точности 92,7% при тестировании на ImageNet в задаче распознавания объектов на изображении.
JSON - текстовый формат обмена данными, основанный на javascript. Как и многие другие текстовые форматы, JSON легко читается людьми. Несмотря на происхождение от javascript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается независимым от языка и может использоваться практически с любым языком программирования.
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :


Україна відкриває експорт дронів, повідомив президент Володимир
Зеленський під час спілкування з викладачами та студентами Київського
авіаційного інституту.
Мінфін України та Світовий банк підписали угоду про надання
грантового фінансування від Японії та Канади на загальну суму у майже
691 млн доларів США.
Згідно з її даними, порівняно з попереднім кварталом, з урахуванням
сезонного фактору, реальний ВВП збільшився на 0,7% з урахуванням
сезонного фактору, а квартал тому цей показник складав 0,8%.
Рада ЄС у середу, 4 лютого, узгодила свою позицію щодо правової бази для
імплементації угоди Європейської Ради про надання Україні кредиту в
розмірі 90 мільярдів євро на 2026-2027 роки.
У США по бойовому випробували крилату ракету Rusty Dagger для України, створену за програмою ERAM.
В Україні стартував оборонний збір на 1 млрд грн для захисту від "Шахедів". Про це повідомляє пресслужба Фонду Сергія Притули. Проєкт під назвою "Єдинозбір" проводиться фондом спільно з 412 бригадою Nemesis та Світовим Конґресом Українців.
Samsung ще не представила лінійку Galaxy S26, а в мережі вже
з'явилася цікава інформація про флагман наступного покоління - Galaxy
S27 Ultra.
Китайські дослідники за допомогою лазерів успішно заплутали між собою
атоми на відстані 11 км у згорнутій оптоволоконній мережі.
AnTuTu опублікував щомісячний рейтинг найпродуктивніших
Android-смартфонів, у якому спостерігаються кілька цікавих змін, але
лідер вже четвертий місяць поспіль залишається колишнім.
YouTube оголосив
про повноцінний запуск функції автоматичного дубляжу відео на основі
штучного інтелекту, яка тепер доступна для всіх авторів та підтримує 27
мов, серед яких є і українська.
Ілон Маск став першою людиною в історії зі статками понад $850 млрд
після угоди між SpaceX та xAI. За оцінками Forbes, злиття ракетобудівної
компанії з бізнесом Маска у сфері штучного інтелекту та соціальних
медіа збільшило його капітал на $84 млрд - до рекордних $852 млрд.
Intel має намір знову вийти на ринок пам'яті, уклавши партнерство з дочірньою компанією SoftBank - Saimemory.
Акції технологічних та софтверних компаній обвалилися на тлі побоювань,
що розвиток штучного інтелекту (ШІ) витіснить бізнес-моделі традиційних
розробників програмного забезпечення (ПЗ).
Автомобіль перебуває в активному використанні вже 18 місяців без
тривалих простоїв. За цей час власник проїжджав у середньому майже 500
км щодня, що робить цей випадок особливо показовим з точки зору зносу.
Аналітики найближчим часом прогнозують суттєве подорожчання оперативної пам'яті та твердотільних накопичувачів, пише NotebookCheck
Згідно з документом, SpaceX та xAI спільно створять у космосі
потужний обчислювальний центр, величезні потреби в енергії якого будуть
компенсуватися за рахунок енергії Сонця
Продажі нових легкових автомобілів в Україні в січні 2026 року зросли на
10,7% порівняно з січнем 2025 року - до 5,043 тис. од., повідомляє
AUTO-Consulting.
Міністерство оборони опублікувало алгоритм, як верифікувати термінал супутникового зв'язку Starlink в Україні для військових та цивільних.
Роскомнагляд заблокував понад 4,7 млн інтернет-сторінок у рамках боротьби із "забороненою інформацією".
Група вчених заявила про розробку нового типу волоконно-оптичних
чипів з потенційною щільністю інтеграції д 100 тис. транзисторів на
сантиметр.