Определение спам-изображений на основе перцептивных

реклама
Определение спам-изображений
на основе перцептивных хешей
Фефелов Алексей Андреевич, 545 группа
Научный руководитель: к.ф.-м.н. , Д.Ю. Бугайченко
Рецензент: к.ф.-м.н. А.Т. Вахитов
Введение

Фильтрация спама
o
o
o

Способы борьбы со спамом
o
o

Пользовательская модерация
Статистические фильтры
Спам-изображения
o

Социальные сети, сайты знакомств, блоги
Электронная почта
Мессенджеры
Содержат похожие, но не идентичные фрагменты
Проблема: спамеры постоянно создают новые
подложки и искажают фрагменты
Возможные решения

Нейронные сети
o

Алгоритмы на базе детекции особенностей
(SURF, SIFT и другие)
o
o

Необходимость обучения
Необходимость разрешения для использования в
коммерческих целях/отсутствие зрелых библиотек
Низкая производительность
Использование перцептивных хешей
o
o
o
Можно сравнивать между собой
При вычислении применяются процессы,
имитирующие различные аспекты восприятия
информации человеком
Один из наиболее общих способов решения
Постановка задачи

Изучить различные существующие подходы
для вычисления перцептивных хешей
изображений

Реализовать несколько хеш-алгоритмов и
адаптировать их для задачи поиска спамизображений
Протестировать алгоритмы на базе данных с
изображениями, проанализировать результаты
их работы
Подготовить условия для введения алгоритмов
в эксплуатацию


Используемые алгоритмы

Simple Hash (128 байт)
 Marr-Hildreth Operator Based Hash (64 байта)
Используемые алгоритмы(2)

Discrete Cosine Transform Based Hash –
построение матрицы частот, избавление от
высоких частот (8 байт)
o

Дискретное косинусное преобразование для
вектора X длины N-1:
Radial Variance Based Hash – построение
вектора энергий + DCT (40 байт)
Схема архитектуры системы


Множество паттернов (пара спам-изображение
и расположение фрагмента на нем)
Поиск подстроки, соответствующей хешу спамфрагмента в хеше изображения
Характеристики работы спамфильтра

Спам-фильтр разбивает все изображения на 3
группы: «точно спам», «возможно спам», «точно
не спам»
Результат проверки
изображения
На самом деле спам
На самом деле не
спам
Позитивное
срабатывание
(«точно спам»)
Истинно-позитивное
Ложно-позитивное
(ошибка 2 рода, FAR)
Негативное
срабатывание
(«точно не спам»)
Ложно-негативное
(ошибка 1 рода,FRR)
Истинно-негативное
«Возможно спам»
В этой группе находится как спам, так и не спам
Ложные срабатывания
Рис. Ложно-позитивные(FAR) и ложно-негативные
срабатывания(FRR) для алгоритма DCTBH
Сравнение результатов

60000 изображений с музыкального сервиса
социальной сети odnoklassniki.ru, из которых
700 – спам, 3 типа спама
90%
Истинно-позитивное
срабатывание
80%
70%
60%
Неопределенное
срабатывание
(возможно спам)
Ложно-позитивное
срабатывание
50%
40%
30%
20%
Ложно-негативное
срабатывание
10%
0%
SH
DCT
RV
MH
Сравнение скоростей

Intel Core i5-2430M CPU (2,40 GHz)
Среднее время
обработки 1
изображения(мс.)
Среднее время
сравнения 100 хешей
(мс.)
160
140
120
100
80
60
40
20
0
600
500
400
300
200
100
0
SH
DCT
RV
MH
Результаты




Были изучены различные существующие
подходы для вычисления перцептивных хешей
изображений
4 перцептивных хеш-алгоритма адаптировано
для задачи поиска спам-изображений
Алгоритмы протестированы на реальных
данных, проанализированы результаты их
работы
Создано API для введения алгоритмов в
эксплуатацию, компания «Одноклассники»
рассматривает возможность внедрения
полученных результатов для фильтрации спама
Скачать