Снижение разрешения гистограммы ориентированных градиентов (HOG) для детекции объектов малого размера Русинов Павел, 371 гр. Научный руководитель: к.ф.-м.н, доц. Вахитов А. Т. Гистограмма ориентированных градиентов (HOG) Является необходимым преобразованием изображения в многомерный вектор для успешного использования классификатора Вычисление HOG SVM-классификатор При обучении строится гиперплоскость, разделяющая объекты на классы Гиперплоскость задается уравнением <w, x> = b w — линейная комбинация опорных векторов, являющихся подмножеством обучающей выборки Метод скользящего окна по нескольким масштабам Метод скользящего окна по нескольким масштабам При обработке изображения вычисляется до нескольких тысяч HOG Является ресурсоёмкой задачей Актуален поиск метода снижения вычислительной нагрузки Подход к оптимизации Получение из исходного классификатора новых классификаторов для окон меньших размеров Их использование при детекции объектов малого размера на входном изображении Постановка задачи Изучить структуру HOG и алгоритм его получения, изучить алгоритм работы SVMклассификатора Изучить существующие подходы к оптимизации метода скользящего окна Разработать и реализовать алгоритм масштабирования HOG Реализовать алгоритм масштабирования SVM-классификатора (с использованием предыдущего алгоритма) Постановка задачи Реализовать метод скользящего окна с использованием масштабированных классификаторов Сравнить его с первоначальным методом Существующие решения Каскадный HOG: Используются блоки произвольных размеров Вместо одного классификатора — каскад слабых классификаторов Ускорение первоначального метода в 30 раз, потеря точности распознавания Алгоритм масштабирования HOG HOG преобразуется в набор изображений (размер набора = количеству значений в блоке, размер изображения = размеру HOG в блоках) Каждое изображение интерполируется до нужного размера Изображения преобразуются в HOG Масштабирование SVMклассификаторов Используется предыдущий алгоритм для масштабирования опорных векторов В итоге получается классификатор для окон другого размера Тестирование Алгоритм масштабирования SVMклассификатора был протестирован на базе изображений рукописных цифр MNIST. Точность распознавания изображений исходного размера (28x28) составила 99.5% Тестирование На базе изображений пешеходов INRIA Person был протестирован метод скользящего окна, использующий уменьшенные классификаторы. Падение точности составило 4.6%, ускорение работы 40% Также был протестирован метод скользящего окна, использующий и уменьшенные, и увеличенные классификаторы. Падение точности составило 16.3% Результаты Изучены алгоритмы вычисления HOG и работы SVM-классификатора Реализован алгоритм масштабирования HOG Реализован и протестирован алгоритм масштабирования SVM-классификатора Реализован и протестирован метод скользящего окна, использующий масштабированные классификаторы