Лабораторная работа 7. Распознавание изображений по углу

реклама
ЛАБОРАТОРНАЯ РАБОТА 7. РАСПОЗНАВАНИЕ
ИЗОБРАЖЕНИЙ ПО УГЛУ МЕЖДУ ВЕКТОРАМИ,
СКАЛЯРНОМУ ПРОИЗВЕДЕНИЮ И ПО
ПРИНАДЛЕЖНОСТИ К ЗАДАННОЙ ОБЛАСТИ
ПРОСТРАНСТВА
Цель лабораторных занятий
Приобретение и закрепление знаний, получение практических
навыков работы с простейшими алгоритмами распознавания на основе
представления изображений в виде точек или векторов в п-мерном
векторном пространстве.
Краткие сведения из теории
Существует большое число различных форм представления
изображений в распознающих устройствах или программах. Одной из
наиболее простых и понятных является форма, использующая
представление изображений в виде точек или векторов в некотором nмерном пространстве. Каждая ось такого пространства естественным
образом соотносится с одним из n входов или с одним из n рецепторов
распознающей системы. Каждый из рецепторов может находиться в
одном из m состояний, если они дискретны, или иметь бесконечно
большое число состояний, если рецепторы непрерывны. В зависимости
от вида используемых рецепторов может порождаться непрерывное,
дискретное или непрерывно-дискретное n-мерное пространство. В
данной лабораторной работе рассматривается непрерывное n-мерное
векторное пространство.
Мера сходства изображений в n-мерном векторном пространстве
вводится как функцию двух переменных 𝐿(𝑆𝑘 , 𝑆𝑖 ), где 𝑆𝑘 , 𝑆𝑖 ∈ 𝑆 =
{𝑆1 , 𝑆2 , … 𝑆𝑛 } - конечное множество изображений в рассматриваемом
пространстве. При этом функция 𝐿(𝑆𝑘 , 𝑆𝑖 ) обладает следующими
свойствами:
- свойством симметрии, т.е. 𝐿(𝑆𝑘 , 𝑆𝑖 ) = 𝐿(𝑆𝑖 , 𝑆𝑘 );
1
- областью
значений
функции
является
множество
неотрицательных чисел, т.е. 𝐿(𝑆𝑘 , 𝑆𝑖 ) ≥ 0, 𝑘, 𝑖 = 1,2 … , 𝑛;
- мера сходства изображения с самим собой принимает
экстремальное значение по сравнению с любым другим
изображением, т.е. в зависимости от способа введения меры
сходства выполняется одно из двух соотношений:
𝐿(𝑆𝑘 , 𝑆𝑘 ) = max(𝐿(𝑆𝑘 , 𝑆𝑖 )),
𝐿(𝑆𝑘 , 𝑆𝑘 ) = min(𝐿(𝑆𝑘 , 𝑆𝑖 ));
- в случае компактных образов функция 𝐿(𝑆𝑘 , 𝑆𝑖 ) является
монотонной функцией удаления точек 𝑆𝑘 и 𝑆𝑖 друг от друга в nмерном пространстве.
В n-мерном пространстве мера сходства изображений может быть
введена многими способами. Рассмотрим несколько из них. При этом
во всех случаях будем полагать, что эталонные изображения
𝑋1 , 𝑋2 , … , 𝑋𝑚 m различных классов изображений или образов в n-мерном
пространстве задаются в виде векторов с проекциями на оси координат:
𝑋1 = (𝑥11 , 𝑥12 , … , 𝑥1𝑛 ), 𝑋2 = (𝑥21 , 𝑥22 , … , 𝑥2𝑛 ), … , 𝑋𝑚 = (𝑥𝑚1 , 𝑥𝑚2 , … , 𝑥𝑚𝑛 ).
Любое входное изображение 𝑆𝑖 ∈ 𝑆 также представляется в виде
вектора 𝑆𝑖 = (𝑠𝑖1 , 𝑠𝑖2 , … , 𝑠𝑖𝑛 ) в этом пространстве.
Распознавание по углу между векторами
Мера близости между двумя векторами в n-мерном векторном
пространстве может быть задана в виде угла. Если задано входное
изображение 𝑆𝑖 = (𝑠𝑖1 , 𝑠𝑖2 , … , 𝑠𝑖𝑛 ) и векторы эталонных изображений 𝑋1 =
(𝑥11 , 𝑥12 , … , 𝑥1𝑛 ), 𝑋2 = (𝑥21 , 𝑥22 , … , 𝑥2𝑛 ), … , 𝑋𝑚 = (𝑥𝑚1 , 𝑥𝑚2 , … , 𝑥𝑚𝑛 ), то мера
сходства между входным и эталонными изображениями определяется
выражением
𝐿(𝑆𝑖 , 𝑋𝑗 ) = 𝑎𝑟𝑐𝑐𝑜𝑠(
𝑠𝑖1 𝑥𝑗1 + 𝑠𝑖2 𝑥𝑗2 +⋯+𝑠𝑖𝑛 𝑥𝑗𝑛
2
2
2
2
2
2
√𝑠𝑖1
+𝑠𝑖2
+⋯+𝑠𝑖𝑛
⋅√𝑥𝑗1
+𝑥𝑗2
+⋯+𝑥𝑗𝑛
) = 𝑎𝑟𝑐𝑐𝑜𝑠 (
∑𝑛
𝑘=1 𝑠𝑖𝑘 𝑥𝑗𝑘
|𝑆𝑖 |∙|𝑋𝑗 |
),
(1)
где |𝑆𝑖 |, |𝑋𝑗 | - соответственно длины векторов.
Принадлежность входного изображения 𝑆𝑖 к одному из m образов
определяется с помощью решающего правила
2
𝑆𝑖 ∈ 𝑋𝑗 , если 𝐿(𝑆𝑖 , 𝑋𝑗 ) = min(𝐿(𝑆𝑖 , 𝑋𝑗 )),
(2)
𝑗
При этом в решающем правиле и далее по тексту для обозначения
j-го образа и эталонного изображения j-го образа применяется одно и
тоже обозначение 𝑋𝑗 (𝑗 = 1, 𝑚).
Распознавание
произведению
изображений
по
скалярному
Мера близости изображений по углу между векторами (1)
основана на скалярном произведении векторов:
< 𝑆𝑖 , 𝑋𝑗 > = |𝑆𝑖 | ∙ |𝑋𝑗 | ⋅ 𝑐𝑜𝑠 𝛼 = ∑𝑛𝑘=1 𝑠𝑖𝑘 𝑥𝑗𝑘 .
(3)
Некоторые системы распознавания используют непосредственно
скалярное произведение в качестве меры сходства изображений в nмерном векторном пространстве:
𝐿(𝑆𝑖 , 𝑋𝑗 ) == ∑𝑛𝑘=1 𝑠𝑖𝑘 𝑥𝑗𝑘 .
(4)
В этом случае принадлежность входного изображения 𝑆𝑖 к какомулибо образу определяется с помощью решающего правила
𝑆𝑖 ∈ 𝑋𝑗 , если 𝐿(𝑆𝑖 , 𝑋𝑗 ) = max(𝐿(𝑆𝑖 , 𝑋𝑗 )),
𝑗
Распознавание изображений по
заданной области пространства
(5)
принадлежности к
При этом способе распознавания все пространство изображений V
разбивается на непересекающиеся области 𝑉1 , 𝑉2 , … 𝑉𝑚 , 𝑉𝑚+1 , где
𝑉1 , 𝑉2 , … 𝑉𝑚 - области, содержащие изображения только одного
соответствующего образа 𝑋1 , 𝑋2 , … , 𝑋𝑚 ; V m+1 - область, не содержащая
изображений, относящихся к указанным образам. В этом случае
принадлежность
входного
изображения
𝑆𝑖 = (𝑠𝑖1 , 𝑠𝑖2 , … , 𝑠𝑖𝑛 )
к
некоторому j-му образу (𝑗 = 1, 𝑚) определяется решающим правилом
𝑆𝑖 ∈ 𝑋𝑗 , если (𝑠𝑖1 , 𝑠𝑖2 , … , 𝑠𝑖𝑛 ) ∈ 𝑉𝑗 .
(6)
3
Если области 𝑉𝑗 , (𝑗 = 1, 𝑚) заданы в евклидовом пространстве в
∗
∗
∗
виде шаров с центрами в точках (𝑥𝑗1
, 𝑥𝑗2
, … , 𝑥𝑗𝑛
, ) и радиусами 𝑅𝑗 то
решающее правило (6) принимает вид
2
∗
𝑆𝑖 ∈ 𝑋𝑗 , если 𝐿(𝑆𝑖 , 𝑋𝑗 ) = √∑𝑛𝑘=1(𝑥𝑗𝑘
− 𝑠𝑖𝑘 ) ≤ 𝑅𝑗 ,
(7)
Для конструирования областей в пространстве изображений могут
использоваться любые меры сходства, например, расстояния с
весовыми коэффициентами (8) - (10), расстояние по Камберру (11) и
т.д.
𝐿(𝑆𝑖 , 𝑋𝑗 ) = √∑𝑛𝑘=1 𝜂𝑘 (𝑠𝑖𝑘 − 𝑥𝑗𝑘 )2 ,
(8)
𝜆
𝐿(𝑆𝑖 , 𝑋𝑗 ) = √∑𝑛𝑘=1 𝜂𝑘 (𝑠𝑖𝑘 − 𝑥𝑗𝑘 )𝜆 ,
(9)
𝐿(𝑆𝑖 , 𝑋𝑗 ) = ∑𝑛𝑘=1 𝜂𝑘 |𝑠𝑖𝑘 − 𝑥𝑗𝑘 |,
𝐿(𝑆𝑖 , 𝑋𝑗 ) = ∑𝑛𝑘=1 |
𝑠𝑖𝑘 −𝑥𝑗𝑘
𝑠𝑖𝑘 +𝑥𝑗𝑘
(10)
|,
(11)
𝜂𝑘 (𝑘 = 1, 𝑛) - весовые коэффициенты; 𝜆 - целое положительное
число, большее двух.
Решающее правило (6) для расстояний (8) - (10) принимает вид
𝑆𝑖 ∈ 𝑋𝑗 , если 𝐿(𝑆𝑖 , 𝑋𝑗 ) = 𝑅𝑖𝑗 ≤ 𝑅𝑗 ,
где 𝑅𝑖𝑗
-
расстояние, заданное одним из выражений (8)
-
(11),
между предъявленным изображением 𝑆𝑖 и центром шара, содержащего
изображения j-го образа; 𝑅𝑗 - радиус шара, содержащего изображения jго образа.
При использовании для распознавания угла между векторами
непересекающиеся области 𝑉𝑗 , (𝑗 = 1, 𝑚) задаются в виде конусов, а
решающее правило имеет вид
𝑆𝑖 ∈ 𝑋𝑗 , если 𝐿(𝑆𝑖 , 𝑋𝑗 ) = 𝜑𝑖𝑗 = 𝑎𝑟𝑐𝑐𝑜𝑠(
𝑠𝑖1 𝑥𝑗1 + 𝑠𝑖2 𝑥𝑗2 +⋯+𝑠𝑖𝑛 𝑥𝑗𝑛
2
2
2
2
2
2
√𝑠𝑖1
+𝑠𝑖2
+⋯+𝑠𝑖𝑛
⋅√𝑥𝑗1
+𝑥𝑗2
+⋯+𝑥𝑗𝑛
) ≤ 𝜑𝑗𝑚𝑎𝑥 ,
4
где 𝜑𝑖𝑗 - угол между предъявленным изображением 𝑆𝑖 и эталонным
изображением 𝑋𝑗 ; 𝜑𝑗𝑚𝑎𝑥 предельно допустимый угол для j-го образа
между эталонным и распознаваемым изображениями.
Индивидуальные задания
1. Разработайте алгоритм и программу, моделирующую
распознавание различных объектов в п-мерном векторном
пространстве по углу между векторами и скалярному
произведению.
2. Задайтесь
размерностью
n-мерного
векторного
пространства, числом m эталонных объектов образов (п и m
должны быть не менее 5) и несколькими распознаваемыми
объектами. С помощью угла между векторами и скалярного
произведения определите принадлежность предъявленных
объектов к тому или иному образу.
3. Разработайте алгоритм и программу, моделирующую
распознавание различных объектов по их принадлежности к
шарообразным или конусообразным областям в n-мерном
векторном пространстве.
4. Задайтесь
размерностью
n-мерного
векторного
пространства,
числом
m
образов
и
несколькими
распознаваемыми объектами. Определите принадлежность
предъявленных объектов к тому или иному образу при
шарообразных и конусообразных областях, содержащих
изображения заданных образов.
Содержание отчета
1. Тема лабораторных занятий.
2. Индивидуальное задание.
3. Результаты выполнения пунктов 1 - 4 индивидуального
задания.
5
Скачать