Классификатор на основе нейронной сети ART-1.

реклама
УДК 004.896
КЛАССИФИКАТОР НА ОСНОВЕ НЕЙРОННОЙ СЕТИ ART-1
Е.С.Борисов
Институт Кибернетики им. В.М.Глушкова НАН Украины
В этой работе построен классификатор, распознающий картинки с
цифрами от 0 до 9. Для реализации классификатора используется
нейронная сеть ART-1.
При построении классификаторов может возникать проблема
стабильности - пластичности, которая заключается в необходимости
постоянного разрешения следующей дилеммы: является ли текущий
образ искажением старого, т.е. уже предъявлявшегося ранее, или это
новый образ, существенно отличающийся от старых. Восприятие
системы должно быть пластично, т.е. способно принимать новую
информацию, и при этом - стабильно, т.е. не разрушать память о старых
образах. Решение этой проблемы было предложено С. Гроссбергом в
теории адаптивного резонанса (ART) [1]. Согласно ей общая схема
интеллектуальной системы состоит из двух типов памяти:
кратковременной (STM) и долговременной (LTM), которые связаны
между собой. Образ помещается в кратковременную память и
сравнивается с образами, хранящимися в долговременной памяти. Если
содержимое STM похоже на образ из LTM то возникает состояние
резонанса - т.е. система "узнаёт" входной образ. В противном случае
текущий входной образ считается новым. Этот подход реализует
детектор новизны образов. Гипотеза Гроссберга состоит в том, что
только резонансные состояния мозга достигают рационального уровня
сознания. Это перекликается с понятием естественного (человеческого)
языка, который часто ошибочно определяют как средство общения, в то
время как средством общения есть речь. Язык же есть средством
разделения,
инструментом
сегментации
и
классификации
окружающего
мира.
Человек
способен
видеть
(воспринять)
только то, что присутствует в его
языке (состояние резонанса). В этой
статье мы рассмотрим нейронную
сеть ART-1 [2], она относится к
дискретным
рекуррентным
Рис.1: нейронная сеть ART-1
нейронным сетям и состоит из трёх
слоёв (входного и двух обрабатывающих) и двух специальных блоков
(управления и сброса). Схема этой сети приведена на рис.1.
Общая схема функционирования сети выглядит следующим образом.
1. Сигнал через входной слой X подается на нейроны первого слоя.
2. Взвешенные (с помощью матрицы весов B ) выходы первого слоя
Y 0 поступают на входы второго слоя.
3. Взвешенные (с помощью матрицы весов T ) выходы второго слоя
Y 1 возвращаются к первому слою.
4. Выходы первого слоя Y 0 и входной вектор X сравниваются,
выполняется проверка состояния резонанса, т.е. проверяется
"узнала" система образ или нет.
5. Если резонанс не установлен, то модифицируется второй слой и
процедура повторяется со второго шага.
В этой работе реализован классификатор бинарных (черно-белых)
картинок с изображением цифр. На вход нейронной сети подаётся
картинка в формате BMP. Входной слой сети ( X на рис.1) состоит из
1581 нейронов, размер первого слоя ( Y 0 на рис.1) равен размеру
входного слоя X , размер второго слоя (слой Y 1 на рис.1) определяет
емкость памяти системы, в данном случае - 10 нейронов. Данная
реализация классификатора показала способность к обобщению
немного хуже двухслойного персептрона [2]. Однако она обладает
способностью отделять новые образы от искажённых старых (тех, что
уже предъявлялись), а так же ART-1, в отличие от персептронов,
способна постоянно (быстро) обучаться, не "забывая" при этом старые
образы.
Литература
1. Grossberg S. Competitive learning: From interactive activation
to adaptive resonance // Cognitive Science N11/1987
2. В.А.Головко, под ред.проф.А.И.Галушкина Нейронные
сети: обучение, организация и применение. - Москва:
ИПРЖР, 2001
Скачать