ОБ АЛГЕБРАИЧЕСКИХ ОСНОВАНИЯХ ГОЛОГРАФИЧЕСКОЙ ПАРАДИГМЫ В ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ: АЛГЕБРА ФУРЬЕ-ДУАЛЬНЫХ ОПЕРАТОРОВ Павлов А.В., к.т.н., с.н.с. СПб ГУ ИТМО тел./факс: (812)232-14-67 e-mail: pavlov@phoi.ifmo.ru 1. ВВЕДЕНИЕ В искусственном интеллекте хорошо известна голографическая парадигма (ГП), основанная на ряде аналогий между механизмами работы и свойствами мозга с одной стороны и оптической голографии с другой [1]. Предтечей ГП можно считать А. Гольдшайдера, предложившего еще в 1906 г. рассматривать механизмы памяти и внимания как взаимодействие (т.е. интерференцию) волновых фронтов, формирующихся при поступлении стимулов в кортикальные области мозга. Известно, что голографическая парадигма пересекается с нейросетевой парадигмой [2], а также имеет ряд глубоких аналогий с теорией нечетких множеств. Для выявления этих аналогий полезно рассмотреть алгебраические основания ГП. В данной статье, исходя из принципа физической обоснованности математической модели, рассмотрены алгебраические основания голографии Фурье. 2. АЛГЕБРА ФУРЬЕ-ДУАЛЬНЫХ ОПЕРАТОРОВ Определение 1. Пусть U – универсальное множество, его элементы обозначим x. Обозначим через Im элементы модели, построенной на универсальном множестве U, и определим множество элементов модели (множество всех подмножеств) следующим образом: F Im Im Im :U 0,1 (1) Нетрудно видеть, что (1) формально совпадает с определением нечеткого множества [3]. Аналогия в оптике. Рассмотрим плоский волновой фронт, ограниченный апертурой кадрового окна. В силу универсального свойства ограниченности, в том числе, Фурье-спектра, этот волновой фронт в соответствии с теоремой Котельникова (или теорией дифракции в оптике) может быть представлен в виде набора пикселей – дифракционно-ограниченных элементов разрешения, имеющих конечный размер. В предположении безаберрационности оптической системы и отсутствия геометрических искажений положение пикселей строго фиксировано и не изменяется. Любое изображение Im, т.е. электромагнитное поле в данной плоскости или транспарант, также состоит из пикселей. Приняв для изображений обычную процедуру нормировки, ограничившись только амплитудными изображениями, и обозначив плоский волновой фронт U, а пиксели x, правомочно представить любое изображение в виде Im( x ) :U 0,1 , формально совпадающем с определением нечеткого подмножества (1). Таким образом, мы можем принять плоский волновой фронт, ограниченный апертурой кадрового окна в качестве оптической реализации абстрактного понятия универсального множества U, пиксели – в качестве его элементов. Обратим внимание, что допущение на безаберрационность системы позволяет однозначно приписать каждому пикселю x его координату, которую также обозначим x (для простоты рассмотрим одномерный случай). Определение 2. Определим алгебру как модель F Im ,D,, ,o,u , где и – определяющие модель операции, D – оператор, задающий дуальность определяющих операций и в форме Ima x ,Imb x F Im ;D Ima x Imb x D Ima x D Imb x , (2) o и u – наименьший и наибольший элементы. Определение 3. Определим коммутативную, ассоциативную и неубывающую бинарную операцию 2 V : o, u o, u с нейтральным элементом e(x), т.е (3) Im x o,u ;V Im x ,e x V e x ,Im x Im x Тогда, если e(x)=u(x), то определим V как абстрактное умножение (V = ); а если e(x) = o(x), то V определим как абстрактное сложение (V = )). Нетрудно видеть, что определенные таким образом операции суть t-норма и t-конорма соответственно [3, 4]. Определение 4. Определим D как унарный оператор o, u o, u , удовлетворяющий следующему набору аксиом, включая (2): D o u, D u o , (4) Ima x ,Imb x F Im ; Ima x Imb x (5) D Ima x D Imb x Здесь мы предполагаем, что на F Im задано отношение порядка, но не конкретизируем его. Ima x F Im ;D D Ima x Ima x . (6) Определение 5. Используем классическое определение оператора Фурье-преобразования F, связывающего функцию Im(x), удовлетворяющую условиям Дирихле и абсолютно интегрируемую (x в данном контексте координата), с ее Фурье-образом F(): F Im x F Im x exp j 2 x dx , (7) где j – мнимая единица, – координата в Фурье-пространстве (частота). Операция Фурье-преобразования (ФП) реализуется в оптике положительной линзой. В задней фокальной плоскости линзы формируется Фурье-образ распределения амплитуд волнового поля в передней фокальной плоскости. Нетрудно видеть, что в силу хорошо известных свойств Фурье-преобразования оператор F удовлетворяет аксиомам (4) в форме: F x Const ; F Const x где (x)- -функция Дирака, определяемая следующим образом: при x 0 x 0 при x 0 , + x dx 1 - и аксиоме (5) в случае нормальных унимодальных функций (обозначим их a(x) и b(x)) a ( x ), b( x ) : U 0,1 ; 0,1 ; a x b x , Re F a x Re F b x , где а – -срез а. Если функции не унимодальные, то последнее условие имеет силу для глобальных максимумов автокорреляционных функций 0,1 ; Ima x Ima x Imb x Imb x , Re F Ima x Re F Imb x где символ обозначает операцию корреляции. В оптике -функция суть дифракционно-ограниченный точечный источник (пиксел). Требование инволютивности (6) удовлетворяется при использовании пары прямого и обратного ФП, отличающихся лишь знаком под экспонентой. При двукратном применении прямого ФП (7) имеет место инверсия координат F F Im x Im x , учет которой эквивалентен выполнению условия (6). Таким образом, в алгебре с Фурье-дуальными определяющими операциями в качестве минимального элемента о(x) выступает -функция, а максимального, Фурье-дуального минимальному, Const(x) = 1 . В качестве операции умножения примем обычное умножение. Операция умножения в оптике реализуется при освещении транспаранта волновым фронтом. Тогда операция абстрактного сложения, Фурье-дуальная умножению, определяется в соответствии с (2). Получаем формулировку известной теоремы Бореля о свертке –Фурье-образ свертки двух функций равен произведению их Фурье-образов, т.е. в качестве абстрактного сложения выступает свертка F Ima x Imb x F Ima x F Imb x , (8) F Ima x Imb x , где символ * обозначает операцию свертки двух функций S Ima x Imb x Im x Im x dx . a b В силу свойства инволютивности (6) свертка вычисляется методом двойного ФП, т.е. S Ima x ,Imb x F F Ima x F Imb x . (9) Здесь, как и в дальнейшем изложении, в целях упрощения выкладок мы пренебрегли инверсией координат, возникающей вследствие двукратного применения прямого ФП. Операция свертки (абстрактного сложения) в оптике реализуется методом Фурье-голографии (ФГ) [5]. Замечание 1. Заметим, что алгебра с Фурье-дуальными определяющими операциями есть алгебра нечетких множеств – даже в случае определения исходных элементов модели как четких множеств, уже однократное применение операции абстрактного сложения ведет к преобразованию четких множеств в нечеткие Ima ,Imb :U 0,1 ;S(Ima ,Imb ) :U 0,1 . Замечание 2. В алгебре Фурье-дуальных операторов операция сложения определена не поточечно, но учитывает внутреннюю коррелированность как фундаментальный атрибут информации, отличающий ее от -коррелированного шума. Замечание 3. Оператор Фурье-преобразования в общем случае представляет собой отображение в пространство комплексных функций. Отсюда c неизбежностью следует необходимость применения для реализации Фурье-дуальности (9) технологий, обеспечивающих регистрацию и восстановление комплексных функций. Для волн любой природы и частотного диапазона (оптических, радио, и.т.д.) единственной на сегодня технологией, удовлетворяющей этому требованию, является голография. Замечание 4. В силу ограниченности (пространственной или временной) как U, так и области определения Фурье-образа F(o(x))Supp= [-Max,Max], -функция в реальности имеет ненулевую ширину и описывается в Фурье-области функцией xmax 1 при x xmax , xmax u x 0 при x xmax , xmax x max F (u( x )) xmax u( x ) exp( j 2 x )dx 2 xmax Sinc(2 xmax ) xmax где [- xmax , xmax ] – область определения U, Sinc – обозначение Вудварда для функции вида Sin(x)/x. Аналогично, в силу ограниченности области определения Фурье-образа [-Max,Max], -функция на U также описывается функцией, определяемой аналогично. Если U=XY, т.е. плоскость, то для прямоугольной области определения xmax , ymax 2 xmax Sinc(2 x xmax )2 ymax Sinc(2 y ymax ) , а для области определения с осевой симметрией (т.е. круглой апертуры радиуса rmax) 2 r rmax max 2 J 1 2 rmax , 2 rmax где J1 – функция Бесселя первого рода первого порядка. Элементы модели Для любого элемента модели можно определить четыре связанных с ним элемента: дуальный, дополнительный, инверсный и противоположный. Определения дуального и дополнительного элементов очевидны. Инверсный элемент Imi для элемента Im относительно операции S определяется [6] из условия (10) S Im,Im i o Противоположный элемент Imo определяется условием Imo x Im x (11) где x, как и ранее, – обобщенная координата элемента Im на оси элементов модели. Пользуясь свойством симметрии ФП, получим F Im x F * Im x , где звездочка – символ комплексного сопряжения. Отсюда, используя определение вычитания как сложения с аддитивно противоположным элементом [6], получим: S Im x ,Imo x F F Im x F Imo x Im x Im x т.е. операция корреляции в алгебре Фурье-дуальных операций суть вычитание. Операция корреляции в оптике реализуется в той же схеме, что и операция свертки – схеме голографии Фурье. Свертка реализуется в – 1 порядке дифракции, корреляция – в +1 порядке дифракции. 3. РЕАЛИЗАЦИЯ НЕЧЕТКИХ ЛОГИК МЕТОДОМ ФУРЬЕ-ГОЛОГРАФИИ Определение 6 (по Л.Заде [7]). Лингвистической переменной (ЛП) называется набор Y, Tm(Y),U,G,M, где Y – название ЛП, Tm(Y) – терм-множество, U – универсальное множество, G – множество синтаксических правил, порождающее термы множества Tm(Y), M – множество семантических правил (семантическое правило каждому лингвистическому значению Y ставит в соответствие его смысл m(Y) , причем m(Y) обозначает нечеткое подмножество множества U). В рамках настоящей статьи ограничимся рассмотрением реализации семантических правил из M. Нетрудно видеть, что адекватная схеме ФГ алгебра F Im ,F ,, ,o,u суть алгебра нечеткозначной логики [4], множество элементов модели F Im Im Im :U 0,1 суть решетка нечетких множеств. Соответственно, метод логико-лингвистического моделирования (ЛЛМ) Л.Заде может быть реализован на этой алгебре методом Фурье-голографии при представлении смысла входных ЛП посредством нечетких чисел, что и было показано в [8]. Однако обратим внимание на то, что модель не запрещает представление смысла ЛП любым изображением Im и не накладывает на Im ограничений, обычно накладываемых на множества, представляющие смысл ЛП (нормальность, унимодальность и выпуклость). Таким образом, алгебра нечеткозначной логики F Im ,F ,, ,o,u реализуется и при обработке схемой ФГ изображений Im, не удовлетворяющих требованию унимодальности. Следовательно, возможна реализация идеи ЛЛМ и при обработке произвольных изображений, в том числе, аналогов паттернов внутренней репрезентации (ПВР). Тем самым, в рамках данной модели и ее голографической реализации возможна интеграция двух форм мышления – логической и образной. При этом эталонные ПВР задаются не формализовано, а посредством обучения системы – записи голограммы. Иными словами, речь идет уже об интеграции нечетких и нейронных систем. Однако, в рамках такого подхода возникает проблема, отсутствующая в классическом подходе Л.Заде [7] – интерпретация смысла, представленного унимодальным множеством очевидна, но для придания методу Заде биологической мотивированности мы отказались от требования унимодальности Im. Непосредственная же интерпретация смысла, представленного многомодальным множеством ведет к … шизофрении. Для наглядности изложения предложенного подхода к решению проблемы интерпретации рассмотрим его на примере реализации композиционного правила вывода «Обобщенный Modus Ponens», связывающего набор входных ЛП с одной выходной ЛП (заключением). Используем классический пример вывода «Если яблоко большое и красное, то оно хорошее». Нетрудно видеть, что проблема интерпретации разделяется на две: 1. Интерпретация смыслов входных ЛП, представленных в соответствии с требованием на биологическую мотивированность в виде изображений – аналогов ПВР, которые обозначим Imin ; 2. Интерпретация смысла логического заключения ImOut. Примем достаточно очевидное с практической точки зрения условие, что заключение, формируемое системой ImOut, должно удовлетворять требованиям к нечетким числам, в первую очередь – требованию унимодальности. В следующем разделе покажем, что это условие удовлетворяется выбором семантического оператора. Тогда остается первая проблема - проблема объединения двух моделей – описывающей реальную схему Фурье-голографии и предложенной Заде, т.е. оперирующей НЧ. Обратим внимание, что при реализации метода ЛЛМ Л.Заде алгеброй Фурье-дуальных операторов существует «внутренний» этап – вычисление Фурье-образов и их перемножение. Поэтому решение задачи интерпретации будем искать не в пространстве ПВР, а в Фурье-пространстве, а именно – приравняем действительные части Фурье-образов реально обрабатываемых системой ПВР Imin и абстрактных нечетких чисел, которые обозначим FN (от Fuzzy Numbers) (12) Re F Imin Re F FN . Выражение (12) связывает характеристики изображений, обрабатываемых схемой ФГ, с характеристиками нечетких чисет, используемых в абстрактном описании – увеличение моды НЧ сопровождается расширением его функции принадлежности [4], что в соответствии с (3.1) ведет к уменьшению разрешения изображения Imin – увеличению размеров его элементов. Таким образом, два подхода – абстрактноалгебраический, использующий представление смысла ЛП посредством НЧ и биологически мотивированный (нейросетевой) объединяются и согласовываются в Фурье-пространстве. 4. ЗАКЛЮЧЕНИЕ Таким образом, схема голографии Фурье строит алгебру нечетких множеств. Нечеткость в данном случае возникает не по прихоти автора модели, а как математическая формализация реального физического явления – дифракции. Соответственно, и физическая обусловленность порождаемой логики позволяет объединить в одном методе два понятия образа – биологически мотивированное как картины нейронной активности коры мозга (паттерна внутренней репрезентации) и формальное как вектора в абстрактном пространстве признаков и, тем самым, интегрировать две формы мышления – логическую и образную. Литература 1. Прибрам К. Нелокальность и локализация: голографическая гипотеза о функционировании мозга в процессе восприятия и памяти// Синергетика и психология. Вып. 1: Методологические вопросы: Пер. с англ. – М.: МГСУ "Союз", 1997. 2. 3. 4. 5. 6. 7. 8. 9. Кузнецов О.П. Неклассические парадигмы в искусственном интеллекте // Известия РАН: Теория и системы управления. –1995. – №5. – С.3-23. Новак В., Перфильева И., Мочкорж И., Математические принципы нечеткой логики: Пер. с англ. – М.: Физматлит, 2006. Аверкин А.Н., Батыршин И.З. и др. Нечеткие множества в моделях управления и искусственного интеллекта/ Под ред. Д.А. Поспелова. – М.: Физматлит, 1986. Dubois D., Prade H. Fuzzy Numbers: An Overview// Analysis of Fuzzy Information/ Ed. by J.C.Bezdek. – Boca Raton FL: CRC Press, 1987. – Vol.1.- P.3-39. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений: Пер. с англ. – М.: Мир, 1976. Павлов А.В. Реализация логико-лингвистических моделей методом Фурье-голографии// Известия РАН: Теория и системы управления. – 2003. – №2. – C.118-125. . Павлов А.В. Математические модели оптических методов обработки информации // Известия РАН: Теория и системы управления. – 2000. – №3. – C.111-118. Павлов А.В. Об алгебраических основаниях Фурье-голографии// Оптика и спектроскопия. – 2001. – Т.90. – Вып.3. – С.515-520.