Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Рекомендованная ссылка Терехин А.Т., Будилова Е.В., Качалова Л.М., Чмыхова Е.В. Локальность, интегральность и варифокальность мышления *Электронный ресурс+ // Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru (дата обращения: чч.мм.гггг). [Описание соответствует ГОСТ Р 7.0.5-2008. Дата обращения в формате число-месяц-год (чч.мм.гггг.) – дата, когда вы обращались к странице сайта и она была доступна+ Локальность, интегральность и варифокальность мышления Терехин А.Т.1, Будилова Е.В.2, Качалова Л.М.3, Чмыхова Е.В.4 Московский государственный университет им. М.В.Ломоносова, Москва, Россия Современная гуманитарная академия, Москва, Россия Описывается модель, объясняющая процесс мышления как движение по когнитивному ландшафту в направлении его понижения. Рассматриваются когнитивные ландшафты, соответствующие локальному и интегральному типам мышления. Вводится понятие варифокальности мышления, то есть способности произвольного изменения гладкости когнитивного ландшафта. Математически обосновываются способы преодоления локальности мышления. Ключевые слова: нейронные сети, когнитивный ландшафт, функция Ляпунова, локальное мышление, интегральное мышление, варифокальность мышления Locality, integrality and varifocal thinking Terekhin A.T., Budilova E.V., Kachalova L.M., Chmykhova E.V. Lomonosov Moscow State University, Moscow, Russia Modern University for the Humanities. Moscow, Russia A model that explains the process of thinking as a movement on the cognitive landscape in the direction of his slides. Considered cognitive landscapes, appropriate local and integral types of thinking. Introduce the concept of the varifocal thinking, that is, the ability of any change in the smoothness of the cognitive landscape. Mathematically justified ways to overcome the locality of thinking. Keywords: neural networks, cognitive landscape, Lyapunov function, local thinking, integral thinking, varifocal thinking СВЕДЕНИЯ ОБ АВТОРАХ 1 Терехин Анатолий Тимофеевич (1942–2010). Доктор биологических наук, профессор, биологический факультет, Московский государственный университет им. М.В.Ломоносова; Институт когнитивной нейрологии, Современная гуманитарная академия, Москва, Россия. Персональная web-страница: http://ecology.genebee.msu.su/3_SOTR/CV_Terekhin.htm 2 Будилова Елена Вениаминовна. Кандидат технических наук, старший научный сотрудник кафедры общей экологии, биологический факультет, Московский государственный университет им. М.В.Ломоносова, Ленинские горы, 1, стр. 12, 119991 Москва, Россия. E-mail: evbudilova@mail.ru 3 Качалова Лариса Андреевна. Кандидат биологических наук, директор, Институт когнитивной нейрологии, Современная гуманитарная академия, ул. Нижегородская, 32, 109029 Москва, Россия. Е-mail: lefi@muh.ru 4 Чмыхова Екатерина Витальевна. Кандидат социологических наук, заместитель проректора, директор Департамента науки и инноваций, зав. кафедрой практической и экспериментальной психологии, Современная гуманитарная академия, ул. Нижегородская 32, 109029 Москва, Россия. E-mail: niipo@muh.ru Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Современная информационная среда, характеризующаяся, с одной стороны, огромным объемом доступной информации, а с другой – наличием мощных средств ее поиска, позволяющих легко найти необходимые детали интересующего предмета, предъявляет новые интеллектуальные требования к работающим в этой среде специалистам – на первый план выходит умение находить общую стратегию решения поставленной задачи. Когнитивные способности, позволяющие это сделать, можно назвать интегральным мышлением. Здесь мы исследуем базовые информационные механизмы интегрального мышления и рассматриваем различные подходы к его формированию. Математическая модель Базовые аспекты когнитивной деятельности мозга вполне адекватно описываются моделью нейронной сети Хопфилда с сигмоидной функцией активации, содержащей параметр крутизны *Hopfield, 1984]. Cеть Хопфилда характеризуется тем, что все ее элементы (нейроны) связаны со всеми остальными и есть только два ограничения на веса синаптических связей: веса прямых и обратных связей равны между собой, а вес связи нейрона с самим собой равен нулю (условие симметричности связей не является биологически мотивированным, а принимается как упрощающее допущение). Состояние каждого нейрона i , i 1, 2, ..., n в момент времени t задается переменной состояния xi (t ) , принимающей значения между –1 и 1. Динамика сети определяется правилами изменения состояний ее нейронов и весов wij (t ) синаптических связей, соединяющих нейроны i и j . Если веса wij (t ) и состояния xi (t ) сети в момент времени t заданы, то в следующий момент t 1 состояние нейрона i изменится в соответствии с сигмоидной функцией активации нейрона: xi ( t 1) 1 e 2 1. G w x (t ) ij j Параметр G можно назвать параметром крутизны этой функции, поскольку при G она превращается в пороговую, а при G 0 приближается к горизонтальной прямой, совпадающей с осью абсцисс (рис. 1). Чтобы значения параметра G для разных наборов синаптических весов wij (t ) были соизмеримы, мы будем предполагать, что сумма квадратов весов равна их числу n(n 1) , то есть среднее значение квадрата синаптического веса равно 1. Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Рис. 1. Зависимость гладкости сигмоидной кривой от параметра S . Значения синаптических весов формируются в процессе обучения сети в соответствии с правилом Хебба *Hebb, 1949]: wij (t 1) wij (t ) xi (t ) x j (t ), i j, то есть вес увеличивается на единицу, если нейроны i и j находятся в одинаковых состояниях, и уменьшается на единицу, если в разных. Когнитивный ландшафт Поведение сети Хопфилда очень удобно интерпретировать в терминах функции Ляпунова (функции энергии, потенциальной функции), вид которой для данной сети определяется весами ее синаптических связей, а значение для каждой совокупности состояний нейронов x1 (t ),..., xn (t ) в момент t определяется формулой E ( x1 ,..., x n , t ) 1 n n x (t ) w (t ) x (t ) ij j 2 i 1 j 1 i 1 n ln[(1x G i i 1 ( t )) 1 xi ( t ) (1 xi ( t )) 1 xi ( t ) ]. Совокупность состояний нейронов, то есть состояние сети, можно интуитивно представить в виде точки в n -мерном когнитивном пространстве, а функцию Ляпунова – можно назвать ее когнитивным ландшафтом – в виде многомерной поверхности над этим пространством. Можно показать, что изменение состояния сети может происходить только в направлении понижения уровня когнитивного ландшафта. Этот факт позволяет наглядно представить изменение состояния сети как движение по поверхности когнитивного ландшафта подобно тому, как это происходит, например, с помещенным на неровную поверхность шариком, который всегда движется в направлении уменьшения Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 своей потенциальной энергии к ближайшему локальному минимуму – аттрактору. Все когнитивное пространство распадается на области, образующие так называемые бассейны притяжения аттракторов, и динамика сети, установленной в некоторое начальное состояние, полностью зависит от того, в бассейн притяжения какого из аттракторов она попала (рис. 2). Рис. 2. Когнитивный ландшафт. Сеть Хопфилда обладает рядом интересных свойств с точки зрения ее использования в качестве модели когнитивных процессов *Hopfield, 1982; Веденов, 1988; Amit, 1989; Терехин, Будилова, 1995+. Рассмотрим эти свойства, интерпретируя их в терминах когнитивного ландшафта нейронной сети. Пусть сначала все синаптические веса сети равны нулю, то есть ее когнитивный ландшафт представляет собой абсолютно ровную поверхность E ( x1 ,..., xn , t ) 0 , и на входы нейронов поступает некоторая конфигурация сигналов – образ. В результате нейроны установятся в состояния, соответствующие этому образу и, в соответствии с правилом Хебба, сформируются новые веса сети. Следствием этого будет то, что на исходно ровном когнитивном ландшафте появится углубление – локальный минимум, аттрактор (рис. 3а). Если после этого предъявить сети любое другое сочетание сигналов, но уже не в режиме обучения, а в режиме свободного эволюционирования во времени (режиме вспоминания), то через небольшое число шагов состояние сети достигнет сформировавшегося локального минимума и останется в нем. Можно сказать, что сеть «запомнила» предъявленный ей образ. При предъявлении какого-либо другого образа на поверхности когнитивного ландшафта образуется второй локальный минимум (рис. 3b). Если после этого сети предъявить в режиме вспоминания еще какой-нибудь образ (ассоциацию), то сеть будет Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 эволюционировать в направлении того аттрактора, в бассейне притяжения которого она оказалась (рис. 3c), то есть можно сказать, что нейронная сеть обладает способностью ассоциативного вспоминания. Рис. 3. Изменение когнитивного ландшафта при Хеббовском обучении: (a) – запоминание первого образа; (b) – запоминание второго образа; (c) – ассоциативное вспоминание. В процессе Хеббовского обучения локальные минимумы могут образовываться не только в точках когнитивного пространства, соответствующих реально предъявленным образам, но и в точках, соответствующих комбинациям этих образов – химерам. Это свойство нейронных сетей можно рассматривать как их способность к творческой фантазии. В частности, при предъявлении нескольких близких образов, каждый из которых создает неглубокий локальный минимум, образуется значительно более глубокий минимум, соответствующий усредненному образу, то есть нейронная сеть обладает также способностью создания обобщенных образов. Локальное и интегральное мышление Из сформулированного выше представления о процессе мышления как движении по когнитивному ландшафту в направлении его понижения следует, что, начав движение из некоторого ментального состояния, например, вызванного предъявлением внешнего стимула, сеть приходит в стационарное состояние, соответствующее ближайшему локальному минимуму, что можно интерпретировать как завершение решения некоторой умственной задачи – вспоминания образа, выбора варианта реакции на полученную информацию. Однако, как мы видим из рис. 4, в зависимости от степени неровности когнитивного ландшафта найденное решение может быть разным. В случае его сильной неровности ближайший локальный минимум обычно находится совсем рядом от начального состояния, и, как правило, он не очень глубок. Наоборот, при гладком когнитивном ландшафте могут быть достигнуты довольно удаленные глубокие минимумы. Первая ситуация соответствует локальному мышлению, вторая – интегральному. Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Рис. 4. Когнитивные ландшафты, соответствующие локальному и интегральному типам мышления. Поскольку глубокие аттракторы образуются в результате обобщения информации о множестве мелких, то следует ожидать, что соответствующие им решения будут стратегически более правильными, и именно интегральное мышление позволяет находить такие решения. Наоборот, в рамках локального мышления стратегически правильное решение найти практически невозможно. На повседневном уровне локальное мышление проявляется как зацикленность на частностях, зашоренность, неумение «видеть за деревьями лес». Одним из крайних проявлений локального мышления является синдром «ученого-идиота» – сочетание феноменальных вычислительных и мнемонических способностей с ограниченными возможностями адекватного восприятия окружающей действительности. Яркий образ такого ученого-идиота создан Дастином Хофманом в фильме Барри Левинсона «Человек дождя» (рис. 5). Реальный прототип Человека дождя – Ким Пек из американского городка Солт-Лейк-Сити – прочитал и может воспроизвести наизусть более 7500 книг, распознать большинство музыкальных композиций, назвать дату создания композиции и дату и место рождения и смерти композитора, мгновенно назвать день недели для любой календарной даты и т.д. Но при всем этом он способен работать только в специальной мастерской для взрослых с ограниченным развитием. Рис. 5. «Человек дождя». Источник: http://ru.wikipedia.org/wiki/Rain_man.jpg. Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Варифокальность мышления Хотя, несомненно, интегральность мышления является ценной когнитивной способностью, обеспечивая нахождение стратегически правильных решений, она обеспечивается за счет отвлечения от деталей рассматриваемой проблемной ситуации (рис. 4). Однако для полного решения проблемы эти детали могут оказаться необходимыми. Идеальным выходом из ситуации было бы обеспечение способности произвольного изменения гладкости когнитивного ландшафта. Можно назвать такую способность варифокальностью – по аналогии с возможностью произвольного изменения фокусного расстояния объектива фотоаппарата (функция «зум»), обеспечивающей получение снимков разной степени детальности. Реально диапазон изменения неровности, изрезанности когнитивного ландшафта (диапазон варифокальности) ограничен, поскольку такое изменение требует затрат ресурсов организма, которые естественным образом лимитированы. Например, если верхняя граница диапазона неровности находится на очень высоком уровне, то есть ландшафт сильно изрезан, то нижняя граница не может находиться на достаточно низком уровне. Так, даже на низшем уровне изрезанности когнитивного ландшафта «человека дождя» ему не удается делать обобщения, необходимые для обычной жизни, поэтому он должен содержаться в специальной клинике. Таким образом, возникает проблема определения оптимального соотношения между уровнями локальности и интегральности мышления. Сглаживание когнитивного ландшафта путем ослабления межнейронных связей Поскольку сглаживание когнитивного ландшафта имеет важное значение с точки зрения повышения интегральности, стратегичности мышления, то интересно понять, хотя бы на уровне математического моделирования, какими способами можно его осуществить. Расчеты, в частности, показывают, что уменьшение параметра крутизны G функции активации нейрона (что эквивалентно пропорциональному ослаблению всех межнейронных связей) приводит к сглаживанию когнитивного ландшафта. Проиллюстрируем это на модельной сети Хопфилда из 200 нейронов. Для наглядности расположим нейроны в порядке возрастания их номеров. Кроме того, при обучении будем предъявлять для обучения сети образы специального вида, в которых некоторое число начальных нейронов 1, 2, …, k находятся в состоянии +1, а последующие k + 1, k + 2, …, n – в состоянии –1 (подобно столбику ртути в градуснике, проградуированном от 1 до 200). Предъявленные образы определенным способом структурированы: образы, соответствующие некоторым значениям, встречаются чаще, а промежуточные – реже. В частности, в одном из вариантов расчетов было предъявлено 200 обучающих образов со значениями k , сконцентрированными вокруг чисел 20, 60, 100, 140 и 180 со Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 среднеквадратичным отклонением 5 . При этом значения, концентрирующиеся вокруг k = 60, встречаются в полтора раза чаще других. После обучения были вычислены значения функции Ляпунова для нескольких значений параметра крутизны функции активации: G = 6, 7, 8, 10. На рис. 6. распределение числа обучающих образов с разными k показано серой линией, а когнитивные ландшафты, соответствующие разным G , – темными линиями. Мы видим, что при уменьшении параметра крутизны G минимумы когнитивного ландшафта становятся все более и более мелкими, а затем и совсем выглаживаются: сначала самые мелкие, а затем все более и более глубокие. Таким образом, ослабление межнейронных связей позволяет подойти к наиболее глубоким минимумам. Рис. 6. Зависимость вида когнитивного ландшафта (темные кривые) от значения параметра гладкости G для сети из 200 нейронов (серая кривая – число образов, предъявленных при обучении). Ослабление межнейронных связей происходит естественным образом при старении мозга в силу уменьшения плотности постсинаптических рецепторов и других возрастных физиологических изменений в мозге. В *Карпенко и др., 2009+ на этом основании делается вывод о том, что с возрастом мышление человека становится более интегральным. Преодоление локальности мышления с помощью случайного шума Другой способ не застревать в мелких локальных минимумах когнитивного ландшафта – это добавление в нейронную сеть случайного шума. Имеется чисто стохастический вариант сети Хопфилда, называемый машиной Больцмана *Hinton, Sejnowski, 1986+. Нейрон в машине Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Больцмана может находиться только в крайних состояниях (–1 или 1) и вероятности оказаться в этих состояниях на каждом шаге времени задаются формулами 1 P[ xi ( t 1) 1] 1 e 1 T wij x j ( t ) и 1 P[ xi ( t 1) 1] 1 e 1 T wij x j ( t ) , где параметр T называется температурой сети. При T 0 машина Больцмана ведет себя как обычная детерминированная сеть Хопфилда с двумя возможными состояниями нейронов, то есть нейрон принимает с вероятностью единица состояние 1, если взвешенная сумма его входов больше нуля, и состояние –1, если она меньше нуля. При повышении температуры нейрон переходит в состояние, предписываемое поступающими на его вход сигналами, лишь с некоторой вероятностью, а при T эта вероятность становится равной 1/2, так что динамика сети становится полностью случайной. Образно эффект температуры можно представить как вибрирование поверхности когнитивного ландшафта – чем выше температура, тем сильнее вибрация. Интуитивно ясно, что шарик, помещенный на вибрирующую поверхность, не будет задерживаться в мелких локальных минимумах и с большей вероятностью будет оказываться в более глубоких. Имеется даже метод поиска глобального минимума функции, основанный на этом принципе и называемый моделированным отжигом (simulated annealing) *Kirkpatrick, Gelatt, Vecchi, 1983]. В нашем случае нейрон может принимать не только крайние значения –1 и 1, но и любые промежуточные, поэтому вводить случайность в сеть придется несколько иначе – мы просто прибавим стандартный гауссовский случайный шум к аргументу функции активации: xi ( t 1) 1 e 2 1, G w x ( t ) T ij j где – случайная величина, имеющая нормальное распределение с нулевым математическим ожиданием и единичной дисперсией, а T – масштабирующий множитель, аналогичный температуре в машине Больцмана. При T 0 мы получаем обычную детерминированную сеть Хопфилда, а при T поведение сети становится все более и более хаотичным. На нейробиологическом уровне наличие в нейронной сети случайного шума означает, что информационные сигналы, поступающие к нейрону, могут подвергаться случайным искажениям на их пути от других нейронов, а также в синапсах и самом принимающем нейроне. Полезность наличия случайного шума в нейронной сети состоит в том, что он позволяет сети выскакивать из мелких локальных минимумов и достигать более глубоких. В частности, в ситуации, представленной на рис. 6, сеть смогла бы преодолевать локальные минимумы k = 140 и k = 180 уже при снижении параметра крутизны до G 7 , тогда как при отсутствии шума его необходимо снизить до G 6 , когда эти локальные минимумы выглаживаются полностью. Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Таким образом, ослабление межнейронных связей и внесение шума могут дополнять друг друга. Формирование сглаженного когнитивного ландшафта при обучении Выше мы рассмотрели два способа уменьшения локальности мышления – ослабление межнейронных связей и добавление случайного шума, позволяющие выделять важную информацию на фоне менее важной. Однако можно попытаться так организовать обучение сети, чтобы второстепенная информация отсеивалась уже на этом этапе. Для выяснения этого вопроса был проведен следующий модельный эксперимент. Два экземпляра описанной выше сети из 200 нейронов были обучены на двух разных наборах обучающих образов. В одном случае был использован такой же набор, как и в эксперименте, представленном на рис. 5, то есть значения k были сконцентрированы вокруг чисел 20, 60, 100, 140 и 180 со среднеквадратичным отклонением 5 . Обучающий набор для второй сети отличался тем, что среднеквадратичное отклонение от центров концентрации было увеличено до 10,5 . После обучения для обеих сетей были найдены функции Ляпунова. Результаты представлены на рис. 7, где для обеих сетей показано как распределение числа образов для разных k , так и соответствующие каждой из них функции Ляпунова. 500 1 2 0 2 -500 1 -1000 -1500 0 20 40 60 80 100 120 140 160 180 200 Рис. 7. Зависимость вида когнитивного ландшафта (нижние кривые) для разных наборов образов, предъявленных при обучении (верхние кривые); линии (1) – четко разделенные образы; линии (2) – нечетко разделенные образы. Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Мы видим, что функция Ляпунова для сети, обученной по набору нечетко разделенных образов ( 10,5 ), более сглажена по сравнению с функцией Ляпунова для сети, обученной по набору четко разделенных образов ( 5 ). Таким образом, если при обучении даются не просто сведения об отдельных изолированных явлениях, а указываются взаимосвязи между ними, описываются промежуточные варианты, то в результате в памяти сохраняется информация только о наиболее общих связях и закономерностях, что формирует у обучаемого интегральное мышление, особенно ценное в современную информационную эпоху. Измерение уровня локальности мышления Мы определили понятия локальности мышления на базовом информационном уровне как степень неровности, изрезанности функции Ляпунова нейронной сети. Также, на качественном уровне, понятно, какими должны быть феноменологические проявления локальности – это зацикленность на деталях, зашоренность, неспособность к широким обобщениям, трудности в нахождении стратегически правильных решений, сочетающиеся с легкостью запоминания огромного количества изолированных фактов. Но, конечно, хотелось бы уметь оценивать уровень локальности мышления количественно. Для этого необходимо разработать соответствующие методики психологического тестирования. Поскольку понятие локальности мышления, по-видимому, близко к такому известному в психологии свойству мышления, как его жесткость (ригидность) *Залевский, 1993+, то можно в качестве отправной точки для оценки локальности проанализировать методики оценки ригидности. Важно при этом определять для каждого испытуемого как нижнюю, так и верхнюю границы его локальности мышления (диапазон варифокальности), – первая определяет уровень способности к обобщениям, вторая – к запоминанию конкретной информации. Заключение Выше мы ввели понятие когнитивного ландшафта – поверхности, рельеф которой определяет динамику изменения ментального состояния. Мелкие впадины на этой поверхности, локальные минимумы, соответствуют ментальным образам, понятиям, связанным с конкретными явлениями и объектами, более широкие и глубокие – обобщенным образам и понятиям. Локальное мышление характеризуется отслеживанием деталей рельефа когнитивного ландшафта и имеет тенденцию к зацикливанию на частностях. Для преодоления этого недостатка и перехода к более интегральному, стратегическому мышлению мозг должен обладать способностью сглаживания когнитивного ландшафта. Были рассмотрены три потенциально возможных пути повышения интегральности мышления – ослабление межнейронных связей, внесение шума в систему, интегрально ориентированное обучение. Необходимы дополнительные исследования для создания практически работающих методик стимулирования интегрального мышления. Кроме того, необходимо разработать тесты для его количественной оценки. Психологические исследования: электрон. науч. журн. 2011. N 4(18). URL: http://psystudy.ru ISSN 2075-7999 Литература Веденов А.А. Моделирование элементов мышления. М.: Наука, 1988. Залевский Г.В. Психическая ригидность в норме и патологии. Томск: Изд-во Том. гос. ун-та, 1993. Карпенко М.П., Качалова Л.М., Будилова Е.В., Терехин А.Т. Когнитивные преимущества третьего возраста: нейросетевая модель старения мозга // Журнал высшей нервной деятельности. 2009. Т. 59, N 2. С. 252–256. Терехин А.Т., Будилова Е.В. Сетевые механизмы биологической регуляции // Успехи физиологических наук. 1995. Т. 26, N 4. С. 75–97. Amit D.J. Modeling brain function. The world of attractor neural networks. New York: Cambridge University Press, 1989. Hebb D.O. The organization of behavior. New York: Wiley, 1949. Hinton G.E., Sejnowski T.J. Learning and relearning in Boltzman machines // Parallel Distributed Processing. Explorations in the Microstructure of Cognition. Cambridge, MA: MIT Press. 1986. Vol. 1. P. 282–317. Hopfield J.J. Neurons networks and physical systems with emergent collective computational abilities // Proc. Natl. Acad. Sci. USA. 1982. Vol. 79. P. 2554–2558. Hopfield J.J. Neurons with graded response have collective computational properties like those of two-state neuron // Proc. Natl. Acad. Sci. USA. 1984. Vol. 81. P. 3088–3092. Kirkpatrick S., Gelatt C.D., Vecchi M.P. Optimization by simulated annealing // Science. 1983. Vol. 220. P. 671–680. Поступила в редакцию 25 января 2011 г. Дата публикации: 26 августа 2011 г. Опубликовано в журнале “Психологические исследования”, 2011, номер 4(18).