принципы социального научения[1]

реклама
Бандура А., Уолтерс Р. Принципы социального научения // Современная зарубежная
социальная психология. М.: Издательство Московского университета, 1984. С. 55-60.
Бандура (Bandura) Альберт (род. в 1925 г.) — американский социальный психолог, с 1953 г. —
профессор психологии Стэнфордского университета. Основная проблематика: теория
социального научения и развития личности.
Соч.: (соавт.) Adolescent Agression. N.Y., 1959, (соав.) Social learning and personality
development. N.Y., 1963; Agression: social learning analysis. N. Y., 1973.
Уолтерс (Walters) Ричард (1913— 1968) американский социальный психолог, работал в
различных американских университетах, активно сотрудничал с А. Бандурой.
Соч.: (соавт.) Adolescent agression. N. Y., 1959; Social learning and personality development. N. Y.,
1963.
А. Вандуpa, P. Уолтерc
ПРИНЦИПЫ СОЦИАЛЬНОГО НАУЧЕНИЯ1
ВОЗНИКНОВЕНИЕ НОВЫХ ОТВЕТОВ ПРИ ОБУЧЕНИИ ПОСРЕДСТВОМ
НАБЛЮДЕНИЯ
Слабость подходов к научению, которые пренебрегают значением социальных
переменных, нигде не раскрывается так ясно, как в вопросе возникновения новых
ответов, центральной проблемы любой адекватной теории научения. Следуя, например,
теории социального научения Роттера, вероятность возникновения данного поведения в
конкретной ситуации определяется двумя переменными — субъективной вероятностью
(ожиданием) того, что поведение в принципе будет подкреплено, и ценностью
подкрепляющего стимула для субъекта: Мнение Роттера о процессе научения
предполагает существование иерархии ответов, которые имеют тенденцию возникать в
различных ситуациях с различной степенью вероятности; поэтому практически
невозможно объяснить возникновение ответа, который еще не был выучен и,
следовательно, имеет нулевую ценностную вероятность. Ребенок, не знающий
польского языка, никогда не произнесет на польском языке фразу, даже если
вероятность подкрепления будет 100% и подкрепляющий стимул будет необыкновенно
привлекательным. Очевидно, что в этом частном примере введение важной социальной
переменной — вербальной модели — является неоценимым аспектом процесса
научения.
1
Bandura A., Walters R. Social learning and personality development. N. Y., 1965.
1
Хотя роттеровская теория социального научения, возможно, адекватна для
предсказания возникновения и модификации ранее выученных образцов ответов, она
оказала довольно незначительное влияние на теории социального поведения, так как
зависимые переменные в экспериментах, вызванных этим подходом в целом не
затрагивали социальных ответов. По большей части экспериментирование было
ограничено границами ожидания и условий, которые приводят к их модификации,
обобщению, исчезновению, но почти ничего не было сделано для того, чтобы связать
переменную ожидания с типами социального поведения, что должна была бы сделать
теория социального поведения.
Другие
представления
о
путях
возникновения
новых
ответов
часто
ограничивались описанием тех изменений поведения, которые были основаны на
принципах оперантного и инструментального условных рефлексов (Бье и Бэр, 1961;
Лундин, 1961, Скиннер, 1953). Скиннер (1953) создал подробное описание процедур
оперантного условного рефлекса путем последовательного приближения; таким
образом, могут возникать новые образцы поведения. Эта процедура включает
позитивное подкрепление элементов ответов, отражающих окончательную форму того
поведения, которое желательно воспроизвести, в то время как компоненты ответов,
имеющие лишь очень маленькое или вообще никакого сходства с этим поведением,
остаются неподкрепленными. Постепенным повышением требований к подкреплению
в направлении той завершенности формы поведения, которую оно должно принять, из
имеющихся ответов могут быть сформированы . образцы, не существовавшие до этого
в репертуаре организма. С этой точки зрения новые ответы никогда не возникают
вдруг, но всегда являются следствием довольно длительного процесса.
Оперантное подкрепление формирует поведение как скульптор оформляет глыбу
мрамора. Хотя с определенной точки зрения скульптор создал совершенно новый
объект, мы всегда можем проследить этот процесс в обратном порядке до естественной
недифференцированной глыбы, и можем выделить последовательные стадии, с
помощью которых можно вернуться к первоначальным условиям так близко, как
захотим. Без всякого сомнения все то, что возникает, в значительной степени отлично
от того, что предшествовало ему. Конечный продукт кажется обладающим особым
единством или интегрированностью замысла, но мы не сможем найти тот момент,
когда это внезапно возникло. В этом смысле, оперант не является чем-то, что
полностью выросло из поведения организма. Это результат длительного процесса
формирования (Скиннер, 1953). Оперантная условно-рефлекторная процедура может
2
быть очень эффективной, особенно если стимул, который вызывает ответы, в
некоторых отношениях отражает желаемое поведение, уже содержащееся в репертуаре
обучающегося. Сомнительно тем не менее, что многие реакции, которые проявляются
практически всеми членами нашего общества, были бы получены, если бы социальный
тренинг совершался бы исключительно путем последовательного приближения. Это, в
частности, правильно по отношению к поведению, для которого не существует
валидных
побуждающих
стимулов,
за
исключением
тех
образцов,
которые
обеспечиваются другими, когда они демонстрируют поведение. Если у ребенка не было
возможности слышать речь, например, или, в случае слепо-глухого человека (Келлер,
1927), не было возможности соотнести рот и сокращение лоринговых мускулов
вербализующей модели, практически невозможно было бы обучить его тем типам
вербальных ответов, которые составляют язык.
В таких случаях имитация является неоценимым аспектом обучения. Даже в
случаях, где известны некоторые другие стимулы, способные вызвать приближение к
желаемому поведению, процесс возникновения может быть значительно сокращен
предъявлением социальных моделей (Бандура и Макдональд, 1963).
В «Социальном научении и имитации» (1941) Миллер и Доллард подчеркивали
роль имитации в случае феномена социального научения; тем не менее в их
дальнейших публикациях «Личность и психотерапия» (1950) имитация удостаивается
лишь замечаний мимоходом. Этот парадокс может быть объяснен тем фактом, что
авторы представляли имитацию как особый случай инструментального условного
рефлекса, в котором социальные знаки служат в качестве дискриминирующих
стимулов и ответы обучающегося по-разному подкрепляются или не подкрепляются в
зависимости от того, подходят они или не подходят к тем, которые соответствуют
модели. Так как эксперименты, на которых была основана их теория, не охватывали
случаев возникновения новых ответов в отсутствии подкрепления наблюдателю за
имитационное поведение, не удивительно, что Миллер и Доллард в конце концов
опустили обучение при наблюдении как особый случай инструментального условного
рефлекса.
Процесс имитации сейчас пользуется особым вниманием со стороны тех, кто
занимается теорией научения, но до сих пор с ним обычно обходятся как с особой
формой инструментального рефлекса, как было предположено Миллером и Доллардом.
Тем не менее существует решительное подтверждение тому факту, что научение может
возникать через наблюдение за поведением других, даже когда наблюдающий не
3
повторяет модельные ответы при их предъявлении и поэтому не получает
подкрепления (Бандура, 1962). Таким образом, очевидно, что принципы научения,
выдвинутые Халлом (1943) и Скиннером (1938, 1953), должны быть переосмыслены и
расширены для того, чтобы адекватно соотноситься с обучением при наблюдении.
Более того, эти принципы имеют дело только с прямым подкреплением. Так как
возникновение и создание имитирующего поведения в значительной мере зависит от
последовательности ответов модели, адекватная теория социального научения должна
также брать в расчет роль замещающего подкрепления, через которое поведение
наблюдателя модифицируется в расчете на подкрепление, предъявляемое моделью.
ОБРАЗЦЫ ПОДКРЕПЛЕНИЯ
Имитирующее поведение часто вознаграждается моделью и, дополнительно,
приносит вознаграждающие последствия, обеспечивающие модели демонстрацию
социально эффективного поведения; следовательно, у большинства детей развивается
генерализованная привычка выбирать ответы успешной модели. Действительно,
образцы социального поведения наиболее быстро возникают благодаря совместному
влиянию моделей и дифференцирующего подкрепления. В то время как принцип
последовательного
приближения
имитации
наиболее
важен
для
понимания
возникновения образцов социального поведения, создание этих образцов в течение
длительного времени лучше всего может быть объяснено в терминах принципов,
взятых из исследований эффектов подкрепления по схеме. В лабораторных условиях
Можно разграничить подкрепляющие агенты для каждого желаемого ответа и привести
их постепенно в соответствие с некоторой схемой или планом. Говоря в общем,
длительное подкрепление приводит к более быстрому возникновению ответов, но
однажды выученное поведение более стабильно и более устойчиво к расчленению, чем
если бы оно возникло по промежуточной схеме.
Постепенное подкрепление может предъявляться по различным схемам.
Экспериментатор может подкреплять ответы в соответствии с рациональнофиксированной схемой — он может подкреплять только каждый второй, каждый
третий или каждый пятый ответ. Или он может подкреплять ответы по интервальнофиксированной схеме; в этом случае избранный интервал времени разделяет
предъявление каждой последовательной пары подкрепляющих I аспектов. При
рационально-фиксированной схеме устанавливаются очень стабильные величины
ответов, где скорость ответов позитивно изменяется с частотой подкрепления. При
4
интервально-фиксированной схеме величина ответов снижается сразу же после
подкрепления, но значительно возрастает, когда приходит время следующего
подкрепления. Примеры рационально-фиксированных схем подкрепления трудно
найти в каждодневной жизни, особенно среди процедур, использующихся для
воспитания детей. С другой стороны, в большинстве современных социальных систем,
социализирующие
агенты,
которые
распределяют
подкрепление,
должны
организовывать свои жизни на основе временных схем других. Следовательно, в
большинстве своем некоторые ответы детей подкрепляются по относительно
неизменной интервально-фиксированной схеме: кормление, доступность отца, сестры
или брата школьного возраста для социального взаимодействия, и, в общем, события,
связанные с домашними и семейными заботами, могут служить в качестве
подкрепляющих
стимулов,
положительных
или
отрицательных,
которые
распределяются по относительно фиксированным интервалам.
Исследование
Маркуса
(1941)
демонстрирует
влияние
интер-вально-
фиксированных схем кормления на поведение младенцев. Маркус сравнил активность
младенцев, которых кормили через три часа, через четыре часа и тогда, когда они
требовали.
Младенцы
с
интервально-фиксированными
схемами
кормления
демонстрировали возрастание активности, когда приближалось время кормления; более
того младенцы, которые были переведены с трехчасового на четырехчасовое
расписание (схему), демонстрировали быстрое возрастание количества активности к
четвертому часу. Влияние интервально-фиксированного расписания (схемы) на
поведение старших детей
в семейных ситуациях
не стало пока объектом
систематического изучения. Неформальное наблюдение тем не менее дает возможность
предположить, что оно контролирует поведение во многом так же, как в лабораторных,
исследованиях на животных. Например, в семьях, в которых отец является
положительным подкреплением, можно наблюдать, как дети (и мать) дают
«предвосхищающие ответы», когда приближается время возвращения отца домой с
работы.
В повседневной жизни большинство подкрепляющих стимулов, отдельно от тех,
которые ассоциируются с повседневными заботами, распределены по различным
схемам. В лабораторных исследованиях изучалось влияние обеих — и рациональнопеременной
и
интер-вально-переменной
схем.
В
последнем
случае
вместо
подкрепления каждого n-ного ответа экспериментатор изменяет соотношение вокруг
некоторого
среднего
значения
таким
образом,
что
изменяется
количество
5
неподкрепленных ответов, расположенных между предъявлениями последовательных
подкреплений. В случае переменно-интервальных схем экспериментатор варьирует
интервал
между предъявлением
последовательных
подкреплений.
Результатом
переменных схем являются очень стабильные величины ответов и, говоря в общем,
увеличение сопротивления к исключению части. Характерологически социальные
подкрепления распределены по комбинированным схемам, в которых можно
варьировать и количество неподкрепленных ответов, и временные интервалы между
предъявлением подкрепляющего агента. Исследования животных свидетельствуют о
том, что ответы, которые подкрепляются по переменному интервалу, но только тогда,
когда субъект отвечает на высоком уровне, приводят к стабильно высокому уровню
ответов; те же, кого подкрепляют по переменным интервалам, но только тогда, когда
испытуемый отвечает на низком уровне, в результате демонстрируют стабильно низкий
уровень ответов. Использование комбинированных расписаний (схем), таким образом,
позволяет экспериментатору поддерживать поведение на любом желаемом уровне.
При воспитании детей использование комбинированных схем естественно
преобладает. Возьмем для примера поведение, направленное на привлечение внимания
к себе. Большинство маленьких детей пытаются много раз в течение дня вызвать
внимание и ласку своих матерей. Иногда мать отвечает незамедлительно, но чаще она
занята. В различные интервалы она будет награждать ребенка своим вниманием и
интересом к нему. Многие матери склонны игнорировать незначительные формы
поведения, направленного на поиск внимания, и отвечать только тогда, когда это
поведение является частым и интенсивным. Можно предсказать, на основе
лабораторных исследований, ссылка на которые была выше, что эти матери должны
были бы иметь детей, которые демонстрируют постоянное поведение в поисках
внимания, выражающееся на том уровне и с той интенсивностью, которая раньше уже
приносила награду. Можно думать, что наиболее «тревожащее» поведение было
подкреплено по комбинированной схеме, по которой нежелательные ответы большой
сложности и частоты незамедлительно подкреплялись. Поведение, сформированное
таким образом, устойчиво, с трудом поддается изменению и является оглушающим для
родителей. Возможно, что генезис большей части агрессивного поведения можно
обнаружить в использовании схем, которые подкрепляют ответы только большой
интенсивности; в качестве такового выступает поведение, направленное на поиск
внимания, требование пищи и на другие, так называемые «зависимые» ответы, так же
как и ответы того типа, который обычно называется агрессивным.
6
В
социальных
ситуациях
подкрепления
обычно
распределены
по
комбинированным схемам, с изменяющимся количеством неподкрепленных ответов и
постоянно изменяющимися временными интервалами между подкреплениями. Тем не
менее социальное подкрепление не настолько хаотический процесс, как предполагалось
некоторыми авторами. Преобладание смешанных схем подкрепления в социальных
ситуациях связано не только с тем фактом, что живые существа менее однозначны, чем
программированные машины, или неспособны длительно демонстрировать поведение,
которое они хотели бы контролировать. Это связано также со сложностью социальных
требований. Если бы даже социализирующие агенты соответствовали их поведению и
даже если бы они были способны опосредовать все ответы детей, схемы подкреплений
зависели бы от формы, времени, интенсивности и объектов поведения детей.
7
Скачать