А.В. Рафаева К составлению словаря сказочных персонажей В докладе обсуждаются основные принципы составления и использования словаря сказочных персонажей, ориентированного в первую очередь на использование в справочно-аналитической системе СКАЗКА-2. Под персонажем в первую очередь будет пониматься персонаж в смысле В.Я. Проппаi, т.е. существо или предмет, выполняющий ту или иную функцию в сказке. В тех случаях, когда одна функция (например, вредительство) исполняются несколькими деятелями (например, несколько змеев, их жёнызмеихи и мать), должны быть учтены каждый из них. Наконец, существуют вырожденные случаи; так, братья героя чаще всего являются ложными героями, однако в некоторых сказках они служат лишь наблюдателями, иронизирующими над попытками дурака выполнить трудное задание и жениться на царевне. Кажется разумным, что в словаре должны быть учтены и такие случаи, т.е. если какой-то персонаж (например, кот или брат героя) в некоторых сказках может исполнять одну из функций Проппа, то учитываются и его появления в сказках, где он никаких функций не выполняет. Так, словарная статья, описывающая кота, должна включать как кота-помощника, так и кота в функции диковинки, а также кота, наряду с райскими птицами «украшающего» собой чудесное дерево или пуговицы на праздничной шубе. Неоднократно было замечено, что действия и характеристики мифологического и фольклорного персонажа отнюдь не произвольны, и, зная имя персонажа, мы часто можем предсказать и его поступки. О. М. Фрейденберг выразила это наблюдение следующим образом: «Основной закон мифологического, а затем и фольклорного сюжетосложения заключается в том, что значимость, выраженная в имени персонажа и, следовательно, в его метафорической сущности, развертывается в действие, составляющее мотив; герой делает только то, что семантически сам означает. <...> Таким образом в мифологическом сюжете (под которым нужно понимать не сюжет мифа, но сюжет, созданный мифотворческим мышлением, т.е. сюжет и персонажа, и вещи, и действия) мотивы не только связаны с персонажем, но являются его действенной формой. <...> Каждый образ воплощен; эти воплощения получают развернутые мотивы действий и состояний в обряде и мифе»ii. Первоочередной сказочных задачей работы является составление словаря персонажей для использования в справочно-аналитической компьютерной системе СКАЗКА-2. Предполагается, что словарь должен быть построен так, чтобы быть пригодным не только для исследователя, но и в первую очередь для использования в различных алгоритмах поиска и построения выборок в системе. В частности, с помощью такого словаря, связанного с текстами сказок системой перекрёстных ссылок, можно будет выяснить, насколько распространены те или иные персонажи, как меняются их атрибуты и роль в сюжете и т.п. Сказанное означает, что для полноценной работы необходимо не только составить соответствующие словарные статьи, описывающие действующих лиц волшебных сказок, но и связать их с текстами самих сказок, то есть выделить в тексте те элементы, которые прямо или косвенно указывают на появление в сказке того или иного персонажа. Кроме того, поставленная задача требует, чтобы при работе учитывались все обнаруженные появления рассматриваемого персонажа, а не только наиболее типичные или частые случаи. В последнее время вышел целый ряд фольклорных словарей, в том числе словарей фольклорных персонажей, что сильно облегчает разработку структуры словарной статьи для нашего словаря. В настоящее время структура словарной статьи для словаря разработана лишь частично; в этой работе мы во многом опираемся на принципы описания персонажей в уже изданных словарях и базах данныхiii. Однако волшебные сказки имеют свою специфику, которая должна быть отражена, в частности, и в структуре словарной статьи; например, достаточно естественно учитывать в словарной те роли по Проппу, которые может выполнять персонаж. Для различных видов сказочных персонажей требуется различная форма описания. Так, для людей существенными признаками будут пол, возраст, социальное и семейное положение, а также профессия/умения; для описания сверхъестественных существ большую роль приобретает внешний вид (включая признаки антропоморфность/зооморфность/отсутствие облика и т.п.) и место обитания. Социальное положение для сверхъестественных существ, как правило, отсутствует (хотя возможно появление некоторой иерархии), а вот родственные связи часто существуют и служат объяснением для того или иного поворота сюжета. В целом словарь должен содержать по меньшей мере три больших группы персонажей, требующих отдельных схем описания: люди, животные, сверхъестественные существа. Кроме того, персонажами сказки могут быть некоторые предметы, например, печка, укрывающая детей от преследования или ворота, пропускающие героиню в жилище Бабы-Яги и свободно выпускающие её. В этом случае предметы являются помощниками героев (совмещают функции дарителя и помощника). При подборе примеров к словарной статье для уже частично разработанной компьютерной системы, естественно, хочется автоматизировать поиск того или иного персонажа, если это возможно. Однако для автоматического поиска признак «выполнять ту или иную роль по Проппу» слишком сложен и плохо формализуется; требуется нахождение более простого формального признака. Согласно первоначальному определению, персонаж – это человек, животное, чудовище или предмет, способный к самостоятельным поступкам или – в терминологии В.Я. Проппа – выполняющий одну или несколько функций в сюжете. В качестве одного из основных формальных признаков персонажа можно назвать речь: предмет или животное, наделённые речью, как правило, являются активными деятелями, часто дарителями или помощниками героя или же, напротив, подручными вредителя. Определенную сложность для описания персонажей представляют случаи позднейшего переосмысления. В ряде сказок, к примеру, водяной (водяной царь) может быть назван нечистым или чёртом. Очевидно, что чёрт в таких текстах – явление позднейшее, однако изменение названия персонажа, по крайней мере, в одном из рассматриваемых случаев привело и к изменению в сюжете сказки: черт-водяной не только просит отдать ему то, «чего дома не знаешь» (т.е. сына, родившегося в отсутствие отца), но и требует подписать договор кровью. Таким образом, сверхъестественное существо в тексте опознаётся – с той или иной степенью уверенности – по сумме признаков, куда, наряду с названием, входят и его атрибуты, и типовые действия (функции или акции), и мотивы. В нашем примере антагонист, сохраняя признаки водяного, приобретает и некоторые черты чёрта. Однако вполне возможно появление персонажей, в гораздо большей степени совмещающих в себе различные черты, чем в приведённом случае. Итак, возникает вопрос, каким образом необходимо представить в системе СКАЗКА-2 «черта» («подводного царя») и других подобных персонажей. Составляя словарь, не следует забывать, что «прошлое не перерабатывается и не исчезает; все его формы соуживаются рядом, хотя бы они и противоречили новому настоящему»iv, а, следовательно, словарь должен отражать все существующие – противоречивые – формы, в данном контексте – все возможные роли персонажа в сказке и их изменения. Затруднения вызывает не само написание словарной статьи (в конце концов, подобные задачи ставились и решались исследователями неоднократно), но связь словарной статьи и текста. В самом деле, словарная статья может содержать только типичные для каждого сверхъестественного существа атрибуты, однако при описании и разметке текста необходимо указывать все признаки, относящиеся к данному персонажу, даже если их совокупность может быть истолкована различными способами (и, заметим, особенно в этом последнем случае). Видимо, в такой ситуации задачей составителя будет не точное указание, какой именно персонаж встречен в конкретном тексте, тем более, что такое указание в дальнейшем может снизить полезность системы СКАЗКА-2. Можно предположить, что в словарной статье, ориентированной на последующий компьютерный анализ, продуктивным будет задание персонажа в виде набора (пучка) некоторых признаков, от описания внешности, жилища, места обитания (лес, город, подземное царство и т.п.) до типовых функций в сказке и основных типов сказочных персонажей, взаимодействующих с нашим. При этом едва ли можно ожидать, что все признаки будут упомянуты в одном тексте; нет необходимости и требовать, чтобы все признаки относились или могли быть отнесены к одному сверхъестественному существу. При таком описании вид персонажа будет определяться (в идеале – автоматически) не только по имени, а по целому набору переменных. В этом случае система сможет определить, что анализируемый персонаж в сказке имеет такие-то признаки, скажем, лешего, такие-то – колдуна и т. п Сказанное в ещё большей степени верно для персонажей-медиаторов, которые по определению являются посредниками между двумя мирами и имеют качества, позволяющие отнести их как к «этому», так и к «иному» миру. Первая попытка задать некоторую схему описания сверхъестественных существ в волшебной сказке предпринята нами в работе на материале указателей СУС и AaThv. Очевидно, что подобная схема, созданная по материалам указателей, не будет полной. Например, в указателях отсутствуют описания внешности и жилища сверхъестественного существа, опущены многие мотивы, из нескольких возможных финалов сказки выбран только один и т.п.; кроме того, многие сказки не принадлежат к одномуединственному типу, но представляют собой более или менее устойчивые контаминации сюжетных типов. Тем не менее, ряд выводов, сделанных на основе работы с указателями, может быть перенесён и на изучение сказочных текстов как таковых. Во-первых, в описание сверхъестественного персонажа нужно включать те роли, которые он обычно играет в сказке, стало быть, и те функции, которые он выполняет. Во-вторых, для определения, как будет происходить и чем закончится контакт между героем и сверхъестественным существом, часто достаточно знать характеристики этих персонажей. Так, баба-яга для героев-детей – вредитель, опасное существо, угрожающее смертью, из-под власти которого надо вырваться, то есть основу сюжета таких сказок (например, СУС 327A Брат и сестра у ведьмы (колдуна, змея), 327B Мальчик c пальчик у ведьмы и др.) составляют парные архетипические мотивы попадание во власть демонического существа и спасение от демонического существа. Для взрослого героя бабаяга уже гораздо чаще будет помощником или дарителем, возможно невольным или враждебным, а возможно, соглашающимся помочь по доброй воле. Иными словами, семантический потенциал сверхъестественного существа в волшебной сказке проявляет себя только при столкновении с героем, а основу сюжета сказки составляет результат такого взаимодействия. Как представляется, словарная статья, описывающая сказочных персонажей, должна будет – помимо описания, оприентированного на прочтение человеком – содержать следующие поля для компьютерного анализа: имя (название) персонажа, варианты этого имени, описание внешности, антропоморфный/неантропоморфный вид персонажа, пол, возрастная группа (ребёнок, молодой неженатый человек / незамужняя девушка, женатый герой / молодая женщина, старик), описание семейного положения (особенно значима оппозиция отсутствие/наличие детей), описание внешности, атрибутов, типовых реплик, описание пространства («мира»), в котором живёт герой (мир людей – иной мир, во втором случае существенно различие леса и подземного царства (или иных вариантов далёкого царства); возможность свободного перемещения (так, сверхъестественное существо может быть привязано к одному месту или свободно перемещаться в пределах своего мира; некоторые – чаще всего, Змей – способны даже нарушать границу мира людей); наличие собственного жилища, описание жилища; часто упоминаемые реплики, формулы; функции, в которых персонаж может выступать в волшебной сказке; типовые мотивы, связанные с этим персонажем. Для всех или хотя бы для некоторых полей необходимо составить список ключевых слов и наборов правил, позволяющих определить наличие или отсутствие данного признака в тексте конкретной сказки. Конечно, задача это очень сложна и трудоёмка; в то же время, как показывает опыт автоматизированного извлечения данных из текста на естественном языке, составление таких списков признаков – хотя бы частичных – возможноvi. Набор рассмотренных признаков (полей словарной статьи), очевидно, неполон. Впрочем, при составлении компьютерного словаря нет необходимости задавать все поля заранее; напротив, работа с системой, добавление новых текстов и уточнение правил обработки их позволяет выделять новые признаки или уточнять уже существующие. В этом преимущество представления словаря в электронной форме: словарь может быть использован в работе даже в самом начале его составления (например, составлено только несколько словарных статей, причём описания персонажей содержат только ряд ключевых слов, позволяющих с высокой степенью уверенности автоматически опознавать в тексте некоторых из наиболее частых сказочных персонажей). Таким образом, и справочно- аналитическая компьютерная система, и входящие в неё словари развиваются параллельно, причём каждое новое изменение невелико и может быть проверено на материале, входящем в систему. Пропп В. Я. Морфология <волшебной> сказки. Исторические корни волшебной сказки. – М.: Лабиринт, 1998. ii Фрейденберг О. М. Поэтика сюжета и жанра. – М.: Лабиринт, 1997. – С. 222–223. iii См. Гура А.В. Символика животных в славянской народной традиции. – М., 1997; Славянские древности. Этнолингвистический словарь в 5 томах. Тт. 1–4. – М., 1995–2009; схема описания i мифологических персонажей в Виноградова Л. Н. Народная демонология и мифо-ритуальная традиция славян. М., 2000; Левкиевская Е. Е. База данных «Славянские мифологические персонажи» как способ классификации мифологической системы // Проблемы структурно-семантических указателей: Сборник статей. – М.: РГГУ, 2006. С. 136 – 144. iv Фрейденберг О.М. Миф и литература древности. 2-е изд., испр. и доп. — М., 1998. –С. 155. v Рафаева А. В. Анализ родственных отношений с помощью системы «Сказка» // Проблемы компьютерной лингвистики: Сб-к научн. трудов / Под ред. А.А. Кретова. – Вып. 1. – Воронеж: РИЦ УФ ВГУ, 2004. – С. 83 – 90. vi См. Рафаева А.В. Анализ родственных отношений…, а также: Рафаева А. В. Полуавтоматический анализ волшебных сказок в компьютерной системе СКАЗКА // Труды международного семинара Диалог’98 по компьютерной лингвистике и ее приложениям: В 2 т. Казань, 1998. Т. 2. С.701 – 706; Рафаева А. В. Синонимичные мотивы в волшебной сказке // Первая российская конференция по когнитивной науке: Тезисы докладов. – Казань: КГУ, 2004. – С. 210 – 211.