А.В.Венцов Санкт-Петербургский государственный университет Санкт-Петербург, Россия av.ventsov@mail.ru «Составные» слова и перцептивный словарь* Корпус русского литературного языка (Венцов, Грудева, 2009) создавался изначально как собрание материалов, используемых при исследованиях механизмов восприятия речи человеком. Предполагалось, что в первом приближении его тексты и словари могут быть использованы в компьютерных моделях сегментации и поиска в словарях в качестве весьма приблизительного аналога звучащей речи. Поэтому в нем последовательно проведена сплошная акцентуация (во всех словах маркирован ударный гласный) и восстановлена в правах буква «ё». Из этих же соображений в Корпусе в качестве самостоятельных единиц фигурируют так называемые «составные» слова. Под «составными» словами имеются в виду единицы, которые иногда в литературе называют «сочетаниями, эквивалентными слову».Составной характер части таких сочетаний (в обни+мку, в отме+стку, до упа+ду, на о+щупь) является чисто орфографической особенностью, с грамматической же точки зрения это слова-наречия. Использование других позволяет разрешить омографию (например, различать союзное «слово» и сочетание местоименного существительного с глаголом): «…, то_есть надежда пропала» vs «…то есть надежда, что…». Теперь важно установить, не содержатся ли эти слова в перцептивном словаре, т.е. в том разделе ментального лексикона, который обеспечивает переход от акустического сигнала к лексическим единицам языка, именно в таком «составном» виде. К такому выводу можно было бы прийти, если бы при анализе речи носителей языка оказалось, что подобные «составные» слова систематически и устойчиво образуют фонетические слова с соблюдением всех правил качественной и количественной редукции. Всего в Корпусе на 120 тыс. разных словоформ насчитывается 1129 «составных» слов (Венцов, Грудева, 2008: 143). Чтобы оценить каждое из них на предмет включения или не включения в перцептивный словарь, потребуется длительная масштабная работа. На сегодня были рассмотрены наиболее частотные сочетания «потому+_что» и «то+_есть», частотность которых составила 482 и 353 на миллион словоупотреблений соответственно. Для этого были проанализированы оцифрованные записи телевизионной программы «Культурная революция» (Горбова и др., 2006), а также имеющиеся в Интернете записи * Работа выполнена при поддержке гранта РФФИ № 09-06-00244-а актерского чтения художественной прозы (http://www.repository.voxforge1.org/downloa ds/Russian/Trunk/Audio/16kHz_16bit/). Последовательность слов «потому» и «что» в текстах на русском языке встречается в двух вариантах: как разделенная запятой последовательность местоименного наречия и союза (…потому, что…) и как союзное слово (…, потому что). В речевом сигнале наречие и союз могут разделяться паузой (рис. 1а) или произноситься слитно (рис. 1б), но в любом случае реализуются с характерным значительным повышением частоты основного тона на ударном слоге наречия, воспринимаемым как пограничный сигнал даже при отсутствии паузы. Союзное слово никогда не произносится с паузой перед «что», и его реализация не сопровождается специфическими изменениями основного тона (рис. 1в,г). При этом второй предударный гласный составного слова может редуцироваться вплоть до полного выпадения (рис. 1г). Этим подтверждается наблюдение, что в спонтанной речи союзное слово может подвергаться весьма значительной редукции: [пътамуштъ], [птамуштъ], [птамуш]. Из сказанного выше можно заключить, что составное союзное слово потому_что в речевом сигнале систематически реализуется, Рис. 1. Спектрограммы типичных реализаций сочетаний «потому» и «что» в спонтанной речи. Жирные черные кривые – интонограммы. как устойчивое фонетическое слово, и в таком виде может быть элементом перцептивного словаря. При этом нельзя исключить возможность того, что в этом словаре данное составное слово представлено всеми возможными реализациями, встречающимися в спонтанной речи, при обязательной ссылке на то, что на следующем уровне ментального лексикона всем им соответствует составное союзное слово потому_что. Но в спонтанной речи и в Корпусе часто встречаются сочетания словоформ, к категории «составных» пока не отнесенные. Это все те случаи, когда в речи ударение переносится на предлог или частицу «не»: на+ сторону, до+ смерти, за+ год, не+ был, не+ было, не+ с кем, не+ на что. В сущности, все это варианты наречий, по значению аналогичные таким наречиям, как на+голову, до+верху, за+мужем, не+зачем, но орфографически еще не образующие целого слова. Список литературы Венцов А.В., Грудева Е.В. Частотный словарь словоформ русского языка (проект).– Череповец: Изд-во ЧГУ, 2008.– 204 с. Венцов А.В., Грудева Е.В. О корпусе русского литературного языка (narusco.ru) // Russian Linguistics.– 2009.– V. 33, N 2.– С. 195-209. Горбова Е.В. и др. Предварительные результаты мониторинга современной русской спонтанной речи // Современная русская речь: Состояние и функционирование. Вып. II / Под ред. С.И. Богданова, Н.О. Рогожиной и Е.Е. Юркова.– СПб.: Изд-во «Осипов», 2006.– С. 7-31.