ToBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков) 1 ToBI (1992-1996) Стандартная транскрипционная система для интонации американского варианта английского языка (AE), разработанная и протестированная международной группой исследователей (Silverman et al. 1992). Цели стандартизации 1. 2. Создание единой теоретической и практической парадигмы для дальнейших научных исследований и технологических разработок, которая позволила ли бы разным лабораториям и рабочим коллективам интерпретировать и использовать накопленные данные по интонации английского языка в его главных вариантах (АЕ, АА, АB ). Создание ресурсов для разработки и использования он-лайновых баз данных с просодически размеченной и затранскрибированной речью. 2 Вопросы для дальнейшего обсуждения Теоретическая база системы ToBI Иллюстративные примеры Соглашения и инструкция для разметчиков; Компьютерный инструментарий, примеры; Структура разметочных файлов, совместимость; Экспериментальная проверка работоспособности (валидности) системы; Расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRI, + итальянский, испанский, арабский (каирский вар.). 3 Теоретическая база системы ToBI Общее направление – интонационная фонология, в ее рамках автосегментная тональная теория, метрическая теория. 1. J. Pierrehumbert, 1980 – модель английской интонации1 ; 2. M. Beckman & J. Pierrehumbert, 1986 - модель английской интонации; 3. J. Pierrehumbert. Tonal elements and their alignment, 2000 модель английской интонации; 4. Goldsmith J., 1990 – общие вопросы автосегментной и метрической фонологии 2; 5. Ladd D. R. (1983, 1996) – интерпретация явления даунстепа и тональный диапазон; 6. Wightman C. et. al. – 1992 – интерпретация просодических стыков=швов; 7. Selkirk E. 1984, 1995 – метрическая теория и просодическое фразирование (формирование просодических составляющих). 1См.учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология. 4 J. Pierrehumbert. Tonal elements and their alignment, 1980 - 2000 - модель английской интонации, АЕ Из истории : 50-е годы ХХ в. – первые попытки фонологизации тональных явлений= интонации на материале АЕ. • Признание автономной, супрасегментной фонетической природы интонации и ее отдельных элементов; слог - основное поле реализации интонационных контрастов. Два подхода в в фонологической интерпретации интонации. 1. Trager. Smith, 1951, Pike, 1945 – декомпозиция тональных контуров в терминах 4 функционально значимых тональных уровней=уровневых тонов: L, LM, HM, H. 2. Bolinger (1951,1958), Британская фонет. школа + современные исследоваватели Liberman M. (1975), Ladd (1979).декомпозиция контуров в терминах тональных движенийконфигураций . Каждый подход имеет свои преимущества и недостатки. 5 Современные модели J. Pierrehumbert и (1980-2000) и другие в той же парадигме попытка интегрировать прежние подходы с учетом их недостатков. Краткая характеристика модели • Базовый тональный контраст: H ~ L использование верхней и нижней части голосового диапазона в качестве основных целевых зон (мишеней= targets) во всех тональных элементах системы битональная модель интонации. Постулируется инвентарь из 6 фонологически разных L*, H*, L+H*, L*+H, H+L*, H*+L, тональных элементов: • Два простых L и H • Четыре сложных: L + H*, L* + H, H* + L, H+ L* Различаются по локализации во фразе и дискурсивной функции (см. слайд 7). 6 Типы тональных элементов Локализация H* L* ТА Акцентированный ударный слог слова ( маркер * ) L+H* L*+H H+L* H*+L Фразовые (краевые тоны H) L- ФТ Граничные тоны H% конечные ГТ L% ГТ Начальный ГТ %Н ТТ после последнего акцентированного слога до конца промежуточной фразы Последний слог в интонационной фразы Начальные слоги фразы Прагматические дискурсивные Функции тон. элементов (интонационных морфем) Новая, фокусируемая И., добавляемая в общее инф. поле дискурса Важная информация, но с сомнительным индексом доверия И. , выбранная из небольшого числа альтернатив. причем L+H* кодирует также «добавь=add », а L*+H – «не добавляй» в общее инф. поле Д. Старая И. + инструкция идентифицировать связь передаваемой информации с информацией, кот. уже находится в общем информационном поле Д. Дискурсивный статус просодической фразы в целом а не статус отдельных фокусируемых элементов фразы. 7 Грамматика возможных интонационных структур английского языка (ИГ) Интонационная структура (ИС) фразы = линейная последовательность фонологически значимых тональных элементов, ассоциированных с метрически сильными (акцентированными) слогами и границами просодических составляющих двух уровней иерархии (промежуточными и интонационными фразами) (сл. 10 ). Грамматика, исчисляющая возможные ИС, = сеть из 3 возможных тональных состояний; любой путь через сеть порождает некоторую ИС (сл. 9). Свойства порождаемых ИС: • Длина и сложность ИС. Фраза может иметь бесконечное к-во тональных акцентов, это идеализация. Обычно акцентов 1 - 3, очень редко 5 . Но это ограничение не самой ИГ, а ритмометрики фразы: количество метрически сильных слогов в составляющей ограничивает кол-во тон. Акцентов в ней. • Комбинаторика тональных элементов. Тональные акценты и граничные тоны не имеют принципиальных ограничений на комбинаторику, порождая 36 сложных тон. конфигураций в завершении фразы (сл.11). Но комбинаторика акцентов внутри одной и той же фразы имеет ограничения, как показывают исследования. • Инвентарь нуклеарных и ненуклеарных тональных акцентов один и тот же. • Иерархия в ИС - Линейная последовательность тональных элементов, 8 организованных в иерархическую фразово-просодическую структуру. (сл.10) Интонационная порождающая грамматика ‘X*’ ‘Х-’ ‘X%’ 9 Линейно-иерархическая природа интонационной структуры предложения Adelaide’s in South Australia and Sydney’s in New South Wales. 10 Тональные конфигурации в завершении фразы ТА ГТ ТА Тональные конфигурации в завершении фразы 11 Просодические тональные правила 1. 2. 3. Tone alignment rules = Постлексические правила выбора тональных элементов и их связывания с сегментным составом (слоговой последовательностью, представляющей высказывание). Связь ТА с акцентированными слогами мб объяснена общей организацией моторного контроля1. Правила формирования ЧОТ-контура на основе данной ИС = реализационные правила тональной параметризации. Абстрактные тон. элементы ИС условно можно рассматривать как маршрут или схему движения в целевом ЧОТ-пространстве. Есть два типа реализационных правил – таймирование и частотное шкалирование акустических событий, соотносимых с абстрактными тон. элементами. Учитывается не только исходная ИС, но и ряд других факторов – тон. диапазон фразы, взаимодействие тональных элементов, деклинационные тенденции и пр.Очень важны для автом. синтеза речи. См. э-библиотеку речевой группы ОТ и ПЛ. Кривнова О.Ф.Генерация тонального контура фразы в системах автоматического синтеза речи // Диалог’2000 . С. 211-219. КривноваО.Ф. Моделирование и синтез фразовой интонации на основе особых точек тонального контура // Диалог'97. М., 1997. C. 161-164. это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно. 1 12 Иллюстративные примеры [[Adelaide] [is in South Australia] ] - вверху H* HH* L- L% [[Adelaide] H* H- [is in South Australia?] ] - внизу L* H- H% 13 [[Adelaide’s] [ in South Australia] ] - вверху H* HH* H* L- H% [[Adelaide’s] [ in South Australia] ] H* HH* H* H- L% 14 [[Sydney isn’t in South Australia!] ] - внизу L*+H* L- H% 15 ToBI Annotation Conventions (1992 ) M. Beckman and J. Hirshberg Соглашения и инструкция для разметчиков • • 1. 2. 3. 4. Разметочная система ToBI обеспечивает для каждого речевого высказывания следующую информацию: цифровую запись звучания, ассоциированный ЧОТ-контур, собственно транскрипцию – маркеры (labels) для различных речевых событий в следующих 4 слоях (каналах): Орфографический слой: w*ord Тональный слой:TA; PhT; BT; !H; HiF0 Слой показателей просодических швов (стыков): 0,1,2,3,4числовой показатель фонетической выраженности словораздела; Слой дополнительных комментариев (прочие события разного рода): паузы, речевые сбои, хезитации и пр. Соглашения касаются как собственно транскрипционных файлов, так и компьютерного инструментария wavesTM , форматов речевых файлов и средств временной синхронизации разных информационных слоев. 16 Компьютерный инструментарий, примеры; • wavesTM - часть пакета ESPS (Entropic Speech Processing System, ОС Unix ) – Англия • EMU Labeller – Австралия • Pitchworks – SciConcord.com (сл.18, 19 + Demo) • SA SIL ? 17 Рабочее окно разметчика PitchWorks 18 19 Структура разметочных файлов, чекеры, совместимость wavesTM формат • Каждая строка в разметочном текстовом файле содержит несколько полей, разделенных маркерами: field_1; field_2; field_3; field_4; field_5. С учетом содержания полей типичная строка в абстрактном виде выглядит так:: w(*)ord–tonal_marker$break_index@(time_stamp)(time_stamp); comment • В системе имеется чекер для проверки правильности состава и структуры разметочных протоколов. • Большинство работ с иcпользованием ToBI сделано с помощью инструментария wavesTM (ESPS) в среде Unix, в собственном формате. Для работы с ESPS-форматом, например, для изучения тренировочного материала по этой просодической разметке на сайте Ohio State Univ., под Windows требуется конвертер. См. сайт EMU-Австралия. Кроме традиционной формы разметки, EMU строит иерархическую просодическую аннотацию. Мои данные об указанных сайтах на сегодняшний день устарели, поэтому здесь не приводятся. 20 Экспериментальная проверка работоспособности (валидности) системы ToBI • • • • • Эксперимент по оценке валидности системы проводился с участием 26 разметчиков, на материале из 34 высказываний. По оценкам экспертов (Pitrelli et al. 1994) протоколы продемонстрировали хорошую согласованность работы экспертов при попарном сравнении протоколов с учетом транскрипционных символов на каждом слове. 88% согласования по наличию-отсутствию тонального маркера; 81 % по выбору определенного тонального маркера; 92% согласования в пределах одного уровня фразирования (членения) = разметки просодических швов; Полученный уровень согласования значительно выше, чем показывали предыдущие транскрипционные системы интонации , обеспечивает дальнейшее развитие в области создания и использования интонационных корпусов. 21 Заключение Ограничения ToBI Разработчики ToBI не утверждают, что система покрывает всё содержание интонационного оформления речи. Имеющиеся слои относятся к наиболее значимым, по общему мнению, просодическим характеристикам речевых сообщений. Последний, 4-ый канал может использоваться для любой дополнительной информации, например, для наблюдений об экспрессивном использовании фонации. Стандарт-ToBI разрабатывался под влиянием теорий для конкретного языка, но в ряде важных теоретических отношений он нейтрален. Однако, не следует ожидать сходства тональных инвентарей и физического тождества тональных элементов в разных языках. В то же время , можно ожидать, что широкие типы тональных контрастов и тональных реализаций могут воспроизводиться в разных интонационных системах (аналогично с ситуацией в сегментной фонетике). Это подтверждают попытки расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRi www.fon.hum.uva.nl/tori I, +шведский, итальянский, испанский, арабский (каирский вар.), японский, китайский….. 22