О СХЕМЕ ВЗАИМОДЕЙСТВИЯ В КОМПЛЕКСЕ «АНАЛИЗ И СИНТЕЗ ЕСТЕСТВЕННОГО ЯЗЫКА И ИЗОБРАЖЕНИЙ»

реклама
О СХЕМЕ ВЗАИМОДЕЙСТВИЯ В
КОМПЛЕКСЕ «АНАЛИЗ И СИНТЕЗ
ЕСТЕСТВЕННОГО ЯЗЫКА И
ИЗОБРАЖЕНИЙ»
С.С. Курбатов, cul@nicevt.ru
К.А. Найденова, Naidenovaxen@gmail.com
Г.К. Хахалин, gkhakhalin@yandex.ru
20-24.09.10
КИИ-2010, Тверь
1
Комплекс: анализ/синтез ЕЯ и
изображения + онтология





Система анализа изображений.
Система синтеза изображений.
Система анализа ЕЯ-текста.
Система синтеза ЕЯ-текста.
Прикладная онтология - связующее звено
между системами:
Прикладная область: плоские контурные
планиметрические объекты.
 Язык представления знаний в онтологии –
семантический гиперграф.

20-24.09.10
КИИ-2010, Тверь
2
Схема комплекса
Концептуальный
анализ
изображений
Прикладная
онтология
Анализ
ЕЯ
20-24.09.10
Концептуальный
синтез
изображений
Синтез
ЕЯ
КИИ-2010, Тверь
3
Семантический гиперграф
 Является расширением семантических
сетей, где естественным образом
представляются n-арные отношения.
 Предоставляет возможность задавать
атрибутивную и структурную информацию
об объектах и ситуациях.
 В зависимости от типов отношений можно
реализовывать классифицирующие,
функциональные, ситуационные,
структурные сети и сценарии.
20-24.09.10
КИИ-2010, Тверь
4
Фрагмент прикладной онтологии на
языке семантического гиперграфа
Плоская Фигура
Треугольник
Прямоугольный
Треугольник
Параллелограмм
Трапеция
Эллипс
Ромб
Равнобедренный
Треугольник
Овал
Равнобочная
Трапеция
Прямоугольник
Квадрат
Круг
Равносторонний
Треугольник
20-24.09.10
КИИ-2010, Тверь
5
Равнобочная трапеция
Трапеция
F11 (S=1/2 (ав+cd)*h)
Площадь
вид
имеет
по_формуле
Равнобочная_Трапеция
по_формуле
имеет
им_структуру
Периметр
F10 (P=ав+сd+2l)
соприк_к.т.В
Основание (ав)
им_длину
им_длину
l2
им_длину
Бок_Сторона (аd)
соприк_к.т.D
параллельны
20-24.09.10
соприк_к.т.С
l
соприк_к.т.А
Бок_Сторона (вс)
не_параллельны
Основание (сd)
не_параллельны
КИИ-2010, Тверь
им_длину
l3
6
Схема взаимодействия систем
9
1
3
2
КАИ
4
11
КСИ
5
Прикладная
онтология
12
8
6
АЕЯ
7
СЕЯ
10
20-24.09.10
КИИ-2010, Тверь
7
Анализ/понимание изображения
 {1, 2} – вход: изображение; в онтологии: описание зрительной
ситуации (всей или части) на ЯПЗ
Параллелограмм
F22 (S= l1*l2)
Площадь
по_формуле
по_формуле
имеет
имеет
вид
Прямоугольник
им_структуру
Периметр
F20 (P=2*(ав+вс))
соприк_к.т.В
Сторона (вс)
Сторона (ав)
им_длину
соприк_к.т.А
перпенд.
Сторона (аd)
l1
l2
им_длину
соприк_к.т.D
соприк_к.т.С
перпенд.
Сторона (сd)
параллельны
20-24.09.10
КИИ-2010, Тверь
8
Анализ изображения и проверка
результатов анализа по синтезу объектов
 {1, 2, 3} – вход: изображение; в онтологии:
описание зрительной ситуации на ЯПЗ; выход:
множество примеров изображений класса
объектов.
20-24.09.10
КИИ-2010, Тверь
9
Генерирование текста по рисунку
 {1, 4, 8} – вход: изображение; в онтологии: описание
геометрической ситуации на ЯПЗ; выход: ЕЯ-тексты,
описывающие геометрическую ситуацию.
А
C
20-24.09.10
B
ЕЯ-тексты:
Треугольник ABC, две стороны которого
равны 6 и 8, а медиана, заключенная между
ними, равна 5.
Треугольник со сторонами АВ=8, АС=6.
Медиана, проведенная из вершины А, равна
5.
Задан треугольник ABC. Сторона АС
(равна 6) меньше стороны АВ (равна 8). Из
вершины А к основанию CB опущена
медиана AD (равна 5).
КИИ-2010, Тверь
10
Создание рисунка по тексту
 {6, 5, 3} – вход: ЕЯ-текст; в онтологии: семантическое описание
текстовой ситуации на ЯПЗ; выход: изображение (множество
изображений), описывающее текстовую ситуацию.
ЕЯ-текст: В треугольник ABC вписана окружность.
Вписанная_в_Тре-к_Окружность
им_структуру
Треугольник
нах_внутри
Центр_Окр.
Сторона
(вс)
имеет
А
принадлежит
Сторона
(ас)
Сторона (ав)
касается_в_точке
C
B
R
Окружность
20-24.09.10
имеет
им_знач
Радиус
КИИ-2010, Тверь
11
Перефразирование входного текста
(анализ/синтез текста)
 Входной текст: Постройте круг данного радиуса r,






который включает точку с координатами X1 и Y1.
Выходные тексты:
Задана точка с координатами X1 и Y1. Она находится
внутри круга с радиусом r. Построить такой круг.
Построить круг с радиусом r, включающий точку с
координатами X1 и Y1.
Внутри круга находится точка с координатами X1 и Y1.
Постройте такой круг, радиус которого равен r.
Выходной текст может быть представлен на языке,
отличным от входного языка:
To construct the circle with radius r which includes a points with
co-ordinates X1 and Y1.
20-24.09.10
КИИ-2010, Тверь
12
Схема взаимодействия подсистем
9
1
3
2
КАИ
4
11
КСИ
5
Прикладная
онтология
12
8
6
АЕЯ
7
СЕЯ
10
20-24.09.10
КИИ-2010, Тверь
13
Пример наполнения онтологии
 Кораблик – это равнобочная трапеция, к
большему основанию которой
перпендикулярно проведен отрезок
прямой длиной не более 2/3 этого
основания. Этот отрезок прямой
касается большего основания трапеции в
его середине. Отрезок прямой
пересекает параллелограмм. Стороны
параллелограмма не более 2/3 и не менее
1/4 длины отрезка.
20-24.09.10
КИИ-2010, Тверь
14
Структура понятия «Кораблик» и
пример изображения
Отрезок прямой
Кораблик
вх._в_стр-ру
Равнобоч.
трапеция
вх._в_стр-ру
Параллелограмм
вх._в_стр-ру
Равнобоч.
трапеция
касается_в_сере
дине
Отрезок прямой
пересекает
Параллелограмм
им_структуру
вх._в_стр-ру
Большее основание
им_длину
l1
перпендикулярно
им_длину
не более 2/3 от
l2
не менее 1/4 и не более 2/3 от
им_длину
вх._в_стр-ру
l3
l4
Сторона а
им_длину
вх._в_стр-ру
Сторона b
20-24.09.10
КИИ-2010, Тверь
15
Претенденты на системы комплекса
 Система Spotlight (фирма CSOFT) – «нижние»
уровни анализа объектов изображения.

Основные функции: сканирование, фильтрация,
коррекция, распознавание геометрических
примитивов:
 отрезки, дуги, окружности, символы, произвольные
кривые (полилинии)
 Система «ПСИ» (Власов А.В., Аредова И.И.) –
синтез объектов изображения.

20-24.09.10
Основные функции: означивание параметров
объектов изображения по структурам модели;
расчет экземпляров объектов; выявление
недостатка/противоречивости данных и т.д.
КИИ-2010, Тверь
16
Претенденты на системы комплекса
 Лингвистический транслятор «Адалит» (Хахалин
Г.К. и др.) – анализ/синтез ЕЯ-текста.

Основные функции: морфологический,
синтаксический и семантический анализ элементов
ЕЯ-текста, включающего простые, осложненные,
сложные, эллиптические и анафорические
предложения. Элементы синтеза ЕЯ-текста.
 Язык представления знаний для прикладной
онтологии (Курбатов С.С., Хахалин Г.К.) –
семантический гиперграф.

20-24.09.10
Основные функции: стандартные процедуры
обработки гиперграфов (добавление/удаление
вершин, ребер; стягивание, свертка и т.д.).
КИИ-2010, Тверь
17
Возможное применение:
 Системы обучения (естественному языку с
картинками, геометрии и т.д.).
 Робототехника.
 Система сурдоперевода («текст →
аватар»).
 Система описания изображений на ЕЯ для
поиска.
20-24.09.10
КИИ-2010, Тверь
18
Спасибо за внимание!
 Дополнительную информацию можно
получить, обратившись к докладчикам или
по e-mail: gkhakhalin@yandex.ru
20-24.09.10
КИИ-2010, Тверь
19
Студенты и аспиранты!
 Если Вы хотите работать над дипломом
или над диссертацией по темам
«Лингвистический анализ/синтез
естественного языка» или
«Концептуальный анализ/синтез
изображений», обращайтесь к докладчику
или по e-mail: gkhakhalin@yandex.ru
 Престиж и качество гарантируются!
20-24.09.10
КИИ-2010, Тверь
20
Скачать