Среда передачи

реклама
Интеграция информационных систем
с применением семантических технологий
Сергей Горшков,
«Бизнес Семантика»
Задача: обмен данными
между приложениями
• Прямой доступ в БД
• Обмен через файлы (CSV, XML)
• SOAP
• Шины обмена сообщениями
(ESB, MQ)
• MDM-системы
Проблема: сопоставление
семантики данных в разных
приложениях
Что мы предлагаем?
Кодировать передаваемую
информацию в семантическую форму.
Подлежащее – сказуемое – определение
Подлежащее: универсальный
идентификатор объекта (URI)
Сказуемое: связь объекта с другим
объектом, или название его свойства
Определение: объект или литерал
Возможные типы объектов, свойств,
связей хранятся в онтологии
Примеры стандартных онтологий:
Dublin Core (DC)
FOAF
микроформаты (μF)
Можно также создать свою
онтологию – «с нуля», или путем
расширения существующей.
Технологии, необходимые для
работы с информацией
в семантической форме:
RDF
RDFS
OWL
SPARQL
Обмен данными между ИС
ИС - источник
Данные в табличной
форме (реляционная БД)
клиентский компонент
Преобразование данных
в триплеты
среда передачи
Данные
в семантической форме
клиентский компонент
Преобразование данных
из триплетов
ИС - приемник
Данные в табличной
форме (реляционная БД)
Как кодируются данные?
Таблица «Клиенты»
ID
Имя
Телефон
12
Иванов 111-22-33
14
Петров 123-45-67
http://xmlns.com/foaf/0.1/#Ivanov имеет имя Иванов.
http://xmlns.com/foaf/0.1/#Ivanov имеет телефон 111-22-33.
http://xmlns.com/foaf/0.1/
#Ivanov
имеет имя
Иванов
одна из стандартных онтологий
уникальный ID объекта
- вместе образуют URI объекта
термин из онтологии (foaf:name)
значение – литерал
Информационный граф
Таблица «Сотрудники»
Таблица «Приказы»
ФИО
Дата
Номер паспорта
Номер
Адрес
Сотрудник
…
Вид приказа
«Текст» в виде RDF
Сотрудник #ivanov имеет имя Иванов И.И.
Сотрудник #ivanov проживает по адресу
ул. Мира, 1.
Сотрудник #ivanov имеет паспорт
с номером 65 03 111222.
Приказ #0001 относится к сотруднику #ivanov.
Приказ #0001 издан 2012-01-01.
Приказ #0001 имеет номер 1.
Приказ #0001 имеет тип прием на работу.
Среда передачи
ИС - источник
Данные в табличной
форме (реляционная БД)
Какой должна быть
Преобразование данных
клиентский
компонент
среда передачи?
в триплеты
среда передачи
Данные
в семантической форме
клиентский компонент
Преобразование данных
из триплетов
ИС - приемник
Данные в табличной
форме (реляционная БД)
•
•
•
•
Прямой доступ в БД
Обмен через файлы (CSV, XML)
SOAP
Шины обмена сообщениями
(ESB, MQ)
• MDM-системы
Обмен через шину
ИС - источник
клиентский компонент
ИС - приемник
SOAP - интерфейс
клиентский компонент
Сервер
обмена
сообщениями
Роль клиента
Генерация сообщений
об изменении данных
Прием и интерпретация
сообщений от других систем
Клиент реализует «логический
уровень» - определяет правила
трансформации данных.
Роль сервера
Маршрутизация сообщений
Контроль прав доступа
Восстановление
целостности информации
Возможно подключение
SPAQRL-сервера для
формирования общей
аналитической базы
Новизна подхода
Отличие от обычной шины –
реализация «логического уровня»
протокола обмена.
Синтез идей шины обмена
сообщениями и Semantic Web
Отличие от средств семантического
обмена (ISO 15926) – обмен в
реальном времени, возможность
использования любых онтологий,
реализация «логического уровня»
620075, Россия, г. Екатеринбург, ул. Бажова, д. 89
+7 (343) 2-110-220
serge@business-semantic.ru
http://www.business-semantic.ru
http://serge-index.livejournal.com
Скачать