Онтологические модели и гуманитарные технологии: что будет, если… В.Ф. Хорошевский Вычислительный центр им. А.А. Дородницына РАН khor@ccas.ru Аннотация В докладе обсуждаются проблемы моделирования процессов, протекающих в социуме. Представлен анализ существующей в данной области ситуации с позиций двух направлений – разработки семантических моделей для гуманитарной сферы и гуманитарных технологий формирования пространств знаний. Введение В настоящее время одной из самых сложных и значимых проблем в области искусственного интеллекта (ИИ) и информационных технологий (ИТ) является разработка и реализация формальных моделей процессов, протекающих в социуме, где речь идет о взаимодействии индивидов, обладающих своими целями и задачами (собственными и/или «навязанными»), которые вербализуются в специальных текстах на различных естественных языках. В такой постановке речь идет о специализированных экспертных системах (ЭС), а важнейшим их отличием является то, что и модели предметной области, и механизмы вывода на знаниях формируются и/или корректируются экспертамижурналистами. Как представляется, в настоящее время ни в области ИИ или ИТ, ни в области социальных сетей нет адекватных полномасштабных решений этой проблемы. С другой стороны, в области гуманитарных технологий уже накоплен достаточно обширный фактический материал, в котором представлены (хотя и неформально) методы и средства экспертной журналистики, обеспечивающие решение достаточно широкого спектра практически значимых задач. С учетом вышесказанного целью настоящей работы является анализ сложившейся ситуации с точки зрения двух направлений – семиотических моделей для гуманитарной сферы и гуманитарных технологий формирования пространств знаний и попытка ответить на три вопроса: «Что может дать онтологический инжиниринг гуманитарным технологиям?», «Что могут дать гуманитарные технологии онтологическому инжинирингу?» и «Что будет, если эти направления начнут работать вместе?». 1. Семантические модели для гуманитарной сферы 1.1. Общие замечания Анализ исследований и разработок по семантическим моделям пространств знаний, методам приобретения экспертных знаний и онтологическому инжинирингу в гуманитарных областях показывает, что с позиций сегодняшнего дня здесь можно выделить следующие основные направления: от фундаментальных исследований по ИИ к моделям гуманитарных процессов и из области ИТ и Semantic Technologies (ST) к пространствам гуманитарных знаний. 1.2. Модели, методы и средства Исследования и разработки в области ИИ внесли серьезный вклад не только в формирование проблематики представления и обработки знаний, но и в саму идею пространств знаний, а в последнее 10-летие и в Semantic Web. При этом такие исследования, по существу, сформировали эту проблематику и те подходы, модели и методы, которые развивались в дальнейшем с учетом новых Интернет-технологий. В группе теперь уже классических работ, безусловно, выделяются инициатива (KA)2 – Knowledge Acquisition Initiative of the Knowledge Acquisition Community [Benjamins, et al., 1999] и проект SHOE – Simple HTML Ontology Extensions [Heflin, et al., 2000], а также более близкие к тематике гуманитарных моделей работы [Газе-Рапопорт и др.,1980; Поспелов и др., 1980; Таран, 2011; Михеенкова и др., 2006] и др. Оценивая проект инициативы (KA)2 и проект SHOE в целом, можно констатировать, что очень многие идеи, разработанные и реализованные в этих проектах, сейчас «переоткрываются» и используются снова, а эти 2 проекта, по сути дела, заложили научно-технические основы формирования пространств знаний. Одной из первых, не только в нашей стране, но и в мире, работ по онтологическому моделированию гуманитарных процессов была работа по генерации на ЭВМ волшебных сказок [Гаазе-Рапопорт и др.,1980]. Основная цель этой работы состояла в том, чтобы на базе идей В. Проппа и методов ИИ предложить формальную модель сказочных текстов, где в рамках единого фреймового формализма представления знаний были бы смоделированы как общий сюжет, так и персонажи волшебной сказки с их целями и поступками. Для примера ниже рассматривается общая структура формальной модели сказочного текста и ее конкретизация для модели детективной истории, предложенной В.Б. Карповым. В соответствии с общей идеей В. Проппа структура волшебной сказки может быть представлена следующим образом: Пролог (экспозиция) +Тело (развертывание сюжета) + Эпилог (постпозиция) Экспозиция волшебной сказки по В. Проппу [Propp, 1968] описывается графом, показанным на Рис. 1, развертывание сюжета осуществляется на основе представления последовательности эпизодов, а постпозиция имеет простую линейную структуру вида Награда-Героя + Заключение-Сказочника + Традиционная-Формула-Завершения. Герой Традиционная формула начала Место/Время Моление о ребенке или пророчество Родители героя Другие персонажи Завязка Рождение героя Рис. 1. Экспозиция волшебной сказки Для разных жанров развитие сюжета осуществляется в соответствии с разными моделями. Так, для жанра волшебной сказки характерна линейная схема из множества эпизодов. В случае сериалов модификация линейной схемы волшебной сказки состоит в том, что в каждом эпизоде могут участвовать произвольно выбранные персонажи. Детективная схема направлена на достижение цели и в рамках сюжета определяется последовательность обменов вещей между персонажами таким образом, чтобы главный герой, смог добиться своей цели (раскрытия преступления). Таким образом, уже в 80-х годах ХХ века в рамках исследований и разработок в области ИИ были заложены основы формального описания моделей текста различных жанров. Дальнейшее развитие теории пошло по пути создания моделей поведения персонажей и создания моделей конфликтных ситуаций. Среди работ первого направления, на наш взгляд, представляет интерес исследование Д.А. Поспелова и В.А. Шустер [Поспелов и др., 1980] по нормативному поведению в интеллектуальных системах и моделям поступков. В дальнейшем специалистами по ИИ, когнитивными психологами и структурными лингвистами самое серьезное внимание уделялось различным аспектам создания формальных моделей в гуманитарной сфере. Не имея возможности в данной работе рассмотреть даже наиболее известные из таких моделей, хотелось бы тезисно остановиться на тех отечественных работах, которые сформировали саму методологию построения моделей гуманитарного знания, предложили методы спецификации и анализа таких моделей, а также заложили основы создания инструментальных средств формирования пространств гуманитарных знаний. Важнейшим аспектам когнитивного моделирования в гуманитарной сфере посвящены работы недавно ушедшей из жизни Т.А. Таран [Таран, 2011] и работы В.К. Финна с сотрудниками [Михеенкова и др., 2006], где представлены исследования в области формальных моделей социологических явлений и процессов. Так, Т.А. Таран предложен специальный математический аппарат для когнитивного картирования «образа ситуации», а для создания когнитивных карт здесь использовались репертуарные решетки, обеспечивающие выявление представлений личности о себе, о мире и о взаимоотношениях с миром, и специальные средства представления данных решетки в виде графов. Логический подход к построению моделей социологических явлений и процессов развивается в научной школе В.К. Финна [Финн, 2004]. В частности, в работе [Михеенкова и др., 2006] предлагается формализация качественного анализа социологических данных на базе ДСМ-метода автоматического порождения гипотез. Таким образом, можно констатировать, что в настоящее время в результате фундаментальных и прикладных исследований в области ИИ уже сформирован достаточно представительный спектр формальных методов представления знаний в гуманитарной сфере. Вместе с тем, использование этих методов на практике тормозится отсутствием удобных для гуманитарного сообщества технологий и инструментария, где математически сложный аппарат был бы «экранирован» от экспертов-предметников адекватными интеллектуальными средствами формирования пространств гуманитарных знаний. На наш взгляд, решение этой важнейшей задачи лежит в области информационных технологий и онтологического инжиниринга, кратко представленных в оставшейся части настоящего раздела. Одним из прикладных направлений в области ИИ во второй половине ХХ века было направление «Экспертные системы», где важнейшей задачей была разработка методологий, методов и средств приобретения знаний. Оценивая результаты исследований и разработок в области формирования баз знаний для прикладных интеллектуальных систем в целом, можно констатировать, что именно здесь были заложены теоретические основы онтологического моделирования – направления, которое в настоящее время активно развивается в рамках построения пространств знаний в различных (в том числе, гуманитарных) областях. 1.3. Онтологический инжиниринг В области онтологического инжиниринга ведутся интенсивные работы в рамках десятков и даже сотен проектов [Ефименко и др., 2011а, 2011б; Гурьянова и др., 2011]. Одним из фундаментальных результатов исследований русской школы психологов, который представляет большой интерес для построения онтологических моделей гуманитарного знания, является теория активностей (теория деятельности) [Vygotsky, 1978; Leont'ev, 1978], в рамках которой предполагается, что в процессе деятельности предмет изменяет объект для генерации результата с помощью средств в контексте определенного сообщества с его правилами и разделением труда. Активные работы по развитию и использованию теории деятельности ведутся в Скандинавии [Engestrom, 1987], где разрабатываются методологии проектирования многоуровневых онтологий на базе контекстов. В подходе скандинавской (финской) школы выделяются 7 контекстных областей, из которых «получают» концепты для уточнения и интерпретации контекстных явлений – цель, лицо, действие, объект, возможность, место и время, а структурирование понятий внутри и между областями осуществляется по схеме 7S: for Some purpose, Somebody does Something for Someone, with Some means, Sometimes and Somewhere (с какой целью кто-то делает что-то для кого-то с помощью некоторых средств время от времени и в некотором месте). Значительный интерес для построения пространств гуманитарных знаний представляет и методология когнитивного моделирования, предназначенная для анализа и принятия решений в плохо определенных ситуациях, предложенная Р. Аксельродом [Axelrod, 1976] и основанная на моделировании субъективных представлений экспертов о ситуации и методах анализа ситуаций, а также ее развитие – технология конфайнмент-моделирования [Уиддет, Холлифорд, 2003], где общая модель компетенций выступает в качестве онтологии предметной области, а специальные модели рассматриваются как прикладные онтологии. В контексте настоящей статьи представляют интерес и результаты работ в кластере онтологического инжиниринга под руководством Т.А. Гавриловой в Санкт-Петербурге [Гаврилова, 2009], где в качестве базисной парадигмы методологии структурного анализа знаний и формирования поля знаний был предложен обобщенный объектно-структурный подход и алгоритм объектно-структурного анализа (ОСА) предметной области, позволяющего оптимизировать и упорядочить нестрогие процедуры структурирования знаний с дезагрегацией ПО на отдельные страты. В последнее время наблюдается значительное увеличение исследований в области решения проблем формирования пространств знаний, а основные исследования сосредоточены на разработке методологий и методов построения онтологий «с нуля» (from scratch, on fly); методах реинжиниринга онтологий (ontology reengineering); методах коллективной разработки онтологий (collaborative ontology development) и методах и методологиях объединения и выравнивания онтологий (ontology merging & alignment). 2. Гуманитарные технологии формирования пространств знаний В данном разделе доклада представлено обсуждение гуманитарных технологий как совокупности методов и средств, направленных на достижение целей и решение задач, специфицированных в работах Е.Н. Пенской, А.Г. Шмелева, Г.П. Щедровицкого [Пенская, 2006; Шмелев, 1982; Щедровицкий, 1995] и других исследователей, по сути дела, создавших само направление гуманитарных технологий и экспертной журналистики, а также активных практиков в данной области, интуитивно сформировавших работающие здесь техники, но так и не построивших адекватные модели, которые бы могли использоваться без их непосредственного участия. Заключение В чем же, по мнению автора, возможна синергия представленных в докладе результатов, полученных в компьютерных и гуманитарных науках? Ответ на вопрос «Что может дать онтологический инжиниринг гуманитарным технологиям?», как представляется, состоит в следующем: разработанные формальные модели и методы обеспечивают теоретический базис исследований и разработок в области создания пространств гуманитарных знаний; созданные в ИТ-сообществе инструментальные средства могут способствовать переходу от неформальных моделей гуманитарного знания к практической реализации пространств гуманитарных знаний. Представляется, что гуманитарные технологии являются ключевыми для онтологического инжиниринга в данной области, поскольку именно гуманитарные технологии могут обеспечить построение адекватного поля знаний в данной области; могут способствовать развитию новых моделей для пространств гуманитарных знаний, а также созданию новых методов и средств их использования в прикладных задачах. С учетом вышесказанного ответ на вопрос «Что будет, если эти направления начнут работать вместе?» представляется очевидным – это будет способствовать становлению и развитию нового перспективного и в фундаментальном, и в прикладном аспекте направления «Интеллектуальные системы в гуманитарной сфере». Литература [Гаврилова, 2009] Гаврилова Т.А. Инженерия знаний // В кн.: Инновационное развитие: экономика, интеллектуальные ресурсы, управление знаниями / Под ред. Б.З. Мильнера, М.: ИНФРА-М, 2009 [Гаазе-Рапопорт и др., 1980] Гаазе-Рапопорт М.Г., Поспелов Д.А., Семенова Е.Т. Порождение структуры волшебных сказок. /Научный совет по комплексной проблеме «Кибернетика». М., 1980, -20с. [Ефименко и др., 2011а] Ефименко И.В., Хорошевский В.Ф. Онтологическое моделирование экономики предприятий и отраслей современной России: Часть 1. Онтологическое моделирование: подходы, модели, методы, средства, решения (ч. 1). – М.: Изд. дом ВШЭ, 2011. – 76 с. [Гурьянова и др., 2011] Гурьянова М.А., Ефименко И.В., Хорошевский В.Ф. Онтологическое моделирование экономики предприятий и отраслей современной России: Часть 2. Мировые исследования и разработки: аналитический обзор (ч. 2). – М.: Изд. дом ВШЭ, 2011. – 88 с. [Ефименко и др., 2011б] Ефименко И.В., Хорошевский В.Ф. Онтологическое моделирование экономики предприятий и отраслей современной России: Часть 3. Российские исследования и разработки в области онтологического инжиниринга и бизнес-онтологий (ч. 3). – М.: Изд. дом ВШЭ, 2011. – 58 с. [Михеенкова и др., 2006] Михеенкова М.А., Финн В.К. Об одном варианте формализованного качественного анализа социологических данных. //Труды национальной конференции по искусственному интеллекту КИИ-2006, Тверь, 2006. [Пенская, 2006] Структуризация российской гуманитарной среды. Подходы к изучению. // Вопросы образования 2006, №4. [Поспелов и др., 1980] Поспелов Д.А., Шустер В.А. Нормативное поведение интеллектуальных систем. //Ученые записки Тартуского университета, -Тарту, 1980, Вып. 551. Логикосемантические вопросы искусственного интеллекта. -с. 92-103. [Таран, 2011] Таран Т.А. Искусственный интеллект и гуманитарные проблемы: конфликты, рефлексивные процессы, обучающие системы. Избранные труды. –К.: Просвiта, 2011. -224с. [Уиддет, Холлифорд, 2003] Уиддет С., Холлифорд С. Руководство по компетенциям // М.: Hippo, 2003. [Финн, 2004] Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта, 2004, № 3. [Шмелев, 1982] Шмелев А. Г. Введение в экспериментальную психосемантику: теоретикометодологические основания и психодиагностические возможности. — М., 1982. — 180 с. [Щедровицкий, 1995] Щедровицкий Г. П. Избранные труды. — М.: Шк.Культ.Полит., 1995. -800 с. [Axelrod, 1976] Axelrod R. The Structure of Decision: Cognitive Maps of Political Elites. Princeton University Press, 1976. [Benjamins, et al., 1999] Benjamins R., Decker S., Fensel D., Gomez-Perez A. “(KA)2: Building Ontologies for the Internet”: A Mid Term Report. International Journal of Human Computer Studies (IJHCS). 51(3). September 1999. [Engestrom, 1987] Engestrom Y. Learning by expanding: an activity theoretical approach to developmental research. Orienta-Konsultit, Helsinki, Finland(1987). [Heflin, et al., 1998] Heflin J, Hendler J, Luke S.: Reading Between the Lines: Using SHOE to Discover Implicit Knowledge from the Web. In: AAAI-98 Workshop on AI and Information Integration, 1998. [Leont'ev, 1978] Leont’ev, A. N. Activity, Consciousness, Personality. Englewood Cliffs, NJ, Prentice Hall. (1978). [Propp, 1968] Propp V., Morphology of the Folktale. //Austin: University of Texas Press. 1968. [Vygotsky, 1978] Vygotsky, L. S. Mind in society: The development of higher psychological processes. Cambridge, MA: Harvard University Press. xi, 159 p. 1978.