Правительство Российской Федерации Государственное образовательное бюджетное учреждение высшего профессионального образования ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ВЫСШАЯ ШКОЛА ЭКОНОМИКИ ПЕРМСКИЙ ФИЛИАЛ Программа дисциплины «Системы искусственного интеллекта» для направления 080700.62 – Бизнес-информатика Утверждена Учебно-методическим Советом ПФ ГУ-ВШЭ Одобрена на заседании кафедры Информационных технологии в бизнесе протокол _______________________________ Председатель_______________Володина Г.Е. Зав. кафедрой_______________Казаченко Т.А. «_______»_________________________2010 г. «______»__________________________2010 г. Пермь 2010 I. Пояснительная записка 1. Автор программы: E.Б. Замятина, к.ф.-м.н., доцент. 2. Требования к студентам. Основное требование к предварительному уровню подготовки – освоение «Базового курса» по информатике в объеме общеобразовательной школы. 3. Аннотация Искусственный интеллект – это область компьютерных наук, предназначенный для автоматизации разумного поведения. В настоящее время методы искусственного интеллекта получили широкое применения во многих областях науки и техники. Это объясняется тем, что методы искусственного интеллекта позволяют прогнозировать будущее развитие ситуаций, систем, процессов, событий. Методы искусственного интеллекта широко применяются в бизнесе, в экономике, при создании адаптируемого программного обеспечения, при создании обучающих тренажеров, в робототехнике, в системах распознавания образов и т.д. Курс разделён на две части. Цель первой части – изучить основы искусственного интеллекта, методы представления знаний, основы построения интеллектуальных систем. Цель второй части курса – рассмотреть основы создания систем распознавания образов, основные методы, применяемые при распознавании образов. 4. Учебная задача курса Учебная дисциплина «Системы искусственного интеллекта» предназначена для повышения уровня информационно-коммуникационной компетенции (ИКК) студентов посредством углубленного изучения теоретических основ систем искусственного интеллекта, освоения новых современных технологий построения интеллектуальных систем и применения полученных знаний и навыков на практике. Основные задачи дисциплины «Системы искусственного интеллекта» заключаются в следующем: - раскрыть содержание ключевых понятий и определений, используемых в теории и практике разработки и применения современных интеллектуальных систем и технологий; - дать обзор основных направлений исследований в области искусственного интеллекта (ИИ), что позволит студенту на практике увереннее ориентироваться в вопросах выбора подходящих технологий для решения конкретных задач из различных областей применения методов ИИ; - ознакомить с теоретическими основами проектирования и разработки систем, базирующихся на знаниях; - сформировать практические навыки по созданию и применению интеллектуальных систем и технологий. Полученные в результате освоения дисциплины знания необходимы при выполнении курсовых и дипломных проектов, при решении практических задач в сфере своей профессиональной деятельности в процессе реализации систем, интегрирующих традиционные подходы с подходами из области ИИ. Образовательные результаты В результате изучения курса студент должен овладеть основами методов искусственного интеллекта: Знать: - как моделировать базу знаний ЭС, используя продукционную, фреймовую, логическую модели представления знаний или модель знаний на семантических сетях; - как проводить сеанс консультации с экспертной системой; получать объяснения найденного решения; анализировать полученное решение; - алгоритмы, используемы в различных методах распознавания образов. 2 Уметь: - проектировать базы знаний, основанные на продукциях, семантических сетях, фреймах; - принимать решения о целесообразности выбора того или иного способа представления знаний; - выбирать наиболее эффективный метод распознавания образов в зависимости от способа представления и количества апостериорной и априорной информации. Иметь представление: - об основных технологиях решения задач на ЭВМ с использованием баз знаний и о сферах применения этих технологий; - о современном состоянии и тенденциях развития систем, базирующихся на знаниях; - о способах представления и использования знаний на основе логики предикатов первого порядка, фреймов, продукций и семантических сетей в экспертных системах и других программах искусственного интеллекта; - об онтологическом подходе к проектированию и разработке интеллектуальных информационных систем; - о сфере применения нейросетевых технологий и генетических алгоритмов; - о современных интеллектуальных Internet-технологиях и подходах к интеллектуальному анализу информационных ресурсов; - о роли и месте компьютерной лингвистики в разработке и применении интеллектуальных систем; - о технологиях распределенного искусственного интеллекта; Обладать навыками: - работы в среде оболочек экспертных систем продукционного типа; - разработки и создания индивидуальных экспертных систем под управлением оболочки экспертных систем продукционного типа GURU; - решения задач прогнозирования и распознавания образов с использованием технологий на базе искусственных нейронных сетей; - интеллектуального анализа информационных ресурсов с использованием программных средств класса Data Mining, Text Mining, Web Mining. Полученные знания могут быть применены в процессе изучения студентами других учебных дисциплин по современным информационным технологиям, а также в процессе работы над курсовыми и дипломными проектами. 5. Формы контроля: текущий контроль: согласно графику контрольных мероприятий выполняется домашнее задание. промежуточный контроль: выполнение заданий на практических занятиях. Итоговый контроль: зачет Итоговая оценка: складывается в соответствии с «Положением о рейтинге», принятом в ПФ ГУ ВШЭ. II. Содержание программы Раздел 1. Введение в искусственный интеллект Тема 1. Введение в искусственный интеллект, интеллектуальные системы и интеллектуальные технологии Основные направления исследований в области искусственного интеллекта. Нейросетевой подход к созданию интеллектуальных систем. Инженерия знаний. Понятие экспертной системы (ЭС). 3 Раздел 2. Введение в экспертные системы и технологию инженерии знаний Тема 2. Базы знаний База знаний – основная компонента экспертной системы. Отличия знаний от данных, базы знаний от базы данных. Архитектура ЭС. Отличия ЭС от традиционных программных систем. Основные типы решаемых задач и области применения ЭС. Тема 3. Инженерия знаний Технологии инженерии знаний. Классификация методов извлечения знаний. Примеры систем приобретения знаний. Представление нечетких знаний. Вывод в условиях неопределенности. Тема 4. Основные средства представления знаний и организация вывода в ЭС Представление знаний продукциями. Вывод в продукционных системах. Представление знаний фреймами. Технологические аспекты организации логического вывода на сети фреймов. Представление знаний семантическими сетями. Вывод на основе семантических сетей. Представление знаний на языке исчисления предикатов первого порядка. Логический вывод на основе метода резолюций. Представление и использование метазнаний. Интеграция различных способов представления знаний. Тема 5. Разработка и реализация ЭС Методология построения ЭС. Технология проектирования и разработки ЭС. Классификация инструментальных средств создания ЭС. Оболочки ЭС. Классификация оболочек ЭС. Обзор современного рынка ЭС и оболочек ЭС. Проблемы и перспективы развития ЭС. Тема 6. Интеллектуальные информационные системы Отличия знаний от простой информации. Информационный поиск, релевантность, критерий смыслового соответствия, критерий выдачи. Понятие интеллектуальной информационной системы (ИИС). Отличительные особенности ИИС по сравнению с традиционными ИС. Основные компоненты ИИС. Классификация ИИС. Роль интеллектуальных информационных технологий в системах поддержки принятия решений. Современные технологии проектирования и реализации ИИС. Извлечение знаний из данных. Системы и средства Data Mining и Knowledge Discovery. Онтологии и онтологические системы. Раздел 3. Распознавания образов Тема 7. Системы распознавания образов Введение в распознавание образов. История становления теории распознавания образов. Применение теории распознавания образов. Классификация систем распознавания образов. Понятие образа. Системы распознавания образов с обучением. Системы распознавания образов без обучения. Самообучающиеся системы распознавания образов. Особенности задач распознавания. Классификация задач распознавания изображений. Особенности задач распознавания изображений. Характерные признаки, используемые для распознавания изображений. Тема 8. Методы и алгоритмы распознавания образов Метод потенциалов. Особенности применения метода потенциалов. Способы кодирования изображений. Метод секущих. Графический и табличный способы распознавания образов с использование метода секущих. Лингвистический метод распознавания изображений. Особенности применения лингвистического метода распознавания образов. 4 Метод голосования. Опорные множества. Решающие правила. Интегральные оценки принадлежности образа к тому или иному классу. Факторы, влияющие на точность работы алгоритма голосования. Системы распознавания без учителя: метод К-средних, метод максимина. Раздел 4. Нейронные сети Тема 9. Введение в искусственные нейронные сети (ИНС) Общие положения теории искусственных нейронных сетей (ИНС). Применение ИНС. Топология ИНС. Архитектура ИНС. Применение ИНС в бизнес-информатике. Тема 10. Типы искусственных нейронных сетей. Многослойный персептрон. Алгоритмы обучения ИНС. Самоорганизующиеся сети Кохонена. III. Учебно-методическое обеспечение дисциплины 1. Литература: Базовый учебник: 1. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.: Питер, 2001. Основная: 1. Гаскаров Д.В. Интеллектуальные информационные системы. Учеб. для вузов. М.: Высш. шк., 2003. 2. Рассел, Стюарт. Искусственный интеллект. Современный подход/ С. Рассел, П. Норвиг ; [пер. с англ. и ред. К. А. Птицына],2006. Дополнительная: 1. Джексон П. Введение в экспертные системы: Учеб. пособие. М.: Изд. дом «Вильямс», 2001. 624 с. 2. Дюк В., Самойленко А. Data Mining: Учебный курс (+CD). СПб.: Питер, 2001. 3. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия; Телеком, 2002. 4. Люгер Дж. Искусственный интеллект: стратегии и методы решения сложных проблем. М.: Изд. дом «Вильямс», 2003. 5. Искусственный интеллект: В 3 кн.: Справ. изд. /Под. ред. Э.В.Попова. М.: Радио и связь, 1990. 6. Каллан Р. Основные концепции нейронных сетей. М.: Изд. дом «Вильямс», 2001. 7. Батищев Д. И. Генетические алгоритмы решения экстремальных задач. Учеб. пособие. Воронеж, 1995. 8. Борисов А.Н. и др. Обработка нечеткой информации в системах принятия решений. М.: Радио и связь, 1988. 9. Братко И. Программирование на языке ПРОЛОГ для искусственного интеллекта. М: Мир, 1990. 10. Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах / Под ред. В.Н. Вагина, Д.А. Поспелова. М.: ФИЗМАТЛИТ, 2004. 11. Вороновский Г.К., Махотило К.В., Петрашев С.Н., Сергеев С.А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. Харьков: ОСНОВА, 1997. 12. Гаврилова Г.А., Червинская К.Р. Извлечение и структурирование знаний для экспертных систем. М.: Радио и связь, 1992. 13. Денисов П.Н. Лексика русского языка и принципы ее описания. М.: Русский язык, 1993. 5 14. Логический подход к искусственному интеллекту: от классической логики к логическому программированию / А. Тейз, П. Грибомон, Г. Юлен, А. Пирот и др. М.: Мир, 1990. 15. Логический подход к искусственному интеллекту: от модальной логики к логике баз данных / А. Тейз, Ж. Луи, П. Грибомон, Д. Снайгерс и др. М.: Мир, 1998. 16. Марчук Ю.Н. Проблемы машинного перевода. М.: Наука, 1983. 17. Мендельсон Э. Введение в математическую логику. М. Наука, 1976. 18. Минский М. Фреймы для представления знаний. М.: Энергия, 1979. 19. Осуга С. Обработка знаний / Пер. с япон. В.И. Этова. М.: Мир, 1989. 20. Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энергоиздат, 1981. 2. Тематика заданий по различным формам текущего контроля: Приложение 1. Варианты домашних заданий по теме «Распознавание образов» Приложение 2. Тест по теме «Распознавание образов» Приложение 3. Планы семинарских занятий Приложение 4. Тематика домашних заданий. Приложение 5. Вопросы для самоконтроля студентов. 3. Методические рекомендации (материалы) преподавателю: На лекциях рекомендуется использовать мультимедийные презентации, иллюстрирующие материал. При этом студенты должны активно участвовать в обсуждении вопросов. На лабораторных занятиях используются следующие методы обучения и контроля усвоения материала: 1) выполнение лабораторных работ по теме занятия сопровождается контрольным опросом; 2) обсуждение различных вариантов решения, предложенных студентами, сравнение решений, анализ возможных ситуаций. Подробные методические рекомендации по выполнению лабораторных работ приведены в книгах, указанных в основном списке литературы по курсу. Рекомендуется передать студентам в электронном виде для подготовки к выполнению лабораторных работ не только тексты лекций, но и примеры выполнения работ, что позволит активизировать самостоятельную работу студентов, сэкономить время на разборе типовых стандартных ситуаций, большее внимание уделить индивидуальной работе со студентами. Для выполнения работ по изучению таких алгоритмов распознавания образов, как метод потенциалов, метод секущих плоскостей и лингвистический алгоритм распознавания образов студентам предлагается разделы электронного методического пособия: три программы, запуская которые студент может пошагово выполнить предлагаемые к изучению алгоритмы на конкретном примере. Справочная система программы включает не только руководство пользователя, но и подробное описание алгоритма. В приложении приводятся скриншоты электронного пособия, методический материал, включающий описание синтаксического (лингвистического) метода (приводится в разделе электронного пособия) и тесты. 4. Методические указания студентам: Студенту рекомендуется следующая схема подготовки к лабораторному занятию: 1) проработать конспект лекций; 2) проанализировать литературу, рекомендованную по изучаемому разделу; 3) проанализировать варианты решений, предложенные преподавателем; 4) при затруднениях сформулировать вопросы к преподавателю. 6 Подробные методические рекомендации по выполнению лабораторных работ приведены в книгах, указанных в основном списке литературы по курсу. 5. Рекомендации по использованию информационных технологий Все практические занятия проводятся в компьютерном классе. Программное обеспечение сети должно поддерживать 1) возможность доступа к материалам для подготовки, размещаемым на сервере; 2) возможность работы с Microsoft Office, Guru, Deductor Автор программы: _________________________________________ /E.Б. Замятина/ 7 № Наименование разделов и тем Лекции Семинарские или практические занятия Аудиторные часы Всего Самостоятельная работа IV. Тематический расчет часов по программе дисциплины «Системы искусственного интеллекта» для направления 080700.62 «Бизнес- информатика» Всего часов Введение в искусственный интеллект 1 Введение в искусственный интеллект, интеллектуальные системы и интеллектуальные технологии. Введение в экспертные системы и технологию инженерии знаний Базы знаний. Инженерия знаний. Основные средства представления 2 знаний и организация вывода в ЭС. Разработка и реализация ЭС. Интеллектуальные информационные системы. 1 2 3 3 6 6 4 10 10 20 5 5 11 10 21 2 2 4 3 7 28 26 54 Распознавания образов 3 Системы распознавания образов. Методы и алгоритмы распознавания образов. Нейронные сети Введение в искусственные нейронные 4 сети (ИНС). Типы искусственных нейронных сетей. Методы и системы распознавания образов. Всего: Автор программы: 14 14 __________________________________________ /E.Б. Замятина / 8 Приложение 1. Варианты домашних заданий по теме «Распознавание образов» Вариант 1 Образы: четырехугольники. Признаки: четыре длины сторон четырехугольника. Класс «маленький четырехугольник»: (2,2,2,2), (2,2,3,2), (2,3,2,2), (3,2,2,2), (3,3,2,2), (2,3,3,2), (3,2,3,2), (3,3,3,2), (2,2,2,3), (2,2,3,3), (2,3,2,3), (3,2,2,3), (3,3,2,3), (2,3,3,3), (3,2,3,3), (3,3,3,3). Класс «большой четырехугольник»: (9,9,9,9), (9,9,11,9), (9,11,9,9), (11,9,9,9), (11,11,9,9), (11,9,11,9), (9,11,11,9), (11,11,11,9), (9,9,9,11), (9,9,11,11), (9,11,9,11), (11,9,9,11), (11,11,9,11), (11,9,11,11), (9,11,11,11), (11,11,11,11). Класс «очень маленький четырехугольник»: (0.1,0.1,0.1,0.1). Вариант 2 Образы: книги. Признаки: количество страниц, количество картинок, количество таблиц, средняя длина слова. Класс «детская книга»: (200,50,0,4), (150,37,0,5). Класс «учебник»: (400,15,90,8), (500,3,105,7). Класс «журнал»: (80,200,5,6), (100,198,4,7). Вариант 3 Образы: погода на сутки (летом). Признаки: количество часов с дождем, количество солнечных часов, средняя температура воздуха, количество детей во дворе днем, скорость ветра. Класс «хорошая погода»: (0,17,25,15,2), (1,16,24,13,3), (1,17,23,15,2). Класс «плохая погода»: (20,0,18,1,7), (17,2,18,0,8), (18,1,19,2,7). Вариант 4 Образы: погода на сутки (зимой). Признаки: количество часов со снегом, количество солнечных часов, средняя температура воздуха, количество детей во дворе днем, скорость ветра. Класс «хорошая погода»: (0,13,-10,15,2), (1,12,-12,13,3), (1,13,-13,15,2). Класс «плохая погода»: (20,0,-21,1,8), (17,2,-24,0,9), (18,1,-23,2,8). Вариант 5 Образы: животные. Признаки: количество полосок, рост (см), длина хвоста (см). Класс «пчела»: (7,1,0), (8,2,0), (6,1,0). Класс «зебра»: (30,150,50), (35,160,60), (33,155,50). Класс «тигр»: (60,100,100), (70, 110,110), (55,100,110). Класс «муравей»: (0,0.5,0), (0,0.6,0). Вариант 6 Образы: одежда. Признаки: длина рукава, количество пуговиц, длина изделия. Класс «футболка»: (15,0,60), (20,0,70). Класс «рубашка»: (50,8,60), (60,9,60), (55,8,70). Класс «летняя рубашка»: (15,6,60), (20,8,70), (20,7,65). Класс «халат»: (15,9,120), (20,10,130), (25,9,115). 9 Вариант 7 Образы: школьники. Признаки: оценка по алгебре, оценка по геометрии, оценка по физике, оценка по истории, оценка по литературе, оценка по иностранному языку, оценка по физкультуре. Класс «отличник»: (5,5,5,5,5,5,5), (4,5,5,5,5,5,5), (5,4,5,5,5,5,5), (5,5,4,5,5,5,5), (5,5,5,4,5,5,5), (5,5,5,5,4,5,5), (5,5,5,5,5,4,5), (5,5,5,5,5,5,4). Класс «троечник»: (3,3,3,3,3,3,3), (4,3,3,3,3,3,3), (3,4,3,3,3,3,3), (3,3,4,3,3,3,3), (3,3,3,4,3,3,3), (3,3,3,3,4,3,3), (3,3,3,3,3,4,3), (3,3,3,3,3,3,4), (3,3,3,3,3,3,5). Класс «математик»: (5,5,5,3,3,3,4), (5,5,5,3,4,3,3), (5,5,5,4,3,3,4) (5,5,5,3,3,4,3), (5,5,5,3,4,4,3), (5,5,5,4,4,3,4) (5,5,5,4,3,4,3). Класс «гуманитарий»: (3,3,3,5,5,5,4), (3,4,3,5,5,5,3), (4,3,3,5,5,5,4), (3,3,4,5,5,5,3), (3,4,4,5,5,5,3), (4,4,3,5,5,5,4), (4,3,4,5,5,5,3). Вариант 8 Образы: ягоды. Признаки: количество семечек, радиус сечения (см), количество на одном растении. Класс «вишня»: (1,2,300), (1,1.5,400), (1,1,350). Класс «арбуз»: (50,20,1), (60,25,1), (40,21,1). Класс «облепиха»: (6,0.3,500), (8,0.2,550), (8,0.3,600). Класс «виноград»: (6,1,1500), (8,1.5,1400), (8,0.7,1700). Вариант 9 Образы: пятиугольники. Признаки: пять длин сторон пятиугольника. Класс «маленький пятиугольник»: (2,2,2,2,2), (2,2,3,2,2), (2,3,2,2,3), (3,2,2,2,3), (3,3,2,2,2), (2,3,3,2,3), (3,2,3,2,2), (3,3,3,2,3), (2,2,2,3,2), (3,3,3,3,3). Класс «большой пятиугольник»: (9,9,9,9,9), (9,9,11,9,11), (9,11,9,9,9), (11,9,9,9,11), (11,11,9,9,9), (11,9,11,9,11), (9,11,11,9,9), (11,11,11,9,9), (11,11,11,11,11). Класс «очень маленький пятиугольник»: (0.1,0.1,0.1,0.1,0.1). Вариант 10 Образы: треугольники. Признаки: три длины сторон треугольника. Класс «маленький треугольник»: (2,2,2), (2,2,3), (2,3,2), (3,2,2), (3,3,2), (2,3,3), (3,2,3), (3,3,3). Класс «большой треугольник»: (9,9,9), (9,9,11), (9,11,9), (11,9,9), (11,11,9), (11,9,11), (9,11,11), (11,11,11). Класс «очень маленький треугольник»: (0.1,0.1,0.1). Задание №2. Используя алгоритмы: Максимина К-средних выполнить кластеризация образов (Варианты 1-10). Задание 2. Реализовать метод К-средних, минимакса (вариант-1-10) Задание 3. Реализовать метод голосования (вариант-1-10). 10 Приложение 2. Тест по теме «Распознавание образов» 1) Что не является образом? a) Структурированное, приближенное, частично определенное описание изучаемого объекта b) Система преобразований, направленная на извлечение из изображения информации о свойствах объекта c) Набор признаков (a1, a2 … an), представленных в виде вектора d) Высказывание, которое порождается грамматикой и порождает класс e) Некоторая сущность, противостоящая хаосу 2) Чем сложная система распознавания образов отличается от простой? a) Наличием нескольких уровней получения апостериорной информации b) Большим количеством априорной информации c) Разнородностью признаков d) Длительностью времени, затраченного на разработку системы 3) По языку признаков, на котором описаны распознаваемые объекты, все системы распознавания делятся на: a) Детерминированные, логические, стохастические b) Детерминированные, стохастические, структурные c) Детерминированные, стохастические, структурные, комбинированные d) Все вышеперечисленные 4) Соотнесите формулы нахождения расстояния между векторами и их названия. p a) Евклидово расстояние 1. d ( xi , x j ) | xi( k ) x (jk ) | k 1 b) Взвешенное евклидово расстояние c) Расстояние по Хэммингу d) Метрика «городских кварталов» 2. d ( xi , x j ) max | xi( k ) x (jk ) | k 3. d ( xi , x j ) p (x (k ) i k 1 x (jk ) ) 2 4. d ( xi , x j ) ( xi x j ) ( xi x j )T 1 e) Расстояние по Махаланобису 5. d ( xi , x j ) p w (x k 1 k (k ) i x (jk ) ) 2 а3 b5 c1 d2 e4 5) Соотнесите названия формул определения расстояния между группами с их описаниями a) «Ближайший сосед» 1. Расстояние между группами равно среднему арифметическому всевозможных попарных расстояний b) Центры тяжести 2. Расстояние между группами равно расстоянию между ближайшими объектами из этих групп c) «Дальний сосед» 3. Расстояние между группами равно расстоянию между самыми дальними объектами из этих групп d) Среднее арифметическое 4. Расстояние между группами равно расстоянию между их математическими ожиданиями a2 b4 c3 d1 6) В каком из высказываний о моделях распознавания образов допущена ошибка? a) Р-модели основаны на принципах разделения b) С-модели используют аппарат математической статистики c) П-модели построены на принципе частичной прецедентности d) Г-модели основаны на вычислении оценок, голосовании 11 e) Л-модели основаны на исчислении высказываний, в частности, на аппарате алгебры логики 7) Идея метода потенциальных функций состоит в … a) Определении вероятности принадлежности объекта классам b) Построении монотонно убывающей функции c) Выборе из заданного класса поверхностей некоторого набора d) Анализе электрических явлений 8) Что приведет к возникновению ошибок при работе метода потенциальных функций? a) Неравномерное распределение точек между областями b) Слишком большое количество точек c) Слишком малое количество точек 9) Упорядочите этапы метода секущих плоскостей a) Распознавание объектов b) Исключение лишних плоскостей c) Проведение секущих плоскостей d) Исключение лишних кусков плоскостей cbda 10) При использовании статистических алгоритмов ошибкой первого рода называется: a) Ошибочное отнесение объекта к классу b) Отнесение объекта второго класса к первому классу c) Отнесение объекта первого класса ко второму классу d) Невозможность отнести объект к какому-либо классу 11) Применение какого критерия целесообразно в том случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов или явлений в условиях неизменного признакового пространства, стабильного описания классов и неизменной платежной матрицы? (выберите наилучший вариант) a) Байесовского критерия b) Минимаксного критерия c) Критерия Неймана-Пирсона d) Ни один из вышеперечисленных 12) Выбор терминальных символов и разработка правил подстановки являются проблемами при использовании для распознавания изображений… a) Метода потенциальных функций b) Статистических методов c) Метода секущих плоскостей d) Лингвистического подхода Приложение 3. Рекомендации преподавателю по проведению занятий по теме «Распознавание образов». Содержание электронного пособия по теме «Лингвистический метод распознавания образов» Описание метода Синтаксический метод заключается в использовании для структурного и синтаксического анализа изображений методов формальной лингвистики, предназначенных для анализа естественного языка. В качестве примера разберем рассмотрим простое предложение S=MARK # PAINTED # THE # PICTURE где # обозначает пробел. Для написания этого предложения используются следующие терминальные символы: T={ MARK, PAINTED, THE, PICTURE, #} Набор нетерминальных символов определяется следующим образом: N={<Предложение>,<Группа существительного>, <Глагольная <Существительное>, <Глагол>, <Артикль>} группа>, 12 Нетерминальные символы участвуют в составлении предложений, но не входят в окончательный результат. Предложение строится с помощью набора правил подстановки. В данном случае они таковы. <Предложение> = <Группа существительного> # <Глагольная группа> <Группа существительного> = <Существительное> <Группа существительного> = <Артикль> # <Существительное> <Глагольная группа> = <Глагол> # <Группа существительного> <Существительное> = MARK <Существительное> = PICTURE <Глагол> = PAINTED <Артикль> = THE Синтаксический метод анализа цепочки букв алфавита для проверки ее правильности можно применить и к анализу изображений. При распространении синтаксического подхода на двумерные объекты возникают трудности. Во-первых, отсутствуют очевидные принципы выбора простых терминальных элементов. Во-вторых, двумерность изображения порождает затруднения при разработке правил подстановки. При разборе изображений требуется большое количество терминальных символов. С увеличением числа символов растет набор правил подстановки. Значительные трудности при решении этих проблем ограничили возможность использования синтаксических методов анализом изображений, имеющих простую структуру. Существует язык описания изображений PDL, основанный на синтаксических понятиях. В этом языке терминальные символы представлены отрезками линий, которые имеют метки “Голова” ”Хвост”. Эти отрезки связываются простыми операторами: (А+В) голова А присоединена к хвосту В (А В) хвост А присоединен к хвосту В (А*В) голова А присоединена к голове В, а хвост А присоединена к хвосту В ( A ) обозначение головы и хвоста в обратном порядке. N NE E SE Терминальные символы W = (((SE+NE)+SE)+NE) E = ( E +N)+(E (N+E)) Мы будем использовать некоторую модификацию этого метода. Будем строить поточечный обход исходного изображения и кодировать этот обход некоторым образом. Обход будем начинать с самой левой нижней точки изображения. Для точки ищутся соседи, т.е. точки, принадлежащие изображению, а не фону. Соседние точки просматриваются по ходу часовой стрелки. Затем осуществляется переход на найденного соседа. Если сосед находится вверху, то переход кодируется 1, по диагонали вверху справа -2, справа – 3, по диагонали снизу справа – 4 и т.д. до 8. Если у точки несколько соседей, то переход осуществляется на первую, а остальные заносятся в 13 список точек, на которые нужно вернуться. В результате мы получим некоторый код. После его упрощения и сравнения с образцами известных образов можно сделать вывод о принадлежности изображения какому-то образу. Реализация метода. Ниже представлено основное окно программы. Окно программы. В области “Изображение” показывается текущее распознаваемое изображение. В эту область можно загружать готовые изображения букв с помощью кнопки “Открыть изображение”. После загрузки изображения и нажатия кнопки “Анализ” программа начинает первый этап. При включенном переключателе “Показывать обход” будет показан обход изображения при анализе. В поле “Комментарий” помещается пояснение текущего этапа. Итог анализа в виде цепочки цифр помещается в поле “Результат анализа”.С помощью кнопок “Назад” и ”Далее” можно перемещаться по цепочке объяснений. Первый этап обучения. 14 С помощью кнопок “Назад” и ”Далее” можно перемещаться по цепочке объяснений. После нажатия кнопки “Упрощение” начинается второй этап. На нем укорачивается цепочка цифр, полученная на первом этапе. Содержание поля “Комментарий ” автоматически меняется. Итог помещается в поле “Результат упрощения”. Второй этап обучения. После нажатия кнопки “Грамматика” начинается третий этап. Изображение представляется в виде символьного выражения, которое сравнивается с образцом. В поле “Результат” помещается название распознанной буквы. В поле “Комментарий” помещаются необходимые пояснения. 15 После того, как студенты прослушают лекции по теме «Обучение с учителем», выполнят практические индивидуальные задания, целесообразно провести контрольное мероприятие. Ниже приводятся примеры тестов для проведения контрольного мероприятия по теме: Обучение с учителем. Синтаксический метод распознавания образов. Примеры тестовых заданий и упражнений по теме “Синтаксический метод” 1)Какой получится цепочка обхода в результате анализа изображения на рисунке 1? а) (321111187655555). б) (1111123455555567). в) (112233)(445566). г) (1111112334555555677). рис.1 2) Какой получится цепочка обхода в результате анализа изображения на рисунке 2? а) (111111234)(332). б) (332)(111111234). в) (32)(111111234). г) (11111234)(332). рис. 2 3) Перечислите этапы синтаксического метода по порядку? а) Грамматическое представление. б) Анализ. в) Упрощение. 4) Какой сосед текущей точки будет браться в первую очередь? а) выбирается случайным образом. б) первый при обходе против часовой стрелке. в) первый при обходе по часовой стрелке. 5) Что нужно делать, если в текущей точке возможно разветвление и список точек возврата не пуст? а) продолжать обход с этой точки, запомнив ее в списке возврата. б) добавить ее в конец список возврата и продолжать обход с точки-головы списка. в) продолжать обход, ничего не запоминая. 16 Приложение 3. Планы семинарских занятий Раздел 2. Тема 2. Практические занятия по разработке экспертных систем Разработать демонстрационную экспертную систему в среде оболочки ЭС GURU для некоторой выбранной проблемной области. В процессе выполнения задания студент, используя продукционную модель представления знаний; должен спроектировать, заполнить и отладить базу знаний ЭС, разработать дружественный пользовательский интерфейс; реализовать интерфейс оболочки ЭС с базой данных и ASCII-файлами, содержащими набор вопросов, задаваемых пользователю во время консультации, и список возможных ответов. Последнее необходимо для предоставления пользователю возможности не набирать ответ на клавиатуре, а выбирать его из предлагаемого списка возможных ответов. Во время сдачи задания студент должен провести сеанс консультации с экспертной системой и проанализировать полученный результат. Примерный вид вариантов заданий: 1. разработать демонстрационную ЭС по подбору комплектации персонального компьютера с учетом вида профессиональной деятельности пользователя, необходимого ему программного обеспечения, хобби и приемлемого диапазона цен; 2. разработать демонстрационную ЭС по выбору места отдыха с учетом количества спутников, времени года, типа отдыха, показателей здоровья, диапазона цен и т.п. Раздел 5. Тема 7. Практические занятия по методам распознавания образов Примерный вид задания: 1. Даны набор признаков и несколько классов. Используя метод голосования, отнести образ к одному из классов. Варианты заданий приведены в приложении Тема 3. Практические занятия по ИНС Освоить работу с ИНС в среде системы Deductor и исследовать демонстрационные примеры решения задач прогнозирования на основе ИНС. Используя имеющиеся в Pathfinder тестовые наборы данных и,подготовив в среде Microsoft Excel собственные тесты, построить и обучить ИНС для решения некоторой задачи прогнозирования. Например, можно решить демонстрационную задачу предсказания для некоторой электрической компании ежедневного пикового спроса на электричество. Необходимо подобрать тестовые примеры входных данных для обучающей выборки, провести серию экспериментов с топологией нейронной сети и объяснить полученные результаты. 17 Приложение 4. Тематика домашних заданий. Домашнее контрольное задание по проектированию баз знаний. Дано словесное описание проблемной области. Необходимо выполнить этапы идентификации, концептуализации, формализации базы знаний, выбрать и обосновать предлагаемый алгоритм логического вывода в рамках следующих основных парадигм представления знаний: 1. продукционной (описание базы знаний должно быть выполнено на языке представления знаний оболочки GURU); 2. фреймовой (необходимо привести описание базы знаний в виде графа со структурированными вершинами); 3. логической (описание базы знаний должно быть выполнено на языке исчисления предикатов первого порядка); 4. на семантических сетях (необходимо привести описание базы знаний в графическом виде). 18 Приложение 5. Вопросы для самоконтроля студентов. По экспертным системам 1. Чем отличаются такие понятия как данные, информация, знания? 2. В чем заключаются основные отличия баз знаний от баз данных? 3. Для каких целей разрабатываются ЭС? 4. Как связаны понятия ЭС и инженерия знаний? 5. В чем разница между формализованными и не формализуемыми (слабо формализуемыми) задачами? 6. Какова основная цель прототипирования экспертных систем? 7. Что нужно учитывать для обоснования выбора методов инженерии знаний для решения конкретной задачи? 8. Когда разработка ЭС возможна? 9. Когда разработка ЭС оправдана? 10. Когда методы инженерии знаний соответствуют решению задачи? 11. Какова основная цель прототипирования ЭС? 12. В чем заключаются основные преимущества и недостатки представления знаний продукциями? 13. В чем заключаются основные преимущества и недостатки представления знаний фреймами? 14. В чем заключаются основные преимущества и недостатки представления знаний семантическими сетями? 15. В чем заключаются основные преимущества и недостатки представления знаний на языке исчисления предикатов первого порядка? 16. Чем отличаются универсальные оболочки ЭС от настраиваемых? 17. Что такое «онтология» и как это понятие соотносится с понятием «метазанние»? 18. Чем отличается интеллектуальная информационная система от традиционной ИС? 19. Какие задачи решаются с привлечением методов КЛ? 20. Какие методы ИИ используются для решения основных задач КЛ? 21. Что такое ИНС и что понимается под топологией ИНС? 22. Какие типы задач решаются на основе нейросетевых технологий? 23. Что понимается под обучением ИНС? 24. Что такое ГА и какие типы задач решаются с использованием ГА? 25. Какие проблемы современных Internet-технологий могут быть решены с использованием методов ИИ? 26. Какие задачи решают системы класса Data Mining, Text Mining, Web Mining? 27. Какие вы знаете примеры применения технологии ИНС для решения задач компьютерной безопасности? 19