Представление знаний в информационных системах Спицын В.Г Томский политехнический университет E-mail: spvg@tpu.ru http://portal.main.tpu.ru/SHARED/s/SPV/teach work Лекция 1 СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХ • • • • • • • Введение История создания искусственного интеллекта Процесс мышления Основные понятия и классификация систем, основанных на знаниях Экспертные системы как элемент искусственного интеллекта Методы извлечения знаний Литература 2 Введение В первой лекции рассматриваются: • история возникновения систем искусственного интеллекта, • процесс мышления человека, • системы, основанные на знаниях, • методы извлечения знаний. 3 1. История создания искусственного интеллекта Появление искусственного интеллекта (ИИ) как научного направления произошло после создания ЭВМ в 40-х годах XX в. [1-3]. В это время Норберт Винер создал свои основополагающие работы по кибернетике. Вскоре произошло разделение его на два направления: “нейрокибернетика” и кибернетика “черного ящика”. 4 Этапы развития ИИ • Нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. • Основной принцип кибернетики “черного ящика” заключается в том, что не имеет значения как построено “мыслящее” устройство. Требуется, чтобы на заданные входные воздействия оно реагировало так же, как и человеческий мозг. • В США в середине 1970-х годов на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. Появились первые коммерческие системы, основанные на знаниях, или экспертные системы. 5 2. Процесс мышления • Процесс мышления, протекающий в человеческом сознании, чрезвычайно сложен [4]. • Одна ячейка человеческого глаза способна выполнять за 10 мс обработку, эквивалентную решению системы из 500 нелинейных дифференциальных уравнений. • Глаз человека насчитывает не менее 10 миллионов ячеек, компьютеру Cray-1 необходимо затратить по меньшей мере 100 лет, чтобы воспроизвести процессы, происходящие ежесекундно в человеческом глазу. 6 Обработка и анализ информации • Данные из внешнего мира воспринимаются человеком с помощью одного из органов чувств и затем помещаются в буфер кратковременной памяти для анализа [4]. • В долговременной памяти хранятся символьные образы и смысловые связи между ними, которые используются для объяснения новой информации, поступающей из кратковременной памяти. • Большие объемы данных постоянно записываются в кратковременную память, и мы непрерывно анализируем и фильтруем получаемую информацию для того, чтобы определить степень ее важности и то, как она соотносится с образами, хранящимися в долговременной памяти 7 Система обработки информации у человека [4] 8 Доступ к информации • Доступ к информации в долговременной памяти осуществляется достаточно эффективно. Любой элемент данных может быть извлечен в течение цикла обработки продолжительностью не более 70 мс и затем преобразован [4]. • Перемещение данных из кратковременной памяти в долговременную память занимает приблизительно 15–20 минут. • Если человек в получил мозговую травму, то долговременная память может восстановиться. Однако вся информация, поступившая в течение 15–20 минут до катастрофы, будет потеряна и никогда не восстановится. 9 Соответствие между памятью человека и ЭВМ • Можно провести аналогию между кратковременной памятью человека и оперативной памятью ЭВМ, для которой отключение электропитания означает полное уничтожение всех данных [4]. • Долговременная память человека похожа на дисковую память ЭВМ. В долговременной памяти образы существуют в виде циркулирующих электрохимических импульсов и физических нейронных взаимодействий. 10 Способ хранения символьных образов • Способ хранения символьных образов в долговременной памяти во многом схож со способом хранения числовой информации в базах данных сетевого типа. • Человеческая память хранит не числовые данные,, а образы или символы. • В памяти существует система указателей, позволяющая нам быстро извлечь любой нужный символ и все данные, которые с ним связаны [4]. 11 Символьные образы • Символьные образы в мозге человека объединены в чанки – наборы фактов и связей между ними, запомненные и извлекаемые как единое целое. • Чанки хранятся совместно с взаимосвязями между ними. В каждый момент времени человек может обрабатывать и интерпретировать не более четырех-семи чанков. 12 Способность формировать чанки • Эксперт развивает свою способность объединять в чанки большие объемы данных и устанавливать иерархические связи между ними для того, чтобы быстро извлекать эти данные из памяти и с их помощью распознавать новые ситуации по мере поступления информации о них в мозг. • Средний специалист в конкретной предметной области помнит от 50 000 до 100 000 чанков, которые могут быть использованы для решения той или иной проблемы. • Их накопление в памяти человека и построение указателей для такого объема данных требуют от 10 до 20 лет. 13 3. Основные понятия и классификация систем, основанных на знаниях • Искусственный интеллект ориентирован на создание методов дублирования функций живых интеллектуальных систем искусственными системами. • Технология разработки интеллектуальных программных средств основана на том, что знания о решении задач отделяются от программ и реализуются в виде базы знаний, а в программах реализуется алгоритм манипулирования этими знаниями. • Этот алгоритм называют механизмом логического вывода. 14 Виды знаний • К знаниям относят информацию о логике решения задач, а к данным – информацию, которая должна быть проанализирована в соответствии с этой логикой. • Знания, которыми обладает специалист в какойлибо предметной области, можно разделить на формализованные и неформализованные знания. • Формализованные знания формулируются в виде общих и строгих суждений (законов, формул, моделей и алгоритмов), отражающих универсальные знания. • Неформализованные знания отличаются конкретностью, субъективностью и 15 приблизительностью. Особенности экспертных систем • Экспертные системы отличаются от традиционных программ тем, что ориентированы на решение неформализованных задач. • Основными особенностями ЭС являются: • алгоритм решения неизвестен заранее, а строится самой системой с помощью символических рассуждений, базирующихся на эвристических приемах; • способность анализа и объяснений своих действий и знаний; • способность приобретения новых знаний от пользователя – эксперта, не знающего программирования, и изменения в соответствии с ними своего поведения. 16 • Экспертные системы представляют собой класс компьютерных программ, которые выдают советы, проводят анализ, выполняют классификацию и ставят диагноз. • Они ориентированы на решение задач, обычно требующих проведения экспертизы человеком-специалистом. • В отличие от машинных программ, использующих процедурный анализ, ЭС решают задачи в узкой предметной области на основе дедуктивных суждений. 17 Классификация ЭС по решаемой задаче • • • • • • • • • Интерпретация. Диагностика. Мониторинг (наблюдение). Прогнозирование. Планирование. Проектирование. Обучение. Контроль и управление. Поддержка принятия решений. 18 4. Экспертные системы как элемент искусственного интеллекта • Задачей ИИ является воссоздание с помощью искусственных устройств разумных рассуждений и действий. • При этом возникают трудности двух типов: • В большинстве случаев, выполняя какие-то действия, мы сами не осознаем, как мы это делаем. Нам неизвестен точный способ (или алгоритм), как именно происходит понимание текста, узнавание лица, решение задач. • ЭВМ априори далеки от человеческого уровня компетентности: до начала любой их работы необходимо составить соответствующие программы. Однако в действительности языки программирования дают возможность выражать только элементарные понятия. 19 Применение ЭС позволяет • при проектировании интегральных микросхем повысить производительность труда в 5 раз, при этом выполнение некоторых операций ускоряется в 10 раз; • ускорить поиск неисправностей в 7 раз; • повысить производительность труда программистов в 5 раз; • при профессиональной подготовке сократить в 10 раз время на индивидуальную работу с обучаемым персоналом. 20 Система PROSPECTOR • Предназначена для выдачи геологам следующей информации: • о наличии в анализируемой местности залежей полезных ископаемых; • об оценке геологических ресурсов района, о выборе мест, благоприятных для бурения. • Система создана фирмой SRI International. Трудозатраты на создание системы оцениваются в 30 человеко-лет, система достигла промышленной стадии. • База знаний (БЗ) системы содержат свыше 1000 правил и включают классификацию более 1000 геологических понятий. 21 Онтологии • Развитие систем искусственного интеллекта и экспертных систем привело к появлению специальности инженера по онтологии. • Под онтологией в данном случае понимается явная формальная спецификация терминов проблемной области и отношений между ними. • Другими словами, онтологию можно представить как стандартный, согласованный набор терминов, применяемых для описания определенной прикладной области. 22 5. Извлечение знаний • Можно выделить три основных аспекта извлечения знаний: • психологический, • лингвистический и • гносеологический. • Из них психологический аспект является ведущим, так как он определяет эффективность взаимодействия инженера по знаниям и эксперта. 23 Потери информации • При разговорном общении велики потери информации. • В связи с этим представляет интерес увеличение информативности общения аналитика и эксперта за счет применения психологических знаний. 24 Потери информации при разговорном общении 25 Число Ингве–Миллера • На успех беседы влияет длина фраз. Установлено, что человек лучше всего воспринимает предложения с длиной 7+/-2 слова (число Ингве–Миллера). • Опытные лекторы, используя короткие фразы в лекции, сводят потерю информации до 3 %. • Несоблюдение этого принципа может приводить к потере до 20–30 % информации. 26 Лингвистический аспект извлечения знаний • Лингвистический аспект извлечения знаний относится к исследованиям возникающих при этом языковых проблем. • Различие языков, на которых говорят эксперт и аналитик, обусловливает возникновение языкового барьера между ними. • Эти два языка являются отражением “внутренней речи” эксперта и аналитика. • Психологи и эксперты полагают, что язык является основным средством мышления. 27 Гносеологический аспект • Гносеологический аспект извлечения знаний связан с теорией отражения действительности в сознании человека. • При этом вначале действительность отображается в сознании эксперта. Затем опыт эксперта интерпретируется сознанием инженера по знаниям. • Далее происходит построение третьей интерпретации в виде поля знаний экспертной системы 28 Классификация методов извлечения знаний 29 СПИСОК ЛИТЕРАТУРЫ 1. Гаврилова Т.А. , Хорошевский В.Ф. Базы знаний интеллектуальных систем. – Санкт-Петербург: Питер, 2000. – 382 с. 2. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. – М.: Нолидж, 2000. – 352 с. 3. Змитрович А.И. Интеллектуальные информационные системы. – Минск: Тетра Системс, 1997. – 367 с. 4. Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ / пер. с англ. – М.: Финансы и статистика, 1990. – 320 с. 5. Спицын В.Г., Цой Ю.Р. Представление знаний в информационных системах: Учебное пособие. – Томск: Изд-во ТПУ, 2008. – 152 c. 6. Джарратано Д., Райли Г. Экспертные системы: принципы разработки и программирования / пер. с англ. – М.: Издательский дом “Вильямс”, 2007. – 1152 c. 7. Дюк В., Самойленко А. Data Mining. – Санкт-Петербург: Питер, 2001. – 368 с. 30