накопленного опыта - Российская ассоциация искусственного

реклама
МЕХАНИЗМЫ ПРАВДОПОДОБНЫХ РАССУЖДЕНИЙ НА ОСНОВЕ ПРЕЦЕДЕНТОВ
(НАКОПЛЕННОГО ОПЫТА) ДЛЯ СИСТЕМ ЭКСПЕРТНОЙ ДИАГНОСТИКИ*
П.Р. Варшавский1
Исследуются механизмы правдоподобных рассуждений на основе прецедентов
(накопленного опыта) для интеллектуальных систем поддержки принятия решений
(ИСППР) и систем экспертной диагностики сложных технических объектов. Для
реализации извлечения прецедентов из библиотеки прецедентов (БП) системы
рассматривается возможность использования различных метрических алгоритмов и
учета коэффициентов важности параметров объекта.
Введение
Тематика работы тесно связана с актуальной проблемой в области искусственного
интеллекта и конструирования перспективных интеллектуальных (экспертных) систем –
проблемой моделирования человеческих рассуждений (рассуждений «здравого смысла»).
Следует
отметить,
что
в
современных
и
дорогостоящих
зарубежных
средствах
конструирования интеллектуальных (экспертных) систем (G2, RTworks и др.) практически
отсутствуют развитые средства, реализующие механизмы правдоподобных рассуждений,
которые способны обеспечить работу системы в условиях неопределенности как в исходной
информации, получаемой от объекта управления и среды, так и в экспертных знаниях. Наличие
подобных механизмов рассуждений (индуктивных, абдуктивных, нечетких, аргументации, на
основе аналогий и прецедентов [Вагин и др., 2004]) в системах экспертной диагностики и
поддержки принятия решений позволяет своевременно осуществлять диагностирование
проблемной ситуации на объекте и дает возможность лицам, принимающим решения (ЛПР),
принимать более адекватные и экономически выгодные управляющие воздействия на объект
управления с целью нормализации проблемной ситуации [Геловани и др., 2001].
В работе основное внимание уделяется правдоподобным рассуждениям на основе
прецедентов (накопленного опыта), активно применяемым в диагностических системах
(медицинской диагностике, диагностике спутникового оборудования и т.д.), в юриспруденции,
экспертных системах и системах машинного обучения. Рассматривается возможность
использования различных метрических алгоритмов для извлечения прецедентов из БП системы
и учета коэффициентов важности параметров объекта, задаваемых экспертом.
Работа выполнена при финансовой поддержке РФФИ по проекту № 08-01-00437 и гранту Президента РФ для
поддержки молодых российских ученых (МК-6009.2008.9)
1
111250, Москва, ул. Красноказарменная 14, МЭИ (ТУ), VarshavskyPR@mpei.ru
*
1. Рассуждения на основе прецедентов
В большинстве энциклопедических источников прецедент определяется как случай,
имевший место ранее и служащий примером или оправданием для последующих случаев
подобного рода. Вывод на основе прецедентов (CBR – Case-Based Reasoning) является
подходом, позволяющим решить новую задачу, используя или адаптируя решение уже
известной задачи. Как правило, такие методы рассуждений включают в себя четыре основных
этапа, образующие так называемый цикл рассуждения на основе прецедентов или CBR-цикл
[Aamodt et al., 1994].
К преимуществам рассуждений на основе прецедентов можно отнести следующие
аспекты:
− Возможность напрямую использовать опыт, накопленный системой без интенсивного
привлечения эксперта в той или иной предметной области;
− Возможность сокращения времени поиска решения поставленной задачи за счет
использования уже имеющегося решения для подобной задачи;
− Существует возможность исключить повторное получение ошибочного решения;
− Отсутствует необходимость полного и углубленного рассмотрения знаний о конкретной
предметной области;
− Возможно применение эвристик, повышающих эффективность решения задач.
К недостаткам рассуждений на основе прецедентов можно отнести следующее:
− При описании прецедентов обычно ограничиваются поверхностными знаниями о
предметной области;
− Большое количество прецедентов может привести к снижению производительности
системы;
− Проблематичным
является
определение
критериев
для
индексации
и
сравнения
прецедентов;
− Проблемы с отладкой алгоритмов определения подобных (аналогичных) прецедентов;
− Невозможность получения решения задач, для которых нет прецедентов или степень их
сходства (подобия) меньше заданного порогового значения.
Основная цель использования аппарата прецедентов в рамках ИСППР и, в частности, систем
экспертной диагностики сложных технических объектов заключается в выдаче готового
решения ЛПР (оператору) для текущей ситуации на основе прецедентов, которые уже имели
место в прошлом при управлении данным объектом или процессом.
На первом этапе CBR-цикла выполняется определение степени сходства текущей ситуации с
прецедентами из БП системы и последующее их извлечение с целью разрешить новую
проблемную ситуацию, сложившуюся на объекте.
2. Методы извлечения прецедентов
Для успешной реализации рассуждений на основе прецедентов необходимо обеспечить
корректное извлечение прецедентов из БП системы экспертной диагностики. Выбор метода
извлечения прецедентов напрямую связан со способом представления прецедентов и
соответственно со способом организации БП.
Основные способы представления прецедентов можно разделить на следующие группы:
−
параметрические;
−
объектно-ориентированные;
−
специальные (в виде деревьев, графов, логических формул и т.д.).
В
большинстве
случаев
для
представления
прецедентов
достаточно
простого
параметрического представления, т.е. представления прецедента в виде набора параметров с
конкретными значениями и решения (диагноз по проблемной ситуации и рекомендации ЛПР):
CASE(x1, x2, … , xn, R),
где x1…xn – параметры ситуации, описывающей данный прецедент (x1  X1, x2  X2,…,xn  Xn),
R – диагноз и рекомендации ЛПР, n – количество параметров прецедента, а X1, … , Xn – области
допустимых значений соответствующих параметров прецедента.
Существует целый ряд методов извлечения прецедентов и их модификаций:
1) Метод ближайшего соседа (NN – Nearest Neighbor). Это самый распространенный метод
сравнения и извлечения прецедентов. Он позволяет довольно легко вычислить степень сходства
текущей проблемной ситуации и прецедентов из БП системы. С целью определения степени
сходства на множестве параметров, используемых для описания прецедентов и текущей
ситуации, вводится определенная метрика. Далее в соответствии с выбранной метрикой
определяется расстояние от целевой точки, соответствующей текущей проблемной ситуации,
до точек, представляющих прецеденты из БП, и выбирается ближайшая к целевой точка.
Метод определения ближайшего соседа (ближайших соседей) также широко применяется
для решения задач классификации, кластеризации, регрессии и распознавания образов
[Башмаков и др., 2005].
Основными
преимуществами
данного
метода
являются
простота
реализации
и
универсальность в смысле независимости от специфики конкретной проблемной области. К
существенным недостаткам метода можно отнести сложность выбора метрики для определения
степени сходства и прямую зависимость требуемых вычислительных ресурсов от размера БП, а
также неэффективность при работе с неполными и зашумленными исходными данными.
На практике применяются различные модификации указанного метода [Варшавский и др.,
2006]. Обычно решение выбирается на основе нескольких ближайших точек (соседей), а не
одной (метод k ближайших соседей). Возможно использование метода ближайшего соседа,
основанного на знаниях о предметной области (определенных зависимостях между
параметрами объекта).
2) Метод извлечения прецедентов на основе деревьев решений. Этот метод предполагает
нахождение требуемых прецедентов путем разрешения вершин дерева решений. Каждая
вершина дерева указывает, по какой ее ветви следует осуществлять дальнейший поиск
решения. Выбор ветви осуществляется на основе информации о текущей проблемной ситуации.
Таким образом, необходимо добраться до концевой вершины, которая соответствует одному
или нескольким прецедентам. Если концевая вершина связана с некоторым подмножеством
прецедентов, то тогда для выбора наиболее подходящего из них может использоваться метод
ближайшего соседа. Такой подход рекомендуется применять для больших БП, т.к. основная
часть работы по извлечению прецедентов выполняется заранее на этапе построения дерева
решений, что значительно сокращает время поиска решения.
3) Метод извлечения прецедентов на основе знаний. В отличие от методов, описанных выше,
данный метод позволяет учесть знания экспертов (ЛПР) по конкретной предметной области
(коэффициенты важности параметров, выявленные зависимости и т.д.) при извлечении. Метод
может успешно применяться совместно с другими методами извлечения прецедентов, особенно
когда БП имеет большие размеры и предметная область является открытой и динамической.
4) Метод извлечения с учетом применимости прецедентов. В большинстве систем,
использующих механизмы рассуждений на основе прецедентов, предполагается, что наиболее
схожие с текущей проблемной ситуацией прецеденты являются наиболее применимыми в этой
ситуации. Однако это не всегда так. В основе понятия извлечения на основе применимости
(адаптируемости) лежит то, что извлечение прецедентов базируется не только на их сходстве с
текущей проблемной ситуацией, но и на том, насколько хорошую для желаемого результата
модель они собой представляют. Т.е. на выбор извлекаемых прецедентов влияет возможность
их применения в конкретной ситуации. В некоторых системах эта проблема решается путем
сохранения прецедентов вместе с комментариями по их применению. Использование
указанного подхода позволяет сделать поиск решения более эффективным, заранее отбрасывая
часть заведомо неперспективных прецедентов.
Помимо рассмотренных методов для извлечения прецедентов могут успешно применяться и
другие методы (например, аппарат искусственных нейронных сетей) [Башмаков и др., 2005].
3. Извлечение прецедентов методом ближайшего соседа с использованием различных
метрик и учетом коэффициентов важности параметров объекта
Как уже отмечалось ранее, это самый популярный и часто используемый метод для
извлечения прецедентов, а его эффективность во многом зависит от выбора метрики (меры
сходства). Пусть задан прецедент (C) и текущая проблемная ситуация (T) в n-мерном
пространстве признаков (параметров, свойств), тогда степень сходства или близости (S(C,T))
можно определить, используя одну из основных метрик для определения расстояния между C и
T (dCT): Евклидова метрика; квадрат Евклидового расстояния; Манхэттенская метрика;
расстояние Чебышева; расстояние Журавлева; мера сходства Хэмминга и др.
Выбор соответствующей метрики творческая и довольно трудоемкая задача, от успешного
решения которой непосредственно зависит результативность поиска и извлечения прецедентов.
В каждом конкретном случае этот выбор производится по-разному, в зависимости от целей
ЛПР, физической и статистической природы используемой информации, ограничений и других
факторов,
влияющих
на
процесс
поиска
решения.
В
некоторых
методах
выбор
соответствующей метрики достигается с помощью специальных алгоритмов преобразования
исходного пространства признаков, а в других случаях эксперт (ЛПР) сам определяет метрику,
опираясь на собственные знания по предметной области или экспериментальные данные.
Таким образом, в методе определения ближайшего соседа определяется расстояние dCT
между текущей ситуацией и прецедентом. Для определения значения степени сходства S(C,T)
необходимо найти максимальное расстояние dMAX в выбранной метрике, используя границы
диапазонов параметров (xiнач и xiкон, i=1,…,n). Затем можно вычислить значение степени
сходства S(C,T)=1–dCT/dMAX или в процентах S(C,T)=(1–dCT/dMAX)*100%.
К сожалению, данный метод не дает четких рекомендаций для случая, когда присутствует
несколько прецедентов, равноудаленных от текущей ситуации, а также неэффективен в случае
зашумленности исходных данных и в случае их неполноты. Для устранения вышеуказанных
недостатков существуют различные модификации данного метода [Варшавский, 2006].
С учетом специфики систем экспертной диагностики технического состояния сложных
объектов типа энергоблоков и их подсистем был предложен модифицированный метод
ближайшего соседа. Данная модификация заключается в том, что вводится специальная
величина K – пороговое значение степени сходства (S) прецедентов и текущей ситуации. Таким
образом, в результате сравнения выбирается не один единственный ближайший сосед
(прецедент), а некоторое множество ближайших соседей, степень сходства которых больше или
равна пороговому значению (S≥K). Это позволяет решить проблему для случая, когда
присутствует несколько прецедентов, равноудаленных от текущей ситуации.
Кроме того, в модифицированном методе учитывается возможность работы с неполной
информацией в исходных данных и возможность учета коэффициентов важности параметров
объекта на основе экспертных знаний (предпочтений эксперта).
В случае отсутствия значений параметров в описании прецедентов будем считать, что по
данным параметрам прецеденты и текущая ситуация полностью совпадают (т.е. данные
параметры не являются важными для этих прецедентов). Наоборот, в случае отсутствия
значений параметров в описании текущей ситуации будем считать, что по данным параметрам
прецеденты и текущая ситуация не совпадают.
Коэффициент важности (вес) i-го параметра объекта обозначим wi, а его значение будет
изменяться в интервале от 0 до 1 (0 до 100%). По умолчанию вес параметра считается равным 1,
но эксперт (ЛПР) имеет возможность указать необходимые на его взгляд значения для
коэффициентов важности параметров. Для учета коэффициентов важности параметров при
извлечении прецедентов из БП и вычислении степени сходства необходимо скорректировать
значения параметров умножив их на соответствующий коэффициент (xi*wi), а также учесть
коэффициенты важности при вычислении максимального расстояния dMAX (xiнач*wi и xiкон*wi).
4. Алгоритмы извлечения прецедентов с использованием различных метрик и учетом
коэффициентов важности параметров объекта
На основе описанного выше модифицированного метода определения ближайшего соседа
(ближайших соседей) были разработаны соответствующие алгоритмы извлечения прецедентов,
использующие различные метрики для определения степени сходства (близости) прецедентов с
текущей проблемной ситуацией и учитывающие коэффициенты важности параметров объекта.
Рассмотрим алгоритм извлечения прецедентов из БП с использованием евклидовой метрики.
Входные данные: текущая ситуация T (т.е. должны быть заданы значения параметров,
описывающие сложившуюся ситуацию), CL – непустое множество прецедентов (БП), w1, .. ,wn
– веса (коэффициенты важности) параметров, m – количество рассматриваемых прецедентов из
БП и пороговое значение степени сходства K.
Выходные данные: Множество прецедентов SC (Set of Cases), которые имеют степень
сходства (близости) больше или равную порогового значения K.
Промежуточные данные: Вспомогательные переменные i, j (параметры цикла).
Шаг 1. SC=, j=1 и переходим к следующему шагу.
Шаг 2. Если j≤m выбираем прецедент Cj из множества CL (CjCL) и переходим к шагу 3,
иначе все прецеденты из БП рассмотрены и переходим к шагу 6.
Шаг 3. Рассчитываем расстояние в евклидовой метрике между выбранным прецедентом Cj и
текущей ситуацией T (dCjT) с учетом коэффициентов важности параметров:
В случае отсутствия значения параметра xiCj в описании прецедента Cj проводим вычисление
расстояния dCjT, учитывая, что xiCj = xiT, а для случая, когда отсутствует значение параметра xiT в
описании
текущей
ситуации
T
вычисление
расстояния
dCjT
xiT = max{(xiCj – xiнач), (xiкон – xiCj)}. Далее переходим к следующему шагу.
выполняем,
полагая
Шаг 4. На этом шаге вычисляем степень сходства S(Cj,T)=1–dCjT/dMAX или в процентах
S(Cj,T)=(1–dCjT/dMAX)*100%, если пороговое значение K задано в процентах, (при вычислении
dMAX учитываются веса параметров) и переходим к шагу 5.
Шаг 5. Если S(Cj,T)≥K, то данный прецедент Cj добавляем в результирующее множество SC
(CjSC), т.е. извлекаем данный прецедент из БП. После проверки j=j+1 и переходим к шагу 2.
Шаг 6. Если SC=, то прецеденты для текущей проблемной ситуации не найдены и
переходим к шагу 7 с выдачей сообщения для пользователя (ЛПР) о необходимости
уменьшения порогового значения K, иначе прецеденты для текущей ситуации успешно
извлечены и переходим к следующему шагу.
Шаг 7. Конец (завершение алгоритма).
В результате, найденные прецеденты могут быть упорядочены по убыванию значений их
степени сходства с текущей ситуацией и выданы пользователю (ЛПР).
Отличие других метрических алгоритмов от рассмотренного заключается в том, что на
третьем шаге расстояние вычисляется с помощью других метрик. В перспективе возможна
реализация обобщенного алгоритма извлечения прецедентов на основе различных метрик.
Использование различных метрических алгоритмов извлечения прецедентов в системах
экспертного диагностирования технического состояния сложных объектов и, в частности,
подсистем энергоблока обеспечивает более гибкую работу механизмов поиска решения на
основе прецедентов. У ЛПР появляется возможность рассмотреть различные метрики для
извлечении прецедентов из БП системы, что обеспечивает выбор более адекватной метрики,
способной учесть специфику конкретной решаемой задачи экспертного диагностирования.
Необходимо отметить, что в алгоритмах извлечения прецедентов для учета коэффициентов
важности
параметров
объекта может
выполняться
предварительный
этапа (Шаг 0)
корректировки значений границ диапазонов параметров и самих параметров, что исключает
необходимость в последующем учете коэффициентов важности при извлечении прецедентов.
Заключение
В работе рассмотрены вопросы, связанные с реализацией механизмов правдоподобных
рассуждений на основе прецедентов для систем экспертной диагностики и ИСППР. Основное
внимание
уделено
проблеме
извлечения
прецедентов
из
БП
системы.
Предложен
модифицированный метод ближайшего соседа для извлечения прецедентов. Разработаны
соответствующие метрические алгоритмы извлечения прецедентов, обеспечивающие учет
коэффициентов важности параметров объекта и работу с неполной информацией.
Выполнена программная реализация указанных метрических алгоритмов для извлечения
прецедентов с использованием средств визуального программирования Borland C++ Builder 6.0
и Developer Studio 2006. Разработанный программный модуль извлечения прецедентов включен
в состав новой версии инструментального средства КБП для конструирования библиотек
прецедентов и поиска решения на основе прецедентов, зарегистрированного в Федеральной
службе по интеллектуальной собственности, патентам и товарным знакам.
Разработанное программное инструментальное средство КБП использовано для решения
задач экспертной диагностики на основе аппарата прецедентов в прототипе ИСППР для
помощи оперативно-диспетчерскому персоналу при мониторинге и управлении сложными
техническими объектами типа энергоблоков, разрабатываемом на кафедре Прикладной
математики МЭИ (ТУ) совместно с ООО «ТАСМО-БИТ».
Следует отметить, что активно ведется работа по исследованию возможности использования
более сложного представления прецедентов (объектно-ориентированного и специального), а
также реализации извлечения прецедентов на базе методов структурной аналогии [Eremeev et
al., 2007] и аналогии на основе парного соответствия с применение элементов онтологического
подхода [Башмаков и др., 2005].
Список литературы
[Вагин и др., 2004] Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В.
Достоверный и правдоподобный вывод в интеллектуальных системах // Под редакцией В.Н.
Вагина, Д.А. Поспелова. – М.: ФИЗМАТЛИТ, 2004. –704 с.
[Геловани и др., 2001] Геловани В.А., Башлыков А.А., Бритков В.Б., Вязилов Е.Д.
Интеллектуальные системы поддержки принятия решений в нештатных ситуациях с
использованием информации о состоянии природной среды //–М.:Эдитореал УРСС, 2001 –304с.
[Aamodt et al., 1994] Aamodt A., Plaza E. Case-based reasoning: foundational issues,
methodological variations, and system approaches // AI Communications. IOS Press. Vol. 7: 1. 1994. –
P. 39-59.
[Башмаков
и
др.,
2005]
Башмаков
А.И.,
Башмаков
И.А.
Интеллектуальные
информационные технологии: Учеб. Пособие //–М.:Изд-во МГТУ им. Н.Э. Баумана, 2005.–304с.
[Варшавский и др., 2006] Варшавский П.Р., Еремеев А.П. Методы правдоподобных
рассуждений на основе аналогий и прецедентов для интеллектуальных систем поддержки
принятия решений // Новости Искусственного Интеллекта, № 3, 2006, с. 39-62.
[Варшавский, 2006] Варшавский П.Р. Реализация метода правдоподобных рассуждений на
основе прецедентов для интеллектуальных систем поддержки принятия решений // Труды
десятой национальной конференции по ИИ с международным участием КИИ-2006. В 3-х т. Т.1.
– М.: Физматлит. 2006. – С. 303-311.
[Eremeev et al., 2007] Eremeev A., Varshavsky P. Methods and Tools for Reasoning by Analogy
in Intelligent Decision Support Systems // Proc. of the International Conference on Dependability of
Computer Systems. Szklarska Poreba, Poland, 14-16 June, 2007, IEEE, P.161-168.
Скачать