Барчан Константин гр.8204 Мультимодель - это «множество моделей М1,М2,... ,МС, снабженное соответствующим механизмом переключения между моделями, либо, если необходимо, механизмом агрегации результатов, предоставляемых отдельными моделями». Педрич (Рейгусг 1996) С мультимодельной системой нельзя обращаться как с одномодельной , ибо это может стать причиной неправильной интерпретации результатов. Сравним теперь данную модель с моделью химического процесса, которая описывает взаимосвязь между температурой процесса Т и числом Дамкелера d: Очевидно: Характеристика процесса не является однозначной. Данная ситуация обусловлена тем, что размер- ность пространства, в котором представлены характеристики, является недостаточной для однозначного представления взаимосвязи между ними. Для реальных систем, демонстрирующих неоднозначность своего поведения, должен существовать дополнительный вход, который определяет выбор некоторой части характеристики системы в заданный момент (подобно тому, что было изображено на рисунке ранее). Однозначно определить выходное состояние а в заданный момент t (d/t) можно только при наличии дополнительной информации о значениях двух переменных, задающих направление возникающих в ходе процесса изменений: d’(t), а также Т’(t). Представление характеристики процесса в 4мерной системе: Если модель системы не содержит (или не учитывает) некоторые ее входы (из-за отсутствия информации об их значениях либо нашей неуверенности в их существовании), то выходное состояние не может быть однозначным. Первый способ заключается в выяснении того, какие входы не были учтены, с последующим представлением модели системы в расширенном пространстве. Обратимся к реляционной нечеткой модели устанавливающей взаимосвязь между умственными способностями ребенка и его успеваемостью в школе. Данная модель обладает ярко выраженными характеристиками мультимодели, в которой выходное состояние является неоднозначным и можно указать лишь одно из его вероятных значений. Если принять во внимание еще один важный вход, такой как трудолюбие (прилежание), то можно сделать рассматриваемую модель в достаточной степени однозначной. Другой причиной неоднозначности может также являться не до конца установленная взаимосвязь между входами и выходами системы, результатом чего является невозможность определить выходное состояние, даже если известны входные данные (пример: прогноз погоды). Если неизвестны причинноследственные зависимости между входами и выходами системы, или неизвестна часть входов, то можно воспользоваться методом описания системы, заключающимся в присвоении различным состояниям выхода у вероятностей их возникновения при заданном состоянии входного вектора X (как было показано в примере) На основе измерений входных и выходных данных необходимо устанавливать, является ли заданная система однозначной (т. е. соответствует модели) или неоднозначной (т. е. соответствует мультимодели). Обычно входные данные зашумлены и/или подвержены влиянию не учтённых в модели входов. Если разброс (кстати тоже нечёткое понятие) результатов измерений выхода небольшой (в пределах погрешности измерительного устройства), то для представления системы следует использовать однозначную модель. При большом разбросе систему необходимо представлять в форме мультимодели. Первые нечеткие модели создавались на основе экспертных знаний о моделируемой системе. Получение информации о системе осуществлялось с помощью эксперта в соответствующей предметной области. Затем эксперт в области нечеткого моделирования выполнял преобразование этой информации в нечеткую модель. Указанный метод называется приобретением знаний (Ргеизз 1994а). Данный метод является эффективным в том случае, когда эксперт полностью обладает знаниями о системе и может выразить эти знания в словесной форме и передать их. На практике знания эксперта часто являются неполными, неточными, слабо поддающимися формулированию и могут даже содержать в себе противоречия. Кроме того, эти знания субъективны. Таким образом, представляется целесообразным, чтобы в основе модели лежала объективная информация о системе. Такой информацией являются результаты измерения значений ее входов и выходов. Процесс приобретения знаний на основе этих данных называет извлечением знаний. Подобной возможностью обладают нейронные сети. Нейронечеткая сеть представляет собой особую эквивалентную форму нечеткой модели. Например, нечеткая модель с кусочно-линейными функциями принадлежности Aij значений входных параметров X1 и X2 одноточечными функциями Вк для описания значений выходного параметра Y и базой правил вида: Может быть преобразована к нейронечёткую сеть следующего вида: 1. ННС обеспечивают возможность оптимизации (настройки) параметров нечетких моделей на основе данных измерения входов и выходов реальных систем. 2. ННС позволяют корректировать недостаточно точные нечеткие модели, формируемые экспертами. 3. ННС дают возможность расширения формируемых экспертами нечетких моделей на те области пространства входов, экспертные знания о которых отсутствуют. 4. Структура и параметры ННС (множества типа “большой” и “малый”, лингвистические правила) являются понятными человеку, а также допускают обобщение знаний содержащихся в зашумлённых измеряемых данных о моделируемой системе, и представление их в форме хорошо интерпретируемых лингвистических правил (извлечение знаний). В этом отличие ННС от персептронных нейронных сетей, параметры которых не несут никакой информации, кроме числовой, и содержащиеся в них знания недоступны для интерпретации человеком – подобную сеть можно назвать сетью типа “чёрный ящик”. 5. При наличии предварительных или частичных знаний о моделируемой системе их можно легко отразить в ННС. В персептронных сетях это сделать невозможно либо крайне сложно. 6. В случае ННС определение структуры сети представляет собой значительно более простую задачу, чем в случае персептронных сетей, где обычно используется метод проб и ошибок. Знание правильной структуры сети ускоряет процесс обучения и уменьшает влияние со стороны локальных минимумов функции ошибок. Нечеткие модели Мамдани имеют следующиеособенности: а) они осуществляют прямоугольное (или гиперпрямоугольное) разбиение входного пространства. б) границы прямоугольных сегментов являются, как правило, линейными. в) поверхности локальных сегментов являются обычно “слабо” нелинейными (например, полилинейными). В зависимости от выбранного критерия оценки данные особенности могут являться как достоинствами, так и недостатками. Прямоугольное разбиение входного пространства позволяет формулировать модель с помощью понятных человеку правил. Поскольку функции принадлежности задаются отдельно для каждой входящей в модель переменной, попытка добавить в модель хотя бы одну новую функцию приводит лишь к значительному увеличению числа правил. Пусть дана некоторая поверхность моделируемой системы y = f(x1, x2): Особенности: Для точного моделирования “пиков” необходимо большее число функций принадлежности. Для точного моделирования плато функций принадлежности и правил требуется значительно меньше. Диктуемая “пиками” большая плотность функций принадлежности переносится на зоны плато заставляя задавать их с использованием необоснованно большого числа правил. Увеличение же числа параметров модели существенно усложняет процесс ее настройки, с риском превысить пределы возможностей последней (проклятие размерности). Использование нерегулярного (например, треугольного) разбиения пространства входов позволяет значительно уменьшить количество сегментов и согласовать плотность их распределения со степенью нелинейности моделируемой области. В случае системы с тремя входами для задания поверхности модели над одним кубоидальным сегментом входного пространства требуется измерение восьми значений входных и выходного параметров системы. При использовании тетраэдральных сегментов достаточно только четырёх значений. P = 2^n P=n+1 В случае нечеткой модели Мамдани каждому узлу сетки разбиения соответствует одно правило, определяющее выходное состояние модели Y, вида: Поверхность над прямоугольным сегментом “к” входного пространства задаётся по следующему правилу: Каждому треугольному сегменту в модели соответствует одно правило вида (модели Делоне): Модель однозначной статической системы, реализующей отображение fs : X-> Ys, должна в максимально возможной степени удовлетворять двум принципам подобия: принципу подобного отображения входного вектора Хs в выходное значение YM и принципу подобного отображения приращения dXs данного вектора в приращение dYM. 1. Принцип подобного отображения входного вектора Xs в выходное значение YM определяется с помощью следующего выражения: 2. Принцип подобного отображения приращения dXs входного вектора в приращение выходного параметра dY при совпадающих входных состояниях (Xs(0) = XM(0)) системы и ее модели определяется с помощью выражения вида: Во всех предыдущих главах поверхность отображения Y=F(X), соответствующее причинноследственным связям, характерным для моделируемой системы. Пример:: Помимо этого, теорию нечетких множеств часто используют для решения задач классификации, примером которой является оценка клиентов, заинтересованных в получении банковского кредита. Клиенты: - кредитоспособные (погасили кредит в срок) - частично кредитоспособные (погасили кредит не в срок) - некредитоспособные(не погасили кредит) Эта классификация также является нечёткой. Каждый клиент, желающий получить кредит, должен предоставить банку ряд данных, например: х1 — средняя величина чистого дохода, х2 — количество материально зависимых лиц (иждивенцев), х3 — объем имеющихся долгов, х4 — оценка стоимости его активов, х5 — период занятости на текущем месте работы, х6 — период занятости на предыдущих местах работы, х7 — запрашиваемая сумма кредита. Тогда каждый i-ый клиент будет характеризоваться соответствующим вектором (х1i… х7i) На основе полученных данных создаётся нечёткий классификатор. Другими примерами классификации являются: распознавание личности человека по его лицу; распознавания блока рукописных букв на основе точечнорастрового представления или других специально подобранных признаков, таких как число линий, пересекающих остроугольные изгибы буквы; распознавание самолетов по их силуэтам; распознавание личности человека по его голосу; распознавание типа танка по звуку работающего двигателя и автоматическое принятие решения о взрыве противотанковой мины. Условием корректной работы автоматического классификатора является правильная настройка использующихся в нем функций принадлежности отдельным классам, т. е. правильное их размещение в пространстве признаков {х1,х2, … х7} Упростим нашу модель, оставив лишь признаки х1 и х7 и рассмотрим случай с чётким разделением: х1 — средняя величина чистого дохода; х7 — запрашиваемая сумма кредита. Но так бывает не всегда: В общем случае задача классификации заключается в определении размера, формы и местоположения функций принадлежности отдельным классам в пространстве признаков Х1 х Х2 х ... х Хn. Одномерные функции принадлежности представляют собой наиболее часто используемый в нечеткой логике тип функций. Одномерные функции принадлежности являются единственными функциями, которые эксперт в области моделируемой системы может задать словесно на основе своих “осознанных” знаний о ней. Они представляют собой регулярные функции с прямоугольными носителями, стороны которых параллельны осям координат. Вместе с тем, человек (эксперт) использует в процессе принятия решений свои не только “осознанные”, но также и «неосознанные» знания. Следовательно реальные функции могут иметь б’ольшую размерность, не быть прямоугольными и параллельными осям координат. Предположим, в процессе принятия решений, эксперт сформулировал функцию: К сожалению не возможно словесно выразить информацию о форме и угле поворота данной функции - эксперт может предоставить лишь информацию о ее одномерных проекциях Аx1 и Аx2 Таким образом задание формы и положения подобных функций выполняется на основе информации о тех решениях, которые были приняты экспертом в реальных условиях . На основе обучающей выборки (например, точек, задающих значения признаков для предыдущих клиентов банка) в пространстве признаков Х1 х Х2 х ... х Хn образуется кластер выбранного класса. В основе метода двумерной проекции лежит предположение о том, что если какой-либо элемент принадлежит кластеру рассматриваемого класса в n-мерном пространстве, то его проекции также принадлежат проекциям этого кластера на любое из двумерных подпространств Хi х Хj Таким образом, чтобы определить n-мерную функцию принадлежности кластера заданного класса m(х1,х2,... ,хn), необходимо определить функции А затем определить n-мерную функцию принадлежности (используя, например, оператор PROD): В качестве функций принадлежности m(х1,…,хк) проекций кластеров могут использоваться различные типы функций, например, обобщенные вращаемые несимметричные гауссовы функции вида: Оценка 49 предприятий сталелитейной промышленности с использованием метода двумерной проекции. Очень важной и интересной задачей является определение зоны влияния функций принадлежности отдельных классов в областях, не покрываемых элементами выборки измерений (областях недостаточной информации). Менее рискованно применять: задачи с замкнутым и ограниченным числом классов. Нежелательно применять: задачи с открытым числом классов (распознавание лиц)