ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕССОВ ОБРАБОТКИ ПОТОКОВ ДАННЫХ, ЛЕКЦИЯ 3 БГУ РФиЭ Кафедра Интеллектуальных Систем Адуцкевич Иван Анатольевич УПРАВЛЕНИЕ ЗНАНИЯМИ Основные понятия ОСНОВНЫЕ ПОНЯТИЯ Под управлением знаниями в общем случае понимается дисциплина, которая обеспечивает интегрированный подход к созданию, сбору, организации, доступу и использованию информационных ресурсов организации. Эти ресурсы включают в себя корпоративные базы данных, текстовую информацию, такую как документы, описывающие правила и процедуры, и, что наиболее важно, неявные знания и опыт сотрудников организации Под корпоративными знаниями понимается различная деловая информация, которую необходимо иметь для поддержки на высоком уровне основных бизнес-процессов предприятия, а также для быстрого реагирования на динамику рынка. В более широком смысле знания - это информация, материализованная в процессе решения конкретной задачи в виде каких-то конкретных действий людей, стремящихся достичь своих конкретных целей ОСНОВНЫЕ ПОНЯТИЯ При внедрении технологий управления знаниями особое внимание мы уделяем стратегии создания и развития хранилищ корпоративных данных, которую мы увязываем со стратегическими аспектами развития всей компании и потребностями конкретных бизнеспроцессов Knowledge Management – это не Management of Knowledge. ПОНЯТИЕ ЗНАНИЯ В чем разница между знаниями, информацией и данными? Стремление к знанию – одно из основных свойств человека. Аристотель Познание есть процесс активного исследования окружающей среды и создания различных типов знания с целью оптимизации жизненных процессов и достижения тех или иных целей Знания есть совокупность понятий и представлений об объективной действительности, их внутренне взаимосвязанных систем (суждений, положений, концепций, теорий и т.д.), вырабатываемых обществом в процессе познания и преобразования мира. ПОНЯТИЕ ЗНАНИЯ Чтобы построить КС, основанную на знаниях, необходимо знать: Чем знание отличается от подобных ему понятий – данных и информации Какие существуют способы представления или обработки знаний в КС Какие существуют источники знания В задачах информатики можно и более удобно определить категорию знания в каком-то смысле косвенно – через самые разнообразные его свойства и методы обработки ЛОКАЛИЗАЦИЯ ЗНАНИЯ Трудно сомневаться в автономности существования мира знаков в эпоху Интернета Вначале было Слово, и Слово было у Бога и Слово было Бог. Евангелие от Иоанна Данные – это явления реального мира Это намагниченные участки дисков, бороздки грампластинок и CD, модулированные радиоволны и т.д. Можно измерить, а иногда иувидеть, пощупать Данные несут в себе закодированную информацию Информация может быть воспринята, если будет переведена в знаки – визуальные, звуковые Информация имеет знаковую природу и принадлежит миру знаков Знание принадлежит внутреннему миру человека ЭЛЕМЕНТАРНЫЙ АКТ ОБРАБОТКИ ЗНАНИЯ. КРИТЕРИЙ СУЩЕСТВОВАНИЯ ЗНАНИЯ. Два Факта 1. Студент Петров учится в 925 группе. 2. Студенты Иванов и Петров учатся в одной группе. В какой группе учится студент Иванов? Критерием того, что внутри КС находятся знания по какой-то проблемной области есть способность порождать (генерация или автогенерация) новых знаний ИСТОЧНИКИ ЗНАНИЙ Источник знания – не есть еще само знание Текст есть не знание, а только его источник Тоже справедливо для окружающего нас мира – там в скрытой форме содержится огромный объем знаний Окружающий нас материальный мир - это тоже есть не знание, а только его источник ПОНЯТИЕ ПРЕДМЕТНОЙ ОБЛАСТИ (KNOWLEDGE DOMAIN) Под предметной областью, относящейся к данной задаче (теоретической или практической) имеется в виду то множество материальных, мыслительных, знаковых объектов, их качеств взаимосвязей, задействованных в данном виде деятельности ЛОГИКА СООТНОШЕНИЯ – «ЗНАНИЯИНФОРМАЦИЯ-ДАННЫЕ» С точки зрения пользователя не важно каким образом хранится информация в КС и как она обрабатывается ИС в которой хранится огромное количество фактов, но которая не способна порождать новое знание на практике так же принято называть системой управления знаниями. процесс овеществления или реификации знания. K ID КС = База знаний(KB) + Процессор знаний(KP) User I [KB KP] ЛОКАЛЬНЫЕ СИСТЕМЫ ОБРАБОТКИ ЗНАНИЙ СИНТАКТИКА, СЕМАНТИКА И ПРАГМАТИКА ПРЕДСТАВЛЕНИЯ ЗНАНИЙ Системы представления знаний Предикаты Фреймы Семантические сети ПРЕДИКАТЫ Для обработки используется специально созданный язык пролог Например Father(Джон, Мери) может дать ответ на вопрос «чей отец Джон» и «кто есть отец Мери» Есть готовый интерпретатор баз знаний использующих логику предикатов – язык Пролог Авторство такой системы представления знаний в форме силлогизмов восходит, к Аристотелю ФРЕЙМЫ Представляют собой таблицы разделенные на ячейки-слоты В ячейки записываются элементарные единицы знания. Факты - элементарные единицы знания (простые утверждения о характеристиках объекта) Программу КР необходимо писать самому СЕМАНТИЧЕСКИЕ СЕТИ В СС объекты ПО представляются прямоугольниками и они соединяются дугами, обозначающими их качества или связи. Например. Cat on the couch. CAT ON COUCH Программы обработчики необходимо писать самому ПРОСТЕЙШИЕ КОГНИТИВНЫЕ ПРОЦЕССЫ ПРОЦЕСС ПОНИМАНИЯ ЗНАКА S { S1 D1 } Ясно, что такой процесс понимания отдельного знака нетрудно смоделировать и реализовать в КС, мультиплицировав его на понимание целых знаковых синтагм. ПРОЦЕСС ГЕНЕРАЦИИ (АВТОГЕНЕРАЦИИ) ЭЛЕМЕНТАРНОЙ ЕДИНИЦЫ ЗНАНИЯ Лежит в основе силлогизмов Аристотеля Если «Сократ – человек» и «Все люди смертны», то «Сократ – смертен». Важно заметить, что процесс содержит в себе подпроцесс знакового понимания Первые два утверждения воспринимаются КС в процессе их знаковой обработки Его результатом явилось генерация нового знания - «Сократ смертен» Такой процессор легко может быть реализован на базе языка пролог ПРОЦЕСС ГЕНЕРАЦИИ (АВТОГЕНЕРАЦИИ) ЭЛЕМЕНТАРНОЙ ЕДИНИЦЫ ЗНАНИЯ Если в КС содержатся знания(S), которые могут быть обработаны ее когнитивным процессором К, то при знаковом понимании следующей порции информации I, эта структура должна быть воспринята, понята и записана в ее базу знаний. K(S) + I = K(S + S1) Однако Не вся информация может быть воспринята и обработана База знаний не всегда аддитивна Может измениться и сам процессор K(S) + I1 + I2 = K1(S1) ЭКСПЕРТНЫЕ СИСТЕМЫ ОПРЕДЕЛЕНИЯ ЭС КС, способная для пользователя заменить эксперта в определенной предметной области Однако под это определение для человека, который не умеет считать подпадает даже калькулятор КС, способная производить обработку знаний для решения своих экспертных задач Например, простейшая КС, способная обрабатывать знания в форме предикатов КРАТКИЙ ОБЗОР ОБЛАСТИ ЭКСПЕРТНЫХ СИСТЕМ Предметом теории экспертных систем служат методы и приемы конструирования человекомашинных систем, компетентных в некоторой узкоспециальной области При разработке первых ЭС считалось, что немногочисленные законы логических рассуждений в сочетании с мощными вычислительными машинами позволят работать на уровне эксперта и даже превзойти человеческие возможности Следующее поколение ЭС ставило знания на центральное место. Знания эксперта являются решающими для высококвалифицированной деятельности, тогда как представление знаний и схемы логического вывода служат механизмами, позволяющими их использовать. ИНЖЕНЕРИЯ ЗНАНИЙ Инженерия знаний – сочетание научных, техничских и методологических аспектов. Работа на уровне хорошего эксперта редко может быть сведена к некоторому строгому алгоритмическому процессу, но, тем не менее, такая деятельность поддается компьютеризации. Выявление знаний эксперта-специалиста, их четкая формулировка и внесение их в вычислительную машину составляют главные задачи в этой области. ФУНДАМЕНТАЛЬНЫЕ СВОЙСТВА ЭКСПЕРТНЫХ СИСТЕМ Несмотря на то, насколько быстро решается задача, никого не удовлетворит, если результат окажется неверным или неточным Правила ЭС по сути своей являются эвристиками, т.е. вытекают из самых общих соображений ЭС часто касаются узких и высококвалифицированных областей ЭС должны иметь способность к объяснению ТИПОВАЯ СТРУКТУРА ЭС Структура типовой ЭС в основном повторяет обобщенную схему системы обработки знаний. KP+KB Особенностью ЭС является присутствие блока объяснений KB ЭС должна быть заполнена и постоянно обновлятся КЛАССИФИКАЦИЯ ЭКСПЕРТНЫХ ЗАДАЧ Тип - адресуемые задачи Интерпретация Прогноз Диагностика Проектирование Планирование Мониторинг Отладка Ремонт Обучение Управление ИНЖЕНЕРИЯ ЗНАНИЙ – ОПИСАНИЕ ЗНАНИЙ НА ЯЗЫКАХ ВЫСОКОГО УРОВНЯ Concept: Similar things: Things that are special case of this: Parts of this: Things that this is part of: Things that generally associated with: Things that it does: Properties that it often has: Concept: ability Similar things: talent, skill Things that are special case of this: genius Parts of this: Things that this is part of: Things that generally associated with: learning, sport, intelligence, talent, skill, expertise. Things that it does: Things that are done to this: enhanced, improved, developed Properties that it often has: natural, amazing, uncanny ПРЕОБРАЗОВАНИЕ ТЕКСТА В КОГНИТИВНУЮ СТРУКТУРУ Mike is one of Americans. He is 14 years old. He has older sister. Like the others Americans he believes God. Two years ago he went to school. Mike doesn’t like to learn mathematics, physics and computer science. On the contrary, he likes study humanities. He is an usual American teenager. { [PartOf Mike Americans] [NumericProperty Mike age 14 years] [Own Mike sister] [RelativeProperty Mike sister older] [Inheritance American1 American] [Inheritance Mike American1] [Believe Mike [in God]] [RelativeTime FirstDayOfSChool today «2 years ago»] [Time [Mike went to school] FirstDayOfSChool] [RelativeProperty [learn Mike “the humanities”] [learn Mike “mathematics, physics and computer science”] more like] [PartOf Mike “American teenagers”] }