Чувашский государственный университет имени И.Н. Ульянова Кафедра прикладной физики и нанотехнологий БАЗА ЗНАНИЙ: ЭКСПЕРИМЕНТ, ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ, ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ В.С. АБРУКОВ, С.В. АБРУКОВ, А.В. СМИРНОВ, Е.В. КАРЛОВИЧ Постановка задачи работы Вопросы • Как лучше обобщить экспериментальные данные? • Можно ли их обобщить так, чтобы можно было решать, как прямые, так и обратные задачи? • Можно ли их обобщить так, чтобы иметь возможность прогнозировать результаты еще не проведенных экспериментов и определять технологии получения объекта с заранее заданными свойствами? База знаний Под базой знаний мы понимаем информационное средство, которое: • содержит в себе все зависимсоти между всеми переменными объекта, • позволяет вычислять значения одних переменных через другие, • позволяет решать, как прямые, так и обратные задачи, • позволяет прогнозировать характеристики и свойства еще не исследованных объектов • позволяет прогнозировать параметры технологического процесса для получения объекта с требуемыми характеристиками Data Mining ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ • • • • • Средства предобработки и анализа данных Искусственные нейронные сети (ИНС) Самоорганизующиеся карты Кохонена Деревья решений и другие средства ИНС играют ведущую роль при создании многофакторных вычислительных моделей экспериментальных данных ИНС - единственно возможные «аппроксиматоры» многомерных экспериментальных функций Искусственные нейронные сети • В основе - теорема Колмогорова – Арнольда, адаптированная применительно к ИНС теоремой Хехт-Нильсена • ИНС позволяют использовать разнородные данные (качественные и количественные), «непредставительные» (неполные) выборки, анализировать сильно нелинейные связи. • Реальный компьютерный эмулятор ИНС, работает (вычисляет) как обычная компьютерная программа. Разница в том, что создание ИНС – модели данных основано на использовании процедуры обучения на наборе примеров (таблице примеров, базе данных примеров). ИНС применяются в трех случаях: • Когда невозможно аналитическое описание задачи. • Когда аналитическое описание возможно, но нет алгоритма его решения. Пример - уравнение Шредингера или дифференциальное уравнение распространения волны горения. • Когда аналитическое описание возможно и есть алгоритм ее решения, но время, необходимое для компьютерной реализации алгоритма слишком велико и не удовлетворяет условиям задачи (например, задачи управления быстропротекающими процессами). Пример части биологической нейронной сети Схема биологического нейрона Схема искусственного нейрона • Искусственный нейрон состоит из входов, синапсов, сумматора, аксона, нелинейного преобразователя (функции активации). • Здесь: xi - компоненты входного вектора (входные данные); wi - веса синапса (i = 1 ..., n); S - результат суммирования; Y – передаточный сигнал нейрона; F нелинейный преобразователь (функция активации). Виды искусственных нейронных сетей Модели характеристик наноматериалов Наши ИНС-модели основаны на экспериментах по исследованию электрофизических и оптических характеристик наноплёнок линейно-цепочечного углерода (ЛЦУ) с внедрёнными в них атомами металлов и неметаллов (ЛЦУА). Впервые ЛЦУА были получены в Чувашском государственном университете, в межвузовской (ЧГУ-МГУ) лаборатории высоких технологий (научный руководитель проф. Кочаков В.Д), с использованием запатентованной технологии и различных ноу-хау. ЛЦУА могут представлять большой интерес для элементов твердотельной электроники, элементов солнечных батарей, фотодатчиков, сенсоров, медицинских приложений и т.д. Пример данных, использованных для создания модели «Вольтамперная характеристика ЛЦУА». Табл. 1. (видно только начало таблицы, всего в таблице 698 строк). Структура ИНС – многофакторной вычислительной модели вольтамперных характеристик ЛЦУА обобщающей все экспериментальные данные. На черном фоне слева – факторы, определяющие значение электрического тока. Экран многофакторной вычислительной модели «Вольтамперная характеристика ЛЦУА» для случая внедрения атомов кадмия (48) и теллура (52). Над графиком – набор конкретных значений факторов и вычисленное значение тока Структура ИНС – многофакторной вычислительной модели вольтамперных характеристик ЛЦУА, решающей обратную задачу – определение того, какой дополнительно элемент надо внедрить в ЛЦУА, чтобы получить требуемую вольтамперную характеристику. При обучении ИНС использовались те же данные (Табл. 1), но менялось назначение данных: значение тока было входным фактором, а номер и группа элемента 1 – выходными целевыми функциями Экран модели решения обратной задачи – определение того, какой дополнительно элемент надо внедрить в ЛЦУА, чтобы получить требуемую вольтамперную характеристику (требуемое значение тока при заданном напряжении). Показан график зависимости номера и группы дополнительно внедряемого элемента от толщины пленки ЛЦУ. Зеленая линия - номер группы. Экран многофакторной вычислительной модели «Вольтамперная характеристика ЛЦУА» для случая внедрения атомов лития (3) и астата (85). Над графиком – набор конкретных данных. Все они выделены красным – в таблице, использованной для обучения ИНС все эти значения отсутствовали. Это прогноз не проведенного эксперимента! Экраны «базы знаний» вольтамперных характеристик (приведена только малая часть информации содержащаяся в базе знаний) Заключение • Аналогичные результаты получены нами для спектров пропускания ЛЦУА и для «фотодатчиков» на основе ЛЦУ (создавались различные сэндвичи из ЛЦУ и серебра, кадмия, меди и никеля в различных сочетаниях). • Совокупность всех этих моделей можно представить, как Базу Знаний характеристик наноматериалов на основе ЛЦУ, которая: - содержит в себе зависимсоти между переменными объекта, - позволяет вычислять значения одних переменных через другие, - позволяет решать, как прямые, так и обратные задачи, - позволяет прогнозировать характеристики и свойства еще не исследованных объектов - позволяет прогнозировать параметры технологического процесса для получения объекта с требуемыми характеристиками Эти модели пока не позволяют определять первые и вторые производные экспериментальных зависимостей, эта задача будет решаться в ближайшем будущем. Мы приглашаем к сотрудничеству всех, кто заинтересован в создании «локальной» базы знаний своих экспериментальных результатов, а также решением задачи определения производных своих экспериментальных зисимостей. Работа выполнена при финансовой поддержке РФФИ (проект № 13-02-97071). База знаний эксплуатации солнечной электростанции в феврале 2013. Исходные данные: база данных База знаний эксплуатации солнечной электростанции в феврале 2013. Исходные данные – статистика База знаний эксплуатации солнечной электростанции в феврале 2013. Исходные данные – корреляционный анализ База знаний эксплуатации солнечной электростанции в феврале 2013 Структура ИНС База знаний эксплуатации солнечной электростанции в феврале 2013 Качество ИНС-модели База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики (только малая часть) База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции в феврале 2013 Зависимости, графики База знаний эксплуатации солнечной электростанции • Мгновенно вычисляет и представляет в виде графиков сотни случаев эксплуатации солнечной электростанции при различных метеоусловиях и выдает решения для оптимальных условий эксплуатации СЭ Литература Neural Networks for Instrumentation, Measurement and Related Industrial Applications (2003) (Нейронные сети для измерительных устройств, измерений и промышленных применений). Proceedings of the NATO Advanced Study Institute on Neural Networks for Instrumentation, Measurement, and Related Industrial Applications (9-20 October 2001, Crema, Italy)/ ed. by Sergey Ablameyko, Liviu Goras, Marco Gori and Vincenzo Piuri, IOS Press, Series 3: Computer and Systems Sciences – Vol. 185, Amsterdam. Заключение. Научные исследования Методы интеллектуального анализа данных - это новый подход к проведению фундаментальных и прикладных научных исследований Его достоинства заключаются в следующем: - возможность создания многофакторных моделей эксперимента - возможность решения как прямых, так и обратных задач - возможность прогнозирования результатов еще не проведенных экспериментов Заключение. Представление результатов научных исследований Методы интеллектуального анализа данных - это возможность реализации нового подхода к представлению результатов научных исследований в научных журналах и отчетах НИР в виде прилагаемого к статье компьютерного исполняемого модуля многофакторной вычислительной модели экспериментальных данных. Его достоинства в следующем: - возможность представления результатов эксперимента в наиболее полном и компактном виде - возможность для читателя ознакомится со всеми закономерностями, содержащимися в экспериментальных данных, а не только с теми, которые представлены авторами статьи или отчета по НИР - возможность построения читателем своих сценариев анализа экспериментальных данных и проверке качества эксперимента Наши контакты Чувашский государственный университет, корп. 1, каф. прикладной физики и нанотехнологий ул. Университетская, 38, комн. 225 Тел. 8352-455600 доб.3602 Fax: 8352-452403 E-mail: abrukov@yandex.ru Спасибо за внимание!