МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Государственный университет - учебно-научно-производственный комплекс» Учебно-научно-исследовательский институт информационных технологий Кафедра «Электроника, вычислительная техника и информационная безопасность» УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС по дисциплине М.2-Б.2 Эксперимент, планирование, проведение, анализ для направления 211000.682 Заведующий кафедрой В.Т. Еременко (подпись) «05» сентября 2012 г. Разработчик (подпись) О.А. Воронина « 05» сентября 2012 г. Содержание УМК дисциплины М.2-Б.2 «Эксперимент, планирование, проведение, анализ» 1 Рабочая программа дисциплины. .................................................................. 3 2 Карта учебно-методической обеспеченности дисциплины. ....................... 19 3 Конспект лекций. ......................................................................................... 20 4 Методические указания по проведению лабораторных работ. ................. 101 5 Методические рекомендации по выполнению практических работ..... 129 6 Методические рекомендации по СРС........................................................ 287 7 Материалы по модульному контролю (тесты). ......................................... 288 8 Вопросы к зачету ........................................................................................ 292 1 Рабочая программа дисциплины. МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ "ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УЧЕБНО-НАУЧНО-ПРОИЗВОДСТВЕННЫЙ КОМПЛЕКС" УЧЕБНО-НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Кафедра «Электроника, вычислительная техника и информационная безопасность» Воронина Оксана Александровна 211000.68-2011-2-o М.2-Б.1 ЭКСПЕРИМЕНТ, ПЛАНИРОВАНИЕ, ПРОВЕДЕНИЕ, АНАЛИЗ Рабочая программа учебной дисциплины (модуля) Направление подготовки электронных средств Степень магистр Форма обучения очная 211000.68 Конструирование и технология Орел 2011 Автор к.т.н., , доцент, Воронина О. А. __________ Рецензент _________________________________________________________________ ( ученая степень, ученое звание, Ф.И.О., личная подпись) _____________________________________________________________________________ Рабочая программа предназначена для студентов направления подготовки 211000.68 Конструирование и технология электронных средств, обучающихся по очной форме обучения. Рабочая программа обсуждена на заседании кафедры «Электроника, вычислительная техника и информационная безопасность» Протокол № ___ от «__» _____________ _______г. Зав. кафедрой д.т.н, профессор, Еременко В. Т. __________ Рабочая программа согласована с УМС института «Учебно-научно-исследовательский институт информационных технологий» Протокол № ___ от «__» _____________ _______г. Председатель УМС д.т.н, профессор, Подмастерьев К. В. __________ Рабочая программа утверждена УМС института «Учебно-научно-исследовательский институт информационных технологий» Протокол № ___ от «__» _____________ _______г. Председатель УМС д.т.н, профессор, Подмастерьев К. В. __________ 5 Содержание Введение 6 1 Цели освоения учебной дисциплины (модуля) 6 2 Место дисциплины (модуля) в структуре ООП 7 3 Компетенции обучающегося, формируемые в результате освоения учебной дисциплины (модуля) 7 4 Структура учебной дисциплины (модуля) и распределение ее трудоемкости 9 5 Технологическая карта учебной дисциплины (модуля) 10 6 Самостоятельная работа студентов 14 7 Образовательные технологии 14 8 Оценочные средства для текущего и рубежного контроля успеваемости 14 9 Учебно-методическое, информационное и материально-техническое обеспечение учебной дисциплины (модуля) 15 10 Календарный план-график реализации учебной дисциплины (модуля) 17 11 Рекомендуемая литература 18 11.1 Основная литература 18 11.2 Дополнительная литература 18 6 Введение Рабочая программа по дисциплине «Эксперимент, планирование, проведение, анализ» для направления 211000.68 «Конструирование и технология электронных средств» разработана на основании федерального государственного образовательного стандарта высшего профессионального образования по направлению подготовки магистра 211000 «Конструирование и технология электронных средств», утвержденного базового учебного плана направления 211000.68 «Конструирование и технология электронных средств». Рабочая программа оформлена в соответствии с СТО ОрелГТУ 72-0406-2010 «Рабочая программа учебной дисциплины (модуля) высшего профессионального образования». Данная рабочая программа отражает все виды учебных занятий и формы самостоятельной работы, а также все формы контрольных мероприятий и итоговой аттестации в форме зачета. В рабочей программе приводится список основной и дополнительной литературы, необходимой для освоения курса, подготовки к лабораторным и практическим занятиям, а также перечень средств обеспечения освоения дисциплины. В соответствии с БУП дисциплина «Эксперимент, планирование, проведение, анализ» относится к вариативной части профессионального цикла. Общая трудоемкость дисциплины составляет 3 зачетные единицы. Предметом изучения дисциплины «Эксперимент, планирование, проведение, анализ» являются современные методы математического моделирования разрабатываемых объектов или технологических процессов с целью оптимизации их параметров, методы планирования, проведения модельных и натурных экспериментов, анализ результатов экспериментов, программные продукты, ориентированные на решение научных, проектных и технологических задач. Успешное изучение дисциплины основано на использовании знаний, полученных студентами по следующим дисциплинам: «Теория вероятностей и математическая статистика», «Информатика», «Информационные технологии». На знаниях данной учебной дисциплины основывается изучение дисциплин: «Моделирование конструкций и технологических процессов производства электронных средств», «Оптимизационные методы при конструировании и технологии электронных средств», «Автоматизированные системы контроля и испытаний электронных средств». 1 Цели освоения учебной дисциплины (модуля) Целью изучения учебной дисциплины «Эксперимент, планирование, проведение, анализ» является формирование профессиональных компетенций, таких как ПК-19 «способность планировать 7 и проводить эксперименты, обрабатывать и анализировать их результаты» , ПК-3 «способность понимать основные проблемы в своей предметной области, выбирать методы и средства их решения», ПК-5 «Способность к профессиональной эксплуатации современного оборудования и приборов и представлять результаты», ПК-7 «способность анализировать состояние научно-технической проблемы путем подбора, изучения и анализа литературных и патентных материалов», ПК-20 «способность оценивать значимость и перспективы использования результатов исследования, подготавливать отчеты, обзоры, доклады и публикации по результатам работы, заявки на изобретения, разрабатывать рекомендации по практическому использованию полученных результатов». Целью изучения дисциплины «Эксперимент, планирование, проведение, анализ» является освоение основных принципов построения математических моделей разрабатываемых объектов и технологических процессов, методов оптимизации их параметров, методов планирования и проведения активных и пассивных экспериментов, анализа резуьтатов эксперимента. Задачи курса: - математическое моделирование разрабатываемых объектов или технологических процессов с целью оптимизации их параметров; - организация модельных и натурных экспериментов. 2 Место дисциплины (модуля) в структуре ООП В соответствии БУП направления подготовки магистров 211000.68 "Конструирование и технология ЭВС" учебная дисциплина «Эксперимент, планирование, проведение, анализ» относится к профессиональному циклу. Для изучения дисциплины студент должен обладать знаниями, полученными при изучении учебных предметов: "Теория вероятностей и математическая статистика", "Математика", "Информатика", "Информационные технологии". Знания, полученные по дисциплине, используются при изучении дисциплин: "Моделирование конструкций и технологических процессов производства электронных средств", "Оптимизационные методы при конструировании и технологии электронных средств", "Автоматизированные системы контроля и испытаний электронных средств". Приобретенные в результате освоения дисциплины знания используются при прохождении магистрантами научно-исследовательской практики и при написании выпускной квалификационной работы в форме магистерской диссертации. 3 Компетенции обучающегося, формируемые в результате освоения учебной дисциплины (модуля) В процессе освоения дисциплины у студентов формируются 8 следующие профессиональные компетенции: - ПК-19 «способность планировать и проводить эксперименты, обрабатывать и анализировать их результаты» , - ПК-3 «способность понимать основные проблемы в своей предметной области, выбирать методы и средства их решения», - ПК-5 «способность к профессиональной эксплуатации современного оборудования и приборов и представлять результаты», - ПК-7 «способность анализировать состояние научно-технической проблемы путем подбора, изучения и анализа литературных и патентных материалов», - ПК-13 «готовность проектировать технологические процессы, разрабатывать технологическую документацию, обеспечивать технологичность изделий и осуществлять авторское сопровождение разрабатываемых модулей, блоков, систем и электронных комплексов», - ПК-20 «способность оценивать значимость и перспективы использования результатов исследования, подготавливать отчеты, обзоры, доклады и публикации по результатам работы, заявки на изобретения, разрабатывать рекомендации по практическому использованию полученных результатов». В результате освоения дисциплины и формирования профессиональных компетенций магистр должен: - Знать : основы планирования, проведения и обработки результатов эксперимента, основы методов оценки результатов исследований, способы представления научно-технической информации; - Уметь: правильно использовать достижения науки при постановке и проведении эксперимента в области проектирования, технологии и эксплуатации электронных средств, правильно классифицировать и находить научно-техническую информацию в области проектирования, технологии и эксплуатации электронных средств, правильно оформлять результаты исследований в области проектирования, технологии и эксплуатации электронных средств; - Владеть: навыками планирования и проведения эксперимента, навыками применения современных программных средств, навыками анализа научной информации в своей предметной области знания, навыками работы в текстовых процессорах, электронных таблицах, базах данных, системах подготовки презентаций и современных прикладных программах. 9 4 Структура учебной дисциплины (модуля) и распределение ее трудоемкости Таблица 1 – Структура дисциплины и распределение часов по семестрам Всего Виды учебной работы 1 Аудиторные занятия, всего Из них в интерактивной форме 1.1 Лекции Из них в интерактивной форме 1.2 Лабораторные занятия Из них в интерактивной форме 1.3 Практические занятия Из них в интерактивной форме 2 Самостоятельная работа 2.1 ОСРС 2.2 КСРС Рубежный контроль Семестр №1 Часы 108 40 16(16) 8 Кол-во 12 3 20 16(16) 68 68 0 10 17 4 Часы 108 40 16(16) 8 0(0) 12 0(0) 20 16(16) 68 68 0 Зачет Кол-во 17 4 3 10 10 5 Технологическая карта учебной дисциплины (модуля) Семестр №1 Лекция: Методология математического моделирования. 1 лек №1 Изучаемые вопросы: Концепция последовательного усложнения разрабатываемой модели. Особенности выявления существенных факторов сложного процесса. Выявление факторов, оказывающих влияние на функцию отклика с помощью метода ранговой корреляции. Применение дисперсионного анализа для выявления факторов, оказывающих влияние на функцию отклика проводимого эксперимента Методы насыщенных и свернасыщенных планов для выявления доминирующих факторов. Вопросы для самостоятельного изучения: Особенности выявления существенных факторов сложного процесса 3 1 2 1 пр №1 Экспериментальный анализ случайной величины. Проверка статистических гипотез. 3 пр* №2 Метод ранговой корреляции ПК-3, 1, 2, 3, 5, 9, ПК-5, ПК-7, 12, 13, 15 ПК-19 4 5 ПК-5, 1, 2, 3, ПК-13, 6, 7, ПК-19, 12, 13, ПК-20 14 ПК-3, ПК-5, 1, 2, 3, 7, 8 ПК-7, ПК-13, Итого УБ 5 6 7 8 9 10 Модуль №1 «Методология математического моделирования» УБ Самостоятельная работа часы 4 за отчет 3 за посещение 2 УБ часы 1 № рекомендуемой литературы Вид и № занятия Тема занятия № компетенции Учебная неделя Аудиторная работа форма контроля Таблица 2 – Технологическая карта учебной дисциплины (модуля) 11 12 2 1 0 2 6 7 8 2 1 3 2 4 2 1 3 3 4 9 10 1 11 12 11 5 пр* №3 Однофакторный дисперсионный анализ 7 пр* №4 Двухфакторный и трехфакторный дисперсионный анализ 9 пр* №5 Методы насыщенных и сверхнасыщенных планов Модульный контроль: форма контроля - тест; абсолютные баллы - 2 Итого по модулю: 1 2 2 лек №2 3 Лекция: Активный эксперимент. Планирование, проведение, анализ Изучаемые вопросы: Полный факторный эксперимент. Дробный факторный эксперимент. Центральные композиционные планы. Вопросы для самостоятельного изучения: Автоматизация обработки результатов 13 лаб №1 Автоматизация обработки результатов активного эксперимента 11 пр №6 Полный факторный эксперимент ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 1, 2, 3, 5, 6, 7, 13, 14 2 1 3 3 4 1, 2, 3, 7, 14 2 1 3 3 4 1, 2, 3, 7, 10, 13 2 1 3 3 4 12 4 6 2 18 15 0 5 6 7 8 9 10 Модуль №2 «Активный эксперимент» 21 11 12 ПК-3, ПК-5, 1, 2, 3, ПК-7, 6, 14, ПК-13, 15 ПК-19, ПК-20 2 1 0 2 1 ПК-3, ПК-5, 1, 2, 3, 6, 7, ПК-7, ПК-13, 11, 13, 14 ПК-19, ПК-20 ПК-3, 1, 2, 3, 4 2 6 3 8 2 1 3 3 4 12 13 пр* №7 Дробный факторный эксперимент 15 пр* №8 Цетральный композиционный рототабельный план 1 2 3 Модульный контроль: форма контроля - тест; абсолютные баллы - 2 Итого по модулю: ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 4 Лекция: Пассивный эксперимент. Планирование, проведение, анализ 3 лек №3 Изучаемые вопросы: Проведение пассивного эксперимента в производственных условиях и информативность его результатов. Факторный анализ. Метод главных компонентов. Временные ряды. Планирование и обработка результатов пассивного эксперимента методами регрессионного анализа. Вопросы для самостоятельного изучения: Возникновение погрешностей. Автоматизация эксперимента. 15 лаб №2 Планирование и обработка результатов пассивного эксперимента 17 пр* №9 Метод регрессионного анализа. 6, 7, 10, 13, 14 1, 2, 3, 5, 6, 7, 10, 13, 14 2 1 3 2 4 1, 2, 3, 13, 14 2 1 3 3 4 5 6 7 8 10 2 12 6 15 15 Модуль №3 «Пассивный эксперимент» ПК-3, ПК-5, 2, 3, 5, ПК-7, 6, 10, ПК-13, 13, 14, 15 ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 ПК-3, ПК-5, 9 11 0 12 21 2 1 0 2 1 1, 2, 3, 4, 5, 6, 7, 8, 11, 12, 14 4 2 6 3 8 1, 2, 3, 6, 7, 2 1 3 3 4 13 Модульный контроль: форма контроля - тест; абсолютные баллы - 2 Итого по модулю: 1 2 3 ПК-7, ПК-13, ПК-19, ПК-20 8 4 Лекция: Оптимизация исследуемых процессов 4 лек №4 Изучаемые вопросы: Метод Гаусса-Зайделя. Градиентные методы. Метод крутого восхождения. Симплексный метод. Вопросы для самостоятельного изучения: Оптимизация при многоэкстремальной поверхности отклика. Обобщенный параметр оптимизации. 17 лаб №3 Планирование экстремальных поисковых экспериментов 17 пр* №10 Метод крутого восхождения Модульный контроль: форма контроля - тест; абсолютные баллы - 2 Итого по модулю: Рубежный контроль: зачет Итого по семестру: 14 2 10 9 5 6 7 8 9 Модуль №4 «Методы оптимизации» ПК-3, 1, 2, 3, ПК-5, 7, 8, ПК-13, 14, 15 ПК-19 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 4 0 10 13 11 12 2 1 0 2 1 1, 2, 3, 6, 7, 10, 11, 12, 13, 14 4 2 6 3 8 1, 2, 3, 7, 10, 14 2 1 3 3 4 8 4 9 40 20 48 2 10 15 68 0 13 0 68 14 6 Самостоятельная работа студентов Таблица 3 – Самостоятельная работа студентов Виды учебной работы 1 ОСРС Подготовка к лекциям Подготовка к лабораторным занятиям Подготовка к практическим занятиям Подготовка к рубежному контролю Подготовка к модульному контролю Итого по ОСРС КСРС Итого по КСРС Итого по факту Итого по плану Всего часов баллов 2 3 Семестр №1 часов баллов 4 5 8 9 28 15 8 68 - 8 9 28 15 8 68 - 68 68 - 68 68 - 7 Образовательные технологии В процессе освоения учебной дисциплины "Эксперимент, планирование, проведение, анализ" предусматривается использование следующих образовательных технологий: - при проведении лекционных занятий - итерактивные формы проведения занятий; применение компьютерных технологий; - при проведении лабораторных работ - применение компьютерных технологий; - при проведении практических занятий - активные и интерактивные формы проведения занятий; применение компьютерных технологий. При организации самостоятельной работы студентов используются следующие образовательные технологии: - технология разноуровневого (дифференцированного) обучения; - технология модульного обучения ; - технология использования компьютерных программ; - Интернет-технологии; - технология тестирования. Реализация компетентностного и личностно-деятельностного подхода с использованием перечисленных технологий предусматривает активные и интерактивные формы обучения. Удельный вес занятий, проводимых в интерактивных формах, составляет более 30 % аудиторных занятий. 8 Оценочные средства для текущего и рубежного контроля успеваемости В ходе выполнения студентом учебной работы в семестре предусматриваются текущие аттестации и рубежный контроль. Цель текущей аттестации - оценка результатов работы в семестре. Целью рубежного контроля является оценка качества освоения студентами дисциплины по 15 завершении отдельных этапов обучения. В соответствии с положением "О балльно-рейтинговой системе контроля и оценки результатов учебной деятельности студентов" П ОрелГТУ 72-05-27-2010 сумма баллов текущей аттестации складывается из следующих составляющих: - баллы за посещаемость аудиторных и индивидуальных занятий; - баллы за качество выполнения и защиты заданий практических и лабораторных работ; - баллы за качество выполнения индивидуальной самостоятельной работы студента. В качестве оценочного средства для текущего контроля знаний по итогам освоения модулей дисциплины используется тестовый контроль. В качестве оценочного средства для рубежного контроля знаний по итогам освоения модулей дисциплины «Эксперимент, планирование, проведение, анализ» и учебной дисциплины в целом в соответствии с базовым учебным планом используется зачет. 9 Учебно-методическое, информационное и материальнотехническое обеспечение учебной дисциплины (модуля) Учебно-методическое и информационное обеспечение учебной дисциплины "Эксперимент, планирование, проведение, анализ" включает в себя: - учебную литературу по тематике дисциплины, в достаточном количестве (не менее 0,5 экземпляра на 1 студента) имеющуюся в фондах научно-технической библиотеки университета, в том числе учебник под редакцией О.П. Глудкина "Современный эксперимент: подготовка, проведение, анализ результатов" ; - периодические издания по тематике дисциплины в фондах научнотехнической библиотеки университета, в том числе журнал "Математическое моделирование", который публикует обзоры, оригинальные статьи и краткие сообщения, посвященные математическому моделированию с применением ЭВМ и численным методам решения сложных и актуальных проблем науки и современной технологии. В журнале помещаются также работы, имеющие высокий предметный и математический уровень, показывающие возможности вычислительного эксперимента в данной области и освещающие следующие вопросы: постановки научно-технических задач, построение математических моделей для них, математические методы их исследований и вычислительные алгоритмы их решения, пакеты прикладных программ для решения актуальных задач, иллюстрированные расчеты, апробация моделей путем сравнения с экспериментальными или теоретическими данными; - учебно-методические указания по проведению лабораторных и практических занятий в печатном и электронном виде, в том числе учебное 16 пособие Ворониной О.А. "Математические основы планирования и проведения эксперимента" ; - Интернет-ресурсы по тематике дисциплины. Материально-техническое обеспечение учебной дисциплины "Эксперимент, планирование, проведение, анализ" включает в себя: - компьютерный класс (9 рабочих мест) с возможностью подключения к Интернет. 17 10 Календарный план-график реализации учебной дисциплины (модуля) Виды учебной работы Таблица 4 – Календарный план-график реализации РП дисциплины на 1 учебный семестр лек лаб пр Всего часов 8 12 20 Нормати УБ вная АБ сумма Колич ество часов/ УБ в учебн ую недел ю 1 2 3 4 2 2 2 2 2 5 4,41 2 6 5,29 11 9,71 5 6 7 8 9 10 Аудиторные занятия 11 12 13 14 4 2 2 2 2 Текущая аттестация 12 16 16 20 20 24 24 28 28 40 40 10,59 14,12 14,12 17,65 17,65 21,18 21,18 24,71 24,71 35,29 35,29 2 15 4 2 16 17 18 4 4 52 52 68 45,88 45,88 60 68 60 11 Рекомендуемая литература 11.1 Основная литература 1. Воронина О.А. Математические основы планирования и проведения эксперимента. Учеб. пособие / О.А. Воронина - Орел: ОрелГТУ – 2007. 2. Современный эксперимент: подготовка, проведение, анализ результатов / В.Г. Блохин , О.П. Глудкин , А.И. Гуров , М.А Ханин. Под ред. О.П. Глудкина – М.: Радио и связь, 1997. 3. Статистические методы в инженерных исследованиях (лабораторный практикум): Учеб. пособие / В.П. Бо р одюк , А.П. Во щинин , А.З. Ивано в и др . Под ред. Г.К. Круга – М.: Высшая школа, 1983. 4. Автоматизация физических исследований и эксперимента: компьютерные измерения и виртуальные приборы на основе Lab VIEW 7/ Под. ред. П. А. Бутырина - М.: ДМК Пресс, 2005. 5. Грачев Ю.П. Математические методы планирования эксперимента / Ю.П. Грачев, Ю.М. Плаксин Ю.М - М.: ДеЛи принт 2005 г. 6. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь - М.: ФИЗМАТЛИТ, 2006 7. Вуколов Э. А. ОСНОВЫ СТАТИСТИЧЕСКОГО АНАЛИЗА. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL: у чебно е по собие / Э. А. Вуко ло в — М. : ФОРУМ : ИНФРА-М, 2010 8. Денисенко В.В. Компьютерное управление технологическим процессом, экспериментом, оборудованием. / В.В. Денисенко - М.: Горячая линия-Телеком, 2009. 9. ГОСТ Р 50.1.040-2002 `Статистические методы. Планирование экспериментов. Термины и определения` 11.2 Дополнительная литература 10. Охорзин В.А. Прикладная математика в системе MATHCAD: Учебное пособие. / В.А. Охорзин– СПб.:Лань, 2008. 1 1 . Сур анов А. Я. Lab VIEW 7: спр аво чник по функциям. / А.Я. Сур анов М.: ДМК Пресс, 2005. 12. Лагутин М. Б. «Наглядная математическая статистика» / М. Б. Лагутин М.: Бином. Лаборатория знаний, 2007. 13. Макаров А.А. Анализ данных на компьютере / Ю.Н Тюрин, А.А. Макаров – М.: Инфра-М, 2003. 14. Львович Я.Е. Теоретические основы конструирования, технологии и надежности РЭА: Учеб. пособие для вузов / Я.Е.Львович , В.Н.Фролов - М.: Радио и связь, 1986. 15. Журнал `Математическое моделирование` [Электронный ресурс] http://www.mathnet.ru/php/journal.phtml?jrnid=mm&option_lang=rus 2 Карта учебно-методической обеспеченности дисциплины. КАРТА УЧЕБНО-МЕТОДИЧЕСКОЙ ОБЕСПЕЧЕННОСТИ ДИСЦИПЛИНЫ М.2-Б.1 «Эксперимент, планирование, проведение, анализ» для магистрантов основной образовательной программы: 211000.68 Конструирование и технология электронных средств № п/п Количество экземпляров на в кафедре* библиотеке Библиографическое описание 1 Основная литература 1.1 . Современный эксперимент: подготовка, проведение, анализ результатов / Блохин В.Г., Глудкин О.П., Гуров А.И., Ханин М.А.; Под ред. О.П. Глудкина. – М.: Радио и связь, 1997. 5 1.2 Статистические методы в инженерных исследованиях (лабораторный практикум): Учеб. пособие / Бородюк В.П., Вощинин А.П., Иванов А.З. и др; Под ред. Г.К. Круга – М.: Высшая школа, 1983. 10 1.3 Автоматизация физических исследований и эксперимента: компьютерные измерения и виртуальные приборы на основе Lab VIEW 7/ Под. ред. Бутырина П. А. -М.: ДМК Пресс, 2005. Воронина О.А. Математические основы планирования и проведения эксперимента. Учеб. пособие - Орел: ОрелГТУ, 2007 5 1.4 10 2 Дополнительная литература 2.1 Охорзин В.А. Прикладная математика в системе MATHCAD: Учебное пособие. – СПб.:Лань, 2008 5 2.2 Кардашев Г.А. Цифровая электроника на персональном компьютере Electronics Work bench и Micro-Cap – М.: Горячая линия-Телеком, 2003. 3 Методические указания по лабораторным работам, курсовым работам Воронина О.А. Планирование и проведение эксперимента при Эл. вид производстве электронно-вычислительных средств: Методические указания по проведению практических занятий – Орел: Изд-во ФГБОУ ВПО "Госуниверситет - УНПК" , 2012. Методические указания по проведению лабораторных работ Эл. вид 5 3.1 3.2 5 5 4 Другие методические разработки 4.1 Конспект лекций Зав. кафедрой Карту составила Эл. вид __________________________ подпись __________________________ 19 Еременко В.Т. Воронина О.А. 5 3 Конспект лекций. ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССОНАЛЬНОГО ОБРАЗОВАНИЯ «ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ – УЧЕБНО-НАУЧНОПРОИЗВОДСТВЕННЫЙ КОМПЛЕКС» УЧЕБНО-НАУЧНОИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Кафедра «Электроника, вычислительная техника и информационная безопасность» О.А. Воронина ЭКСПЕРИМЕНТ, ПЛАНИРОВАНИЕ, ПРОВЕДЕНИЕ, АНАЛИЗ КОНСПЕКТ ЛЕКЦИЙ Направление подготовки 211000.68 Конструирование и технология электронных средств Степень магистр Форма обучения очная Орел 2012 20 Автор: к.т.н., доцент кафедры «ЭВТИБ» О.А. Воронина Рецензент: к.т.н., профессор кафедры «ЭВТИБ» В. А. Лобанова Конспект лекций « Эксперимент, планирование, проведение, анализ» предназначен для магистрантов, обучающихся по специальности направлению подготовки магистра 211000 «Конструирование и технология электронных средств» и смежных с ними. Конспект лекций «Эксперимент, планирование, проведение, анализ» рассмотрен и одобрен на заседании кафедры ЭВТИБ «______»________2012 г., протокол №___, зав. кафедрой ЭВТИБ, д.т.н., проф. ________________ В.Т. Еременко; на заседании УМС УНИИ ИТ «___»________2012 г., протокол № ____ председатель УМС УНИИ ИТ, д.т.н., проф. ____________ К.В.Подмастерьев 21 СОДЕРЖАНИЕ МОДУЛЬ №1 «МЕТОДОЛОГИЯ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ» ............................................................................................................................. 23 Лекция1: Методология математического моделирования....................... 23 МОДУЛЬ №2 «АКТИВНЫЙ ЭКСПЕРИМЕНТ» ........................................... 49 Лекция2: Активный эксперимент. Планирование, проведение, анализ . 49 МОДУЛЬ №3 «ПАССИВНЫЙ ЭКСПЕРИМЕНТ» ........................................ 72 Лекция3: Пассивный эксперимент. Планирование, проведение, анализ 72 МОДУЛЬ №4 «МЕТОДЫ ОПТИМИЗАЦИИ» ............................................... 85 Лекция4: Оптимизация исследуемых процессов ..................................... 85 Литература ........................................................................................................ 100 22 МОДУЛЬ №1 «МЕТОДОЛОГИЯ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ» Лекция1: Методология математического моделирования. Изучаемые вопросы: Концепция последовательного усложнения разрабатываемой модели. Особенности выявления существенных факторов сложного процесса. Выявление факторов, оказывающих влияние на функцию отклика с помощью метода ранговой корреляции. Применение дисперсионного анализа для выявления факторов, оказывающих влияние на функцию отклика проводимого эксперимента. Методы насыщенных и сверхнасыщенных планов для выявления доминирующих факторов. Вопросы для самостоятельного изучения: Особенности выявления существенных факторов сложного процесса Освоенные компетенции: ПК-3, ПК-5, ПК-7, ПК-19 Сложный процесс, как и любая сложная система, представляет собой составной объект, части которого можно рассматривать как составляющие системы, объединенные в единое целое в соответствии с определенными принципами или связанные между собой заданными отношениями. Части сложной системы (подсистемы) можно расчленить (часто лишь условно) на более мелкие подсистемы и т. д. вплоть до выделения элементов сложной системы, которые либо объективно не подлежат дальнейшему расчленению, либо относительно их неделимости имеется договоренность. Свойства сложной системы в целом определяются, как свойствами составляющих ее элементов, так и характером взаимодействия между ними. Сложные системы характеризуются тем, что: – состояние системы описывается, как правило, большим числом динамических переменных; примером сложной системы с малым числом динамических переменных является модель Лоренца, включающая три независимых динамических переменных, однако проявлением сложности процесса, описываемого этой моделью, является стохатизация динамического детерминированного процесса; – система обнаруживает качественные изменения динамического поведения; – система включает нелинейные взаимодействия и обратные связи, которые также, как правило, содержат нелинейности. Примерами сложной системы являются современные электронные средства, система регулирования движения транспорта, энергосистема, междугородная телефонная сеть. Основной метод исследования сложной системы — моделирование, в том числе имитация процессов функционирования сложной системы на ЭВМ. Сложные системы и процессы их функционирования становятся все более распространенным объектом исследования в технике. Конечной задачей современного эксперимента, как правило, является разработка модели, адекватной исследуемому процессу. Под адекватностью понимают верное воспроизведение в модели связей и отношений исследуемого процесса. Степень 23 адекватности определяется соответствием модельных и экспериментальных результатов. В то же время, экспериментальное исследование сложных процессов должно дополняться моделированием, когда эксперименты ставятся в соответствии с предполагаемой моделью исследуемого процесса. Моделирование, с одной стороны, позволяет четко поставить задачу эксперимента, а с другой, способствует анализу его результатов. Сравнение модельных и экспериментальных данных устанавливает влияние на результаты процесса новых факторов или роль ранее не учитывавшихся явлений. Вместе с тем, сочетание экспериментального исследования и моделирования, когда эксперимент осуществляется непосредственно на объекте в соответствии с предполагаемой моделью исследуемого процесса, приводит к повышению адекватности модели исследуемому процессу. Большинство современных процессов характеризуется наличием значительного числа разнообразных факторов, влияющих на процесс; большим количеством внутренних связей между факто рми а и их сло жным взаимным влиянием на процесс; развитием различных направлений процесса, конкурирующих между собой и определяющих его ход; воздействием на процесс большого числа неконтролируемых и неуправляемых факторов, играющих роль возмущений. При моделировании, как правило, анализируется не все многообразие явлений, определяющих исследуемый процесс, а лишь те, которые существенны для решения поставленной задачи. Модель — это упрощенная система, отражающая отдельные, наиболее важные стороны явлений изучаемого процесса. Один процесс можно описать различными моделями, в то время как одна модель может описывать различные процессы. При этом удается использовать результаты моделирования одних процессов для описания других, полученных с учетом их различной физической природы. Процесс моделирования должен удовлетворять следующим требованиям: – эксперимент на модели должен быть проще, оперативнее и экономичнее, чем на объекте; – должно быть известно правило, по которому можно перенести результаты исследования модели на объект. На практике различают два вида моделирования: физическое и математическое. Физическое моделирование — воспроизведение постоянства определяющих критериев подобия. Физической моделью некоторой системы называют систему той же или иной природы, которая частично или полностью воспроизводит свойства (главным образом — динамические) исходной системы (объекта моделирования) в рамках заданного приближения. При физическом моделировании для исследования процесса в качестве физической модели часто используют процесс другой физической природы, описываемой аналогичным математическим аппаратом. Чаще всего в качестве модели используются электрические и электромагнитные процессы. При этом исходные моделируемые процессы могут иметь разнообразную физическую природу (механическую, тепловую, 24 гидродинамическую и др.). Это связано с простыми и точными методами измерения параметров электрических и магнитных цепей. Разновидностью физического моделирования является исследование процесса той же физической природы, что и исходный моделируемый процесс, но в другой области параметров (так называемые масштабные модели). В обоих приведенных случаях существенно облегчается сам процесс измерения параметров при соответствующем выборе физической модели. Физическое моделирование иногда является альтернативой математического моделирования, но часто они дополняют друг друга. Математическое моделирование — это метод качественного и (или) количественного описания процесса с помощью так называемой математической модели, при построении которой реальный процесс или явление описывается с помощью того или иного адекватного математического аппарата. Математическое моделирование является неотъемлемой частью современного исследования. Математическая модель сложного процесса, непосредственное проведение экспериментов на котором часто практически невозможно, позволяет исследовать его динамику, давая количественное описание процесса, и одновременно устанавливает изменения качественного характера в динамике (бифуркации или «катастрофы»). Моделируемые процессы весьма разнообразны по своей природе и степени сложности. В связи с этим существуют различные подходы к их анализу и способу построения моделей. Все процессы делятся на детерминированные и стохастические. Детерминированными называются такие процессы, динамика которых полностью определяется начальными условиями, и динамические переменные являются функциями времени. Поэтому динамику можно однозначно предсказать на основе изучения его механизма. Стохастическими процессами называются такие, параметры которых изменяются случайно, под воздействием неконтролируемых дестабилизирующих воздействий, поэтому однозначно предсказать поведение таких процессов на основе их изучения затруднительно; можно говорить лишь о вероятности того или иного типа их поведения. В стохастических системах динамические переменные при фиксированных начальных условиях могут принимать различные значения. В то же время, может быть определена вероятность заданного значения динамической переменной и ее среднего значения. Стохастическое поведение может быть следствием случайных воздействий на динамическую систему или, что очень существенно, выражать внутренние свойства системы. Стохастический процесс может быть следствием особенности системы и возникает при определенных условиях даже без внешних воздействий Математическое моделирование позволяет установить условия,, при которых динамическая система переходит от детерминированного процесса к стохастическому. В соответствии с характером изучаемого процесса строятся: жесткие или вероятностные модели. Жесткие (детерминированные) модели строятся обычно без использования статистических вероятностных распределений. В этом случае определенному 25 значению входного параметра процесса соответствует вполне определенное значение его выходного параметра. Связь между входным и выходным параметрами в этом случае является функциональной связью. Значительно сложнее обстоит дело с вероятностными моделями, описывающими стохастические процессы. Большинство изучаемых современных процессов носят, как правило, случайный характер, когда выходной параметр связан с входным параметром статистически, т. е. нельзя заранее с точностью, характерной для функциональной связи, предсказать значение выходного параметра, соответствующее определенному значению входного. Математическое моделирование Математическое моделирование является типичной дисциплиной, находящейся, как сейчас часто говорят, «на стыке» нескольких паук. Адекватная математическая модель не может быть созвана без глубокого знания того объекта, который «обслуживается» математической моделью. Классификация математических моделей на основе особенностей применяемого математического аппарата. В ней можно выделить следующие их разновидности. Математические модели с сосредоточенными параметрами. Обычно с помощью таких моделей описывают динамику систем, состоящих из дискретных элементов. С математической стороны — это системы обыкновенных линейных или нелинейных дифференциальных уравнений. Математические модели с сосредоточенными параметрами широко применяются для описания систем, состоящих из дискретных объектом пли совокупностей идентичных объектов. Математические модели с распределенными параметрами. Моделями этого типа описываются процессы диффузии, теплопроводности, распространения волн различной природы и т. п. Эти процессы могут быть не только физической природы. Математические модели с распределенными параметрами широко распространены в биологии, физиологии и других науках. Чаще всего в качестве основы математической модели применяют уравнения математической физики, в том числе и нелинейные. Математические модели, основанные на экстремальных принципах. Общеизвестна основополагающая роль принципа наибольшего действия в физике. Например, все известные системы уравнений, описывающие физические процессы, могут быть выведены из экстремальных принципов. Однако и в других науках экстремальные принципы играют существенную роль. Математические модели в виде интегро-дифференциальных уравнений. Во многих процессах, в которых участвуют большое число объектов, существенную роль играет суммарный результат многих взаимодействий. Концепция последовательного усложнения разрабатываемой модели Одним из важнейших первичных этапов математического моделирования является выбор концепции моделирования. Обычно математическая модель включает некоторые фундаментальные первичные законы, а также частные закономерности специфических для рассматриваемого объекта процессов. Не 26 следует стремиться с самого начала работы к созданию адекватной модели рассматриваемого процесса. Однако попытка сразу, с первого подхода, достигнуть высокой адекватности имеет шансы на реализацию только при наличии большого опыта математического моделирования именно в рассматриваемой области. При моделировании в новой области можно рекомендовать следующий подход к решению задачи. На первом этапе следует создать «грубую», по терминологии академика А. А. Андронова, или чаще «максимально грубую» модель. Речь идет об учете только и большого числа самых существенных факторов. Разумеется, претендовать на высокую адекватность «грубой» модели не приходится. Однако работа с такой моделью разовьет интуицию исследователя и составит базу для создания следующей, более адекватной модели, в которую целесообразно включить дополнительный фактор по сравнению с теми, которые вошли в первую — самую < грубую» модель. Получив вторую модель, следует проверить, даст in правильный результат предельный подход к первой модели. »Тот переход можно осуществить, если, например, устремить к нулю какой-либо параметр, значение которого связано с дополнительным фактором, введенным во вторую модель. В результате предельного перехода будут получены уравнение «грубого» приближения и его решение. Такая проверка с помощью предельного перехода может быть проведена, как при численном решении задачи, так и пр и аналитическом. Метод последовательного усложнения модели введением дополнительных факторов или процессов может продолжаться до достижения необходимой адекватности модели. Именно так поступают па практике, постепенно переходя от простого к более сложному. 15 качестве имитационной модели исследуемого процесса сначала рассматривается модель в виде линейного полинома (1-го порядка), как наиболее простой и грубой модели, составленной на основании (1.32), и осуществляется первоначальное планирование п проведение эксперимента. Только после анализа и оценки результатов эксперимента переходят к более сложной предполагаемой имитационной модели (2-го порядка), на основании которой вновь осуществляют планирование и проведение эксперимента. 11осле чего вновь проводятся анализ и оценка результатов эксперимента. Этот процесс усложнения имитационной модели продолжается до достижения необходимой адекватности математической модели исследуемому процессу. К преимуществам системы разработки математических моделей, основанной на принципе постепенного перехода от простого к более сложному, следует отнести: развитие интуиции в ходе моделирования; дополнительный способ проверки правильности результатов; выявление роли дополнительных факторов и их взаимодействий, которые последовательно вводятся в модель. Другим важным методологическим приемом, облегчающим решение задач математического моделирования, является введение безразмерных переменных, которое чрезвычайно полезна и практике математического моделирования. Заметим, что анализ размерностей позволяет на самой ранней стадии моделирования установить безразмерные константы для рассматриваемого случая и их число. Основой этого анализа является так называемая П-теорема. 27 Другим эффективным инструментом математического моделирования является редукция систем динамических уравнений, т. е. уменьшение их числа без существенной утраты информативности. Однако в ряде случаев оказывается возможной редукция системы уравнений, которая связана с анализом скоростей процессов, описываемых отдельными уравнениями, входящими в систему. Если скорости одних процессов существенно превышают скорости других, то более быстрые за короткое время (по сравнению со временем установления равновесного состояния в медленных процессах) достигнут квазистационарного состояния. Это значит, что в «быстрых» уравнениях можно пренебречь производной по времени: соответствующие уравнения превратятся из дифференциальных в алгебраические (или трансцендентные). Следовательно, динамические переменные, относящиеся к быстрым процессам, могут быть исключены из уравнений, описывающих медленные процессы. Все это приводит к редукции системы. Метод редукции особенно эффективен при исследовании больших систем. Во многих случаях математическая модель дает только качественные описания реального объекта. Однако не следует думать, что это слабый результат. Знание особенностей поведения системы вносит значительный вклад в понимание исследуемого процесса. Качественное описание объекта является первым этапом. Оно должно быть дополнено количественным описанием, т. е. моделированием с высоким уровнем адекватности. Наиболее высокий уровень адекватности достигнут при математическом моделировании многих физических процессов. Однако к высокому уровню адекватности не всегда целесообразно стремиться. Следует иметь в виду, что чем выше уровень адекватности, тем сложнее математическая модель, обеспечивающая этот уровень, и, следовательно, труднее ею пользоваться. Часто возникают ситуации, в которых для численного решения задачи оказываются недостаточными имеющиеся средства вычислительной техники. В связи с этим возникает необходимость построения «конструктивной» модели, которая обеспечивает разумную в данной ситуации адекватность и, в то же время, достаточно компактна и допускает численные решения с использованием современной вычислительной техники. Иными словами, требования высокой конструктивности и адекватности не могут быть одновременно удовлетворены. Здесь необходим поиск разумного компромисса. При создании математической модели используются экспериментальные данные, характеризующие объект. Например, это могут быть данные, характеризующие отдельные процессы, а также схема системы, как целого. В таких случаях иногда ошибочно утверждают, что математическая модель не может дать ничего сверх того, что в нее первично заложено на основе экспериментальных данных. Этот неверный взгляд часто приводит к недооценке роли математического моделирования. В действительности математические модели обладают предсказательной способностью; из них следуют результаты, которые не были первично заложены и не могут быть получены путем непосредственного осмысления экспериментальных данных. Предсказательные свойства математических моделей особенно ярко проявляются при моделировании больших систем. 28 Анализ бифуркаций (метод качественной теории дифференциальных уравнений) играет большую роль при разработке математической модели. Этот метод позволяет анализировать поведение динамической системы, не получая ее решения. В результате устанавливают наличие бифуркаций — существенных изменений поведения динамической системы, а также параметры этой системы, при которых возникают бифуркации. Бифуркации могут проявляться в виде пороговых эффектов. Это явление наблюдается, например, при функционировании лазеров. Большую роль играют также бифуркации, при которых система входит в колебательный, точнее, автоколебательный режим. Особенностью автоколебательного процесса является отсутствие внешней возмущающей силы. Автоколебания являются следствием внутренних свойств нелинейной колебательной системы. Выявление наиболее существенных факторов исследуемого процесса На первых этапах при исследовании сложных процессов необходимо учитывать очень большое количество факторов. При этом, чем меньше априорных сведений об исследуемом процессе, тем обычно большее количество факторов, информация о влиянии которых на выходной параметр Y не достаточна, включается в план эксперимента. Потом многие из них могут быть отброшены, как невлияющие или мало влияющие на процесс, однако, чтобы не пропустить существенные факторы, в начале исследования экспериментатор вынужден учитывать десятки факторов и их взаимодействий. Отсюда возникает необходимость в предварительном отсеивании несущественных факторов. Кроме того, на нервом этапе исследования и не требуется точная количественная оценка влияния входных параметров па выходную величину, здесь необходима лишь качественная оценка влияния, т. е. первоначальный этап предусматривает разработку «грубой модели». Рассмотрим основные методы, которые позволяют с минимальными затратами выделить из большого числа факторов доминирующие, оказывающие наиболее существенное влияние на ход процесса. Метод ранговой корреляции Поскольку даже небольшое уменьшение числа факторов приводит к значительному сокращению опытов, возникает вопрос об использовании априорной информации для предварительного отсеивания несущественных факторов. Метод ранговой корреляции позволяет в ряде случаев сравнительно просто отбросить несущественные технологические факторы, основываясь на опросе мнения специалистов, работающих в данной области. Поэтому с этого метода следует начинать эксперимент, особенно для начинающего исследователя, априорные сведения которого об исследуемом процессе, как правило, малы. Процедура определения степени влияния технологических факторов на выходной параметр этим методом сводится к следующим этапам. I. Составление перечня факторов, оказывающих влияние на функцию отклика. После того, как экспериментатор проанализировал литературные источники об исследуемом процессе, он составляет перечень факторов, которые по 29 сведениям этих источников могут оказывать влияние на интересующий исследователя выходной параметр процесса. II. Ранжирование и расширение списка факторов. Возможно более широкому кругу специалистов (представителям различных школ) предлагается расположить составленный перечень факторов в порядке убывания степени их влияния на выбранный выходной параметр исследуемого процесса. При этом представленный список факторов каждым из опрашиваемых может быть дополнен, если по его мнению он является неполным. III. Составление матрицы рангов Результаты опроса представляют в виде таблицы — матрицы рангов (табл. 1.1), где для каждого фактора указывается место (значение aij), занимаемое им в анкете специалиста, номер которого или фамилия указывается в первом столбце матрицы. Первое место (ему присваивается ранг aij=1) соответствует наиболее существенному фактору, т.е. фактору Xi, оказывающему наиболее существенное влияние па интересующую исследователя функцию отклика Y, т. е. выходной параметр исследуемого процесса. По мере уменьшения влияния фактора величина ранга aij возрастает. Иногда матрица рангов строится с учетом квалификации опрашиваемого; в этом случае показания специалистов умножаются на коэффициент, присваиваемый в соответствии с его квалификацией, а значение aij соответствует результату этого перемножения. При выборе коэффициентов следует также ранжировать опрашиваемых специалистов, исходя из их опыта и всеобщего признания, ставя на первое место (присваивая им коэффициент aij равный 1) специалистов, чье мнение вызывает наибольшее доверие. Часто то или иное место в ранге специалистов может отдаваться нескольким экспертам. Тогда им присваивается один и тот же коэффициент. Чем меньше сумма рангов рассматриваемого фактора Xi, тем более высокое место он занимает в ранжировке, и, следовательно, большее влияние должен оказывать на выходной параметр. Таблица 1.1 – Матрица рангов Факторы ai2 ai3 aij aik an1 an2 an3 anj ank – – – – – – – – – – – – – – – n-й … Xk … … … ai1 … a12 a22 … a11 a21 … a1k a2kj X3 … … i-й Сумма рангов данного фактора a13 a23 X2 … … 1-й 2-й …Xj … a1j a2j X1 … Специалист n ∑ aij i =1 Cреднее арифметическое значение суммы n рангов ∑ aij i =1 n Абсолютное значение отклонения суммы 30 рангов от их среднего арифметического n значения ∑a i =1 n ij n − ∑ aij i =1 IV. Расчет коэффициента конкордации Для проверки согласованности мнений вычисляют коэффициент конкордации: W= 12 H , n k3 − k 3 ( ) опрошенных специалистов (1.1) 2 n ∑ aij k n i =1 где H = ∑ n − ∑ aij . j =1 i =1 Для подсчета коэффициента конкордации используют три последние строки матрицы рангов (табл. 1.1), т. е. сумма квадратов отклонения суммы рангов рассматриваемых факторов от среднего значения суммы рангов всех факторов. Коэффициент конкордации с помощью статистических методов позволяет определить, случайна или не случайна согласованность мнений специалистов: чем выше коэффициент конкордации, тем выше степень согласованности мнений специалистов. Коэффициент может принимать значения 0<W<1. Так, W=0 означает полное отсутствие согласованности между ранжировками специалистов, а W=1 показывает, что специалисты одинаково расположили факторы. По полученной матрице рангов (рассчитанные значения суммы рангов занесены в третью снизу строку матрицы) строят диаграмму рангов. Если распределение на диаграмме рангов (рис. 2.1, а) равномерно, а изменение суммы рангов незначительно, то это значит, что хотя специалисты и отводят неодинаковые места технологическим факторам в матрице рангов, но делают они это неуверенно. В этом случае целесообразно все факторы включить в эксперимент. Наиболее благоприятен случай быстрого экспоненциального уменьшения степени влияния факторов (рис. 1.1, б). При этом появляется возможность отбросить ряд факторов на основе проведенного опроса. В результате проведенной ранговой корреляции перед экспериментатором встает вопрос: какие факторы нужно учитывать при последующих исследованиях, а какие отбросить. Например, из анализа диаграммы рангов (рис. 1.1, б) следует, что фактор Х2 следует учитывать при проведении эксперимента, ибо он по мнению всех опрошенных специалистов оказывает влияние иа интересующий исследователя выходной параметр (функцию отклика Y исследуемого процесса) и, при этом, его влияние, по мнению большинства опрошенных специалистов, может быть существенным. В то же время, влияние фактора Х1 по мнению ряда специалистов хотя и носит систематический характер, но является сравнительно 31 несущественным. Рисунок 1.1 – Диаграммы рангов: а) равномерное распределение; б) экспоненциальное Другие же специалисты считают, что влияние этого фактора на выходной параметр носит не закономерный, а случайный характер и они предлагают его вообще не учитывать в эксперименте. При таком мнении специалистов у экспериментатора могут возникнуть сомнения: следует ли этот фактор учитывать в эксперименте при дальнейшей разработке модели, адекватно описывающей исследуемый процесс, или отбросить его, как несущественный факто р . Ответ на этот вопрос может дать эксперимент и последующий дисперсионный анализ его результатов. Однофакторный дисперсионный анализ Во многих областях практической деятельности встречаются объекты исследования, состояние которых определяется входными переменными (факторами), не имеющими количественного описания. Такими факторами могут быть неуправляемые и управляемые переменные, которые по каким-либо причинам не позволяют производить их измерение в данном эксперименте, а также те неконтролируемые переменные, уровни варьирования которых можно произвольно выбирать и фиксировать во времени. Для изучения влияния факторов подобного рода на выходную функцию объекта (отклик), их общего оценивания, ранжирования и выделения среди них существенных, очевидно, непригодны все методы отсеивания управляемых количественных факторов и метод регрессионного анализа неуправляемых факторов, поскольку эти методы предусматривают измерение уровней исследуемых факторов. Рассмотрим теперь постановку задачи в общем виде. Дано: – отклик Y может зависеть (по физическим причинам) от k независимых управляемых факторов X1, X2,…Xk, не имеющих количественного описания, и их парных взаимодействий; – каждый фактор Xi может варьироваться на m уровнях; – полный факторный эксперимент состоит из N серий независимых наблюдений по числу всех возможных неповторяющихся сочетаний k факторов: – каждая j-ая серия содержит nj наблюдений Yj1, Yj2, … Y jn j параллельных 32 опытов. Требуется: определить, в какой мере существенно на фоне случайных погрешностей влияние того или иного фактора Xi или взаимодействия факторов на отклик Y; провести сравнение с другими факторами и выделить наиболее существенные. Допущения, на которых базируется дисперсионный анализ: – наблюдение отклика Y – нормально распределенная случайная величина с центром распределения M{Y}. Таким образом, факторы определяют величину Y лишь в среднем, оставляя простор для случайных ошибок наблюдений, подчиняющихся нормальному распределению; – дисперсия единичного наблюдения, обусловленная случайными ошибками, постоянна во всех опытах и не зависит от X1, X2,…Xk. Из данных задачи и указанных допущений очевидно, что чем больше влияние некоторого фактора Xi на отклик Y, тем бо льше р асхождение между собой средних арифметических отклика Yξ в сериях параллельных наблюдений, сделанных при различных уровнях варьирования фактора Xi . Статистическая значимость такого расхождения указывает на существенное влияние фактора. Требуется одновременно сопоставить произвольно большое число средних и на основании этого сделать вывод о существенности влияния того или иного фактора. Из множества факторов, влияющих на рассеяние выходной величины Y, выбирается один, который, по мнению исследователя, имеет наибольшее влияние на это рассеяние. Остальные факторы служат фоном (ошибкой эксперимента). Чтобы выявить эффект исследуемого фактора, его делят на несколько четко разделимых уровней, а остальные факторы рандомизируют. Число экспериментов при этом может быть случайным или определенным по специальной методике из условия минимальной различимости эффектов. Продолжительность экспериментальных исследований должна быть достаточной для того, чтобы учесть все факторы, влияющие на рассеяние выходной величины. По результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таблица 1.1), причем число наблюдений по разным уровням исследуемого фактора может быть разным. По данным таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемого фактора, то есть дисперсия между выборками S2A , и ошибки 2 эксперимента, то есть дисперсия внутри выборки Sот . Эти формулы представлены в таблице 1.2. Таким образом, сумма квадратов отклонений SSобщ и общее число степеней свободы N-1 делятся на две составляющие. Одна составляющая основана на дисперсии частных средних вокруг общего среднего X, а другая – на дисперсиях внутри выборок. 33 Таблица 3.1 – Результаты наблюдений однофакторного эксперимента Номер Уровни фактора наблюден 1 2 … j … k ия 1 y11 y12 … y1j … y1k yn1 yn2 yij … ynj y2k … yik … ynk … … … … y2j … n … … yi2 … yi1 … i … … y22 … y21 … 2 Суммы nj Y j = ∑ yij k Yi1 Yi2 … Yij … Yik Y = ∑ Yij j =1 i =1 Число наблюден ий Средние yij = Y j n j Квадраты сумм k n1 n2 … yi1 yi 2 Yi12 Yi 22 nk N = ∑ nj … yik y =Y N … Yik2 Y2 nj … … yij … Yij2 Таблица 1.2 – Схема определения дисперсий Число Источник степеней Сумма квадратов дисперсии свободы Внутри выборок n SSот = ∑ ∑ ( yij − yi ) 2 i =1 j =1 Между выборками SS A = n∑ ( yi − y ) 2 Общая k k i =1 SSобщ = ∑(y i =1,..., k j =1,..., n ij − y )2 ν1 = N − k ν1=k-1 ν 2 = N −1 j =1 Дисперсия k n S = ∑ ∑ ( yij − yi ) 2 ( N − k ) i =1 j =1 2 от k = S n∑ ( yi − y ) 2 (k − 1) i =1 2 A S 2 общ = [∑ ( y ij ] − y ) 2 ( N − 1) Если на выборочные наблюдения не оказывают влияния определенные факторы, то обе оценки дисперсий не отличаются друг от друга. Это можно проверить с помощью F-критерия (критерия Фишера), а именно 2 2 F= S A / S от . (1.1) 34 По таблице F-распределения (таблица А2 приложения А) находим значение Fкр для выбранного уровня значимостиβ и числа степ еней свободы ν1=k–1 и ν2=N–k. Если Fрасч<Fкр, то делается вывод о том, что результаты эксперимента не противоречат гипотезе об отсутствии эффекта уровней исследуемого фактора. Если Fрасч≥Fкр, то следует сделать вывод о том, что исследуемый фактор вносит существенный эффект в разброс выходной величины Y. Дисперсионный анализ более эффективно применять при значительном объеме выборки, так как в этом случае удается выделить даже слабый сигнал (влияние фактора) на фоне шума (ошибка эксперимента). Дисперсионный анализ можно использовать и при оценке нескольких факторов (как правило, не более трех) – двух- и трехфакторный дисперсионные анализы. В этом случае удается оценить влияние или его отсутствие не только самих факторов, но и их взаимодействий. Двухфакторный дисперсионный анализ Однофакторный дисперсионный анализ, при котором происходит полная рандомизация эксперимента, не всегда является лучшим способом его планирования. Очень часто выделение из общей дисперсии влияния только одного исследуемого фактора оказывается недостаточным, так как ошибка эксперимента может быть очень велика и интересующий эффект может быть не виден на фоне этой ошибки. Уменьшение ошибки эксперимента можно получить при разбиении эксперимента на группы опытов, так называемые блоки («блочное планирование»), соответствующие возможным причинам неоднородностей. В качестве блоков могут быть использованы уровни второго исследуемого фактора, или разные дни проведения экспериментов, или еще какие-либо условия. Такой план эксперимента способствует выявлению эффекта, связанного с изменением уровней обоих исследуемых факторов. Блоки в двухфакторном эксперименте представляют ограничение, наложенное на рандомизацию, которая в этом случае должна проводиться на каждом блоке отдельно. По результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таблица 4.1), причем в этом случае число наблюдений в каждом столбце должно быть одинаково. По данным этой таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемых факторов S2A и S2B , а также ошибки 2 эксперимента Sот (таблица 4.2). Для проверки гипотезы об отсутствии эффектов влияния по обоим исследуемым факторам вычисляются дисперсионные отношения: 2 2 2 2 (4.1) Fрасч А= SA / Sот ; Fрасч В= SB / Sот и сравниваются с табличными значениями обычным порядком. Двухфакторный дисперсионный анализ является самым удобным из простых планов и поэтому наиболее часто применяется на практике. Таблица 4.1 – Результаты наблюдений двухфакторного эксперимента k yi = Y j k Уровни 2-го Уровни 1-го фактора Yi 2 Y =∑y 35 y12 … y1j … y1k Y1 y1 Y12 2 y21 y22 … y2j … y2k Y2 y2 Y22 … yij … … Yi 2 … yi … Yi … … yik … yi2 … yi1 … i … y11 … k … … … j … … … 2 … 1 … фактора (блоки) 1 n yn1 yn2 … ynj … ynk Yn yn Yn2 Yij = ∑ yij Yi1 Yi2 … Yij … Yik Y – – yij = Yij n yi1 yi 2 … yij … yik – y – Yij2 Yi12 Yi 22 … Yij2 … Yik2 – – Y2 n i =1 Таблица 4.2 – Формулы для расчета оценок дисперсий Число Источник степеней Сумма квадратов рассеяния свободы Между уровнями 1-го фактора Между уровнями 2-го фактора (между блоками) k SS A = ∑ (Y j2 n) − (Y 2 nk ) k-1 j =1 n SS B = ∑ (Yi 2 n) − (Y 2 nk ) n-1 i =1 n Ошибка эксперимента Общая сумма Дисперсия i =1 j =1 k n j =1 i =1 Sот2 = SSот [(n − 1)(k − 1)] ∑ (Y j2 n) − ∑ (Yi 2 k ) +(Y 2 nk ) n nk-1 S B2 = SS B (n − 1) k SS от = ∑∑ Yij2 − (k-1)·(n-1) S A2 = SS A (k − 1) k SSобщ = ∑∑ Yij2 − (Y 2 nk ) i =1 j =1 2 Sобщ = SSобщ (nk − 1) Трехфакторный дисперсионный анализ (латинский квадрат) Дальнейшее уменьшение ошибки эксперимента можно получить введением еще одного исследуемого фактора, который выделит из общей дисперсии свою часть. При этом налагается еще одно ограничение на рандомизацию, что приводит к специальным планам эксперимента, называемым латинскими квадратами. Суть этого плана сводится к тому, что все три исследуемые фактора разбиваются на одинаковое число уровней n (как правило, n≥4), при этом уровни 36 1-го фактора располагаются по столбцам плана, уровни 2-го – по строкам, а уровни 3-го, обозначенные в виде латинских букв, – в поле плана, причем их комбинация должна быть такой, чтобы каждая буква встречалась в каждом столбце и в каждой строке только один раз (таблица 4.3). Построение плана эксперимента по типу латинского квадрата позволяет осуществить экономный перебор вариантов испытаний. Таблица 4.3 – План эксперимента типа латинский квадрат Уровни 2-го фактора Уровни 1-го фактора 1 2 3 4 1 2 a b b c c d d a 3 c d a b 4 d a b c По результатам испытаний вычисляется оценка дисперсий (таблица 4.4), которые позволяют построить дисперсионные отношения 2 2 2 2 2 2 (4.2) Fрасч А= SA / Sот ; Fрасч В= SB / Sот ; Fрасч С= SC / Sот Сравнение найденных дисперсионных отношений с табличными значениями и выводы о верности или неверности гипотез об отсутствии эффектов соответствующих факторов производятся как в предыдущих случаях. Символические значения в таблице 4.4 означают: суммы наблюдений по 1-му фактору (по строкам) n Yi = ∑ yijl ; i =1 суммы наблюдений по 2-му фактору (по столбцам) n Yl = ∑ yijl ; i =1 суммы наблюдений по 3-му фактору (по буквам) n Y j = ∑ yijl ; i =1 (например, суммируются все наблюдения, соответствующие букве a затем b и т.д.); общая сумма n n n i =1 l =1 j =1 Y = ∑ yi = ∑ yl = ∑ y j . Латинские квадраты применяются предпочтительно для оценки линейных эффектов изучаемых факторов на начальных этапах исследования. Таблица 4.4 – Формулы для расчета оценок дисперсий 37 Источник рассеяния 1 Между уровнями 1-го фактора (между строками) Между уровнями 2-го фактора (между столбцами) Между уровнями 3-го фактора (между латинскими буквами) Число степеней свободы Сумма квадратов Дисперсия 2 3 4 n-1 SS A = [(∑ Yi 2 ) n] − (Y 2 n 2 ) S A2 = SS A (n − 1) n i =1 n n-1 SS B = [(∑ Yl 2 ) n] − (Y 2 n 2 ) l =1 n n-1 SSC = [(∑ Y j2 ) n] − (Y 2 n 2 ) S C2 = SS C (n − 1) Sот2 = SSот [(n − 1)(k − 1) j =1 Ошибка эксперимента (n-1)·(n-2) SS от = SS общ − SS A − SS B − SS C Общая сумма 2 SS общ = ∑∑ Yil2 − (Y 2 n 2 ) n n -1 S B2 = SS B (n − 1) k i =1 l =1 2 S общ = SS общ (n 2 − 1) Методы насыщенных и сверхнасыщенных планов При исследовании сложных процессов исследователю приходится иметь дело с большим количеством факторов, которые способны оказать влияние на функцию отклика исследуемого процесса. Для первоначального построение «грубой модели» процесса желательно оставить только те факторы, которые оказывают сравнительно существенное влияние на функцию отклика, отбросив на первом этапе факторы, оказывающие незначительное влияние. Это можно сделать с помощью насыщенных и сверхнасыщенных планов. Метод насыщенных планов Насыщенные планы – планы, для которых число степеней свободы равно N–k=1, (5.1) то есть число вариантов условий проведения эксперимента (число номеров опытов) должно быть на единицу больше число рассматриваемых факторов. Необходимым условием применения насыщенных планов является отсутствие влияния эффекта взаимодействия факторов на функцию отклика исследуемого процесса. Соблюдение этого условия основано на предпосылке, что на выходной параметр исследуемого процесса оказывают влияние лишь линейные эффекты и не влияют взаимодействия факторов. При этом используют дробные реплики ПФЭ, стремясь к тому, чтобы все 38 экспериментальные данные, полученные при N условий проведения эксперимента, были бы использованы для оценки коэффициентов при соответствующих переменных. Если предполагается, что на функцию отклика исследуемого процесса способны оказывать влияние 15 факторов, то для отсеивания несущественных или оказывающих незначительное влияние факторов может быть использован ДФЭ типа 215-11 с числом различных условий эксперимента (минимальным числом опытов) N=16. Условие (5.1) в этом случае выполняется, так как N–k=16-15=1. Число опытов N=16 предусматривает применение ПФЭ типа 24. Полином первого порядка в этом случае имеет следующий вид: Y=b0+b1X1+b2X2+b3X3+b4X4+b12X1X2+b13X1X3+ +b14X1X4+b23X2X3+b24X2X4+b34X3X4+b123X1X2X3+ (5.2) +b124X1X2X4+b134X1X3X4+b234X2X3X4+b1234X1X2X3X4. Из приведенного полинома 1-го порядка (5.2) видно, что имеется 15 коэффициентов (без учета коэффициента b0). Поэтому, заменяя все члены полинома (5.2), учитывающие эффект влияния взаимодействия ранее выбранных четырех из пятнадцати рассматриваемых факторов, на одиннадцать оставшихся, получаем полином 1-го порядка с пятнадцатью факторами: Y=b0+b1X1+b2X2+b3X3+b4X4+b5X5+b6X6+b7X7+b8X8+ +b9X9+b10X10+b11X11+b12X12+b13X13+b14X14+b15X15. (5.3) 4 15-11 В (5.3) имеем дело не с ПФЭ типа 2 , а с ДФЭ типа 2 , на основании которого можно оценить все пятнадцать коэффициентов b1, b2, b3,…, b15. X5=X1X2X3X4; X10=X1X2; X6=X1X2X3; X11=X1X3; X7=X1X3X4; X12=X1X4; X8=X1X2X4; X13=X2X3; X9=X2X3X4; X14=X2X4; X15=X3X4. Проведя соответствующую замену в матрице ПФЭ типа 24 при использовании значений рассматриваемых в эксперименте 15-ти факторов, получим матрицу ДФЭ типа 215-11 (таблица 5.1). После проведения экспериментов производится вычисление коэффициентов по формуле (5.10). X3б X4б X5б X6б X7б X8б X9б X10б X11б X12б X13б X14б X15б + + + + + + X2б 1 2 3 4 5 6 X1б Номер опыта X0б Таблица 5.1 – Матрица насыщенного планирования – + – + – + – – + + – – – – – – + + – – – – – – + – – + – + – + + – + – – + + – – + – + + + + – – – + + + + + – – + + – + – + – – + + – + – + – + + – – – – + + – – + + + + + + – – 39 Yξ Y1 Y2 Y3 Y4 Y5 Y6 7 8 9 10 11 12 13 14 15 16 + + + + + + + + + + – + – + – + – + – + + + – – + + – – + + + + – – – – + + + + – – + + + + + + + + + – – + + – + – – + – + – + + – + – – + + – + – – + + – – + + – + – + – – + – + – – + + – – – – + + – + + – – + + – – + – + + – + – – + – + + – – + – + – + – + + + + + – – – – + + – – – – + + – – + + – – – – – – + + + + Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y15 Y16 Факторы, при которых коэффициенты в результате проведенной оценки по критерию Стьюдента оказались незначимыми, отбрасываются. На первых этапах исследования, когда создается «грубая» модель исследуемого процесса, допускается отсеивание несущественных факторов, исходя из значений полученных коэффициентов. Если рассматривать процесс с числом факторов k=17, то число опытов ПФЭ типа 24 будет недостаточным. Ближайшее минимальное число опытов можно получить с помощью ПФЭ типа 25, которое составляет N=32. Число опытов в данном случае значительно превышает число учитываемых в эксперименте факторов, но облегчается замена эффектов взаимодействия на линейные эффекты. Все линейные эффекты могут быть введены в план вместо эффектов взаимодействия более высокого порядка, чем парные (по сравнению с k=15), а следовательно, менее значимыми с точки зрения их влияния на функцию отклика. Действительно, X6=X1X2X3X4X5; X9=X1X2X4X5; X12=X1X3X4; X15=X2X3X4; X7=X1X2X3X4; X10=X2X3X4X5; X13=X1X4X5; X16=X2X4X5; X8=X1X3X4X5; X11=X1X2X3; X14=X1X3X5; X17=X2X3X5. Однако объем экспериментальной работы в данном случае увеличится не пропорционально увеличению числа рассматриваемых факторов, в отличие от предыдущего случая. При k=9; 17; 33 и т.д. использование дробных реплик от ПФЭ ведет к значительному увеличению числа опытов соответственно N=16; 32; 64 и т.д. Для того, чтобы увеличить насыщенность планов, разработаны ортогональные планы с N=12; 20; 24; 36 и т.д. Однако применение метода насыщенных планов для исследования сложных процессов ограничено, так как эффект влияния взаимодействия факторов на выходной параметр может быть значительным. Метод сверхнасыщенных планов (метод случайного баланса) Этот метод дает возможность отсеивать как линейные эффекты, так и их взаимодействия. Но применение этого метода предполагает, что число значимых 40 эффектов (оказывающих доминирующее влияние на функцию отклика) значительно меньше общего числа взятых под подозрение. Для выявления существенных факторов используются сверхнасыщенные планы – планы, где число опытов меньше числа исследуемых эффектов, включенных в эксперимент, то есть число степеней свободы меньше единицы. При этом предполагается брать случайные выборки из ПФЭ, таким образом, совместные оценки оказываются смешанными некоторым случайным образом, поэтому другое название метода – метод случайного баланса. Этот метод позволяет решить основную задачу отсеивающих экспериментов – выявить доминирующие факторы среди очень большого их числа, включенных в исследование, как потенциально способных оказывать влияние на выходной параметр. Для построения матрицы планирования все факторы разбиваются на группы. Для получения несовмещенных оценок целесообразнее эту разбивку производить так, что бы в кажду ю гру ппу вхо дили факторы, характеризующие определенные моменты исследуемого процесса. При исследовании технологического процесса производства электронных средств, желательно составлять группы факторов в соответствии с последовательностью операций технологического процесса. Для каждой группы строится матрица планирования, соответствующая ДФЭ или ПФЭ. Поэтому лучше составлять группы не более чем из 3 - 5 факторов, так как в этом случае для каждой можно взять ПФЭ, в котором перебираются все возможные комбинации уровней в группе. План эксперимента образуется случайным смешиванием строк групповых планов, которое выполняется с помощью таблицы случайных чисел. Полученный экспериментальный материал обрабатывается в несколько этапов с помощью диаграмм рассеивания результатов наблюдений по отдельным факторам. На первом этапе диаграмма рассеивания строится для каждого фактора (рисунок 5.1). По оси ординат откладываются экспериментальные значения рассматриваемой функции отклика, а по оси абсцисс – учитываемые в эксперименте факторы. Y – + X1 – + X2 – + X3 – + Xn факторы Рисунок 5.1 - Диаграмма рассеивания результатов наблюдений для отдельных факторов 41 Поле рассеяния экспериментальных точек (значений функции отклика) представляет собой две колонки точек, соответствующих нижнему и верхнему уровням варьирования каждым фактором. Слева располагаются все значения функции отклика для тех опытов, где данный фактор находился на нижнем уровне, а справа – на верхнем. Таким образом, над обозначением на оси абсцисс каждого фактора будет находиться N точек (суммарное их значение в двух колонках), соответствующих N результатам экспериментов. При анализе диаграммы рассеивания каждый фактор рассматривается не зависимо от других. В р зультате е имеются две гр ппы у о ыто п ,в в каждо й из кото р х ы анализируемый фактор зафиксирован на определенном уровне, а все остальные факторы изменяются случайным образом. Если фактор влияет на выходной параметр Y, то при переходе его с одного уровня на другой произойдет смещение центра распределения MY на величину βi = (MY)1 – (MY)2, (5.4) где βi – вклад данного фактора; (MY)1 – центр распределения значений функции отклика Y при нахождении фактора Xi на первом (нижнем) уровне; (MY)2 – центр распределения значений Y при нахождении фактора Xi на втором (верхнем) уровне. Вклад данного фактора проще всего оценить с помощью разницы медиан для нижнего и верхнего уровней. При этом, если число точек, находящихся на уровне, 2i, то медиана лежит между i-й и (i+1)-й точками, если же на уровне (2i+1) точек, то медианой является (i+1)-я точка. Существенные технологические факторы можно выделить, сравнивая визуально вклады факторов. Факторы, признанные существенными, то есть имеющие наибольшие вклады, могут быть оценены количественно. Для этого обычно составляется таблица с числом входов, соответствующим числу выделенных факторов (таблица 5.2). Таблица 5.2 – Вспомогательная таблица для количественной оценки факторов Входы таблицы I+ C+ I– I+ C– I– A+ A– Yi…Yξ .…… Y1 Y3 .…… .…… Y2 Y4 .…… .…… Y5 Y7 .…… .…… Y6 Y8 В каждую клетку таблицы заносятся результаты экспериментов в соответствии с уровнями, на которых находились выделенные факторы. При этом может оказаться, что некоторые клетки окажутся незаполненными. В этом случае надо сократить число входов таблицы, то есть уменьшить число выделяемых на 42 данном этапе факторов. Эти формулы отличаются от соответствующих формул для вычисления коэффициентов в ПФЭ или ДФЭ тем, что здесь дополнительно производится усреднение в каждой клетке. Это необходимо делать, так как в случайно сбалансированном эксперименте различным комбинациям уровней может соответствовать разное число опытов. Из (5.5) видно, что коэффициенты при соответствующих факторах определяются как разность средних значений функции отклика, соответствующих верхнему и нижнему уровням рассматриваемого фактора. Если количественная оценка подтвердила значимость выделенных визуально факторов, то их исключают из рассмотрения при последующих этапах обработки данных. Обычно ограничиваются сравнением абсолютных значений коэффициентов и если значения каких-то коэффициентов оказываются в несколько раз меньше, чем других, то соответствующие им факторы на данном этапе не исключаются, а вновь включаются в рассмотрение на следующем этапе. В то же время, факторы, которые по значениям коэффициентов признаются влияющими на процесс, исключаются из дальнейшего рассмотрения. Коэффициенты, характеризующие влияние факторов, вычисляются на первом этапе со значительной ошибкой, которая может быть много больше ошибки эксперимента, так как оценка факторов производится на «шумовом фоне», создаваемом всеми остальными факторами, среди которых присутствуют и невыявленные пока доминирующие факторы. В связи с этим оценка значимости коэффициентов по критерию Стьюдента может оказаться неэффективной, и ее на первом этапе не производят, а ограничиваются сравнением абсолютных значений коэффициентов, вычисленных в соответствии с (5.5). После исключения первой группы значимых факторов необходимо определить, являются ли существенными остальные факторы и эффект влияния взаимодействия факторов. Для этого проводят корректировку результатов эксперимента, полученных на первом этапе. Сущность этой корректировки состоит в том, чтобы на втором этапе исключить эффекты влияния на функцию отклика выявленных на предыдущем этапе значимых факторов. Для этого все экспериментальные результаты, находящиеся на одном из уровней, признанного существенным фактора, изменяют на величину b X i . Данная процедура аналогично проделывается с экспериментальными данными для всех остальных всех остальных выделенных на первом этапе факторов. По скорректированным результатам снова строятся диаграммы рассеивания и вся процедура повторяется. На очередной серии диаграмм рассеивания разность медиан факторов, признанных существенными, по которым производилась корректировка, станет равной или близкой к нулю. Иными словами эти факторы не будут мешать анализировать другие факторы и взаимодействия. На втором этапе диаграммы рассеивания строятся, как для отдельных факторов, так и для их взаимодействий, потенциально способных оказывать влияние на выходной параметр. Однако строить диаграммы рассеивания для всех 43 эффектов, взятых под подозрение, достаточно трудоемко, поскольку их число обычно велико. Поэтому сначала строят диаграммы рассеивания для линейных эффектов, а затем, проанализировав их, – лишь для тех взаимодействий, вклады которых достаточно велики. Пример Взаимодействие X8X9 будет иметь больший вклад, если появятся выделяющиеся точки как на уровне (X8X9)+, так и на уровне (X8X9)– (рисунок 5.2). В первом случае оба фактора X8 и X9 будут иметь одинаковые знаки, а во втором – разные. Таким образом, нужно строить диаграммы рассеивания лишь для взаимодействия таких факторов, которые имеют выделяющиеся точки, как на одинаковых уровнях, так и на разных. То есть одни части диаграмм рассеивания факторов должны повторять друг друга, а другие – быть зеркальными отображениями (рисунок 5.2). Взаимодействие может иметь значительный вклад, в то время, как каждый фактор в отдельности характеризуется небольшим вкладом. Процесс выявления существенных технологических факторов следует прекратить, а все оставшиеся факторы считать относящимися к «шумовому полю», когда на очередной серии диаграмм рассеивания все вклады окажутся примерно одного порядка и незначительными по величине. Y – + X8 – + X9 – + X8X9 факторы Рисунок 5.2 - Построение диаграммы рассеивания результатов наблюдений для взаимодействий факторов Наряду с такой чисто качественной и субъективной оценкой значимости, как самих факторов, так и их взаимодействий, применяют также количественные критерии эффективности проведения отсеивающих экспериментов, которыми можно пользоваться после того, когда выявлены значимые факторы и их влияние на результаты эксперимента скорректированы. Значимость выделенных факторов и их взаимодействий можно проверить с помощью критерия Стьюдента, подсчитав первоначально экспериментальное значение t-параметра, здесь дисперсии ошибок определения каждого из коэффициентов: 44 l S 2 {b} = S 2 {Ykξ }∑ (1 / m j ), (5.6) j =1 где Ykξ – значения функции отклика, полученные после корректировки результатов эксперимента; l S 2 {Ykξ } = ∑ [ S 2j ⋅ (m j − 1)] j =1 l ∑ (m j =1 j − 1) , (5.7) l – число клеток в таблице 5.2; mj – число значений функции отклика Y в j-й клетке независимо от того, скорректированы или не скорректированы они; S – дисперсия наблюдаемых в j-й клетке значений функции отклика Yi, Yξ и т.д.; m S = [1 (m j − 1)] ⋅ ∑ (Yξ − Y ) 2 . 2 j (5.8) j =1 Проверку с помощью t-критерия имеет смысл проводить на последнем этапе построения диаграмм рассеивания, когда исследователь считает, что выделены все существенные эффекты, и, следовательно, остаточная дисперсия определяется ошибкой эксперимента. В этом случае с помощью критерия Стьюдента проверяют один – два эффекта, имеющие наибольшие вклады на последней серии диаграмм рассеивания. Если эти эффекты окажутся незначимыми, то можно сказать, что все существенные факторы и взаимодействия выявлены. Критерием окончания отсева существенных эффектов может служить и Fкритерий: F = S 2 {Ykξ } S 2 {Y }, (5.9) 2 где S {Y} – дисперсия воспроизводимости или ошибка эксперимента. Все существенные факторы и взаимодействия считаются выявленными, если различие между S2{Ykξ} и S2{Y} незначительно и F≤Fкр; Fкр находится при ν1=N–1: ν2=n–1. Только в этом случае можно считать влияние факторов и их взаимодействий незначительным, а дисперсию значений функции отклика – обусловленной ошибками эксперимента. Эффективность проведения отсеивающих экспериментов можно проверить и с помощью критерия Пирсона χ ( 2-критерия). Сущность этой проверки заключается в том, что, если выявлены все эффекты, влияющие на процесс, и исключено их воздействие на выходной параметр, то его распределение должно быть, в соответствии с центральной предельной теоремой, близким к нормальному закону. Разброс Yξ после заключительной корректировки должен быть обусловлен лишь наличием «шумового поля» или случайных возмущений, воздействующих на процесс. Проверку гипотезы о близости распределения скорректированного (по всем диаграммам рассеивания) значения выходного параметра нормальному закону осуществляют с помощью критерия Пирсона. В этом случае часто применяют следующую формализованную методику: 1. Проводят построение упорядоченного вариационного ряда. Для этого производят следующие действия: – находят Ymax и Ymin; 45 – подсчитывают число интервалов K=1+3,332·lgn, где n – объем выборки, а K (число интервалов) округляют до целого значения; – определяют длину интервала l=(Ymax–Ymin)/K; – находят середину интервала Yi=(Yi+1–Yi)/2; – вычисляют относительную частоту попадания в интервал k pi=ni/n, где n = ∑ ni ; i =1 – строят гистограмму. 2. Определяют теоретическую вероятность того, что значение случайной величины попадет в интервал от Yi+1 до Yi. Для этого: k – находят выборочное среднее арифметическое Y = (1 / n)∑ (Yi ni ); i =1 k 2 2 – вычисляют выборочную дисперсию S = ∑[ni (Yi − Y ) ] (n − 1); i =1 – определяют среднее квадратическое отклонение S = S 2 ; – вычисляют значение t–распределения Стьюдента ti = (Yi − Y ) / S , причем ti определяется для границ интервалов; – проводят подсчет теоретической вероятности для каждого интервала ~p = Φ (t ) − Φ (t + 1) , где Φ – функция Лапласа Φ(-t)=1–Φ(t); значение Φ(t) находят i i i по таблице приложения. pi ; 3. Определяют теоретическую функцию распределения n~ 4. Вычисляют расхождение между эмпирической ni и теоретическими pi по критерию Пирсона функциями распределения n~ χ k 2 расч = ∑[(ni − n~pi ) 2 (n~pi )]. (5.10) i =1 5. Находят число степеней свободы ν=K–d–1, где d – число оцениваемых параметров, в данном случае d=2, так как оцениваются Y и S2. 2 6. Определяют табличное значение критерия Пирсона χ табл для ν и P (вероятности, представляющие собой уровень значимости, который выбирается равным 0,9; 0,95; 0,99). 2 2 7. Если χ табл > χ расч – гипотеза о соответствии распределения нормальному закону принимается. На практике, если P<0,1, необходимо проверить эксперимент, если возможно – повторить его. При появлении повторных расхождений следует попытаться найти более подходящий для описания экспериментальных данных закон распределения. На этапе отсеивающих экспериментов не ставится задача получения адекватной математической модели, поэтому целесообразнее брать большие интервалы варьирования, чтобы изменения выходной величины, вызываемые переходом фактора с одного уровня на другой, были различимы на фоне «шума». Таким образом, постановка отсеивающих экспериментов дает возможность: 46 – выявить среди множества факторов, взятых под подозрение, наиболее существенные, и тем самым сократить дальнейшие исследования; – определить требования к применяемому оборудованию и упростить управление процессом, тщательно контролируя лишь те параметры, которые оказывают наиболее сильное воздействие на интересующие исследователя показатели; – представить характер влияния технологических параметров на выходную величину процесса и правильно выбрать исходную точку и интервалы варьирования переменными для дальнейших экспериментов. Контрольные вопросы 1 Какие основные группы параметров сложного процесса, влияющие на его поведение Вам известны и в чем их особенность? 2 В чем отличие физического и математического моделирований? 3 В чем особенности моделирования процессов, характеризующихся функциональными и статистическими связями исследуемых параметров? 4 Как классифицировать модели, используя область их применения? 5 Какие преимущества при математическом моделировании дает введение безразмерных переменных? 6 Из каких условий определяются единицы измерения динамических переменных и независимой переменной при их «обезразмеривании»? 7 На чем основана возможность редукции системы динамических уравнений? 8 В чем принципиальное отличие метода ранговой корреляции от других методов исследования? 9 В каких случаях метод ранговой корреляции не дает желаемого эффекта? 10 Какова общая стратегия исследования при определении факторов, влияющих на процесс. 11 Для чего служат коэффициент конкордации? 12 Что характеризует матрица рангов? 13 Как по диаграмме рангов определить факторы, оказывающие существенное влияние на исследуемый процесс? 14 Какого типа практические задачи обычно решают методом дисперсионного анализа? 15 Как математически формулируется задача однофакторного дисперсионного анализа? 16 В чем заключается основная идея метода дисперсионного анализа? 17 Каким образом производится оценивание существенности влияния фактора в однофакторном дисперсионном анализе? 18 Как производится оценивание влияния двух факторов и их взаимодействий в двухфакторном дисперсионном анализе? 19 Чем ограничивается применение метода насыщенных планов при исследовании технологических процессов? 20 Почему при реализации метода сверхнасыщенных планов рекомендуется разбивать факторы на группы с учетом особенностей технологического процесса? 47 21 Почему общая матрица планирования эксперимента в методе сверхнасыщенных планов строится путем случайного смешивания строк групповых планов? 22 Каковы условия применения метода случайного баланса и почему они не мешают широкому использованию этого метода при исследовании технологических процессов? 23 Почему на каждой последующей серии диаграмм рассеивания повышается точность оценки рассматриваемых эффектов? 24 Где производится более точная оценка фактора: на диаграмме рассеивания или с помощью вспомогательных таблиц и рассчитываемых с их помощью коэффициентов регрессии? 25 Какова общая стратегия исследования при определении факторов, влияющих на процесс? 48 МОДУЛЬ №2 «АКТИВНЫЙ ЭКСПЕРИМЕНТ» Лекция2: Активный эксперимент. Планирование, проведение, анализ Изучаемые вопросы: Полный факторный эксперимент. Дробный факторный эксперимент. Центральные композиционные планы. Вопросы для самостоятельного изучения: Автоматизация обработки результатов Освоенные компетенции: ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 Активный эксперимент предусматривает активное вмешательство в исследуемый процесс, изменяя его по заранее разработанному экспериментатором плану. Примером проведения активного эксперимента являются ПФЭ, ДФЭ и центральные композиционные планы, подробно рассмотренные в гл. 4 и 5, когда значения исследуемых факторов в каждом опыте изменяются в соответствии с матрицей планирования эксперимента. К основным преимуществам активного эксперимента можно отнести следующие: – планирование эксперимента дает четкую последовательную логическую схему построения всего процесса исследования, т. е. известно ,что, когда и как надо делать; – внедрение активного планирования позволяет повысить эффективность исследований, извлечь наибольшее количество сведений об изучаемых процессах при ограниченных затратах, сократить объем экспериментальных исследований, повысить надежность и четкость интерпретации полученных результатов; – обработка результатов эксперимента осуществляется стандартными приемами, позволяющими формализовать процесс построения модели и сопоставить материалы различных исследований. Таким образом, при оптимизации исследуемых процессов активный эксперимент наиболее эффективен при исследовании в лабораторных условиях, т. е. на этапе оптимального проектирования. В то же время, в процессе производства технологический процесс постоянно подвергается воздействию случайных неконтролируемых возмущений, что приводит к смещению найденного в лабораторных условиях оптимума относительно технологических факторов. Чтобы иметь возможность оценить это смещение и вести процесс при наиболее благоприятных условиях, необходимо после проведения лабораторных исследований продолжить изучение технологического процесса в реальных производственных условиях. Наилучшие результаты при исследовании технологического процесса в производственных условиях, т. е. на этапе оптимального управления, дает пассивный эксперимент. Полный факторный эксперимент Планирование эксперимента Основной целью проведения современного эксперимента является разработка математической модели, адекватно описывающей процесс и 49 позволяющей осуществлять управление производством. При планировании эксперимента исследователь должен: – обеспечить высокую надежность и четкость интерпретации результатов экспериментальных исследований; – составить четкую и последовательную логическую схему построения всего процесса исследования; – максимально формализовать процесс разработки модели и сопоставления экспериментальных данных различных опытов одного и того же объекта исследований с целью широкого применения электронно-вычислительных средств. Всем требованиям отвечают статистические методы планирования эксперимента. Статистические методы планирования активного эксперимента являются одним из эмпирических способов получения математического описания статики сложных объектов исследования, то есть уравнения связи отклика объекта и независимых управляемых входных переменных (факторов). При этом математическое описание представляется в виде полинома k k k i =1 i≠ j i =1 Y = b0 + ∑ bi X i + ∑ bij X i X j + ∑ bii X i2 + ... , (6.1) где Y – функция отклика; X1, X2, …, Xk – факторы исследуемого процесса. Первый этап исследования – составление плана эксперимента, который определяет расположение экспериментальных точек в k-мерном факторном пространстве, иначе говоря, условия для всех опытов, которые необходимо провести. Обычно план эксперимента задается в виде матрицы планирования, каждая строка которой определяет условия опыта, а каждый столбец – значения контролируемых и управляемых параметров в исследуемом процессе, то есть значения факторов, соответствующих условию опыта. В последний столбец матрицы заносят значения функции отклика, полученные экспериментальным путем в каждом опыте, проведенным в соответствии с условиями, указанными в строках матрицы планирования эксперимента. Первый шаг – выбор центра плана, то есть точки, соответствующей начальному значению всех используемых в эксперименте факторов (x10, x20, …, xk0), в окрестностях которой в дальнейшем ставится серия планируемых опытов. Начальным значениям факторов будет соответствовать начальное значение функции отклика y0. Центр плана обычно выбирается на основе априорных сведений о процессе. Если же их нет, то обычно в качестве центра плана принимается центр исследуемой области. Второй шаг – задание интервала варьирования. Значения факторов в каждом опыте, в случае применения матрицы планирования эксперимента, отличается от начального их значения xi0 на величину интервалаΔ x. Одним из важнейших предварительных условий успешного проведения эксперимента с целью разработки математической модели, адекватной исследуемому процессу, является выбор оптимальной величины Δ x. Обычно интервал варьирования 50 выбирают в пределах 0,05 … 0,3 от диапазона варьирования исследуемого фактора. Третий шаг – для удобства обработки результатов опытов, проводится преобразование значений управляемых переменных (учитываемых в эксперименте факторов xi) к безразмерным величинам xiб = (xi – xi0)/Δxi, (6.2) где xi0 – базовое или начальное значение i-го фактора в центре плана; Δxi – значение интервала варьирования по i-му фактору; xi – текущее значение i-го фактора. Таким образом, в безразмерной системе координат верхний уровень фактора при проведении эксперимента равен +1, а нижний –1. Координаты центра плана равны нулю и совпадают с началом координат. При составлении матрицы планирования эксперимента верхний и нижний уровни переменных для упрощения записи можно заменять символами (+) и (–). Второй этап исследования. Разработку модели процесса следует проводить по принципу «от простого – к более сложному». В соответствии с этим принципом, планирование эксперимента начинают с предположения, что имитируемая модель исследуемого процесса является линейной и в соответствии с (6.1) имеет вид полинома 1-го порядка k k i =1 i≠ j Y = b0 + ∑ bi X i + ∑ bij X i X j . (6.3) Если после обработки и анализа результатов эксперимента выяснится, что сделанное предположение о линейности модели является ошибочным, то переходят к планированию эксперимента из предположения, что эта модель может быть представлена полиномом 2-го порядка и так далее до тех пор, пока не будет разработана адекватная исследуемому процессу математическая модель. Начнем рассмотрение наиболее распространенных статистических методов планирования экспериментов с полного факторного эксперимента. Полным факторным экспериментом (ПФЭ) называется эксперимент, реализующий все возможные неповторяющиеся комбинации уровней n независимых управляемых факторов, каждый их которых варьируют на двух уровнях. В этом случае учитывается влияние на функцию отклика исследуемого процесса не только каждого рассматриваемого в эксперименте фактора в отдельности, но и их взаимодействий. Первоначально рассмотрим случай воздействия на функцию отклика Y двух факторов X1 и X2. В соответствии с принципом «от простого к более сложному» предположим, что модель исследуемого процесса является линейной и в соответствии с (6.3) имеет вид Y = b0 + b1X1+ b2X2 + b12X1X2, (6.4) где b0 – значение функции отклика Y в центре плана; b1, b2 – характеризуют степень влияния факторов X1, X2 на функцию отклика Y (чем он больше по сравнению с другими коэффициентами, тем более весомый вклад в изменение функции отклика вносит данный фактор); b12 – характеризует весомость влияния взаимодействия 1-го и 2-го факторов на функцию отклика исследуемого процесса. 51 Все возможные комбинации для двух факторов (k=2), варьируемых на двух уровнях, будут исчерпаны, если мы поставим четыре опыта. Опытные точки расположатся в вершинах квадрата, центр которого совпадает с центром плана (р исунок 6 2. .) Каждо му из этих четырех опытов будет соответствовать свое значение функции отклика в зависимости от четырех различных сочетаний двух значений варьируемых в данном эксперименте факторов. Построим матрицу планирования ПФЭ для рассматриваемого случая и с учетом предполагаемой модели (6.4) исследуемого процесса. X2 Y3= f(x1= -1, x2= +1) Y4= f(x1= +1, x2= +1) X1 Y1= f(x1= -1, x2= -1) Y2= f(x1= +1, x2= -1) Рисунок 6.2 – Расположение экспериментальных точек для двух независимых факторов, варьируемых на двух уровнях Первый столбец матрицы представляет собой нумерацию опытов. Нумерация факторов осуществляется произвольно и в каждом конкретном случае определяется самим исследователем. Во втором столбце приводятся значения фиктивной переменной x0=+1, соответствующей коэффициенту b0. В последующих столбцах приводятся безразмерные символы, соответствующие верхнему и нижнему уровням варьирования факторов и их взаимодействий. При построении матрицы планирования ПФЭ существует следующее правило: первая строка матрицы в столбцах, соответствующих рассматриваемым в эксперименте факторам, заполняется безразмерным символом, соответствующим нижнему уровню значений фактора в эксперименте, то есть символом (–); продолжение заполнения столбца, соответствующего первому по порядку фактору, проводится последовательным чередованием противоположных знаков (безразмерных значений уровней варьирования фактора); все последующие столбцы, соответствующие другим пронумерованным по порядку факторам, заполняются с частотой смены знака вдвое меньшей, чем для предыдущего столбца. Заполнение столбцов, учитывающих взаимодействие факторов, производится как результат перемножения знаков соответствующих факторов в каждой строке. В последний столбец матрицы заносятся экспериментальные значения функции отклика, полученные в результате проведения каждого опыта. Матрица планирования для двух факторов приведена в таблице 6.1, ее называют матрицей планирования ПФЭ типа 22 (два фактора варьируются на двух уровнях). 52 Таблица 6.1 – Матрица планирования ПФЭ типа 22 Номер опыта x0б x1б x2б x1бx2б Yξ 1 + – – + Y1 2 + + – – Y2 3 + – + – Y3 4 + + + + Y4 Если в эксперименте используются три фактора, а предполагаемая математическая модель линейна, то она соответствует виду Y=b0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+b23X2X3+b123X1X2X3. (6.5) При варьировании каждым из трех факторов (k=3) на двух уровнях число опытов N будет составлять N=23=8. В этом случае опытные точки располагаются в вершинах куба, центр которого находится в начале координат (0,0,0) (рисунок 6.3). Матрица планирования ПФЭ составляется по описанным ранее правилам, и будет иметь следующий вид (таблица 6.2). Руководствуясь приведенным ранее правилом можно построить матрицу и для большего числа рассматриваемых в эксперименте факторов, число опытов в которой равно N = 2k, (6.6) где k – число учитываемых в эксперименте факторов. Но выражение (6.6) справедливо только для линейной модели, соответствующей полиному 1-го порядка (6.3), когда варьирование по каждому фактору достаточно проводить на двух уровнях. X2 Y3=f(-1;1;-1) Y7=f(-1;1;1) Y4=f(1;1;-1) Y8=f(1;1;1) (0;0;0) X1 Y1=f(-1;-1;-1) Y5=f(-1;-1;1) Y2=f(1;-1;-1) Y6=f(1;-1;1) X3 Рисунок 6.3 – Расположение экспериментальных точек в плане, соответствующем полиному 1-го порядка для трех независимых переменных При статистическом методе планирования эксперимента существует правило – число уровней варьирования, учитываемых в эксперименте факторов, должно быть, по крайней мере, на единицу больше порядка 53 полинома, для построения которого планируется эксперимент. Планирование эксперимента началось с предположения, что математическая модель исследуемого процесса соответствует полиному 1-го порядка, поэтому достаточно проводить варьирование каждого из k факторов на двух уровнях, а необходимое число проводимых опытов можно определить с помощью выражения (6.6). Номер опыта 1 2 3 4 5 6 7 8 X0б Таблица 6.2 – Матрица планирования ПФЭ типа 23 X1б X2б X3б X1бX2 X1бX3 X2бX3 X1бX2бX3б Yξ + + + + + + + + – + – + – + – + – – + + – – + + – – – – + + + + б б б + – – + + – – + + – + – – + – + + + – – – – + + – + + – + – – + Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Если анализ результатов эксперимента показывает, что линейная модель, соответствующая полиному первого порядка (6.3) не адекватна исследуемому процессу, то переходят к планированию и проведению следующего эксперимента исходя уже из предположения, что математическая модель соответствует полиному следующего порядка и так далее. Но при планировании эксперимента, основанного на математической модели, например, соответствующей полиному второго порядка k k k k Y = b0 + ∑ bi X i + ∑ bij X i X j + ∑ bii X + ∑ biijj X i2 X 2j i =1 i≠ j i =1 2 i i≠ j (6.7) Необходимо обеспечить варьирование по каждому из факторов уже на трех уровнях. Тогда необходимое число опытов, которое нужно провести в эксперименте, должно быть не менее N=3k , для полинома третьего порядка N=4k и так далее. Достоинства многофакторного планирования ПФЭ: 1 – Опытные точки находятся в оптимальном положении, то есть математическое описание исследуемого процесса оказывается более точным, чем при проведении опытов в точках, расположенных каким-либо другим образом. 2 – Планирование и проведение ПФЭ сравнительно просто, что объясняет его широкое применение на практике. 3 – Все факторы и соответственно коэффициенты полинома оцениваются независимо друг от друга, что обеспечивается независимостью и ортогональностью столбцов матрицы планирования. Проведение эксперимента Оно должно обеспечить сведение к минимуму влияния случайных параметров исследуемого процесса на функцию отклика. С целью уменьшения их влияния на конечный результат эксперимента, 54 необходимо придерживаться следующих требований: – предусмотреть проведение нескольких параллельных опытов при одних и тех же условиях, предусмотренных соответствующей строкой матрицы планирования (номером опыта); – необходимо рандомизировать неконтролируемые параметры процесса, то есть обеспечить их взаимную компенсацию. Для выполнения первого требования должно быть предусмотрено проведение не менее двух параллельных опытов (n = 2 ), а для бо лее высо ко й достоверности результатов их число увеличивают. В этом случае результаты n параллельных опытов для каждой строки матрицы планирования усредняют и при анализе результатов эксперимента используют именно усредненное значение функции отклика, соответствующие условиям опыта и подсчитываемое по следующей формуле: Yξ = n ∑ Yξ i =1 n, i (6.8) где ξ = 1, N – номер опыта по порядку, установленному первым столбцом матрицы; i – номер параллельного опыта в ее строке; yξi – значение функции отклика, соответствующее i-му параллельному опыту в ξ-м номере опыта; n – число параллельных опытов. Для выполнения второго требования порядок реализации условий опыта, предусмотренный первым столбцом матрицы, должен быть рандомизирован. Для этого перед непосредственной реализацией плана эксперимента для каждой из n серий опытов обычно с помощью таблицы случайных чисел (таблица А.4 приложения А) определяется последовательность опытов на исследуемом объекте. Обработка и анализ результатов эксперимента Обработка и анализ результатов ПФЭ предусматривает следующий порядок их проведения: 1. Оцениваются дисперсии среднего арифметического в каждой строке матрицы по формуле Sξ = ∑ (Yξi − Yξ ) n (n − 1), 2 2 (6.9) i =1 2. Проверяются однородности дисперсий. Так как даже о дна грубая ошибка может исказить результаты исследования, проведенного при небольшом числе экспериментов, то необходим контроль воспроизводимости результатов исследования, который осуществляется с помощью критерия Кохрена. Подсчитывают параметр G = max Sξ 2 N Sξ ∑ ξ =1 2 , (6.10) то есть вычисляют отношение максимального значения изменчивости (максимального значения дисперсии, определенного по (6.9)) среди N опытов к 55 сумме изменчивостей во всех N опытах. Найденное по (6.10) наибольшее экспериментальное значение G сравнивают с критичным (табличным) его значением Gкр. Критичное значение Gкр представляет собой максимально возможное значение параметра G, при котором гипотеза о воспроизводимости эксперимента еще может считаться справедливой. В этом случае максимальная изменчивость функции отклика, полученная в результате проведения n параллельных опытов, не отличается от ожидаемой среди N опытов. Задаваясь определенным значением коэффициента рискаβ, значение Gкр определяют в столбце таблицы А3 приложения А, соответствующем числу параллельных опытов (n) и строке, соответствующей числу номеров опытов (N). Если G ≤ Gкр, то «подозрительное» максимальное значение изменчивости не является «инородным», а представляет собой результат случайного рассеяния исследуемой функции отклика, то есть эксперименты воспроизводимы и их результаты можно использовать для оценки коэффициентов регрессии. Если G > Gкр, то эксперименты не воспроизводимы, то есть неконтролируемые и неуправляемые факторы создают на выходе слишком большой уровень «шума». Необходимо проверить следующую точку (имеющую второе по величине значение Sξ2) и так далее, то есть нужно выявить все точки, в которых эксперимент невоспроизводим. При этом можно увеличить число параллельных опытов. 3. Создается математическая модель объекта с проверкой статистической значимости коэффициентов полинома. После выполнения ПФЭ осуществляют независимую оценку коэффициентов полинома по следующей формуле: N bi = ∑ X iξ Yξ N , (6.11) ξ =1 где X iξ принимает значения +1 или –1 в соответствии с матрицей планирования. В числителе (6.11) фактически стоит сумма средних значений выходного параметра по всем опытам с учетом уровня независимой переменной Xi в ξ-м опыте. По формуле (6.11) можно найти также коэффициенты bij при произведениях факторов XiXj (i ≠ j). Значения этих коэффициентов показывают уровень влияния эффекта взаимодействия факторов Xi и Xj . После вычисления коэффициентов оценивается их значимость для определения степени влияния различных факторов на выходной параметр (функцию отклика). Основой оценки значимости является сопоставление абсолютного значения, например, коэффициента bi и дисперсии ошибки его определения S2{bi}. В это м слу чае с помо щью t-критерия (критерия Стьюдента) проверяется гипотеза о незначимости рассматриваемого коэффициента, то есть гипотеза о том, что bi=0 (проверка нуль-гипотезы). Значение параметра определяется по формуле: ti = bi S 2{b} . (6.12) При ортогональном планировании эксперимента дисперсии ошибок 56 определения каждого из коэффициентов равны между собой S 2 {b} = S 2 {Y } (nN ), (6.13) Дисперсия воспроизводимости S {Y} оценивается по формуле 2 N S {Y } = ∑ Sξ2 N . 2 (6.14) ξ =1 Коэффициент b признается значимым, если t для числа степеней свободы ν=N(n–1) больше или равен tкр (t ≥ tкр) , найденному по таблице А1 приложения А для заданного значения коэффициента риска β. В случае t<tкр, коэффициент признается незначимым. Статистическая незначимость коэффициента bi может быть вызвана следующими обстоятельствами: – уровень базового режима по данной переменной X0i (или по произведению переменных) близок к точке частного экстремума: bi ≈ ∂Y ( X 0 ) ∂X i = 0; – интервал варьирования ΔXi переменной выбран слишком малым; – данный фактор (взаимодействие факторов) не оказывает влияния на значение выходного параметра. Так как применение ортогональных планов дает возможность оценивать значения всех коэффициентов независимо друг от друга, тогда если один или несколько коэффициентов окажутся незначимыми, то они могут быть отброшены без пересчета остальных. Отбросив незначимые коэффициенты, получим уточненную имитационную модель в виде полинома, представляющую зависимость выходного параметра от технологических факторов. 4. Проверяется адекватность. Математическая модель должна достаточно верно качественно и количественно описывать свойства исследуемого явления, то есть она должна быть адекватна. Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического более чем на некоторую заранее заданную величину. Для проверки адекватности достаточно оценить отклонение предсказанного имитационной моделью значения выходного параметра Yξt от результатов эксперимента Yξ в точке Xξ факторного пространства. Оцениваем дисперсию адекватности по формуле N 2 S ад = ∑ (Yξ − Yξt ) 2 ( N − d ), (6.15) ξ =1 где d – число членов аппроксимирующего полинома. Если S ад2 не превышает дисперсии опыта S2{Y} ( Sад2 ≤S2{Y}), то полученная математическая модель адекватно представляет результаты эксперимента; если S ад2 >S2{Y}, то проверка гипотезы об адекватности проводится с помощью Fкритерия (критерия Фишера) при νад=N–d и ν=N(n–1). F = S ад2 S 2{Y }, (6.16) если F ≤ Fкр, то модель признается адекватной. Очевидно, что такая проверка возможна, еслиν 57 ад > 0, так как пр и N=d не остается степеней свободы для проверки нуль-гипотезы об адекватности. В этом случае можно провести косвенную проверку адекватности, поставив ряд экспериментов в центре плана. Различие между средним значением выходной величины, полученной в этих экспериментах, и свободным членом линейного уравнения может дать представление об адекватности модели. Если это различие незначимо, то можно предположить, что модель адекватна. При отрицательном результате проверки адекватности (модель недостаточно верно описывает процесс) необходимо либо переходить к уравнению связи более высокого порядка, так как, по-видимому, эксперимент ставился в области, близкой к экстремальной, либо, если это возможно, проводить эксперимент с меньшим интервалом варьирования ΔXi. Уменьшение интервала варьирования приводит к увеличению отношения помех к полезному сигналу, что обусловливает необходимость увеличения числа параллельных опытов для выделения сигнала на фоне шума, а также к уменьшению абсолютных значений коэффициентов bi, величины которых зависят от интервала варьирования и при чрезмерном его уменьшении могут стать статистически незначимыми. Если полученная модель адекватна, то возможны следующие ситуации: – Все линейные коэффициенты значимы. Полученную модель можно использовать для управления процессом и оптимизации его путем движения по направлению к экстремуму. – Один из коэффициентов резко выделяется по абсолютной величине. В этом случае движение по градиенту функции выродится в обычный однофакторный эксперимент. Поэтому следует повторить эксперимент, уменьшив интервал варьирования этого фактора или увеличив его для других факторов. – Некоторые из линейных коэффициентов незначимы. Ими можно пренебречь, если соответствующие факторы действительно не оказывают влияния на выходной параметр (например, если незначимым оказался включенный в исследование из осторожности фактор, который и по априорным сведениям не должен оказывать существенного влияния на функцию отклика). Если в этом уверенности нет, то необходимо поставить новую серию опытов, расширив интервалы варьирования у соответствующих факторов. – Некоторые или все линейные коэффициенты незначимы, но значимы коэффициенты взаимодействия bij. Такое положение может возникнуть из-за неудачного выбора интервалов варьирования, поэтому надо поставить новую серию опытов, увеличив интервалы варьирования у соответствующих факторов. Причиной подобной ситуации может быть и то, что эксперимент ставился в области, в которой линейное приближение является неудачной моделью поверхности отклика. В этом случае переходят к нахождению математической модели более высокого порядка. Дробный факторный эксперимент При большом числе учитываемых в эксперименте факторов ПФЭ становится громоздким и занимает очень большое время для своего проведения, так как число опытов с ростом учитываемых в эксперименте факторов увеличивается по экспоненте. Но при этом уменьшаются ошибки при 58 определении коэффициентов полинома, так как для оценки каждого из них используются все опыты. Число опытов можно сократить, если априорно известно, что на процесс не оказывают влияния те или иные взаимодействия. В этом случае можно использовать дробный факторный эксперимент (ДФЭ). Дробным факторным экспериментом называется эксперимент, реализующий часть (дробную реплику) полного факторного эксперимента. Предположим, что необходимо получить математическое описание процесса при трех учитываемых факторах X1, X2, и X3, оказывающих влияние на функцию отклика Y. При использовании ПФЭ для определения коэффициентов полинома 1-го порядка необходимо провести восемь (23) о пытов в со ответствии с матрицей планирования, приведенной в таблице 6.2. Число номеров опытов должно быть не менее числа коэффициентов полинома, в соответствии с которым планируется эксперимент. В данном случае предполагаемая математическая модель, описывающая исследуемый процесс, имеет вид полинома (6.5), содержащего восемь коэффициентов от b0 до b123. Однако, если взаимодействие между факторами X1, X2 и X3 отсутствует, можно воспользоваться матрицей планирования ПФЭ для двух факторов X1 и X2, приведенной в таблице 6.1, заменив в ней обозначение X1бX2б на X3б, соответствующее безразмерному значению фактора X3 на верхнем и нижнем его уровнях. Чередование знаков в этом столбце остается неизменным после замены символов в матрице планирования. Эксперимент в данном случае будет ставиться уже с включением третьего фактора, изменяющегося согласно столбцу X1бX2б ПФЭ (таблица 6.1), а предполагаемая математическая модель будет иметь вид полинома 1-го порядка, не учитывающего взаимодействия факторов, то есть Y=b0+b1X1+b2X2+b3X3 (7.1) Такой сокращенный план содержит половину опытов от требуемого их числа 2k согласно плану ПФЭ (в данном случае четыре опыта вместо восьми) и называется полурепликой от ПФЭ типа 2k. Условное обозначение такого плана: ДФЭ типа 2k-L, где k – число учитываемых в эксперименте факторов; L – число взаимодействий, замененных факторами, учитываемых в эксперименте. Для рассматриваемого случая трех факторов X1, X2, X3 матрица планирования ДФЭ типа 23-1 (X3б=X1бX2б) будет иметь вид (табл. 7.1): Таблица 7.1 Матрица планирования ДФЭ типа 23-1 (X3б=X1бX2б) Номер опыта X0б X1б X2б X3б Yξ 1 + – – + Y1 2 + + – – Y2 3 + – + – Y3 4 + + + + Y4 Приведенное планирование эксперимента дает возможность при обработке и анализе его результатов оценить в полиноме (3.17) свободный член b0 и коэффициенты b1, b2, b3.Однако при этом предполагается, что коэффициенты b12, b13, b23, b123 в полиноме (6.5) равны нулю. Поэтому 59 составление такой матрицы планирования эксперимента возможно лишь в том случае, если полностью отсутствует или пренебрежительно мало влияние на функцию отклика эффектов взаимодействия факторов исследуемого процесса. То лько в это м случае математическая модель, представленная полиномом, в котором отсутствуют члены, учитывающие эти взаимодействия (так как соответствующие им коэффициенты равны нулю), может быть адекватна исследуемому процессу. При использовании матрицы планирования ДФЭ мы получаем совместную оценку нескольких эффектов: факторов и их взаимодействий: X1б=X2бX3б, X2б=X1бX3б, X3б=X1бX2б (7.2) Поэтому подсчитываемые значения линейных коэффициентов b1, b2, b3 полинома по экспериментальным значениям функции отклика будут включать также значения коэффициентов, учитывающих эффект влияния взаимодействия факторов на функцию о тклика. В результате коэффициенты полином (7.1) будут иметь следующий вид: b'1 = b1+b23, b'2 = b2+b13, (7.3) b'3 = b3+b12, где b1, b2, b3 – действительные значения линейных коэффициентов полинома; b'1, b'2, b'3 – полученные их значения при наличии эффекта влияния взаимодействия факторов на функцию отклика. Для получения математической модели вида (7.1), адекватной исследуемому процессу, необходимо быть уверенным в отсутствии влияния взаимодействия факторов на экспериментальное значение функции отклика. Только при этом условии подсчитанные коэффициенты b'i будут искомыми значениями линейных коэффициентов bi. Если это условие не выполняется, то найденные значения линейных коэффициентов b'i будут отличаться от действительного значения bi на величину коэффициента bij , учитывающего эффект влияния парного взаимодействия двух других факторов (7.3). Эти эффекты не могут быть раздельно оценены при планировании, состоящем только из одной полуреплики ПФЭ. Раздельную оценку для линейных коэффициентов bi и коэффициентов bij можно провести, если поставить дополнительно еще четыре опыта в соответствии с матрицей планирования ДФЭ типа 23-1, приравнивая X3б= – X1бX2б, тогда матрица будет иметь вид (таблица 7.2): Таблица 7.2 –Матрица планирования ДФЭ типа 23-1 (X3б= – X1бX2б) Номер опыта X0б X1б X2б X3б Yξ 1 + – – – Y1 2 + + – + Y2 3 + – + + Y3 4 + + + – Y4 Подсчитанные коэффициенты b'i линейных членов полинома (7.1) будут включать реальные значения коэффициентов b12, b13, b23, но в отличии от (7.3) совместная оценка коэффициентов будет происходить с обратным знаком: 60 b''1 = b1 – b23, b''2 = b2 – b13, (7.4) b''3 = b3 – b12. Изменение знака объясняется тем, что для матрицы ДФЭ 23-1 взаимозависимость значений факторов имеет вид X1б = -X2бX3б, X2б = -X1бX3б, X3б = -X1бX2б (7.5) Теперь после постановки уже восьми опытов в соответствии с приведенными планами можно записать раздельные оценки b1=(b'1+b''1)/2; b2=(b'2+b''2)/2; b3=(b'3+b''3)/2; (7.6) b23=(b'1–b''1)/2; b13=(b'2–b''2)/2; b12=(b'3–b''3)/2. Таким образом, для получения раздельных оценок bi и bij необходимо было провести восемь опытов, то есть пришлось объединить две полуреплики от ПФЭ типа 23. Поэтому практически всегда имеет смысл начинать исследования с ДФЭ. Если в дальнейшем появятся сомнения в том, что какиелибо взаимодействия, ранее не включенные в план эксперимента, могут влиять на выходной параметр, то всегда имеется возможность расширить матрицу планирования до ДФЭ меньшей дробности или ПФЭ и найти раздельную оценку интересующих эффектов. В случае применения матриц планирования ДФЭ для исследования процессов, содержащих более трех факторов, нужно стремиться к тому, чтобы максимальное число линейных факторов оказалось не смешанным с парными взаимодействиями. Чем более высокие уровни взаимодействия будут заменены факторами из числа рассматриваемых в эксперименте, тем более высоким уровнем разрешающей способности для раздельной оценки коэффициентов полинома будет обладать матрица ДФЭ. Для формализации процедуры определения разрешающей способности дробной реплики, представленной в виде матрицы планирования ДФЭ при фиксированных k и l, вводятся понятия генерирующего соотношения (ГС) и определяющего контраста (ОК). В примере с тремя факторами X1, X2 и X3 генерирующими соотношениями являются X3б=X1бX2б и X3б= – X1бX2б, каждо е из ко торых характеризует соответствующую полуреплику от ПФЭ типа 23. Выражения ОК получаются умножением левой и правой частей приведенных ГС на их левую часть, то есть на X3б. При этом получаются элементы столбца матрицы планирования ДФЭ, соответствующие свободному члену b0 полинома, которые всегда равны единице, так как X2iб=1: 1 = X1бX2б X3б; 1 = – X1бX2б X3б. Определяющие контрасты позволяют определить всю систему совместных оценок факторов и взаимодействий, не изучая матрицы планирования. Для этого последовательно умножают обе части ОК на соответствующие эффекты и получают всю картину совместных оценок данной матрицы ДФЭ. Имея систему совместных оценок, можно формализовать процедуру построения плана ДФЭ, обеспечивающего высокую разрешающую способность при определении коэффициентов полинома. 61 Чтобы получить высокую разрешающую способность, стремятся таким образом построить план ДФЭ, чтобы линейные факторы были смешаны с взаимодействиями самого высокого порядка (они чаще бывают равными нулю) или с теми взаимодействиями, о которых априорно известно, что они не оказывают влияния на процесс. Оценить разрешающую способность помогает ГС, чем бо льше симво ло в входит в ГС, тем обычно выше разрешающая способность. По мере возрастания числа учитываемых в исследуемом процессе факторов можно применять реплики большей степени дробности (1/4, 1/8 и т.д.). При этом с ростом числа независимых переменных (учитываемых факторов) растет разрешающая способность дробных реплик, так как для линейной имитационной модели (3.3), соответственно возрастает порядок взаимодействия факторов и количество членов полинома, учитывающих эти взаимодействия, а следовательно, увеличивается точность оценки коэффициентов при линейных членах, смешанных с взаимодействиями высокого порядка. Число опытов, проводимых в соответствии с матрицей дробной реплики для раздельной оценки коэффициентов полинома, должно быть не менее числа коэффициентов в предполагаемой имитационной модели, включая коэффициент b0. Реализация плана ДФЭ ничем не отличается от реализации плана ПФЭ. Обработку и анализ результатов дробного факторного эксперимента проводят в полном соответствии с методикой, изложенной для ПФЭ. ЦЕНТРАЛЬНЫЕ КОМПОЗИЦИОННЫЕ ПЛАНЫ Разработка математической модели предусматривает принцип «от простого к более сложному», то есть постепенный переход исследователя от «грубой» модели к моделям, более точно описывающим исследуемый процесс. В имитационной модели, соответствующей полиному (6.1), этот принцип предусматривает в качестве следующего шага переход от полинома 1-го порядка вида (3.3) к полиному 2-го порядка (6.7). Шаговое движение к экстремуму продолжается до тех пор, пока исследователь не достигнет области, близкой к экстремуму (или «почти стационарной»), которая не может быть описана линейным приближением. Здесь уже становятся значимыми квадратичные эффекты. Близость к «почти стационарной» области можно установить, поставив ряд экспериментов в центре плана, определив среднее значение функции отклика Y0 и сравнить его с теоретическим значением b0, исходя из предполагаемой имитационной модели в виде полинома 1-го порядка (6.3). Вычисляемое для линейного уравнения значение b0 при реализации факторного эксперимента (ПФЭ и ДФЭ) в «почти стационарной» области является совместной оценкой для свободного члена и суммы квадратичных членов, так как безразмерные значения, стоящие в соответствующих столбцах матрицы ПФЭ, будут одинаковыми. Поэтому разность b0– Y0 может дать представление о кривизне поверхности отклика. «Почти стационарную» область обычно удается описать с достаточной 62 точностью полиномом 2-го порядка (6.7). Как уже говорилось в практическом занятии №6 число уровней изменения каждой из независимых переменных должно быть на единицу больше порядка полинома. Поэтому при увеличении числа учитываемых факторов применение ПФЭ типа 3k не рационально, так как это планирование характеризуется резким увеличением объема эксперимента. Сократить число опытов можно, используя центральные композиционные планы (ЦКП), ядром которых являются линейные ортогональные планы. Преимущество этих планов – для получения модели более высокого порядка достаточно добавить несколько специально спланированных экспериментальных точек к уже существующим (в которых был проведен ДФЭ или ПФЭ). Общее число опытов центрального композиционного плана при k факторах составит N = NФЭ + Nα + N0, (8.1) k где NФЭ = 2 – число точек ПФЭ или ДФЭ; Nα = 2k –число «звездных точек»; N0 – число опытов в центре плана. При построении планов используют различные критерии оптимальности планирования. Наиболее широкое применение получили следующие планы: – ортогональные; – рототабельные; – D-оптимальные. При ортогональном планировании коэффициенты уравнения полинома оцениваются независимо с минимальными дисперсиями, причем факторы с незначимыми коэффициентами можно сразу отбрасывать, без пересчета оставшихся значимых коэффициентов, как это необходимо при неортогональных планах. Рототабельные планы позволяют получать уравнения регрессии, предсказывающие значения выходной величины объекта с одинаковой точностью во всех направлениях на одинаковом расстоянии от центра плана. Точность оценивания коэффициентов полинома характеризуется эллипсоидом рассеяния их оценок. Планирование, при котором требуется, чтобы объем эллипсоида рассеяния оценок коэффициентов был минимальным, называется D-оптимальным. Центральный композиционный ортогональный план (ЦКОП) Планирование и проведение эксперимента При составлении матрицы планирования эксперимента этот план предусматривает проведение только одного опыта, условия которого соответствуют начальным значениям всех учитываемых факторов (в центре плана), то есть N0 = 0. Поэтому для ЦКОП выражение (8.1) примет вид N = 2k + 2k + 1, (8.2) Соответствующая матрица ЦКОП для имитационной модели исследуемого процесса, соответствующая полиному 2-го порядка при k=3, приведена в таблице 8.1. Условие ортогональности матрицы выполняется только для линейных членов соответствующего полинома 2-го порядка, представляющего собой 63 имитационную модель вида Y = b0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+ (8.3) 2 2 2 +b23X2X3+b123X1X2X3+b11X 1+b22X 2+b33X 3 Для приведения матрицы к ортогональному виду необходимо провести преобразование квадратичных переменных X2iξб. N 2 2 2 2 X iξбп = X iξб − X iб = X iξб − ∑ X i2ξб N , (8.4) ξ =1 где X i2ξбп – преобразованное (п) безразмерное (б) квадратичное значение i-го фактора, соответствующее ξ-му опыту. +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 –1 –1 +1 +1 –1 –1 +1 0 0 0 0 0 0 0 +1 –1 +1 –1 –1 +1 –1 +1 0 0 0 0 0 0 0 +1 +1 –1 –1 –1 –1 +1 +1 0 0 0 0 0 0 0 –1 +1 –1 +1 –1 +1 –1 +1 –α +α 0 0 0 0 0 –1 –1 +1 +1 –1 –1 +1 +1 0 0 –α +α 0 0 0 –1 –1 –1 –1 +1 +1 +1 +1 0 0 0 0 –α +α 0 X1бX2бX3б N0 X2бX3б Nα X1бX3б NПФЭ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X0б X1б X2б X3б X1бX2б Группы точек Номер опыта Таблица 8.1 – Матрица центрального композиционного ортогонального плана X21б X22б X23б Yξ –1 +1 +1 –1 +1 –1 –1 +1 0 0 0 0 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 +α2 +α2 0 0 0 0 0 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y15 +1 +1 +1 +1 +1 +1 +1 +1 0 0 +α2 +α2 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 0 0 0 0 +α2 +α2 0 Для выполнения условия ортогональности матрицы ЦКОП, помимо преобразования столбцов, соответствующих квадратичным членам полинома (8.3), и приведения значений, стоящих в них, к виду (8.4), необходимо величину звездного плеча α выбирать соответственно: при k < 5 α4+2kα2-2k-1(k+0,5)=0; (8.5) при k ≥ 5 α4+2k-1α2-2k-2(k+0,5)=0. (8.6) Ядро ЦКОП при k<5 составляет, как правило, ПФЭ типа 2k, а при k≥5 – ДФЭ типа 2k-1, так как во втором случае полуреплика от ПФЭ вполне обеспечивается возможность независимой оценки линейных членов полинома (8.3) и членов, учитывающих эффект взаимодействия факторов. Значения звездного плеча, подсчитанные на основании условий (8.5) и 64 (8.6), приведены в таблице 8.2. Таблица 8.2 – Значения звездного плеча ЦКОП k 2 3 4 1,00 1,215 1,414 α 5 1,547 6 1,724 7 1,885 Преобразовав соответствующим образом матрицу ЦКОП, приведенную в таблице 8.1, получим матрицу ЦКОП, которая полностью соответствует условию ортогональности (таблица 8.3) X3б +1 –1 –1 –1 +1 +1 –1 –1 +1 –1 +1 –1 +1 +1 +1 –1 +1 –1 –1 +1 +1 +1 –1 +1 +1 –1 +1 +1 +1 +1 +1 +1 +1 –1,215 0 0 +1 +1,215 0 0 +1 0 –1,215 0 +1 0 +1,215 0 +1 0 0 –1,215 +1 0 0 +1,215 +1 0 0 0 +1 –1 –1 +1 +1 –1 –1 +1 0 0 0 0 0 0 0 +1 –1 +1 –1 –1 +1 –1 +1 0 0 0 0 0 0 0 +1 +1 –1 –1 –1 –1 +1 +1 0 0 0 0 0 0 0 X1бX2бX3б X2б X2бX3б X1б X1бX3б 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X0б X1бX2б Номер опыта Таблица 8.3 – Преобразованная матрица ЦКОП, отвечающая требованиям ортогональности –1 +1 +1 –1 +1 –1 –1 +1 0 0 0 0 0 0 X21б X22б X23б Yξ 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,75 –0,73 –0,73 0,75 –0,73 –0,73 –0,73 0,75 –0,73 –0,73 0,75 –0,73 –0,73 –0,73 0,75 –0,73 –0,73 0,75 –0,73 –0,73 –0,73 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y15 Для приведенной в таблице 8.3 матрицы ЦКОП будет соответствовать имитационную модель следующего вида Y = b′0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+b23X2X3+ (8.7) 2 2 2 2 2 2 +b123X1X2X3+b11(X 1– X1 )+b22(X 2– X 2 )+b33(X 3– X 3 ). Для перехода от модели (8.7) к модели (8.3), необходимо пересчитать коэффициент b0, который будет в (8.3) определяться b′0= b′0 – b11 X1б2 – b22 X 2б2 – b33 X 3б2 или, в общем виде k b0 = b − ∑ bii X iб2 . ' 0 (8.8) i =1 65 Если выполняется условие (8.8), можно пользоваться полиномом 2-го порядка в общем виде для проведения эксперимента в соответствии с преобразованной матрицей ЦКОП. При применении ЦКОП получение идентичной информации во всех направлениях исследуемого пространства невозможно, так как дисперсии ошибок определения коэффициентов полинома различны, то есть точность предсказания выходной величины (значения функции отклика Y) в р азличных направлениях факторного пространства неодинакова – информационные поверхности не являются сферами. Обработка и анализ результатов эксперимента Обработка и анализ результатов для ЦКОП проводятся в том же порядке, как и для ПФЭ, с аналогичными формулами для оценки дисперсий среднего арифметического (6.8) и адекватности (6.14). Исключение составляют формулы для расчета коэффициентов полинома (6.10) и дисперсии их определения (6.12). В силу ортогональности матрицы ЦКОП все коэффициенты имитационной модели в виде полинома 2-го порядка определяются, как и для ПФЭ, независимо др уг о т друга. Но если пр и подсчете коэффициентов в соответствии с (6.10) в знаменателе используется одно и то же значение N (число номеров опытов), то в ЦКОП расчет коэффициентов полинома ведется по формуле N bi = ∑ ( X iξ Yξ ) ξ =1 N Xξ, ∑ ξ =1 2 i (8.9) где i = 1,2,…,k. Это означает, что при определении коэффициентов полинома в соответствии с выражением (8.9) значение знаменателя для различных групп коэффициентов будет различным. Для непреобразованной матрицы в соответствии с таблицей 8.1 значения знаменателей следующие: – для b0 15 X ∑ ξ =1 2 i 0ξ = 15; – для группы коэффициентов при линейных членах Xi полинома 15 X ξ = 8 + 2α ∑ ξ =1 2 i 2 ; – для группы коэффициентов XiXj или X1X2X3, учитывающих взаимодействие факторов (X ∑ ξ 15 =1 X j )ξ = 8; 2 i – для коэффициентов при квадратичных членах Xi2 полинома 15 ( X )ξ ∑ ξ =1 2 i = 8 + 2α 4 . Соответственно формула для расчета дисперсии найденных по (8.9) коэффициентов полинома, будет иметь вид 66 n S 2 {bi } = S 2 {Y } n∑ X i2ξ . (8.10) ξ =1 Расчет дисперсии воспроизводимости эксперимента S2{Y} при оценке дисперсий коэффициентов в (8.10) производится по формуле (6.13). Из сравнения (8.10) и (6.2) видно, что в ЦКОП дисперсия коэффициентов полинома будет различной для различных групп, в то вр емя, как для линейно й модели она постоянна. Для непреобразованной матрицы оценку дисперсии для всех групп коэффициентов легко получить, учитывая приведенные выше значения знаменателя в (8.9). Для приведенной матрицы ЦКОП в соответствии с таблицей 8.3 оценка дисперсии различных коэффициентов в общем виде может быть представлена, как S 2 {b0 } = S 2 {Y } (nN ). (8.11) k При k<5, когда ЦКОП базируется на ПФЭ типа 2 . S 2 {bi } = S 2 {Y } [n(2 k + 2α 2 )] , (8.12) S 2{bij } = S 2{Y } (n2k ) , (8.13) S 2{bii } = S 2{Y } {n[2k (1 − X i2 ) 2 + 2(α 2 − X i2 ) 2 + ( X i2 ) 2 ]}, (8.14) N 2 где X = ∑ X iξ 2 i N. ξ =1 При k≥5, когда ЦКОП базируется на ДФЭ типа 2k–1. [ ] S 2{bi } = S 2{Y} n( 2 k −1 + 2α 2 ) , (8.15) S 2{bij } = S 2{Y } (n2k −1 ) , (8.16) S 2{bii } = S 2{Y } {n[2 k −1 (1 − X i2 ) 2 + 2(α 2 − X i2 ) 2 + ( X i2 ) 2 ]}. (8.17) С учетом выражений (5.11)–(5.17) значение t-параметра, подсчитанное по (3.11), будет отличаться знаменателем для различных групп коэффициентов полинома. А это означает, что в отличие от линейного приближения, при ортогональном планировании на базе полинома второго порядка оценка значимости найденных коэффициентов полинома ЦКОП будет проводиться с различной точностью. Это означает, что точность определения математической модели исследуемого процесса во всех направлениях факторного пространства не одинакова. Различие в точности оценок коэффициентов полинома при описании областей, близких к экстремуму, особенно нежелательно, так как при планировании экстремальных экспериментов необходимо иметь высокую точность описания процесса именно в этих областях. В этом случае более удачным является центральное композиционное рототабельное планирование. Центральный композиционный рототабельный план (ЦКРП) Планирование и проведение эксперимента При центральном композиционном рототабельном планировании 67 информационная поверхность приближается к сферической, то есть точность Y во всех направлениях на одинаковом расстоянии R от центра планирования становится практически одинаковой S2{Y}→const при R=const. При этом, ЦКРП позволяет минимизировать ошибки в определении Y, связанные с адекватностью представления результатов исследования процесса имитационной моделью в виде полинома 2-го порядка. Это достигается тем, что, выбирая удаленные от центра плана «звездные точки» на осях координат для непрерывности информационной поверхности, они дополняются информацией из центра плана, представляющей собой сферу с нулевым радиусом, то есть информацией равноточной во всех направлениях. Удельный вес этой информации в общем объеме информации увеличивается, что достигается увеличением числа опытов (N0) в центре плана. Число опытов в центре плана зависит от числа учитываемых в эксперименте факторов, то есть N0 = f(k). При k=3 число опытов в центре плана N0=6 совпадает с числом звездных точек. Это приводит к увеличению числа опытов по сравнению с ЦКОП, но обеспечивает непрерывность информационной поверхности и ее идентичность независимо от поворота осей координат. При реализации рототабельных планов можно отказаться от постановки параллельных опытов для оценки воспроизводимости экспериментов, что уменьшает общее число опытов по сравнению с ЦКОП. Дисперсия воспроизводимости может быть оценена в этом случае по экспериментам в центре плана. Чтобы композиционный план был рототабельным, величина звездного плеча α выбирается из следующих условий: α=2k/4 при k<5; (8.18) α=2(k–1)/4 при k≥5. (8.19) Подсчитанные значения звездного плеча α и число центральных точек N0, в зависимости от числа учитываемых в эксперименте факторов, приведены в таблице 8.4. Таблица 8.4 – Значения звездного плеча и числа центральных точек ЦКРП k 2 3 4 5 6 7 α 1,414 1,682 2,00 2,00 2,38 2,83 N0 5 6 7 6 9 11 Для k=3 и соответственно N0=6 выражение (8.1) примет вид: N=2k+2k+6. (8.20) Тогда матрица планирования ЦКРП для k=3 будет иметь следующий вид (таблица 8.5). Таблица 8.5– Матрица ЦКРП 68 X2бX3б X1бX2бX3б N0 X1бX3б Nα X1бX2б Группы точек Номер опыта NПФЭ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X0б X1б X2б X3б +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 –1 –1 +1 +1 –1 –1 +1 0 0 0 0 0 0 0 0 0 0 0 0 +1 –1 +1 –1 –1 +1 –1 +1 0 0 0 0 0 0 0 0 0 0 0 0 +1 +1 –1 –1 –1 –1 +1 +1 0 0 0 0 0 0 0 0 0 0 0 0 –1 +1 +1 –1 +1 –1 –1 +1 0 0 0 0 0 0 0 0 0 0 0 0 –1 +1 –1 +1 –1 +1 –1 +1 +α –α 0 0 0 0 0 0 0 0 0 0 –1 –1 +1 +1 –1 –1 +1 +1 0 0 +α –α 0 0 0 0 0 0 0 0 –1 –1 –1 –1 +1 +1 +1 +1 0 0 0 0 +α –α 0 0 0 0 0 0 X21б X22б X23б +1 +1 +1 +1 +1 +1 +1 +1 α2 α2 0 0 0 0 0 0 0 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 0 0 α2 α2 0 0 0 0 0 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 0 0 0 0 α2 α2 0 0 0 0 0 0 Yξ Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y15 Y16 Y17 Y18 Y19 Y20 Из выр ажения (8 .2 0) следует, что для тр ех учитываемых в эксперименте факторов X1, X2, X3 в ЦКРП потребуется проведение не менее 20 опытов (таблица 8.5) по сравнению с 15-ю о пытами в случае применения ЦКОП (таблица 8.1). Причем, все эти дополнительные пять опытов проводятся в центре плана. Матрица ЦКРП не соответствует условиям ортогональности для столбцов с квадратичными членами полинома (8.3), поэтому оценка коэффициентов не будет являться независимой. Но этот недостаток ЦКРП компенсируется более высокой точностью определения Y во всех направлениях на одинаковом расстоянии R от центра плана. При этом следует учитывать, что ЦКРП использует независимую оценку коэффициентов полинома при линейных его членах, проведенную по результатам предыдущего полного или дробного факторного эксперимента. Обработка и анализ результатов эксперимента Обработка и анализ результатов ЦКРП отличается от ранее рассмотренных только в подсчете коэффициентов полинома и их дисперсий. Дисперсию воспроизводимости оценивают по экспериментам в центре плана, число которых значительно больше, чем в ЦКОП. Формулы для расчета коэффициентов полинома и их дисперсий при рототабельном планировании сложнее, чем при ортогональном: N k N b0 = ( A / N ) 2λ2 (k + 2)∑ ( X 0ξ Yξ ) − 2λC ∑∑ ( X i2ξ Yξ ); (8.21) ξ =1 i =1 ξ =1 69 N bi = (C / N )∑ ( X iξ Yξ ); (8.22) ξ =1 N bij = [C ( Nλ )]∑ ( X iξ X iξ Yξ ); 2 (8.23) ξ =1 N k N N bii = ( A / N ) C 2 [(k + 2)λ − k ]∑ ( X i2ξ Yξ ) − C 2 (1 − λ )∑∑ ( X i2ξ Yξ )− 2λC ∑ ( X 0ξ Yξ ); (8.24) ξ =1 i =1 ξ =1 ξ =1 2 2 2 S {b0 } = 2 Aλ (k + 2) S {Y } (Nn ); (8.25) { ( ) S {b } = (CS {Y }) (Nn ); S {b } = (A[(k + 1)λ − (k − 1)C S {Y }]) (Nn ); S {b } = (C S {Y }) (λNn ). 2 2 i 2 2 2 ii 2 2 2 ij где C=N (8.26) (8.27) (8.28) N X ξ; ∑ ξ =1 2 i A = 1 {2λ[(k + 2)λ − k ]}; λ = (kN ) {(k + 2)( N − N 0 )} Так же, как и при получении линейной модели, обработка результатов при реализации ЦКП предполагает статистические проверки гипотез воспроизводимости результатов экспериментов, значимости коэффициентов и адекватности моделей. Матрица ЦКРП позволяет минимизировать ошибки в определении Y, связанные с неадекватностью представления результатов исследования полиномом 2-го порядка. Полученная модель 2-го порядка может быть использована для нахождения оптимальных технологических режимов. При этом ее тщательно анализируют и методами аналитической геометрии приводят к канонической форме. Контрольные вопросы 1. Что называется полным факторным экспериментами? 2. Как выбираются факторы планирования, их основные (базовые) уровни и интервалы варьирования? 3. Указать порядок проведения эксперимента методом ПФЭ. 4. Как составляется матрица планирования ПФЭ? 5. Как выбрать центр плана эксперимента? 6. Чем определяется величина интервала варьирования фактора? 7. Почему необходимо проведение параллельных опытов и их рандомизация? 8. Как зависит число уровней варьируемых факторов от порядка имитационной модели, представленной в виде полинома? 9. В чем заключается смысл разработки математической модели по принципу «от простого – к сложному»? 10. Каков порядок статистической обработки и анализа результатов эксперимента? 70 11. При каких условиях не соблюдается требование воспроизводимости эксперимента и как следует поступить в этом случае? 12. Как проверить значимость оценок коэффициентов регрессии? 13. Поясните различие применения критерия Стьюдента для оценки выборочных средних значений случайной величины и оценки значимости коэффициента полинома. 14. При каких условиях оценки коэффициентов регрессии незначимы и как эти условия устранить? 15. Как проверить адекватность математической модели? 16. При каких условиях не соблюдается требование адекватности математической модели и как следует поступить в этом случае? 17. Что называется дробным факторным экспериментами? 18. В каких случаях возможно планирование ДФЭ? 19. Как можно оценить разрешающую способность матрицы ДФЭ? 20. Что такое генерирующее соотношение и как оно выбирается? 21. Что такое определяющий контраст и как с его помощью составляется система совместных оценок? 22. Указать преимущества факторного планирования эксперимента перед другими способами проведения активного эксперимента и пассивным экспериментом? 23. Когда и для чего используется ЦКП и в чем его отличие от планирования ПФЭ и ДФЭ? 24. Что является критерием оптимальности плана при ЦКОП и ЦКРП? 25. Как достигается ортогональность матрицы планирования при ЦКОП? 26. Почему при рототабельном планировании можно не проводить параллельных опытов? 27. В чем преимущество рототабельного планирования перед ортогональным и как оно достигается? 28. Каков порядок обработки результатов ЦКОП? 29. Каков порядок обработки результатов ЦКРП? 71 МОДУЛЬ №3 «ПАССИВНЫЙ ЭКСПЕРИМЕНТ» Лекция3: Пассивный эксперимент. Планирование, проведение, анализ Изучаемые вопросы: Проведение пассивного эксперимента в производственных условиях и информативность его результатов. Факторный анализ. Метод главных компонентов. Временные ряды. Планирование и обработка результатов пассивного эксперимента методами регрессионного анализа. Вопросы для самостоятельного изучения: Возникновение погрешностей. Автоматизация эксперимента. Освоенные компетенции: ПК-3, ПК-5, ПК-7, ПК-13, ПК-19, ПК-20 Пассивный эксперимент сводится к сбору и обработке данных, полученных в результате пассивного наблюдения за технологическим процессом в производственных условиях. Для анализа и обработки этих данных в настоящее время применяется достаточно большое число методов. К ним относится, в первую очередь, регрессионный и корреляционный анализы [10], а также факторный анализ, метод главных компонентов, временные ряды (дрейф параметров во времени) и др. В результате проведения регрессионного и корреляционного анализа исследуемого процесса в производственных условиях, можно определить уравнение регрессии и найти с помощью коэффициента корреляции степень взаимосвязи изучаемых переменных величин. Однако сами по себе уравнения регрессии и коэффициент корреляции мало что говорят о возможной причинной связи между рассматриваемыми переменными. Для установления этой связи можно использовать факторный анализ, который является довольно гибким количественным методом статистического анализа. Он в большей мере, чем другие методы, может применяться для проверки сложных гипотез и позволяет получить информацию о числе факторов в исследуемой системе, их природе и зависимости, а также степени этой зависимости. Так, по наблюдениям за вариациями 30 ...40 различных переменных можно с помощью факторного анализа получить конкретную информацию о том, что только пять факторов коррелируют между собой и каждый из них в той или иной степени влияет на изменения соответствующих исходных переменных. Этим путем можно проверить гипотезу, выдвинутую по результатам наблюдений, полученным при анализе другими методами. Кратко факторный анализ можно охарактеризовать следующим образом: – в основе анализа лежат результаты наблюдений над естественными изменениями переменных; – он позволяет выявить основные факторы, оказывающие существенное влияние в исследуемой области; – этот метод не требует предварительных гипотез, наоборот, он сам может служить основой их выдвижения, а также выступать критерием гипотез, опирающихся на данные, полученные другими методами; 72 – при анализе этим методом не требуется априорных предположений относительно того, какие переменные зависимы, а какие не зависимы. Он позволяет количественно оценить причинные связи и решить вопрос о степени их влияния в процессе дальнейших исследований; – с помощью факторного анализа можно рассматривать только линейные корреляционные связи. Наиболее существенным недостатком факторного анализа является отсутствие однозначного математического решения проблемы факторных нагр узо к, т. е. вклада о тдельных факто р во в изменения значений функции отклика. Метод главных компонентов позволяет осуществить анализ многомерных случайных величин. Если число рассматриваемых случайных величин, которые требуется обработать, слишком велико и интерес представляют только отклонения, то это число можно сократить, отбрасывая линейные комбинации, имеющие малые дисперсии. Предположим, имеется п переменных: Х [ , х2,...,хп. К ним применяется ортогональное преобразование для получения некоррелированных переменных у\, уч,..., уп, которые выбираются так, что у\ имеет максимум дисперсии, y-i — максимум дисперсии при требовании некоррелированности с у\ и т. д. Множество главных компонентов представляет собой удобную систему координат, а соответствующие дисперсии компонент характеризуют их статистические свойства. Таким образом, если факторный анализ ориентирован на корреляционную связь исследуемых параметров процесса, то метод главных компонентов — на их дисперсию. Временный ряд представляет собой совокупность измерений какой-либо характеристики в течение некоторого периода времени. Основной чертой этого метода анализа является существенность порядка, в котором производятся наблюдения. Природа ряда и структура порождающего его процесса предопределяют порядок образования последовательности. Пусть имеется временный ряд Y 1 Y2, - Yt. Тогда члены этого ряда можно представить в виде yt = f ( t ) + U ( t ) ( t = 1, 2,..., Т ) , где f ( t ) —некоторая полностью определенная последовательность (систематическая составляющая); U(t)—случайная последовательность, подчиняющаяся некоторому вероятностному закону. С точки зрения математической статистики нужно на основании ограниченного количества информации, получаемой из временного ряда конечной длины, сделать выводы о вероятностном механизме, порождающем этот ряд, проанализировать структуру, лежащую в его основе. Если структура известна, то рассматривается вопрос о предсказании последующих значений процесса, если же структура неизвестна, ее нужно оцепить по имеющимся данным и затем уже для предсказания использовать найденные оценки. Преимущество пассивного эксперимента состоит в том, что при его применении нет необходимости тратить время и средства на постановку опытов. 73 Полученные результаты можно затем использовать для управления процессом. Однако пассивный эксперимент имеет существенные недостатки, ограничивающие его применение для оптимизации технологических процессов. Во-первых, при сборе экспериментальных данных на действующем промышленном объекте во избежание появления брака возможно лишь незначительное изменение параметров технологического процесса. При этом интервалы варьирования технологическими факто р ами о бычно сто ль малы, что изменения выходной величины будут в большей степени обусловливаться воздействием неконтролируемых, случайных возмущений. Во-вторых, при пассивном эксперименте па производстве часто не рассматриваются факторы, оказывающие существенное влияние на процесс, либо из-за невозможности их регистрировать и изменять, либо из-за неполных сведений о процессе. Кроме того, в производственных условиях входные величины X зачастую измеряются с такими большими ошибками, что искажают результаты сильнее, чем ошибки в определении выходного параметра Y. Наконец, в-третьих, при пассивном эксперименте нет возможности произвольно варьировать технологическими факторами, в результате чего экспериментальные точки часто располагаются неудачно и даже при большом числе опытов нельзя получить точное описание исследуемого процесса. Но, несмотря на отмеченные недостатки, следует иметь в виду, что грамотно организованный пассивный эксперимент и анализ его результатов могут дать богатую информацию о реальном процессе и позволят не только скорректировать результаты предварительно проведенного активного эксперимента, но в ряде случаев, даже определить, как это будет показано в последующих параграфах данной главы, модель исследуемого процесса. Однако это требует глубокого познания механизма явлений изучаемого процесса, и чем он сложнее, тем очевиднее необходимость высокого' уровня предварительных теоретических знаний экспериментатора об исследуемом процессе. Метод регрессионного анализа Если объект исследования по техническим, технологическим или экономическим соображениям не допускает преднамеренного варьирования входных переменных в необходимом диапазоне, то для накопления статистического материала применяется пассивный эксперимент, заключающийся в наблюдении и регистрации значений входных\выходных переменных в режиме нормального функционирование исследуемого объекта. Применение метода пассивного эксперимента может быть успешным, если при его проведении соблюдаются необходимые условия, к которым относятся такие, как правильное определение времени регистрации данных, обеспечение независимости соседних измерений и входных переменных друг от друга, достаточный с точки зрения математической статистики объем экспериментальных данных. Выбор структуры модели является наиболее неформализуемой процедурой, так как исследователь до начала эксперимента, как правило, не располагает необходимой априорной информацией. 74 Построение модели существенно упрощается, если в качестве ее составляющих используются полиномы, которые следует включать в уравнение регрессии. Но прежде чем приступить к проведению эксперимента, необходимо выделить наиболее существенные входные факторы из всей совокупности входных величин , оценить степень корреляции между ними и исключить из числа подлежащих регистрации те из них, которые сильно коррелированы с другими. Регрессионный анализ служит для нахождения по результатам эксперимента связи выходного параметра с факторами, которые оказывают влияние на этот параметр. Регрессионный анализ позволяет получить математическую модель процесса на основе оценки коэффициентов регрессии в виде полинома. Классический регрессионный анализ базируется на так называемом "пассивном эксперименте", который сводится к сбору и обработке данных, полученных в результате пассивного наблюдения за производственными процессами. В регрессионном анализе вид связи между параметром Y и факторами Xi , обычно задается в виде разложения в ряд Тейлора: k k k i =1 i≠ j i =1 Y = f ( X 1 , X 2 ,..., X k ) = b0 + ∑ bi X i + ∑ bij X i X j + ∑ bii X i2 + ... , (9.1) где b0, bi, bij, bii – постоянные коэффициенты уравнения, оценки которых необходимо определить в результате постановки и проведения пассивного эксперимента; n – число наиболее существенных входных величин, полученных в результате отсеивающего эксперимента. Число коэффициентов уравнения (9.1) определяет объем эксперимента. Поэтому выбирают такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованию простоты и адекватности, под которой понимается способность модели предсказывать результаты эксперимента в некоторой области и с требуемой точностью. Так как чаще всего исследователь не располагает достаточной информацией, то на предварительной стадии исследования объекта обычно выбирают полином первой степени, предполагая, что параметры объекта лежат в области, в которой расположен экстремум исследуемой функции, и поэтому объект описывается линейной моделью. Если же эта линейная модель оказывается неадекватной, то в нее включают члены парного взаимодействия XiXj, а при необходимости увеличивают степень полинома до тех пор, пока модель не окажется адекватной. В большинстве практических случаев квадратичная модель оказывается достаточно работоспособной в пределах имеющихся ограничений. В результате регрессионного анализа результатов пассивного эксперимента находятся оценки коэффициентов уравнения регрессии β0, βi, βij, βii, … Пассивный эксперимент с учетом условий накопления статистических данных может применяться для получения математического описания технологических процессов в производстве ЭВC (изготовление печатных плат, оксидирование анодной фольги для электролитических конденсаторов, синтез 75 ферритовых антенн, гальванические покрытия и т. п.), а также для моделирования процессов функционирования радиоэлектронных устройств. Определение интервала съема данных. Для непрерывныx технологических процессов важно знать, как изменяется теснота корреляционной связи между входными и выходными величинами в зависимости от временного сдвига τ между ними. Для оценки временного сдвига используется взаимно-корреляционна функция Kxy(τ), которая для непрерывных случайных переменных x(t) и y(t) определяется формулой T 1 K xy (τ ) = lim x(t ) y (t + τ )dt . (9.2) T → ∞ 2T ∫ −T На практике имеют дело обычно с дискретными значениями x(t) и y{t) через равные промежутки времени ∆t', причем объем выборки N<∞. В этом случае асимптотически несмещенные оценки взаимно-корреляционных функций вычисляют по формуле N Rxy (τ ) = ∑ [ x(t ) − x ][ y(t l =1 l l + τ ) − y] ( N − 1) S x S y , (9.3) где τ=0, 1·∆t', 2·∆t', …, u·∆t'; u – число используемых сдвигов; и= (0,25.—0,35) N; N – объем выборки. По расположению максимума функции Rxy(τ) на оси τ опре деляют время эквивалентного запаздывания τЭ.З. (рис. 9.1), физический смысл которого состоит в том, что всякий скачок функции x(t) на входе объекта наиболее полно отражается на выходе только через промежуток времени τЭ.З. Рисунок 9.1 – Взаимно-корреляционная функция Rxy(τ) Величина интервала съема данных·∆t должна обеспечивать некоррелированность наблюдений, так как согласно предпосылкам регрессионного анализа соседние наблюдения должны быть стохастически независимыми. Для непрерывных технологических процессов, для которых изменения переменных представляют собой некоторый случайный процесс, это равносильно требованию Rxx(τ≥∆t)=0. Асимптотически несмещенная оценка Rxx(τ) (корреляционной функции входной переменной) определяется по формуле 76 N Rxx (τ ) = ∑ [ x(t ) − x ][ x(t l =1 l l +τ ) − x] , (9.4) ( N − 1) S x2 По корреляционной функции Rxx(τ) (рис. 9.2) определяют промежутки времени между соседними измерениями x(t), когда последние становятся независимыми. Эти промежутки времени называются временем корреляции τ0. Рисунок 9.2 – Корреляционная функция Rxx(τ) Практически интервал ·∆t должен выбираться из условия, что ·∆t≥ τ0 (9.5) и должен быть по возможности ближе к то, но не меньше времени измерения переменных и не превышать значительно время, эквивалентного запаздывания τЭ.З. Приближенное значение τ0 можно оценить по временному графику, случайного процесса, если на нем провести среднюю линию и подсчитать число пересечений кривой изменения переменной N0 за время ∆T. Тогда время корреляции оценивается по формуле τ0=2(∆T)/N0. (9.6) Число пересечений N0 на этом отрезке времени ∆T должно быть 40–70. Определение времени наблюдения Т. Допустим, задан рабочий диапазон изменения технологической переменной x(t) во времени, причем это изменение представляет собой случайный стационарный; процесс (рис. 9.3): ∆x = xв − xн (9.7) Весь диапазон ∆x разбит на ряд одинаковых интервалов ∆х в соответствии с разрешающей способностью измерительного прибора. Предположим, что известны дискретность проведения опытов ∆t и вероятности р1 и р2 попадания случайной величины x в нижний и верхний интервалы диапазона ∆x . 77 Рисунок 9.3 – Рабочий диапазон изменения переменной x(t) Если величина x имеет симметричное распределение внутри диапазона, то р1=р2=р. Время наблюдения T=∆tλ/p, (9.8) где λ — параметр, характеризующий среднее число попаданий перменной в крайний интервал диапазона за время эксперимента; ∆t — интервал получения данных; р — вероятность попадания случайной величины x в крайний интервал диапазона ∆х. Значения параметра λ находят из табл. 9.1, задаваясь вероятностью Р, с которой необходимо рассчитать коэффициенты уравнения регрессии; на практике чаще всего выбирается Р = 0,95, т.е. при уровне значимости β = 5%, где β=(1—Р) 100%. Таблица 9.1 P 0,94 3,52 λ 0,95 3,68 0,96 3,90 0,97 4,19 0,98 4,6 0,99 5,3 Вероятность Р находится по временному графику случайного процесса x(t) (рис. 9.3) по результатам предварительных исследований закона распределения случайной величины x . Определение объема экспериментальных данных. Определи интервал ∆t и общее время эксперимента Т, находят число наблюдений (объем выборки) из соотношения N = T/∆t. (9.9) Обработка данных пассивного эксперимента. Производится методом регрессионного анализа, который позволяет получат оценки коэффициентов нелинейных уравнений регрессии. Прежде всего величины переводятся в стандартизованный масштаб по формулам: x − xj y −y ξ yl = l , ξ jl = jl , (9.10) sy sx j 78 где j – номер величины (j=1, n); l – номер измерения выходной величины (l=1, N); ξ yl , ξ jl — значения соответственно величн yi и xjl в стандартизованном масштабе; y , x — средние значения величин; sy, sx — среднеквадратические отклонения величин y и xj; N — общее число наблюдений. Для вычисления оценок коэффициентов β̂ j на основе метода наименьших квадратов составляется следующая система уравнений: N N N N l =1 l =1 l =1 l =1 N N N N l =1 l =1 l =1 l =1 N N N N l =1 l =1 l =1 l =1 ∑ ξ ylξ1l = βˆ1 ∑ ξ12l + βˆ2 ∑ ξ1lξ2l + ... + βˆm ∑ ξilξml ; ∑ ξ ylξ2l = βˆ1 ∑ ξ2lξ1l + βˆ2 ∑ ξ22l + ... + βˆm ∑ ξ2lξml ; (9.11) ∑ ξ ylξml = βˆ1 ∑ ξmlξ1l + βˆ2 ∑ ξmlξ2l + ... + βˆm ∑ ξml , где m — число линейных величин вместе с искусственными линейными величинами, заменившими нелинейные члены уравнения; m = 2n + C; (9.12) С — число сочетаний из п элементов по 2; С = С2n. (9.13) Система уравнений (9.14) решается на ЭВМ с использованием стандартной программы. Уравнение регрессии в стандартизованном масштабе имеет вид ξ y = βˆ1ξ1 + βˆ2ξ 2 + ... + βˆ jξ j + ... + βˆmξ m . В результате решения находят искомые оценки коэффициентов β̂ j уравнения регрессии в стандартизованном масштабе, проводят проверку их статистической значимости с помощью t-критерия Стьюдента. Статистически незначимые коэффициенты из уравнения регрессии исключаются. Полученное математическое описание в виде уравнения регрессии показывает, как изменяется положение среднего значения выхода с изменением входных величин. Оценку тесноты регрессионной связи, т. е. оценку работоспособности полученного уравнения, дает коэффициент множественной корреляции R. Считается нормальным, если R=0,8—0,9. Для практических целей в предлагается использовать коэффициент γ, который показывает, во сколько раз уменьшается интервал ошибки предсказания при переходе от предсказания выходной величиной по среднему значению к предсказанию по эмпирическому уравнению регрессии: γ=sy/s0y, (9.14) где sy – среднеквадратическое отклонение выходной величины у: 79 N sy = ∑(y l =1 эl − y )2 ; (9.15) N −1 уэl – экспериментальное значение выходной величины y в l-й точке наблюдения; y — соответствующее среднее значение выходной величиной; s0y — среднеквадратическое отклонение выходной величины y относительно ее значений, полученных по уравнению регрессии в натуральном масштабе N s0 y = ∑(y l =1 эl − yˆl ) 2 ; (9.16) N −d ŷl — значение выходной величины, полученное по уравнению регрессии в lй точке наблюдения; d — число членов уравнения регрессии. На рис. 9.4 приведена графическая зависимость γ от R, из которой следует, что γ начинает резко возрастать в области больших значений R. Рисунок 9.4 – Графическая зависимость коэффициента корреляции R от γ Вероятно, уравнение регрессии имеет практический смысл, если γ≥2, т. е. когда ошибка предсказания по уравнению регрессии хотя бы в два раза меньше, чем ошибка предсказания по среднему значению y . Проведение пассивного эксперимента в производственных условиях и информативность его результатов Производственный процесс, и, в; частности, технологический процесс производства современных электронных средств (ЭС) можно рассматривать как определенную систему большого числа разнообразных входных и выходных параметров, анализ изменения значений которых и составляет сущность проведения пассивного эксперимента. Для анализа производственного процесса последовательность технологических операций удобно представлять в виде схемы вероятностного процесса перехода от одной операции к другой. Применяя статистический анализ интересующих исследователя параметров процесса на конкретных технологических операциях, можно получить распределение этих параметров в производственных условиях. В то же время, распределение выходных параметров на каждой 80 технологической операции, являющихся, как правило, параметрами изготавливаемого изделия и характеризующих его качество, представляют собою фактически р а с п р е д е л е н и е п о г р е ш н о с т е й п р о и з в о д с т в а . Именно они несут наиболее интересную информацию о технологическом процессе при проведении пассивного эксперимента в производственных условиях. В дальнейшем будем называть эти параметры — параметрами качества и обозначать их в общем случае через X . Погрешности параметров качества технологического процесса и, в конечном итоге, его продукта, каковым в нашем случае является ЭС, и стабильность этих параметров — один из главнейших критериев качества технологического процесса производства ЭС. Аналитическое или графическое описание взаимодействия (или взаимного влияния) технологических факторов производства и параметров качества изделий представляет собой, как правило, стохастическую модель технологического процесса, так как описывает статистическую связь между ними. В любом производстве возникают погрешности, из-за которых параметры качества изделий отличаются от требуемых (номинальных). Такие погрешности принято называть производственными. Они весьма многочисленны и разнообразны по своей природе и значимости. Обычно различают два вида производственных погрешностей: случайные и систематические. Погрешности называются случайными, если и х появление можно предсказать только с некоторой вероятностью. При этом ни величину, ни знак отклонения параметров качества от номинала не возможно предсказать с полной определенностью. Систематические же погрешности можно точно предсказать. Систематические погрешности обычно делятся на постоянные и закономерно изменяющиеся. Кроме случайных и систематических погрешностей на практике встречаются также грубые ошибки («промахи»), зависящие от ошибок операторов, неправильно рассчитанных технологических режимов и т. д. Влияние таких погрешностей не учитывается при построении модели, но принимаются все меры к их предупреждению. В производстве все погрешности проявляются в совокупности и вызываются в основном следующими факторами: – погрешностями в работе технологического оборудования, обусловленными дефектами электрических, механических и оптических узлов установок; – погрешностями инструмента, обусловленными его износом, отклонениями от требуемой конфигурации; эти факторы часто являются причиной, вызывающей закономерно изменяющиеся во времени производственные погрешности; – неточностью приспособлений и технологической оснастки, обусловленной в основном недостаточной их жесткостью, нарушением конфигурации и размеров, неправильной установкой в оборудовании и т. д.; 81 – неоднородностью электрофизических, механических и прочих свойств материалов и заготовок изделий; – субъективными ошибками оператора при настройке оборудования и поддержании режимов его работы; – метрологическими ошибками в результате неточности работы измерительных средств при контроле параметров качества изделий. Систематическая погрешность определяется,, как разность среднего значения измеряемого параметра и номинального его значения (или его математического ожидания). Н а личие систематической погрешности свидетельствует о неотлаженности технологического процесса, именно о том, что значения факторов, воздействующих на параметр качества, выбраны неоптимально. При отлаженном технологическом процессе систематическая погрешность равна 0. Случайная составляющая погрешности оценивается величиной рассеивания измеряемого параметра качества от его среднего значения, а именно величиной стандартного среднего квадратического отклонения, которая характеризует меру воздействия на измеряемый параметр случайных факторов и в том числе погрешностей его измерения, а также погрешностей фиксации значений воздействующих факторов технологического процесса. В целом величина стандартного отклонения параметра качества характеризует степень настройки технологического оборудования (включая измерительное). Значения случайной и систематической составляющих производственных погрешностей характеризуют точность технологического процесса, причем различают конструктивную и технологическую точность. Конструктивная точность характеризуется величиной допусков параметров качества изделия, а технологическая — степенью соответствия фактических отклонений параметров качества допустимым, согласно чертежам, техническим условиям или другой конструкторскотехнологической документации на изделие. Технологическая точность оценивается количественными критериями Важнейшим из таких критериев является вероятность Р выхода годных изделий, параметры качества которых находятся в пределах установленного поля допуска, называемая коэффициентом выхода годных. При гауссовском законе распределения параметра качества коэффициент выхода годных изделий определяется как площадь, ограниченная кривой и полем установленного допуска. Аналогично зависимости коэффициента выхода годных изделий от установленного поля допуска на их параметры качества, влияние систематической и случайной составляющих погрешности принято также характеризовать зависимостью от установленного поля допуска. По известному закону распределения погрешностей можно выявить физическую сущность источников погрешностей, приводящую к данному распределению. Теоретический закон распределения производственных погрешностей параметров качества изделий считается достаточно полной 82 оценкой точности технологического процесса. Иногда такой оценкой служат гистограмма или полигон распределения. Однако следует еще раз обратить внимание читателя на тог факт, что оценка точности рассматривается в данной главе только для технологических процессов производства изделий, которые характеризуются потерями за счет ухода значений параметра качества за пределы установленного для него поля допуска, т. е. для так называемых параметрических потерь. В случае же брака катастрофического характера, называемого повреждающими дефектами (обрывы, короткие замыкания проводников и т. п.), качество технологического процесса оценивают плотностью этого вида дефектов ЭС. В то же время на практике в процессе анализа технологического процесса по критериям точности учитывают только параметрические потери и поэтому повреждающие дефекты ЭС нами не рассматриваются. При анализе точности технологического процесса изготовления ЭС групповыми методами обработки (например, микроэлектронных средств в виде ИС) следует учитывать особенности процесса их изготовления. Первая особенность состоит в необходимости учета идентичности условий при групповом характере обработки. Так как идентичность условий меняется в зависимости от естественного или искусственного группирования изготавливаемых изделий, то необходимо рассмотреть возможные случаи такого группирования. В т о р а я о с о б е н н о с т ь обусловлена наличием конструктивно отличающихся элементов каждого вида (резисторов, транзисторов, конденсаторов) в одном ЭС. Для ряда ЭС характерна типовая конструкция элементов. В этом случае, как уже ранее отмечалось, коэффициент выхода годных ИС характеризует качество технологического процесса их изготовления. В то же время существует ряд ЭС (например, гибридные ИС), состоящих, как правило, из конструктивно различных элементов, отличающихся параметрами топологического рисунка. Нетрудно заметить, что относительная систематическая погрешность формирования геометрического размера ЭС будет тем выше, чем меньше формируемый его размер. Следовательно, вероятность выхода параметра качества, определяющего функционирование элемента ЭС (в дальнейшем будем называть его функциональным параметром качества), за пределы ноля допуска возрастает с уменьшением формируемого его размера, а следовательно, возрастает вклад систематической погрешности этого размера в погрешность функционального параметра качества элемента. Учитывая зависимость коэффициента выхода годных от конструктивных особенностей ЭС, он не может рассматриваться только как показатель точности технологического процесса. Параметры погрешностей являются характеристиками уровня качества технологического процесса, реализованного в конкретном производстве. Они могут соответствовать требованиям конструкции данного ЭС, но могут полиостью или частично не соответствовать требованиям конструкции 83 данного ЭС. Поэтому возникает вопрос о методике определения соответствия технологического процесса требованиям, сформулированным в технической документации на ЭС (в чертеже и технических условиях). Анализ конкретных причин возникновения погрешностей и возможностей их устранения на соответствующих АПЕ позволяет технологу выработать необходимые управляющие воздействия, направленные на уменьшение этих погрешностей, а следовательно, и на повышение коэффициента выхода годных изделий. Контрольные вопросы 1. Назовите основные отличия активного и пассивного экспериментов, их преимущества и недостатки. 2. Каков порядок проведения пассивного эксперимента в производственных условиях? 3. Какую информацию о качестве технологического процесса несут контролируемые в процессе производства параметры качества? 4. В чем различие систематических и случайных погрешностей? 5. Каким образом можно оценить вклад случайных и систематических погрешностей в точность технологического процесса? 84 МОДУЛЬ №4 «МЕТОДЫ ОПТИМИЗАЦИИ» Лекция4: Оптимизация исследуемых процессов Изучаемые вопросы: Метод Гаусса-Зайделя. Градиентные методы. Метод крутого восхождения. Симплексный метод. Вопросы для самостоятельного изучения: Оптимизация при многоэкстремальной поверхности отклика. Обобщенный параметр оптимизации. Освоенные компетенции: ПК-3, ПК-5, ПК-13, ПК-19 Главной задачей и конечной целью решения большого числа разнообразных исследовательских проблем управления, проектирования и планирования обычно является достижение и поддержание экстремальных, то есть наилучших, показателей. Процесс нахождения и поддержания наилучших (в определенном смысле) значений целевой функции объекта называется оптимизацией. Критерий оптимизации (целевая функция) Y обычно задается, иногда исследователь задает ее сам. Этот критерий должен удовлетворять следующим основным условиям: – нести в себе существенную информацию об объекте, о качестве процесса; – измеряться с достаточной точностью; – носить обобщенный характер, то есть отражать свойства и качества процесса в целом. Если математическое ожидание критерия оптимизации у есть функция от вектора x входных управляемых переменных (факторов), то есть M{y} = f( x ) = f(x1, x2, …, xk), (10.1) где k – число факторов, то задача оптимизации сводится к отысканию таких значений факторов x * = (x1*, x2*, …, xk*), (10.2) при которых целевая функция достигает экстремума (максимума или минимума). Если на объект воздействуют аддитивные помехи, то зависимость (10.1) выражает не функциональную, а регрессионную зависимость, которая в (k+1)мерном пространстве n факторов xi (i =1, 2, …, k) и целевой функции y образует поверхность отклика. Для решения задачи оптимизации, то есть отыскания вектора (10.2), можно применить два принципиально разных подхода: 1 – если известна или есть возможность найти n-факторную математическую модель для той части пространства, где расположен экстремум функции отклика, то задачу оптимизации решают аналитическим или численным методом; 2 – если математическое описание не получено по каким-либо причинам, то осуществляют экспериментальный поиск области оптимума. 85 В первом случае используют известное из математического анализа свойство функций, имеющих экстремум: в точке экстремума (максимума или минимума) первая производная этой функции обращается в нуль. Если необходимо найти полную производную в n-факторном пространстве, то находят n частных производных по каждому из n факторов и получают систему из n уравнений ∂y/∂x1 = 0; ∂y/∂x2 = 0; ………….. ∂y/∂xk-1 = 0; ∂y/∂xk = 0 (10.3) Решением системы (10.3) и является вектор (10.2). Однако во многих практических случаях аналитическая зависимость (10.1) неизвестна или ее нахождение представляет собой сложную задачу. Тогда, если имеется возможность одновременно наблюдать все n факторов и целевую функцию, задачу оптимизации проще решить с помощью второго подхода, то есть с помощью экспериментального поиска. Для этого сначала осуществляют изучение характера поверхности отклика в районе первоначально выбранной точки факторного пространства (с помощью специально спланированных «пробных» опытов). Затем совершают «рабочее» движение в сторону экстремума, причем направление движения определяют по результатам пробных опытов. Такое движение может осуществляться путем ряда этапов, которые могут объединяться в «циклы». После выхода в район экстремума оптимальную точку можно уточнить одним из двух способов: – постановкой дополнительных, особым образом спланированных, опытов; – получением математической модели второго или более высокого порядка и последующим решением системы уравнений (6.3). Задача надежного отыскания экстремума усложняется, если на объект воздействуют случайные помехи. Тогда каждое измеренное (наблюдавшееся) значение целевой функции оказывается суммой истинного ее значения и случайной помехи. Для повышения надежности результатов применяют специальные методы, например в каждой запланированной точке факторного пространства выполняют несколько параллельных опытов. Если характеристики объекта изменяются, смещаются во времени (дрейф), то это создает дополнительные трудности и приходится создавать специальные планы эксперимента. Метод Гаусса-Зайделя Метод Гаусса-Зайделя предусматривает поочередное нахождение частных экстремумов целевой функции по каждому фактору xi (i =1, 2, …, n). При этом на каждом i-м этапе стабилизируют n-1 факторов и варьируют только один, i-й фактор. Задачу поиска экстремума решают в несколько этапов, которые затем объединяют в циклы. 86 Рассмотрим последовательность поиска максимума методом Гаусса-Зайделя с иллюстрацией двухфакторного примера. Графическая интерпретация метода дана на рисунке 10.1, где на плоскости двух факторов x1, x2 изображена функция отклика у топографическим способом с помощью замкнутых линий постоянного уровня этой оптимизируемой выходной функции. Эти линии соответствуют некоторым относительным величинам, однако форма функции отклика до начала исследования обычно неизвестна. I этап. Производится поиск частного экстремума по первому фактору x1, остальные факторы остаются неизменными, то есть стабилизируются. 1 – Выбирают основную (начальную, базовую) точку М0, обычно она соответствует номинальному режиму ведения технологического процесса x 0=(x10; x20; …; xk0). Иногда эту точку выбирают в центре области, которую желательно исследовать, либо в центре области ограничений, если они имеются. x2 M11 Δx2 x20 M6 M9 M12 M13 M14 M8 M15 M5 M4 M3 M2 M0 M1 M7 x1 0 x10 Δx1 Рисунок 10.1 – Поиск экстремума функции отклика методом ГауссаЗайделя 2 – Выбирают интервал варьированияΔ x1 по фактору x1. Интервал не должен быть слишком малым, иначе движение к экстремуму окажется замедленным. Кроме того, на интервале варьирования Δxi (i=1, 2, …, k) изменение целевой функцииΔ y должно быть существенно большим, чем погрешность ее измерения δy (не менее чем в 5–10 раз) 3. Определяют координаты пробных точек М1 и М2: x (М1) = (x10+Δx1; x20; …; xk0), x (М2) = (x10–Δx1; x20; …; xk0). 4 . В то чках М1 и М2 ставят пробные опыты (для повышения точности результатов могут выполняться параллельные опыты) и измеряют отклики у(М1) и у(М2). 5. Сравнивают полученные отклики, и если у(М2) > у(М1), то совершают 87 → рабочее движение на один рабочий шаг Δx1 по направлению M 0 M 2 в точку М3. 6. Аналогичные шаги продолжают в том же направлении до тех пор, пока на каком-то m-м шаге не окажется, что у(Мm) < у(Мm–1), то есть значение отклика в очередной, m-й рабочей точке станет уменьшаться, – это и служит признаком достижения частного экстремума. За частный экстремум принимают (m–1)-ю точку с откликом у(Мm–1). На рисунке 4.1 это точка М5. II этап. Его проводят в том порядке, что и I этап, с той лишь разницей, что стабилизируют все факторы, кроме x2. За новую базовую точку принимают точку с координатами x (Мm–1) = (x10+Δx1·(m–2); x20; …; xk0), а x2 варьирую на выбранную по аналогичным условиям величину интервала Δx2. По достижении частного экстремума по фактору x2 точку нового частного экстремума принимают за новую базовую точку. На рисунке 10.1 это точка М9. Первый цикл продвижения к экстремуму заканчивается n-м этапом, на котором стабилизируются все факторы, кроме xk. Для него выбирают интервал варьирования Δxk и совершают пробное, а затем рабочее движение до достижения частного экстремума по фактору xk. Если экстремум не достигнут, то выполняют второй цикл поиска. Второй цикл, как и первый, начинается с I этапа, на котором варьируют фактор x1 (i ≠ 1), затем последовательно выполняют k этапов по каждому из k факторов. Поисковое шаговое движение к экстремуму заканчивают по достижении такой точки факторного пространства, при движении из которой в любую сторону по всем n факторным осям xi в положительном или отрицательном направлениях значения отклика оказываются меньшими. Такую точку принимают за экстремум (в рассматриваемом случае – максимум). Достоинства метода Гаусса-Зайделя: – простота стратегии и наглядность; – высокая помехозащищенность в смысле выбора направления движения. Недостатки: – путь к главному экстремуму оказывается обычно долгим, особенно при большом числе факторов; – если поверхность отклика имеет сложную форму, то использование метода может привести к ложному ответу на вопрос о месте расположения экстремума; – метод не дает информации о взаимодействиях факторов. Исторически метод Гаусса-Зайделя известен как первый из рассматриваемых. При увеличении количества воздействующих факторов до 5–6 применять этот метод для оптимизации процессов неэффективно. Метод случайного поиска Характерной чертой этого метода является случайный выбор направления движения на каждом шаге, то есть одновременное изменение значений сразу всех факторов. Так, если изображающая точка после i-го шага занимает xm положение в факторном пространстве, то следующий рабочий шаг будет совершен лишь 88 после выполнения пробного эксперимента в точке xm+1 = xm + z, где z – случайный вектор определенной длины (рисунок 10.2). x2 k+2 k+1 k x1 0 Рисунок 10.2 – Поиск экстремума функции отклика методом случайного поиска Значения у(xm) и у(xm+z) сравниваются, и производится (i+1)-й рабочий шаг вдо ль векто р а по напр авлению к экстр емуму. Как правило, длина рабочего шага превышает длину пробного. Критерием выхода в область экстремума целевой функции (функции отклика) является возрастание числа неудачных шагов, то есть многократное повторение положения, когда у(xm+z) < у(xm). Достоинство – метод случайного поиска очень прост, но он применим лишь для очень простых ситуаций. Основные недостатки метода: – большая трудоемкость и длительность поиска экстремума; – возможность ошибки при попадании в область локального экстремума. Градиентные методы Градиентные методы имеют несколько разновидностей, различающихся правилами выбора ступеней варьирования и рабочих шагов на каждом этапе движения к экстремуму. Сущность стратегии всех этих разновидностей состоит в том, что на каждом этапе вокруг очередной базовой точки организуют пробные эксперименты, по результатам которых оценивают новое направление градиента, после чего в этом направлении совершают рабочий шаг. Вектор-градиент в n-факторном пространстве определяется соотношением 0 0 0 grad y = (∂y/∂x1) x 1 + (∂y/∂x2) x 2 + … + (∂y/∂xk) x k , (10.4) 89 0 где x i (i=1, 2, …, n) – единичные направляющие векторы (орты), расположенные вдоль факторных осей; ∂y/∂xi – частная производная целевой функции по i-му фактору. Пробные опыты (по два в точках, расположенных на прямых, параллельных каждой факторной оси и проходящих через базовую точку) проводят с целью получить приближенные оценки частных производных. Рассмотрим две основные разновидности градиентных методов. Обычный метод градиента осуществляется по следующей процедуре: 1 – Выбирают начальную (базовую) точку x 0=(x10; x20; …; xno). На рисунке 10.3 это точка L0. 2 – Выбирают интервал варьирования Δxi по каждому из факторов xi (i=1, 2, …, k), пользуясь уже определенными ранее правилами. 3 – Определяют координаты пробных точек (рисунок 10.3). Вдоль направления, параллельного факторной оси x1, ими являются точки L1, L2 с координатами x (L1) = (x10 – Δx1; x20; …; xko), x (L2) = (x10 + Δx1; x20; …; xko). то есть варьируют один фактор x1 при стабилизации остальных факторов на базовом уровне. Аналогично вычисляют координаты пробных точек вдоль направлений, параллельных остальным факторным осям x2; x3; …; xk. Вдоль направления, параллельного факторной оси x2, такие точки – L3, L4 с координатами x (L3) = (x10; x20 – Δx2; …; xko), x (L4) = (x10; x20 + Δx2; …; xko). В пробных точках ставят опыты и получают значения целевой функции Y. x2 L10 L9 L5 L7 L6 Δx2 x20 Δx2 L8 L1 L4 L0 L2 L3 Δx1 x10Δ x1 90 x1 Рисунок 4.3 – Поиск экстремума функции отклика методом градиента 4 – По результатам пробных опытов вычисляют оценки составляющих вектор-градиента в точке L0 для каждого i-го фактора: ∧ grady ( L 0 ) x = ∂y ∂xi ≈ ∆y x (2∆xi ) = b i i (10.5) i В частности, для фактора x1 по результатам опытов в точках L1 и L2 вычисление выполняют по формуле ∧ grady ( L 0 ) x1 ≈ ∆y x1 (2∆x1 ) = [ y ( L2 ) − y ( L1 )] [ x1 ( L2 ) − x1 ( L1 )] = b1 . (10.6) Как известно, частные производные являются коэффициентами ai (i=1, 2, …, n; i≠0) уравнения плоскости, касательной к поверхности отклика в точке L0: y = b0 + b1x1 + b2x2 + … + bkxk. (10.7) ∧ Оценки b i коэффициентов получают по формуле (10.5). 5 – Находят координаты рабочей точки на направлении градиента. Для этого выбирают параметр рабочего шага ρ гр и вычисляют координаты первой рабочей точки по всем факторным осям xi (i =1, 2, …, k): ∧ (10.8) xi1 = xi0 + ρгр b i 0 . На рисунке 10.3 первой рабочей точкой является точка L5. Чтобы из основной точки L0 попасть в точку L5, от L0 откладывают в масштабе отрезки, ∧ ∧ ∧ равные ρ гр b1 и ρ гр b 2 , причем если b i <0, то по соответствующему фактору отрезок откладывают в отрицательном направлении от точки L0, то есть для фактора x1 – ∧ влево от точки L0, а для фактора x2 – вниз от точки L0. Если b i >0, то отрезки ∧ ρгр b i откладывают в положительном направлении от основной точки. 6 – Первую рабочую точку принимают за новую базовую точку и вокруг нее организуют новые пробные опыты для оценивания нового направления градиента, после чего совершают новый рабочий шаг (на рисунке 10.3 – в точку L10). В общем случае в каждой m-й рабочей точке по результатам пробных ∧ опытов вокруг нее получают оценки составляющих градиента b im и совершают (m+1)-й рабочий шаг (m = 0, 1, 2, …) в точку с координатами ∧ xi, m+1 = xi m + ρгр b im . (10.9) 7 – Рабочее движение производят до тех пор, пока на очередном шаге все ∧ составляющие градиента не станут пренебрежимо малыми, то есть b i ,m+1 ≈0 (i=1, 2, …, n). Для этого достаточно, чтобы выполнялось неравенство ∧ (10.10) ρгр b i ,m+1 < 1 Если по результатам пробных опытов в (m+1)-й рабочей точке выполняется условие (10.10), то движение к экстремуму прекращают и эту рабочую точку принимают за точку экстремума. Достоинства метода градиента: 91 – достаточная простота стратегии; – повышенная по сравнению с методом Гаусса-Зайделя скорость движения к экстремуму (эффективность). Недостатки: – большая чуткость к помехам в отношении выбора направления рабочего движения; – в случаях, когда поверхность отклика имеет сложную форму, метод градиента может не привести к истинному экстремуму; – если поверхность отклика достаточно пологая, то в условиях помех метод мало эффективен в смысле точности выхода к экстремуму; Метод Кифера-Вольфовица является разновидностью градиентного метода и отличается от описанного выше обычного метода градиента тем, что если в первом из них размеры интервалов варьирования Δxi при постановке пробных экспериментов и параметр ρ гр рабочего шага остаются неизменными на любом рабочем шаге, то в рассматриваемом методе Δxik и ρ грm выбирают в зависимости от номера k рабочего шага: Δxim = Δxi0/(γm), ρгрm = ρгр0/m, (10.11) где Δxi0 – начальный интервал варьирования в основной точке L0; ρгр0 – начальное значение параметра рабочего шага; m – номер рабочего шага (m = 1, 2, …); γ – постоянная степень, обычно выбираемая в пределах 0 < γ < 0,5. Чаще всего полагают γ=0,25. Если в методе градиента фактический размер m-го рабочего шага уменьшается только из-за уменьшения градиента, то есть крутизны наклона поверхности отклика, при приближении к области экстремума, то в методе Кифера-Вольфовица фактический размер рабочего шага уменьшается в прямой зависимости от номера этого шага. Достоинством метода Кифера-Вольфовица по сравнению с немодифицированным методом является его повышенная точность нахождения экстремальной точки, если поверхность отклика достаточно крутая, а экстремум находится от базовой точки не слишком далеко. Недостатком является его низкая эффективность в условиях пологих поверхностей отклика. При очень пологих поверхностях отклика этот метод вообще не приводит к цели: рабочие шаги становятся сравнимыми с погрешностями измерения до достижения экстремума. Остальные достоинства и недостатки, а также вся процедура работы такие же, как и в методе градиента. Метод крутого восхождения (метод Бокса-Уилсона) Метод крутого восхождения предложен Дж. Боксом и К. Уилсоном как синтез лучших черт градиентных методов и метода Гаусса-Зайделя, причем пробные опыты для выяснения направления движения выполняют методом полного факторного эксперимента (ПФЭ) или дробного факторного эксперимента 92 (ДФЭ). От градиентных методов здесь воспринято выполнение рабочего движения вдоль вектор-градиента, определенного в районе исходной (базовой) точки, а от метода Гаусса-Зайделя взят принцип продвижения не на один рабочий шаг (как в методе градиента), а до достижения частного экстремума функции отклика на направлении градиента, без его корректировки на каждом рабочем шаге. Проведение ПФЭ или ДФЭ позволяет более точно оценивать направление градиента, чем при традиционном методе градиента, и получать информацию о взаимодействиях факторов и достаточно просто осуществлять статистическую проверку результатов расчетов. На первом цикле метода крутого восхождения используется следующая процедура: 1 – Выбирают основную (базовую, нулевую) точку К0 (рисунок 10.4). Правила ее выбора прежние. 2 – Выбирают интервал варьированияΔ xi для каждого фактора xi (i = 1, 2, …, k) по изложенным ранее правилам. 3 – Определяют координаты пробных точек для нижнего и верхнего уровней варьирования факторов xi по правилам ПФЭ xiн = xi0 – Δxi , xiв = xi0 + Δxi (10.12) и составляют ортогональную матрицу планирования ПФЭ или ДФЭ, для чего факторы нормируют по формуле: xiб = (xi – xi0) / Δxi (10.13) Затем выбирают число n серий параллельных опытов, порядок проведения опытов в сериях рандомизируют с помощью таблицы случайных чисел (Приложение А) и в этом порядке выполняют наблюдения отклика в точках ПФЭ и ДФЭ (на рисунке 10.4 это точки K1, K2, K3, K4). x2 B A K11 K10 K9 K8 x2В x20 x2Н K3 K0 K1 K4 K7 K2 x1 x1Н x10 x1В Рисунок 10.4 – Поиск экстремума функции отклика методом крутого восхождения 93 4 – По результатам ПФЭ (или ДФЭ) вычисляют оценки коэффициентов нормированного уравнения регрессии первого порядка ∧ ∧ ∧ ∧ ∧ y = b 0 + b1 x1б + b 2 x2 б + ... + b n xnб , (10.15) ∧ а также производят статистическую проверку значимости b i , для чего можно рассчитать критическое значение коэффициентов: ∧ ∧ b кр = tкрs{ b i }, (10.16) где tкр = tтабл {νзн; q}, выбираемое из таблицы (Приложение А) при числе степеней свободы νзн = N(n-1) и принятом уровне значимости β. 5 – Вычисляют расчетные i-е составляющие рабочих шагов в реальном масштабе: ∧ λi = b i Δxi. (10.17) Максимальное по модулю из всех λ i (i=1, 2, …, k) принимают за базовое λбаз. 6 – Получают практические (округленные) i-е составляющие рабочих шагов 0 λiокр для продвижения вдоль направления градиента (на рисунке 10.4 это луч у (или изменяют) λ λ баз.окр и К0А), для чего о рк гляют баз до удобного пропорционально этому округляют (или изменяют) остальныеλ i до λ i окр (i=1, 2, …, k). Округление λi производят по формуле λi окр = (λбаз.окр / λбаз) λi (10.18) до удобного значения либо с учетом погрешностей измерения по каждому фактору xi. Знаки λi окр должны соответствовать (в случае поиска максимума, если отыскивается минимум, то знакиλ i окр должны быть противоположны) знакам ∧ оценок b i коэффициентов. 7 – Вычисляют координаты m-х рабочих точек (m = 1, 2, …) на направлении градиента (на рисунке 10.4 это точки К5 – К11) в реальном масштабе: xim = xi0 + m λi окр; (10.19) в них последовательно выполняют мысленные и проверочные (реальные) опыты. Размер λ i обычно выбирают так, чтобы первая рабочая точка (m=1) не выходила за границы области ПФЭ или ДФЭ. Мысленные опыты заключаются в получении предсказанных (расчетных) ∧ значений отклика y t по полученному линейному уравнению (10.15). Они позволяют: – сокращать объем реальных опытов, то есть увеличить скорость продвижения к экстремуму; – иметь представление, насколько хорошо уравнение (10.15) аппроксимирует реальную поверхность отклика, то есть насколько расчетные значения отличаются от результатов наблюдавшихся значений в реальных опытах; – оценивать правильность выбора размера составляющих практического рабочего шага λ( i окр): если за число шагов k=3 достигается и превышается максимально возможное расчетное значение целевой функции (определяемое из физических свойств и ограничений, существующих для объекта), тоλ i окр нужно уменьшить; если же число k слишком большое, тоλ i окр следует увеличить или 94 реже ставить реальные опыты. Реальные (проверочные) опыты в начале движения из базовой точки вдоль направления градиента ставят через 2 – 4 мысленных опыта, а при уменьшении приращений наблюдавшихся значений отклика в каждом последующем реализованном по сравнению с предыдущим в рабочих точках проверочные ставят чаще, вблизи частного экстремума выполняют на каждом шаге. Рабочее движение продолжают, пока не будет достигнут частный экстремум на направлении градиента (на рисунке 10.4 это точка К9). Признаком достижения частного экстремума является уменьшение (в случае поиска максимума) отклика в последующих проверочных опытах. 8 – Точку частого экстремума на первоначальном направлении градиента (на рисунке 10.4 это точка К9 на луче К0А) принимают за новую нулевую точку и организуют второй цикл крутого восхождения. Порядок работы на втором цикле тот же, что и на первом. Различие состоит в том, что интервалы варьирования при постановке пробных о пытов (ПФЭ или ДФЭ) и р азмер р або чих шаго в в связи с приближением к экстремуму и увеличением кривизны поверхности отклика обычно выбирают меньшими, чем на первом цикле. В случае необходимости выполняют третий цикл крутого восхождения. 9 – Поисковое рабочее движение прекращают по достижении области экстремума. Признаком достижения экстремума является статистическая ∧ незначимость оценок b i коэффициентов при членах первого порядка, вычисленных по результатам ПФЭ (ДФЭ) вокруг очередной нулевой точки. Достоинства метода крутого восхождения: – высокая помехозащищенность (помехоустойчивость) в смысле точности оценивания составляющих градиента: если в градиентных методах каждая ∧ составляющая b i оценивается лишь по двум точкам факторного пространства, то в ПФЭ, который в методе крутого восхождения используется для этой цели, ∧ каждый коэффициент b i оценивается по всем N=2k точкам; – высокая эффективность в смысле скорости движения к экстремуму; по сравнению с методом Гаусса-Зайделя она выше за счет продвижения по градиенту, а по сравнению с градиентным – за счет исключения пробных опытов на каждом рабочем шаге и за счет мысленных опытов; – пробные опыты, выполняемые методом ПФЭ, позволяют получать ∧ информацию об оценках b ij коэффициентов при взаимодействиях факторов xixj, ∧ характеризующих кривизну поверхности отклика: увеличение b ij при уменьшении ∧ b i обычно характеризует приближение к экстремуму; – ПФЭ с применением параллельных опытов позволяет достаточно просто осуществлять надежную статистическую интерпретацию результатов; – метод наиболее эффективен из известных при пологих поверхностях отклика. Недостатком рассмотренного метода является несколько большая, чем в предыдущих методах, сложность планирования пробных опытов, требующая одновременного варьирования сразу всех факторов относительно базовой точки, и 95 меньшая оперативность по сравнению с симплексным методом в условиях дрейфующих объектов. Симплексный метод Симплексом называют выпуклую фигуру (или тело), образованную k+1 вершинами в пространстве k факторов, причем эти k+1 вершин не принадлежат одновременно ни одному из подпространств из k-1 факторов. Симплекс называется регулярным, если все расстояния между его вершинами равны. В пространстве одного фактора (k=1) симплексом служит отрезок установленного размера, при k=2 – треугольник, при k=3 – тетраэдр. При k≥4 привычным образом интерпретировать симплекс невозможно. Симплексный метод позволяет совмещать пробные опыты для определения направления движения с рабочим движением по поверхности отклика к области оптимума. Основная идея симплексного метода в следующем. Если во всех k+1 вершинах симплекса поставить опыты и измерить отклик, то (при не слишком большом уровне шумов) по величине отклика в вершинах можно судить, в каком направлении следует двигаться, чтобы приблизиться к экстремуму. После проведения серии опытов, поставленных в вершинах правильного симплекса, определяется точка, соответствующая условиям, при которых получаются наихудшие результаты. Затем используется важное свойство симплекса, по которому из любого симплекса можно, отбросив одну из вершин, получить новый, заменив отброшенную вершину ее зеркальным отражением относительно противоположной его грани. Если отбросить точку с наихудшими результатами и построить на оставшейся грани новый симплекс, то его центр будет смещен в направлении: худшая точка – центр тяжести остальных точек, то есть в направлении к экстремуму. Затем процесс отбрасывания вершины с наихудшим значением целевой функции и построения нового симплекса повторяется. Если значение выхода в новой вершине снова окажется наихудшим, то нужно вернуться к исходному симплексу и отбросить следующую по порядку вершину с плохим результатом. В результате этого образуется цепочка симплексов, перемещающихся в факторном пространстве к точке экстремума. Таким образом, движение к экстремуму осуществляется путем зеркального отражения точки с наихудшими результатами относительно центра противоположной грани симплекса. Порядок работы при использовании симплексного метода следующий: 1 – Выбирают начальную точку С1, а также интервалы варьирования Δxi для всех факторов (i=1, 2, …, k). 2 – Выбирают безразмерную величину ρсим стороны (или ребра) симплекса в относительных единицах по отношению к интервалам варьирования Δ xi . Наиболее просто выбрать ρсим=1. Стремятся, чтобы в безразмерных единицах стороны симплекса были равны. 3 – Вычисляют координаты остальных вершин начального симплекса. Обычно для этого используют следующее правило. Через начальную точку С1 проводят осевые линии, параллельные координатным осям, и выбирают квадрант, в котором по предположению, должен располагаться экстремум целевой функции. В начальную точку помещают вершину симплекса С1 (рисунок 10.5), а 96 сам симплекс I располагают так, чтобы его стороны образовали с осевыми линиями равные углы. При таком расположении начального симплекса координаты его вершин определяют с помощью матрицы (таблица 10.1), в которой даны координаты вершин (k+1)-мерного симплекса в n-факторном пространстве. x2 C12 C10 C13 C14 C8 C11 C9 C6 C7 C5 C4 C3 C2 x20 C1 pΔx1 x10 qΔx1 x1 Рисунок 10.5 – Поиск экстремума функции отклика симплексным методом Безразмерные относительные величины p и q при таком расположении симплекса определяют по формуле: p = k +1 + k −1 k 2 ,q = k +1 −1 k 2 . (10.20) На рисунке 10.5 показаны размеры pΔx1 и qΔx1 для случая ρсим=1. Если принимают ρсим≠1, то Δxi умножают еще на ρсим. Знаки Δxi зависят от номера квадранта, в котором расположен начальный симплекс. Для k=2 имеем p≈0,966, q≈0,259. 4 – В вершинах симплекса выполняют наблюдения отклика и сравнивают по величине; выбирают вершину с минимальным откликом и отражают ее относительно противолежащей стороны или грани; находят вершину следующего симплекса II, n вершин которого одновременно являются и вершинами предыдущего симплекса I. Координаты отраженной вершины вычисляют по формуле xil , m +1 = [2( xi1m + xi 2 m + ... + xi , n +1, m ) k ] ± xilm , (10.21) где i – номер фактора (i=1, 2, …, k); l – номер вершины m-го симплекса, где обнаружен минимальный (в случае нахождения максимума) отклик; m+1 – номер последующего симплекса, содержащего отраженную вершину (ей условно присваивают тот же номер l); ( )( ) ( )( ) 97 k – число факторов. Если минимальный отклик оказался сразу в двух вершинах, то вопрос, какую из них отражать, решают произвольно. Таблица 10.1 –Задание координат вершин симплекса Факторы xi x1 x2 x3 … xi … xk x10+qΔx1 x20+pΔx2 x30+qΔx3 … xi0+qΔxi … … xk0+qΔxk … … xi0+pΔxi …xk0+qΔxk … … … xi0+qΔxi … x10+qΔx1 x20+qΔx2 x30+qΔx3 … … … … Вершина Ck+1 x10+qΔx1 x20+qΔx2 x30+qΔx3 … … Вершина Ci+1 … Вершина C3 … … xk0 … xk0+qΔxk … … xi0 … xi0+qΔxi … x10 x20 x30 x10+pΔx1 x20+qΔx2 x30+qΔx3 … Вершина C1 Вершина C2 … xk0+pΔxk 5 – Ставят эксперимент в отраженной вершине нового симплекса и отклик в ней сравнивают с откликами в остальных вершинах, а затем снова выбирают вершину с минимальным откликом и отражают ее через противолежащую сторону (или грань) симплекса. Если в новой вершине (m+1)-го симплекса отклик оказался опять минимальным, то возвращаются к m-му симплексу и отражают вторую по минимальности вершину. Если это явление повторяется, то отражают третью по минимальности вершину и так далее. 6 – Эксперимент продолжают до тех пор, пока симплекс не совершит полный оборот вокруг одной из вершин. На рисунке 10.5 это вершина С11. Точность нахождения точки экстремума зависит от двух причин: размера симплекса и влияния помех. Для уточнения положения экстремальной точки статического объекта в последних симплексах рекомендуется ставить параллельные опыты, чтобы снизить влияние помех, а также выполнить опыт в середине того симплекса, в вершинах которого отклик оказался максимальным по сравнению с остальными симплексами. Достоинства симплексного метода: – достаточно высокая помехоустойчивость в смысле выбора направления движения к экстремуму; – изучение поверхности отклика сочетается с одновременным рабочим движением к экстремуму; – при оптимально выбранном размере симплекса обеспечивается высокая скорость выхода к области экстремума; – высокая оперативность, позволяющая использовать этот метод особенно для непрерывной оптимизации объектов с дрейфующим экстремумом. Недостатки метода: – метод не позволяет непосредственно получать математическое описание изучаемого участка поверхности отклика, как, например, в методе Бокса-Уилсона; – в условиях пологих поверхностей отклика симплексный метод дает менее точное решение, чем метод крутого восхождения. 98 Контрольные вопросы 1. Как формулируется задача оптимизации? 2. Какими подходами можно решить задачу оптимизации? 3. Что общего у всех методов экспериментального поиска экстремума? 4. В чем заключается основная идея и процедура метода Гаусса-Зайделя? 5. В чем заключается основная идея и процедура метода случайного поиска? 6. В чем заключается основная идея и процедура обычного градиентного метода? 7. В чем заключается основная идея и процедура метода КифераВольфовица? 8. В чем заключается основная идея и процедура симплексного метода? 9. В чем заключается основная идея и процедура метода крутого восхождения (Бокса-Уилсона)? 10. Сравните известные поисковые методы по помехоустойчивости в смысле выбора направления движения. 11. Сравните поисковые методы по помехоустойчивости в смысле точности выхода к экстремуму. 12. Сравните методы поиска по эффективности, то есть по скорости выхода к экстремуму. 13. Каковы достоинства и недостатки поисковых методов? 14. Что служит критерием достижения экстремума в поисковых методах? 15. В чем состоит роль мысленных опытов и как они проводятся? 16. Как выполняется статистический анализ результатов в методе крутого восхождения? 17. Как выполняется оптимизация при многоэкстремальной поверхности отклика? 18. Что служит критерием для выбора начальной точки исследования? 19. Что служит критерием для выбора интервала варьирования для каждого фактора? 99 Литература 1. Воронина О.А. Математические основы планирования и проведения эксперимента. Учеб. пособие / О.А. Воронина - Орел: ОрелГТУ – 2007. 2. Современный эксперимент: подготовка, проведение, анализ результатов / В.Г. Блохин , О.П. Глудкин , А.И. Гуров , М.А Ханин. Под ред. О.П. Глудкина – М.: Радио и связь, 1997. 3. Статистические методы в инженерных исследованиях (лабораторный пр актикум): Учеб. по со бие / В.П. Бо р одюк , А.П. Во щинин , А.З. Ивано в и др . Под ред. Г.К. Круга – М.: Высшая школа, 1983. 4. Грачев Ю.П. Математические методы планирования эксперимента / Ю.П. Грачев, Ю.М. Плаксин Ю.М - М.: ДеЛи принт 2005 г. 5. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь - М.: ФИЗМАТЛИТ, 2006 6. Вуколов Э. А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL: у чебно е по собие / Э. А. Вуколов — М. : ФОРУМ : ИНФРА-М, 2010 7. Денисенко В.В. Компьютерное управление технологическим процессом, экспериментом, оборудованием. / В.В. Денисенко - М.: Горячая линия-Телеком, 2009. 8. ГОСТ Р 50.1.040-2002 Статистические методы. Планирование экспериментов. Термины и определения 9. Охорзин В.А. Прикладная математика в системе MATHCAD: Учебное пособие. / В.А. Охорзин – СПб.: Лань, 2008. 10. Лагутин М. Б. Наглядная математическая статистика / М. Б. Лагутин М.: Бином. Лаборатория знаний, 2007. 11. Макаров А.А. Анализ данных на компьютере / Ю.Н Тюрин, А.А. Макаров – М.: Инфра-М, 2003. 12. Львович Я.Е. Теоретические основы конструирования, технологии и надежно сти РЭА: Учеб. по со бие для вузо в / Я.Е.Льво вич , В.Н.Фр о ло в - М.: Радио и связь, 1986. 100 4 Методические указания по проведению лабораторных работ. ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССОНАЛЬНОГО ОБРАЗОВАНИЯ «ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ – УЧЕБНО-НАУЧНОПРОИЗВОДСТВЕННЫЙ КОМПЛЕКС» УЧЕБНО-НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Кафедра «Электроника, вычислительная техника и информационная безопасность» О.А. Воронина АВТОМАТИЗАЦИЯ ЭКСПЕРИМЕНТА ПРИ ПРОИЗВОДСТВЕ ЭЛЕКТРОННЫХ СРЕДСТВ Методические указания по выполнению лабораторных работ Дисциплина – «Эксперимент, планирование, проведение, анализ» Направление – 211000.68 «Конструирование и технология электронных средств» Орел 2012 101 Автор: к.т.н., доцент кафедры «Электроника, вычислительная техника и информационная безопасность» О.А.Воронина Рецензент: к.т.н., профессор кафедры «Электроника, вычислительная техника и информационная безопасность» В.А. Лобанова Методические указания по выполнению лабораторных работ «Планирование и проведение эксперимента при производстве электронновычислительных средств» предназначены для магистрантов, обучающихся по направлению 211000.68 «Конструирование и технология электронных средств», изучающих дисциплину «Эксперимент, планирование, проведение, анализ». Методические указания по выполнению лабораторных работ «Планирование и проведение эксперимента при производстве электронновычислительных средств» рассмотрены и одобрены на заседании кафедры «ЭВТИБ» «______»________2011 г., протокол №___, зав. кафедрой ЭВТИБ, д.т.н., профессор ________________ В.Т. Еременко 102 СОДЕРЖАНИЕ МОДУЛЬ 2 «АКТИВНЫЙ ЭКСПЕРИМЕНТ» _____________________ 104 ЛАБОРАТОРНАЯ РАБОТА № 1 _____________________________ 104 Автоматизация обработки результатов активного эксперимента ____ 104 МОДУЛЬ 3 «ПАССИВНЫЙ ЭКСПЕРИМЕНТ» ____________________ 109 ЛАБОРАТОРНАЯ РАБОТА № 2 _____________________________ 109 Планирование и обработка результатов пассивного эксперимента ___ 109 МОДУЛЬ 4 «МЕТОДЫ ОПТИМИЗАЦИИ» _______________________ 119 ЛАБОРАТОРНАЯ РАБОТА № 3 ____________________________ 119 Планирование экстремальных поисковых экспериментов __________ 119 Литература _____________________________________________________ 128 103 МОДУЛЬ 2 «АКТИВНЫЙ ЭКСПЕРИМЕНТ» ЛАБОРАТОРНАЯ РАБОТА № 1 Автоматизация эксперимента обработки результатов активного Обработка результатов измерительного эксперимента основывается на статистическом анализе получаемых данных, и при больших объемах информации возникает необходимость в автоматизации данного процесса. Статистическая обработка результатов эксперимента состоит из нескольких этапов, среди которых построение вариационных рядов, вычисление статистических характеристик, исключение аномальных значений, проверка полученных данных на соответствие предполагаемому теоретическому закону распределения, проверка на независимость, проверка выборок на однородность. Современные программные средства математического анализа, такие как MatchCad от компании MathSoft, MatLab (The MathWorks inc.), Statistica (Statsoft inc.) позволяют решать широкий круг задач связанных с обработкой экспериментальных данных, используя разнообразные алгоритмы, заложенные в качестве предустановленных функций программных пакетов либо созданные самостоятельно на основе уже имеющихся. Однако, данные программные средства не позволяют проводить интеграцию с внешними источниками данных на достаточно высоком уровне. Процесс обработки данных в системе LabVIEW состоит из нескольких этапов, каждый из которых, представляет собой отдельный программный модуль. На первом этапе для тестирования работы системы происходит получение данных от генератора случайных чисел, текстового файла либо аналого-цифрового преобразователя L-780 производства L-card, с частотой дискретизации до 300 кГц либо интерфейса компьютера; полученный массив данных (генеральная выборка) разделяется на подвыборки, каждая из которых может быть сохранена отдельно либо в рамках генеральной выборки. Следующим этапом является обработка данных согласно регламентированной в нормативной литературе методике. 104 Структурная схема системы статистической обработки результатов измерительного эксперимента представлена на рис. 1. В системе использованы как стандартные элементы LabVIEW], реализующие функции статистической обработки, так и разработанные на их основе специализированные подпрограммы. Рис.1.1. Структурная схема системы статистической обработки результатов измерительного эксперимента Система даёт возможность генерировать выборки с заданными законами распределения данных - нормальным, равномерным и треугольным. Выборки в дальнейшем могут быть экспортированы в файл и использованы для иных целей. Для генерации случайной величины с гауссовским законом распределения применяется стандартный элемент Gaussian Noise. Для удобства использования элементы для генерации выборок с равномерным и треугольным законами распределения выполнены по образцу стандартных элементов генерации случайных последовательностей, встроенных в систему LabVIEW, т.е. разработанные элементы позволяют задавать исходные параметры выборки (объем, математическое ожидание и дисперсию). Генерация выборки с равномерным законом распределения выполняется с помощью разработанного виртуального прибора, использующего как основу стандартный элемент Random Number, 105 генерация выборки с треугольным законом распределения осуществляется на основе алгоритма, предложенного в. Подпрограмма реализации данного алгоритма приведена на рис.1. 2. Разработанная система позволяет: 1. Рассчитывать точечные характеристики (математическое ожидание, дисперсию, размах, эксцесс, асимметрию, моду и медиану). Для реализации были использованы встроенные функции LabVIEW. Вид окна расчета точечных характеристик приведены на рис1. 3. 2. Рассчитывать интервальные оценки вышеприведенных статистических характеристик. 3. Проверять экспериментальные данные на нормальность. Проверка соответствия закона распределения полученной выборки гауссовскому выполняется с помощью RS-критерия (рис1.4). Значения верхнего и нижнего порога Фα(0,1) представляют собой двумерный массив, записанный в файл, поскольку встроенная функция Continuous Inverse CDF.vi. не возвращает требуемых параметров. 4. Строить гистограмму распределения экспериментальных данных; проверять соответствие закона распределения экспериментальных данных с заданным с помощью критериев Колмогорова и х2 Рис1.2. Подпрограмма генерации выборки с треугольным законом распределения Окно анализа данных по критерию χ 2 приведено на рис. 5. На практике пороговые значения χ2гр выбирают из таблиц в зависимости от количества степеней свободы r и вероятности p. В разработанной 106 системе для полученияχ CDF.vi. гр. 2 применяется функция Continuous Inverse Рис1.3. Окно расчета точечных характеристик 5. Проверка на аномальность результатов, выявления грубых погрешностей и промахов (параметрические критерии Ирвина, Кохрена). 6. Проверка однородности (параметрические критерии Фишера, Стьюдента, непараметрический критерий Лемана-Розенблата). Подпрограмма проверки однородности по критерию Фишера приведена на рис1. 6. Рис1.4. Окно проверки экспериментальных данных на нормальность 7. Проверка на независимость (корреляционные коэффициенты, критерий Кенделла-Симта). 8. Проверка на переменные систематические погрешности (серийные критерии: медианный, восходящих и нисходящих серий, а также критерий Аббе). Для получения пороговых значений статистик 107 критериев были использованы встроенные функции LabVIEW (Continuous Inverse CDF.vi), а также сформированные внешние массивы данных. Рис1.5. Окно просмотра результатов работы χ2 критерия Рис.1.6. Подпрограмма проверки однородности выборок по критерию Фишера 108 МОДУЛЬ 3 «ПАССИВНЫЙ ЭКСПЕРИМЕНТ» ЛАБОРАТОРНАЯ РАБОТА № 2 Планирование эксперимента и обработка результатов пассивного Цель работы: Изучение возможностей пакета Ms Excel при решении задач обработки экспериментальных данных. Приобретение навыков обработки результатов эксперимента. Одной из распространенных задач в науке, технике является аппроксимация экспериментальных данных, алгебраических данных аналитическими выражениями. Возможность подобрать параметры уравнения таким образом, чтобы его решение совпало с данными эксперимента, зачастую является доказательством (или опровержением) теории. Рассмотрим следующую математическую задачу. Известные значения некоторой функции f образуют таблицу: Таблица 2.1 x x1 x2 ... xn f(x) y1 y2 ... yn Необходимо построить аналитическую зависимость наиболее близко описывающую результаты эксперимента. функцию y = f(x, a0, a1, ..., ak) таким образом, чтобы сумма отклонений измеренных значений yi от расчетных f(xi ,a0, была наименьшей (см. рис. 2.1). Рис. 2.1 109 y = f(x), Построим квадратов a1, ..., ak) Математически эта задача равносильна следующей: найти значение параметров a0, a1, a2, ...,ak, при которых функция принимала бы минимальное значение. (2.1) Эта задача сводится к решению системы уравнений: (2.2) Если параметры ai входят в зависимость y = f(x,ao, a1, …, ak) линейно, то мы получим систему линейных уравнений: (2.3) Решив систему (2.3), найдем параметры ao, a1, ..., ak и получим зависимость y = f(x, ao, a1, ..., ak). Линейная функция (линия регрессии) Необходимо определить параметры функции y = ax+b. Составим функцию S: (2.4) Продифференцируем выражение (8.4) по a и b, сформируем систему линейных уравнений, решив которую мы получим следующие значения параметров: (2.5) Подобранная прямая называется линией регрессии y на x, a и b называются коэффициентами регрессии. Чем меньше величина тем более обосновано предположение, что табличная зависимость описывается линейной функцией. Существует показатель, характеризующий тесноту линейной связи между x и y. Это коэффициент корреляции. Он рассчитывается по формуле: Коэффициент корреляции r и коэффициент регрессии a связаны соотношением: где Dy, Dx - среднеквадратичное отклонение значений x и y. 110 Значение коэффициента корреляции удовлетворяет соотношению -1 ≤ r ≤ 1. Чем меньше отличается абсолютная величина r от единицы, тем ближе к линии регрессии располагаются экспериментальные точки. Если коэффициент корреляции равен нулю, то переменные x, y называются некоррелированными. Если r = 0, то это только означает, что между x, y не существует линейной связи, но между ними может существовать зависимость, отличная от линейной. Для того чтобы проверить, значимо ли отличается от нуля коэффициент корреляции, можно использовать критерий Стьюдента. Вычисленное значение критерия определяется по формуле: Значение t сравнивается со значением, взятым из таблицы распределения Стьюдента в соответствии с уровнем значимости a и числом степеней свободы n-2. Если t больше табличного, то коэффициент корреляции значимо отличен от нуля. Решение поставленной задачи средствами MS Excel Вычисление коэффициентов регрессии осуществляется с помощью функции ЛИНЕЙН(): ЛИНЕЙН(Значения_y; Значения_x; Конст; статистика) Значения_y - массив значений y. Значения_x- необязательный массив значений x, если массив х опущен, то предполагается, что это массив {1;2;3;...} такого же размера, как и Значения_y. Конст - логическое значение, которое указывает, требуется ли, чтобы константа b была равна 0. Если Конст имеет значение ИСТИНА или опущено, то b вычисляется обычным образом. Если аргумент Конст имеет значение ЛОЖЬ, то b полагается равным 0 и значения a подбираются так, чтобы выполнялось соотношение y = ax. Статистика - логическое значение, которое указывает, требуется ли вернуть дополнительную статистику по регрессии. Если аргумент статистика имеет значение ИСТИНА, то функция ЛИНЕЙН возвращает дополнительную регрессионную статистику. Если аргумент статистика имеет значение ЛОЖЬ или опущен, то функция ЛИНЕЙН возвращает только коэффициент a и постоянную b. Для вычисления множества точек на линии регрессии используется функция ТЕНДЕНЦИЯ. 111 ТЕНДЕНЦИЯ(Значения_y; Значения_x; Новые_значения_x; Конст) Значения_y- массив значений y, которые уже известны для соотношения y = ax + b. Значения_x- массив значений x. Новые_значения_x- новый массив значений, для которых ТЕНДЕНЦИЯ возвращает соответствующие значения y. Если Новые_значения_x опущены, то предполагается, что они совпадают с массивом значений х. Конст - логическое значение, которое указывает, требуется ли, чтобы константа b была равна 0. Если Конст имеет значение ИСТИНА или опущено, то b вычисляется обычным образом. Если Конст имеет значение ЛОЖЬ, то b полагается равным 0, и значения а подбираются таким образом, чтобы выполнялось соотношение y = ax. Необходимо помнить, что результатом функций ЛИНЕЙН, ТЕНДЕНЦИЯ является множество значений - массив. Для расчета коэффициента корреляции используется функция КОРРЕЛ, возвращающая значения коэффициента корреляции: КОРРЕЛ(Массив1;Массив2) Массив1 - массив значений y. Массив2 - массив значений y. Массив1 и Массив2 должны иметь одинаковое количество точек данных. ПРИМЕР 2.1. Известна табличная зависимость G(L). Построить линию регрессии и вычислить ожидаемое значение в точках 0, 0.75, 1.75, 2.8, 4.5. 1 1,5 2 2,5 3 3,5 4 L 0 0,5 G 1 2,39 2,81 3,25 3,75 4,11 4,45 4,85 5,25 Введем таблицу значений в лист MS Excel и построим точечный график. Рабочий лист примет вид изображенный на рис. 2.2. 112 Рис. 2.2 Для того, чтобы рассчитать значения коэффициентов регрессии а и b выделим ячейки К2:L2, обратимся к мастеру функций и в категории Статистические выберем функцию ЛИНЕЙН. Заполним появившееся диалоговое окно так, как показано на рис. 2.3 и нажмем Ок. Рис. 2.3 В результате вычисленное значение появится только в ячейке К2 (см. рис.8.4). Для того чтобы вычисленное значение появилось и в ячейке L2 необходимо войти в режим редактирования, нажав клавишу F2, а затем нажать комбинацию клавиш CTRL+SHIFT+ENTER. 113 Для расчета значения коэффициента корреляции в ячейку M2 была введена следующая формула: М2 = КОРРЕЛ(B1:J1;B2:J2) (см. рис. 2.4). Рис. 2.4 Для вычисления ожидаемого значения в точках 0, 0.75, 1.75, 2.8, 4.5 занесем их в ячейки L9:L13. Затем выделим диапазон ячеек M10:M13 и введем формулу: = ТЕНДЕНЦИЯ(B2:J2;B1:J1;L9:L13). Для того чтобы вычисленные значения появились и в ячейках M10:M13 необходимо нажать комбинацию клавиш CTRL+SHIFT+ENTER. Рис. 2.5 Изобразим линию регрессии на диаграмме. Для этого выделим экспериментальные точки на графике, щелкнем правой кнопкой мыши и выберем команду Исходные данные. В появившемся диалоговом окне (см. рис. 8.5), для добавления линии регрессии щелкнем по кнопке Добавить. В качестве имени введем Линия регрессии, в качестве Значения Х: L9:L13, в качестве Значения Y: M9:M13. Далее выделяем линию регрессии, для изменения ее типа щелкаем правой кнопкой мыши и выбираем команду Тип диаграммы (см. рис. 8.6). Для форматирования линии регрессии (можно изменить толщину линии, цвет, тип маркера и т.п) дважды щелкаем по ней (см. рис. 8.7). 114 Рис. 8.6 Рис. 8.7 После форматирования графика рабочий лист примет вид, изображенный на рис. 8.8. 115 Рис. 8.8 ВАРИАНТЫ ЗАДАНИЙ 1. На первом рабочем листе документа MS Excel ввести исходные данные, соответствующие варианту задания. Проанализировать экспериментальную зависимость. Построить график экспериментальных точек. 2. На втором рабочем листе средствами MS Excel рассчитать коэффициенты регрессии, коэффициент корреляции, среднеквадратичные отклонения и суммарную ошибку. Построить в одной графической области экспериментальные точки и линию регрессии. 3. Третий рабочий лист должен содержать вычисление коэффициентов функциональной зависимости, соответствующей варианту задания. Расчет коэффициентов произвести аналитически при помощи метода наименьших квадратов, сведя задачу к задаче оптимизации. Построить в одной графической области экспериментальные точки и график подобранной функциональной зависимости. Определить суммарную ошибку. 4. На четвертом рабочем листе построить линию тренда, если это возможно. Убедится в том, что вычисленные в п.3 коэффициенты совпадают с коэффициентами линии тренда. Провести сравнительный анализ полученных результатов и построить в одной графической области график экспериментальных точек, линию регрессии и график полученной экспериментальной зависимости. 116 5. Озаглавить рабочие листы согласно тематике вычислений. Исходные данные, результаты вычислений и графики сопровождать соответствующими подписями и пояснениями. Вариант №1. P(s)=As3+Bs2+Сs+D s 0,00 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50 5,00 P 10,00 50,10 39,58 15,40 23,68 33,60 57,78 100,90 149,50 256,00 Вариант № 2. G(s)=Ae bs s 0,5 1,5 2 2,5 3 3,5 4 4,5 5 G 3,99 5,65 6,41 7,71 11,215 17,611 27,83 38,19 39,3 1 1,5 2 2,5 3 3,5 4 2,1 2 2,1 2,3 2,4 2,22 2,59 Вариант № 3. K(s)=As b s 0,5 K 1,65 Вариант № 4. V(s)=As е b Cs s 0,2 0,7 1,2 1,7 2,2 2,7 3,2 V 2,3198 2,9569 2,3999 6,4357 6,5781 6,9459 14,6621 Вариант № 5. W(s)=A/(Bs+C) s 1 W 0,529 2 3 4 5 6 7 8 9 0,298 0,267 0,171 0,156 0,124 0,1 0,078 0,075 Вариант № 6. Q(s)=As +Bs+C 2 s 1 1,25 1,5 1,75 2 2,25 2,5 2,75 3 Q 5,21 4,196 3,759 3,672 4,592 4,621 5,758 7,173 9,269 Вариант № 7. Y=x/(Ax-B) x 3 3,1 Y 0,61 0,6 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0,592 0,58 0,585 0,583 0,582 0,57 0,572 0,571 Вариант № 8. V=1/(A+Be ) -U u 2 V 5,197 2,5 3 3,5 4 4,5 5 5,5 6 7,78 11,14 15,09 19,24 23,11 26,25 28,6 30,3 Вариант № 9. R=At +14,5 B t 1 2 3 4 5 6 7 8 9 10 R 2,11 5,2 5,15 19,27 18,2 30,37 32 31 30,22 31,2 Вариант № 10. R=Ch +Dh+K 2 h 2 4 6 8 10 12 14 16 R 0,035 0,09 0,147 0,1 0,24 0,28 0,31 0,34 1 1,5 2 2,5 3 3,5 4 2,81 3,25 3,75 4,11 4,45 4,85 5,25 Вариант №11. G=DL+K l 0 0,5 G 2 2,39 Вариант № 12. Y=Ax +Bx +Cx+D 3 x 1 Y 14,5 2 1,5 2 2,5 3 3,5 4 4,5 5 25 26,9 83,75 89,9 219,1 326,1 464 637,5 3 3,5 Вариант № 13. Y=Ax +Cx+D 3 x 1 1,5 2 2,5 117 4 4,5 5 Y 6,5 20,38 46,4 88,63 151,1 237,9 535 500,3 684,5 Вариант № 14. R=Ch +K 2 h 1 R 7,5 1,5 2 2,5 3 3,5 4 4,5 14,25 23,7 25,86 50,7 68,25 88,5 111,5 Вариант № 15. Z=At +Ct +K 4 2 t 1 1,5 2 2,5 3 3,5 4 4,5 5 Z 2,2 10,6 35,6 90 191,1 359,2 618,7 997,9 1598,5 118 МОДУЛЬ 4 «МЕТОДЫ ОПТИМИЗАЦИИ» ЛАБОРАТОРНАЯ РАБОТА № 3 Планирование экстремальных поисковых 119 экспериментов 120 121 122 123 124 ЗАДАНИЯ ДЛЯ ВЫПОЛНЕНИЯ 1) 2) 125 3) 4) 5) 126 127 Литература 1. Воронина О.А. Математические основы планирования и проведения эксперимента. Учеб. пособие / О.А. Воронина - Орел: ОрелГТУ – 2007. 2. Современный эксперимент: подготовка, проведение, анализ результатов / В.Г. Блохин , О.П. Глудкин , А.И. Гуров , М.А Ханин. Под ред. О.П. Глудкина – М.: Радио и связь, 1997. 3. Статистические методы в инженерных исследованиях (лабораторный практикум): Учеб. пособие / В.П. Бородюк , А.П. Вощинин , А.З. Иванов и др. Под ред. Г.К. Круга – М.: Высшая школа, 1983. 4. Грачев Ю.П. Математические методы планирования эксперимента / Ю.П. Грачев, Ю.М. Плаксин Ю.М - М.: ДеЛи принт 2005 г. 5. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь - М.: ФИЗМАТЛИТ, 2006 6. Вуколов Э. А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL: учебное пособие / Э. А. Вуколов — М. : ФОРУМ : ИНФРА-М, 2010 7. Денисенко В.В. Компьютерное управление технологическим процессом, экспериментом, оборудованием. / В.В. Денисенко - М.: Горячая линия-Телеком, 2009. 8. ГОСТ Р 50.1.040-2002 Статистические методы. Планирование экспериментов. Термины и определения 9. Охорзин В.А. Прикладная математика в системе MATHCAD: Учебное пособие. / В.А. Охорзин – СПб.: Лань, 2008. 10. Лагутин М. Б. Наглядная математическая статистика / М. Б. Лагутин - М.: Бином. Лаборатория знаний, 2007. 11. Макаров А.А. Анализ данных на компьютере / Ю.Н Тюрин, А.А. Макаров – М.: Инфра-М, 2003. 12. Львович Я.Е. Теоретические основы конструирования, технологии и надежности РЭА: Учеб. пособие для вузов / Я.Е.Львович , В.Н.Фролов - М.: Радио и связь, 1986. 13. Журнал «Математическое моделирование» [Электронный ресурс] http://www.mathnet.ru/php/journal.phtml?jrnid=mm&option_lang=rus 128 5 Методические рекомендации по выполнению практических работ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССОНАЛЬНОГО ОБРАЗОВАНИЯ «ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ – УЧЕБНО-НАУЧНОПРОИЗВОДСТВЕННЫЙ КОМПЛЕКС» УЧЕБНО-НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Кафедра «Электроника, вычислительная техника и информационная безопасность» О.А. Воронина ПЛАНИРОВАНИЕ И ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТА ПРИ ПРОИЗВОДСТВЕ ЭЛЕКТРОННО-ВЫЧИСЛИТЕЛЬНЫХ СРЕДСТВ Методические указания по проведению практических занятий Дисциплина – «Эксперимент, планирование, проведение, анализ» Направление – 211000.68 «Конструирование и технология электронных средств» Орел 2012 129 Автор: к.т.н., доцент кафедры «Электроника, вычислительная техника и информационная безопасность» О.А.Воронина Рецензент: к.т.н., профессор кафедры «Электроника, вычислительная техника и информационная безопасность» В.А. Лобанова Методические указания по проведению практических занятий «Планирование и проведение эксперимента при производстве электронновычислительных средств» предназначены для магистрантов, обучающихся по направлению 211000.68 «Конструирование и технология электронных средств», изучающих дисциплину «Эксперимент, планирование, проведение, анализ». Методические указания содержат описания методов планирования активного и пассивного эксперимента, обработки и анализа полученных результатов, методов оптимизации процессов. Методические указания состоят из десяти практических занятий, каждое из которых содержит основные теоретические сведения по теме, поясняющие примеры и задачи для решения Методические указания по проведению практических занятий «Планирование и проведение эксперимента при производстве электронновычислительных средств» рассмотрены и одобрены на заседании кафедры «ЭВТИБ» «______»________2011 г., протокол №___, зав. кафедрой ЭВТИБ, д.т.н., профессор ________________ В.Т. Еременко; 130 Содержание Стр. Введение ............................................................................................... 132 МОДУЛЬ 1 «МЕТОДОЛОГИЯ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ».......................................................................... 133 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 1................................................... 133 1.1 Экспериментальный анализ случайной величины ............... 133 1.2 Проверка статистических гипотез ........................................ 138 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 2.................................................. 150 2.1 Метод ранговой корреляции .................................................. 150 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 3................................................... 158 3.1 Однофакторный дисперсионный анализ ............................... 158 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 4................................................... 168 4.1 Двухфакторный дисперсионный анализ ............................... 168 4.2 Трехфакторный дисперсионный анализ ................................ 169 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 5.................................................. 178 5. Методы насыщенных и сверхнасыщенных планов ................ 178 МОДУЛЬ 2 «АКТИВНЫЙ ЭКСПЕРИМЕНТ» .................................. 198 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 6................................................... 198 6. Полный факторный эксперимент ........................................... 198 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 7................................................... 219 7.1 Дробный факторный эксперимент ....................................... 219 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 8................................................... 228 8 ЦЕНТРАЛЬНЫЕ КОМПОЗИЦИОННЫЕ ПЛАНЫ .............. 228 8.1 Центральный композиционный ортогональный план ........ 230 8.2 Центральный композиционный рототабельный план ........ 236 МОДУЛЬ 3 «ПАССИВНЫЙ ЭКСПЕРИМЕНТ» ............................... 248 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №9.................................................... 248 9.1 Метод регрессионного анализа ............................................ 248 МОДУЛЬ 4 «МЕТОДЫ ОПТИМИЗАЦИИ» ...................................... 259 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 10 ................................................. 259 10.1 Методы оптимизации .......................................................... 259 Литература ............................................................................................ 280 Приложения 281 131 Введение Целью изучения дисциплины «Эксперимент, планирование, проведение, анализ» является освоение основных принципов построения математических моделей разрабатываемых объектов и технологических процессов, методов оптимизации их параметров, методов планирования и проведения активных и пассивных экспериментов, анализа результатов эксперимента. Задачи курса: - математическое моделирование разрабатываемых объектов или технологических процессов с целью оптимизации их параметров; - организация модельных и натурных экспериментов. В процессе освоения дисциплины у студентов формируются следующие профессиональные компетенции: ПК-19 «способность планировать и проводить эксперименты, обрабатывать и анализировать их результаты» , ПК-3 «способность понимать основные проблемы в своей предметной области, выбирать методы и средства их решения». В результате освоения дисциплины и формирования профессиональных компетенций магистр должен: - Знать : основы планирования, проведения и обработки результатов эксперимента, основы методов оценки результатов исследований, способы представления научно-технической информации; - Уметь: правильно использовать достижения науки при постановке и проведении эксперимента в области проектирования, технологии и эксплуатации электронных средств, правильно классифицировать и находить научно-техническую информацию в области проектирования, технологии и эксплуатации электронных средств, правильно оформлять результаты исследований в области проектирования, технологии и эксплуатации электронных средств; - Владеть: навыками планирования и проведения эксперимента, навыками применения современных программных средств, навыками анализа научной информации в своей предметной области знания, навыками работы в текстовых процессорах, электронных таблицах, базах данных, системах подготовки презентаций и современных прикладных программах. 132 МОДУЛЬ 1 «МЕТОДОЛОГИЯ МОДЕЛИРОВАНИЯ» МАТЕМАТИЧЕСКОГО ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 1 1.1 Экспериментальный анализ случайной величины Случайной величиной (СВ) называют такую величину, значения которой изменяются при повторении опытов некоторым, заранее не предсказуемым образом. f(x). Для случайной величины нельзя заранее точно сказать, какое конкретное значение она примет в определенных условиях, а можно только указать закон ее распределения. Закон распределения считается заданным, если: – указано множество возможных значений случайной величины, – указан способ количественного определения вероятности попадания случайной величины в любую область множества возможных значений. Вероятность попадания в заданную область может быть определена следующим образом: p m = lim ( N m N ) , (1.1) N →∞ где Nm – количество наблюдений СВ, оказавшихся в заданной области, N – общее число наблюдений (частотное определение вероятности). Аналитическими выражениями законов распределения случайных величин являются функции распределения вероятностей – интегральная и дифференциальная. Интегральная функция распределения F(x) случайной величины X показывает вероятность того, что СВ не превышает некоторого заданного или текущего значения x. F(x) = P{X ≤ x} (1.2) Следовательно, вероятность того, что значение СВ X заключено между x1 и x2 равна разности значений функции распределения, вычисленных в этих двух точках: P{x1 < X ≤ x2} = F(x2) – F(x1). Аналогично, P{X > x} = 1 – F(x). (1.3) (1.4) Свойства интегральной функции распределения СВ: 133 F ( x) = F ( −∞) = 0 ; 1. Nlim →∞ F ( x ) = F (∞ ) = 1 ; 2. Nlim →∞ 3. F(x) ≥ 0 для всех x; 4. F(x2) ≥ F(x1), если x2 > x1. Если функция F(x) дифференцируема для всех значений СВ Х, то закон распределения вероятностей может быть выражен с помощью дифференциальной функции распределения вероятностей: f ( x) = dF ( x) dx = lim P{x < X ≤ x + ∆x} ∆x; (∆x > 0) ∆x →0 (1.5) Таким образом, значение функции f(x) приближенно равно отношению вероятности попадания СВ в интервал (x, x+Δx) к длине Δx этого интервала, когдаΔ x – бесконечно малая величина. Поэтому функцию f(x) называют также функцией плотности распределения вероятностей (функцией плотности вероятности). Основные свойства дифференциальной функции распределения вероятностей: ∞ 2. ∫ f ( x)dx = 1 ; −∞ 1. f(x) ≥ 0; x f ( x) = 0 3. ∫ f ( z )dz = F ( x) ; (z – переменная интегрирования) 4. lim x →∞ −∞ С помощью дифференциальной функции распределения вычисляется вероятность нахождения СВ в любой области из множества ее возможных значений. В частности, P{ X ≤ a1} = a1 ∫ f ( x)dx, (1.6) −∞ ∞ P{ X > a2 } = ∫ f ( x)dx, (1.7) a2 P{a1 < X ≤ a2 } = a2 ∫ f ( x)dx. (1.8) a1 Как интегральная, так и дифференциальная функции распределения являются исчерпывающими вероятностными характеристиками случайной величины. Однако некоторые основные свойства СВ могут быть описаны более просто с помощью определенных числовых параметров. Наибольшую роль среди них на практике играют роль два параметра, характеризующие центр рассеяния (центр распределения) СВ и степень ее рассеяния вокруг этого центра. 134 Наиболее распространенной характеристикой центра распределения является математическое ожидание mx случайной величины Х (часто называемое также генеральным средним значением): ∞ mx = ∫ xf ( x)dx. (1.9) −∞ Степень рассеяния СВ Х относительно mx может охарактеризована с помощью генеральной дисперсии σ x2 : σ x2 = быть 2 ∞ ∫ (x − m ) x f ( x)dx. (1.10) −∞ Квадратный корень из дисперсии σ x2 называется средним квадратическим отклонением σ x . Зачастую для описания практической ситуации оказывается необходимым использование одновременно нескольких (в простейшем случае – двух) случайных величин. Для задания вероятностных свойств двух СВ X, Y используются двумерные (совместные) функции распределения вероятностей: интегральная F(x,y) и дифференциальная f(x,y). Функция F(x,y), характеризующая вероятность того, что первая СВ принимает некоторое значение, меньшее или равное x, а вторая – значение, меньшее или равное y, называется интегральной функцией совместного распределения двух случайных величин: F(x, y) = P{X ≤ x, Y ≤ y}. (1.11) Как и для одной непрерывной СВ, если функция F(x,y) достаточно гладкая, то ее можно продифференцировать, в результате чего получится двумерная дифференциальная функция распределения вероятностей (двумерная плотность вероятности): f(x, y) = ∂2F(x, y) ⁄ ∂x∂y. (1.12) По известной двумерной плотности f(x,y) можно определить частные (одномерные) функции распределения f(x), f(y) каждой случайной величины: ∞ f ( x) = ∫ f ( x, y)dy, ∞ f ( y) = −∞ ∫ f ( x, y)dx. −∞ (1.13) Как и в одномерном случае, основные свойства двумерной совокупности величин X, Y могут быть охарактеризованы с помощью 135 ряда числовых параметров. В качестве наиболее употребительных параметров используются математическое ожидание и дисперсия соответствующей СВ: mx, my, σ x2 , σ y2 . Для двумерной совокупности могут быть построены параметры, характеризующие степень взаимозависимости переменных X и Y. Простейшими из них являются ковариация двух случайных величин (называемая также корреляционным моментом) cov( X , Y ) = ∞ ∫ ∫ ( x − m )( y − m x −∞ y ) f ( x, y )dxdy, (1.14) а также нормированный показатель связи – коэффициент корреляции ρ xy = cov( X , Y ) (σ xσ y ). (1.15) Коэффициент корреляции характеризует степень линейной зависимости между X и Y. Коэффициент корреляции меняется в пределах –1≤ρxy≤1. Все описанные функции и связанные с ними параметры являются теоретическими, характеризующими определенные свойства изучаемого объекта. На практике почти всегда эти характеристики неизвестны и возникает задача экспериментального (эмпирического) определения тех или иных характеристик случайных величин на основе наблюдений. Экспериментальный анализ одномерной случайной величины Пусть имеется набор (выборка) экспериментальных данных x1, x2,…xN. Обработку этих данных для получения эмпирических характеристик одномерной СВ производят обычно в следующей последовательности. 1 Построение вариационного ряда (ряда распределения) Вариационный ряд z1, z2,…zN получают из исходных данных путем расположения xm (m=1,2,…,N) в порядке возрастания от xmin до xmax так, чтобы xmin= z1 ≤ z2 ≤…≤ zN = xmax. 2 Построение диаграммы накопленных частот. Диаграмма ∧ накопленных частот F N (x) является эмпирическим аналогом интегрального закона распределения. Диаграмму строят в соответствии с формулой ∧ F N ( x) = µ N ( x) ∑ (1 N ), (1.16) i =1 136 где μN (x) – число элементов в выборке, для которых значение xi < x. При построении диаграммы на оси абсцисс указывают значения наблюдений xm (или zl). Значение по оси ординат равно нулю левее точки xmin и далее во всех других точках xm диаграмма имеет скачок равный 1/N. Если существует несколько совпадающих значений xm, то в этом месте на диаграмме происходит скачок, равный λ/N, где λ – число совпадающих точек. Для величин x > xmax значение диаграммы накопленных частот равно 1. При N → ∞ ∧ F N (x) → F(x). ∧ 3 Построение гистограммы выборки Гистограмма f N (x) является эмпирическим аналогом функции плотности распределения f(x). Этапы построения гистограммы: — Нахождение предварительного количества квантов (интервалов), на которое должна быть разбита ось Ox. Это количество К определяется с помощью оценочной формулы K = 1 + 3,2lgN (1.17) Найденное значение необходимо округлить до ближайшего целого. — Определение длины интервала ∆x = (xmax – xmin) / K (1.18) Величину ∆x можно округлить для удобства вычислений. — Середину области изменения выборки (центр распределения) (xmax+xmin)/2 принимают за центр некоторого интервала, после чего определяют границы и окончательное количество указанных интервалов так, чтобы в совокупности они перекрывали всю область от xmin до xmax. — Подсчет количества наблюдений Nm, попавших в каждый квант: Nm равно числу членов вариационного ряда, для которых справедливо неравенство xm ≤ zl < xm + ∆x, где xm и xm + ∆x – границы m-го интервала. Значения zl, попавшие на границу между (m-1)–м и m –м интервалами, относят к m –му интервалу. — Подсчет относительного количества (относительной частоты) наблюдений Nm/N, попавших в данный квант. — Построение гистограммы, которая представляет собой ступенчатую кривую, значение которой на m –м интервале (xm, xm + ∆x) постоянно и равно Nm/N. 137 4 Определение оценок математического ожидания x , 2 дисперсии s x и среднего квадратического отклонения sx N x = (1 N )∑ xi , (1.19) i =1 N s = [∑ ( xi − x ) 2 ] ( N − 1) (1.20) s x = + s x2 . (1.21) 2 x i =1 1.2 Проверка статистических гипотез При решении многих прикладных задач необходимые вероятностные характеристики соответствующих случайных величин неизвестны исследователю и должны определяться по экспериментальным данным. Такое статистическое описание результатов наблюдений, построение и проверка различных математических моделей, использующих понятие вероятности, составляют основное содержание математической статистики. Фундаментальными понятиями статистической теории являются понятия генеральной совокупности и выборки. Генеральная совокупность – совокупность всех мыслимых (возможных) результатов наблюдений над случайной величиной, которые в принципе могут быть проведены при данных условиях. Если в результате эксперимента получены значения x1, x2,...xn, то они интерпретируются как случайная выборка из некоторой гипотетической генеральной совокупности. Выборка – это конечный набор значений случайной величины, полученный в результате наблюдений. Число элементов выборки n называется ее объемом. Выборка называется репрезентативной (представительной), если она достаточно полно характеризует генеральную совокупность. Для обеспечения репрезентативности выборки чаще всего используется случайный выбор элементов. Предполагается, что при таком выборе каждая возможная выборка фиксированного объема имеет одну и ту же вероятность выбора, а последовательные наблюдения взаимно независимы. Смысл статистических методов заключается в том, чтобы при выборке ограниченного объема n, то есть по некоторой части 138 генеральной совокупности, высказать обоснованное суждение о ее свойствах в целом. Под статистическими гипотезами понимаются некоторые предположения относительно характера распределения вероятностей генеральных совокупностей и их параметров. По данным выборки можно оценить такие параметры распределения как математическое ожидание (часто называемое также средним значением) и дисперсию. Математическое ожидание определяется по выражению: _ n x = ∑ xi n i =1 (1.22) Дисперсию можно оценить с помощью соотношения 2 n _ s = ∑ x − xi i =1 2 (n − 1) (1.23) Несмещенность оценки s2 достигается использованием в знаменателе формулы (2.2) величины ν = n − 1 , которую называют числом степеней свободы, вместо очевидного на первый взгляд значения n. Эта величина равна разности между числом имеющихся экспериментальных значений n, по которым вычисляют оценку дисперсии, и количеством дополнительных параметров, входящих в формулу для оценки этой дисперсии и вычисляемых в виде линейных комбинаций тех же самых наблюдений (в данном случае это всего один параметр x ). Проверка гипотезы заключается в сопоставлении некоторых статистических показателей (критериев проверки), вычисленных по данным выборки, со значениями этих показателей, определенных теоретически в предположении, что гипотеза верна. Критерий статистической гипотезы – это правило, позволяющее принять или отвергнуть данную гипотезу на основании выборки. Для проверки гипотезы о равенстве двух выборочных средних значений случайной величины, имеющей гауссовский закон распределения, используется критерий Стьюдента (t-критерий). Для применения данного критерия подсчитывают выборочные средние арифметические значения случайной величины X1 и X2, соответственно для выборок n1 и n2 , и их выборочные стандартные отклонения S1 и S2, которые определяются по следующим формулам: 139 _ 2 S1 = ∑ xi − x1 i =1 n1 _ 2 S 2 = ∑ xi − x 2 i =1 n1 (n1 − 1) и ( n2 − 1) (1.24) Далее подсчитывается величина стандартного отклонения выборочных средних арифметических значений по формуле ((n − 1)S + (n − 1)S ) ((n − 1) + (n − 1)) S_ = 2 1 1 x 2 2 2 1 2 (1.25) После того, как определены стандартные отклонения выборочных средних арифметических, подсчитывается размах Стьюдента: _ _ t = x 2 − x1 S _ x или _ t = M ( x) − x S _ x (1.26) Найденное экспериментальное значение t сравнивают с критичным значением tкр , которое определяется по таблице распределения Стьюдента для заданного коэффициента риска β (обычно задаются β =0,10; 0,05; 0,01), при котором может быть принята гипотеза, и числа степеней свободы ν . Если значение критерия, вычисленного по данным выборки, окажется больше его критического значения, определенного по таблице A1 приложения А, то гипотеза бракуется. При значениях критерия, принадлежащего области допустимых значений, можно лишь сделать заключение, что данная выборка не противоречит гипотезе. То есть если t ≤ tкр, то гипотеза о равенстве выборочных средних арифметических значений принимается, а это значит, что выборки взяты из одной и той же генеральной совокупности. При гауссовском законе распределения случайной величины для проверки гипотезы о равенстве двух дисперсий одной и той же случайной величины, в качестве критерия значимости используется критерий Фишера (F- критерий), который равен отношению двух рассматриваемых выборочных дисперсий S1 и S2 , имеющих соответственно степени свободы ν 1 и ν 2 , то есть F = S12 S 22 (1.27) При расчете F–параметра по (2.6) должно выполняться условие S21 140 >S22. В противном случае следует поменять местами рассматриваемые дисперсии. Найденное экспериментальное значение F-парметра сравнивается с его критическим значением Fкр, соответствующим максимальному значению отношения двух дисперсий, при котором еще можно считать гипотезу о равенств рассматриваемых дисперсий справедливой. Критичное значение Fкр по числу степеней свободы и заданному коэффициенту риска находится из таблицы A2 приложения А, Значение числа степеней свободы ν 1 дисперсии, стоящей в числителе выражения (1.27), определяет значение Fкр по столбцу, а значение ν 2 – по строке. Если F ≤ Fкр, то гипотеза о равенстве выборочных дисперсий принимается. В противном случае, рассматриваемые дисперсии относятся к различным генеральным совокупностям исследуемой случайной величины. Для проверки однородности дисперсии полученных экспериментальных значений используют критерий Кохрена. Для этого рассчитывается дисперсия экспериментальных значений для каждой выборки. В результате получится ряд выборочных дисперсий S2 и недоверие будут вызывать именно наибольшие их значения. Далее подсчитывается параметр G = max S N 2 ∑S 2 (1.28) i =1 при i=1,2…N, то есть вычисляют отношение максимального значения изменчивости среди N опытов к сумме изменчивостей во всех N опытах. Найденное по (1.28) наибольшее экспериментальное значение G сравнивают с критичным его значением Gкр. Критичное значение отношения рассматриваемой изменчивости к сумме всех изменчивостей находят из таблицы критических значений критерия Кохрена (таблица A3 приложения А). Задаваясь определенным значением коэффициента риска β, Gкр определяют в столбце, соответствующем числу элементов выборки (n) и строке, соответствующей числу выборок (N). Если G ≤ Gкр, то “подозрительное” максимальное значение изменчивости не является “инородным”, а представляет собою результат случайного рассеивания исследуемой величины. Критерий Кохрена применяется для оценки однородности дисперсий только при равном числе повторов каждого эксперимента, что и имеет место при применении методов статистического 141 планирования и проведения эксперимента. Если число повторов различно (различные объемы выборок), то однородность дисперсий проверяется по критерию Бартлета. Соответствие экспериментального распределения случайной величины предполагаемому теоретическому закону распределения оценивается с помощью критерия Пирсона. Принадлежность случайной величины к рассматриваемой генеральной совокупности случайных величин позволяет оценить критерий Диксона. Применение этого критерия имеет практический смысл только при большом числе параллельных опытов. Наиболее часто применимы на практике для проверки статистических гипотез критерии Стьюдента, Фишера, Кохрена. Рассмотрим их применение на примерах. 1.3 Решение типовых примеров Пример 1.1 Пусть имеется выборка из 10 наблюдений (то есть N=10): x1=5, x2=2, x3=4, x4=5, x5=7, x6=3, x7=6, x8=8, x9=3, x10=9. Исследовать свойства одномерной случайной величины Решение 1 Построение вариационного ряда (ряда распределения) z1=2, z2=3, z3=3, z4=4, z5=5, z6=5, z7=6, z8=7, z9=8, z10=9. 2 Построение диаграммы накопленных частот – на оси абсцисс отмечаем значения наблюдений 2, 3, 4, 5, 6, 7, 8, 9; – затем откладываем значения по оси ординат. Левее xmin=2 значение ординаты равно нулю, а в точке x=2 диаграмма имеет скачок, равный 1/N=1/10. В данном примере в выборке присутствуют два значения x=3 и два значения x=5 (λ=2), следовательно, в точках x=3 и x=5 на диаграмме происходит скачок, равный λ/N=2/10. В остальных точках выборки диаграмма имеет скачок, равный 1/N=1/10. Для величин x>xmax=9 значение диаграммы накопленных частот равно 1 ∧ F N (x) 1 9/10 142 8/10 7/10 6/10 5/10 4/10 3/10 2/10 1/10 x 1 2 3 4 5 6 7 8 9 Рисунок 1.1 – Построение диаграммы накопленных частот 3 Построение гистограммы выборки K = 1 + 3,2lg10 = 1+3,2 = 4,2 ≈ 5, ∆x = (9 – 2) / 5 = 7/5 = 1,4, (xmax+xmin)/2 = (9+2)/2 = 5,5 – центр распределения выборки, для данного примера при выбранном числе интервалов – это середина третьего интервала. Следовательно, слева и справа от этого значения необходимо отложить по 2,5 интервала или 2,5∆x. 5,5 x 2 3,4 4,8 ∆x 6,2 7,6 9 Рисунок 1.2 – Разбиение оси Ox на интервалы (кванты) В первый интервал попало три значения zl N1=3, во второй – одно значение zl N2=1, в третий – три значения zl N3=3, в четвертый – одно значение zl N4=1, в пятый – два значения zl N5=2. N=10, N1/N=3/10=0,3; N2/N=1/10=0,1; N3/N=3/10=0,3; N4/N=1/10=0,1; N5/N=2/10=0,2. По результатам предыдущих этапов строим гистограмму для данного примера. ∧ f N (x) 0,3 0,2 0,1 2 3,4 4,8 6,2 7,6 9 x Рисунок 1.3 – Построение гистограммы выборки 143 4. Определение оценок математического ожидания, 10 x = (1 10)∑ xi = (2 + 3 + 3 + 4 + 5 + 5 + 6 + 7 + 8 + 9) / 10 = 52 / 10 = 5,2 i =1 дисперсии 10 s x2 = [∑ ( xi − 5,2) 2 ] (10 − 1) = [(2 − 5,2) 2 + (3 − 5,2) 2 + (3 − 5,2) 2 + (4 − 5,2) 2 + (5 − 5,2) 2 + i =1 + (5 − 5,2) 2 + (6 − 5,2) 2 + (7 − 5,2) 2 + (8 − 5,2) 2 + (9 − 5,2) 2 ] / 9 = = (1,79 + 4,84 + 4,84 + 1,44 + 0,04 + 0,04 + 0,64 + 3,24 + 7,84 + 14,44) / 9 = 39,15 / 9 = 4,35 среднего квадратического отклонения : s x = + s x2 = 4,35 = 2,09 Пример 1.2 Две установки должны напылять резисторы с одинаковыми сопротивлениями. При замере получены следующие данные (в Омах): Установка 1 (Х1): 1095, 1025, 938, 915, 1012, 980, 975, 990, 1000, 974; Установка 2 (Х2): 942, 938, 1010, 1030, 973, 915, 990, 970,925, 1045, 1100, 1020, 985, 1082, 1065, 1090. Определить, одинаково ли налажены установки. Решение. По формулам (1.22) и (1.23) определяем: _ 2 2 x 1=987,7 Ом; s1 =2587,12 Ом при ν 1 = n1 − 1 = 9 , _ 2 2 x 2=1005,0 Ом; s2 =3605,73 Ом при ν 2 = n2 − 1 = 15 . Затем по формулам (2.4) и (2.5) находим S =(9·2587,12+15·3605,73)/(9+15)=3223,75 t = 987,7 − 1005,0 3223,75 = 0,3049 По таблице A1 приложения А находим tкр =2,06 ( β =0,05; ν = n1 + n2 − 2 = 24 ) Так как tкр>t, то гипотеза о равенстве выборочных средних принимается, следовательно обе установки налажены одинаково. Пример 1.3 Установка для напыления должна быть настроена на величину сопротивления напыляемых резисторов M(х)=15кОм. При замере получились следующие значения: 13,2; 14,7; 12,9; 15,3; 13,8; 14,1; 12,8; 16,8; 13,5; 14,2; 16,2; 14,1; 13,9; 14,3; 15,1кОм. Определить правильность настройки. Решение Определим среднее значение и стандартное отклонение полученной выборки по формулам (1.22) и (1.23) 2 _ 2 2 x =13,5 кОм, s =1,8973 кОм при ν = n1 − 1 = 15 _ Так как величину x надо сравнить с постоянным 144 числом, то размах Стьюдента подсчитывается по формуле − t = ( x − M ( x) s2 ) n, t = ( 13,5 − 15,0 1,8973 ) 16 = 4,3559 (1.29) По таблице А1 приложения А при β=0,05, ν=15 находим tкр=2,13. Так как tкр<t, то гипотеза о равенстве выборочного среднего значения сопротивления напыляемых резисторов заданным 15 кОм отвергается, следовательно установка для напыления настроена неправильно. Пример 1.4 Определить границы существования истинного значения математического ожидания по условию примера 1.2 при доверительной вероятности P=0,95. Решение Для коэффициента риска β=1 –p=0,05 и степени свободы ν=15 величина к ритерия Стьюдента по таблице А1 приложения А tкр=2,13. Из формулы (1.29) и используя условие принятия критерия о равенстве двух средних: tкр>t, можно составить следующее неравенство tкр > ( x − M ( x) n ) s2 , Следовательно x − M ( x) < t кр ( s 2 n ), или x − t кр ( s 2 n ) < M ( x) < x + t кр ( s 2 Подставляя числовые значения, получаем 12,766 кОм < M(x) < 14,234 кОм n ). Пример 1.5 При измерении толщины слоя окисла после диффузии в большой партии пластин получилась следующая выборка: 30, 29, 28, 31, 34, 30, 28, 29, 29, 28, 30, 28, 31, 30, 29, 30, 28, 31, 30, 28, 28 мкм. Определить наличие грубых ошибок. Решение Грубой ошибкой измерения может быть только крайнее значение выборки, то есть в данном случае это 28 или 34 мкм. Так как значение 34 мкм встречается всего один раз, то сначала необходимо проверить его. Задача сводится к сравнению двух средних выборок, одна из которых состоит из единственного подозреваемого значения, а вторая – из всех остальных. То есть надо сравнить выборку без подозреваемого значения с постоянным числом (этим подозреваемым значением). _ x =29,25; s2=1,2204 при n=20. По формуле (2.5) для M(x)=34 получаем 145 t = 29,25 − 34,0 1,2204 = 4,29 По таблице А1 приложения А при β=0,05, ν= n–1=19 находим tкр=2,14. Так как tкр<t, то гипотеза о равенстве сравниваемых значений отвергается, следовательно подозреваемое значение является грубой ошибкой и должно быть исключено из дальнейшей статистической обработки. Пример 1.6 Определить, одинакова или различна точность измерений двух выборок в примере 1.2. Решение Согласно формуле (1.27) вычисляем критерий Фишера. Поскольку в числитель всегда ставится большее число, тогда в данном случае F = s22 s12 = 3605,73 2587,12 = 1,3937 По таблице А2 приложения А при β = 0,05, νчисл = 15, νзнам = 9 находим Fкр=2,71. Так как Fкр>F, то гипотеза о равноточности измерений в обеих сериях опытов принимается. Пример 1.7 В результате измерений четырех партий резисторов получены следующие данные Таблица 1.1 – Исходные данные для примера 1.7 Номер Результаты измерений, кОм партии 1 12,1 11,7 11,9 11,9 12,1 11,8 12,3 12,0 11,6 2 14,5 14,7 14,9 15,2 14,6 15,3 15,6 15,1 14,9 3 19,3 20,1 20,7 19,5 19,8 20,3 20,4 19,4 20,5 4 26,1 27,3 27,8 26,5 26,8 27,3 27,1 27,6 26,7 Определить одинакова или различна точность измерений всех партий резисторов. Решение Для каждой партии резисторов найдем средние арифметические значения и эмпирические дисперсии по формулам (1.22) и (1.23). x1 = 11,93кОм; s12 = 0,0475кОм 2 ; x 3 = 20,00кОм; s 32 = 0,2675кОм 2 ; x 2 = 14,98кОм; s 22 = 0,1270кОм 2 ; x 4 = 27,02кОм; s 24 = 0,2970кОм 2 ; По формуле (2.7) вычисляем критерий Кохрена G = max S 2 N ∑ S 2 = 0,2970 (0,0475 + 0,1270 + 0,2675 + 0,2970) = 0,4019 i =1 По таблице А3 приложения А при β=0,05, νчисл=8, νзнам=4 находим Gкр=0,54. Так как Gкр>G, то можно считать, что все измерения во всех опытах сделаны равноточно, причем дисперсия измерений в среднем равна 146 N s 2{xi } = (∑ si2 ) N = 0,1848. i =1 1.4 Задачи для решения В таблице 1.2 приведены значения выборочных измерений 10 партий напыляемых резисторов. 1. По заданной выборке, в которую входят результаты замеров i-той и j-той партий резисторов, исследовать свойства одномерной случайной величины. 2. Оцените расхождение средних значений сопротивлений между двумя партиями резисторов (номера партий приведены в таблице 1.3). 3. Определите правильность настройки на величину 1000 Ом установки для напыления резисторов, при условии что i-тая и j-тая партии напылялись на одной установке (табл. 1.3). 4. Определите границы существования истинного значения математического ожидания для выборки, в которую входят результаты замеров i-той и j-той партий резисторов при доверительной вероятности Р=0,95 (табл. 1.3). 5. Определите наличие грубых ошибок в общей выборке, состоящей из замеров двух партий резисторов (табл. 1.3). 6. Определите, одинакова или различна точность замеров i-той и jтой партий резисторов (табл. 1.3). 7. Определите, одинакова или различна точность замеров четырех партий резисторов (номера партий приведены в таблице 1.3). Таблица 1.2 – Исходные данные для задач Номер партии 1 2 3 4 5 6 7 8 Результаты измерений, Ом 895 1044 1067 1049 1045 998 991 972 962 998 1052 1031 1037 1008 1001 993 992 987 976 1027 1015 1002 1010 987 1109 995 985 982 1033 1013 1012 983 1061 983 988 980 998 1053 1040 1033 147 1045 1013 987 1009 1006 985 1115 1039 1028 1025 1019 1013 1011 1010 1021 1219 1057 1113 1142 1089 1066 1035 1034 1031 1063 1069 1047 1045 997 983 970 1037 929 983 984 994 1009 1007 1013 999 9 10 922 967 847 988 985 981 981 1042 1028 1040 987 1005 1005 985 1017 1026 1137 975 1006 1011 Таблица 1.3 – Номера партий для задач 1 – 7 Номер варианта Номера партий из таблицы 1.2 Задачи № 1– 6 Задача № 7 1 1 2 1 2 3 2 1 3 1 2 3 3 1 4 1 2 3 4 1 5 1 2 3 5 1 6 1 2 3 6 1 7 1 2 3 7 1 8 2 3 4 8 1 9 2 3 4 9 1 10 2 3 4 10 2 3 2 3 4 11 2 4 2 3 4 12 2 5 3 4 5 13 2 6 3 4 5 14 2 7 3 4 5 4 5 6 7 8 9 5 6 7 8 9 1 6 7 1.5 Контрольные вопросы 1. Дать определение случайной величины. 2. Дать определение одномерного интегрального и дифференциального законов распределения случайной величины и назвать их свойства. 3. Дать определение двумерного интегрального и дифференциального законов распределения случайных величин и назвать их свойства. 4. Какие числовые параметры наиболее часто используются в качестве мер расположения и рассеяния одномерной и двумерной совокупности случайных величин? 5. Каким образом производится построение вариационного ряда, диаграммы накопленных частот, гистограммы выборки одномерной случайной величины? 6. Каким образом производится построение поля рассеяния и составление таблицы распределения двумерной совокупности случайных величин? 7. Что такое статистическая гипотеза и на основании чего ее можно принять или отвергнуть? 8. В каких случаях применяется критерий Кохрена и как с его помощью можно оценить однородность дисперсий? 9. В каких случаях однородность дисперсий проверяется по критерию Кохрена, а в каких по критерию Бартлета? 10. Как с помощью критерия Фишера можно выяснить, относятся ли 148 дисперсии случайных величин к одной генеральной совокупности или к разным? 11. Как проверяется гипотеза о равенстве двух выборочных средних значений случайной величины? 12. Что означает понятие «число степеней свободы»? 13. С помощью какого критерия оценивают соответствие экспериментального распределения случайной величины предполагаемому теоретическому закону распределения? 14. Как проверяется принадлежность случайной величины к рассматриваемой генеральной совокупности случайных величин? 149 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 2 2.1 Метод ранговой корреляции Поскольку даже небольшое уменьшение числа факторов приводит к значительному сокращению опытов, возникает вопрос об использовании априорной информации для предварительного отсеивания несущественных факторов. Метод ранговой корреляции позволяет в ряде случаев сравнительно просто отбросить несущественные технологические факторы, основываясь на опросе мнения специалистов, работающих в данной области. Поэтому с этого метода следует начинать эксперимент, особенно для начинающего исследователя, априорные сведения которого об исследуемом процессе, как правило, малы. Процедура определения степени влияния технологических факторов на выходной параметр этим методом сводится к следующим этапам. I. Составление перечня факторов, оказывающих влияние на функцию отклика. После того, как экспериментатор проанализировал литературные источники об исследуемом процессе, он составляет перечень факторов, которые по сведениям этих источников могут оказывать влияние на интересующий исследователя выходной параметр процесса. II. Ранжирование и расширение списка факторов. Возможно более широкому кругу специалистов (представителям различных школ) предлагается расположить составленный перечень факторов в порядке убывания степени их влияния на выбранный выходной параметр исследуемого процесса. При этом представленный список факторов каждым из опрашиваемых может быть дополнен, если по его мнению он является неполным. III. Составление матрицы рангов Результаты опроса представляют в виде таблицы — матрицы рангов (табл. 2.1), где для каждого фактора указывается место (значение aij), занимаемое им в анкете специалиста, номер которого или фамилия указывается в первом столбце матрицы. Первое место (ему присваивается ранг aij=1) соответствует наиболее существенному фактору, т.е. фактору Xi, оказывающему наиболее существенное влияние па интересующую исследователя функцию отклика Y, т. е. выходной параметр исследуемого процесса. По мере уменьшения влияния фактора величина ранга aij возрастает. Иногда матрица рангов строится с учетом квалификации опрашиваемого; в этом случае 150 показания специалистов умножаются на коэффициент, присваиваемый в соответствии с его квалификацией, а значение aij соответствует результату этого перемножения. При выборе коэффициентов следует также ранжировать опрашиваемых специалистов, исходя из их опыта и всеобщего признания, ставя на первое место (присваивая им коэффициент aij равный 1) специалистов, чье мнение вызывает наибольшее доверие. Часто то или иное место в ранге специалистов может отдаваться нескольким экспертам. Тогда им присваивается один и тот же коэффициент. Чем меньше сумма рангов рассматриваемого фактора Xi, тем более высокое место он занимает в ранжировке, и, следовательно, большее влияние должен оказывать на выходной параметр. Таблица 2.1 – Матрица рангов a1k a2kj ai2 ai3 aij aik an1 an2 an3 anj ank – – – – – – – – – – – – – – – i-й ai1 n-й … … … … … … Сумма рангов данного фактора … a12 a22 Xk … a11 a21 1-й 2-й … X3 … X2 … a13 a23 …Xj … a1j a2j X1 … Специалист Факторы n ∑ aij i =1 Cреднее арифметическое значение суммы n рангов ∑ aij i =1 n Абсолютное значение отклонения суммы рангов от их среднего арифметического n значения ∑a i =1 n ij n − ∑ aij i =1 IV. Расчет коэффициента конкордации Для проверки согласованности мнений опрошенных специалистов вычисляют коэффициент конкордации: W= 12 H , n k3 − k 3 ( (2.1) ) 151 2 где n ∑ aij k n i =1 H =∑ − ∑ aij . n j =1 i =1 Для подсчета коэффициента конкордации используют три последние строки матрицы рангов (табл. 2.1), т. е. сумма квадратов отклонения суммы рангов рассматриваемых факторов от среднего значения суммы рангов всех факторов. Коэффициент конкордации с помощью статистических методов позволяет определить, случайна или не случайна согласованность мнений специалистов: чем выше коэффициент конкордации, тем выше степень согласованности мнений специалистов. Коэффициент может принимать значения 0<W<1. Так, W=0 означает полное отсутствие согласованности между ранжировками специалистов, а W=1 показывает, что специалисты одинаково расположили факторы. По полученной матрице рангов (рассчитанные значения суммы рангов занесены в третью снизу строку матрицы) строят диаграмму рангов. Если распределение на диаграмме рангов (рис. 2.1, а) равномерно, а изменение суммы рангов незначительно, то это значит, что хотя специалисты и отводят неодинаковые места технологическим факторам в матрице рангов, но делают они это неуверенно. В этом случае целесообразно все факторы включить в эксперимент. Наиболее благоприятен случай быстрого экспоненциального уменьшения степени влияния факторов (рис. 2.1, б). При этом появляется возможность отбросить ряд факторов на основе проведенного опроса. В результате проведенной ранговой корреляции перед экспериментатором встает вопрос: какие факторы нужно учитывать при последующих исследованиях, а какие отбросить. Например, из анализа диаграммы рангов (рис. 2.1, б) следует, что фактор Х2 следует учитывать при проведении эксперимента, ибо он по мнению всех опрошенных специалистов оказывает влияние иа интересующий исследователя выходной параметр (функцию отклика Y исследуемого процесса) и, при этом, его влияние, по мнению большинства опрошенных специалистов, может быть существенным. В то же время, влияние фактора Х1 по мнению ряда специалистов хотя и носит систематический характер, но является сравнительно несущественным. 152 Рисунок 2.1 – Диаграммы рангов: а) равномерное распределение; б) экспоненциальное Другие же специалисты считают, что влияние этого фактора на выходной параметр носит не закономерный, а случайный характер и они предлагают его вообще не учитывать в эксперименте. При таком мнении специалистов у экспериментатора могут возникнуть сомнения: следует ли этот фактор учитывать в эксперименте при дальнейшей разработке модели, адекватно описывающей исследуемый процесс, или отбросить его, как несущественный фактор. Ответ на этот вопрос может дать эксперимент и последующий дисперсионный анализ его результатов. 2.2 Решение типового примера Технологическая операция –термическое окисление кремния (рис. 2.2). В планарной технологии метод термического окисления кремния яиляется основным при получении маскирующих пленок в процессах фотолитографии, легирования и травления кремния и пленок подзатворного оксида для МОП-структур. Рисунок 2.2 – Схема процесса окисления пластины кремния В общем случае технологическая операция термического окисления кремния, как и любой другой технологический процесс, может быть представлена в виде «черного ящика» (рис. 2.3) с четырьмя группами параметров. 153 Рисунок 2.3 – Представление процесса в виде «черного ящика» Входные контролируемые и управляемыепараметры: {xi }kI В операции термического окисления к этой группе факторов относятся: – температура подложки (tподл,°С); – давление парогазовой смеси в реакторе (Р, МПа); – концентрация водяного пара в объеме реактора (С, м-3); – температура воды в барботере ( tH O , °С); –скорость подачи парогазовой смеси в реактор (м/с); – скорость нагрева и охлаждения печи вместе с пластинами (м/с). Непосредственно в производстве задаются пределами изменения каждого фактора: tmin i ≤ xi ≤ tmax i Например: 850°С ≤ tподл≤1300°С, 1 о МПа≤P≤50 МПа, 60 С≤ tH O ≤95°С. Входные контролируемые, но неуправляемые факторы: {ωi }Ip В термическом окислении к ним относятся: степень чистоты подложки, уровень легирования подложки, степень чистоты реактивов и другие факторы, управление которыми ведется на предыдущих операциях ТП. Эти факторы вносят систематическую погрешность в точность ТП, но если их влияние не деформирует закон распределения параметров качества ТП, то нет необходимости в их контроле и анализе. Входные неконтролируемые и неуправляемые факторы: {zi }mI .К этой группе относятся случайные и, следовательно, неконтролируемые параметры исходных материалов и оборудования. Количество этих факторов велико, они неуправляемы и создают «шум» на входе ТП. Выходные параметры { yi }nI несут информацию о качестве ТО и удовлетворяют установленным допускам: yi min ≤ yi ≤ yi max . Операция термического окисления характеризуется следующими параметрами качества: точностью толщины слоя оксида; однородностью слоя; беспористостью слоя; чистотой слоя; плоскостностью пластины кремния и др. Все эти параметры относятся к физическим параметрам 2 2 154 качества оксидного слоя. При анализе ТП важно определить зависимость выходных параметров качества от входных контролируемых и управляемых факторов. В операции термического окисления каждый выходной параметр зависит от суммарного действия всех входных факторов. В качестве выходного параметра данного ТП выбирается пробивное напряжение слоя окисла y=f(x1, x2, ..., xk). Обозначим наиболее существенные факторы следующим образом: х1—температура подложки; х2 — давление парогазовой смеси в реакторе; х3 — концентрация водяного пара в объеме реактора; х4 — температура воды в барботере; х5 — скорость потока парогазовой смеси; х6 — скорость нагрева печи. Построим матрицу рангов в виде таблицы 2.2. Рассчитаем коэффициент конкордации 2 n a k ∑ ij n i =1 H =∑ − ∑ aij = 7216,2 n j =1 i =1 12 H 12 ⋅ 7216,2 W= 3 3 = 3 3 = 0,412 n k − k 10 ⋅ (6 − 6) ( ) Значение коэффициента конкордации W>0,4 говорит о достаточной степени согласованности мнений специалистов. Построим диаграмму рангов (рис.2.4). Таблица 2.2 – Матрица рангов Специалист 1 2 3 4 5 6 7 8 9 10 х1 3 3 3 1 2 1 2 2 2 1 155 х2 2 1 1 2 1 2 3 3 3 2 Факторы х3 х4 1 4 2 4 2 4 3 4 3 4 3 4 1 5 1 5 1 4 3 4 х5 6 6 6 6 6 6 6 6 6 6 х6 5 5 5 5 5 5 4 4 5 5 Сумма рангов данного фактора Cреднее арифметическое значение суммы рангов Абсолютное значение отклонения суммы рангов от их среднего арифметического значения 21 20 20 42 60 48 18,9 18 18 37,8 54 43,2 357,2 324 324 1428,8 2916 1866,2 Рисунок 2.4 – Диаграмма рангов Построенная диаграмма показывает три фактора, которые обладают наибольшим влиянием на выходной параметр качества: Х1, X2 и Х3. 2.3 Задачи для решения (интерактивная форма– метод «мозгового штурма») С помощью метода ранговой корреляции установить значимость входных факторов технологического процесса самостоятельно выбранном, в соответствии с темой магистерской диссертации или в соответствии с вариантом: 1 – Механическая обработка печатной платы; 2 – формирование токопроводящих элементов печатных плат; 3 – формирование рисунка печатных плат; 4 – травление меди с пробельных мест; 5 – нанесение припойной пасты на плату; 6 – установка компонентов на плату; 7 – оплавление припойной пасты. 1. Каждый студент группы выступает в роли эксперта и, не советуясь с другими, должен оценить каждый фактор в баллах, от 1 до 10 или расширить список факторов (1- максимальная значимость). 2. Составьте сводную матрицу рангов, занося в нее соответствующие ранговые показатели, полученные от всех 3.Оцените степень согласованности экспертов по каждой идее. 156 4. Постройте диаграмму рангов 5. Сделайте вывод по проведенной работе: какой фактор имеет наивысшую значимость; какова при этом согласованность мнений экспертов; по какому фактору получена наибольшая согласованность мнений экспертов; по какому из факторов больше всего расходятся мнения; какие из рассмотренных факторов можно порекомендовать для проведения эксперимента. 2.4 Контрольные вопросы 1. В чем принципиальное отличие метода ранговой корреляции от других методов исследования? 2. В каких случаях метод ранговой корреляции не дает желаемого эффекта? 3. Какова общая стратегия исследования при определении факторов, влияющих на процесс. 4. Для чего служат коэффициент конкордации? 5. Что характеризует матрица рангов? 6. Как по диаграмме рангов определить факторы, оказывающие существенное влияние на исследуемый процесс? 157 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 3 3.1 Однофакторный дисперсионный анализ Во многих областях практической деятельности встречаются объекты исследования, состояние которых определяется входными переменными (факторами), не имеющими количественного описания. Такими факторами могут быть неуправляемые и управляемые переменные, которые по каким-либо причинам не позволяют производить их измерение в данном эксперименте, а также те неконтролируемые переменные, уровни варьирования которых можно произвольно выбирать и фиксировать во времени. Для изучения влияния факторов подобного рода на выходную функцию объекта (отклик), их общего оценивания, ранжирования и выделения среди них существенных, очевидно, непригодны все методы отсеивания управляемых количественных факторов и метод регрессионного анализа неуправляемых факторов, поскольку эти методы предусматривают измерение уровней исследуемых факторов. Рассмотрим теперь постановку задачи в общем виде. Дано: – отклик Y может зависеть (по физическим причинам) от k независимых управляемых факторов X1, X2,…Xk, не имеющих количественного описания, и их парных взаимодействий; – каждый фактор Xi может варьироваться на m уровнях; – полный факторный эксперимент состоит из N серий независимых наблюдений по числу всех возможных неповторяющихся сочетаний k факторов: – каждая j-ая серия содержит nj наблюдений Yj1, Yj2, … Y jn параллельных опытов. Требуется: определить, в какой мере существенно на фоне случайных погрешностей влияние того или иного фактора Xi или взаимодействия факторов на отклик Y; провести сравнение с другими факторами и выделить наиболее существенные. Допущения, на которых базируется дисперсионный анализ: – наблюдение отклика Y – нормально распределенная случайная величина с центром распределения M{Y}. Таким образом, факторы определяют величину Y лишь в среднем, оставляя простор для случайных ошибок наблюдений, подчиняющихся нормальному распределению; – дисперсия единичного наблюдения, обусловленная случайными j 158 ошибками, постоянна во всех опытах и не зависит от X1, X2,…Xk. Из данных задачи и указанных допущений очевидно, что чем больше влияние некоторого фактора Xi на отклик Y, тем больше расхождение между собой средних арифметических отклика Yξ в сериях параллельных наблюдений, сделанных при различных уровнях варьирования фактора Xi . Статистическая значимость такого расхождения указывает на существенное влияние фактора. Требуется одновременно сопоставить произвольно большое число средних и на основании этого сделать вывод о существенности влияния того или иного фактора. Из множества факторов, влияющих на рассеяние выходной величины Y, выбирается один, который, по мнению исследователя, имеет наибольшее влияние на это рассеяние. Остальные факторы служат фоном (ошибкой эксперимента). Чтобы выявить эффект исследуемого фактора, его делят на несколько четко разделимых уровней, а остальные факторы рандомизируют. Число экспериментов при этом может быть случайным или определенным по специальной методике из условия минимальной различимости эффектов. Продолжительность экспериментальных исследований должна быть достаточной для того, чтобы учесть все факторы, влияющие на рассеяние выходной величины. По результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таблица 3.1), причем число наблюдений по разным уровням исследуемого фактора может быть разным. По данным таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемого фактора, то есть дисперсия между выборками S2A , и ошибки эксперимента, то есть 2 дисперсия внутри выборки Sот . Эти формулы представлены в таблице 3.2. Таким образом, сумма квадратов отклонений SSобщ и общее число степеней свободы N-1 делятся на две составляющие. Одна составляющая основана на дисперсии частных средних вокруг общего среднего X, а другая – на дисперсиях внутри выборок. 159 Таблица 3.1 – Результаты наблюдений однофакторного эксперимента Номер наблюде ния 1 1 2 … j … k y11 y12 … y1j … y1k 2 y21 y22 … y2j … y2k … yij … yik … ynj … ynk yn1 yn2 … … … n … … yi2 … … yi1 … i … … Уровни фактора Суммы nj Y j = ∑ yij k Yi1 Yi2 … Yij … Yik Y = ∑ Yij j =1 i =1 Число наблюден ий Средние k n1 n2 … yij = Y j n j yi1 yi 2 Квадраты сумм Yi12 Yi 22 nk N = ∑ nj … yik y =Y N … Yik2 Y2 nj … … yij … Yij2 j =1 Таблица 3.2 – Схема определения дисперсий Источник дисперсии Сумма квадратов Внутри выборок n SSот = ∑ ∑ ( yij − yi ) 2 i =1 j =1 Между выборкам и Общая k k SS A = n∑ ( yi − y ) 2 i =1 SSобщ = ∑(y i =1,..., k j =1,..., n ij − y )2 Число степеней свободы ν1 = N − k ν1=k-1 ν 2 = N −1 Дисперсия k n 2 Sот = ∑ ∑ ( yij − yi ) 2 ( N − k ) i =1 j =1 k S = n∑ ( yi − y ) 2 (k − 1) i =1 2 A S 2 общ = [∑ ( y ij ] − y ) 2 ( N − 1) Если на выборочные наблюдения не оказывают влияния определенные факторы, то обе оценки дисперсий не отличаются друг от друга. Это можно проверить с помощью F-критерия (критерия 160 Фишера), а именно 2 . (3.1) F= S A2 / Sот По таблице F-распределения (таблица А2 приложения А) находим значение Fкр для выбранного уровня значимостиβ и числа степ еней свободы ν1=k–1 и ν2=N–k. Если Fрасч<Fкр, то делается вывод о том, что результаты эксперимента не противоречат гипотезе об отсутствии эффекта уровней исследуемого фактора. Если Fрасч≥Fкр, то следует сделать вывод о том, что исследуемый фактор вносит существенный эффект в разброс выходной величины Y. Дисперсионный анализ более эффективно применять при значительном объеме выборки, так как в этом случае удается выделить даже слабый сигнал (влияние фактора) на фоне шума (ошибка эксперимента). Дисперсионный анализ можно использовать и при оценке нескольких факторов (как правило, не более трех) – двух- и трехфакторный дисперсионные анализы. В этом случае удается оценить влияние или его отсутствие не только самих факторов, но и их взаимодействий. 3.2 Решение типового примера Предположим, что результаты эксперимента, который проводился в соответствии с матрицей ПФЭ типа 22 при n=3 параллельных опытах для каждого условия их проведения, представлены на рис.3.1. X2 Y3=21, 19, 17 Y4=25, 27, 24 X1 0 Y1=42, 48, 44 Y2=51, 53, 49 Рисунок 3.1 - Результаты трех параллельных опытов, проведенных в соответствии с ПФЭ для двух факторов X1 и X2 Из анализа результатов эксперимента, приведенного на рисунке 6.1, видно, что при изменении значения фактора X2 от его нижнего уровня до верхнего, значения функции отклика во всех трех параллельных опытах уменьшились примерно в два раза. Поэтому влияние этого фактора экспериментально подтвердилось и не вызывает 161 никакого сомнения. С другой стороны, варьирование фактора X1 приводит также (рисунок 6.1) к изменению значения функции отклика, хотя не с такой разительной разницей, как при изменении значений фактора X2. Объективно ответить на вопрос о случайном или закономерном характере изменений функции отклика сможет дисперсионный анализ приведенных результатов эксперимента. Для этого нужно подсчитать дисперсии внутри и между выборками, представляющими собой экспериментальные значения Yξ при фиксированном значении фактора X2 и различных значениях X1, и оценить эти дисперсии с помощью критерия Фишера. При этом дисперсия внутри выборки характеризует случайные изменения процесса, а дисперсия между выборками – систематические его изменения. Рассмотрим значения функции отклика Yξ, соответствующие верхнему уровню фактора X2 , то есть при X2б=+1 и различным уровням варьирования X1, то есть X1=+1 и X2= –1, которые приведены в таблице 3.3. Таблица 3.3 – Экспериментальные значения функции отклика при фиксированном значении X2 в трех параллельных опытах при различных значениях фактора X1 Номер параллельного опыта 1 2 3 Значение функции отклика при заданных условиях проведения эксперимента X2=+1 X1=+1 X1= –1 25 21 27 19 24 17 n ∑ Yξ i =1 i 76 57 25,33 19 n Yξ = (∑ Yξi ) / n i =1 Подсчитаем главное экспериментальное среднее значение функции отклика, для этого воспользуемся либо значениями функции отклика, соответствующими каждому параллельному опыту, либо их средними значениями, соответствующими одному из условий проведения эксперимента и приведенными в последней строке таблицы 3.3. 162 Тогда n Y = (∑ Yξi ) /( Nn) = (25 + 27 + 24 + 21 + 19 + 17) /(3 ⋅ 2) = 22,17. i =1 Зная главное среднее, можно подсчитать оценку дисперсии между выборками: N S = n∑ (Y − Yξ ) 2 ( N − 1) = {3 ⋅ [(22,17 − 25,33) 2 + (22,17 − 19) 2 ]} /(2 − 1) = 59,97. ξ =1 2 A Дисперсия внутри выборки, характеризующая случайную изменчивость исследуемого процесса, для приведенных в таблице 3.3 значений функции отклика, будет равна 3 3 2 S = ∑∑ (Yξi − Yξ ) [ N ⋅ (n − 1)] = ∑ (Y1i − Y1 ) + ∑ (Y2i − Y2 ) 2 4 = 12,67 / 4 = 3,17 i =1 ξ =1 i =1 i =1 2 2 Из сравнения значений SA и Sот видно, что S2A > Sот2 , причем эта N n 2 от 2 разница значительна. Проверим достоверность этого отличия с помощью критерия Фишера. Экспериментальное значение F-параметра будет равно F= S2A / Sот2 =59,97/3,17=18,92. В соответствии с таблицей А2 приложения А для β=0,01 и ν1=1, ν2=4 критическое значение равно Fкр=21,20. Сравнивая экспериментальное и критическое значения F-параметра, приходим к выводу, что F<Fкр, то есть существенное отличие S2A и Sот2 не является закономерным, следовательно, можно утверждать, что фактор X1 не влияет на параметр отклика Y и в дальнейшем можно не учитывать его при построении модели. Этот вывод будет верным в 99 случаях из 100, так как β=0,01. Для большей достоверности нашего вывода, когда мы можем ошибиться только в одном случае из ста, фактор X1 следует отбросить при дальнейшем проведении эксперимента. 3.3 Задачи для решения 1. Оценить значимость влияния и дать интерпретацию результатов эксперимента с конкретными рекомендациями. В таблице даны результаты опытов при исследовании влияния группы материала одной и той же партии на выходную переменную Выходная величина Y 1 Группа материалов 2 3 19 20,5 1 17,5 163 4 20 2 3 4 5 6 7 8 9 17,3 20 20 20 19 20,5 19 20,5 17,5 20,25 18 19,5 19 20,5 19,5 20,25 19,5 19,25 19,5 20 19,5 20,5 19,5 19,7 19,5 20,5 19,3 20 19 19,5 19,3 20,2 2. Провести дисперсионный анализ результатов технологического эксперимента, план которого полностью рандомизирован. Проверить нуль-гипотезу о том, что фактор А не влияет на результаты измерения Уровни измерения 1 2 3 4 5 1 8 6 7 5 8 2 4 -2 0 -2 3 Уровни фактора А 3 1 2 0 -1 -3 4 4 6 5 5 4 5 10 8 7 4 9 3. Выходной параметр – время нагревания микропаяльника, с. Уровни единственного фактора А – три разных типа микропаяльников. Эксперимент полностью рандомизирован. Провести дисперсионный анализ и проверить гипотезу о том, что среднее время нагревания одинаково для всех типов микропаяльников. Время нагревания микропаяльника ,с 1 2 3 4 Тип микропаяльника А2 А1 19 23 26 18 20 20 18 35 20 20 32 27 40 24 22 18 А3 16 15 18 26 19 17 19 18 4. Выходной параметр – срок службы миниатюрного индикаторного прибора, ч. Уровни единственного фактора А – партии приборов, изготовленные по четырем разным технологиям. Отбор приборов для испытания полностью рандомизирован. 164 Проверить нуль-гипотезу о том, что варианты технологического процесса не влияют на срок службы индикаторных приборов. Номер повторяемости опыта 1 2 3 4 5 Номер варианта технологического процесса А1 А2 А3 А4 1600 1610 1650 1680 1700 1580 1640 1640 1700 1750 1460 1550 1600 1620 1640 1510 1520 1530 1570 1600 Переходить к кодированным данным с помощью преобразования Yкод=(Y-1600)/10/ 4. Сравнить по выходному параметру продукцию, получаемую из трех разных по конструкции единиц технологического оборудования и установить, отличаются ли между собой средние выборок. Эксперимент полностью рандомизирован. Вариант технологического оборудования Номер повторяемости опыта А1 А2 А3 1 6 5 7 2 7 6 8 3 6 4 5 4 5 5 8 5. Провести дисперсионный анализ данных полностью рандомизированного эксперимента по условиям: Вариант Номер повторяемости опыта технологического 1 2 3 4 оборудования А1 210 220 210 200 А2 200 210 190 200 А3 220 230 200 230 6. Для изготовления печатных плат на складе предприятия получены две партии химиката, сертификаты на которые потеряны. Выяснить, являются ли эти партии химиката пригодными для использования в технологическом процессе, если на складе находится еще одна партия того же химиката, принятая по сертификату входным 165 контролем. Данные замеров поверхностного сопротивления контрольных экземпляров серий печатных плат, отбор которых был полностью рандомизирован, в кодированном виде представлены в таблице. Номер партии химиката Поверхностное сопротивление (кодированное) А1 8 -17 -28 -7 А2 24 11 22 16 32 12 25 14 А3 10 -27 -18 9 26 15 -13 34 38 -32 -19 30 7. В бригаде радиорегулировщиков, состоящей из четырех человек, одному (первому) доверено личное клеймо контроля качества. Можно ли доверять личное клеймо бригаде в целом? Данные контрольных замеров аппаратов, отобранных с рабочих мест радиорегулировщиков в полностью рандомизированном порядке, приведены в таблице. Номер регулировщика Значения выходного параметра – чувствительности диапазона волн радиоприемника А1 24.5 31.2 34.1 32.3 33.7 27.6 25.8 31.2 А2 38.6 28.9 35.1 30.6 А3 34.1 30.2 31.7 28.5 31.9 27.3 34.3 28.3 25.4 29.6 32.6 29.4 А4 34.6 30.5 29.7 32.3 32.7 31.2 29.9 30.1 8. Для пропитки высокочастотных катушек индуктивности радиоприемника получен парафин, марка которого не соответствует записанной в технической документации. Задача технолога – решить, можно ли партию парафина (партия №1) запустить в производство без ущерба для качества изделий. Для проведения контрольных замеров партия №1 парафина была запущена параллельно текущему производству, где использовались еще две партии. Эксперимент полностью рандомизирован. Номер партии парафина А1 А2 166 А3 Добротность катушек 142 147 158 149 161 141 155 157 163 152 151 163 158 149 148 162 160 149 159 161 152 150 148 150 3.4 Контрольные вопросы 1. Какого типа практические задачи обычно решают методом дисперсионного анализа? 2. Как математически формулируется задача однофакторного дисперсионного анализа? 3. В чем заключается основная идея метода дисперсионного анализа? 4. Каким образом производится оценивание существенности влияния фактора в однофакторном дисперсионном анализе? 5. Как производится оценивание влияния двух факторов и их взаимодействий в двухфакторном дисперсионном анализе? 167 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 4 4.1 Двухфакторный дисперсионный анализ Однофакторный дисперсионный анализ, при котором происходит полная рандомизация эксперимента, не всегда является лучшим способом его планирования. Очень часто выделение из общей дисперсии влияния только одного исследуемого фактора оказывается недостаточным, так как ошибка эксперимента может быть очень велика и интересующий эффект может быть не виден на фоне этой ошибки. Уменьшение ошибки эксперимента можно получить при разбиении эксперимента на группы опытов, так называемые блоки («блочное планирование»), соответствующие возможным причинам неоднородностей. В качестве блоков могут быть использованы уровни второго исследуемого фактора, или разные дни проведения экспериментов, или еще какие-либо условия. Такой план эксперимента способствует выявлению эффекта, связанного с изменением уровней обоих исследуемых факторов. Блоки в двухфакторном эксперименте представляют ограничение, наложенное на рандомизацию, которая в этом случае должна проводиться на каждом блоке отдельно. По результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таблица 4.1), причем в этом случае число наблюдений в каждом столбце должно быть одинаково. По данным этой таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемых факторов S2A и S2B , а также ошибки эксперимента Sот2 (таблица 4.2). Для проверки гипотезы об отсутствии эффектов влияния по обоим исследуемым факторам вычисляются дисперсионные отношения: (4.1) Fрасч А= S2A / Sот2 ; Fрасч В= S2B / Sот2 и сравниваются с табличными значениями обычным порядком. Двухфакторный дисперсионный анализ является самым удобным из простых планов и поэтому наиболее часто применяется на практике. 168 Таблица 4.1 – Результаты наблюдений двухфакторного эксперимента Уровни 1-го фактора Уровни 2-го фактора (блоки) Y j = ∑ yij y12 y22 … … y1j y2j … … y1k y2k … yij … Y22 Yi 2 … yi … Yi … yik … … y2 … yi2 Y12 … yi1 y1 … i Y1 Y2 … y11 y21 Yi 2 … k yi = Y j k … … i =1 … j … … … 2 … 1 … 1 2 k n yn1 yn2 … ynj … ynk Yn yn Yn2 Yij = ∑ yij Yi1 Yi2 … Yij … Yik Y – – yij = Yij n yi1 yi 2 … yij … yik – y – Yij2 Yi12 Yi 22 … Yij2 … Yik2 – – Y2 n i =1 Таблица 4.2 – Формулы для расчета оценок дисперсий Источник рассеяния Между уровнями 1-го фактора Между уровнями 2-го фактора (между блоками) Число степене й свободы Сумма квадратов k k-1 SS A = ∑ (Y j2 n) − (Y 2 nk ) n-1 SS B = ∑ (Yi 2 n) − (Y 2 nk ) j =1 n i =1 n Ошибка эксперимента Общая сумма Дисперсия (k-1)·(n1) S B2 = SS B (n − 1) k SS от = ∑∑ Yij2 − i =1 j =1 k n j =1 i =1 Sот2 = SSот [(n − 1)(k − 1)] ∑ (Y j2 n) − ∑ (Yi 2 k ) +(Y 2 nk ) n nk-1 S A2 = SS A (k − 1) k SSобщ = ∑∑ Yij2 − (Y 2 nk ) i =1 j =1 4.2 Трехфакторный дисперсионный анализ 169 2 Sобщ = SSобщ (nk − 1) (латинский квадрат) Дальнейшее уменьшение ошибки эксперимента можно получить введением еще одного исследуемого фактора, который выделит из общей дисперсии свою часть. При этом налагается еще одно ограничение на рандомизацию, что приводит к специальным планам эксперимента, называемым латинскими квадратами. Суть этого плана сводится к тому, что все три исследуемые фактора разбиваются на одинаковое число уровней n (как правило, n≥4), при этом уровни 1-го фактора располагаются по столбцам плана, уровни 2-го – по строкам, а уровни 3-го, обозначенные в виде латинских букв, – в поле плана, причем их комбинация должна быть такой, чтобы каждая буква встречалась в каждом столбце и в каждой строке только один раз (таблица 4.3). Построение плана эксперимента по типу латинского квадрата позволяет осуществить экономный перебор вариантов испытаний. Таблица 4.3 – План эксперимента типа латинский квадрат Уровни 2-го фактора Уровни 1-го фактора 1 2 3 1 a b c 2 b c d 3 c d a 4 d a b 4 d a b c По результатам испытаний вычисляется оценка дисперсий (таблица 4.4), которые позволяют построить дисперсионные отношения Fрасч А= S2A / Sот2 ; Fрасч В= S2B / Sот2 ; Fрасч С= SC2 / Sот2 (4.2) Сравнение найденных дисперсионных отношений с табличными значениями и выводы о верности или неверности гипотез об отсутствии эффектов соответствующих факторов производятся как в предыдущих случаях. Символические значения в таблице 4.4 означают: суммы наблюдений по 1-му фактору (по строкам) n Yi = ∑ yijl ; i =1 суммы наблюдений по 2-му фактору (по столбцам) 170 n Yl = ∑ yijl ; i =1 суммы наблюдений по 3-му фактору (по буквам) n Y j = ∑ yijl ; i =1 (например, суммируются все наблюдения, соответствующие букве a затем b и т.д.); общая сумма n n n i =1 l =1 j =1 Y = ∑ yi = ∑ yl = ∑ y j . Латинские квадраты применяются предпочтительно для оценки линейных эффектов изучаемых факторов на начальных этапах исследования. Таблица 4.4 – Формулы для расчета оценок дисперсий Число степене Источник й Сумма квадратов Дисперсия рассеяния свобод ы 1 2 3 4 Между n уровнями 1-го [( SS Yi 2 ) n] − (Y 2 n 2 ) = S A2 = SS A (n − 1) n-1 ∑ A фактора (между i =1 строками) Между n уровнями 2-го SS B = [(∑ Yl 2 ) n] − (Y 2 n 2 ) S B2 = SS B (n − 1) n-1 фактора (между l =1 столбцами) Между уровнями 3-го n SS = [( Y j2 ) n] − (Y 2 n 2 ) S C2 = SS C (n − 1) фактора (между n-1 ∑ C j =1 латинскими буквами) Продолжение табл. 4.4 1 2 3 171 4 2 S = SSот [(n − 1)(k − 1) Ошибка от (n-1)·(n-2) SS от = SS общ − SS A − SS B − SSC эксперимента Общая сумма 2 n -1 n k SS общ = ∑∑ Yil2 − (Y 2 n 2 ) i =1 l =1 2 S общ = SS общ (n 2 − 1) 4.3 Решение типового примера Пример Исследовать качество трех конструкций ЭА одного функционального назначения, изготовленных на трех предприятиях, температурные условия эксплуатации изменяются в диапазоне от 20 до 70 °С. Решение. Исследование проведем по наиболее информативной выходной переменной Y в относительных единицах. Так как имеют место качественные факторы (конструкции и предприятиеизготовитель), а общее число факторов равно трем, то при планировании эксперимента используем 3x3 латинский квадрат с числом параллельных опытов m=4. Рандомизированный план и результаты эксперимента представлены в табл. 4.5. Таблица 4.5 План эксперимента Результаты опытов Уровни b1 b3 b2 Уровни b1 b3 b2 фактор факто а ра a2 c3 c2 c1 a2 2, 0, 1, 4 4, 3, 2, 6 8, 6, 10, 9 a1 c2 c1 c3 a1 5, 4, 10, 8 8, 6, 4, 7 11, 9, 10, 12 a3 c1 c3 c2 a3 6, 7, 8, 5 8, 9, 10, 7 9, 1, 2, 8 В строках квадрата (табл. 4.5) a1, a2 и a3представлены предприятия-изготовители, в столбах b1, b2, b3 — конструкции ЭА, элементы латинского квадрата c1, c2, c3 — значения выходной переменной Y в относительных единицах. Результаты обработки наблюдений представлены в табл. 4.6, где даны суммы четырех опытов, итоги по строкам (Ai), по столбцам (Bj) и по латинской букве (Ск). Таблица 4.6 Уровни b1 фактора b3 172 b2 Итоги по строкам a2 a1 a3 Итоги по столбцам Итоги по букве (Ск) c3 7 c2 27 c1 26 c2 15 c1 25 c3 34 c1 33 c3 42 c2 20 B1=60 B3=74 B2=95 Итог G=229 C1=84 C2=62 C3=83 – A2=55 A1=94 A3=80 Рассчитываем суммы квадратов для факторов Sa, Sb, Sc общую сумму квадратов S и остаточную сумму квадратов So, для чего вначале вычисляем суммы квадратов S1, S2, S3, S4, S5 с учетом параллельных опытов n=4: 1 S1 = [7 2 + (15) 2 + (33) 2 + (27) 2 + (25) 2 + (42) 2 + (26) 2 + (34) 2 + (20) 2 ] = 1678,25 , 4 1 S2 = [(55) 2 + (94) 2 + (80) 2 ] = 1521,75 , 4⋅3 1 S3 = [(60) 2 + (74) 2 + (95) 2 ] = 1508,42 , 4⋅3 1 [(84) 2 + (62) 2 + (83) 2 ] = 1482,42 , S4 = 4⋅3 (229) 2 S5 = = 1456,69 , 4 ⋅ 32 S a = S 2 − S5 = 1521,75 − 1456,69 = 65,06 , Sb = S3 − S5 = 1508,42 − 1456,69 = 51,73 , Sc = S 4 − S5 = 1482,42 − 1456,69 = 25,73 , S = S1 − S5 = 1678,25 − 1456,69 = 221,56 , S0 = S − S a − Sb − Sc = 221,56 − 65,06 − 51,73 − 25,73 = 79,04 . Дисперсия внутри ячеек Sв. я. = ∑ ( yijkm − ABC ijk ) 2 = 1801 − 1678,75 = 122,75 Результаты дисперсионного анализа сводим в табл. 4.7. Таблица 4.7 Источник дисперсии Число степеней свободы Сумма квадратов 173 Средний квадрат Критерий Фишера Fрасч Строка (предприятие – изготовитель) Столбец (конструкция) Латинская буква (условия испытаний) Остаток Внутри ячеек Итого n-1=2 Sa=65,06 S a2 = 32,53 7,15 n-1=2 Sb=51,73 Sb2 = 25,86 5,68 n-1=2 Sc=25,73 Sc2 = 12,86 2,82 (n-1)( n-2)=2 n2(m-1)=27 35 S0=79,04 Sв.я.=122,75 344,31 S02 = 39,52 8,68 – – sв.я.=4,55 – Как показал анализ, эффекты по строке и столбцу значимы. Незначим оказался эффект по латинской букве (температура испытаний). Проводим проверку гипотезы о незначимости всех взаимодействий по критерию Фишера: Fрасч = S0 ((n − 1)(n − 2)) 39,52 = = 8,68 Sв. я. (n 2(m − 1)) 4,55 Из табл. А2 для β =0,05 и степеней свободы ν 1=2, ν 2=27 находим критическое значение F-критерия, который оказался равным 3,35. Так как Fрасч>Fкр, то гипотеза о незначимости взаимодействий отвергается, что говорит о смешивании главных эффектов со взаимодействиями. Логический анализ показал, что существенным можно считать взаимодействие факторов ВС, т.е. между конструкцией и условиями испытаний. Очевидно, при проектировании исходили из различных технических заданий, в которые не ставились одинаковые требования по термостабильности. 4.4 Задачи для решения 1. Исследовать точность настройки трех конструкций ЭВА одного функционального назначения, изготовленных на трех предприятиях тремя высококвалифицированными рабочими, имеющими различный стаж работы. Результаты эксперимента помещены в таблицу, где значения a1, a2, a3 – предприятия-изготовители; b1, b2, b3 – конструкции;c1, c2, c3 – 174 квалификация рабочих; число параллельных опытов n=5. При выполнении задания плана эксперимента необходимо рандомизировать и к результатам опытов прибавить номер выполняемого варианта. Уровнь Результаты опытов факторов b1 b2 b3 a1 3, 6, 4, 2, 2 10, 11, 13, 13, 11 3, 3, 5, 7, 3 a2 7, 9, 11, 8, 7 1, 1, 2, 5, 2 1, 3, 3, 6, 3 a3 1, 2, 2, 5, 1 1, 2, 2, 5, 2 3, 6, 5, 2, 6 2. Определить влияние времени откачки и напряжения на нагревателе насоса на давление внутри вакуумной камеры, Па. Выбраны три уровня для времени откачки и два значения напряжения. Для каждой комбинации времени откачки и напряжения проведены испытания. Порядок проведения эксперимента полностью рандомизирован. Результаты эксперимента представлены в таблице: Напряжение на нагревателе Время откачки, мин насоса U, В 60 90 150 127 0,048 0,028 0,007 0,058 0,033 0,015 220 0,062 0,014 0,006 0,054 0,010 0,009 Провести дисперсионный анализ этих данных и проверить влияние времени откачки, напряжения на нагревателе и их взаимодействия на давление. 3. Для любого значимого эффекта предыдущей задачи проверить значимость различия между уровнями значимых факторов. Какую комбинацию времени откачки и напряжения на нагревателе можно рекомендовать, если желательна комбинация, для которой давление минимально? Объяснить сделанный выбор. 4. Определялась сила сцепления клейкого материала при трех фиксированных уровнях влажности и трех фиксированных температурных условиях. Для каждого сочетания условий записано по четыре показания. Эксперимент полностью рандомизирован. Результаты дисперсионного анализа представлены в таблице. Заполнить таблицу до конца. Источник Число Сумма Средний изменчивости степеней квадратов квадрат свободы отклонений Влажность, H 9,07 175 Температура, T Взаимодействие, HT Ошибка, ε 8,66 6,07 52,30 5. Для эксперимента предыдущей задачи установить математическую модель и указать гипотезы, которые нужно проверить. 6. Для данных двух предыдущих задач проверить гипотезы о влиянии факторов и их взаимодействия и дать заключение. 7. Цель эксперимента – определить осевое давление при сверлении печатных плат на различных скоростях с разной подачей материала и для различных материалов. Использовали пять скоростей, три вида подачи материала для двух типов материала и для каждого сочетания условий снимали показания. Порядок проведения эксперимента был полностью рандомизирован, уровни факторов фиксированы. В таблицу данных эксперимента числа занесены после вычитания из каждого показания числа 200. Провести полный дисперсионный анализ этого эксперимента и дать заключение. Тип Подача материа материала, ла мм/об 0,004 100 Скорость, м/мин 200 475 715 870 122 108 108 66 80 110 85 60 50 60 B10 0,008 332 276 248 248 276 330 310 295 275 310 0,014 640 612 543 612 696 500 500 450 610 610 0,004 192 136 122 108 136 170 130 85 75 75 V10 0,008 386 333 318 472 499 365 330 330 350 390 0,014 810 779 810 893 1820 725 670 750 890 890 8. Цель эксперимента – получить данные для конструирования автоматического устройства управления технологическим процессом пайки печатных плат волной. Выбраны три уровня температуры (фактор А) и два уровня скорости конвейера перемещения плат (фактор В). Контролировалось количество «холодных» паек. Порядок проведения эксперимента полностью рандомизирован. 176 Скорость Температура волны (фактор А) перемещени 2200С (А1) 2200С (А2) 2200С (А3) я плат (фактор В) 1,5 м/мин 32 38 29 6 9 7 15 11 22 (В1) 34 26 36 4 11 8 18 21 16 2,5 м/мин 39 41 35 12 9 15 28 31 26 (В2) 34 43 40 13 16 10 30 29 32 9. Ответить на вопрос – какая температура волны и какая скорость перемещения печатной платы по условиям предыдущей задачи обеспечивают меньшее количество «холодных» паек? 4.5 Контрольные вопросы 1. Какого типа практические задачи обычно решают методом дисперсионного анализа? 2. Как математически формулируется задача однофакторного дисперсионного анализа? 3. В чем заключается основная идея метода дисперсионного анализа? 4. Каким образом производится оценивание существенности влияния фактора в однофакторном дисперсионном анализе? 5. Как производится оценивание влияния двух факторов и их взаимодействий в двухфакторном дисперсионном анализе? 177 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 5 5. Методы насыщенных и сверхнасыщенных планов При исследовании сложных процессов исследователю приходится иметь дело с большим количеством факторов, которые способны оказать влияние на функцию отклика исследуемого процесса. Для первоначального построение «грубой модели» процесса желательно оставить только те факторы, которые оказывают сравнительно существенное влияние на функцию отклика, отбросив на первом этапе факторы, оказывающие незначительное влияние. Это можно сделать с помощью насыщенных и сверхнасыщенных планов. 5.1 Метод насыщенных планов Насыщенные планы – планы, для которых число степеней свободы равно N–k=1, (5.1) то есть число вариантов условий проведения эксперимента (число номеров опытов) должно быть на единицу больше число рассматриваемых факторов. Необходимым условием применения насыщенных планов является отсутствие влияния эффекта взаимодействия факторов на функцию отклика исследуемого процесса. Соблюдение этого условия основано на предпосылке, что на выходной параметр исследуемого процесса оказывают влияние лишь линейные эффекты и не влияют взаимодействия факторов. При этом используют дробные реплики ПФЭ, стремясь к тому, чтобы все экспериментальные данные, полученные при N условий проведения эксперимента, были бы использованы для оценки коэффициентов при соответствующих переменных. Если предполагается, что на функцию отклика исследуемого процесса способны оказывать влияние 15 факторов, то для отсеивания несущественных или оказывающих незначительное влияние факторов может быть использован ДФЭ типа 215-11 с числом различных условий эксперимента (минимальным числом опытов) N=16. Условие (5.1) в этом случае выполняется, так как N–k=16-15=1. Число опытов N=16 предусматривает применение ПФЭ типа 24. Полином первого порядка в этом случае имеет следующий вид: Y=b0+b1X1+b2X2+b3X3+b4X4+b12X1X2+b13X1X3+ 178 +b14X1X4+b23X2X3+b24X2X4+b34X3X4+b123X1X2X3+ (5.2) +b124X1X2X4+b134X1X3X4+b234X2X3X4+b1234X1X2X3X4. Из приведенного полинома 1-го порядка (5.2) видно, что имеется 15 коэффициентов (без учета коэффициента b0). Поэтому, заменяя все члены полинома (5.2), учитывающие эффект влияния взаимодействия ранее выбранных четырех из пятнадцати рассматриваемых факторов, на одиннадцать оставшихся, получаем полином 1-го порядка с пятнадцатью факторами: Y=b0+b1X1+b2X2+b3X3+b4X4+b5X5+b6X6+b7X7+b8X8+ +b9X9+b10X10+b11X11+b12X12+b13X13+b14X14+b15X15. (5.3) 4 В (5.3) имеем дело не с ПФЭ типа 2 , а с ДФЭ типа 215-11, на основании которого можно оценить все пятнадцать коэффициентов b1, b2, b3,…, b15. X5=X1X2X3X4; X10=X1X2; X6=X1X2X3; X11=X1X3; X7=X1X3X4; X12=X1X4; X8=X1X2X4; X13=X2X3; X9=X2X3X4; X14=X2X4; X15=X3X4. Проведя соответствующую замену в матрице ПФЭ типа 24 при использовании значений рассматриваемых в эксперименте 15-ти факторов, получим матрицу ДФЭ типа 215-11 (таблица 5.1). После проведения экспериментов производится вычисление коэффициентов по формуле (5.10). X3б X4б X5б X6б X7б X8б X9б X10б X11б X12б X13б X14б X15б + + + + + + + + + + X2б 1 2 3 4 5 6 7 8 9 10 X1б Номер опыта X0б Таблица 5.1 – Матрица насыщенного планирования – + – + – + – + – + – – + + – – + + – – – – – – + + + + – – – – – – – – – – + + + – – + – + + – – + – + + – + – – + – + – + + – – + + – + – – + + + + – + – + – – – + + + + – – + + + – – + + – – + + – + – + – – + – + + – + – + – + – + – – + + + – – – – + + + + + + – – + + – – – – + + + + – – – – – – 179 Yξ Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 11 12 13 14 15 16 + + + + + + – + – + – + + + – – + + – – + + + + + + + + + + + – + – – + + – + – – + – + + – – + + – – + – + – – – – + + – + + – – + + – – + – + – + – + – + – – – – + + + + – – + + – – + + + + Y11 Y12 Y13 Y14 Y15 Y16 Факторы, при которых коэффициенты в результате проведенной оценки по критерию Стьюдента оказались незначимыми, отбрасываются. На первых этапах исследования, когда создается «грубая» модель исследуемого процесса, допускается отсеивание несущественных факторов, исходя из значений полученных коэффициентов. Если рассматривать процесс с числом факторов k=17, то число опытов ПФЭ типа 24 будет недостаточным. Ближайшее минимальное число опытов можно получить с помощью ПФЭ типа 25, которое составляет N=32. Число опытов в данном случае значительно превышает число учитываемых в эксперименте факторов, но облегчается замена эффектов взаимодействия на линейные эффекты. Все линейные эффекты могут быть введены в план вместо эффектов взаимодействия более высокого порядка, чем парные (по сравнению с k=15), а следовательно, менее значимыми с точки зрения их влияния на функцию отклика. Действительно, X6=X1X2X3X4X5; X9=X1X2X4X5; X12=X1X3X4; X15=X2X3X4; X7=X1X2X3X4; X10=X2X3X4X5; X13=X1X4X5; X16=X2X4X5; X8=X1X3X4X5; X11=X1X2X3; X14=X1X3X5; X17=X2X3X5. Однако объем экспериментальной работы в данном случае увеличится не пропорционально увеличению числа рассматриваемых факторов, в отличие от предыдущего случая. При k=9; 17; 33 и т.д. использование дробных реплик от ПФЭ ведет к значительному увеличению числа опытов соответственно N=16; 32; 64 и т.д. Для того, чтобы увеличить насыщенность планов, разработаны ортогональные планы с N=12; 20; 24; 36 и т.д. Однако применение метода насыщенных планов для исследования сложных процессов ограничено, так как эффект влияния взаимодействия факторов на выходной параметр может быть значительным. 180 5.2 Метод сверхнасыщенных планов (метод случайного баланса) Этот метод дает возможность отсеивать как линейные эффекты, так и их взаимодействия. Но применение этого метода предполагает, что число значимых эффектов (оказывающих доминирующее влияние на функцию отклика) значительно меньше общего числа взятых под подозрение. Для выявления существенных факторов используются сверхнасыщенные планы – планы, где число опытов меньше числа исследуемых эффектов, включенных в эксперимент, то есть число степеней свободы меньше единицы. При этом предполагается брать случайные выборки из ПФЭ, таким образом, совместные оценки оказываются смешанными некоторым случайным образом, поэтому другое название метода – метод случайного баланса. Этот метод позволяет решить основную задачу отсеивающих экспериментов – выявить доминирующие факторы среди очень большого их числа, включенных в исследование, как потенциально способных оказывать влияние на выходной параметр. Для построения матрицы планирования все факторы разбиваются на группы. Для получения несовмещенных оценок целесообразнее эту разбивку производить так, чтобы в каждую группу входили факторы, характеризующие определенные моменты исследуемого процесса. При исследовании технологического процесса производства электронных средств, желательно составлять группы факторов в соответствии с последовательностью операций технологического процесса. Для каждой группы строится матрица планирования, соответствующая ДФЭ или ПФЭ. Поэтому лучше составлять группы не более чем из 3 - 5 факторов, так как в этом случае для каждой можно взять ПФЭ, в котором перебираются все возможные комбинации уровней в группе. План эксперимента образуется случайным смешиванием строк групповых планов, которое выполняется с помощью таблицы случайных чисел. Полученный экспериментальный материал обрабатывается в несколько этапов с помощью диаграмм рассеивания результатов наблюдений по отдельным факторам. На первом этапе диаграмма рассеивания строится для каждого фактора (рисунок 5.1). По оси ординат откладываются экспериментальные значения рассматриваемой функции отклика, а по оси абсцисс – учитываемые в эксперименте факторы. 181 Y – + X1 – + X2 – + X3 – + Xn факторы Рисунок 5.1 - Диаграмма рассеивания результатов наблюдений для отдельных факторов Поле рассеяния экспериментальных точек (значений функции отклика) представляет собой две колонки точек, соответствующих нижнему и верхнему уровням варьирования каждым фактором. Слева располагаются все значения функции отклика для тех опытов, где данный фактор находился на нижнем уровне, а справа – на верхнем. Таким образом, над обозначением на оси абсцисс каждого фактора будет находиться N точек (суммарное их значение в двух колонках), соответствующих N результатам экспериментов. При анализе диаграммы рассеивания каждый фактор рассматривается не зависимо от других. В результате имеются две группы опытов, в каждой из которых анализируемый фактор зафиксирован на определенном уровне, а все остальные факторы изменяются случайным образом. Если фактор влияет на выходной параметр Y, то при переходе его с одного уровня на другой произойдет смещение центра распределения MY на величину βi = (MY)1 – (MY)2, (5.4) где βi – вклад данного фактора; (MY)1 – центр распределения значений функции отклика Y при нахождении фактора Xi на первом (нижнем) уровне; (MY)2 – центр распределения значений Y при нахождении фактора Xi на втором (верхнем) уровне. Вклад данного фактора проще всего оценить с помощью разницы медиан для нижнего и верхнего уровней. При этом, если число точек, находящихся на уровне, 2i, то медиана лежит между i-й и (i+1)-й точками, если же на уровне (2i+1) точек, то медианой является (i+1)-я 182 точка. Существенные технологические факторы можно выделить, сравнивая визуально вклады факторов. Факторы, признанные существенными, то есть имеющие наибольшие вклады, могут быть оценены количественно. Для этого обычно составляется таблица с числом входов, соответствующим числу выделенных факторов (таблица 5.2). Таблица 5.2 – Вспомогательная таблица для количественной оценки факторов Входы таблицы I+ C+ I– I+ C– I– A+ A– Yi…Yξ .…… Y1 Y3 .…… .…… Y2 Y4 .…… .…… Y5 Y7 .…… .…… Y6 Y8 В каждую клетку таблицы заносятся результаты экспериментов в соответствии с уровнями, на которых находились выделенные факторы. При этом может оказаться, что некоторые клетки окажутся незаполненными. В этом случае надо сократить число входов таблицы, то есть уменьшить число выделяемых на данном этапе факторов. Пример Предположим, что на данном этапе наибольшие вклады имеют факторы X1, X3, X7 (таблица 5.3). Таблица 5.3 – Вспомогательная таблица для количественной оценки факторов X 3+ X 3− X 7+ Yi…Yξ .…… Y1 Y3 X 7− .…… .…… Y2 Y4 X 7+ .…… .…… Y5 Y7 X 7− .…… .…… Y6 Y8 Входы таблицы X1+ X1− 183 Коэффициенты при соответствующих факторах вычисляются по следующим формулам: bC = [(Y1 + Y2 + Y5 + Y6 ) 4] − [(Y3 + Y4 + Y7 + Y8 ) 4]; bA = [(Y1 + Y2 + Y3 + Y4 ) 4] − [(Y5 + Y6 + Y7 + Y8 ) 4]; (5.5) bI = [(Y1 + Y3 + Y5 + Y7 ) 4] − [(Y2 + Y4 + Y6 + Y8 ) 4]; Пример bX = [(Y1 + Y2 + Y5 + Y6 ) 4] − [(Y3 + Y4 + Y7 + Y8 ) 4]; 1 bX 3 = [(Y1 + Y2 + Y3 + Y4 ) 4] − [(Y5 + Y6 + Y7 + Y8 ) 4]; bX = [(Y1 + Y3 + Y5 + Y7 ) 4] − [(Y2 + Y4 + Y6 + Y8 ) 4]; 7 Эти формулы отличаются от соответствующих формул для вычисления коэффициентов в ПФЭ или ДФЭ тем, что здесь дополнительно производится усреднение в каждой клетке. Это необходимо делать, так как в случайно сбалансированном эксперименте различным комбинациям уровней может соответствовать разное число опытов. Из (5.5) видно, что коэффициенты при соответствующих факторах определяются как разность средних значений функции отклика, соответствующих верхнему и нижнему уровням рассматриваемого фактора. Если количественная оценка подтвердила значимость выделенных визуально факторов, то их исключают из рассмотрения при последующих этапах обработки данных. Обычно ограничиваются сравнением абсолютных значений коэффициентов и если значения каких-то коэффициентов оказываются в несколько раз меньше, чем других, то соответствующие им факторы на данном этапе не исключаются, а вновь включаются в рассмотрение на следующем этапе. В то же время, факторы, которые по значениям коэффициентов признаются влияющими на процесс, исключаются из дальнейшего рассмотрения. Коэффициенты, характеризующие влияние факторов, вычисляются на первом этапе со значительной ошибкой, которая может быть много больше ошибки эксперимента, так как оценка факторов производится на «шумовом фоне», создаваемом всеми остальными факторами, среди которых присутствуют и невыявленные пока доминирующие факторы. В связи с этим оценка значимости коэффициентов по критерию Стьюдента может оказаться неэффективной, и ее на первом этапе не производят, а ограничиваются 184 сравнением абсолютных значений коэффициентов, вычисленных в соответствии с (5.5). После исключения первой группы значимых факторов необходимо определить, являются ли существенными остальные факторы и эффект влияния взаимодействия факторов. Для этого проводят корректировку результатов эксперимента, полученных на первом этапе. Сущность этой корректировки состоит в том, чтобы на втором этапе исключить эффекты влияния на функцию отклика выявленных на предыдущем этапе значимых факторов. Для этого все экспериментальные результаты, находящиеся на одном из уровней, признанного существенным фактора, изменяют на величину b X i . Пример В результате проведения первого этапа была установлена значимость фактора X1 (рисунок 5.1). Тогда, из результатов экспериментальных значений функции отклика, например, + верхнего уровня этого фактора, то есть X 1 (таблица 5.2), вычитают значение коэффициента bX 1 , найденное в соответствии с (5.5), или к − экспериментальным значениям нижнего уровня ( X 1 ) прибавляют значение bX 1 . Данная процедура аналогично проделывается с экспериментальными данными для всех остальных всех остальных выделенных на первом этапе факторов. По скорректированным результатам снова строятся диаграммы рассеивания и вся процедура повторяется. На очередной серии диаграмм рассеивания разность медиан факторов, признанных существенными, по которым производилась корректировка, станет равной или близкой к нулю. Иными словами эти факторы не будут мешать анализировать другие факторы и взаимодействия. На втором этапе диаграммы рассеивания строятся, как для отдельных факторов, так и для их взаимодействий, потенциально способных оказывать влияние на выходной параметр. Однако строить диаграммы рассеивания для всех эффектов, взятых под подозрение, достаточно трудоемко, поскольку их число обычно велико. Поэтому сначала строят диаграммы рассеивания для линейных эффектов, а затем, проанализировав их, – лишь для тех взаимодействий, вклады которых достаточно велики. Пример Взаимодействие X8X9 будет иметь больший вклад, если появятся выделяющиеся точки как на уровне (X8X9)+, так и на уровне (X8X9)– (рисунок 5.2). В первом случае оба фактора X8 и X9 будут иметь 185 одинаковые знаки, а во втором – разные. Таким образом, нужно строить диаграммы рассеивания лишь для взаимодействия таких факторов, которые имеют выделяющиеся точки, как на одинаковых уровнях, так и на разных. То есть одни части диаграмм рассеивания факторов должны повторять друг друга, а другие – быть зеркальными отображениями (рисунок 5.2). Взаимодействие может иметь значительный вклад, в то время, как каждый фактор в отдельности характеризуется небольшим вкладом. Процесс выявления существенных технологических факторов следует прекратить, а все оставшиеся факторы считать относящимися к «шумовому полю», когда на очередной серии диаграмм рассеивания все вклады окажутся примерно одного порядка и незначительными по величине. Y – + X8 – + X9 – + X8X9 факторы Рисунок 5.2 - Построение диаграммы рассеивания результатов наблюдений для взаимодействий факторов Наряду с такой чисто качественной и субъективной оценкой значимости, как самих факторов, так и их взаимодействий, применяют также количественные критерии эффективности проведения отсеивающих экспериментов, которыми можно пользоваться после того, когда выявлены значимые факторы и их влияние на результаты эксперимента скорректированы. Значимость выделенных факторов и их взаимодействий можно проверить с помощью критерия Стьюдента, подсчитав первоначально экспериментальное значение t-параметра, здесь дисперсии ошибок определения каждого из коэффициентов: 186 l S 2 {b} = S 2 {Ykξ }∑ (1 / m j ), (5.6) j =1 где Ykξ – значения функции отклика, полученные после корректировки результатов эксперимента; l S {Ykξ } = ∑ [ S ⋅ (m j − 1)] 2 j =1 2 j l ∑ (m j =1 j − 1) , (5.7) l – число клеток в таблице 5.2; mj – число значений функции отклика Y в j-й клетке независимо от того, скорректированы или не скорректированы они; S – дисперсия наблюдаемых в j-й клетке значений функции отклика Yi, Yξ и т.д.; m S = [1 (m j − 1)] ⋅ ∑ (Yξ − Y ) 2 . 2 j (5.8) j =1 Проверку с помощью t-критерия имеет смысл проводить на последнем этапе построения диаграмм рассеивания, когда исследователь считает, что выделены все существенные эффекты, и, следовательно, остаточная дисперсия определяется ошибкой эксперимента. В этом случае с помощью критерия Стьюдента проверяют один – два эффекта, имеющие наибольшие вклады на последней серии диаграмм рассеивания. Если эти эффекты окажутся незначимыми, то можно сказать, что все существенные факторы и взаимодействия выявлены. Критерием окончания отсева существенных эффектов может служить и F-критерий: F = S 2 {Ykξ } S 2 {Y }, (5.9) 2 где S {Y} – дисперсия воспроизводимости или ошибка эксперимента. Все существенные факторы и взаимодействия считаются 2 2 выявленными, если различие между S {Ykξ} и S {Y} незначительно и F≤Fкр; Fкр находится при ν1=N–1: ν2=n–1. Только в этом случае можно считать влияние факторов и их взаимодействий незначительным, а дисперсию значений функции отклика – обусловленной ошибками эксперимента. Эффективность проведения отсеивающих экспериментов можно проверить и с помощью критерия Пирсона χ ( 2-критерия). Сущность этой проверки заключается в том, что, если выявлены все эффекты, влияющие на процесс, и исключено их воздействие на выходной параметр, то его распределение должно быть, в соответствии с центральной предельной теоремой, близким к нормальному закону. Разброс Yξ после заключительной корректировки должен быть 187 обусловлен лишь наличием «шумового поля» или случайных возмущений, воздействующих на процесс. Проверку гипотезы о близости распределения скорректированного (по всем диаграммам рассеивания) значения выходного параметра нормальному закону осуществляют с помощью критерия Пирсона. В этом случае часто применяют следующую формализованную методику: 1. Проводят построение упорядоченного вариационного ряда. Для этого производят следующие действия: – находят Ymax и Ymin; – подсчитывают число интервалов K=1+3,332·lgn, где n – объем выборки, а K (число интервалов) округляют до целого значения; – определяют длину интервала l=(Ymax–Ymin)/K; – находят середину интервала Yi=(Yi+1–Yi)/2; – вычисляют относительную частоту попадания в интервал k pi=ni/n, где n = ∑ ni ; i =1 – строят гистограмму. 2. Определяют теоретическую вероятность того, что значение случайной величины попадет в интервал от Yi+1 до Yi. Для этого: k – находят выборочное среднее арифметическое Y = (1 / n)∑ (Yi ni ); i =1 k – вычисляют выборочную дисперсию S 2 = ∑[ni (Yi − Y ) 2 ] (n − 1); i =1 – определяют среднее квадратическое отклонение S = S 2 ; – вычисляют значение t–распределения Стьюдента ti = (Yi − Y ) / S , причем ti определяется для границ интервалов; – проводят подсчет теоретической вероятности для каждого интервала ~pi = Φ(ti ) − Φ(ti + 1) , где Φ – функция Лапласа Φ(-t)=1–Φ(t); значение Φ(t) находят по таблице приложения. 3. Определяют теоретическую функцию распределения n~pi ; 4. Вычисляют расхождение между эмпирической ni и теоретическими функциями распределения n~pi по критерию Пирсона χ k 2 расч = ∑[(ni − n~pi ) 2 (n~pi )]. (5.10) i =1 5. Находят число степеней свободы ν=K–d–1, где d – число оцениваемых параметров, в данном случае d=2, так как оцениваются Y и S2. 188 2 6. Определяют табличное значение критерия Пирсона χ табл для ν и P (вероятности, представляющие собой уровень значимости, который выбирается равным 0,9; 0,95; 0,99). 2 2 7. Если χ табл > χ расч – гипотеза о соответствии распределения нормальному закону принимается. На практике, если P<0,1, необходимо проверить эксперимент, если возможно – повторить его. При появлении повторных расхождений следует попытаться найти более подходящий для описания экспериментальных данных закон распределения. На этапе отсеивающих экспериментов не ставится задача получения адекватной математической модели, поэтому целесообразнее брать большие интервалы варьирования, чтобы изменения выходной величины, вызываемые переходом фактора с одного уровня на другой, были различимы на фоне «шума». Таким образом, постановка отсеивающих экспериментов дает возможность: – выявить среди множества факторов, взятых под подозрение, наиболее существенные, и тем самым сократить дальнейшие исследования; – определить требования к применяемому оборудованию и упростить управление процессом, тщательно контролируя лишь те параметры, которые оказывают наиболее сильное воздействие на интересующие исследователя показатели; – представить характер влияния технологических параметров на выходную величину процесса и правильно выбрать исходную точку и интервалы варьирования переменными для дальнейших экспериментов. 5.3 Решение типового примера Рассмотрим гипотезу о соответствии закона распределения, представленного статистическим рядом в таблице 5.4, гауссовскому закону распределения. Распределение, полученное по результатам наблюдений, разбито в таблице 5.4 на 12 интервалов. Первые три и последние два интервала объединим для того, чтобы экспериментальные частоты получились больше 5. Таким образом, число интервалов станет равным 9. Значения экспериментальных и теоретических частот, подсчитанных исходя из гауссовского закона распределения, приведены в таблице 5.5. Подставив значения ni и n~pi в выражение (5.10), получим χ2=7,52. 189 Число степеней свободы в соответствии с ν=K–d–1 равно 6. По таблице А5 приложения А находим P=0,25. Следовательно, распределение значений напряжения пробоя, приведенных в таблице 5.5, близко к гауссовскому. Таблица 5.5 – Интервальный ряд распределения пробивных напряжений диэлектрических слоев 160 однотипных МОП-структур Интервал измерений 176,5-179,4 179,5-182,4 182,5-185,4 185,5-188,4 188,5-191,4 191,5-194,4 194,5-197,4 197,5-200,4 200,5-203,4 203,5-206,4 206,5-209,4 209,5-212,4 Середина Относительна Накопленная Относительная Частота интервала я частота частота накопленная ni Xi ωi , % ∑ni частота ∑ωi, % 178 1 0,6 1 0,6 181 3 1,9 4 2,5 184 5 3,1 9 5,6 187 21 13,1 30 18,1 190 16 10,0 46 28,7 193 29 18,1 75 46,8 196 31 19,4 106 66,2 199 21 13,1 127 79,3 202 18 11,4 145 90,7 205 9 5,6 154 96,3 208 5 3,1 159 99,4 211 1 0,6 160 100,0 Таблица 5.6 – Значения экспериментальных и теоретических частот ni 9=1+3+5 21 n~ pi 11,6=1,0+ 13,4 +3,7+6,9 16 29 31 21 18 6 6=5+1 21,6 28,0 29,3 24,6 16,8 9,3 5,6=4,2+ +1,4 Пример Для иллюстрации применения метода случайного баланса рассмотрим процедуру выявления факторов, оказывающих наиболее сильное влияние на свойства резистивных пленок вольфрама. Программа эксперимента охватывает следующие факторы технологического процесса: X1 – давление в камере при осаждении пленки; X2 – температура испарения; X3 – температура подложки в процессе осаждения пленки; X4 – расстояние испаритель–подложка; X5 – температура подложки при термообработке; X6 – давление в камере при термообработке; 190 X7 – продолжительность термообработки; X8 – температура подложки при напуске воздуха; X9 – длительность хранения очищенной подложки перед установкой в камеру; X10 – длительность прогрева испаряемого материала; X11 – длительность прогрева подложки; X12 – температура прогрева подложки; X13 – продолжительность хранения подложки с резистивной пленкой до защиты слоем диэлектрика. Кроме того, в программе исследований учитываются также 48 эффектов взаимодействия, потенциально способных оказывать влияние на функцию отклика процесса получения пленок вольфрама (стабильность пленок ΔR/R, %, во времени). При составлении матрицы планирования (таблица 5.7) все линейные эффекты разбиваются на четыре группы в соответствии с физикой процесса: 1) X1 … X4; 2) X5 … X8; 1) X9 … X12; 1) X13. Для каждой группы берется матрица ПФЭ типа 24. Нет необходимости строить матрицу ПФЭ для каждой группы, достаточно построить матрицу для самой многочисленной группы, чтобы она была общей для всех остальных групп. Строки общей матрицы планирования получаются путем смешивания строк групповых планов с помощью таблицы случайных чисел. После реализации матрицы планирования строятся диаграммы рассеивания для линейных эффектов (рисунок 5.3). Наибольшие вклады имеют факторы X2 , X3 ,X5 . Для их количественной оценки служит вспомогательная таблица 5.8. С помощью таблицы 5.8 вычислим коэффициенты при соответствующих факторах: bX = −0,300; 2 bX = −0,975; 3 bX = −0,650. 5 bX меньше (по абсолютной величине) Коэффициент коэффициентов bX и bX , поэтому можно исключить фактор X2 из дальнейшей корректировки результатов эксперимента и результаты корректировать только по факторам X3 и X5. 2 3 5 191 Номер опыта Таблица 5.7 – Матрица планирования отсеивающих экспериментов при исследовании резистивных пленок вольфрама Порядок проведения X1 X2 X3 X4 опытов по группам X5 X6 X7 X8 X9 X10 X11 X12 I II III IV X13 группа группа группа группа 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 – + – + – + – + – + – + – + – + – – + + – – + + – – + + – – + + – – – – + + + + – – – – + + + + – – – – – – – – + + + + + + + + 10 6 3 16 12 15 14 1 5 9 7 13 2 8 4 11 7 3 13 16 2 9 2 16 6 12 13 7 9 12 3 6 6 9 16 15 4 3 16 3 9 10 10 4 15 6 5 5 8 3 4 1 9 8 16 4 1 9 7 8 9 12 11 6 Выходной параметр Условия проведения эксперимента I группа II группа III группа X1б X2б X3б X4б X5б X6б X7б X8б X9б X10б X11б + + – + + – + – – – – – + + + – – – + + + + – – – – + – – + + + – + – + – + + – + – + + – + – – 192 + – – + + + + – – + – + – – – + – – – + + – + + + + – – – + – + + + – + – – – + – + – + – + – – + – + + – – – + + – + + – – – + – – + + – + – + – + + – + + – – + – + – + – + – – + + + – + – – – – + – + + + + – – – + + – – – + – + + – – + – – – – – + + + + IV группа Yξ (ΔR/R, %,) X12б X13б – + + + – – + – + + + – + – – – + – + – – + + + – – – + – + – + 2,2 1,9 2,9 0,7 2,4 1,3 1,3 2,0 1,3 2,2 1,2 2,1 2,5 0,6 2,8 1,2 3 2,5 0,85 1,5 1,0 0,8 2 1 0,5 +– +– +– +–+–+ – +– +–+ –+ – +–+–+– X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 Рисунок 5.3 - Диаграмма рассеивания результатов наблюдений на первом этапе отсеивающего эксперимента при исследовании резистивных пленок вольфрама Таблица 5.8 – Таблица для количественной оценки факторов Входы таблицы X 3+ X 3− X 5+ X 5− X 5+ X 5− X +2 X −2 0,7; 0,6 Y1 =0,65 1,3; 1,2 Y2 =1,25 1,3; 1,3 Y5 =1,3 1,9; 2,1 Y6 =2,0 2,4; 1,2 Y3 =1,8 2,9; 2,8 Y4 =2,85 2,0; 2,2 Y7 =2,1 2,2; 2,5 Y8 =2,35 Учитывая, что корректировка экспериментальных данных должна проводиться только по одному уровню варьирования факторов X3 и X5, выбираем из таблицы 5.7 только те средние значения функции отклика Yξ , которые соответствуют верхнему уровню безразмерных значений этих факторов, и производим их корректировку. Тогда получим следующие скорректированные значения функции отклика: 193 YK 2 = 1,9 − bX = 1,9 − (−0.975) = 1,9 + 0,0975 = 2,875; 3 YK 4 = 0,7 − bX − bX = 0,7 + 0,975 + 0,65 = 2,325; 3 5 YK 5 = 2,4 − bX = 3,05; 5 YK 6 = 1,3 − bX = 2,275; 3 YK 7 = 1,3 − bX − bX = 2,925; 3 5 YK 8 = 2,0 − bX = 2,95; 5 YK 9 = 1,3 − bX − bX = 2,925; 3 5 YK 10 = 2,2 − bX = 2,85; 5 YK 11 = 1,2 − bX = 2,175; 3 YK 12 = 2,1 − bX = 3,075; 3 YK 14 = 0,6 − bX − bX = 2,225; 3 5 YK 16 = 1,2 − bX = 1,850. 5 По скорректированным данным и оставшимся YKξ нескорректированным значениям Yξ (таблица 5.6) вновь строим диаграммы рассеивания, но уже не только для линейных эффектов, но и для эффектов влияния их взаимодействия. В данном случае имеют смысл 48 различных взаимодействий, но в первую очередь нас интересуют взаимодействия выделенных на первом этапе значимых факторов, хотя могут вызывать опасения влияния взаимодействий и ряда других факторов, например, X2, X6, X9, X10 и X12. При решении вопроса, для каких эффектов взаимодействий факторов следует на втором этапе строить диаграммы рассеяния, можно воспользоваться следующими рекомендациями. При учете влияния взаимодействия факторов можно воспользоваться анализом скорректированных диаграмм для линейных эффектов. В первую очередь исследователя интересуют те факторы, которые имеют выделяющиеся точки на диаграмме рассеяния, находящиеся на самом высоком (выше верхнего медианного значения) и самом низком (ниже нижнего медианного значения) уровнях. Эффект взаимодействия двух факторов будет представлять интерес в том случае, если эти выделяющиеся точки, находящиеся, например, на самом высоком уровне, будут представлять собою зеркальное отображение для рассматриваемых факторов, то есть 194 значения функции отклика, представленные этими точками на диаграмме рассеяния, будут равны по абсолютной величине, но иметь противоположные знаки. И, наоборот, нижние точки у взаимодействующих факторов будут выделяться, если они представлены значениями функции отклика, равными по абсолютной величине и имеющими одинаковый знак, то есть положение самых нижних точек у рассматриваемых факторов одинаково. Такое расположение точек (зеркальное и повторное) на диаграмме рассеяния для линейных эффектов характеризует наибольший вклад взаимодействия соответствующих факторов. При этом каждый из этих факторов в отдельности может иметь меньший вклад по диаграмме рассеивания, чем их взаимодействия. Оценка выделенных здесь эффектов дала следующие результаты: bX = −0,55; 2 bX X = −0,6. 2 3 Принимаем решение считать данные эффекты существенными, чтобы не пропустить возможно важный фактор X2, и проведем соответствующую корректировку результатов 2-го этапа отсеивающего эксперимента. По скорректированным результатам вновь построим диаграмму. Анализ данной диаграммы рассеивания и оценка наиболее сильного эффекта X1X2 по критерию Стьюдента позволяют сделать вывод, что оставшиеся эффекты могут быть отнесены к «шумовому полю». 5.4 Задачи для решения 1. Используя метод насыщенных планов определить существенные факторы. К результатам опытов из табл.5.9 прибавить номер выполняемого варианта. 2. Используя метод насыщенных планов определить существенные факторы. К результатам опытов из табл.5.10 прибавить номер выполняемого варианта. 195 X1б X2б X3б X4б X5б X6б X7б X8б X9б X10б X11б X12б X13б X14б X15б + + + + + + + + + + – + – + – + – + – + – – + + – – + + – – – – – – + + + + – – – – – – – – – – + + + – – + – + + – – + – + + – + – – + – + – + + – – + + – + – – + + + + – + – + – – – + + + + – – + + + – – + + – – + + – + – + – – + – + + – + – + – + – + – – + + + – – – – + + + + + + – – + + – – – – + + + + – – – – – – + – + – + + + – + – – + – – + – + + + – + – – + – – + – + – + – + – – + + + + + – – + – – – – + + + – + + – – – + – – + + – – + + – + + + – – – – + – – – + + + + + + + + + + + + + + + + + + + Y2 X0б 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 Y1 № Таблица 5.9 21,3 15 7,7 16,6 25,4 17,9 17,7 15,6 3,2 18,3 27,1 12,6 23,2 28 28 26,5 17,4 3,4 10,3 23,3 17,8 29,8 6,8 8 26,4 26,8 25,4 39,2 24,8 24,9 12,7 18,6 Таблица 5.10 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 X1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 X2 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 X3 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 X4 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1 Y1 0,2 8,8 13 12,1 4,9 -3 1,8 2,6 10,1 12 6,6 5,9 0,4 1,2 0,1 13,8 Y2 7,7 26,4 16,6 17,8 6,8 25,4 3,2 24,8 10,3 25,4 12,7 21,3 15 17,9 17,7 15,6 5.5 Контрольные вопросы 1. Чем ограничивается применение метода насыщенных планов при исследовании технологических процессов? 2. Почему при реализации метода сверхнасыщенных планов 196 рекомендуется разбивать факторы на группы с учетом особенностей технологического процесса? 3. Почему общая матрица планирования эксперимента в методе сверхнасыщенных планов строится путем случайного смешивания строк групповых планов? 4. Каковы условия применения метода случайного баланса и почему они не мешают широкому использованию этого метода при исследовании технологических процессов? 5. Почему на каждой последующей серии диаграмм рассеивания повышается точность оценки рассматриваемых эффектов? 6. Где производится более точная оценка фактора: на диаграмме рассеивания или с помощью вспомогательных таблиц и рассчитываемых с их помощью коэффициентов регрессии? 7. Какова общая стратегия исследования при определении факторов, влияющих на процесс? 197 МОДУЛЬ 2 «АКТИВНЫЙ ЭКСПЕРИМЕНТ» ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 6 6. ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ 6.1 Планирование эксперимента Основной целью проведения современного эксперимента является разработка математической модели, адекватно описывающей процесс и позволяющей осуществлять управление производством. При планировании эксперимента исследователь должен: – обеспечить высокую надежность и четкость интерпретации результатов экспериментальных исследований; – составить четкую и последовательную логическую схему построения всего процесса исследования; – максимально формализовать процесс разработки модели и сопоставления экспериментальных данных различных опытов одного и того же объекта исследований с целью широкого применения электронно-вычислительных средств. Всем требованиям отвечают статистические методы планирования эксперимента. Статистические методы планирования активного эксперимента являются одним из эмпирических способов получения математического описания статики сложных объектов исследования, то есть уравнения связи отклика объекта и независимых управляемых входных переменных (факторов). При этом математическое описание представляется в виде полинома k k k i =1 i≠ j i =1 Y = b0 + ∑ bi X i + ∑ bij X i X j + ∑ bii X i2 + ... , (6.1) где Y – функция отклика; X1, X2, …, Xk – факторы исследуемого процесса. Первый этап исследования – составление плана эксперимента, который определяет расположение экспериментальных точек в kмерном факторном пространстве, иначе говоря, условия для всех опытов, которые необходимо провести. Обычно план эксперимента задается в виде матрицы планирования, каждая строка которой 198 определяет условия опыта, а каждый столбец – значения контролируемых и управляемых параметров в исследуемом процессе, то есть значения факторов, соответствующих условию опыта. В последний столбец матрицы заносят значения функции отклика, полученные экспериментальным путем в каждом опыте, проведенным в соответствии с условиями, указанными в строках матрицы планирования эксперимента. Первый шаг – выбор центра плана, то есть точки, соответствующей начальному значению всех используемых в эксперименте факторов (x10, x20, …, xk0), в окрестностях которой в дальнейшем ставится серия планируемых опытов. Начальным значениям факторов будет соответствовать начальное значение функции отклика y0. Центр плана обычно выбирается на основе априорных сведений о процессе. Если же их нет, то обычно в качестве центра плана принимается центр исследуемой области. Второй шаг – задание интервала варьирования. Значения факторов в каждом опыте, в случае применения матрицы планирования эксперимента, отличается от начального их значения xi0 на величину интервала Δx. Одним из важнейших предварительных условий успешного проведения эксперимента с целью разработки математической модели, адекватной исследуемому процессу, является выбор оптимальной величиныΔ x. Обычно интервал варьирования выбирают в пределах 0,05 … 0,3 от диапазона варьирования исследуемого фактора. Третий шаг – для удобства обработки результатов опытов, проводится преобразование значений управляемых переменных (учитываемых в эксперименте факторов xi) к безразмерным величинам xiб = (xi – xi0)/Δxi, (6.2) где xi0 – базовое или начальное значение i-го фактора в центре плана; Δxi – значение интервала варьирования по i-му фактору; xi – текущее значение i-го фактора. Пример Пусть базовое значение температуры подложки – одного из факторов исследуемого процесса получения резистивных пленок рения равно x10=3000С. При этом шаг варьирования по этому фактору Δx1=500С. Варьирование значений фактора относительно его базового значения проводится на двух уровнях (рисунок 6.1). 199 Δx1 250 Δx1 300 x1,0C 350 Рисунок 6.1 – Результаты пошагового варьирования фактора Переходя от абсолютных значений рассматриваемого фактора к безразмерным его значениям, получим в соответствии с (6.2) для верхнего уровня рассматриваемого фактора x1б = (x1 – x10)/Δx1=(350300)/50 = +1, для нижнего – x1б = (250–300)/50 = –1. Таким образом, в безразмерной системе координат верхний уровень фактора при проведении эксперимента равен +1, а нижний – 1. Координаты центра плана равны нулю и совпадают с началом координат. При составлении матрицы планирования эксперимента верхний и нижний уровни переменных для упрощения записи можно заменять символами (+) и (–). Второй этап исследования. Разработку модели процесса следует проводить по принципу «от простого – к более сложному». В соответствии с этим принципом, планирование эксперимента начинают с предположения, что имитируемая модель исследуемого процесса является линейной и в соответствии с (6.1) имеет вид полинома 1-го порядка k k i =1 i≠ j Y = b0 + ∑ bi X i + ∑ bij X i X j . (6.3) Если после обработки и анализа результатов эксперимента выяснится, что сделанное предположение о линейности модели является ошибочным, то переходят к планированию эксперимента из предположения, что эта модель может быть представлена полиномом 2-го порядка и так далее до тех пор, пока не будет разработана адекватная исследуемому процессу математическая модель. Начнем рассмотрение наиболее распространенных статистических методов планирования экспериментов с полного факторного эксперимента. Полным факторным экспериментом (ПФЭ) называется эксперимент, реализующий все возможные неповторяющиеся комбинации уровней n независимых управляемых факторов, каждый их которых варьируют на двух уровнях. В этом случае учитывается влияние на функцию отклика исследуемого процесса не только 200 каждого рассматриваемого в эксперименте фактора в отдельности, но и их взаимодействий. Первоначально рассмотрим случай воздействия на функцию отклика Y двух факторов X1 и X2. В соответствии с принципом «от простого к более сложному» предположим, что модель исследуемого процесса является линейной и в соответствии с (6.3) имеет вид Y = b0 + b1X1+ b2X2 + b12X1X2, (6.4) где b0 – значение функции отклика Y в центре плана; b1, b2 – характеризуют степень влияния факторов X1, X2 на функцию отклика Y (чем он больше по сравнению с другими коэффициентами, тем более весомый вклад в изменение функции отклика вносит данный фактор); b12 – характеризует весомость влияния взаимодействия 1-го и 2-го факторов на функцию отклика исследуемого процесса. Все возможные комбинации для двух факторов (k=2), варьируемых на двух уровнях, будут исчерпаны, если мы поставим четыре опыта. Опытные точки расположатся в вершинах квадрата, центр которого совпадает с центром плана (рисунок 6.2). Каждому из этих четырех опытов будет соответствовать свое значение функции отклика в зависимости от четырех различных сочетаний двух значений варьируемых в данном эксперименте факторов. Построим матрицу планирования ПФЭ для рассматриваемого случая и с учетом предполагаемой модели (6.4) исследуемого процесса. X2 Y3= f(x1= -1, x2= +1) Y4= f(x1= +1, x2= +1) X1 Y1= f(x1= -1, x2= -1) Y2= f(x1= +1, x2= -1) Рисунок 6.2 – Расположение экспериментальных точек для двух независимых факторов, варьируемых на двух уровнях Первый столбец матрицы представляет собой нумерацию опытов. Нумерация факторов осуществляется произвольно и в каждом конкретном случае определяется самим исследователем. Во втором столбце приводятся значения фиктивной переменной 201 x0=+1, соответствующей коэффициенту b0. В последующих столбцах приводятся безразмерные символы, соответствующие верхнему и нижнему уровням варьирования факторов и их взаимодействий. При построении матрицы планирования ПФЭ существует следующее правило: первая строка матрицы в столбцах, соответствующих рассматриваемым в эксперименте факторам, заполняется безразмерным символом, соответствующим нижнему уровню значений фактора в эксперименте, то есть символом (–); продолжение заполнения столбца, соответствующего первому по порядку фактору, проводится последовательным чередованием противоположных знаков (безразмерных значений уровней варьирования фактора); все последующие столбцы, соответствующие другим пронумерованным по порядку факторам, заполняются с частотой смены знака вдвое меньшей, чем для предыдущего столбца. Заполнение столбцов, учитывающих взаимодействие факторов, производится как результат перемножения знаков соответствующих факторов в каждой строке. В последний столбец матрицы заносятся экспериментальные значения функции отклика, полученные в результате проведения каждого опыта. Матрица планирования для двух факторов приведена в таблице 6.1, ее называют матрицей планирования ПФЭ типа 22 (два фактора варьируются на двух уровнях). Таблица 6.1 – Матрица планирования ПФЭ типа 22 Номер опыта x0б x1б x2б x1бx2б Yξ 1 + – – + Y1 2 + + – – Y2 3 + – + – Y3 4 + + + + Y4 Если в эксперименте используются три фактора, а предполагаемая математическая модель линейна, то она соответствует виду Y=b0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+b23X2X3+b123X1X2X3. (6.5) 202 При варьировании каждым из трех факторов (k=3) на двух уровнях число опытов N будет составлять N=23=8. В этом случае опытные точки располагаются в вершинах куба, центр которого находится в начале координат (0,0,0) (рисунок 6.3). Матрица планирования ПФЭ составляется по описанным ранее правилам, и будет иметь следующий вид (таблица 6.2). X2 Y3=f(-1;1;-1) Y4=f(1;1;-1) Y7=f(-1;1;1) Y8=f(1;1;1) (0;0;0) X1 Y1=f(-1;-1;-1) Y2=f(1;-1;-1) Y5=f(-1;-1;1) Y6=f(1;-1;1) X3 Рисунок 6.3 – Расположение экспериментальных точек в плане, соответствующем полиному 1-го порядка для трех независимых переменных Номер опыта 1 2 3 4 5 6 7 8 X0б + + + + + + + + Таблица 6.2 – Матрица планирования ПФЭ типа 23 X1б X2б X3б X1бX2 X1бX3 X2бX3 X1бX2бX3б Yξ – + – + – + – + – – + + – – + + – – – – + + + + б б б + – – + + – – + + – + – – + – + + + – – – – + + – + + – + – – + Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Руководствуясь приведенным ранее правилом можно построить матрицу и для большего числа рассматриваемых в эксперименте факторов, число опытов в которой равно N = 2k, (6.6) 203 где k – число учитываемых в эксперименте факторов. Но выражение (6.6) справедливо только для линейной модели, соответствующей полиному 1-го порядка (6.3), когда варьирование по каждому фактору достаточно проводить на двух уровнях. При статистическом методе планирования эксперимента существует правило – число уровней варьирования, учитываемых в эксперименте факторов, должно быть, по крайней мере, на единицу больше порядка полинома, для построения которого планируется эксперимент. Планирование эксперимента началось с предположения, что математическая модель исследуемого процесса соответствует полиному 1-го порядка, поэтому достаточно проводить варьирование каждого из k факторов на двух уровнях, а необходимое число проводимых опытов можно определить с помощью выражения (6.6). Если анализ результатов эксперимента показывает, что линейная модель, соответствующая полиному первого порядка (6.3) не адекватна исследуемому процессу, то переходят к планированию и проведению следующего эксперимента исходя уже из предположения, что математическая модель соответствует полиному следующего порядка и так далее. Но при планировании эксперимента, основанного на математической модели, например, соответствующей полиному второго порядка k k k k Y = b0 + ∑ bi X i + ∑ bij X i X j + ∑ bii X + ∑ biijj X i2 X 2j i =1 i≠ j i =1 2 i i≠ j (6.7) Необходимо обеспечить варьирование по каждому из факторов уже на трех уровнях. Тогда необходимое число опытов, которое нужно провести в эксперименте, должно быть не менее N=3k , для полинома третьего порядка N=4k и так далее. Достоинства многофакторного планирования ПФЭ: 1 – Опытные точки находятся в оптимальном положении, то есть математическое описание исследуемого процесса оказывается более точным, чем при проведении опытов в точках, расположенных каким-либо другим образом. 2 – Планирование и проведение ПФЭ сравнительно просто, что объясняет его широкое применение на практике. 3 – Все факторы и соответственно коэффициенты полинома оцениваются независимо друг от друга, что обеспечивается независимостью и ортогональностью столбцов матрицы планирования. 204 6.2 Проведение эксперимента Оно должно обеспечить сведение к минимуму влияния случайных параметров исследуемого процесса на функцию отклика. С целью уменьшения их влияния на конечный результат эксперимента, необходимо придерживаться следующих требований: – предусмотреть проведение нескольких параллельных опытов при одних и тех же условиях, предусмотренных соответствующей строкой матрицы планирования (номером опыта); – необходимо рандомизировать неконтролируемые параметры процесса, то есть обеспечить их взаимную компенсацию. Для выполнения первого требования должно быть предусмотрено проведение не менее двух параллельных опытов (n = 2), а для более высокой достоверности результатов их число увеличивают. В этом случае результаты n параллельных опытов для каждой строки матрицы планирования усредняют и при анализе результатов эксперимента используют именно усредненное значение функции отклика, соответствующие условиям опыта и подсчитываемое по следующей формуле: Yξ = n ∑ Yξ i =1 i n, (6.8) где ξ = 1, N – номер опыта по порядку, установленному первым столбцом матрицы; i – номер параллельного опыта в ее строке; yξi – значение функции отклика, соответствующее i-му параллельному опыту в ξ-м номере опыта; n – число параллельных опытов. Для выполнения второго требования порядок реализации условий опыта, предусмотренный первым столбцом матрицы, должен быть рандомизирован. Для этого перед непосредственной реализацией плана эксперимента для каждой из n серий опытов обычно с помощью таблицы случайных чисел (таблица А.4 приложения А) определяется последовательность опытов на исследуемом объекте. 6.3 Обработка и анализ результатов эксперимента Обработка и анализ результатов 205 ПФЭ предусматривает следующий порядок их проведения: 1. Оцениваются дисперсии среднего арифметического в каждой строке матрицы по формуле Sξ2 = ∑ (Yξi − Yξ ) n (n − 1), 2 (6.9) i =1 2. Проверяются однородности дисперсий. Так как даже одна грубая ошибка может исказить результаты исследования, проведенного при небольшом числе экспериментов, то необходим контроль воспроизводимости результатов исследования, который осуществляется с помощью критерия Кохрена. Подсчитывают параметр G = max Sξ 2 N Sξ ∑ ξ =1 2 , (6.10) то есть вычисляют отношение максимального значения изменчивости (максимального значения дисперсии, определенного по (6.9)) среди N опытов к сумме изменчивостей во всех N опытах. Найденное по (6.10) наибольшее экспериментальное значение G сравнивают с критичным (табличным) его значением Gкр. Критичное значение Gкр представляет собой максимально возможное значение параметра G, при котором гипотеза о воспроизводимости эксперимента еще может считаться справедливой. В этом случае максимальная изменчивость функции отклика, полученная в результате проведения n параллельных опытов, не отличается от ожидаемой среди N опытов. Задаваясь определенным значением коэффициента рискаβ, значение Gкр определяют в столбце таблицы А3 приложения А, соответствующем числу параллельных опытов (n) и строке, соответствующей числу номеров опытов (N). Если G ≤ Gкр, то «подозрительное» максимальное значение изменчивости не является «инородным», а представляет собой результат случайного рассеяния исследуемой функции отклика, то есть эксперименты воспроизводимы и их результаты можно использовать для оценки коэффициентов регрессии. Если G > Gкр, то эксперименты не воспроизводимы, то есть неконтролируемые и неуправляемые факторы создают на выходе слишком большой уровень «шума». Необходимо проверить следующую точку (имеющую второе по величине значение Sξ2) и так далее, то есть нужно выявить все точки, в которых эксперимент невоспроизводим. При этом можно увеличить число параллельных 206 опытов. 3. Создается математическая модель объекта с проверкой статистической значимости коэффициентов полинома. После выполнения ПФЭ осуществляют независимую оценку коэффициентов полинома по следующей формуле: N bi = ∑ X iξ Yξ ξ =1 N, (6.11) где X iξ принимает значения +1 или –1 в соответствии с матрицей планирования. В числителе (6.11) фактически стоит сумма средних значений выходного параметра по всем опытам с учетом уровня независимой переменной Xi в ξ-м опыте. По формуле (6.11) можно найти также коэффициенты bij при произведениях факторов XiXj (i ≠ j). Значения этих коэффициентов показывают уровень влияния эффекта взаимодействия факторов Xi и Xj . После вычисления коэффициентов оценивается их значимость для определения степени влияния различных факторов на выходной параметр (функцию отклика). Основой оценки значимости является сопоставление абсолютного значения, например, коэффициента bi и дисперсии ошибки его определения S2{bi}. В этом случае с помощью t-критерия (критерия Стьюдента) проверяется гипотеза о незначимости рассматриваемого коэффициента, то есть гипотеза о том, что bi=0 (проверка нуль-гипотезы). Значение параметра определяется по формуле: ti = bi S 2{b} . (6.12) При ортогональном планировании эксперимента дисперсии ошибок определения каждого из коэффициентов равны между собой S 2 {b} = S 2 {Y } (nN ), (6.13) 2 Дисперсия воспроизводимости S {Y} оценивается по формуле N S {Y } = ∑ Sξ2 N . 2 (6.14) ξ =1 Коэффициент b признается значимым, если t для числа степеней свободы ν=N(n–1) больше или равен tкр (t ≥ tкр) , найденному по таблице А1 приложения А для заданного значения коэффициента риска β. В случае t<tкр, коэффициент признается незначимым. Статистическая незначимость коэффициента bi может быть вызвана следующими обстоятельствами: 207 – уровень базового режима по данной переменной X0i (или по произведению переменных) близок к точке частного экстремума: bi ≈ ∂Y ( X 0 ) ∂X i = 0; – интервал варьирования ΔXi переменной выбран слишком малым; – данный фактор (взаимодействие факторов) не оказывает влияния на значение выходного параметра. Так как применение ортогональных планов дает возможность оценивать значения всех коэффициентов независимо друг от друга, тогда если один или несколько коэффициентов окажутся незначимыми, то они могут быть отброшены без пересчета остальных. Отбросив незначимые коэффициенты, получим уточненную имитационную модель в виде полинома, представляющую зависимость выходного параметра от технологических факторов. 4. Проверяется адекватность. Математическая модель должна достаточно верно качественно и количественно описывать свойства исследуемого явления, то есть она должна быть адекватна. Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического более чем на некоторую заранее заданную величину. Для проверки адекватности достаточно оценить отклонение предсказанного имитационной моделью значения выходного параметра Yξt от результатов эксперимента Yξ в точке Xξ факторного пространства. Оцениваем дисперсию адекватности по формуле N 2 S ад = ∑ (Yξ − Yξt ) 2 ξ =1 ( N − d ), (6.15) где d – число членов аппроксимирующего полинома. Если Sад2 не превышает дисперсии опыта S2{Y} ( Sад2 ≤S2{Y}), то полученная математическая модель адекватно представляет результаты эксперимента; если Sад2 >S2{Y}, то проверка гипотезы об адекватности проводится с помощью F-критерия (критерия Фишера) при νад=N–d и ν=N(n–1). F = S ад2 S 2{Y }, (6.16) если F ≤ Fкр, то модель признается адекватной. Очевидно, что такая проверка возможна, если νад > 0, так как при N=d не остается степеней свободы для проверки нуль-гипотезы об 208 адекватности. В этом случае можно провести косвенную проверку адекватности, поставив ряд экспериментов в центре плана. Различие между средним значением выходной величины, полученной в этих экспериментах, и свободным членом линейного уравнения может дать представление об адекватности модели. Если это различие незначимо, то можно предположить, что модель адекватна. При отрицательном результате проверки адекватности (модель недостаточно верно описывает процесс) необходимо либо переходить к уравнению связи более высокого порядка, так как, по-видимому, эксперимент ставился в области, близкой к экстремальной, либо, если это возможно, проводить эксперимент с меньшим интервалом варьирования ΔXi. Уменьшение интервала варьирования приводит к увеличению отношения помех к полезному сигналу, что обусловливает необходимость увеличения числа параллельных опытов для выделения сигнала на фоне шума, а также к уменьшению абсолютных значений коэффициентов bi, величины которых зависят от интервала варьирования и при чрезмерном его уменьшении могут стать статистически незначимыми. Если полученная модель адекватна, то возможны следующие ситуации: – Все линейные коэффициенты значимы. Полученную модель можно использовать для управления процессом и оптимизации его путем движения по направлению к экстремуму. – Один из коэффициентов резко выделяется по абсолютной величине. В этом случае движение по градиенту функции выродится в обычный однофакторный эксперимент. Поэтому следует повторить эксперимент, уменьшив интервал варьирования этого фактора или увеличив его для других факторов. – Некоторые из линейных коэффициентов незначимы. Ими можно пренебречь, если соответствующие факторы действительно не оказывают влияния на выходной параметр (например, если незначимым оказался включенный в исследование из осторожности фактор, который и по априорным сведениям не должен оказывать существенного влияния на функцию отклика). Если в этом уверенности нет, то необходимо поставить новую серию опытов, расширив интервалы варьирования у соответствующих факторов. – Некоторые или все линейные коэффициенты незначимы, но значимы коэффициенты взаимодействия bij. Такое положение может возникнуть из-за неудачного выбора интервалов варьирования, 209 поэтому надо поставить новую серию опытов, увеличив интервалы варьирования у соответствующих факторов. Причиной подобной ситуации может быть и то, что эксперимент ставился в области, в которой линейное приближение является неудачной моделью поверхности отклика. В этом случае переходят к нахождению математической модели более высокого порядка. 6.4 Решение типового примера Пример Требуется исследовать процесс получения резистивных пленок рения с целью его оптимизации. В качестве критерия оптимизации берется температурный коэффициент сопротивления (ТКС). Задача исследования – определить условия получения резистивных пленок с минимальным ТКС. Решение Из анализа технологического процесса и результатов предварительных опытов установлено, что на ТКС пленок рения оказывают влияние следующие факторы: – температура испарения рения – фактор X1; – температура подложки, на которую производится осаждение рения – фактор X2; – температура термообработки изготовленных резистивных пленок рения – фактор X3. C учетом предварительных опытов выбираем: – центр плана X10=25000C; X20=4000C; X30=4000C; – шаг варьирования по всем трем факторам Δ X1=ΔX2=ΔX3=500C. – абсолютные значения верхнего уровня факторов, учитываемых в данном эксперименте (xi=+1): X10=25500C; X20=4500C; X30=4500C; – абсолютные значения нижнего уровня факторов, учитываемых в данном эксперименте(xi=-1): X10=24500C; X20=3500C; X30=3500C. Первоначально предположим, что искомая модель исследуемого процесса является линейной и может быть представлена полиномом 1-го порядка вида (6.3). В этом случае достаточно варьирования каждого из трех факторов (k=3) на двух уровнях и минимальное число опытов N=23=8. С целью ускорения проводимого эксперимента, принимаем решение о проведении двух параллельных опытов (n=2) для одних и тех же условий, представленных в каждой строке (значения верхнего 210 и нижнего уровней факторов), соответствующих номеру опыта, указанному в первом столбце матрицы. С учетом проведения параллельных опытов, их число увеличивается до N′=N·n и в данном случае составит 16. План эксперимента представим в виде таблицы 6.3, основные отличия которой от таблицы 6.2: – во 2-м столбце матрицы указан порядок проведения опытов, который определен с помощью таблицы случайных чисел (таблица А4 приложения А) для рандомизации неконтролируемых параметров исследуемого процесса; – все экспериментально полученные значения функции отклика первого и повторного опытов заносятся в столбцы 11, 12; – их средние значения подсчитываются по (6.7) и заносятся в 13-й столбец; – в 14-й столбец вносятся значения выборочных дисперсий экспериментальных значений функции отклика Yξi около их среднего значения Yξ , которые определяются по следующей формуле Sξ = 2 ∑ (Yξ n i =1 − Yξi ) 2 (n − 1), где n – количество значений Yξi , полученных в результате проведения n параллельных опытов; ξ=1, N. + + + + + + + + – + – + – + – + – – + + – – + + – – – – + + + + X1бX2бX3б 6 8 7 2 4 5 8 1 X2бX3б 3 4 1 8 7 6 2 5 X1бX3б 1 2 3 4 5 6 7 8 X0б X1б X2б X3б X1бX2б Номер опыта Порядок проведени я опыта Таблица 6.3 – Матрица планирования и результаты экспериментов при исследовании резистивных пленок рения Yξ1 Yξ2 + – – + + – – + + – + – – + – + + + – – – – + + – + + – + – – + 2,4 2,4 2,0 2,2 2,2 2,1 2,1 1,7 211 2,8 2,2 2,4 2,4 2,2 1,7 1,9 1,7 Yξ Sξ2 2,6 2,3 2,2 2,3 2,2 1,9 2,0 1,7 0,08 0,02 0,08 0,02 0 0,08 0,02 0 Порядок обработки и анализа результатов эксперимента следующий: 1. Дисперсии опытных значений функции отклика (ТКС резистивных пленок рения) около их средних значений в каждой строке матрицы рассчитаны по формуле (6.8) и приведены в 14-м столбце таблицы 6.3. Наибольшее ее значение (0,08) соответствует условиям проведения эксперимента, установленным 1-, 3- и 6-м номерами опыта. 2. Для проверки воспроизводимости эксперимента подсчитаем по формуле (6.9) значение критерия Кохрена G = S 2ξ max N Sξ ∑ ξ 2 = 0,08 0,3 = 0,266 . =1 Критичное его значение, для β=0,10 при n=2 (определяет Gкр по столбцу) и N=8 (по строке), равно Gкр=0,57 (таблица А3 приложения А). G<Gкр, следовательно эксперимент воспроизводим. 3. По (6.11) подсчитываем значение каждого коэффициента предполагаемой имитационной модели в виде полинома (6.3), на основании которой был спланирован и проведен эксперимент 8 b0 = ∑ X 0ξ Yξ 8 = (2,6 + 2,3 + 2,2 + 2,3 + 2,2 + 1,9 + 2,0 + 1,7 ) 8 = 2,15 ξ =1 8 b1 = ∑ X 1ξ Yξ 8 = (− 2,6 + 2,3 − 2,2 + 2,3 − 2,2 + 1,9 − 2,0 + 1,7 ) 8 = −0,1 ξ =1 8 b2 = ∑ X 2ξ Yξ 8 = (− 2,6 − 2,3 + 2,2 + 2,3 − 2,2 − 1,9 + 2,0 + 1,7 ) 8 = −0,1 ξ =1 8 b3 = ∑ X 3ξ Yξ 8 = (− 2,6 − 2,3 − 2,2 − 2,3 + 2,2 + 1,9 + 2,0 + 1,7 ) 8 = −0,2 ξ =1 8 b12 = ∑ X 12ξ Yξ 8 = (2,6 − 2,3 − 2,2 + 2,3 + 2,2 − 1,9 − 2,0 + 1,7 ) 8 = 0,05 ξ =1 8 b13 = ∑ X 13ξ Yξ 8 = (2,6 − 2,3 + 2,2 − 2,3 − 2,2 + 1,9 − 2,0 + 1,7 ) 8 = −0,05 ξ =1 8 b23 = ∑ X 23ξ Yξ 8 = (2,6 + 2,3 − 2,2 − 2,3 − 2,2 − 1,9 + 2,0 + 1,7 ) 8 = 0 ξ =1 212 8 b123 = ∑ X 123ξ Yξ 8 = (− 2,6 + 2,3 + 2,2 − 2,3 + 2,2 − 1,9 − 2,0 + 1,7 ) 8 = −0,05 ξ =1 После вычисления коэффициентов предполагаемой модели исследуемого процесса, оцениваем их значимость с помощью критерия Стьюдента, предварительно рассчитав значение t-параметра по формуле (6.11) для каждого коэффициента и соответствующей ему дисперсии ошибки определения этого коэффициента. Учитывая ортогональность матрицы планирования ПФЭ, приведенной в таблице 6.3, дисперсия ошибок каждого из коэффициентов будет одной и той же, определяемой по (6.13). Для вычисления дисперсии ошибки, предварительно нужно определить дисперсию воспроизводимости эксперимента (среднее значение всех оставшихся после проверки на воспроизводимость эксперимента дисперсий функции отклика в параллельных опытах – 14-й столбец таблицы 6.3) по формуле (6.14): 8 S 2{Y } = ∑ Sξ2 8 = 0,3 8 = 0,038. ξ =1 Тогда дисперсия ошибок определения коэффициентов полинома будет равна: S 2{b} = S 2{Y } (2 ⋅ 8) = 0,038 16 = 0,002 . Теперь по формуле (6.11) подсчитываем t-параметр для каждого коэффициента полинома: t0 = b0 S 2{b} = 2,15 0,045 = 47,78; t1 = b1 S 2{b} = 0,1 0,045 = 2,22; t2 = b2 S 2{b} = 0,1 0,045 = 2,22; t3 = b3 S 2{b} = 0,2 0,045 = 4,44; t12 = b12 S 2{b} = 0,05 0,045 = 1,11; t13 = b13 S 2{b} = 0,05 0,045 = 1,11; t23 = b23 S 2{b} = 0 0,045 = 0; t123 = b123 S 2{b} = 0,05 0,045 = 1,11; Определим критичное значение t-параметра по таблице А1 приложения А для ν=N(n–1)=8 и β=0,10; tкр=1,86. 213 Из сравнения найденного значения tкр с соответствующими значениями t-параметров, можно утверждать с уверенностью в нашей правоте в 9 случаях из 10, что коэффициенты b12, b13, b23 и b123 являются незначимыми. В этом случае эффектом взаимодействия учитываемых в эксперименте факторов можно пренебречь и уточненная имитационная модель, описывающая исследуемый процесс, примет вид Y=2,15 – 0,1X1 – 0,1X2 – 0,2X3. (6.16) Анализируя данную математическую модель можно сделать вывод, что самое большое влияние на функцию отклика оказывает третий фактор (температура термообработки готовых резистивных пленок рения), в то время, как влияние двух других факторов в два раза меньше. 4. После уточнения имитационной модели необходимо проверить ее на адекватность исследуемому процессу. Учитывая, что аппроксимирующий полином (6.16) содержит четыре члена (d=4), дисперсия адекватности, в соответствии с (6.14), будет иметь следующий вид: S 2 ад 8 = ∑ (Yξ − Yξt ) 2 ξ =1 (8 − 4), Но для расчета дисперсии адекватности первоначально необходимо определить теоретические значения функции отклика Yξt для каждого условия проведения опыта, соответствующего конкретному его номеру (ξ). Теоретические значения функции отклика определяются из полученной в результате эксперимента математической модели (6.16) подстановкой безразмерных значений соответствующих факторов Xi для каждого номера опыта. Так, для условий эксперимента, соответствующих первому опыту, как видно из таблицы 6.3, значения факторов будут: X1 = -1; X2 = -1; X3 = -1. Тогда теоретическое значение функции отклика для этих условий проведения опыта в соответствии с (6.16) будет равно Y1t =2,15 + 0,1 + 0,1 + 0,2=2,55. Аналогично для последующих номеров опытов получаем следующие значения: Y2t =2,15 – 0,1 + 0,1 + 0,2=2,35; Y3t =2,15 + 0,1 – 0,1 + 0,2=2,35; Y4t =2,15 – 0,1 – 0,1 + 0,2=2,15; Y5t =2,15 + 0,1 + 0,1 – 0,2=2,15; 214 Y6t =2,15 – 0,1 + 0,1 – 0,2=1,95; Y7t =2,15 + 0,1 – 0,1 – 0,2=1,95; Y8t =2,15 – 0,1 – 0,1 – 0,2=1,75. Сравнивая теоретические значения Yξt функции отклика с ее экспериментальными средними значениями, приведенными в 13-м столбце таблицы 6.3, можно подсчитать дисперсию адекватности (2,6 − 2,55)2 + (2,3 − 2,35)2 + (2,2 − 2,35)2 + (2,3 − 2,15)2 + S = (8 − 4 ) = 0,015. 2 2 2 2 + (2,2 − 2,15) + (1,9 − 1,95) + (2,0 − 1,95) + (1,7 − 1,75) 2 ад Таким образом, дисперсия адекватности Sад2 меньше дисперсии воспроизводимости эксперимента S2{Y}, следовательно, математическая модель (6.16) адекватна исследуемому процессу и может быть использована для его оптимизации путем шагового движения к экстремуму. Если бы Sад2 >S2{Y}, то следовало бы воспользоваться F-критерием. 6.5 Задачи для решения Приведены результаты проведения полного факторного эксперимента. Провести обработку и анализ результатов ПФЭ по рассмотренной методике. Вариант 1 Y1 Y2 3,004 3,031 5,193 5,152 3,927 3,950 7,141 7,099 4,684 4,697 9,135 9,123 6,371 6,403 14,67 14,68 2 0 Вариант 3 Y1 Y2 Y3 3,035 5,177 3,936 7,111 4,688 9,166 6,343 14,69 5 Y3 Y4 3,039 5,209 3,898 7,138 4,730 9,134 6,339 14,66 8 Y4 Y5 3,001 5,151 3,897 7,097 4,729 9,117 6,337 14,67 2 Y5 Вариант 2 Y1 Y2 3,651 3,605 6,547 6,514 4,761 4,793 9,515 9,566 5,828 5,847 13,04 13,08 1 1 8,364 8,371 25,57 25,56 5 3 Вариант 4 Y1 Y2 215 Y3 3,653 6,535 4,816 9,534 5,842 13,05 1 8,338 25,61 1 Y4 3,592 6,562 4,792 9,552 5,905 13,08 9 8,365 25,57 8 Y5 3,627 6,581 4,801 9,528 5,886 13,06 3 8,366 25,53 4 Y3 Y4 Y5 2,124 3,382 2,705 4,307 3,107 5,081 3,948 6,873 2,150 3,394 2,652 4,242 3,089 5,148 3,901 6,920 Вариант 5 Y1 Y2 3,072 3,028 5,193 5,159 3,932 3,955 7,094 7,126 4,740 4,704 9,163 9,167 6,336 6,396 14,67 14,66 6 8 Вариант 7 Y1 Y2 4,307 4,284 8,387 8,396 5,832 5,873 13,32 13,30 9 4 7,379 7,415 20,25 20,27 5 8 11,22 11,23 6 8 66,59 66,60 9 5 Вариант 9 2,139 2,140 3,368 3,374 2,655 2,674 4,276 4,317 3,096 3,119 5,123 5,092 3,914 3,951 6,932 6,858 Y3 3,080 5,163 3,893 7,149 4,668 9,160 6,369 14,72 5 Y3 4,284 8,430 5,856 13,32 8 7,415 20,30 4 11,27 1 66,58 8 Y4 3,049 5,220 3,915 7,102 4,698 9,133 6,405 14,72 2 Y4 4,316 8,389 5,843 13,34 0 7,368 20,27 9 11,23 4 66,59 5 2,157 3,372 2,713 4,255 3,137 5,073 3,919 6,869 Y5 3,069 5,168 3,939 7,158 4,724 9,191 6,357 14,74 1 Y5 4,286 8,404 5,862 13,31 2 7,368 20,26 1 11,27 3 66,56 2 2,588 4,191 3,201 5,509 3,793 6,718 4,963 9,738 2,597 4,165 3,231 5,453 3,830 6,752 4,966 9,753 2,542 4,152 3,202 5,448 3,850 6,760 5,001 9,702 2,537 2,539 4,129 4,138 3,199 3,248 5,511 5,445 3,789 3,852 6,709 6,743 4,952 5,007 9,746 9,737 Вариант 6 Y1 Y2 Y3 Y4 Y5 4,292 4,285 4,333 4,304 4,277 8,385 8,390 8,404 8,421 8,390 5,881 5,886 5,847 5,900 5,909 13,349 13,332 13,357 13,342 13,356 7,389 7,368 7,439 7,419 7,442 20,252 20,271 20,271 20,258 20,310 11,282 11,269 11,293 11,249 11,254 66,571 66,613 66,562 66,585 66,620 Вариант 8 Y1 Y2 Y3 Y4 Y5 3,583 3,605 3,623 3,623 3,587 6,555 6,564 6,523 6,559 6,511 4,795 4,790 4,776 4,798 4,744 9,504 9,530 9,524 9,557 9,530 5,855 5,839 5,827 5,881 5,863 13,040 13,011 13,045 13,061 13,036 8,328 8,301 8,303 8,319 8,310 25,586 25,544 25,578 25,562 25,556 Вариант 10 216 Y1 3,054 5,147 3,926 7,117 4,701 9,150 6,390 14,67 7 Y2 3,032 5,170 3,895 7,121 4,682 9,159 6,383 14,67 0 Вариант 11 Y1 Y2 2,164 2,165 3,347 3,338 2,639 2,658 4,281 4,251 3,086 3,084 5,082 5,128 3,950 3,932 6,855 6,870 Вариант 13 Y1 Y2 2,132 2,114 3,373 3,324 2,708 2,645 4,277 4,254 3,075 3,074 5,083 5,076 3,978 3,928 6,898 6,908 Y3 3,024 5,178 3,937 7,101 4,690 9,115 6,384 14,71 8 Y3 2,145 3,322 2,651 4,296 3,081 5,117 3,908 6,875 Y3 2,160 3,377 2,657 4,311 3,090 5,136 3,905 6,887 Y4 3,046 5,190 3,931 7,130 4,718 9,162 6,378 14,69 0 Y4 2,150 3,318 2,648 4,276 3,122 5,106 3,935 6,872 Y4 2,146 3,327 2,645 4,288 3,099 5,098 3,948 6,940 Y5 3,019 5,177 3,915 7,091 4,719 9,156 6,378 14,69 3 Y1 2,549 4,118 3,236 5,445 3,825 6,721 4,951 9,735 Y2 2,537 4,164 3,220 5,485 3,812 6,714 4,989 9,693 Y3 2,563 4,155 3,202 5,449 3,790 6,741 4,955 9,705 Y4 2,564 4,126 3,212 5,472 3,782 6,704 4,941 9,711 Y5 2,569 4,151 3,207 5,455 3,781 6,722 4,981 9,726 Y5 2,163 3,358 2,670 4,269 3,068 5,078 3,901 6,907 Вариант 12 Y1 Y2 1,983 1,951 3,004 3,024 2,435 2,415 3,767 3,794 2,788 2,823 4,491 4,467 3,485 3,510 5,883 5,879 Y3 1,969 2,984 2,428 3,784 2,815 4,492 3,515 5,863 Y4 1,981 2,983 2,394 3,783 2,777 4,473 3,524 5,870 Y5 1,935 3,007 2,438 3,803 2,773 4,460 3,475 5,877 Y5 2,120 3,385 2,657 4,265 3,096 5,140 3,904 6,904 Вариант 14 Y1 Y2 2,567 2,587 4,148 4,183 3,234 3,259 5,458 5,485 3,781 3,808 6,713 6,722 4,998 4,949 9,758 9,689 Y3 2,585 4,155 3,216 5,490 3,820 6,750 4,950 9,701 Y4 2,527 4,144 3,240 5,513 3,814 6,751 4,947 9,711 Y5 2,583 4,169 3,200 5,469 3,842 6,700 4,968 9,686 6.6 Контрольные вопросы 217 1. Что называется полным факторным экспериментами? 2. Как выбираются факторы планирования, их основные (базовые) уровни и интервалы варьирования? 3. Указать порядок проведения эксперимента методом ПФЭ. 4. Как составляется матрица планирования ПФЭ? 5. Как выбрать центр плана эксперимента? 6. Чем определяется величина интервала варьирования фактора? 7. Почему необходимо проведение параллельных опытов и их рандомизация? 8. Как зависит число уровней варьируемых факторов от порядка имитационной модели, представленной в виде полинома? 9. В чем заключается смысл разработки математической модели по принципу «от простого – к сложному»? 10. Каков порядок статистической обработки и анализа результатов эксперимента? 11. При каких условиях не соблюдается требование воспроизводимости эксперимента и как следует поступить в этом случае? 12. Как проверить значимость оценок коэффициентов регрессии? 13. Поясните различие применения критерия Стьюдента для оценки выборочных средних значений случайной величины и оценки значимости коэффициента полинома. 14. При каких условиях оценки коэффициентов регрессии незначимы и как эти условия устранить? 15. Как проверить адекватность математической модели? 16. При каких условиях не соблюдается требование адекватности математической модели и как следует поступить в этом случае? 218 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 7 7.1 Дробный факторный эксперимент При большом числе учитываемых в эксперименте факторов ПФЭ становится громоздким и занимает очень большое время для своего проведения, так как число опытов с ростом учитываемых в эксперименте факторов увеличивается по экспоненте. Но при этом уменьшаются ошибки при определении коэффициентов полинома, так как для оценки каждого из них используются все опыты. Число опытов можно сократить, если априорно известно, что на процесс не оказывают влияния те или иные взаимодействия. В этом случае можно использовать дробный факторный эксперимент (ДФЭ). Дробным факторным экспериментом называется эксперимент, реализующий часть (дробную реплику) полного факторного эксперимента. Предположим, что необходимо получить математическое описание процесса при трех учитываемых факторах X1, X2, и X3, оказывающих влияние на функцию отклика Y. При использовании ПФЭ для определения коэффициентов полинома 1-го порядка необходимо провести восемь (23) опытов в соответствии с матрицей планирования, приведенной в таблице 6.2. Число номеров опытов должно быть не менее числа коэффициентов полинома, в соответствии с которым планируется эксперимент. В данном случае предполагаемая математическая модель, описывающая исследуемый процесс, имеет вид полинома (6.5), содержащего восемь коэффициентов от b0 до b123. Однако, если взаимодействие между факторами X1, X2 и X3 отсутствует, можно воспользоваться матрицей планирования ПФЭ для двух факторов X1 и X2, приведенной в таблице 6.1, заменив в ней обозначение X1бX2б на X3б, соответствующее безразмерному значению фактора X3 на верхнем и нижнем его уровнях. Чередование знаков в этом столбце остается неизменным после замены символов в матрице планирования. Эксперимент в данном случае будет ставиться уже с включением третьего фактора, изменяющегося согласно столбцу X1бX2б ПФЭ (таблица 6.1), а предполагаемая математическая модель будет иметь вид полинома 1-го порядка, не учитывающего взаимодействия факторов, то есть 219 Y=b0+b1X1+b2X2+b3X3 (7.1) Такой сокращенный план содержит половину опытов от требуемого их числа 2k согласно плану ПФЭ (в данном случае четыре опыта вместо восьми) и называется полурепликой от ПФЭ типа 2k. Условное обозначение такого плана: ДФЭ типа 2k-L, где k – число учитываемых в эксперименте факторов; L – число взаимодействий, замененных факторами, учитываемых в эксперименте. Для рассматриваемого случая трех факторов X1, X2, X3 матрица планирования ДФЭ типа 23-1 (X3б=X1бX2б) будет иметь вид (табл. 7.1): Таблица 7.1 Матрица планирования ДФЭ типа 23-1 (X3б=X1бX2б) Номер опыта X0б X1б X2б X3б Yξ 1 + – – + Y1 2 + + – – Y2 3 + – + – Y3 4 + + + + Y4 Приведенное планирование эксперимента дает возможность при обработке и анализе его результатов оценить в полиноме (3.17) свободный член b0 и коэффициенты b1, b2, b3.Однако при этом предполагается, что коэффициенты b12, b13, b23, b123 в полиноме (6.5) равны нулю. Поэтому составление такой матрицы планирования эксперимента возможно лишь в том случае, если полностью отсутствует или пренебрежительно мало влияние на функцию отклика эффектов взаимодействия факторов исследуемого процесса. Только в этом случае математическая модель, представленная полиномом, в котором отсутствуют члены, учитывающие эти взаимодействия (так как соответствующие им коэффициенты равны нулю), может быть адекватна исследуемому процессу. При использовании матрицы планирования ДФЭ мы получаем совместную оценку нескольких эффектов: факторов и их взаимодействий: X1б=X2бX3б, X2б=X1бX3б, X3б=X1бX2б (7.2) 220 Поэтому подсчитываемые значения линейных коэффициентов b1, b2, b3 полинома по экспериментальным значениям функции отклика будут включать также значения коэффициентов, учитывающих эффект влияния взаимодействия факторов на функцию отклика. В результате коэффициенты полином (7.1) будут иметь следующий вид: b'1 = b1+b23, b'2 = b2+b13, (7.3) b'3 = b3+b12, где b1, b2, b3 – действительные значения линейных коэффициентов полинома; b'1, b'2, b'3 – полученные их значения при наличии эффекта влияния взаимодействия факторов на функцию отклика. Для получения математической модели вида (7.1), адекватной исследуемому процессу, необходимо быть уверенным в отсутствии влияния взаимодействия факторов на экспериментальное значение функции отклика. Только при этом условии подсчитанные коэффициенты b'i будут искомыми значениями линейных коэффициентов bi. Если это условие не выполняется, то найденные значения линейных коэффициентов b'i будут отличаться от действительного значения bi на величину коэффициента bij , учитывающего эффект влияния парного взаимодействия двух других факторов (7.3). Эти эффекты не могут быть раздельно оценены при планировании, состоящем только из одной полуреплики ПФЭ. Раздельную оценку для линейных коэффициентов bi и коэффициентов bij можно провести, если поставить дополнительно еще четыре опыта в соответствии с матрицей планирования ДФЭ типа 23-1, приравнивая X3б= – X1бX2б, тогда матрица будет иметь вид (таблица 7.2): Таблица 7.2 –Матрица планирования ДФЭ типа 23-1 (X3б= – X1бX2б) Номер опыта X0б X1б X2б X3б Yξ 1 + – – – Y1 2 + + – + Y2 3 + – + + Y3 4 + + + – Y4 221 Подсчитанные коэффициенты b'i линейных членов полинома (7.1) будут включать реальные значения коэффициентов b12, b13, b23, но в отличии от (7.3) совместная оценка коэффициентов будет происходить с обратным знаком: b''1 = b1 – b23, b''2 = b2 – b13, (7.4) b''3 = b3 – b12. Изменение знака объясняется тем, что для матрицы ДФЭ 23-1 взаимозависимость значений факторов имеет вид X1б = -X2бX3б, X2б = -X1бX3б, X3б = -X1бX2б (7.5) Теперь после постановки уже восьми опытов в соответствии с приведенными планами можно записать раздельные оценки b1=(b'1+b''1)/2; b2=(b'2+b''2)/2; b3=(b'3+b''3)/2; (7.6) b23=(b'1–b''1)/2; b13=(b'2–b''2)/2; b12=(b'3–b''3)/2. Таким образом, для получения раздельных оценок bi и bij необходимо было провести восемь опытов, то есть пришлось объединить две полуреплики от ПФЭ типа 23. Поэтому практически всегда имеет смысл начинать исследования с ДФЭ. Если в дальнейшем появятся сомнения в том, что какие-либо взаимодействия, ранее не включенные в план эксперимента, могут влиять на выходной параметр, то всегда имеется возможность расширить матрицу планирования до ДФЭ меньшей дробности или ПФЭ и найти раздельную оценку интересующих эффектов. В случае применения матриц планирования ДФЭ для исследования процессов, содержащих более трех факторов, нужно стремиться к тому, чтобы максимальное число линейных факторов оказалось не смешанным с парными взаимодействиями. Чем более высокие уровни взаимодействия будут заменены факторами из числа рассматриваемых в эксперименте, тем более высоким уровнем разрешающей способности для раздельной оценки коэффициентов полинома будет обладать матрица ДФЭ. Для формализации процедуры определения разрешающей способности дробной реплики, представленной в виде матрицы планирования ДФЭ при фиксированных k и l, вводятся понятия генерирующего соотношения (ГС) и определяющего контраста (ОК). В примере с тремя факторами X1, X2 и X3 генерирующими соотношениями являются X3б=X1бX2б и X3б= – X1бX2б, каждое из 222 которых характеризует соответствующую полуреплику от ПФЭ типа 23. Выражения ОК получаются умножением левой и правой частей приведенных ГС на их левую часть, то есть на X3б. При этом получаются элементы столбца матрицы планирования ДФЭ, соответствующие свободному члену b0 полинома, которые всегда равны единице, так как X2iб=1: 1 = X1бX2б X3б; 1 = – X1бX2б X3б. Определяющие контрасты позволяют определить всю систему совместных оценок факторов и взаимодействий, не изучая матрицы планирования. Для этого последовательно умножают обе части ОК на соответствующие эффекты и получают всю картину совместных оценок данной матрицы ДФЭ. Имея систему совместных оценок, можно формализовать процедуру построения плана ДФЭ, обеспечивающего высокую разрешающую способность при определении коэффициентов полинома. Чтобы получить высокую разрешающую способность, стремятся таким образом построить план ДФЭ, чтобы линейные факторы были смешаны с взаимодействиями самого высокого порядка (они чаще бывают равными нулю) или с теми взаимодействиями, о которых априорно известно, что они не оказывают влияния на процесс. Оценить разрешающую способность помогает ГС, чем больше символов входит в ГС, тем обычно выше разрешающая способность. По мере возрастания числа учитываемых в исследуемом процессе факторов можно применять реплики большей степени дробности (1/4, 1/8 и т.д.). При этом с ростом числа независимых переменных (учитываемых факторов) растет разрешающая способность дробных реплик, так как для линейной имитационной модели (3.3), соответственно возрастает порядок взаимодействия факторов и количество членов полинома, учитывающих эти взаимодействия, а следовательно, увеличивается точность оценки коэффициентов при линейных членах, смешанных с взаимодействиями высокого порядка. Число опытов, проводимых в соответствии с матрицей дробной реплики для раздельной оценки коэффициентов полинома, должно быть не менее числа коэффициентов в предполагаемой имитационной модели, включая коэффициент b0. 223 Реализация плана ДФЭ ничем не отличается от реализации плана ПФЭ. Обработку и анализ результатов дробного факторного эксперимента проводят в полном соответствии с методикой, изложенной для ПФЭ. 7.2 Решение типового примера Если в эксперименте рассматриваются четыре фактора (k=4), то в предполагаемой линейной имитационной математической модели, соответствующей полиному первого порядка, имеем Y=b0+b1X1+b2X2+b3X3+b4X4+b12X1X2+b13X1X3+ +b14X1X4+b23X2X3+b24X2X4+b34X3X4+b123X1X2X3+ (7.7) +b124X1X2X4+b234X2X3X4+b134X1X3X4+b1234X1X2X3X4. При планировании ПФЭ типа 24, необходимо было бы провести минимум 16 опытов для определения 16-ти коэффициентов, входящих в полином (7.6). Полуреплика от этого плана ПФЭ будет включать 8 опытов, а соответствующую матрицу ДФЭ типа 24-1 можно построить на базе матрицы планирования ПФЭ типа 23, заменив одно из взаимодействий, приведенных в таблице 6.2, на четвертый фактор. Рассмотрим в качестве генерирующих соотношений одно, из числа низкого порядка, например X4=X1X2, а другое – из числа самого высокого порядка, в данном случае X4=X1X2X3. На основании выбранных ГС найдем соответствующие ОК: 1=X1X2X4; 1=X1X2X3X4. С помощью найденных ОК составим две системы совместных оценок: X1=X2X4, X1=X2X3X4, X2=X1X4, X2=X1X3X4, X3=X1X2X3X4, X3=X1X2X4, X4=X1X2, X4=X1X2X3, X1X3=X2X3X4, X1X2=X3X4, X2X3=X1X3X4, X1X3=X2X4, X3X4=X1X2X3, X2X3=X1X4. Приведенные оценки двух полуреплик от ПФЭ 24 получены для двух выбранных ГС, когда взаимодействия факторов 224 приравниваются к независимой переменной (в данном случае, к четвертому линейному фактору X4). При ГС X4=X1X2 (левая колонка системы совместных оценок), член, учитывающий парное взаимодействие факторов X1 и X2 (b12X1X2) будет заменен в уравнении (6.5), а следовательно, и в матрице (таблица 6.2), на член, учитывающий влияние четвертого фактора X4 на функцию отклика, что соответствует плану ДФЭ 24-1 и имитационной математической модели вида Y=b0+b1X1+b2X2+b3X3+b4X4+b13X1X3+b23X2X3+b123X1X2X3 (7.8) Для ГС X4=X1X2X3 план ДФЭ 24-1 будет соответствовать модели вида Y=b0+b1X1+b2X2+b3X3+b4X4+b12X1X2+b13X1X3+b23X2X3 (7.9) В обоих случаях потребуется провести 8 опытов для определения 8 коэффициентов, входящих в уравнения (7.8) и (7.9). Однако разрешающая способность дробной реплики ГС X4=X1X2X3 для раздельной оценки коэффициентов b1, b2, b3, b4 при линейных членах полинома будет выше потому, что все линейные факторы не смешаны с парными взаимодействиями, в то время, как для ГС X4=X1X2 три из четырех линейных факторов смешаны с парными взаимодействиями. 7.3 Задачи для решения В таблице приведены результаты проведения дробного факторного эксперимента. Провести обработку и анализ результатов ДФЭ по рассмотренной методике. Вариант 1 Y1 Y2 2,132 2,114 3,373 3,324 3,978 3,928 6,898 6,908 Y3 Y4 2,160 2,146 3,377 3,327 3,905 3,948 6,887 6,940 Y5 2,120 3,385 3,904 6,904 Вариант 3 Y1 Y2 Y3 Y4 Y5 2,164 2,165 2,145 2,150 2,163 Вариант 2 Y1 Y2 2,567 2,587 4,148 4,183 4,998 4,949 9,758 9,689 Y3 Y4 2,585 2,527 4,155 4,144 4,950 4,947 9,701 9,711 Y5 2,583 4,169 4,968 9,686 Вариант 4 Y1 Y2 Y3 Y4 Y5 2,788 2,823 2,815 2,777 2,773 225 3,347 3,338 3,322 3,318 3,358 3,950 3,932 3,908 3,935 3,901 6,855 6,870 6,875 6,872 6,907 4,491 4,467 4,492 4,473 4,460 3,485 3,510 3,515 3,524 3,475 5,883 5,879 5,863 5,870 5,877 Вариант 5 Y1 Y2 3,054 3,032 5,147 5,170 3,926 3,895 7,117 7,121 Вариант 6 Y1 Y2 2,549 2,537 4,118 4,164 3,236 3,220 5,445 5,485 Y3 Y4 2,563 2,564 4,155 4,126 3,202 3,212 5,449 5,472 Y5 2,569 4,151 3,207 5,455 Вариант 8 Y1 Y2 3,583 3,605 6,555 6,564 4,795 4,790 9,504 9,530 Y3 Y4 3,623 3,623 6,523 6,559 4,776 4,798 9,524 9,557 Y5 3,587 6,511 4,744 9,530 Y3 Y4 3,024 3,046 5,178 5,190 3,937 3,931 7,101 7,130 Вариант 7 Y1 Y2 4,307 4,284 8,387 8,396 5,832 5,873 13,32 13,30 9 4 Вариант 9 Y1 Y2 3,072 3,028 5,193 5,159 3,932 3,955 7,094 7,126 Вариант 11 Y1 Y2 2,124 2,150 3,382 3,394 2,705 2,652 4,307 4,242 Вариант 13 Y1 Y2 Y3 4,284 8,430 5,856 13,32 8 Y4 4,316 8,389 5,843 13,34 0 Y3 Y4 3,080 3,049 5,163 5,220 3,893 3,915 7,149 7,102 Y3 Y4 2,139 2,140 3,368 3,374 2,655 2,674 4,276 4,317 Y3 Y5 3,019 5,177 3,915 7,091 Y4 Y5 4,286 8,404 5,862 13,31 2 Y5 3,069 5,168 3,939 7,158 Вариант 10 Y1 Y2 4,292 4,285 8,385 8,390 5,881 5,886 13,34 13,33 9 2 Y5 2,157 3,372 2,713 4,255 Вариант 12 Y1 Y2 2,588 2,597 4,191 4,165 3,201 3,231 5,509 5,453 Y5 Вариант 14 Y1 Y2 226 Y3 4,333 8,404 5,847 13,35 7 Y4 4,304 8,421 5,900 13,34 2 Y3 Y4 2,542 2,537 4,152 4,129 3,202 3,199 5,448 5,511 Y3 Y4 Y5 4,277 8,390 5,909 13,35 6 Y5 2,539 4,138 3,248 5,445 Y5 3,004 5,193 3,927 7,141 3,031 5,152 3,950 7,099 3,035 3,039 5,177 5,209 3,936 3,898 7,111 7,138 3,001 5,151 3,897 7,097 3,651 6,547 4,761 9,515 3,605 6,514 4,793 9,566 3,653 3,592 6,535 6,562 4,816 4,792 9,534 9,552 3,627 6,581 4,801 9,528 7.4 Контрольные вопросы 1. Что называется дробным факторным экспериментами? 2. В каких случаях возможно планирование ДФЭ? 3. Как можно оценить разрешающую способность матрицы ДФЭ? 4. Что такое генерирующее соотношение и как оно выбирается? 5. Что такое определяющий контраст и как с его помощью составляется система совместных оценок? 6. Указать преимущества факторного планирования эксперимента перед другими способами проведения активного эксперимента и пассивным экспериментом? 227 ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 8 8 ЦЕНТРАЛЬНЫЕ КОМПОЗИЦИОННЫЕ ПЛАНЫ Разработка математической модели предусматривает принцип «от простого к более сложному», то есть постепенный переход исследователя от «грубой» модели к моделям, более точно описывающим исследуемый процесс. В имитационной модели, соответствующей полиному (6.1), этот принцип предусматривает в качестве следующего шага переход от полинома 1-го порядка вида (3.3) к полиному 2-го порядка (6.7). Шаговое движение к экстремуму продолжается до тех пор, пока исследователь не достигнет области, близкой к экстремуму (или «почти стационарной»), которая не может быть описана линейным приближением. Здесь уже становятся значимыми квадратичные эффекты. Близость к «почти стационарной» области можно установить, поставив ряд экспериментов в центре плана, определив среднее значение функции отклика Y0 и сравнить его с теоретическим значением b0, исходя из предполагаемой имитационной модели в виде полинома 1-го порядка (6.3). Вычисляемое для линейного уравнения значение b0 при реализации факторного эксперимента (ПФЭ и ДФЭ) в «почти стационарной» области является совместной оценкой для свободного члена и суммы квадратичных членов, так как безразмерные значения, стоящие в соответствующих столбцах матрицы ПФЭ, будут одинаковыми. Поэтому разность b0– Y0 может дать представление о кривизне поверхности отклика. «Почти стационарную» область обычно удается описать с достаточной точностью полиномом 2-го порядка (6.7). Как уже говорилось в практическом занятии №6 число уровней изменения каждой из независимых переменных должно быть на единицу больше порядка полинома. Поэтому при увеличении числа учитываемых факторов применение ПФЭ типа 3k не рационально, так как это планирование характеризуется резким увеличением объема эксперимента. Сократить число опытов можно, используя центральные композиционные планы (ЦКП), ядром которых являются линейные ортогональные планы. Преимущество этих планов – для получения модели более высокого порядка достаточно добавить несколько 228 специально спланированных экспериментальных точек к уже существующим (в которых был проведен ДФЭ или ПФЭ). Общее число опытов центрального композиционного плана при k факторах составит N = NФЭ + Nα + N0, (8.1) k где NФЭ = 2 – число точек ПФЭ или ДФЭ; Nα = 2k –число «звездных точек»; N0 – число опытов в центре плана. Пример Построение ЦКП можно объяснить на примере с тремя независимыми переменными, соответствующими трем факторам X1, X2, X3. Предположим, что для нахождения линейной модели применен ПФЭ 23, экспериментальные точки которого находятся в вершинах куба (рисунок 5.1). В результате анализа экспериментальных данных установлено, что имитационная математическая модель в виде полинома 1-го порядка не адекватна исследуемому процессу. X2 (-1;1;-1) α (-1;1;1) (1;1;-1) (1;1;1) (0;0;0) (-1;-1;-1) (-1;-1;1) X1 (1;-1;-1) α (1;-1;1) α X3 Рисунок 8.1 – Расположение экспериментальных точек в плане, соответствующем полиному 2-го порядка для трех независимых переменных Тогда в центре плана проводится опыт, условия которого в матрице планирования эксперимента отображаются нулями для безразмерных величин всех факторов. Для повышения достоверности полученного 229 экспериментального значения функции отклика Y0 в центре плана, опыты повторяют при неизменных нулевых значениях факторов. Подсчитанное среднее значение функции отклика Y0 сравнивают с теоретическим значением b0. При подтверждении неадекватности линейной модели ставятся дополнительные опыты для значений факторов, превышающих их абсолютные значения по верхнему и нижнему уровням. Таким образом, в ПФЭ 23, к ранее проведенным восьми опытам добавляются еще семь опытов (включая опыт в центре плана), шесть из которых соответствуют «звездным точкам». «Звездные точки» (рисунок 8.1) представляют собой два уровня варьирования, каждым из трех факторов, значения которых лежат за пределами граней куба. Как видно на рисунке 8.1, все «звездные точки» расположены на расстоянии большем, чем ±1 от центра плана и лежат на поверхности сферы диаметром 2α. При построении планов используют различные критерии оптимальности планирования. Наиболее широкое применение получили следующие планы: – ортогональные; – рототабельные; – D-оптимальные. При ортогональном планировании коэффициенты уравнения полинома оцениваются независимо с минимальными дисперсиями, причем факторы с незначимыми коэффициентами можно сразу отбрасывать, без пересчета оставшихся значимых коэффициентов, как это необходимо при неортогональных планах. Рототабельные планы позволяют получать уравнения регрессии, предсказывающие значения выходной величины объекта с одинаковой точностью во всех направлениях на одинаковом расстоянии от центра плана. Точность оценивания коэффициентов полинома характеризуется эллипсоидом рассеяния их оценок. Планирование, при котором требуется, чтобы объем эллипсоида рассеяния оценок коэффициентов был минимальным, называется D-оптимальным. 8.1 Центральный композиционный ортогональный план 230 (ЦКОП) Планирование и проведение эксперимента При составлении матрицы планирования эксперимента этот план предусматривает проведение только одного опыта, условия которого соответствуют начальным значениям всех учитываемых факторов (в центре плана), то есть N0 = 0. Поэтому для ЦКОП выражение (8.1) примет вид N = 2k + 2k + 1, (8.2) Соответствующая матрица ЦКОП для имитационной модели исследуемого процесса, соответствующая полиному 2-го порядка при k=3, приведена в таблице 8.1. Условие ортогональности матрицы выполняется только для линейных членов соответствующего полинома 2-го порядка, представляющего собой имитационную модель вида Y = b0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+ (8.3) 2 2 2 +b23X2X3+b123X1X2X3+b11X 1+b22X 2+b33X 3 Для приведения матрицы к ортогональному виду необходимо провести преобразование квадратичных переменных X2iξб. X где 2 iξбп =X 2 iξ б −X 2 iб =X 2 iξ б N − ∑ X i2ξб ξ =1 N , (8.4) X i2ξбп – преобразованное (п) безразмерное (б) квадратичное значение i-го фактора, соответствующее ξ-му опыту. Для выполнения условия ортогональности матрицы ЦКОП, помимо преобразования столбцов, соответствующих квадратичным членам полинома (8.3), и приведения значений, стоящих в них, к виду (8.4), необходимо величину звездного плеча α выбирать соответственно: при k < 5 α4+2kα2-2k-1(k+0,5)=0; (8.5) при k ≥ 5 α4+2k-1α2-2k-2(k+0,5)=0. (8.6) 231 X1бX2бX3б X2бX3б X1бX3б X0б X1б X2б X3б X1бX2б Группы точек Номер опыта Таблица 8.1 – Матрица центрального композиционного ортогонального плана X21б X22б X23б Yξ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 NПФЭ Nα N0 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 –1 +1 –1 +1 –1 +1 –1 +1 –α +α 0 0 0 0 0 –1 –1 +1 +1 –1 –1 +1 +1 0 0 –α +α 0 0 0 –1 –1 –1 –1 +1 +1 +1 +1 0 0 0 0 –α +α 0 +1 –1 –1 +1 +1 –1 –1 +1 0 0 0 0 0 0 0 +1 –1 +1 –1 –1 +1 –1 +1 0 0 0 0 0 0 0 +1 +1 –1 –1 –1 –1 +1 +1 0 0 0 0 0 0 0 –1 +1 +1 –1 +1 –1 –1 +1 0 0 0 0 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 +α2 +α2 0 0 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 0 0 +α2 +α2 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 0 0 0 0 +α2 +α2 0 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y15 Ядро ЦКОП при k<5 составляет, как правило, ПФЭ типа 2k, а при k≥5 – ДФЭ типа 2k-1, так как во втором случае полуреплика от ПФЭ вполне обеспечивается возможность независимой оценки линейных членов полинома (8.3) и членов, учитывающих эффект взаимодействия факторов. Значения звездного плеча, подсчитанные на основании условий (8.5) и (8.6), приведены в таблице 8.2. Таблица 8.2 – Значения звездного плеча ЦКОП k 2 3 4 5 1,00 1,215 1,414 1,547 α 6 1,724 7 1,885 Преобразовав соответствующим образом матрицу ЦКОП, приведенную в таблице 8.1, получим матрицу ЦКОП, которая полностью соответствует условию ортогональности (таблица 8.3) X2б X3б X1бX2б X1бX2бX3б X1б +1 +1 –1 +1 –1 –1 –1 –1 +1 +1 +1 –1 0,27 0,27 0,27 Y1 –1 –1 +1 +1 0,27 0,27 0,27 Y2 232 X2бX3б X0б Номер опыта 1 2 X1бX3б Таблица 8.3 – Преобразованная матрица ЦКОП, отвечающая требованиям ортогональности X21б X22б X23б Yξ 3 4 5 6 7 8 9 10 11 12 13 14 15 +1 –1 +1 –1 –1 +1 +1 +1 –1 +1 +1 –1 –1 +1 +1 +1 +1 –1 +1 –1 +1 –1 +1 +1 –1 +1 +1 +1 +1 +1 +1 –1,215 0 0 0 +1 +1,215 0 0 0 +1 0 –1,215 0 0 +1 0 +1,215 0 0 +1 0 0 –1,215 0 +1 0 0 +1,215 0 +1 0 0 0 0 +1 –1 –1 +1 –1 +1 0 0 0 0 0 0 0 –1 –1 –1 –1 +1 +1 0 0 0 0 0 0 0 +1 –1 +1 –1 –1 +1 0 0 0 0 0 0 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,27 0,75 –0,73 –0,73 0,75 –0,73 –0,73 –0,73 0,75 –0,73 –0,73 0,75 –0,73 –0,73 –0,73 0,75 –0,73 –0,73 0,75 –0,73 –0,73 –0,73 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y15 Для приведенной в таблице 8.3 матрицы ЦКОП будет соответствовать имитационную модель следующего вида Y = b′0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+b23X2X3+ (8.7) 2 2 2 2 2 2 +b123X1X2X3+b11(X 1– X1 )+b22(X 2– X 2 )+b33(X 3– X 3 ). Для перехода от модели (8.7) к модели (8.3), необходимо пересчитать коэффициент b0, который будет в (8.3) определяться b′0= b′0 – b11 X1б2 – b22 X 2б2 – b33 X 3б2 или, в общем виде k b0 = b − ∑ bii X iб2 . ' 0 (8.8) i =1 Если выполняется условие (8.8), можно пользоваться полиномом 2-го порядка в общем виде для проведения эксперимента в соответствии с преобразованной матрицей ЦКОП. При применении ЦКОП получение идентичной информации во всех направлениях исследуемого пространства невозможно, так как дисперсии ошибок определения коэффициентов полинома различны, то есть точность предсказания выходной величины (значения функции отклика Y) в различных направлениях факторного пространства неодинакова – информационные поверхности не являются сферами. Обработка и анализ результатов эксперимента 233 Обработка и анализ результатов для ЦКОП проводятся в том же порядке, как и для ПФЭ, с аналогичными формулами для оценки дисперсий среднего арифметического (6.8) и адекватности (6.14). Исключение составляют формулы для расчета коэффициентов полинома (6.10) и дисперсии их определения (6.12). В силу ортогональности матрицы ЦКОП все коэффициенты имитационной модели в виде полинома 2-го порядка определяются, как и для ПФЭ, независимо друг от друга. Но если при подсчете коэффициентов в соответствии с (6.10) в знаменателе используется одно и то же значение N (число номеров опытов), то в ЦКОП расчет коэффициентов полинома ведется по формуле N bi = ∑ ( X iξ Yξ ) ξ =1 N Xξ, ∑ ξ =1 2 i (8.9) где i = 1,2,…,k. Это означает, что при определении коэффициентов полинома в соответствии с выражением (8.9) значение знаменателя для различных групп коэффициентов будет различным. Для непреобразованной матрицы в соответствии с таблицей 8.1 значения знаменателей следующие: – для b0 15 X ∑ ξ =1 2 i 0ξ = 15; – для группы коэффициентов при линейных членах Xi полинома 15 X ξ = 8 + 2α ∑ ξ =1 2 i 2 ; – для группы коэффициентов XiXj или X1X2X3, учитывающих взаимодействие факторов (X ∑ ξ 15 =1 X j )ξ = 8; 2 i – для коэффициентов при квадратичных членах Xi2 полинома 15 ( X )ξ ∑ ξ =1 2 i = 8 + 2α 4 . Соответственно формула для расчета дисперсии найденных по (8.9) коэффициентов полинома, будет иметь вид n S 2 {bi } = S 2 {Y } n∑ X i2ξ . ξ =1 (8.10) Расчет дисперсии воспроизводимости эксперимента S2{Y} при оценке дисперсий коэффициентов в (8.10) производится по формуле 234 (6.13). Из сравнения (8.10) и (6.2) видно, что в ЦКОП дисперсия коэффициентов полинома будет различной для различных групп, в то время, как для линейной модели она постоянна. Для непреобразованной матрицы оценку дисперсии для всех групп коэффициентов легко получить, учитывая приведенные выше значения знаменателя в (8.9). Для приведенной матрицы ЦКОП в соответствии с таблицей 8.3 оценка дисперсии различных коэффициентов в общем виде может быть представлена, как S 2 {b0 } = S 2 {Y } (nN ). (8.11) k При k<5, когда ЦКОП базируется на ПФЭ типа 2 . S 2 {bi } = S 2 {Y } [n(2 k + 2α 2 )] , (8.12) S 2{bij } = S 2{Y } (n2k ) , (8.13) S 2{bii } = S 2{Y } {n[2k (1 − X i2 ) 2 + 2(α 2 − X i2 ) 2 + ( X i2 ) 2 ]}, (8.14) N 2 где X = ∑ X iξ N . 2 i ξ =1 При k≥5, когда ЦКОП базируется на ДФЭ типа 2k–1. S 2{bi } = S 2{Y} n( 2 k −1 + 2α 2 ) , [ ] S 2{bij } = S 2{Y } (n2k −1 ) , (8.15) (8.16) S 2{bii } = S 2{Y } {n[2 k −1 (1 − X i2 ) 2 + 2(α 2 − X i2 ) 2 + ( X i2 ) 2 ]}. (8.17) С учетом выражений (5.11)–(5.17) значение t-параметра, подсчитанное по (3.11), будет отличаться знаменателем для различных групп коэффициентов полинома. А это означает, что в отличие от линейного приближения, при ортогональном планировании на базе полинома второго порядка оценка значимости найденных коэффициентов полинома ЦКОП будет проводиться с различной точностью. Это означает, что точность определения математической модели исследуемого процесса во всех направлениях факторного пространства не одинакова. Различие в точности оценок коэффициентов полинома при описании областей, близких к экстремуму, особенно нежелательно, так как при планировании экстремальных экспериментов необходимо иметь высокую точность описания процесса именно в этих областях. В этом случае более удачным является центральное композиционное рототабельное планирование. 235 8.2 Центральный композиционный рототабельный план (ЦКРП) Планирование и проведение эксперимента При центральном композиционном рототабельном планировании информационная поверхность приближается к сферической, то есть точность Y во всех направлениях на одинаковом расстоянии R от центра планирования становится практически одинаковой S2{Y}→const при R=const. При этом, ЦКРП позволяет минимизировать ошибки в определении Y, связанные с адекватностью представления результатов исследования процесса имитационной моделью в виде полинома 2-го порядка. Это достигается тем, что, выбирая удаленные от центра плана «звездные точки» на осях координат для непрерывности информационной поверхности, они дополняются информацией из центра плана, представляющей собой сферу с нулевым радиусом, то есть информацией равноточной во всех направлениях. Удельный вес этой информации в общем объеме информации увеличивается, что достигается увеличением числа опытов (N0) в центре плана. Число опытов в центре плана зависит от числа учитываемых в эксперименте факторов, то есть N0 = f(k). При k=3 число опытов в центре плана N0=6 совпадает с числом звездных точек. Это приводит к увеличению числа опытов по сравнению с ЦКОП, но обеспечивает непрерывность информационной поверхности и ее идентичность независимо от поворота осей координат. При реализации рототабельных планов можно отказаться от постановки параллельных опытов для оценки воспроизводимости экспериментов, что уменьшает общее число опытов по сравнению с ЦКОП. Дисперсия воспроизводимости может быть оценена в этом случае по экспериментам в центре плана. Чтобы композиционный план был рототабельным, величина звездного плеча α выбирается из следующих условий: α=2k/4 при k<5; (8.18) α=2(k–1)/4 при k≥5. (8.19) Подсчитанные значения звездного плеча α и число центральных 236 точек N0, в зависимости от числа учитываемых в эксперименте факторов, приведены в таблице 8.4. Таблица 8.4 – Значения звездного плеча и числа центральных точек ЦКРП k 2 3 4 5 6 7 α 1,414 1,682 2,00 2,00 2,38 2,83 N0 5 6 7 6 9 11 Для k=3 и соответственно N0=6 выражение (8.1) примет вид: N=2k+2k+6. (8.20) Тогда матрица планирования ЦКРП для k=3 будет иметь следующий вид (таблица 8.5). Из выражения (8.20) следует, что для трех учитываемых в эксперименте факторов X1, X2, X3 в ЦКРП потребуется проведение не менее 20 опытов (таблица 8.5) по сравнению с 15-ю опытами в случае применения ЦКОП (таблица 8.1). Причем, все эти дополнительные пять опытов проводятся в центре плана. Матрица ЦКРП не соответствует условиям ортогональности для столбцов с квадратичными членами полинома (8.3), поэтому оценка коэффициентов не будет являться независимой. Но этот недостаток ЦКРП компенсируется более высокой точностью определения Y во всех направлениях на одинаковом расстоянии R от центра плана. При этом следует учитывать, что ЦКРП использует независимую оценку коэффициентов полинома при линейных его членах, проведенную по результатам предыдущего полного или дробного факторного эксперимента. X1бX3б X2бX3б X1бX2бX3б NПФЭ 1 2 3 4 5 6 7 8 X0б X1б X2б X3б X1бX2б Групп ы Номер опыта Таблица 8.5– Матрица ЦКРП +1 +1 +1 +1 +1 +1 +1 +1 +1 –1 –1 +1 +1 –1 –1 +1 +1 –1 +1 –1 –1 +1 –1 +1 +1 +1 –1 –1 –1 –1 +1 +1 –1 +1 +1 –1 +1 –1 –1 +1 –1 +1 –1 +1 –1 +1 –1 +1 –1 –1 +1 +1 –1 –1 +1 +1 –1 –1 –1 –1 +1 +1 +1 +1 237 X21б X22б X23б Yξ +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 9 10 11 12 13 14 15 16 17 18 19 20 Nα N0 +α 0 0 –α 0 0 0 +α 0 0 –α 0 0 0 +α 0 0 –α 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 α2 α2 0 0 0 0 0 0 0 0 0 0 0 0 α2 α2 0 0 0 0 0 0 0 0 0 0 0 0 α2 α2 0 0 0 0 0 0 Y9 Y10 Y11 Y12 Y13 Y14 Y15 Y16 Y17 Y18 Y19 Y20 Обработка и анализ результатов эксперимента Обработка и анализ результатов ЦКРП отличается от ранее рассмотренных только в подсчете коэффициентов полинома и их дисперсий. Дисперсию воспроизводимости оценивают по экспериментам в центре плана, число которых значительно больше, чем в ЦКОП. Формулы для расчета коэффициентов полинома и их дисперсий при рототабельном планировании сложнее, чем при ортогональном: N k N b0 = ( A / N ) 2λ2 (k + 2)∑ ( X 0ξ Yξ ) − 2λC ∑∑ ( X i2ξ Yξ ); ξ =1 i =1 ξ =1 (8.21) N bi = (C / N )∑ ( X iξ Yξ ); (8.22) ξ =1 N bij = [C 2 ( Nλ )]∑ ( X iξ X iξ Yξ ); (8.23) ξ =1 N k N N bii = ( A / N ) C 2 [(k + 2)λ − k ]∑ ( X i2ξ Yξ ) − C 2 (1 − λ )∑∑ ( X i2ξ Yξ )− 2λC ∑ ( X 0ξ Yξ ); (8.24) i =1 ξ =1 ξ =1 ξ =1 { ( ) S {b } = (CS {Y }) (Nn ); S {b } = (A[(k + 1)λ − (k − 1)C S {Y }]) (Nn ); S {b } = (C S {Y }) (λNn ). S 2 {b0 } = 2 Aλ2 (k + 2) S 2 {Y } (Nn ); 2 2 i 2 2 2 ii 2 2 2 ij где C=N N X ξ; ∑ ξ =1 2 i A = 1 {2λ[(k + 2)λ − k ]}; 238 (8.25) (8.26) (8.27) (8.28) λ = (kN ) {(k + 2)( N − N 0 )} Так же, как и при получении линейной модели, обработка результатов при реализации ЦКП предполагает статистические проверки гипотез воспроизводимости результатов экспериментов, значимости коэффициентов и адекватности моделей. Матрица ЦКРП позволяет минимизировать ошибки в определении Y, связанные с неадекватностью представления результатов исследования полиномом 2-го порядка. Полученная модель 2-го порядка может быть использована для нахождения оптимальных технологических режимов. При этом ее тщательно анализируют и методами аналитической геометрии приводят к канонической форме. 8.3 Решение типового примера Пример Интервалы варьирования переменных технологических факторов представлены в таблице 8.6 и уровни Таблица 8.6 –Значения переменных при исследовании свойств резистивных пленок рения Характеристика фактора Входной фактор 0 А, С В, 0С С, 0С Кодовое обозначение X1 X2 X3 Основной уровень xi=0 2630 530 610 Шаг варьирования ΔXi 40 20 40 Верхний уровень xi=+1 2670 550 650 Нижний уровень xi=-1 2590 510 570 Решение После реализации ПФЭ 23 оказалось, что полученная линейная модель неадекватно описывает результаты экспериментов. Поэтому необходимо дополнить ПФЭ до ЦКРП (таблица 8.7) для получения модели второго порядка. Поскольку при проверке эксперименты оказались воспроизводимыми, результаты опытов использовались для определения коэффициентов регрессии по формулам (8.21) – (8.24): b0=+1,07; b1=+0,069; b2=-0,076; b13=+0,0375; b23=+0,0375; b11=+0,060; 239 b3=+0,125; b22=+0,080; b12=-0,0375; b33=+0,060. После вычисления дисперсий S2{b0}, S2{bi}, S2{bii}, S2{bij} по формулам (8.25) – (8.28) установлено, что коэффициенты b12, b13, b23 незначимы. Тогда получаем математическую модель вида Y=1,07+0,069X1–0,076X2+0,125X3+0,060X12+0,080X22+0,060X32. (8.29) + – – – + + + – – – + – + – – + + + – + + – – + + + + – + – + – + + – + + + + + + -1,682 0 0 0 + +1,682 0 0 0 + 0 -1,682 0 0 + 0 +1,682 0 0 + 0 0 -1,682 0 + 0 0 +1,682 0 + 0 0 0 0 + 0 0 0 0 + 0 0 0 0 + 0 0 0 0 + 0 0 0 0 + 0 0 0 0 X1бX2бX3б X3б X2бX3б X2б X1бX3б 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X0б X1б X1бX2б Номер опыта Таблица 8.7 – Матрица планирования и результаты экспериментов при исследовании резистивных пленок рения + – + – – + – + 0 0 0 0 0 0 0 0 0 0 0 0 + + – – – – + + 0 0 0 0 0 0 0 0 0 0 0 0 – + + + 1,3 1,1 1,2 + + + + 1,5 1,5 1,5 + + + + 1,2 1,4 1,3 – + + + 0,9 0,9 0,9 + + + + 1,6 1,4 1,5 – + + + 1,5 1,3 1,4 – + + + 1,2 1,2 1,2 + + + + 1,6 1,4 1,5 0 2,829 0 0 1,0 1,0 1,0 0 2,829 0 0 1,3 1,7 1,5 0 0 2,829 0 1,2 1,6 1,4 0 0 2,829 0 1,4 1,0 1,2 0 0 0 2,829 1,2 0,8 1,0 0 0 0 2,829 1,7 1,3 1,5 0 0 0 0 0,7 1,1 0,9 0 0 0 0 0,7 0,9 0,8 0 0 0 0 1,6 1,2 1,4 0 0 0 0 1,5 1,1 1,3 0 0 0 0 1,0 1,4 1,2 0 0 0 0 1,1 1,1 1,1 X21б X22б X23б Y1 Y2 Y При проверке адекватности полученного уравнения оказалось S ад=0,427; S2{Y}=0,0402, то есть S2ад>S2{Y}. Критерий Фишера для данного случая F= S2ад/S2{Y}=0,427/0,0402 ≈1,06. Подсчитав νад=N–(m0–1)–[((k+1)(k+2))/2]; ν =m0–1, по таблице А2 приложения А для Р=0,05 Fкр=3,45. Так как F>Fкр, следовательно, уравнение (8.29) адекватно 2 240 описывает поверхность отклика в исследуемой области и может быть использовано для определения оптимальных технологических режимов. Анализ уравнения (8.29) показывает, что исследуемая поверхность отклика относится к поверхностям, имеющим экстремум. Приравняв нулю ∂Y/∂Xi и решив систему уравнений 0,069 +2·0,060X1б=0; -0,076+2·0,080X2б=0; 0,125+2·0,060X3б=0, найдем координаты экстремума X1б=-0,575, X2б=0,475, X3б=-1,04. Затем определим наиболее благоприятные режимы осаждения резистивных пленок рения. Для этого безразмерные переменные с помощью (8.13) переведем в натуральные переменные: X1=26070С; X2=5400С; X3=5680С. 8.4 Задачи для решения 1. Провести обработку и анализ результатов ЦКОП (табл. 8.8) для двух факторов (N=9) по рассмотренной методике. В каждом варианте приведены результаты проведения пяти параллельных опытов (Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ). 1 2 3 4 5 6 7 8 9 X0б X1б X2б +1 –1 –1 +1 +1 –1 +1 –1 +1 +1 +1 +1 +1 –1,00 0 +1 +1,00 0 +1 0 –1,00 +1 0 +1,00 +1 0 0 X1бX2б Номер опыта Таблица8.8 X21б X22б Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ +1 +1 +1 –1 +1 +1 –1 +1 +1 +1 +1 +1 0 1,00 0 0 1,00 0 0 1,00 0 0 1,00 0 0 0 0 241 Вариант 1 Вариант 2 Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ 3,004 3,031 3,035 3,039 3,001 3,651 3,605 3,653 3,592 3,627 5,193 5,152 5,177 5,209 5,151 6,547 6,514 6,535 6,562 6,581 3,927 3,950 3,936 3,898 3,897 4,761 4,793 4,816 4,792 4,801 7,141 7,099 7,111 7,138 7,097 9,515 9,566 9,534 9,552 9,528 4,684 4,697 4,688 4,730 4,729 5,828 5,847 5,842 5,905 5,886 9,135 9,123 9,166 9,134 9,117 13,041 13,081 13,051 13,089 13,063 6,371 6,403 6,343 6,339 6,337 8,364 8,371 8,338 8,365 8,366 14,672 14,680 14,695 14,668 14,672 25,575 25,563 25,611 25,578 25,534 5,828 5,847 5,842 5,905 5,886 5,081 5,148 5,123 5,092 5,073 Вариант 3 Y1ξ Y2ξ 2,124 2,150 3,382 3,394 2,705 2,652 4,307 4,242 3,107 3,089 5,081 5,148 3,948 3,901 6,873 6,920 6,718 6,752 Y3ξ 2,139 3,368 2,655 4,276 3,096 5,123 3,914 6,932 6,760 Вариант 4 Y1ξ Y2ξ 2,588 2,597 4,191 4,165 3,201 3,231 5,509 5,453 3,793 3,830 6,718 6,752 4,963 4,966 9,738 9,753 7,094 7,126 Y4ξ Y5ξ 2,140 2,157 3,374 3,372 2,674 2,713 4,317 4,255 3,119 3,137 5,092 5,073 3,951 3,919 6,858 6,869 6,709 6,743 Вариант 5 Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ 3,072 3,028 3,080 3,049 3,069 5,193 5,159 5,163 5,220 5,168 3,932 3,955 3,893 3,915 3,939 7,094 7,126 7,149 7,102 7,158 4,740 4,704 4,668 4,698 4,724 9,163 9,167 9,160 9,133 9,191 6,336 6,396 6,369 6,405 6,357 14,676 14,668 14,725 14,722 14,741 8,385 8,390 8,404 8,421 8,390 Y3ξ 2,542 4,152 3,202 5,448 3,850 6,760 5,001 9,702 7,149 Y4ξ 2,537 4,129 3,199 5,511 3,789 6,709 4,952 9,746 7,102 Y5ξ 2,539 4,138 3,248 5,445 3,852 6,743 5,007 9,737 7,158 Вариант 6 Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ 4,292 4,285 4,333 4,304 4,277 8,385 8,390 8,404 8,421 8,390 5,881 5,886 5,847 5,900 5,909 13,349 13,332 13,357 13,342 13,356 7,389 7,368 7,439 7,419 7,442 20,252 20,271 20,271 20,258 20,310 11,282 11,269 11,293 11,249 11,254 66,571 66,613 66,562 66,585 66,620 7,379 7,415 7,415 7,368 7,368 242 Вариант 7 Вариант 8 Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ 4,307 4,284 4,284 4,316 4,286 3,583 3,605 3,623 3,623 3,587 8,387 8,396 8,430 8,389 8,404 6,555 6,564 6,523 6,559 6,511 5,832 5,873 5,856 5,843 5,862 4,795 4,790 4,776 4,798 4,744 13,329 13,304 13,328 13,340 13,312 9,504 9,530 9,524 9,557 9,530 7,379 7,415 7,415 7,368 7,368 5,855 5,839 5,827 5,881 5,863 20,255 20,278 20,304 20,279 20,261 13,040 13,011 13,045 13,061 13,036 11,226 11,238 11,271 11,234 11,273 8,328 8,301 8,303 8,319 8,310 66,599 66,605 66,588 66,595 66,562 25,586 25,544 25,578 25,562 25,556 13,040 13,011 13,045 13,061 13,036 4,701 4,682 4,690 4,718 4,719 Вариант 9 Вариант 10 Y1ξ Y2ξ Y3ξ Y4ξ Y5ξ Y1ξ Y2ξ 3,054 3,032 3,024 3,046 3,019 2,549 2,537 5,147 5,170 5,178 5,190 5,177 4,118 4,164 3,926 3,895 3,937 3,931 3,915 3,236 3,220 7,117 7,121 7,101 7,130 7,091 5,445 5,485 4,701 4,682 4,690 4,718 4,719 3,825 3,812 9,150 9,159 9,115 9,162 9,156 6,721 6,714 6,390 6,383 6,384 6,378 6,378 4,951 4,989 14,677 14,670 14,718 14,690 14,693 9,735 9,693 6,721 6,714 6,741 6,704 6,722 3,950 3,932 Y3ξ 2,563 4,155 3,202 5,449 3,790 6,741 4,955 9,705 3,908 Y4ξ 2,564 4,126 3,212 5,472 3,782 6,704 4,941 9,711 3,935 Y5ξ 2,569 4,151 3,207 5,455 3,781 6,722 4,981 9,726 3,901 Вариант 11 Y1ξ Y2ξ 2,164 2,165 3,347 3,338 2,639 2,658 4,281 4,251 3,086 3,084 5,082 5,128 3,950 3,932 6,855 6,870 2,788 2,823 Y3ξ 1,969 2,984 2,428 3,784 2,815 4,492 3,515 5,863 5,136 Y4ξ 1,981 2,983 2,394 3,783 2,777 4,473 3,524 5,870 5,098 Y5ξ 1,935 3,007 2,438 3,803 2,773 4,460 3,475 5,877 5,140 Вариант 13 Y3ξ 2,145 3,322 2,651 4,296 3,081 5,117 3,908 6,875 2,815 Y4ξ 2,150 3,318 2,648 4,276 3,122 5,106 3,935 6,872 2,777 Y5ξ 2,163 3,358 2,670 4,269 3,068 5,078 3,901 6,907 2,773 Вариант 12 Y1ξ Y2ξ 1,983 1,951 3,004 3,024 2,435 2,415 3,767 3,794 2,788 2,823 4,491 4,467 3,485 3,510 5,883 5,879 5,083 5,076 Вариант 14 243 Y1ξ 2,132 3,373 2,708 4,277 3,075 5,083 3,978 6,898 3,781 Y2ξ 2,114 3,324 2,645 4,254 3,074 5,076 3,928 6,908 3,808 Y3ξ 2,160 3,377 2,657 4,311 3,090 5,136 3,905 6,887 3,820 Y4ξ 2,146 3,327 2,645 4,288 3,099 5,098 3,948 6,940 3,814 Y5ξ 2,120 3,385 2,657 4,265 3,096 5,140 3,904 6,904 3,842 Y1ξ 2,567 4,148 3,234 5,458 3,781 6,713 4,998 9,758 9,178 Y2ξ 2,587 4,183 3,259 5,485 3,808 6,722 4,949 9,689 9,194 Y3ξ 2,585 4,155 3,216 5,490 3,820 6,750 4,950 9,701 9,157 Y4ξ 2,527 4,144 3,240 5,513 3,814 6,751 4,947 9,711 9,159 Y5ξ 2,583 4,169 3,200 5,469 3,842 6,700 4,968 9,686 9,121 2. Провести обработку и анализ результатов ЦКРП (табл. 8.5) для трех факторов (N=20) по рассмотренной методике. В каждом варианте приведены результаты проведения пяти параллельных опытов (Y1ξ Y2ξ Y3ξ Y4ξ). Вариант 1 -2.794 5.059 0.943 3.387 8.127 10.69 5.547 2.874 0.148 13.01 3.835 0.985 9.451 2.659 2.677 2.698 2.749 2.815 2.818 2.898 -2.836 5.118 0.911 3.225 8.153 10.6 5.503 2.9 0.130 13.01 3.815 0.964 9.483 2.647 2.697 2.707 2.768 2.762 2.755 2.933 Вариант 3 Вариант 2 -2.837 5.135 0.929 3.428 8.238 10.59 5.599 2.889 0.176 12.99 3.828 0.972 9.368 2.673 2.695 2.652 2.761 2.765 2.767 2.925 -2.751 -2.769 4.983 5.025 0.941 0.895 3.35 3.288 8.212 8.1 10.77 10.64 5.53 5.484 2.89 2.907 0.162 0.136 12.99 13.01 3.794 3.838 1.04 0.968 9.353 9.319 2.674 2.679 2.637 2.693 2.647 2.649 2.758 2.78 2.784 2.823 2.755 2.767 2.887 2.883 -1.694 -1.736 -1.737 -1.651 -1.669 12.16 12.22 12.24 12.08 12.13 4.043 4.011 4.029 4.041 3.995 8.487 8.325 8.528 8.45 8.388 13.23 13.25 13.34 13.31 13.2 17.79 17.7 17.69 17.87 17.74 8.647 8.603 8.699 8.63 8.584 3.974 4 3.989 3.99 4.007 -0.433 -0.451 -0.405 -0.419 -0.445 23.13 23.13 23.11 23.11 23.13 6.082 6.062 6.075 6.041 6.085 7.743 7.722 7.73 7.801 7.726 16.21 16.24 16.12 16.11 16.08 3.759 3.747 3.773 3.774 3.779 3.777 3.797 3.795 3.737 3.793 3.798 3.807 3.752 3.747 3.749 3.849 3.868 3.861 3.858 3.88 3.915 3.862 3.865 3.884 3.923 3.918 3.855 3.867 3.855 3.867 3.998 4.033 4.025 3.987 3.983 Вариант 4 244 -8.114 7.739 -2.377 4.067 8.807 15.37 4.227 1.554 -4.535 19.56 0.833 0.812 12.64 1.339 1.357 1.378 1.429 1.495 1.498 1.578 -8.156 7.798 -2.409 3.905 8.833 15.28 4.183 1.58 -4.553 19.56 0.813 0.791 12.67 1.327 1.377 1.387 1.448 1.442 1.435 1.613 -8.157 -8.071 -8.089 7.815 7.663 7.705 -2.391 -2.379 -2.425 4.108 4.03 3.968 8.918 8.892 8.78 15.27 15.45 15.32 4.279 4.21 4.164 1.569 1.57 1.587 -4.507 -4.521 -4.547 19.54 19.55 19.56 0.826 0.792 0.836 0.799 0.870 0.795 12.56 12.54 12.51 1.353 1.354 1.359 1.375 1.317 1.373 1.332 1.327 1.329 1.441 1.438 1.46 1.445 1.464 1.503 1.447 1.435 1.447 1.605 1.567 1.563 -0.248 7.205 7.981 14.03 6.849 5.007 4.761 1.688 0.164 8.574 10.12 10.07 5.38 2.339 2.357 2.378 2.429 2.495 2.498 2.578 -0.29 7.264 7.949 13.86 6.875 4.917 4.717 1.714 0.146 8.575 10.1 10.05 5.412 2.327 2.377 2.387 2.448 2.442 2.435 2.613 -0.291 7.281 7.967 14.07 6.96 4.91 4.813 1.703 0.192 8.555 10.11 10.06 5.297 2.353 2.375 2.332 2.441 2.445 2.447 2.605 -0.205 7.129 7.979 13.99 6.934 5.093 4.744 1.704 0.178 8.56 10.08 10.13 5.282 2.354 2.317 2.327 2.438 2.464 2.435 2.567 -0.223 7.171 7.933 13.93 6.822 4.958 4.698 1.721 0.152 8.573 10.12 10.06 5.248 2.359 2.373 2.329 2.46 2.503 2.447 2.563 Вариант 5 4.262 4.22 4.219 4.305 4.287 3.535 3.594 3.611 3.459 3.501 12.49 12.46 12.48 12.49 12.44 10.36 10.19 10.4 10.32 10.26 11.36 11.39 11.47 11.44 11.33 1.337 1.247 1.24 1.423 1.288 9.271 9.227 9.323 9.254 9.208 -1.982 -1.956 -1.967 -1.966 -1.949 7.463 7.445 7.491 7.477 7.451 2.116 2.117 2.097 2.102 2.115 10.54 10.52 10.53 10.5 10.54 10.49 10.47 10.48 10.55 10.48 5.8 5.832 5.717 5.702 5.668 2.759 2.747 2.773 2.774 2.779 2.777 2.797 2.795 2.737 2.793 2.798 2.807 2.752 2.747 2.749 2.849 2.868 2.861 2.858 2.88 2.915 2.862 2.865 2.884 2.923 2.918 2.855 2.867 2.855 2.867 2.998 3.033 3.025 2.987 2.983 Вариант 6 -3.901 -3.943 -3.944 -3.858 -3.876 -4.628 -4.569 -4.552 -4.704 -4.662 4.328 4.296 4.314 4.326 4.28 2.192 2.03 2.233 2.155 2.093 3.196 3.222 3.307 3.281 3.169 -6.826 -6.916 -6.923 -6.74 -6.875 1.108 1.064 1.16 1.091 1.045 -10.14 -10.12 -10.13 -10.13 -10.11 7.504 7.486 7.532 7.518 7.492 -9.858 -9.857 -9.877 -9.872 -9.859 -1.433 -1.453 -1.44 -1.474 -1.43 -0.654 -0.675. -0.667 -0.596 -0.671 -5.348 -5.316 -5.431 -5.446 -5.48 2.8 2.788 2.814 2.815 2.82 2.818 2.838 2.836 2.778 2.834 2.839 2.848 2.793 2.788 2.79 2.89 2.909 2.902 2.899 2.921 2.956 2.903 2.906 2.925 2.964 2.959 2.896 2.908 2.896 2.908 3.039 3.074 3.066 3.028 3.024 Вариант 7 -3.558 -3.6 -3.601 -3.515 -3.533 Вариант 8 -0.558 -0.6 -0.601 -0.515 -0.533 245 -4.285 -4.226 -4.209 -4.361 -4.319 4.671 4.639 4.657 4.669 4.623 2.535 2.373 2.576 2.498 2.436 3.539 3.565 3.65 3.624 3.512 -6.483 -6.573 -6.58 -6.397 -6.532 1.451 1.407 1.503 1.434 1.388 -9.802 -9.776 -9.787 -9.786 -9.769 7.847 7.829 7.875 7.861 7.835 -9.515 -9.514 -9.534 -9.529 -9.516 -1.09 -1.11 -1.097 -1.131 -1.087 -0.311 -0.332 -0.324 -0.253 -0.328 -5.005 -4.973 -5.088 -5.103 -5.137 3.143 3.131 3.157 3.158 3.163 3.161 3.181 3.179 3.121 3.177 3.182 3.191 3.136 3.131 3.133 3.233 3.252 3.245 3.242 3.264 3.299 3.246 3.249 3.268 3.307 3.302 3.239 3.251 3.239 3.251 3.382 3.417 3.409 3.371 3.367 Вариант 9 -3.558 -3.6 -3.601 -3.515 -3.533 -4.285 -4.226 -4.209 -4.361 -4.319 4.671 4.639 4.657 4.669 4.623 2.535 2.373 2.576 2.498 2.436 3.539 3.565 3.65 3.624 3.512 -6.483 -6.573 -6.58 -6.397 -6.532 1.451 1.407 1.503 1.434 1.388 -9.802 -9.776 -9.787 -9.786 -9.769 7.847 7.829 7.875 7.861 7.835 -9.515 -9.514 -9.534 -9.529 -9.516 -1.09 -1.11 -1.097 -1.131 -1.087 -0.319 -0.339 -0.329 -0.259 -0.328 -5.005 -4.973 -5.088 -5.103 -5.137 3.143 3.131 3.157 3.158 3.163 3.161 3.181 3.179 3.121 3.177 3.182 3.191 3.136 3.131 3.133 3.233 3.252 3.245 3.242 3.264 3.299 3.246 3.249 3.268 3.307 3.302 3.239 3.251 3.239 3.251 3.382 3.417 3.409 3.371 3.367 -1.285 7.671 5.535 6.539 -3.483 4.451 -6.802 10.85 -6.515 1.91 2.688 -2.005 6.143 6.161 6.182 6.233 6.299 6.302 6.382 -1.226 -1.209 -1.361 -1.319 7.639 7.657 7.669 7.623 5.373 5.576 5.498 5.436 6.565 6.65 6.624 6.512 -3.573 -3.58 -3.397 -3.532 4.407 4.503 4.434 4.388 -6.776 -6.787 -6.786 -6.769 10.83 10.88 10.86 10.84 -6.514 -6.534 -6.529 -6.516 1.89 1.903 1.869 1.913 2.667 2.675 2.746 2.671 -1.973 -2.088 -2.103 -2.137 6.131 6.157 6.158 6.163 6.181 6.179 6.121 6.177 6.191 6.136 6.131 6.133 6.252 6.245 6.242 6.264 6.246 6.249 6.268 6.307 6.239 6.251 6.239 6.251 6.417 6.409 6.371 6.367 Вариант 10 0.312 0.27 0.269 0.355 0.337 -0.415 -0.356 -0.339 -0.491 -0.449 8.541 8.509 8.527 8.539 8.493 6.405 6.243 6.446 6.368 6.306 7.409 7.435 7.52 7.494 7.382 -2.613 -2.703 -2.71 -2.527 -2.662 5.321 5.277 5.373 5.304 5.258 -5.932 -5.906 -5.917 -5.916 -5.899 11.72 11.7 11.75 11.73 11.71 -5.645 -5.644 -5.664 -5.659 -5.646 2.78 2.76 2.773 2.739 2.783 3.558 3.537 3.545 3.616 3.541 -1.135 -1.103 -1.218 -1.233 -1.267 7.013 7.001 7.027 7.028 7.033 7.031 7.051 7.049 6.991 7.047 7.052 7.061 7.006 7.001 7.003 7.103 7.122 7.115 7.112 7.134 7.169 7.116 7.119 7.138 7.177 7.172 7.109 7.121 7.109 7.121 7.252 7.287 7.279 7.241 7.237 8.5 Контрольные вопросы 246 1. Когда и для чего используется ЦКП и в чем его отличие от планирования ПФЭ и ДФЭ? 2. Что является критерием оптимальности плана при ЦКОП и ЦКРП? 3. Как достигается ортогональность матрицы планирования при ЦКОП? 4. Почему при рототабельном планировании можно не проводить параллельных опытов? 5. В чем преимущество рототабельного планирования перед ортогональным и как оно достигается? 6. Каков порядок обработки результатов ЦКОП? 7. Каков порядок обработки результатов ЦКРП? 247 МОДУЛЬ 3 «ПАССИВНЫЙ ЭКСПЕРИМЕНТ» ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №9 9.1 Метод регрессионного анализа Если объект исследования по техническим, технологическим или экономическим соображениям не допускает преднамеренного варьирования входных переменных в необходимом диапазоне, то для накопления статистического материала применяется пассивный эксперимент, заключающийся в наблюдении и регистрации значений входных\выходных переменных в режиме нормального функционирование исследуемого объекта. Применение метода пассивного эксперимента может быть успешным, если при его проведении соблюдаются необходимые условия, к которым относятся такие, как правильное определение времени регистрации данных, обеспечение независимости соседних измерений и входных переменных друг от друга, достаточный с точки зрения математической статистики объем экспериментальных данных. Выбор структуры модели является наиболее неформализуемой процедурой, так как исследователь до начала эксперимента, как правило, не располагает необходимой априорной информацией. Построение модели существенно упрощается, если в качестве ее составляющих используются полиномы, которые следует включать в уравнение регрессии. Но прежде чем приступить к проведению эксперимента, необходимо выделить наиболее существенные входные факторы из всей совокупности входных величин (модуль №1, занятия № 2-4), оценить степень корреляции между ними и исключить из числа подлежащих регистрации те из них, которые сильно коррелированы с другими. Регрессионный анализ служит для нахождения по результатам эксперимента связи выходного параметра с факторами, которые оказывают влияние на этот параметр. Регрессионный анализ позволяет получить математическую модель процесса на основе оценки коэффициентов регрессии в виде полинома. Классический регрессионный анализ базируется на так называемом "пассивном эксперименте", который сводится к сбору и обработке данных, полученных в результате пассивного наблюдения за 248 производственными процессами. В регрессионном анализе вид связи между параметром Y и факторами Xi , обычно задается в виде разложения в ряд Тейлора: k k k i =1 i≠ j i =1 Y = f ( X 1 , X 2 ,..., X k ) = b0 + ∑ bi X i + ∑ bij X i X j + ∑ bii X i2 + ... , (9.1) где b0, bi, bij, bii – постоянные коэффициенты уравнения, оценки которых необходимо определить в результате постановки и проведения пассивного эксперимента; n – число наиболее существенных входных величин, полученных в результате отсеивающего эксперимента. Число коэффициентов уравнения (9.1) определяет объем эксперимента. Поэтому выбирают такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованию простоты и адекватности, под которой понимается способность модели предсказывать результаты эксперимента в некоторой области и с требуемой точностью. Так как чаще всего исследователь не располагает достаточной информацией, то на предварительной стадии исследования объекта обычно выбирают полином первой степени, предполагая, что параметры объекта лежат в области, в которой расположен экстремум исследуемой функции, и поэтому объект описывается линейной моделью. Если же эта линейная модель оказывается неадекватной, то в нее включают члены парного взаимодействия XiXj, а при необходимости увеличивают степень полинома до тех пор, пока модель не окажется адекватной. В большинстве практических случаев квадратичная модель оказывается достаточно работоспособной в пределах имеющихся ограничений. В результате регрессионного анализа результатов пассивного эксперимента находятся оценки коэффициентов уравнения регрессии β0, βi, βij, βii, … Пассивный эксперимент с учетом условий накопления статистических данных может применяться для получения математического описания технологических процессов в производстве ЭВC (изготовление печатных плат, оксидирование анодной фольги для электролитических конденсаторов, синтез ферритовых антенн, гальванические покрытия и т. п.), а также для моделирования процессов функционирования радиоэлектронных устройств. 249 Определение интервала съема данных. Для непрерывныx технологических процессов важно знать, как изменяется теснота корреляционной связи между входными и выходными величинами в зависимости от временного сдвига τ между ними. Для оценки временного сдвига используется взаимнокорреляционна функция Kxy(τ), которая для непрерывных случайных переменных x(t) и y(t) определяется формулой 1 K xy (τ ) = lim T → ∞ 2T T ∫ x(t ) y(t + τ )dt . (9.2) −T На практике имеют дело обычно с дискретными значениями x(t) и y{t) через равные промежутки времени ∆t', причем объем выборки N<∞. В этом случае асимптотически несмещенные оценки взаимнокорреляционных функций вычисляют по формуле N Rxy (τ ) = ∑ [ x(t ) − x ][ y(t l =1 l l + τ ) − y] ( N − 1) S x S y , (9.3) где τ=0, 1·∆t', 2·∆t', …, u·∆t'; u – число используемых сдвигов; и= (0,25.—0,35) N; N – объем выборки. По расположению максимума функции Rxy(τ) на осиτ опре деляют время эквивалентного запаздывания τЭ.З. (рис. 9.1), физический смысл которого состоит в том, что всякий скачок функции x(t) на входе объекта наиболее полно отражается на выходе только через промежуток времени τЭ.З. Рисунок 9.1 – Взаимно-корреляционная функция Rxy(τ) Величина интервала съема данных·∆t должна обеспечивать некоррелированность наблюдений, так как согласно предпосылкам регрессионного анализа соседние наблюдения должны быть стохастически независимыми. Для непрерывных технологических 250 процессов, для которых изменения переменных представляют собой некоторый случайный процесс, это равносильно требованию Rxx(τ≥∆t)=0. Асимптотически несмещенная оценка Rxx(τ) (корреляционной функции входной переменной) определяется по формуле N Rxx (τ ) = ∑ [ x(t ) − x ][ x(t l =1 l l +τ ) − x] ( N − 1) S x2 , (9.4) По корреляционной функции Rxx(τ) (рис. 9.2) определяют промежутки времени между соседними измерениями x(t), когда последние становятся независимыми. Эти промежутки времени называются временем корреляции τ0. Рисунок 9.2 – Корреляционная функция Rxx(τ) Практически интервал ·∆t должен выбираться из условия, что ·∆t≥ τ0 (9.5) и должен быть по возможности ближе к то, но не меньше времени измерения переменных и не превышать значительно время, эквивалентного запаздывания τЭ.З. Приближенное значение τ0 можно оценить по временному графику, случайного процесса, если на нем провести среднюю линию и подсчитать число пересечений кривой изменения переменной N0 за время ∆T. Тогда время корреляции оценивается по формуле τ0=2(∆T)/N0. (9.6) Число пересечений N0 на этом отрезке времени ∆T должно быть 40–70. Определение времени наблюдения Т. Допустим, задан рабочий диапазон изменения технологической переменной x(t) во времени, причем это изменение представляет собой случайный стационарный; процесс (рис. 9.3): 251 ∆x = xв − xн (9.7) Весь диапазон ∆x разбит на ряд одинаковых интервалов ∆х в соответствии с разрешающей способностью измерительного прибора. Предположим, что известны дискретность проведения опытов ∆t и вероятности р1 и р2 попадания случайной величины x в нижний и верхний интервалы диапазона ∆x . Рисунок 9.3 – Рабочий диапазон изменения переменной x(t) Если величина x имеет симметричное распределение внутри диапазона, то р1=р2=р. Время наблюдения T=∆tλ/p, (9.8) где λ — параметр, характеризующий среднее число попаданий перменной в крайний интервал диапазона за время эксперимента; ∆t — интервал получения данных; р — вероятность попадания случайной величины x в крайний интервал диапазона ∆х. Значения параметра λ находят из табл. 9.1, задаваясь вероятностью Р, с которой необходимо рассчитать коэффициенты уравнения регрессии; на практике чаще всего выбирается Р = 0,95, т.е. при уровне значимости β = 5%, где β=(1—Р) 100%. Таблица 9.1 P 0,94 0,95 λ 3,52 3,68 0,96 3,90 0,97 4,19 0,98 4,6 0,99 5,3 Вероятность Р находится по временному графику случайного процесса x(t) (рис. 9.3) по результатам предварительных 252 исследований закона распределения случайной величины x . Определение объема экспериментальных данных. Определи интервал ∆t и общее время эксперимента Т, находят число наблюдений (объем выборки) из соотношения N = T/∆t. (9.9) Обработка данных пассивного эксперимента. Производится методом регрессионного анализа, который позволяет получат оценки коэффициентов нелинейных уравнений регрессии. Прежде всего величины переводятся в стандартизованный масштаб по формулам: ξ yl = x − xj yl − y , ξ jl = jl , sy sx j (9.10) где j – номер величины (j=1, n); l – номер измерения выходной величины (l=1, N); ξ yl , ξ jl — значения соответственно величн yi и xjl в стандартизованном масштабе; y , x — средние значения величин; sy, sx — среднеквадратические отклонения величин y и xj; N — общее число наблюдений. Для вычисления оценок коэффициентов β̂ j на основе метода наименьших квадратов составляется следующая система уравнений: N N N N l =1 l =1 l =1 l =1 N N N N l =1 l =1 l =1 l =1 N N N N l =1 l =1 l =1 l =1 ∑ ξ ylξ1l = βˆ1 ∑ ξ12l + βˆ2 ∑ ξ1lξ2l + ... + βˆm ∑ ξilξml ; ∑ ξ ylξ2l = βˆ1 ∑ ξ2lξ1l + βˆ2 ∑ ξ22l + ... + βˆm ∑ ξ2lξml ; (9.11) ∑ ξ ylξml = βˆ1 ∑ ξmlξ1l + βˆ2 ∑ ξmlξ2l + ... + βˆm ∑ ξml , где m — число линейных величин вместе с искусственными линейными величинами, заменившими нелинейные члены уравнения; m = 2n + C; (9.12) С — число сочетаний из п элементов по 2; С = С2n. (9.13) Система уравнений (9.14) решается на ЭВМ с использованием стандартной программы. 253 Уравнение регрессии в стандартизованном масштабе имеет вид ξ y = βˆ1ξ1 + βˆ2ξ 2 + ... + βˆ jξ j + ... + βˆmξ m . В результате решения находят искомые оценки коэффициентов β̂ j уравнения регрессии в стандартизованном масштабе, проводят проверку их статистической значимости с помощью t-критерия Стьюдента. Статистически незначимые коэффициенты из уравнения регрессии исключаются. Полученное математическое описание в виде уравнения регрессии показывает, как изменяется положение среднего значения выхода с изменением входных величин. Оценку тесноты регрессионной связи, т. е. оценку работоспособности полученного уравнения, дает коэффициент множественной корреляции R. Считается нормальным, если R=0,8—0,9. Для практических целей в предлагается использовать коэффициент γ, который показывает, во сколько раз уменьшается интервал ошибки предсказания при переходе от предсказания выходной величиной по среднему значению к предсказанию по эмпирическому уравнению регрессии: γ=sy/s0y, (9.14) где sy – среднеквадратическое отклонение выходной величины у: N sy = ∑(y l =1 эl − y )2 N −1 ; (9.15) уэl – экспериментальное значение выходной величины y в l-й точке наблюдения; y — соответствующее среднее значение выходной величиной; s0y — среднеквадратическое отклонение выходной величины y относительно ее значений, полученных по уравнению регрессии в натуральном масштабе N s0 y = ∑(y l =1 эl − yˆl ) 2 N −d ; (9.16) ŷl — значение выходной величины, полученное по уравнению регрессии в l-й точке наблюдения; d — число членов уравнения регрессии. На рис. 9.4 приведена графическая зависимость γ от R, из которой следует, что γ начинает резко возрастать в области больших значений R. 254 Рисунок 9.4 – Графическая зависимость коэффициента корреляции R от γ Вероятно, уравнение регрессии имеет практический смысл, если γ≥2, т. е. когда ошибка предсказания по уравнению регрессии хотя бы в два раза меньше, чем ошибка предсказания по среднему значению y. 9.2 Решение типового примера Пример Технологический процесс формовки анодной алюминиевой фольги для электролитических конденсаторов является непрерывным вероятностным процессом, эффективность которого оценивается удельной емкостью заформованной фольги y при ограничении по току утечки. К входным величинам относятся: напряжение формовки, концентрация борной кислоты, удельное электрическое сопротивление электролита, температура электролита, кислотность электролита, наличие ионов хлора, наличие гидроокиси, коэффициент травления фольги, скорость протяжки фольги через агрегат. Требуется построить математическую модель процесса формовки по выходной величине у, учитывая, что постановка активного эксперимента нежелательна. Решение. На первом этапе исследования была проведена процедура сокращения числа входных величин процесса хj и выделения наиболее существенных, которые и будут регистрироваться во времени эксперимента. Для выделения наиболее существенных факторов процесса был применен метод ранговой корреляции. По данным априорного ранжирования были выделены следующие наиболее существенные входные величины (факторы): х1 – напряжение формовки, х2 – температура электролита, х3 –коэффициент травления. 255 Связь между выходной величиной у и факторами xj (j=1, п) имеет следующий вид: y=f(x1, x2, х3). (9.17) Выходная величина, как показала проверка гипотезы с помощью 2 χ -критерия Пирсона по реализации случайной величины у, полученной в результате процесса формовки, распределена по нормальному закону: χ2расч = 7,0258 <χ2крит = 15,507 при ν=8 степенях свободы и 5%-ном уровне значимости Так как имеются ограничения на постановку активного эксперимента, то математическая модель была получена методом пассивного эксперимента. По формуле (9.6) определяется приближенное значение времени корреляции τ0 по кривой изменения y, выходной величины снятой в режиме нормального функционирования процесса формовки: τ0 = 2(∆T ) 2 ⋅ 600 = ≈ 7 мин. N0 171 Интервал получения данных выбран из условия (9.5) и принят равным ∆t=7 мин, что незначительно больше времени эквивалентного запаздывания τэз = 6,3 мин. Из табл. 9.1, задаваясь вероятностью Р=0,95, находим параметр λ=3,68 и с помощью (9.8) определяем общее время наблюдения T= ∆t ⋅ λ 7 ⋅ 3,68 = = 1030,4 мин. p 0,025 Объем выборки при исследовании процесса формовки с целью построения математической модели (9.17) методом пассивного эксперимента равен (9.9) N=T/∆t=1030,4/7≈147. Принимаем N=150. Для условий проведения пассивного эксперимента (∆t=7 мин, N= 150) в режиме нормального функционирования процесса формовки получены результаты регистрации N=150 значений входных величин х1, х2, х3 и соответствующих им значений выходной величины y в j-е моменты времени с интервалом ∆t=7 мин (табл. 9.2). По этим данным рассчитаны оценки коэффициентов уравнения регрессии β̂ j и дисперсий s y2 , soy2 , среднеквадратические отклонения sy, soy, значения t-критерия Стьюдента для соответствующих оценок коэффициентов уравнения регрессии. 256 Таблица 9.2 l x1 x2 x3 yэl 1 2 3 4 5 6 7 8 9 10 … 143 144 145 146 147 148 149 150 590 590 600 600 600 600 600 570 590 590 … 520 530 520 530 520 530 520 590 90 90 93,7 93,5 93,5 88 90 89,5 94 92 … 76 76 88 88 88 88 76 76 19,6 19,6 19,6 19,6 19,6 22,5 22,5 22,5 22,0 22,0 … 11,0 11,0 11,0 11,0 12,0 12,0 12,0 12,0 10,8 10,00 9,74 9,95 9,4 12,61 12,10 13,91 12,50 12,87 … 6,63 6,11 5,68 5,16 6,66 6,14 7,63 7,42 y€l 10,42 10,42 9,61 9,62 9,62 12,93 12,77 14,34 12,47 12,53 … 6,59 6,07 5,63 5,11 6,61 6,09 7,64 7,64 Так как критическое значение t-критерия, найденное по статистическим таблицам для 5%-ного уровня значимости и числа степеней свободы ν=N– (n+1) = 143, оказалось меньше расчетных значений для всех коэффициентов уравнения регрессии (tкрит = 1,9759), то они признаны статистически значимыми. Таким образом, математическая модель процесса формовки высоковольтной фольги имеет вид (9.18) yˆ = 28,432 - 0,051x1 - 0,08x 2 + 0,984x 3 Оценка адекватности полученной математической модели (9.18) проведена по коэффициенту множественной корреляции, который находится из графика рис. 9.4, для чего был произведен расчет коэффициента γ (9.14) по среднеквадратическим отклонениям sy и soy При γ ==2,47> γкрит=2 коэффициент множественной корреляции R=0,92>0,8, что говорит об адекватности полученной математическом модели (9.18). Для наглядности в последней графе табл. 9.2 приведены значения выходной величины, полученные по линейному уравнению регрессии (9.18). 257 9.3 Задачи для решения Построить регрессионную модель но результатам исследований стационарного непрерывного технологического процесса, считая, что предпосылки регрессионного анализа выполняются (табл. 9.3). К результатам опытов из табл. 9.3 прибавить номер выполняемого варианта. x1 x2 y Таблица 9.3 1 2 3 4 5 6 7 8 9 10 11 11 12,6 16,7 19 11,3 12 21,2 24 14,1 19,3 20,5 93 92 89 87 94 88,5 89,5 93,5 93,8 95 94,5 10,7 13,0 19,3 23,2 11,4 12,1 27,3 29,6 15,6 24,1 25,5 Продолжение табл. 9.3 12 13 14 15 16 17 18 19 20 21 22 x1 21 12,5 16,5 22 19,5 13,5 17,5 20 22 22,3 24,1 x2 92,3 92.2 96 91,3 92,5 97 93,3 92 98 94,5 95 y 26,4 13,1 19,3 27,9 24 14,4 21 24,7 28 28,8 29,6 9.4 Контрольные вопросы 1. Назовите основные отличия активного и пассивного экспериментов, их преимущества и недостатки. 2. Каков порядок проведения пассивного эксперимента в производственных условиях? 3. Какую информацию о качестве технологического процесса несут контролируемые в процессе производства параметры качества? 258 МОДУЛЬ 4 «МЕТОДЫ ОПТИМИЗАЦИИ» ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 10 10.1 Методы оптимизации Главной задачей и конечной целью решения большого числа разнообразных исследовательских проблем управления, проектирования и планирования обычно является достижение и поддержание экстремальных, то есть наилучших, показателей. Процесс нахождения и поддержания наилучших (в определенном смысле) значений целевой функции объекта называется оптимизацией. Критерий оптимизации (целевая функция) Y обычно задается, иногда исследователь задает ее сам. Этот критерий должен удовлетворять следующим основным условиям: – нести в себе существенную информацию об объекте, о качестве процесса; – измеряться с достаточной точностью; – носить обобщенный характер, то есть отражать свойства и качества процесса в целом. Если математическое ожидание критерия оптимизации у есть функция от вектора x входных управляемых переменных (факторов), то есть M{y} = f( x ) = f(x1, x2, …, xk), (10.1) где k – число факторов, то задача оптимизации сводится к отысканию таких значений факторов x * = (x1*, x2*, …, xk*), (10.2) при которых целевая функция достигает экстремума (максимума или минимума). Если на объект воздействуют аддитивные помехи, то зависимость (10.1) выражает не функциональную, а регрессионную зависимость, которая в (k+1)-мерном пространстве n факторов xi (i 259 =1, 2, …, k) и целевой функции y образует поверхность отклика. Для решения задачи оптимизации, то есть отыскания вектора (10.2), можно применить два принципиально разных подхода: 1 – если известна или есть возможность найти n-факторную математическую модель для той части пространства, где расположен экстремум функции отклика, то задачу оптимизации решают аналитическим или численным методом; 2 – если математическое описание не получено по каким-либо причинам, то осуществляют экспериментальный поиск области оптимума. В первом случае используют известное из математического анализа свойство функций, имеющих экстремум: в точке экстремума (максимума или минимума) первая производная этой функции обращается в нуль. Если необходимо найти полную производную в nфакторном пространстве, то находят n частных производных по каждому из n факторов и получают систему из n уравнений ∂y/∂x1 = 0; ∂y/∂x2 = 0; ………….. ∂y/∂xk-1 = 0; ∂y/∂xk = 0 (10.3) Решением системы (10.3) и является вектор (10.2). Однако во многих практических случаях аналитическая зависимость (10.1) неизвестна или ее нахождение представляет собой сложную задачу. Тогда, если имеется возможность одновременно наблюдать все n факторов и целевую функцию, задачу оптимизации проще решить с помощью второго подхода, то есть с помощью экспериментального поиска. Для этого сначала осуществляют изучение характера поверхности отклика в районе первоначально выбранной точки факторного пространства (с помощью специально спланированных «пробных» опытов). Затем совершают «рабочее» движение в сторону экстремума, причем направление движения определяют по результатам пробных опытов. Такое движение может осуществляться путем ряда этапов, которые могут объединяться в «циклы». После выхода в район экстремума оптимальную точку можно уточнить одним из двух способов: – постановкой дополнительных, особым образом 260 спланированных, опытов; – получением математической модели второго или более высокого порядка и последующим решением системы уравнений (6.3). Задача надежного отыскания экстремума усложняется, если на объект воздействуют случайные помехи. Тогда каждое измеренное (наблюдавшееся) значение целевой функции оказывается суммой истинного ее значения и случайной помехи. Для повышения надежности результатов применяют специальные методы, например в каждой запланированной точке факторного пространства выполняют несколько параллельных опытов. Если характеристики объекта изменяются, смещаются во времени (дрейф), то это создает дополнительные трудности и приходится создавать специальные планы эксперимента. 10.2 Метод Гаусса-Зайделя Метод Гаусса-Зайделя предусматривает поочередное нахождение частных экстремумов целевой функции по каждому фактору xi (i =1, 2, …, n). При этом на каждом i-м этапе стабилизируют n-1 факторов и варьируют только один, i-й фактор. Задачу поиска экстремума решают в несколько этапов, которые затем объединяют в циклы. Рассмотрим последовательность поиска максимума методом Гаусса-Зайделя с иллюстрацией двухфакторного примера. Графическая интерпретация метода дана на рисунке 10.1, где на плоскости двух факторов x1, x2 изображена функция отклика у топографическим способом с помощью замкнутых линий постоянного уровня этой оптимизируемой выходной функции. Эти линии соответствуют некоторым относительным величинам, однако форма функции отклика до начала исследования обычно неизвестна. I этап. Производится поиск частного экстремума по первому фактору x1, остальные факторы остаются неизменными, то есть стабилизируются. 1 – Выбирают основную (начальную, базовую) точку М0, обычно она соответствует номинальному режиму ведения технологического процесса x 0=(x10; x20; …; xk0). Иногда эту точку выбирают в центре области, которую желательно исследовать, либо в центре области ограничений, если они имеются. 261 x2 M11 Δx2 x20 M6 M9 M12 M13 M14 M8 M15 M5 M4 M3 M2 M0 M1 M7 x1 0 Δx1 x10 Рисунок 10.1 – Поиск экстремума функции отклика методом Гаусса-Зайделя 2 – Выбирают интервал варьирования Δ x1 по фактору x1. Интервал не должен быть слишком малым, иначе движение к экстремуму окажется замедленным. Кроме того, на интервале варьирования Δ xi (i=1, 2, …, k) изменение целевой функции Δ y должно быть существенно большим, чем погрешность ее измерения δy (не менее чем в 5–10 раз) 3. Определяют координаты пробных точек М1 и М2: x (М1) = (x10+Δx1; x20; …; xk0), x (М2) = (x10–Δx1; x20; …; xk0). 4. В точках М1 и М2 ставят пробные опыты (для повышения точности результатов могут выполняться параллельные опыты) и измеряют отклики у(М1) и у(М2). 5. Сравнивают полученные отклики, и если у(М2) > у(М1), то совершают рабочее движение на один рабочий Δ шаг x1 по → направлению M 0M 2 в точку М3. 6. Аналогичные шаги продолжают в том же направлении до тех пор, пока на каком-то m-м шаге не окажется, что у(Мm) < у(Мm–1), то 262 есть значение отклика в очередной, m-й рабочей точке станет уменьшаться, – это и служит признаком достижения частного экстремума. За частный экстремум принимают (m–1)-ю точку с откликом у(Мm–1). На рисунке 4.1 это точка М5. II этап. Его проводят в том порядке, что и I этап, с той лишь разницей, что стабилизируют все факторы, кроме x2. За новую базовую точку принимают точку с координатами x (Мm–1) = (x10+Δx1·(m–2); x20; …; xk0), а x2 варьирую на выбранную по аналогичным условиям величину интервала Δ x2. По достижении частного экстремума по фактору x2 точку нового частного экстремума принимают за новую базовую точку. На рисунке 10.1 это точка М9. Первый цикл продвижения к экстремуму заканчивается n-м этапом, на котором стабилизируются все факторы, кроме xk. Для него выбирают интервал варьирования Δ xk и совершают пробное, а затем рабочее движение до достижения частного экстремума по фактору xk. Если экстремум не достигнут, то выполняют второй цикл поиска. Второй цикл, как и первый, начинается с I этапа, на котором варьируют фактор x1 (i ≠ 1), затем последовательно выполняют k этапов по каждому из k факторов. Поисковое шаговое движение к экстремуму заканчивают по достижении такой точки факторного пространства, при движении из которой в любую сторону по всем n факторным осям xi в положительном или отрицательном направлениях значения отклика оказываются меньшими. Такую точку принимают за экстремум (в рассматриваемом случае – максимум). Достоинства метода Гаусса-Зайделя: – простота стратегии и наглядность; – высокая помехозащищенность в смысле выбора направления движения. Недостатки: – путь к главному экстремуму оказывается обычно долгим, особенно при большом числе факторов; – если поверхность отклика имеет сложную форму, то использование метода может привести к ложному ответу на вопрос о месте расположения экстремума; – метод не дает информации о взаимодействиях факторов. Исторически метод Гаусса-Зайделя известен как первый из рассматриваемых. При увеличении количества воздействующих 263 факторов до 5–6 применять этот метод для оптимизации процессов неэффективно. 10.3 Метод случайного поиска Характерной чертой этого метода является случайный выбор направления движения на каждом шаге, то есть одновременное изменение значений сразу всех факторов. Так, если изображающая точка после i-го шага занимает xm положение в факторном пространстве, то следующий рабочий шаг будет совершен лишь после выполнения пробного эксперимента в точке xm+1 = xm + z, где z – случайный вектор определенной длины (рисунок 10.2). x2 k+2 k+1 k x1 0 Рисунок 10.2 – Поиск экстремума функции отклика методом случайного поиска Значения у(xm) и у(xm+z) сравниваются, и производится (i+1)-й рабочий шаг вдоль вектора по направлению к экстремуму. Как правило, длина рабочего шага превышает длину пробного. Критерием выхода в область экстремума целевой функции (функции отклика) является возрастание числа неудачных шагов, то есть многократное повторение положения, когда у(xm+z) < у(xm). Достоинство – метод случайного поиска очень прост, но он 264 применим лишь для очень простых ситуаций. Основные недостатки метода: – большая трудоемкость и длительность поиска экстремума; – возможность ошибки при попадании в область локального экстремума. 10.4 Градиентные методы Градиентные методы имеют несколько разновидностей, различающихся правилами выбора ступеней варьирования и рабочих шагов на каждом этапе движения к экстремуму. Сущность стратегии всех этих разновидностей состоит в том, что на каждом этапе вокруг очередной базовой точки организуют пробные эксперименты, по результатам которых оценивают новое направление градиента, после чего в этом направлении совершают рабочий шаг. Вектор-градиент в n-факторном пространстве определяется соотношением 0 0 grad y = (∂y/∂x1) x 1 + (∂y/∂x2) x 2 + … + (∂y/∂xk) x 0k , (10.4) 0 где x i (i=1, 2, …, n) – единичные направляющие векторы (орты), расположенные вдоль факторных осей; ∂y/∂xi – частная производная целевой функции по i-му фактору. Пробные опыты (по два в точках, расположенных на прямых, параллельных каждой факторной оси и проходящих через базовую точку) проводят с целью получить приближенные оценки частных производных. Рассмотрим две основные разновидности градиентных методов. Обычный метод градиента осуществляется по следующей процедуре: 1 – Выбирают начальную (базовую) точку x 0=(x10; x20; …; xno). На рисунке 10.3 это точка L0. 2 – Выбирают интервал варьирования Δxi по каждому из факторов xi (i=1, 2, …, k), пользуясь уже определенными ранее правилами. 3 – Определяют координаты пробных точек (рисунок 10.3). x2 265 L10 L9 L5 L7 L6 L8 Δx2 x20 Δx2 L1 L4 L0 L2 L3 Δx1 x10Δ x1 x1 Рисунок 4.3 – Поиск экстремума функции отклика методом градиента Вдоль направления, параллельного факторной оси x1, ими являются точки L1, L2 с координатами x (L1) = (x10 – Δx1; x20; …; xko), x (L2) = (x10 + Δx1; x20; …; xko). то есть варьируют один фактор x1 при стабилизации остальных факторов на базовом уровне. Аналогично вычисляют координаты пробных точек вдоль направлений, параллельных остальным факторным осям x2; x3; …; xk. Вдоль направления, параллельного факторной оси x2, такие точки – L3, L4 с координатами x (L3) = (x10; x20 – Δx2; …; xko), x (L4) = (x10; x20 + Δx2; …; xko). В пробных точках ставят опыты и получают значения целевой функции Y. 4 – По результатам пробных опытов вычисляют оценки составляющих вектор-градиента в точке L0 для каждого i-го фактора: ∧ grady ( L 0 ) x = ∂y ∂xi ≈ ∆y x (2∆xi ) = b i i (10.5) i В частности, для фактора x1 по результатам опытов в точках L1 и L2 вычисление выполняют по формуле ∧ grady ( L 0 ) x1 ≈ ∆y x1 (2∆x1 ) = [ y ( L2 ) − y ( L1 )] [ x1 ( L2 ) − x1 ( L1 )] = b1 . (10.6) Как известно, частные производные являются коэффициентами 266 ai (i=1, 2, …, n; i≠0) уравнения плоскости, касательной к поверхности отклика в точке L0: y = b0 + b1x1 + b2x2 + … + bkxk. (10.7) ∧ Оценки b i коэффициентов получают по формуле (10.5). 5 – Находят координаты рабочей точки на направлении градиента. Для этого выбирают параметр рабочего шага ρгр и вычисляют координаты первой рабочей точки по всем факторным осям xi (i =1, 2, …, k): ∧ (10.8) xi1 = xi0 + ρгр b i 0 . На рисунке 10.3 первой рабочей точкой является точка L5. Чтобы из основной точки L0 попасть в точку L5, от L0 откладывают в ∧ ∧ ∧ масштабе отрезки, равныеρ гр b1 и ρ гр b 2 , причем если b i <0, то по соответствующему фактору отрезок откладывают в отрицательном направлении от точки L0, то есть для фактора x1 – влево от точки L0, а ∧ ∧ для фактора x2 – вниз от точки L0. Если b i >0, то отрезкиρ гр b i откладывают в положительном направлении от основной точки. 6 – Первую рабочую точку принимают за новую базовую точку и вокруг нее организуют новые пробные опыты для оценивания нового направления градиента, после чего совершают новый рабочий шаг (на рисунке 10.3 – в точку L10). В общем случае в каждой m-й рабочей точке по результатам пробных опытов вокруг нее получают ∧ оценки составляющих градиента b im и совершают (m+1)-й рабочий шаг (m = 0, 1, 2, …) в точку с координатами ∧ xi, m+1 = xi m + ρгр b im . (10.9) 7 – Рабочее движение производят до тех пор, пока на очередном шаге все составляющие градиента не станут пренебрежимо малыми, ∧ то есть b i ,m+1 ≈0 (i=1, 2, …, n). Для этого достаточно, чтобы выполнялось неравенство ∧ ρгр b i ,m+1 < 1 (10.10) Если по результатам пробных опытов в (m+1)-й рабочей точке выполняется условие (10.10), то движение к экстремуму прекращают и эту рабочую точку принимают за точку экстремума. Достоинства метода градиента: – достаточная простота стратегии; – повышенная по сравнению с методом Гаусса-Зайделя скорость движения к экстремуму (эффективность). 267 Недостатки: – большая чуткость к помехам в отношении выбора направления рабочего движения; – в случаях, когда поверхность отклика имеет сложную форму, метод градиента может не привести к истинному экстремуму; – если поверхность отклика достаточно пологая, то в условиях помех метод мало эффективен в смысле точности выхода к экстремуму; Метод Кифера-Вольфовица является разновидностью градиентного метода и отличается от описанного выше обычного метода градиента тем, что если в первом из них размеры интервалов варьирования Δxi при постановке пробных экспериментов и параметр ρгр рабочего шага остаются неизменными на любом рабочем шаге, то в рассматриваемом методе Δxik и ρ грm выбирают в зависимости от номера k рабочего шага: Δxim = Δxi0/(γm), ρгрm = ρгр0/m, (10.11) где Δxi0 – начальный интервал варьирования в основной точке L0; ρгр0 – начальное значение параметра рабочего шага; m – номер рабочего шага (m = 1, 2, …); γ – постоянная степень, обычно выбираемая в пределах 0 < γ < 0,5. Чаще всего полагают γ=0,25. Если в методе градиента фактический размер m-го рабочего шага уменьшается только из-за уменьшения градиента, то есть крутизны наклона поверхности отклика, при приближении к области экстремума, то в методе Кифера-Вольфовица фактический размер рабочего шага уменьшается в прямой зависимости от номера этого шага. Достоинством метода Кифера-Вольфовица по сравнению с немодифицированным методом является его повышенная точность нахождения экстремальной точки, если поверхность отклика достаточно крутая, а экстремум находится от базовой точки не слишком далеко. Недостатком является его низкая эффективность в условиях пологих поверхностей отклика. При очень пологих поверхностях отклика этот метод вообще не приводит к цели: рабочие шаги 268 становятся сравнимыми с погрешностями измерения до достижения экстремума. Остальные достоинства и недостатки, а также вся процедура работы такие же, как и в методе градиента. 10.5 Метод крутого восхождения (метод Бокса-Уилсона) Метод крутого восхождения предложен Дж. Боксом и К. Уилсоном как синтез лучших черт градиентных методов и метода Гаусса-Зайделя, причем пробные опыты для выяснения направления движения выполняют методом полного факторного эксперимента (ПФЭ) или дробного факторного эксперимента (ДФЭ). От градиентных методов здесь воспринято выполнение рабочего движения вдоль вектор-градиента, определенного в районе исходной (базовой) точки, а от метода Гаусса-Зайделя взят принцип продвижения не на один рабочий шаг (как в методе градиента), а до достижения частного экстремума функции отклика на направлении градиента, без его корректировки на каждом рабочем шаге. Проведение ПФЭ или ДФЭ позволяет более точно оценивать направление градиента, чем при традиционном методе градиента, и получать информацию о взаимодействиях факторов и достаточно просто осуществлять статистическую проверку результатов расчетов. На первом цикле метода крутого восхождения используется следующая процедура: 1 – Выбирают основную (базовую, нулевую) точку К0 (рисунок 10.4). Правила ее выбора прежние. 2 – Выбирают интервал варьирования Δxi для каждого фактора xi (i = 1, 2, …, k) по изложенным ранее правилам. 3 – Определяют координаты пробных точек для нижнего и верхнего уровней варьирования факторов xi по правилам ПФЭ xiн = xi0 – Δxi , xiв = xi0 + Δxi (10.12) и составляют ортогональную матрицу планирования ПФЭ или ДФЭ, для чего факторы нормируют по формуле: xiб = (xi – xi0) / Δxi (10.13) Затем выбирают число n серий параллельных опытов, порядок проведения опытов в сериях рандомизируют с помощью таблицы случайных чисел (Приложение А) и в этом порядке выполняют наблюдения отклика в точках ПФЭ и ДФЭ (на рисунке 10.4 это точки K1, K2, K3, K4). 269 x2 B A K11 K10 K9 K8 x2В x20 x2Н K3 K0 K1 K4 K7 K2 x1 x1Н x10 x1В Рисунок 10.4 – Поиск экстремума функции отклика методом крутого восхождения 4 – По результатам ПФЭ (или ДФЭ) вычисляют оценки коэффициентов нормированного уравнения регрессии первого порядка ∧ ∧ ∧ ∧ ∧ y = b 0 + b1 x1б + b 2 x2 б + ... + b n xnб , (10.15) ∧ а также производят статистическую проверку значимости b i , для чего можно рассчитать критическое значение коэффициентов: ∧ ∧ b кр = tкрs{ b i }, (10.16) где tкр = tтабл {νзн; q}, выбираемое из таблицы (Приложение А) при числе степеней свободы νзн = N(n-1) и принятом уровне значимости β. 5 – Вычисляют расчетные i-е составляющие рабочих шагов в реальном масштабе: ∧ λi = b i Δxi. (10.17) Максимальное по модулю из всех λ i (i=1, 2, …, k) принимают за базовое λбаз. 6 – Получают практические (округленные) i-е составляющие рабочих шагов λ0iокр для продвижения вдоль направления градиента (на рисунке 10.4 это луч К0А), для чего округляют (или изменяют) λбаз до удобногоλ баз.окр и пропорционально этому округляют (или 270 изменяют) остальныеλ i до λ i окр (i=1, 2, …, k). Округлениеλ i производят по формуле λi окр = (λбаз.окр / λбаз) λi (10.18) до удобного значения либо с учетом погрешностей измерения по каждому фактору xi. Знаки λ i окр должны соответствовать (в случае поиска максимума, если отыскивается минимум, то знаки λ i окр ∧ должны быть противоположны) знакам оценок b i коэффициентов. 7 – Вычисляют координаты m-х рабочих точек (m = 1, 2, …) на направлении градиента (на рисунке 10.4 это точки К5 – К11) в реальном масштабе: xim = xi0 + m λi окр; (10.19) в них последовательно выполняют мысленные и проверочные (реальные) опыты. Размерλ i обычно выбирают так, чтобы первая рабочая точка (m=1) не выходила за границы области ПФЭ или ДФЭ. Мысленные опыты заключаются в получении предсказанных ∧ (расчетных) значений отклика y t по полученному линейному уравнению (10.15). Они позволяют: – сокращать объем реальных опытов, то есть увеличить скорость продвижения к экстремуму; – иметь представление, насколько хорошо уравнение (10.15) аппроксимирует реальную поверхность отклика, то есть насколько расчетные значения отличаются от результатов наблюдавшихся значений в реальных опытах; – оценивать правильность выбора размера составляющих практического рабочего шагаλ ( i окр): если за число шагов k=3 достигается и превышается максимально возможное расчетное значение целевой функции (определяемое из физических свойств и ограничений, существующих для объекта), то λ i окр нужно уменьшить; если же число k слишком большое, тоλ i окр следует увеличить или реже ставить реальные опыты. Реальные (проверочные) опыты в начале движения из базовой точки вдоль направления градиента ставят через 2 – 4 мысленных опыта, а при уменьшении приращений наблюдавшихся значений отклика в каждом последующем реализованном по сравнению с предыдущим в рабочих точках проверочные ставят чаще, вблизи частного экстремума выполняют на каждом шаге. Рабочее движение продолжают, пока не будет достигнут частный экстремум на направлении градиента (на рисунке 10.4 это 271 точка К9). Признаком достижения частного экстремума является уменьшение (в случае поиска максимума) отклика в последующих проверочных опытах. 8 – Точку частого экстремума на первоначальном направлении градиента (на рисунке 10.4 это точка К9 на луче К0А) принимают за новую нулевую точку и организуют второй цикл крутого восхождения. Порядок работы на втором цикле тот же, что и на первом. Различие состоит в том, что интервалы варьирования при постановке пробных опытов (ПФЭ или ДФЭ) и размер рабочих шагов в связи с приближением к экстремуму и увеличением кривизны поверхности отклика обычно выбирают меньшими, чем на первом цикле. В случае необходимости выполняют третий цикл крутого восхождения. 9 – Поисковое рабочее движение прекращают по достижении области экстремума. Признаком достижения экстремума является ∧ статистическая незначимость оценок b i коэффициентов при членах первого порядка, вычисленных по результатам ПФЭ (ДФЭ) вокруг очередной нулевой точки. Достоинства метода крутого восхождения: – высокая помехозащищенность (помехоустойчивость) в смысле точности оценивания составляющих градиента: если в градиентных ∧ методах каждая составляющая b i оценивается лишь по двум точкам факторного пространства, то в ПФЭ, который в методе крутого ∧ восхождения используется для этой цели, каждый коэффициент b i оценивается по всем N=2k точкам; – высокая эффективность в смысле скорости движения к экстремуму; по сравнению с методом Гаусса-Зайделя она выше за счет продвижения по градиенту, а по сравнению с градиентным – за счет исключения пробных опытов на каждом рабочем шаге и за счет мысленных опытов; – пробные опыты, выполняемые методом ПФЭ, позволяют получать информацию об взаимодействиях факторов ∧ оценках b ij коэффициентов при xixj, характеризующих кривизну ∧ ∧ поверхности отклика: увеличение b ij при уменьшении b i обычно характеризует приближение к экстремуму; – ПФЭ с применением параллельных опытов позволяет достаточно просто осуществлять надежную статистическую 272 интерпретацию результатов; – метод наиболее эффективен из известных при пологих поверхностях отклика. Недостатком рассмотренного метода является несколько большая, чем в предыдущих методах, сложность планирования пробных опытов, требующая одновременного варьирования сразу всех факторов относительно базовой точки, и меньшая оперативность по сравнению с симплексным методом в условиях дрейфующих объектов. 10.6 Симплексный метод Симплексом называют выпуклую фигуру (или тело), образованную k+1 вершинами в пространстве k факторов, причем эти k+1 вершин не принадлежат одновременно ни одному из подпространств из k-1 факторов. Симплекс называется регулярным, если все расстояния между его вершинами равны. В пространстве одного фактора (k=1) симплексом служит отрезок установленного размера, при k=2 – треугольник, при k=3 – тетраэдр. При k≥4 привычным образом интерпретировать симплекс невозможно. Симплексный метод позволяет совмещать пробные опыты для определения направления движения с рабочим движением по поверхности отклика к области оптимума. Основная идея симплексного метода в следующем. Если во всех k+1 вершинах симплекса поставить опыты и измерить отклик, то (при не слишком большом уровне шумов) по величине отклика в вершинах можно судить, в каком направлении следует двигаться, чтобы приблизиться к экстремуму. После проведения серии опытов, поставленных в вершинах правильного симплекса, определяется точка, соответствующая условиям, при которых получаются наихудшие результаты. Затем используется важное свойство симплекса, по которому из любого симплекса можно, отбросив одну из вершин, получить новый, заменив отброшенную вершину ее зеркальным отражением относительно противоположной его грани. Если отбросить точку с наихудшими результатами и построить на оставшейся грани новый симплекс, то его центр будет смещен в направлении: худшая точка – центр тяжести остальных точек, то есть в направлении к экстремуму. Затем процесс отбрасывания вершины с наихудшим значением целевой функции и построения нового 273 симплекса повторяется. Если значение выхода в новой вершине снова окажется наихудшим, то нужно вернуться к исходному симплексу и отбросить следующую по порядку вершину с плохим результатом. В результате этого образуется цепочка симплексов, перемещающихся в факторном пространстве к точке экстремума. Таким образом, движение к экстремуму осуществляется путем зеркального отражения точки с наихудшими результатами относительно центра противоположной грани симплекса. Порядок работы при использовании симплексного метода следующий: 1 – Выбирают начальную точку С1, а также интервалы варьирования Δxi для всех факторов (i=1, 2, …, k). 2 – Выбирают безразмерную величину ρсим стороны (или ребра) симплекса в относительных единицах по отношению к интервалам варьирования Δ xi . Наиболее просто выбрать ρсим=1. Стремятся, чтобы в безразмерных единицах стороны симплекса были равны. 3 – Вычисляют координаты остальных вершин начального симплекса. Обычно для этого используют следующее правило. Через начальную точку С1 проводят осевые линии, параллельные координатным осям, и выбирают квадрант, в котором по предположению, должен располагаться экстремум целевой функции. В начальную точку помещают вершину симплекса С1 (рисунок 10.5), а сам симплекс I располагают так, чтобы его стороны образовали с осевыми линиями равные углы. При таком расположении начального симплекса координаты его вершин определяют с помощью матрицы (таблица 10.1), в которой даны координаты вершин (k+1)-мерного симплекса в n-факторном пространстве. x2 C12 C10 C13 C14 C8 C11 C9 C6 C7 C5 C4 C3 C2 274 x20 C1 pΔx1 Рисунок qΔx1 x10 10.5 – Поиск экстремума симплексным методом x1 функции отклика Безразмерные относительные величины p и q при таком расположении симплекса определяют по формуле: p = ( k + 1 + k − 1) (k 2 ), q = ( k + 1 − 1) (k 2 ). (10.20) На рисунке 10.5 показаны размеры pΔx1 и qΔx1 для случая ρсим=1. Если принимают ρсим≠1, то Δxi умножают еще на ρсим. Знаки Δxi зависят от номера квадранта, в котором расположен начальный симплекс. Для k=2 имеем p≈0,966, q≈0,259. Таблица 10.1 –Задание координат вершин симплекса Факторы xi x1 x2 x3 … xi … xk x10+qΔx1 x20+pΔx2 x30+qΔx3 … xi0+qΔxi … … xk0+qΔxk … … xi0+pΔxi …xk0+qΔxk … … … xi0+qΔxi … x10+qΔx1 x20+qΔx2 x30+qΔx3 … … … … Вершина Ck+1 x10+qΔx1 x20+qΔx2 x30+qΔx3 … … Вершина Ci+1 … Вершина C3 … … xk0 … xk0+qΔxk … … xi0 … xi0+qΔxi … x10 x20 x30 x10+pΔx1 x20+qΔx2 x30+qΔx3 … Вершина C1 Вершина C2 … xk0+pΔxk 4 – В вершинах симплекса выполняют наблюдения отклика и сравнивают по величине; выбирают вершину с минимальным откликом и отражают ее относительно противолежащей стороны или грани; находят вершину следующего симплекса II, n вершин которого одновременно являются и вершинами предыдущего симплекса I. Координаты отраженной вершины вычисляют по формуле xil , m +1 = [2( xi1m + xi 2 m + ... + xi , n +1, m ) k ] ± xilm , (10.21) где i – номер фактора (i=1, 2, …, k); l – номер вершины m-го симплекса, где обнаружен минимальный (в случае нахождения максимума) отклик; m+1 – номер последующего симплекса, содержащего отраженную 275 вершину (ей условно присваивают тот же номер l); k – число факторов. Если минимальный отклик оказался сразу в двух вершинах, то вопрос, какую из них отражать, решают произвольно. 5 – Ставят эксперимент в отраженной вершине нового симплекса и отклик в ней сравнивают с откликами в остальных вершинах, а затем снова выбирают вершину с минимальным откликом и отражают ее через противолежащую сторону (или грань) симплекса. Если в новой вершине (m+1)-го симплекса отклик оказался опять минимальным, то возвращаются к m-му симплексу и отражают вторую по минимальности вершину. Если это явление повторяется, то отражают третью по минимальности вершину и так далее. 6 – Эксперимент продолжают до тех пор, пока симплекс не совершит полный оборот вокруг одной из вершин. На рисунке 10.5 это вершина С11. Точность нахождения точки экстремума зависит от двух причин: размера симплекса и влияния помех. Для уточнения положения экстремальной точки статического объекта в последних симплексах рекомендуется ставить параллельные опыты, чтобы снизить влияние помех, а также выполнить опыт в середине того симплекса, в вершинах которого отклик оказался максимальным по сравнению с остальными симплексами. Достоинства симплексного метода: – достаточно высокая помехоустойчивость в смысле выбора направления движения к экстремуму; – изучение поверхности отклика сочетается с одновременным рабочим движением к экстремуму; – при оптимально выбранном размере симплекса обеспечивается высокая скорость выхода к области экстремума; – высокая оперативность, позволяющая использовать этот метод особенно для непрерывной оптимизации объектов с дрейфующим экстремумом. Недостатки метода: – метод не позволяет непосредственно получать математическое описание изучаемого участка поверхности отклика, как, например, в методе Бокса-Уилсона; – в условиях пологих поверхностей отклика симплексный метод дает менее точное решение, чем метод крутого восхождения. 276 10.7 Решение типового примера Пример Оптимизация процесса проводится в соответствии с априорной информацией по трем факторам: температура испарения (А), температура подложки при осаждении (В) и термообработки (С) резистивных пленок рения. Значения переменных при исследовании свойств резистивных пленок приведены в таблице 10.2. Таблица 10.2 – Значения переменных при исследовании резистивных пленок Фактор А В С Кодовые обозначения X1 X2 X3 Основной уровень Xi0 25000С 4000С 4000С Интервал варьирования ΔXi 500С 500С 500С Решение В результате исследования получено математическое описание исследуемой области (процесс получения модели представлен в практическом занятии №6) Yt=2,15 – 0,1X1б – 0,1X2б – 0,2X3б, где Yt –теоретическое значение функции отклика (параметр оптимизации), в качестве которого выбран температурный коэффициент сопротивления резистивных пленок (ТКС·104/0C); Xiб – приведенные переменные (безразмерные значения факторов), полученные по (10.13). Последовательность процесса оптимизации представлена в таблице 10.3. Таблица 10.3 – План проведения и результаты эксперимента, проведенного методом крутого восхождения Факторы X1 X2 X3 Значения Коэффициент bi -0,1 -0,1 -0,2 функции biΔXi -5,0 -5,0 -10,0 отклика Шаг варьирования 5,00С 5,00С 10,00С Исходная (начальная) точка 25500С 4500С 4500С Yξt Yξ 277 Первый реализованный опыт Второй реализованный опыт Третий реализованный опыт Четвертый реализованный опыт Пятый реализованный опыт 25700С 25900С 26100С 26300С 4700С 4900С 5100С 5300С 4900С 5300С 5700С 6100С 1,50 1,25 1,00 0,80 1,70 1,40 1,30 1,00 26500С 5500С 6500С 0,55 1,10 По программе «крутого восхождения» (таблица 10.3) намечены так называемые «мысленные опыты» и некоторые их них (через три) реализованы для проверки соответствия теоретического значения, предсказанного для j-го опыта (Yξt) полученным в результате ПФЭ уравнением, и соответствующего экспериментального значения (Yξ). Пятый опыт не показал уменьшения ТКС по сравнению с четвертым реализованным, и экспериментальное значение ТКС Yξ=1,1 существенно отличается от его теоретического значения Yξt=0,55. Поэтому продолжать движение в прежнем направлении не имеет смысла. Целесообразно поставить новую серию опытов с центром в точке 4 (как имеющей наилучший результат) и найти новое направление для движения к экстремуму. 10.8 Задачи для решения 1. Оптимизировать математические модели в виде полиномов 1порядка, полученные в результате обработки результатов активного эксперимента (практические занятия № 6, 7, 8). 2. Найти минимум функции: 2.1 Y = X 12 + 3 X 22 + 2 X 1 X 2 2.2 Y = 100( X 2 − X 12 ) 2 + (1 − X 1 ) 2 2.3 Y = 1 − 2 X 1 − 2 X 2 − 4 X 1 X 2 + 10 X 12 + 2 X 22 2.4 Y = X 12 + X 22 2.5 Y = 3 X 12 + 5 X 22 + 4 X 1 X 2 2.6 Y = X 12 + 6 X 1 X 2 − 4 X 1 − 2 X 2 2 2 2 2.7 Y = X 1 + X 2 + X 3 2.8 Y = ( X 1 − 1) 2 + ( X 2 − 3) 2 + 4( X 3 + 5) 2 2.9 Y = 3( X 1 − 1) 2 + 2( X 2 − 2) 2 + ( X 3 − 3) 2 2.10 Y = 3( X 1 − 4) 2 + 5( X 2 + 3) 2 + 7(2 X 3 + 1) 2 278 10.9 Контрольные вопросы 1. Как формулируется задача оптимизации? 2. Какими подходами можно решить задачу оптимизации? 3. Что общего у всех методов экспериментального поиска экстремума? 4. В чем заключается основная идея и процедура метода ГауссаЗайделя? 5. В чем заключается основная идея и процедура метода случайного поиска? 6. В чем заключается основная идея и процедура обычного градиентного метода? 7. В чем заключается основная идея и процедура метода Кифера-Вольфовица? 8. В чем заключается основная идея и процедура симплексного метода? 9. В чем заключается основная идея и процедура метода крутого восхождения (Бокса-Уилсона)? 10. Сравните известные поисковые методы по помехоустойчивости в смысле выбора направления движения. 11. Сравните поисковые методы по помехоустойчивости в смысле точности выхода к экстремуму. 12. Сравните методы поиска по эффективности, то есть по скорости выхода к экстремуму. 13. Каковы достоинства и недостатки поисковых методов? 14. Что служит критерием достижения экстремума в поисковых методах? 15. В чем состоит роль мысленных опытов и как они проводятся? 16. Как выполняется статистический анализ результатов в методе крутого восхождения? 17. Как выполняется оптимизация при многоэкстремальной поверхности отклика? 18. Что служит критерием для выбора начальной точки исследования? 19. Что служит критерием для выбора интервала варьирования для каждого фактора? 279 Литература 1. Воронина О.А. Математические основы планирования и проведения эксперимента. Учеб. пособие / О.А. Воронина - Орел: ОрелГТУ – 2007. 2. Современный эксперимент: подготовка, проведение, анализ результатов / В.Г. Блохин , О.П. Глудкин , А.И. Гуров , М.А Ханин. Под ред. О.П. Глудкина – М.: Радио и связь, 1997. 3. Статистические методы в инженерных исследованиях (лабораторный практикум): Учеб. пособие / В.П. Бородюк , А.П. Вощинин , А.З. Иванов и др. Под ред. Г.К. Круга – М.: Высшая школа, 1983. 4. Грачев Ю.П. Математические методы планирования эксперимента /Ю.П. Грачев, Ю.М. Плаксин Ю.М- М.: ДеЛи принт 2005г. 5. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь - М.: ФИЗМАТЛИТ, 2006 6. Вуколов Э. А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL: учебное пособие / Э. А. Вуколов — М. : ФОРУМ : ИНФРА-М, 2010 7. Денисенко В.В. Компьютерное управление технологическим процессом, экспериментом, оборудованием. / В.В. Денисенко - М.: Горячая линия-Телеком, 2009. 8. ГОСТ Р 50.1.040-2002 Статистические методы. Планирование экспериментов. Термины и определения 9. Охорзин В.А. Прикладная математика в системе MATHCAD: Учебное пособие. / В.А. Охорзин – СПб.: Лань, 2008. 10. Лагутин М. Б. Наглядная математическая статистика / М. Б. Лагутин - М.: Бином. Лаборатория знаний, 2007. 11. Макаров А.А. Анализ данных на компьютере / Ю.Н Тюрин, А.А. Макаров – М.: Инфра-М, 2003. 12. Львович Я.Е. Теоретические основы конструирования, технологии и надежности РЭА: Учеб. пособие для вузов / Я.Е.Львович , В.Н.Фролов - М.: Радио и связь, 1986. 13. Журнал «Математическое моделирование» [Электронный ресурс] http://www.mathnet.ru/php/journal.phtml?jrnid=mm&option_lang=rus 281 Приложение А (обязательное) СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ Таблица А1 – Значения tкр распределения (критерий Стьюдента) ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0,5 1,00 1,816 1,765 1,741 1,727 1,718 1,711 1,706 1,703 1,700 1,697 1,695 1,694 1,692 1,691 1,690 1,689 1,688 1,688 1,687 0,25 2,41 1,60 1,42 1,34 1,30 1,27 1,25 1,24 1,23 1,22 1,21 1,21 1,20 1,20 1,20 1,19 1,19 1,19 1,19 1,18 Коэффициент риска β 0,1 0,05 0,025 0,01 6,31 12,7 25,5 63,7 2,92 4,30 6,21 9,92 2,35 3,18 4,18 5,84 2,13 2,78 3,50 4,60 2,01 2,57 3,16 4,03 1,94 2,45 2,97 3,71 1,89 2,36 2,84 3,50 1,86 2,31 2,75 3,36 1,83 2,26 2,68 3,25 1,81 2,23 2,63 3,17 1,80 2,20 2,59 3,11 1,78 2,18 2,56 3,05 1,77 2,16 2,53 3,01 1,76 2,14 2,51 2,98 1,75 2,13 2,49 2,95 1,75 2,12 2,47 2,92 1,74 2,11 2,46 2,90 1,73 2,10 2,44 2,88 1,73 2,09 2,43 2,86 1,72 2,09 2,42 2,85 281 0,005 127 14,1 7,45 5,60 4,77 4,32 4,03 3,83 3,69 3,58 3,50 3,43 3,37 3,33 3,29 3,25 3,22 3,20 3,17 3,15 0,001 637 31,6 12,9 8,61 6,86 5,96 5,40 5,04 4,78 4,59 4,44 4,32 4,22 4,14 4,07 4,01 3,96 3,92 3,88 3,85 282 Таблица А2 – Значения Fкр для различных значений коэффициента риска β ν1 ν2 1 2 3 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 161,45 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 199,50 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,88 3,80 3,74 3,68 3,63 3,59 3,55 3,52 3,49 215,72 19,16 9,28 6,59 5,41 4,76 4,35 4,07 4,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 224,57 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 4052,1 98,49 34,12 21,20 16,26 13,74 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,28 8,18 8,10 4999,0 99,01 30,81 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,20 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5403,5 99,17 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,18 5,09 5,01 4,94 5625,1 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,20 5,03 4,89 4,77 4,67 4,58 4,50 4,43 β 5 β =0,05 230,17 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,02 2,96 2,90 2,85 2,81 2,77 2,74 2,71 =0,01 5764,1 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 282 6 8 12 ∞ 233,97 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 238,89 19,37 8,84 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 243,91 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 254,32 19,50 8,53 5,63 4,36 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 5859,4 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 5981,3 99,36 27,49 14,80 10,27 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,70 3,71 3,63 3,56 6105,8 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,45 3,37 3,30 3,23 6366,5 99,50 26,12 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,16 3,00 2,87 2,75 2,65 2,57 2,49 2,42 283 Таблица А3 – Значения критерия Кохрена Gкр для номеров опытов, каждый из которых состоит из n параллельных опытов, при заданных значениях коэффициента риска (при N= ∞ Gкр=1 для всех значений n; при n= ∞ Gкр=1/N) β =0,05 N 2 3 4 5 6 7 8 9 10 12 15 20 2 * 0,97 0,91 0,84 0,78 0,73 0,68 0,64 0,60 0,54 0,47 0,39 3 0,97 0,87 0,77 0,68 0,62 0,56 0,52 0,48 0,44 0,39 0,33 0,27 4 0,94 0,80 0,68 0,60 0,53 0,48 0,44 0,40 0,37 0,33 0,28 0,22 5 0,91 0,75 0,63 0,54 0,48 0,43 0,39 0,36 0,33 0,29 0,24 0,19 n 6 0,88 0,71 0,59 0,51 0,44 0,40 0,36 0,33 0,30 0,26 0,22 0,17 7 0,85 0,68 0,56 0,48 0,42 0,37 0,34 0,31 0,28 0,24 0,20 0,16 8 0,83 0,65 0,54 0,46 0,40 0,35 0,32 0,29 0,27 0,23 0,19 0,15 9 0,82 0,63 0,52 0,44 0,38 0,34 0,30 0,28 0,25 0,22 0,18 0,14 10 0,80 0,62 0,50 0,42 0,37 0,33 0,29 0,27 0,24 0,21 0,17 0,14 7 0,92 0,76 0,64 0,55 0,49 0,43 0,39 0,36 0,33 0,29 0,24 0,19 8 0,90 0,73 0,61 0,53 0,46 0,41 0,37 0,34 0,31 0,27 0,22 0,17 9 0,88 0,71 0,59 0,50 0,44 0,39 0,35 0,32 0,29 0,25 0,21 0,16 10 0,87 0,69 0,57 0,49 0,42 0,38 0,34 0,31 0,28 0,24 0,20 0,16 β =0,01 N 2 3 4 5 6 7 8 9 10 12 15 20 2 * 0,99 0,97 0,93 0,88 0,84 0,79 0,75 0,72 0,65 0,57 0,48 3 0,99 0,94 0,86 0,79 0,72 0,66 0,62 0,57 0,54 0,48 0,41 0,33 4 0,98 0,88 0,78 0,70 0,63 0,57 0,52 0,48 0,45 0,39 0,33 0,27 5 0,96 0,83 0,72 0,63 0,56 0,51 0,46 0,43 0,39 0,34 0,29 0,23 n 6 0,94 0,79 0,68 0,59 0,52 0,47 0,42 0,39 0,36 0,31 0,26 0,20 283 284 Таблица A4 – Равномерно распределенные случайные числа 10 37 08 99 12 66 31 85 63 73 98 11 83 88 99 65 80 74 69 09 91 80 44 12 63 61 15 94 42 23 04 00 35 59 46 32 69 19 45 94 98 33 80 79 18 74 54 11 48 2 09 54 42 01 80 06 06 26 57 79 52 80 45 68 59 48 12 35 91 89 49 33 10 55 60 19 47 55 48 52 49 54 96 80 05 17 23 56 15 86 08 18 95 75 63 02 17 66 32 3 73 20 26 90 79 57 01 97 33 64 01 50 20 54 46 11 43 09 62 32 91 69 48 07 64 69 44 72 11 37 35 99 31 80 88 90 46 54 51 43 62 51 10 24 33 94 84 44 47 4 25 48 89 25 99 47 08 76 21 57 77 54 96 02 73 76 56 98 68 05 45 45 19 37 93 04 52 85 62 83 24 76 53 83 52 05 14 14 49 19 48 62 04 91 25 39 56 98 79 5 33 05 53 29 70 17 05 02 35 53 67 31 34 00 48 74 35 17 03 05 23 98 49 42 29 46 66 73 13 18 94 54 07 91 36 97 06 30 38 94 26 32 06 40 37 02 11 83 28 6 76 64 19 09 80 34 45 02 05 03 14 39 06 86 37 17 17 77 66 14 68 26 85 11 16 26 95 67 97 73 75 64 26 45 01 89 20 01 19 36 45 41 96 71 98 77 80 52 31 7 52 89 64 37 15 07 57 05 32 52 90 80 28 50 51 46 72 45 25 22 47 94 15 10 50 45 27 89 34 20 24 05 89 42 39 37 11 75 47 16 24 94 38 96 14 55 99 07 24 8 01 47 50 67 73 27 18 16 54 96 56 82 89 75 76 85 70 27 22 56 92 03 74 00 53 74 07 75 40 88 63 18 30 72 09 92 74 87 60 81 02 15 27 12 50 73 33 98 96 9 35 42 93 07 61 68 24 56 70 47 86 77 80 84 49 09 70 72 91 85 76 68 79 20 44 77 99 43 87 98 38 81 93 68 22 52 52 53 72 08 84 09 07 82 65 22 71 48 47 10 86 96 03 15 47 50 06 92 48 78 07 32 83 01 69 50 15 14 48 14 86 58 54 40 84 74 53 87 21 37 24 69 64 42 86 41 04 79 46 51 04 49 74 96 71 70 43 27 10 11 34 24 23 38 64 36 35 68 90 35 22 50 18 36 91 58 45 43 36 46 46 70 32 12 40 61 59 54 16 68 45 96 33 83 77 05 15 40 43 34 44 89 20 69 31 97 05 59 42 12 67 80 20 31 03 69 30 66 55 80 10 72 74 76 82 04 31 23 93 42 16 29 97 86 21 92 36 62 86 93 86 11 35 60 28 56 95 41 66 88 99 43 15 86 01 79 33 38 29 13 35 52 90 13 23 73 34 57 35 83 94 56 67 66 60 77 82 60 68 75 28 73 92 07 95 43 78 24 84 69 25 96 13 94 14 70 66 52 79 88 90 54 12 10 01 01 51 17 53 14 48 40 25 11 66 61 26 48 75 42 05 82 00 79 89 69 23 02 72 67 35 41 65 46 25 37 38 44 87 14 10 38 54 97 40 70 00 15 45 15 88 85 33 25 46 71 29 15 68 284 15 76 37 60 65 53 70 14 18 48 82 58 48 78 51 28 74 74 10 03 88 54 35 75 97 63 29 48 31 67 16 25 96 52 00 77 07 00 85 43 53 96 81 87 91 74 19 69 39 70 16 80 20 15 88 98 65 86 73 28 60 60 29 18 90 93 73 21 45 76 96 94 53 57 96 43 65 82 91 03 26 61 54 77 13 93 86 18 66 59 01 39 88 25 74 05 52 56 09 32 17 95 63 95 67 95 81 79 05 46 93 97 40 47 36 78 03 11 52 62 29 75 14 60 64 65 39 39 19 07 25 96 69 97 02 91 74 74 67 04 54 09 69 01 85 45 62 12 97 30 18 90 61 33 67 11 33 90 38 82 52 09 52 54 47 56 95 57 16 11 77 08 03 04 48 17 45 61 04 11 22 27 28 45 12 08 31 39 43 79 03 47 54 52 22 56 75 71 33 75 19 91 04 47 43 68 98 74 52 87 03 34 42 06 64 13 71 82 42 39 88 99 33 08 94 70 95 01 25 20 96 93 23 00 48 36 71 24 68 00 54 34 19 52 05 14 80 92 34 75 20 17 02 64 97 77 85 39 47 09 44 33 01 10 93 68 86 53 37 90 22 23 40 21 39 82 93 18 92 59 63 35 91 24 92 47 57 23 06 33 56 07 94 98 39 27 21 55 40 46 21 39 00 35 04 12 11 23 18 83 35 50 52 68 29 23 40 14 96 94 54 37 42 22 28 07 42 33 92 25 05 68 23 90 78 70 95 97 84 20 05 35 37 94 00 77 80 36 88 15 22 29 82 08 43 17 19 40 62 49 27 50 77 71 60 47 21 38 28 40 38 08 05 22 70 20 58 21 92 70 52 73 28 10 56 61 39 11 96 82 51 44 54 62 38 83 81 04 46 02 23 27 29 03 62 14 92 30 38 12 38 07 56 17 91 83 81 55 60 05 21 92 08 20 72 73 26 15 74 14 28 71 72 33 52 74 41 89 28 66 45 13 87 46 75 89 45 09 12 00 24 49 16 36 76 68 91 97 85 56 84 37 78 78 10 41 65 37 26 64 45 00 23 54 58 17 05 94 59 66 25 24 95 93 01 29 18 63 52 95 11 18 30 11 95 19 17 53 33 99 25 49 65 06 59 33 70 32 79 24 35 98 51 17 62 13 44 63 55 18 98 48 41 13 15 90 27 66 73 70 62 72 29 33 06 41 38 38 07 41 76 80 43 71 79 39 48 24 56 94 285 Таблица А5 – Значения вероятностей Р для критерия χ χ2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 2 ν 1 2 3 4 5 6 7 8 9 10 0,3173 0,6065 0,8013 0,9098 0,9626 0,9856 0,9948 0,9982 0,9994 0,9998 0,1574 0,3679 0,5724 0,7358 0,8491 0,9197 0,9598 0,9810 0,9915 0,9963 0,0833 0,2231 0,3916 0,5578 0,7000 0,8088 0,8850 0,9344 0,9643 0,9814 0,0455 0,1353 0,2615 0,4060 0,5494 0,6767 0,7798 0,8571 0,9114 0,9473 0,0254 0,0821 0,1718 0,2873 0,4159 0,5438 0,6600 0,7576 0,8343 0,8912 0,0143 0,0498 0,1116 0,1991 0,3062 0,4232 0,5398 0,6472 0,7399 0,8153 0,0081 0,0302 0,0719 0,1359 0,2206 0,3208 0,4289 0,5366 0,6371 0,7254 0,0047 0,0183 0,0460 0,0916 0,1562 0,2381 0,3226 0,4335 0,5341 0,6288 0,0027 0,0111 0,0293 0,0611 0,1091 0,1736 0,2527 0,3423 0,4373 0,5321 0,0016 0,0067 0,0186 0,0404 0,0752 0,1248 0,1886 0,2650 0,3505 0,4405 0,0009 0,0041 0,0117 0,0266 0,0514 0,0884 0,1386 0,2017 0,2757 0,3575 0,0005 0,0025 0,0074 0,0174 0,0348 0,0620 0,1006 0,1512 0,2133 0,2851 0,0003 0,0015 0,0046 0,0113 0,0234 0,0430 0,0721 0,1119 0,1626 0,2237 0,0002 0,0009 0,0029 0,0073 0,0156 0,0296 0,0512 0,0818 0,1223 0,1730 0,0001 0,0006 0,0018 0,0047 0,0104 0,0203 0,0360 0,0591 0,0909 0,1321 0,0001 0,0003 0,0011 0,0030 0,0068 0,0138 0,0251 0,0424 0,0669 0,0996 0,0000 0,0002 0,0007 0,0019 0,0045 0,0093 0,0174 0,0301 0,0487 0,0744 0,0001 0,0004 0,0012 0,0029 0,0062 0,0120 0,0212 0,0352 0,0550 0,0001 0,0003 0,0008 0,0019 0,0042 0,0082 0,0149 0,0252 0,0403 0,0000 0,0002 0,0005 0,0013 0,0028 0,0056 0,0103 0,0179 0,0293 0,0001 0,0003 0,0008 0,0018 0,0038 0,0071 0,0126 0,0211 0,0001 0,0002 0,0005 0,0012 0,0025 0,0049 0,0089 0,0151 0,0000 0,0001 0,0003 0,0008 0,0017 0,0034 0,0062 0,0107 0,0001 0,0002 0,0005 0,0011 0,0023 0,0043 0,0076 0,0001 0,0001 0,0003 0,0008 0,0016 0,0030 0,0053 0,0000 0,0001 0,0002 0,0005 0,0010 0,0020 0,0037 0,0000 0,0001 0,0002 0,0005 0,0014 0,0026 0,0001 0,0001 0,0003 0,0010 0,0018 0,0001 0,0001 0,0003 0,0006 0,0012 0,0000 0,0001 0,0002 0,0004 0,0009 285 286 Продолжение таблицы А5 χ2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 ν 11 12 13 14 15 16 17 18 19 20 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9985 0,9994 0,9998 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9907 0,9955 0,9979 0,9991 0,9996 0,9998 0,9999 1,0000 1,0000 1,0000 0,9699 0,9834 0,9912 0,9955 0,9977 0,9989 0,9995 0,9998 0,9999 1,0000 0,9312 0,9580 0,9752 0,9858 0,9921 0,9958 0,9978 0,9989 0,9994 0,9997 0,8734 0,9161 0,9462 0,9665 0,9797 0,9981 0,9932 0,9962 0,9979 0,9989 0,7991 0,8576 0,9022 0,9347 0,9576 0,9733 0,9835 0,9901 0,9942 0,9967 0,7133 0,7851 0,8436 0,8893 0,9238 0,9489 0,9665 0,9786 0,9867 0,9919 0,6219 0,7029 0,7729 0,8311 0,8775 0,9134 0,9403 0,9597 0,9735 0,9329 0,5304 0,6160 0,6939 0,7622 0,8197 0,8666 0,9036 0,9319 0,9539 0,9682 0,4433 0,5289 0,6108 0,6860 0,7526 0,8095 0,8566 0,8944 0,9238 0,9462 0,3626 0,4457 0,5276 0,6063 0,6790 0,7440 0,8001 0,8472 0,8856 0,9161 0,2933 0,3690 0,4478 0,5265 0,6023 0,6728 0,7362 0,7916 0,8386 0,8774 0,2330 0,3007 0,3738 0,4497 0,5255 0,5987 0,6671 0,7291 0,7837 0,8305 0,1825 0,2414 0,3074 0,3782 0,4514 0,5246 0,5955 0,6620 0,7226 0,7764 0,1411 0,1912 0,2491 0,3134 0,3821 0,4530 0,5238 0,5925 0,6573 0,7166 0,1079 0,1496 0,1993 0,2562 0,3189 0,3956 0,4544 0,5231 0,5899 0,6530 0,0816 0,1157 0,1575 0,2068 0,2627 0,3239 0,3888 0,4557 0,5224 0,5874 0,0611 0,0885 0,1231 0,1649 0,2137 0,2087 0,3285 0,3918 0,4568 0,5218 0,0453 0,0671 0,0952 0,1301 0,1719 0,2202 0,2742 0,3328 0,3946 0,4579 0,0334 0,0504 0,0729 0,1016 0,1368 0,1785 0,2263 0,2794 0,3368 0,3971 0,0244 0,0375 0,0554 0,0786 0,1078 0,1432 0,1847 0,2320 0,2843 0,3405 0,0177 0,0277 0,0417 0,0603 0,0841 0,1137 0,1493 0,1906 0,2373 0,2888 0,0127 0,0203 0,0311 0,0458 0,0651 0,0895 0,1194 0,1550 0,1962 0,2424 0,0091 0,0148 0,0231 0,0346 0,0499 0,0698 0,0947 0,1249 0,1605 0,2014 0,0065 0,0107 0,0170 0,0256 0,0380 0,0540 0,0745 0,0998 0,1302 0,1658 0,0046 0,0077 0,0124 0,0193 0,0287 0,0145 0,0581 0,0790 0,1047 0,1353 0,0032 0,0055 0,0090 0,0142 0,0216 0,0316 0,0449 0,0621 0,0834 0,1094 0,0023 0,0039 0,0065 0,104 0,0161 0,0239 0,0345 0,0484 0,0660 0,0878 0,0016 0,0028 0,0047 0,0076 0,0119 0,0180 0,0263 0,0347 0,0518 0,0699 286 287 6 Методические рекомендации по СРС Аудиторная самостоятельная работа студентов должна включать в себя беглое прохождение лекционных занятий для целей воспроизведения в памяти пройденного материала. Подобное кратковременное воспроизведение позволяет увидеть структуру занятия в целом. Затраты времени составляют примерно 5-10 минут. Внеаудиторная самостоятельная работа студентов в первую очередь должна включать в себя беглое прохождение материала лекционных занятий. Основной материал сосредоточен в лекциях студентов и методических разработках. Здесь в первую очередь следует использовать конспекты лекций и литературу из списка учебных пособий и методических разработок. Затраты времени составляют 10-15 минут На втором этапе освоения следует более тщательная проработка пройденного материала, с обнаружением трудно понятных мест и устранением проблем, вызвавших недопонимание. Здесь в качестве путеводителей используются конспекты лекций и литература из списка учебных пособий и методических разработок. Для освоения сложных мест привлекается литература из списков основной учебной литературы и дополнительной учебной литературы, выбираемой в соответствии с темой занятия. Затраты времени на самостоятельную работу студентов должны составлять около двух часов в неделю. 287 288 7 Материалы по модульному контролю (тесты). Тест для проверки знаний по модулю 1 «Методология математического моделирования» Студент________________________ Группа 11-В-М 1. Для проверки гипотезы о равенстве двух выборочных средних значений случайной величины, имеющей гауссовский закон распределения, используется: а) критерий Стьюдента; б) критерий Фишера; в) критерий Кохрена; г) критерий Пирсона. 2. При гауссовском законе распределения случайной величины для проверки гипотезы о равенстве двух дисперсий одной и той же случайной величины, в качестве критерия значимости используется: а) критерий Стьюдента; б) критерий Фишера; в) критерий Кохрена; г) критерий Пирсона. 3. Для проверки однородности дисперсии полученных экспериментальных значений используют: а) критерий Стьюдента; б) критерий Фишера; в) критерий Кохрена; г) критерий Пирсона. 4. Соответствие экспериментального распределения случайной величины предполагаемому теоретическому закону распределения оценивается с помощью: а) критерий Стьюдента; б) критерий Фишера; в) критерий Кохрена; г) критерий Пирсона. 5. Из множества факторов, влияющих на рассеяние выходной величины Y, выбирается один, который, по мнению исследователя, имеет наибольшее влияние на это рассеяние. Чтобы выявить эффект исследуемого фактора, его делят на несколько четко разделимых уровней, а остальные факторы рандомизируют. Это– а) однофакторный дисперсионный анализ; б) двухфакторный дисперсионный анализ; в) трехфакторный дисперсионный анализ. 6. Если Fрасч<Fкр, то делается вывод о том, что: а) результаты эксперимента не противоречат гипотезе об отсутствии эффекта уровней исследуемого фактора; б) исследуемый фактор вносит существенный эффект в разброс выходной величины Y. 7. Построение плана эксперимента по типу латинского квадрата – а) однофакторный дисперсионный анализ; б) двухфакторный дисперсионный анализ; в) трехфакторный дисперсионный анализ. 8 Метод выявления наиболее существенных факторов исследуемого процесса, основанный на опросе специалистов, работающих в этой области: а) метод ранговой корреляции; б) дисперсионный анализ; в) методы насыщенных и сверх насыщенных планов. 9. Для проверки согласованности мнений специалистов вычисляют а) коэффициент конкордации; б) критерий Стьюдента; 288 289 в) коэффициент Фишера. 10. Для первоначального построения «грубой модели» исследуемого процесса, отбросив на первом этапе факторы, оказывающее незначительное влияние, используют: а) метод ранговой корреляции; б) дисперсионный анализ; в) методы насыщенных и сверх насыщенных планов. 11. Напишите формулы для определения: математического ожидания x = дисперсии s x2 = среднего квадратического отклонения sx = 12. Что такое статистическая гипотеза и на основании чего ее можно принять или отвергнуть? _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ 13. Каковы условия применения метода случайного баланса и почему они не мешают широкому использованию этого метода при исследовании технологических процессов? _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ 14. Какова общая стратегия исследования при определении факторов, влияющих на процесс? _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ 15. Что означает понятие «число степеней свободы»? _____________________________________________________________________________ _____________________________________________________________________________ Задание выполнил студент _______________ (подпись) «____»__________2011 г. Количество правильных ответов _________ ; Количество баллов _______________ Выполненное задание проверила ______________ Воронина О.А. (подпись) «____»__________2011 г. Контрольная работа для проверки знаний по модулю 2 «Активный эксперимент» 1. Что такое активный эксперимент? 2. Что называется полным дробным экспериментом? 3. Как выбираются факторы планирования, их основные (базовые) уровни и интервалы варьирования? 4. Указать порядок проведения эксперимента методом ПФЭ. 5. Как составляется матрица планирования ПФЭ? 6. Как выбрать центр плана эксперимента? 7. Чем определяется величина интервала варьирования фактора? 8. Почему необходимо проведение параллельных опытов и их рандомизация? 289 290 9. Как зависит число уровней варьируемых факторов от порядка имитационной модели, представленной в виде полинома? 10. В чем заключается смысл разработки математической модели по принципу «от простого – к сложному»? 11. Каков порядок статистической обработки и анализа результатов эксперимента? 12. При каких условиях не соблюдается требование воспроизводимости эксперимента и как следует поступить в этом случае? 13. Как проверить значимость оценок коэффициентов регрессии? 14. Поясните различие применения критерия Стьюдента для оценки выборочных средних значений случайной величины и оценки значимости коэффициента полинома. 15. При каких условиях оценки коэффициентов регрессии незначимы и как эти условия устранить? 16. Как проверить адекватность математической модели? 17. При каких условиях не соблюдается требование адекватности математической модели и как следует поступить в этом случае? 18. Что называется дробным факторным экспериментом? 19. В каких случаях возможно планирование ДФЭ? 20. Как можно оценить разрешающую способность матрицы ДФЭ? 21. Что такое генерирующее соотношение и как оно выбирается? 22. Что такое определяющий контраст и как с его помощью составляется система совместных оценок? 23. Указать преимущества факторного планирования эксперимента перед другими способами проведения активного эксперимента и пассивным экспериментом? 24. Когда и для чего используется ЦКП и в чем его отличие от планирования ПФЭ и ДФЭ? 25. Что является критерием оптимальности плана при ЦКОП и ЦКРП? 26. Как достигается ортогональность матрицы планирования при ЦКОП? 27. Почему при рототабельном планировании можно не проводить параллельных опытов? 28. В чем преимущество рототабельного планирования перед ортогональным и как оно достигается? 29. Каков порядок обработки результатов ЦКОП? 30. Каков порядок обработки результатов ЦКРП? _______________ Воронина О.А. (подпись) «____»__________2011 г. 290 291 Контрольная работа для проверки знаний по модулю 3 «Пассивный эксперимент» 1. Назовите основные отличия активного и пассивного экспериментов, их преимущества и недостатки. 2. Назначение и порядок проведения регрессионного анализа 3. Назначение и порядок проведения факторного анализа 4. Назначение и порядок проведения метода главных компонентов 5. Какой метод ориентирован на корреляционную связь исследуемых параметров процесса? 6. Какой метод ориентирован на дисперсию? 7. Каков порядок проведения пассивного эксперимента в производственных условиях? 8. Виды производственных погрешностей. 9. Причины возникновения погрешностей при производстве ЭС 10. Как определяется систематическая погрешность? 11. Как определить случайную составляющую погрешности? _______________ Воронина О.А. (подпись) «____»__________2011 г. Контрольная работа для проверки знаний по модулю 4 «Методы оптимизации» 1. Как формулируется задача оптимизации? 2. В чем заключается основная идея и процедура обычного градиентного метода? 3. В чем заключается основная идея и процедура метода Кифера-Вольфовица? 4. В чем заключается основная идея и процедура симплексного метода? 5. В чем заключается основная идея и процедура метода крутого восхождения (БоксаУилсона)? 6. В чем состоит роль мысленных опытов и как они проводятся? 7. Как выполняется статистический анализ результатов в методе крутого восхождения? 8. Как выполняется оптимизация при многоэкстремальной поверхности отклика? 9. Что служит критерием для выбора начальной точки исследования? 10. Что служит критерием для выбора интервала варьирования для каждого фактора? _______________ Воронина О.А. (подпись) «____»__________2011 г. 291 292 8 Вопросы к зачету Вопросы к зачету по курсу «Эксперимент, планирование, проведение, анализ» 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. В чем суть планирования эксперимента Различие научного и промышленного эксперимента Основные виды задач, решаемых в планировании эксперимента Понятие плана эксперимента, матрицы планирования, спектра плана Этапы планирования эксперимента Основные концепции современного подхода к организации эксперимента Понятие фактора. Требования к факторам Отклик системы, параметр оптимизации Чем отличаются пассивные и активные эксперименты Чем характеризуется объект исследования? Дайте определение факторному пространству. Что образует план эксперимента? Что называется спектром плана? Что такое регрессионные полиномы и где они применяются; Перечислите условия необходимые для определения коэффициентов регрессии; Процедура определения локальной области факторного пространства Что называется полным факторным экспериментом Приемы построения матрицы планирования ПФЭ Свойства матрицы планирования ПФЭ Зачем в матрицу планирования вводят x0? Смешанные оценки в ПФЭ Оценка эффектов взаимодействия в ПФЭ Дробный факторный эксперимент и принцип насыщения Опишите план нахождения построчной дисперсии выходной величины Для чего нужно расчетное значение коэффициента Кохрэна и как он находится; Что такое критерий Стьюдента и где он используется; Для чего оценивают, насколько отличаются средние значения yi выходной величины, полученной в точках факторного пространства, и значения yi, полученного из ур авнения р егр ессии в тех же точках фактор ного пространства. Чем определяется F- критерий Фишера и как его применяют. Чем обеспечивается ортогональность столбцов матрицы F численных значений базисных функций. Определение ОЦКП. Каким образом для ОЦКП выбирается числовое значение α (звездного плеча). Объясните, почему точность оценки коэффициентов регрессии для ОЦКП для разных групп неодинакова. Условие наличия свойства рототабельности у ЦКП второго порядка. В чем отличие РЦКП от ОЦКП Являются ли оценки коэффициентов для РЦКП независимыми Что такое симплекс, какой симплекс называется регулярным Опишите алгоритм перемещения симплекса Способы задания симплекса Основная задача, решаемая симплекс планированием 37. Составила: доцент каф. ЭВТИБ Воронина О.А.того восхождения 292