ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ Design of Experiments (DOE) 1 Историческая справка Основоположником планирования эксперимента был известный английский ученый Рональд А. Фишер (1900—1962 гг.), с именем которого связано развитие современной математической статистики. В 1919г. он начал работать в Рочемстерской агробиологической станции в Англии, обрабатывая результаты агробиологических наблюдений. В 1923г. появилась его планированию эксперимента. первая работа по В 1929г. в Калькутте была организована лаборатория для дальнейшего изучения и практического применения первой строго формализованной стратегии эксперимента. В 1935 г. вышло первое издание известной книги Р. Фишера (R. A. Fisher. The Design of Experiments). В СССР развитие методов планирования экспериментов началось с 1960г. под руководством В.В. Налимова. Известны работы Ю.П. Адлера, Ю.В. Грановского, Е.В. Марковой, 2 В.Б. Тихомирова. Список литературы по курсу: 1. Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента при поиске оптимальных условий. – М.: Наука, 1976. – 279с. 2. Налимов В.В., Чернова Н.А. Статистические методы планирования экстремальных экспериментов. – М.: Наука, 1965. – 398с. 3. Налимов В.В. Статистические методы описания химических и металлургических процессов. – М.: Металлургиздат, 1963. – 60 с. 4. Монтгомери Д.К. Планирование эксперимента и анализ данных: перевод с английского. – М.: Мир, 1981. – 520 c. 5. Бродский В.З. Введение в факторное планирование эксперимента. – М.: Наука, 1976. 6. Джонсон Н. Лион Ф. Статистика и планирование эксперимента в технике и науке: Методы планирования эксперимента. – М.: Мир, 1981. – 520 с. 7. ГОСТ 24026-80 Исследовательские Термины и определения. испытания. Планирование эксперимента. 8. Р 50.1.040-2002 Статистические методы. Планирование экспериментов. Термины и определения. 9. Учебные пособия по ПЭ. 10. Интернет-ресурсы 3 Планирование экспериментов Цель промышленных экспериментов заключается в извлечении максимального количества объективной информации о влиянии изучаемых факторов на производственный процесс с помощью наименьшего числа дорогостоящих наблюдений. Цель научных исследований показать статистическую значимость эффекта воздействия определенного фактора на изучаемую зависимую переменную. ПЭ предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес (активный эксперимент). 4 Задачи, решаемые методами DOE Нахождение факторов, влияющих на параметры качества процесса (выбор существенных факторов) Оценка и уточнение констант теоретических моделей Построение регрессионных (интерполяционных) моделей Оптимизация процесса Поиск оптимальных условий проведения эксперимента Например: • минимизация расхода материала на единицу выпускаемой продукции при сохранении качества; • сокращение время обработки в целом или на отдельных операциях; • снижение трудовых затрат на единицу продукции; • улучшение показателей надежности и др. 5 Виды эксперимента Вид эксперимента Особенности/цель 1. Элиминирующий Выявить и устранить влияние неоднородностей 2. Сравнительный Оценить влияние каждого фактора на процесс 3. Отсеивающий Отобрать для исследования существенные факторы 4. Экстремальный Выбор оптимальных режимов проведения эксперимента 5. Аппроксимирующий Выявление математической модели процесса 6. Численный Замена физического эксперимента математической моделью 7. Идентифицирующий Определение характеристик/коэффициентов в математической модели объекта 8. Экстраполирующий Предсказание изменений параметров объекта 6 DOE и ANOVA Оба подхода изучают вариацию и пытаются «объяснить» ее с помощью факторов. ANOVA – Analysis of Variation – Дисперсионный анализ выяснение реальной природы взаимодействий учет взаимодействия факторов высших порядков МНОГО данных не более 5 факторов DOE – Design of Experiments – Планирование экспериментов выявление существенно влияющих факторов (главные эффекты) пренебрегаем эффектами взаимодействий минимизация общего числа опытов (МАЛО данных) много факторов, 16/32/… 7 Словарь терминов Эксперимент - совокупность операций, совершаемых над объектом исследования с целью получения информации о его свойствах. Планирование эксперимента – это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. План эксперимента (матрица эксперимента) – совокупность данных, определяющих число, условия и порядок проведения опытов. Фактор (Factor) – причина, «движущая сила» процесса, определяющая его характер или отдельные его черты. Уровень фактора – моментальное значение переменной, описывающей фактор (для категориальных факторов – уникальное значение из списка значений, которые может принимать фактор). Целевая характеристика – характеристика процесса/изделия, влияние факторов на которую исследуется в ходе эксперимента. Отклик – результат измерения целевой характеристики при определенной комбинации уровней факторов или определенных значениях. Функция отклика (модель) – зависимость отклика от рассматриваемых факторов. Поверхность отклика пространстве. – геометрическое представление функции отклика в факторном Факторное пространство – пространство, в котором строится поверхность отклика. Эффект – изменение отклика, обусловленное изменением уровня фактора при фиксировании значений других факторов. Взаимодействие факторов – зависимость изменения эффекта одного фактора от уровня других факторов. 8 Объект исследования Схема «черного ящика» Z1, Z2, …, Zi (контролируемые, но неуправляемые факторы) X1, X2, …, Xi (управляемые факторы) Объект Y1, Y2, …, Yi (целевая характеристика) v1, v2, …, vi (неконтролируемые и неуправляемые факторы) При планировании чаще всего работают с 1-ой группой входных параметров - X1, X2, …, Xi. Однако при интерпретации результатов не нужно забывать и о других входных параметрах. 9 Этапы DOE I. Подготовка проекта Выбор объекта исследования. Установление цели эксперимента. Анализ априорной информации. II. Планирование эксперимента Выбор факторов. Выбор плана. Разработка схемы проведения эксперимента. III. Проведение эксперимента Реализация опыта по заранее составленному плану. Измерение целевой характеристики. IV. Анализ результатов Статистическая обработка, построение модели, отсеивание факторов, оптимизация. 10 Основные понятия и принципы DOE Белый шум X1 X2 Xn Исследуемый объект для которого надо построить функцию Y=F(X1, X2, … Xn) Y Х – факторы, они определяют факторное пространство модели; Y – выходная функция или функция отклика модели; Белый шум – все неучитываемые факторы попадают сюда и составляют суммарную погрешность модели 11 Требования к выбору целевой характеристики (Y) Количественное значение: должна измеряться при любом фиксированном наборе уровней факторов Однозначность: должна однозначно оценивать (измерять) работу объекта исследования; заданному набору уровней факторов должно соответствовать, с точностью до ошибки эксперимента, одно значение отклика Эффективность: должна иметь возможно меньшую дисперсию при проведении опытов Универсальность и полнота: должна всесторонне охарактеризовать объект исследования Достаточно четкий физический смысл Удачный выбор целевой характеристики определяется уровнем знания технологии и объекта и является залогом успеха при дальнейшем планировании, поскольку диктует вид математической модели эксперимента. 12 Принятие решений перед планированием эксперимента При выборе области эксперимента прежде всего надо оценить границы областей определения факторов. При этом должны учитываться ограничения нескольких типов: Первый тип – принципиальные ограничения для значений факторов, которые не могут быть нарушены ни при каких обстоятельствах. Например, если фактор – температура, то нижним пределом будет абсолютный нуль. Второй тип – ограничения, связанные с технико-экономическими соображениями (например, со стоимостью сырья, дефицитностью отдельных компонентов, временем ведения процесса). Третий тип ограничений – определяется конкретными условиями проведения процесса. Например, существующей аппаратурой, технологией, организацией. В реакторе, изготовленном из некоторого материала, температуру нельзя поднять выше температуры плавления этого материала или выше рабочей температуры данного катализатора. 13 Требования к факторам (X1, X2, …, Xn) Управляемость в выбранном интервале значений Точность измерения фактора должна быть известна и достаточно высока (хотя бы на порядок выше точности измерения выходной функции) Однозначность, т.е. непосредственное влияние фактора на объект исследования Независимость, отсутствие корреляций между факторами Совместимость факторов Безопасность испытаний при любом сочетании факторов Факторы бывают непрерывные и категориальные. Обычно рекомендуется использовать при планировании не более 15 факторов, если же их больше – выбирать наиболее значимые, оставляя менее значительные факторы в стороне. 14 Факторное пространство Если факторы совместимы, границы их областей определения образуют на плоскости некоторый прямоугольник – область совместного существования. На первом этапе планирования эксперимента необходимо выбрать область определения факторов Xi Выбор этой области производится исходя из априорной информации Чтобы указать значения параметра оптимизации требуется еще одна ось координат – ось отклика. Объект подобного вида носит название поверхности отклика. 15 Факторное пространство Но для двух факторов можно даже не переходить к трехмерному пространству, а ограничиться плоскостью. Для этого достаточно произвести сечение поверхности отклика плоскостями, параллельными плоскости х1Ох2, и полученные в сечениях линии спроектировать на эту плоскость Каждая линия, полученная в результате сечения, соответствует постоянному значению параметра оптимизации. Такая линия называется линией равного отклика 16 Требования к поверхности отклика Непрерывность поверхности – если к какой-либо точке факторного пространства функция отклика терпит разрыв, нет никакой гарантии, что при реальном осуществлении эксперимента данное состояние либо вообще невозможно, либо приведет к фатальным последствиям Гладкость поверхности отклика Наличие единственного оптимума 17 Выбор модели Под моделью будем понимать функцию отклика у = f(х1, х2, ..., хk) Выбрать модель – значит выбрать вид этой функции, записать ее уравнение. И тогда останется спланировать и провести эксперимент для оценки численных значений коэффициентов этого уравнения. Модели бывают разные. Моделей бывает много. Чтобы выбрать одну из них, надо понять, что мы хотим от модели, какие требования мы к ней предъявляем. Y b0 bi X i i 1... n 2 b X X b X ij i j ii i erf i , j 1... n i j i 1... n 18 Требования к выбору модели Способность предсказывать дальнейшее направление опытов. Требуемая точность предсказаний. При этом точность предсказания не должна зависеть от направления, в котором мы двигаемся при планировании, т.е. точность предсказания должна быть одинакова во всех направлениях. Адекватность модели. Данное требование означает, что модель действительно должна предсказывать экспериментальные данные. Простота. Среди всех моделей необходимо выбирать ту, которая является наиболее простой. Разработку модели процесса проводят от простой к сложной. 19 Требования к выбору функции отклика Наиболее часто в планировании эксперимента останавливаются на полиномиальных моделях вида: Полином первой степени: k k 1 1 y b0 bi xi bij xi x j Полином второй степени: k k k 1 1 1 y b0 bi xi bij xi x j bii xi Полином третьей степени: k k 2 k k k 1 1 1 y b0 bi xi bij xi x j biij xi 2 x j bijj xi x j 2 biii xi3 1 1 y – целевая функция bi – линейные коэффициенты bij – коэффициенты двойного взаимодействия xi – факторы 20 Особенности выбора функции отклика Увеличивая степень полинома, можно задать приблизительное описание (аппроксимацию) функции любой сложности. Для экспериментатора же выбор полиномиальной значительно упростить поиск числовых коэффициентов. модели позволяет При выборе степени полинома нужно не забывать о простоте описания. Слишком высокие степени, несмотря на увеличение точности предсказания, редко приветствуется, поскольку с каждой новой степенью затрудняется поиск числовых коэффициентов. При увеличении коэффициентов растет и число опытов, необходимых для их вычисления. Чаще всего экспериментаторы стараются ограничиваться линейными полиномами, а если они недостаточно точны, полиномами второй степени (квадратичными). Дальнейшее увеличение степени полинома ведет, как правило, только к увеличению сложности прогнозирования и не больше. 21 Виды планов экспериментов 22