Лекция В зависимости от способа сбора экспериментальной информации различают: 1. пассивный эксперимент; 2. активный эксперимент. Суть: исследователь собирает некоторый объем экспериментальной информации: входных параметров xi и выходного параметра y. Происходит это в режиме нормальной эксплуатации объекта. Для получения статистических моделей в виде полинома на основании данных полученных в пассивном эксперименте используют методы корреляционного и регрессионного анализов. Записывается уравнение модели в виде полинома n-ой степени. 2. Рассчитываются коэффициенты этого полинома (bi). 3. Оценивается наличие линейных связей между факторами (рассчитывается коэффициент корреляции rxy). 4. Оценивается значимость коэффициентов регрессии по t-критерию (критерий Стьюдента). 5. Устанавливается адекватность уравнения регрессии реальному процессу (по критерию Фишера). 1. Данные методы используются для выявления и описания зависимостей между случайными величинами по экспериментальным данным и базируются на теории вероятности и математической статистики. Основывается на предпосылках о том, что переменные величины y(выходной параметр) и xi (входной параметр) являются случайными величинами и между ними может существовать корреляционная связь при которой с изменением одной величины изменяется распределение другой. Для количественной оценки тесноты связей служит выборочный коэффициент корреляции. 0<rxy<1 Если rxy=0, то корреляции нет. Предполагает связь между зависимой случайной величиной y и независимой переменной xi.Эта связь представляется с помощью уравнения, которое связывает зависимую и независимые переменные с учетом соответствующих допущений. 1. Результаты наблюдений y1….yi есть независимые нормально распределенные случайные величины. 2. Факторы x1…xi – независимы и ошибка в их измерении пренебрежительно мала по сравнению с ошибкой измерения y. Т.е. Sx<<Sy (дисперсия – ошибка). 3. Выборочные дисперсии S1…Sn выходного параметра y, полученные при одинаковых условиях, должны быть однородны. Обработка экспериментальных данных корреляционным и регрессионным анализом позволяет построить статистическую модель в виде уравнения регрессии. Корреляционный анализ дает тесноту (зависимость) между x и y, но не дает формы, вида зависимости между x и y. Для характеристики формы связи пользуются уравнением регрессии. По данной выборке объема n найти уравнение приближенной регрессии и оценить допускаемую при этом ошибку. По сгущениям точек можно найти определенную зависимость, т.е. получить вид уравнения регрессии. Если разброс точек значительный, то регрессии не будет. Вид уравнения регрессии зависит от выбираемого метода приближения. Обычно пользуются методом наименьших квадратов. (разница между экспериментальным значением и функцией должна быть минимальной) При моделировании ХТП во многих случаях связь между входными и выходными параметрами можно описать (аппроксимировать) линейной зависимостью. Для получения вида математической модели нужно рассчитать b0 и b1. Для этого применим метод наименьших квадратов: N 2 F y b b x i 0 1i i 1 min N F 2 y b b x 1 0; i 0 1i b0 i 1 N F b 2 yi b0 b1xi xi 0 i 1 1 Nb b x y 0 1 i i 2 xy b x b x i i 0 i 1 i x y i i 2 x y x i i i b 0 N x i x i x i 2 N x i b 1 N x i y i x y i i x i x i 2 2 y x i i xi yi xi b ; 0 2 N x x 2 i i n n N x y x y i i i i i 1 b i 1 ; 2 1 2 N x x i i После вычисления коэффициентов полинома приступают к исследованию полученной статистической модели. Такое исследование называется регрессионным анализом. 1. Вычисление коэффициентов парной корреляции rxy . Чем ближе коэффициенты корреляции к единице, тем вероятнее наличие линейной связи. Следовательно, экспериментальные данные можно описать линейным уравнением: 2. Проверка однородности дисперсий. 2.1 Определяем среднее по результатам параллельных опытов (если они есть): m – число параллельных опытов, i=1N; N – общее число опытов; 2.2 Определяются выборочные дисперсии в каждой строке: m 2 y y iu i S2 u 1 ; i m 1 2.3 Суммируются дисперсии: i 1, N 2.4 Проверяется однородность дисперсий по критерию Кохрена (при одинаковом числе параллельных опытов): Если G<Gтаб (f1 , f2), то дисперсии однородны. f1=m-1; f2=N; f1 – число степеней свободы числителя и знаменателя; 2.5 Определяется дисперсия воспроизводимости 3. Оценивается значимость коэффициентов полинома по критерию Стьюдента (t – критерий). ▪ bi – i-ый коэффициент регрессии, ▪ - среднее квадратичное отклонение i-го коэффициента. S b 0 N 2 S x воспр. i i 1 N 2 N 2 N x xi i i 1 i 1 S b 1 S2 N воспр. N 2 N N x x i i i 1 i 1 2 Если при (q,f), то коэффициент значим, т.е. он значимо отличается от нуля. 4. проверка модели (полученного уравнения) на адекватность (критерий Фишера). Уравнение регрессии адекватно, если остаточная дисперсия выходной величиныy рассчитанной по уравнению регрессии относительно экспериментальных данных не превосходит ошибки опыта. Если условие выполняется, то модель адекватна q – уровень значимости – это процент вероятности, что данный процесс (событие) наступит, состоится. Если есть параллельные опыты: Если параллельных опытов нет , то для проверки критериев Фишера выполняется оценка качества аппроксимации, найденным уравнением. Сравним остаточную дисперсию Sост с дисперсией относительно среднего . Чем F>Fтабл (q,f1,f2), тем уравнение регрессии эффективнее. для выбранного q 1. Параболическая регрессия. Часто при составлении математических моделей объектов ХТП возникает необходимость использовать уравнения нелинейной формы. В этом случае используют полином второй или более высокой степени. Коэффициенты рассчитываются по МНК, определяем b0;b1;b2. Аналогичным путем определяются коэффициенты параболы любого порядка. Исследования уравнений проводятся по статистическим критериям, также как в случае линейной регрессии. Однако, коэффициент корреляции rxy рассчитывать не надо. Одним из основных методов теории активного эксперимента является статистическое планирование эксперимента. План эксперимента показывает расположение опытных точек в n-мерном пространстве. Рассмотрим Планы I порядка. При планировании по схеме полного факторного эксперимента ПФЭ, реализуются все возможные комбинации факторов на всех выбранных для исследования уровнях. 1. 2. 3. Одновременное варьирование всех факторов при проведении эксперимента по определенному плану. Представление математической модели (функции отклика) в виде линейного полинома. Исследование полученного полинома модели методами математической статистики. Уровни факторов – границы исследуемой области по данному технологическому параметру . Нулевой (основной) уровень – это некоторое начальное значение фактора, при составлении математической модели. Это точка с координатами Интервал варьирования – это часть области определения фактора симметричное относительно его нулевого уровня. Допустим объект исследования – реактор, в котором выход продукта – y , зависит от двух параметров (Т,Р): Т-x1; T=1002000C P-x2; P=2030ат Т (Х1) Р(Х2) Верхний уровень 200 30 Нижний уровень 100 20 План эксперимента указывает расположение в n-мерном пространстве опытных точек независимых переменных или условия всех опытов, которые необходимо провести. В ПФЭ эксперимент ставится только на границе области (1;2;3;4 – опыты) План эксперимента задается обычно в виде матрицы планирования – это таблица, каждая строчка которой –условия опыта, а каждый столбец матрицы соответствует значениям переменных в различных опытах. N=22=4 n=2. Это ПФЭ типа 22. Матрица планирования в натуральном масштабе. Матрица планирования составляется для того, чтобы эксперимент провести по определенному плану, определить значения выходного параметра в каждом опыте и построить статистическую модель. При планировании I порядка получают математическую модель, вида: Для удобства расчетов перейдем от натуральных единиц к безразмерным. Формула кодирования: xi – значение натуральной переменной (верхний или нижний уровень); Xi – кодированное значение i-того фактора; - основной уровень натуральной переменной; xi - интервал варьирования натуральной переменной; Для температуры: Для давления: 200 150 в X 1; 1 50 100 150 н X 1; 1 50 20 15 1; 5 10 15 н X 1; 2 5 Xв 2 N x0 x1 x2 1 +1 +1 +1 2 +1 +1 –1 3 +1 –1 +1 4 +1 –1 –1 N x0 x1 x2 1 + + + 2 + + – 3 + – + 4 + – – или Это матрица планирования в безразмерном масштабе. x0 – фиктивная переменная (+1), необходимая для вычисления свободного члена полинома. Расположение опытных точек в факторном пространстве будет следующим: х2 3(-1,1) 1(1,1) х1 (0,0) 4(-1,-1) 2(1,-1) 1. ортогональность: скалярное произведение двух любых столбцов матрицы равно нулю: N xui x ji 0; i 1 uj; u, i = 1,…,n; симметричность: сумма элементов всех столбцов матрицы, кроме первого, равна нулю: N x 0, iu i 1 u = 1,…,n; нормировка: сумма квадратов элементов каждого столбца равна числу опытов N x N, i 1 2 iu u = 1,…,n; свойство ротатабельности: все точки в матрице планирования подбираются так, что точность предсказания значений выходного параметра одинакова на равных расстояниях от центра эксперимента и не зависит от направления. Благодаря этим свойствам упрощается расчет коэффициентов регрессии. После составления плана (матрицы) проводят эксперимент (дублируя опыты) и на основании результатов эксперимента рассчитывают коэффициенты регрессии. Вычислить коэффициенты регрессии на основании экспериментальных данных, приведенных в табл. N x0 1 +1 2 +1 3 +1 4 +1 x1 x2 x1x2 1 1 1 1 –1 – 1 – 1 1 –1 – 1 – 1 1 Y 68,2 62,5 56,8 50,7 b0 68,2 62,5 56,8 50,7 59,6; 4 b1 68,2 62,5 56,8 50,7 5,8; 4 b2 68,2 62,5 56,8 50,7 2,95; 4 b12 68,2 62,5 56,8 50,7 0,1. 4 yˆ 59,6 5,8 x1 2,95 x2 0,1x1 x2 .