Московский авиационный институт (национальный исследовательский университет) СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ Учебное пособие Москва, 2017 1 АННОТАЦИЯ В учебном пособии изложены методики расчета статистических параметров одномерной выборки, построения доверительных интервалов для измеряемой случайной величины, исследования линейной корреляции переменных величин, различные варианты расчета параметров линейных аппроксимирующих функций методом наименьших квадратов, а также содержатся краткие сведения об основных понятиях теории вероятностей. В пособии описаны методы графического представления экспериментальных результатов. Прилагаются таблицы коэффициентов Стьюдента, Пирсона и функции Лапласа, часто применяющиеся при обработке результатов эксперимента. Учебное пособие предназначено для студентов изучающих дисциплины 09.03.02 «Информационные системы и технологии», 24.05.06 «Системы управления движением и навигация» 2 ВВЕДЕНИЕ Исследование технических систем может использовать теоретические и эмпирические методы. Каждое из этих направлений обладает относительной самостоятельностью, имеет свои достоинства и недостатки. В общем случае, теоретические методы в виде математических моделей позволяют описывать и объяснять взаимосвязи элементов изучаемой системы или объекта в относительно широких диапазонах изменения переменных величин. Однако при построении теоретических моделей неизбежно введение каких-либо ограничений, допущений, гипотез и т.п. Поэтому возникает задача оценки достоверности (адекватности) полученной модели реальному процессу или объекту. Для этого проводится экспериментальная проверка разработанных теоретических моделей. В настоящее время процедура обработки экспериментальных данных разработана достаточно хорошо и исследователю необходимо только иметь достаточную подготовку для того, чтобы правильно ее использовать. Основные задачи, решаемые при обработке результатов эксперимента: вопросы подбора эмпирических формул и оценка их параметров, вопросы оценки истинных значений измеряемых величин и точности измерений, вопросы исследования корреляционных зависимостей и др. Экспериментальные данные формируются путем наблюдений либо с помощью пассивного и активного экспериментов. Наблюдение — систематическое, целенаправленное восприятие того или иного объекта или явления без воздействия на него. Наблюдение позволяет получить первоначальную информацию об изучаемом объекте или явлении. Эксперимент — система операций, воздействий и (или) наблюдений, направленных на получение информации об объекте при исследовательских операциях. Эксперимент состоит из опытов. Пассивный эксперимент — эксперимент, при котором уровни факторов в каждом опыте регистрируются исследователем, но не задаются. 3 Активный эксперимент — эксперимент, в котором уровни факторов в каждом опыте задаются исследователем. Опыт — это воспроизведение исследуемого явления в определенных условиях проведения эксперимента при возможности регистрации его результатов. Целью любого эксперимента является определение качественной и количественной связи между исследуемыми параметрами, либо оценка численного значения какого-либо параметра. В некоторых случаях вид зависимости между переменными величинами известен по результатам теоретических исследований. Как правило, формулы, выражающие эти зависимости, содержат некоторые постоянные, значения которых необходимо определить из опыта. Другим типом задачи является определение неизвестной функциональной связи между переменными величинами на основе данных эксперимента. Такие зависимости называют эмпирическими. Однозначно определить неизвестную функциональную зависимость между переменными невозможно даже в том случае, если бы результаты эксперимента не имели ошибок. Тем более не следует этого ожидать, имея результаты эксперимента, содержащие различные ошибки измерения. Данные результата эксперимента всегда содержит некоторую погрешность. Если погрешность мала, то ею можно пренебречь. Однако при этом неизбежно возникают два вопроса: во-первых, что понимать под малой погрешностью, и, во-вторых, как оценить величину погрешности, то есть и результаты эксперимента нуждаются в определенном теоретическом осмыслении. Итак, никогда истинного значения измеряемой величины не получить. Это объясняется тем, что измерительные средства основаны на определенном методе измерения, точность которого конечна. Ошибка измерения это разность между результатом измерения и истинным значением измеряемой величины. Эта ошибка также неизвестна, как неизвестно истинное значение 4 измеряемой величины. Кроме погрешности измерения на результат измерения влияет еще ряд объективных и субъективных причин. Поэтому одной из важнейших задач математической обработки результатов эксперимента и является оценка истинного значения измеряемой величины по данным эксперимента с возможно меньшей ошибкой. Основным типом погрешностей, изучению которых посвящено данное пособие, являются случайные погрешности. Они поддаются строгому математическому описанию, что позволяет делать корректные выводы о качестве эксперимента. Изучение материалов учебного пособия должно помочь студентам приобрести определенные образовательными стандартами РФ знания, умения и навыки. Знать: — числовые характеристики статистической выборки; — точечное и интервальное оценивание параметров статистической выборки; основы корреляционного и регрессионного анализа. Уметь: — формулировать задачи для статистического анализа; — пользоваться математическим аппаратом для обработки статистических данных; — использовать технические средства для постановки эксперимента. Владеть: — выбором исходных данных для статистического анализа; — анализом полученных числовых и графических характеристик экспериментальных исследований; — методами обработки экспериментальных данных. 5 1. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА С ПОМОЩЬЮ ОДНОМЕРНОЙ ВЫБОРКИ Цель работы: освоение способов проведения экспериментов с использованием промышленных роботов; получение практических навыков точечной и интервальной оценки параметров партии деталей. 1.1. ОБЩИЕ СВЕДЕНИЯ При выполнении экспериментальных исследований на значение измеряемой величины влияет множество случайных факторов, не имеющих прямого отношения к изучаемому явлению или объекту. Эти факторы (помехи) могут весьма значительно влиять на результаты измерений, но не носить закономерный (постоянный) характер. Поэтому все получающиеся из эксперимента величины являются случайными. Ошибки (погрешности), возникающие при этом, называют случайными. Случайные ошибки устранить нельзя, но благодаря тому, что они подчиняются закономерностям теории математической статистики при достаточно большом числе измерений, всегда можно указать пределы, внутри которых заключено истинное значение измеряемой величины. Основное содержание математической статистики составляют методы систематизации, обработки и использования статистических данных, выявление статистических закономерностей. Множество всех объектов, подлежащих изучению, называется генеральной совокупностью. Множество случайно отобранных объектов из генеральной совокупности называется выборочной совокупностью или выборкой. При изучении какого-либо одного параметра, используется одномерная генеральная совокупность и, соответственно, одномерная выборка. Выборка называется случайной, если из генеральной совокупности элементы берутся наугад и в выборку каждый из них может попасть с одинаковой вероятностью. Если случайная выборка такова, что по её распределе6 нию можно судить о распределении неизвестной генеральной совокупности, то такая выборка называется репрезентативной, т.е. хорошо представляющей генеральную совокупность. Основные задачи, рассматриваемые в этой работе: — получение рационально выбранных числовых характеристик, которые дали бы общее представление о всей совокупности; — графическое представление эмпирического материала, дающее приближённые выражения для функции распределения и плотности распределения вероятности; — интервальное оценивание, позволяющее по данным выборки указать интервал, в котором с заданной вероятностью следует искать истинное, но неизвестное значение параметра распределения генеральной совокупности. 1.2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ 1.2.1. Точечный статистический анализ одномерной выборки Пусть x1, x2, …, xn.− выборка объема n из некоторой генеральной совокупности. По этой выборке можно оценить основные числовые характеристики генеральной совокупности. Различные элементы выборки xi называются вариантами. Ряд вариант, расположенных в порядке возрастания их значений называется вариационным рядом. Им пользуются, в основном, при малых n. Если n велико, то ряд разбивают на равные интервалы (интервальная группировка). Количество интервалов можно определить по формуле Стерджеса 𝐾 ≈ 1 + 3,322 lg 𝑛. При величине выборки n < 50 можно пользоваться и другими эмпирическими формулами, например, K ≈ √𝑛, или K < 5lg 𝑛. Они дают приблизительно одинаковый результат. Обычно количество интервалов выбирают в пределах 5 < K < 20. Под частотой mi интервала Ki понимается число членов выборки, которые лежат в i– м интервале. 7 Числовые характеристики выборки называются выборочными (эмпирическими) числовыми характеристиками. Основные числовые характеристики: 1. Среднее арифметическое (среднее выборочное): 𝐧 𝐊 𝐢=𝟏 𝐢=𝟏 𝟏 𝟏 𝒙 = � 𝒙𝒊 = � 𝐦𝐢 𝒙инт 𝒊 , 𝐧 𝐧 где mi – интервальная частота, (1.1) K – количество интервалов, 𝑥𝑥инт 𝑖 − середина i-го интервала. 2. Выборочная (эмпирическая) несмещенная дисперсия: 𝒏 𝑲 𝒊=𝟏 𝒊=𝟏 𝟏 𝟏 𝑺𝟐 = �(𝒙𝒊 − 𝒙)𝟐 = � 𝒎𝒊 (𝒙инт 𝒊 − 𝒙)𝟐 . 𝒏−𝟏 𝒏−𝟏 (1.2) 3. Стандартное среднее квадратичное отклонение: 𝒏 𝑲 𝒊=𝟏 𝒊=𝟏 𝟏 𝟏 𝑺=� �(𝒙𝒊 − 𝒙)𝟐 = � � 𝒎𝒊 (𝒙инт 𝒊 − 𝒙)𝟐 . 𝒏−𝟏 𝒏−𝟏 4. Коэффициент вариации: 𝑺 𝑽= ; 𝒙≠𝟎. (1.3) (1.4) 𝒙 При нормальном распределении коэффициент вариации должен быть не более 0,33. 5. Оценка коэффициента асимметрии: 𝟏 𝑲 ∑𝟏 𝐦𝐢 (𝒙инт 𝒊 − 𝒙)𝟑 𝐧 𝐀𝐬 = . 𝐒𝟑 (1.5) Коэффициент асимметрии характеризует симметричность распределения относительно среднего 𝒙. Он положителен, если правый "хвост" распре- деления длиннее левого (правая часть кривой более пологая), и отрицателен в 8 противном случае. Если распределение симметрично относительно математического ожидания, то его коэффициент асимметрии равен нулю. Среднее квадратичное асимметрии зависит от величины выборки: 𝑺𝑨 = � 6. Оценка эксцесса: 𝟔(𝒏 − 𝟏) . (𝒏 + 𝟏)(𝒏 + 𝟑) 𝟏 𝐊 �𝟏 (𝒙инт 𝒊 − 𝒙)𝟒 𝐦𝐢 𝐧 𝐄𝐱 = −𝟑. 𝐒𝟒 (1.6) (1.7) Минус три» в конце формулы введено для того, чтобы коэффициент эксцесса нормального распределения был равен нулю. Оценка эксцесса является мерой островершинности распределения по сравнению с нормальным распределением. Если Ex > 0, то вершина более острая, а если Ex < 0 то более плоская, чем у нормального распределения. Среднее квадратичное эксцесса: 𝟐𝟒𝒏(𝒏 − 𝟐)(𝒏 − 𝟑) 𝑺𝑬 = � . (𝒏 − 𝟏)𝟐 (𝒏 + 𝟑)(𝒏 + 𝟓) (1.8) 7. Выборочная мода Mo. Для дискретного вариационного ряда (дискретная группировка) мода определяется как значение варианты с наибольшей частотой. При интервальной группировке выбирается интервал, которому соответствует наибольшая интервальная частота Mo = mmax. 8. Выборочная медиана. При дискретной группировке это величина, относительно которой выборка делится на две равные по объему части. При интервальной группировке сначала находят так называемый медианный интервал, номер которого определяют из неравенств: 9 𝒏 ⎧ � 𝐦𝐢 ≤ 𝟐 ⎪ 𝐢<𝐢𝐌𝐞 𝑴𝒆 <=> ⎨ � 𝒎𝒊 > 𝒏 ⎪ 𝟐 ⎩𝒊≤𝒊𝑴𝒆 (1.9) Т.е. сумма частот всех интервалов левее медианного, должна быть меньше суммы частот включающих частоту медианного интервала. За оценку медианы принимают значение середины медианного интервала. 1.2.2. Предварительная проверка нормальности распределения С помощью вычисленных числовых характеристик можно определить, является ли выборочное распределение нормальным. Если выборочное распределение близко к нормальному (или является таковым), то: 1. В интервалы 𝑥𝑥 ± 𝑆, 𝑥𝑥 ± 2𝑆, 𝑥𝑥 ± 3𝑆 должны попадать соответствен- но 68,3%, 95,5% и 99,7% выборочных значений. Значения часто используе- мых интервалов сведены в таблицу 1.1 и проиллюстрированы на рис. 1.1.На графике кривая f(x) определяет плотность распределения непрерывной случайной величины X. Соответственно площадь под кривой в интервале от X1 𝑋 доX2 вычисляется как P(x)=∫𝑋 2 𝑓(𝑥𝑥)𝑑𝑥𝑥 и соответствует вероятности попада1 ния величины X в этот интервал. В таблицу, кроме стандартных значений 𝑥𝑥 ± 𝑆, 𝑥𝑥 ± 2𝑆, 𝑥𝑥 ± 3𝑆 включены интервалы для наиболее часто используемых вероятностей 95,0% и 99,0%. Таблица 1.1. Параметры нормального распределения 10 Интервал Вероятность, % 𝑥𝑥 − 𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 𝑆 68,3 𝑥𝑥 − 2𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 2𝑆 95,5 𝑥𝑥 − 3𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 3𝑆 99,7 𝑥𝑥 − 1,96𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 1,96𝑆 95,0 𝑥𝑥 − 2,58𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 2,58𝑆 99,0 Рис. 1.1. Интервалы и вероятности нормального распределения 2. В не слишком маленькой выборке величина коэффициента вариации V должна быть не более 0,33, т.е.V < 0,33. 3. Оценка коэффициента асимметрии As должны быть близка к нулю. Объективная (количественной) характеристикой ассиметрии является отно𝐀𝐬 шение 𝑺 . Если: — 𝑨 — 𝐀𝐬 𝑺𝑨 𝐀𝐬 𝑺𝑨 ≥ 3, то гипотеза о нормальности отклоняется; ≤ 2, то гипотеза о нормальности принимается; — 2< 𝐀𝐬 𝑺𝑨 < 3, то для проверки нормальности следует использовать критерий χ2 (Пирсона) или критерий Колмогорова. 4. Оценка эксцесса Ex должна быть близка к нулю. Объективной характеристикой является отношение — 𝑬𝒙 — 𝑬𝒙 𝑺𝑬 𝑺𝑬 𝑬𝒙 𝑺𝑬 . Если: ≥ 3, то гипотеза о нормальности отклоняется; ≤ 2, то гипотеза о нормальности принимается; — 2< 𝑬𝒙 𝑺𝑬 < 3, то для проверки нормальности следует использовать критерий χ2 (Пирсона) или критерий Колмогорова. 5. 𝒙 ≈ Me. 11 Интервал ±3S является почти достоверным, так как подавляющее большинство отдельных результатов многократного измерения случайной величины окажется сосредоточенным именно в нем. Поэтому при обработке результатов эксперимента часто используется «правило 3S», которое основано на указанном свойстве нормального распределения. С помощью него можно установить наличие промаха в результате отдельного измерения. Это отдельное измерение можно отбросить, если его значение более чем на 3S отличается от измеренного среднего значения случайной величины. В то же время стоит более тщательно повторить измерения в этой области параметров. Возможно, что данный результат измерения не является промахом, а свидетельствует о наличии необычного поведения изучаемой системы, которое не укладывается в рамки существующей модели, т.е. речь идет об открытии нового качественного состояния. Подробнее о промахах будет рассмотрено ниже. 1.2.3. Графическое представление эмпирического распределения Графическое представление результатов обладает большой наглядностью и информативностью. Графики экспериментальных зависимостей позволяют легко визуально предварительно определять характер зависимости, судить о величине разброса экспериментальных данных по сравнению с предсказаниями теории и т.д. Графики, построенные при выполнении лабораторных работ должны быть максимально информативными. Для этого необходимо соблюдать некоторые требования: 1. На координатных осях должны быть указаны обозначения откладываемых величин и единицы их измерения. 2. Начало координат может не совпадать с нулевыми значениями величин. Его выбирают таким образом, чтобы рабочая площадь была использована максимально. 12 3. Экспериментальные точки изображаются четко и крупно в виде кружков, крестиков, разноцветных точек и т.п. 4. Масштабные деления на координатных осях следует наносить равномерно. 5. Масштаб выбирают таким образом, чтобы: — кривая была равномерно растянута вдоль обеих осей (если график представляет собой прямую, то угол ее наклона к осям должен быть близок к 45°). — положение любой точки можно было определить легко и быстро. Наиболее распространенными способами графического представления эмпирических данных (выборки) являются гистограмма, полигон частот и эмпирическая функция распределения (накопленные относительные частоты). Пусть 𝑥𝑥𝑚𝑖𝑛 и 𝑥𝑥𝑚𝑎𝑥 − соответственно наименьшее и наибольшее значе- ния вариант выборки. Величина R = 𝑥𝑥𝑚𝑎𝑥 − 𝑥𝑥𝑚𝑖𝑛 называется размахом вы- борки. Размах делится на число интервалов K (интервальная группировка). Их количество можно вычислить по приведенным выше формулам, округлив до целого числа. При этом ширина интервала составит ℎ = 𝑅�𝐾 Левую границу интервала принято начинать , отступая примерно на 0,5 интервала в сторону меньших значений от 𝑥𝑥𝑚𝑖𝑛 и заканчивать, отступая примерно на 0,5 интервала в сторону больших значений от 𝑥𝑥𝑚𝑎𝑥 . Получается ве- личина поля рассеивания. В его пределах можно корректировать значения 𝑥𝑥𝑚𝑖𝑛 и 𝑥𝑥𝑚𝑎𝑥 таким об- разом, чтобы величина размаха выборки хорошо делилась на интервалы. После разбиения на интервалы определяют параметры выборки и за- полняют таблицу 1.2 (пример). 13 Таблица 1.2. Разбивка выборки на интервалы K Интервалы группировки Свыше До (включительно) 1 2 3 4 5 6 Середина интервала 𝑥𝑥инт i Частота mi Σ На основании таблицы строятся гистограмма, полигон частот и эмпи- рическая функция распределения Гистограмма строится следующим образом. На оси абсцисс откладываются интервалы, и на каждом из них строится прямоугольник, площадь которого равна частоте, соответствующей этому интервалу, т.е. высота прямоугольника (ордината) равна m i, т.е. гистограмма является эмпирическим аналогом плотности распределения (рис.1.2). Полигон частот — ломаная линия, которая получается, если из середины каждого интервала восстановить перпендикуляр высотой mi и соединить вершины этих перпендикуляров (рис.1.2). По гистограмме и полигону частот судят о виде плотности распределения исследуемой непрерывной случайной величины или о распределении вероятностей дискретной случайной величины. 14 Рис.1.2. Гистограмма и полигон распределения Для данного фиксированного значения 𝑥𝑥i, чем больше ширина интерва- ла h, тем больше соответствующая ему вероятность попасть в этот интервал (т.е. тем больше площадь под кривой распределения). Рассмотрим интервал h бесконечной ширины. Вероятность того, что измеряемая случайная величина принимает какое-либо значение в интервале от –∞ до +∞, равна 1 (достоверное событие – событие, которое происходит всегда). Это означает, что площадь под кривой распределения равна единице. Рассмотрим другой предельный случай. Устремим ширину интервала h к нулю. Площадь при этом тоже обратится в ноль. Это значит, что вероятность получить при измерении конкретное фиксированное значение непрерывной случайной величины равна нулю. То есть для непрерывной случайной величины можно указать лишь интервал ее возможных значений с указанием вероятности ее пребывания в этом интервале. Это означает, что на основании результатов измерений (x1, x2, …, xn) невозможно указать истинное значение величины, а лишь интервал близких к нему возможных значений. Также невозможно указать точное значение допущенной при этом погрешности, а лишь интервал возможных значений погрешности с соответствующей вероятностью. 15 Эмпирическую функцию распределения F(x) получают построением ступенчатой кривой относительных накопленных частот. Она имеет скачки в серединах интервалов группировок, 𝑥𝑥инт 𝑖 (рис. 1.3). Рис.1.3. Эмпирическая функция распределения По сути функция распределения F(x) определяет (для всех действительных х) вероятность того, что случайная величина Х принимает значение не больше, чем x. В частности, по графику задавая F(x) можно определить значение 𝑥𝑥𝑃 , которое исследуемая величина не превзойдет с вероятностью P. И наоборот, задавая 𝑥𝑥𝑃 , по тому же графику можно найти соответствующую вероятность 𝑝. Например, из соотношения 𝐹 (𝑥𝑥𝑃 ) = 0,5 можно определить значение ме- дианы. 1.2.4. Интервальное оценивание В предыдущем разделе были рассмотрены оценки параметров распределения с помощью числовых значений, которые находятся по выборке и называются точечными. К сожалению, точечные оценки параметров не дают 16 представления о степени точности, т.е. близости оценки к действительному параметру. Да и надежность полученной оценки тоже не 100%. Особенно часто вопрос о точности и надежности оценки возникает тогда, когда объем выборки недостаточно велик. В таких случаях для того, чтобы получить представление о точности и надежности оценки параметра, строят интервальные оценки, которые еще называют доверительными интервалами. 1. Доверительный интервал для математического ожидания μ. При построении доверительного интервала для математического ожидания μ, в качестве оценки используем среднее арифметическое (среднее) 𝑥𝑥 и точечную оценку для среднего квадратичного отклонения 𝑺. Выражения для определения 𝑥𝑥 и 𝑆 2 приведены выше. В теории математической статистики доказывается, что значения мате- матического ожидания подчиняются t-распределению f(t) (распределению Стьюдента) (рис. 1.4). Рис.1.4. Распределение Стьюдента Одной из характеристик t-распределения является коэффициент Стьюдента tα,ν, зависящий от величины ν = ( n –1 ), которая называется степенью свободы. Значение α называется коэффициентом значимости и определяет вероятность выхода величины за пределы tα Величина 𝛼 ⁄2 характеризует од- ностороннюю область уровня значимости, соответственно α – двустороннюю. Значение γ =1–α называется коэффициентом доверия. Кроме коэффи17 циента доверия часто используют термин доверительная вероятность P = γ∙100%. В итоге выражение для определения доверительного интервала для μ: 𝒙 − 𝒕𝛼,𝑛−1 𝑺 √𝒏 ≤ 𝝁 ≤ 𝒙 + 𝒕𝛼,𝑛−1 𝑺 √𝒏 . (1.10) Для определения величины 𝑡𝛼,𝑛−1 пользуются таблицами распределе- ния Стьюдента (таблица П.2 приложения). Фрагмент таблицы для n = 36 представлен в тексте. Табл.1.3 Критические точки распределения Стьюдента (фрагмент) ν = n–1 35 0,10 1,69 Уровень значимости α (двусторонняя область) 0,05 0,02 0,01 0,002 2,03 2,44 1,72 3,34 0,001 3,59 Для доверительной вероятности 95% при n > 30 можно пользоваться таблицей для нормального распределения, так как при этих условиях распределение Стьюдента практически совпадает с распределением Гаусса, то есть 𝑡𝛼,𝑛−1 ≈ 𝑍𝛼 . Величина 𝑡𝛼,𝑛−1 𝑆 √𝑛 задает границы доверительного интервала, т.е. определяет пределы интервальной оценки. Доверительный интервал для данных значений S и n можно представить с помощью доверительной полосы графически (рис. 1.5). 18 Рис.1.5. Доверительный интервал для математического ожидания Используя рисунок, для любого вычисленного значения 𝑥𝑥 по выборке данного объема n можно определить границы доверительного интервала для математического ожидания μ. При росте n границы доверительной полосы будут стремиться к линии μ = 𝑥𝑥. Рассмотренный доверительный интервал симметричен относительно 𝑥𝑥. Кроме того, вероятность превзойти левую, ли- бо правую границу интервала одинакова и равна α/2. Обратим внимание, что с увеличением числа измерений погрешность окончательного результата уменьшается. Однако уменьшение погрешности никогда не дается бесплатно. Так, чтобы узнать дополнительную значимую цифру в 𝑥𝑥, т.е. повысить точность в 10 раз, количество измерений необходи- мо увеличить в 100 раз! Следует также учесть, что в конечную погрешность вносит свой вклад приборная (систематическая) погрешность, и с какого-то момента увеличение числа измерений становится неэффективным. Из проведенного анализа можно сделать некоторые выводы: 19 1. При увеличении объема выборки n точность интервальной оценки увеличивается, так как величина (𝑡𝛼,𝑛−1 𝑆 √𝑛 ) уменьшается. При больших n хо- рошей оценкой для μ становится 𝑥𝑥, т.е. точечная оценка. 2. При (𝑥𝑥 − 𝑡𝛼,𝑛−1 𝑆 √𝑛 увеличении коэффициента доверия ), т.е. увеличивается погрешность. 𝛾𝛾 растет величина 3. Для фиксированных значений коэффициента доверия надежности 𝛾𝛾 = 1 – α и погрешности можно определить необходимый объем выборки. Следует иметь в виду, что при неизменном объеме выборки одновременно увеличивать коэффициент доверия и уменьшать погрешность точность нельзя. Поэтому для характеристики величины случайной погрешности (ошибки) результата многократных измерений необходимо указывать два числа: величину доверительного интервала Δx и величину соответствующей ему доверительной вероятности P. Истинное значение измеряемой физической величины никогда неиз- вестно. В теории погрешностей считают, что значение, появляющееся в экс- перименте чаще всего и подчиняющееся нормальному распределению и есть истинное значение 𝑥𝑥0 То есть за истинное значение 𝑥𝑥0 принимают математическое ожидание μ. 2. Доверительный интервал для дисперсии σ2 При определении доверительного интервала воспользуемся тем, что значения для дисперсии принадлежат распределению Пирсона χ2 с ν =( n –1 ) степенями свободы. При этом воспользуемся точечной оценкой для дисперсии 𝑆 2 . Этого достаточно, чтобы определить интервал для σ2. 𝒏𝑺𝟐 𝒏𝑺𝟐 𝟐 ≤𝝈 ≤ 𝟐 𝝌𝟐𝟐 𝝌𝟏 (1.11) Значения 𝜒12 и 𝜒22 находим из таблиц распределения Пирсона χ 2 . При этом параметрами распределения являются α и 𝜈 = 𝑛 − 1, т. е. 20 𝝌𝟐𝟏 <=> � 𝜶 𝟐 ; 𝝂=𝒏−𝟏 𝜶 𝟐 𝝂=𝒏−𝟏 𝟏− (1.12) 𝝌𝟐𝟐 <=> � Этими формулами можно пользоваться независимо от размера выборки. Однако при n > 30 распределение 𝜒𝜈2 близко к нормальному, поэтому для нахождения границ доверительного интервала можно пользоваться стандартными значениями zα, которые приведены в таблице П.2 (фрагмент табл. 1.3 в тексте). То есть при достаточно большом n можно брать значения из последней строки таблицы t – распределения, когда Zα= t α ,∞. Таблица 1.4. Коэффициенты Стьюдента для t α ,∞=Zα(двусторонняя область) α zα= t α ,∞ 0,10 1,64 0,05 1,96 0,02 2,33 0,01 2,58 0,002 3,09 0,001 3,29 При этом доверительный интервал для дисперсии можно определить из выражения: (𝒏 − 𝟏)𝑺𝟐 (𝒏 − 𝟏) + 𝒁𝜶 �𝟐(𝒏 − 𝟏) 𝟐 ≤𝝈 ≤ (𝒏 − 𝟏)𝑺𝟐 (𝒏 − 𝟏) − 𝒁𝜶 �𝟐(𝒏 − 𝟏) Например, при α = 0,05, Zα = 1,96, n = 36 получим: . (1.13) 0.67 S2 ≤ 𝝈𝟐 ≤ 𝟏. 𝟗𝟒 𝑺𝟐 . Доверительный интервал для дисперсии при заданных значениях S и n можно представить с помощью доверительной полосы графически. На рис.1.6 доверительный интервал выделен темным фоном. 21 Рис.1.6. Доверительный интервал для дисперсии 3. Проверка гипотезы о нормальном распределении по критерию Пирсона Если данные представлены интервальной группировкой (K интервалов), то подсчитывается количество mi выборочных значений исследуемого параметра. Это значение mi сравнивается со значением, вычисленным по теоретическим зависимостям для нормального распределения F0(x), т.е. пользуясь интегралом Лапласса. Теоретическое значение mi обозначается как 𝑚𝑖0 . Далее применяется статистика критерия, которая определяется как: 𝑲 (𝒎𝒊 − 𝒎𝟎𝒊 )𝟐 𝝌 =� 𝒎𝟎𝒊 𝟐 (1.14) 𝒊=𝟏 Эта статистика имеет распределение Пирсона (χ2 ) с 𝜈 = 𝐾 − 1 степе- нями свободы. Если для распределения F0(x) предварительно по выборке вы- числялись L параметров, то 𝜈 = 𝐾 − 1 − 𝐿. Этот критерий требует, чтобы были выполнены следующие соотношения для всех интервалов: 𝑚𝑖0 >5. Ги22 потеза о распределении отвергается, если вычисленное реальное значение 2 2 больше 𝜒кр , найденного по таблицам для данных α и ν. 𝜒реал Для проверки нормальности распределения предварительно необходи- мо рассчитать среднее значение выборки 𝑥𝑥 и среднее квадратичное отклонение S. Таким образом, число степеней свободы в данном случае 𝜈 = 𝐾 − 1 − 2. Сначала необходимо рассчитать 𝑚𝑖0 теоретические частоты, воспользо- вавшись формулами: 𝒏𝒉 𝒎𝟎𝒊 = 𝝋(𝒖𝒊 ); 𝑺 𝒖𝒊 = 𝒙𝒊 −𝒙 где 𝒉 − ширина интервала. 𝑺 ; 𝝋(𝒖𝒊 ) = 𝟏 √𝟐𝝅 𝒆 − 𝒖𝟐 𝟐 ; (1.15) Плотность вероятностей нормированного нормального распределения: 𝜑 (𝑢𝑖 ) = 1 √2𝜋 𝑒 − 𝑢2 2 можно определить из таблицы приложения П1. Результаты вычислений удобно представить в виде таблицы: Таблица 1.5.Параметры для определения закона распределения № mi xинт i 1 2 3 4 5 6 xинт i − 𝑥𝑥 𝑢𝑖 = 𝑆 𝜑(𝑢𝑖 ) = 1 √2𝜋 𝑢2 𝑒− 2 𝑚𝑖0 = 𝑛ℎ 𝜑(𝑢𝑖 ) 𝑆 (𝑚𝑖 − 𝑚𝑖0 )2 𝑚𝑖0 2 Σ = 𝜒реал = 2 Далее определим по таблице П.3 критических значений 𝜒кр при уровне 2 2 < 𝜒кр то значимости α и числе степеней свободы 𝜈 = 𝐾 − 1 − 2. Если 𝜒реал гипотезу о нормальном распределении можно принять при данном уровне значимости. 23 В данной работе K = 6, поэтому 𝜈 = 6 − 1 − 2 = 3. Фрагмент таблицы 2 находится на распределения Пирсона представлен на рис.1.7. Величина 𝜒кр пересечении столбца α и строки ν. ν=3 3 Уровень значимости, α 0,01 0,025 11,35 9,35 0,05 7,81 0,95 0,352 0,975 0,216 0,99 0,115 Рис. 1.7. Критические точки распределения Пирсона Более полная таблица распределения Пирсона представлена в приложении (таблица П.3). 1.3. ЗАДАНИЕ ДЛЯ ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ Произвести статистический анализ одномерной выборки. Выборка представлена в виде статистического ряда (x1, x2, …, xn.). Объем выборки 36 значений. Величина 𝑥𝑥 – исследуемый признак, представляющий собой время про- хождения изделием лабиринта, имитирующего технологический процесс. Для выполнения поставленной задачи необходимо: 1. Измерить время прохождения тридцати шести изделий по лабиринту. Изделия изготовлены из одного и того же материала и взяты из одной и той же партии. Их номинальный диаметр 16 мм. Перемещение изделий в рабочей зоне происходит с помощью манипулятора. Время движения по лабиринту фиксируется с помощью контроллера робототехнической системы FANUC с точностью 0,1 с. 2. Составить таблицу измерений выборочной совокупности (выборки). 3. Представить произведенные измерения в виде вариационного ряда. 4. Разбить выборку на интервалы. Результаты свести в таблицу. 5. Рассчитать основные характеристики выборки: — среднее арифметическое (среднее), — выборочную (эмпирическую) несмещенную дисперсию, — стандартное среднее квадратичное отклонение. 24 6. Вычислить дополнительные характеристики выборки, необходимые для установления закона распределения: — коэффициент вариации, — оценку коэффициента асимметрии, — среднее квадратичное асимметрии, — оценку эксцесса, — среднее квадратичное эксцесса, — выборочную моду, — выборочную медиану. 7. Сделать предварительное заключение о степени соответствия распределения нормальному. 8. Построить гистограмму и полигон распределения. 9. Построить эмпирическую функцию распределения. Проверить правильность оценки медианы. 10. Определить доверительный интервал для математического ожида- ния. 11. Определить доверительный интервал для дисперсии. 12. Представить в виде доверительной полосы интервал для математического ожидания графически. 13. Представить доверительный интервал для дисперсии при заданных значениях S и n графически. 14. Проверить гипотезу о нормальном распределении выборки, воспользовавшись критерием Пирсона: 2 — вычислить реальное значение 𝜒реал критерия Пирсона, 2 критерия Пирсона, — по таблице определить критическое значение 𝜒кр — сделать вывод о распределении выборки. 15. Сделать общие выводы по всей работе. 25 1.4. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ 1. Измерить время прохождения выборки из партии деталей по лабиринту, имитирующему технологический процесс. Для этого использовать промышленный робот FANUC. Составление программы для обеспечения автоматического измерения времени задача другой работы. 2. Составить таблицу измерений выборочной совокупностью (выборки). Размер выборки 36 значений. Выборка статистически значима. 3. Представить произведенные измерения в виде вариационного ряда, т.е. измеренные значения расположить в порядке возрастания. 4. Систематизировать результаты измерений, т.е. разбить выборку на интервалы (пример, табл. 1.1). 5. Рассчитать: — среднее арифметическое (среднее) по формуле (1.1), — выборочную (эмпирическую) несмещенную дисперсию (1.2), — стандартное среднее квадратичное отклонение (1.3), 6. Произвести предварительный анализ статистических данных, необходимых для определения закона распределения. Для этого целесообразно построить таблицу 1.5 центральных моментов: Таблица 1.6.Расчет центральных моментов K 1 2 3 4 5 6 xинт i (xинт i − x)1 mi (xинт i − x)2 mi (xинт i − x)3 mi (xинт i − x)4 mi Σ= Σ= Σ= Используя таблицу рассчитать: — коэффициент вариации V (1.4): — оценку коэффициента асимметрии As (1.5), — среднее квадратичное асимметрии SA (1.6), — оценку эксцесса Ex (1.7), 26 — среднее квадратичное эксцесса SE (1.8), — выборочную моду (середина интервала с наибольшей частотой); — выборочную медиану Me (1.9). 7. С помощью вычисленных числовых характеристик определить, является ли данное распределение близким к нормальному. Для наглядности построим еще одну таблицу 1.6: Таблица 1.7. Параметры закона распределения Диапазон 𝑥𝑥 ± 𝑆 𝑥𝑥 ± 2𝑆 𝑥𝑥 ± 3𝑆 Нижнее значение Верхнее значение Реальная частота Допустимая частота 68 95 100 Интеграл Лапласа 68.269 95.450 99.730 Для варианта задания необходимо заполнить второй, третий и четвер- тый столбцы. Для этого целесообразно воспользоваться вариационным рядом. Дополнительно рассчитать As 𝑆𝐴 , 𝐸𝑥 𝑆𝐸 . Сделать предварительное заключение о нормальности распределения. 8. Построить гистограмму и полигон распределения (пример, рис. 1.1). 9. Построить эмпирическую функцию распределения (пример, рис. 1.2). Проверить, правильность оценки медианы (сравнить значение в п.6 с полученным из функции (𝐹 (𝑥𝑥𝑃 ) = 0,5). 10. Определить доверительный интервал для математического ожида- ния μ (1.10). В технике обычно принимают α = 0,05, при этом P1–α = P0,95 = 95%, а при n > 30 => t0,05,∞ = Zα = Z0,05 = 1,96. 11. Представить в виде доверительной полосы интервал для математического ожидания графически (например, как на рис. 1.4). 12. Доверительный интервал для дисперсии (1.13) при P1–α= P0,95 = 95% и n = 30 t0,05,∞= Z0,05 = 1,96 => 0,67 S2 ≤ 𝜎 2 ≤ 1,94 𝑆 2 . 27 13. Представить доверительный интервал для дисперсии при заданных значениях S и n графически (пример, рис.1.6). 14. Проверить гипотезу о нормальном распределении выборки, воспользовавшись критерием Пирсона. Для этого необходимо заполнить таблицу 1.5, приведенную выше. Значения плотности вероятностей 𝜑 (𝑢𝑖 ) = 1 √2𝜋 𝑢2 𝑒 − 2 можно определить из таблицы приложения П.1. 1.5. СОДЕРЖАНИЕ ОТЧЕТА 1. Название и цель работы. На титульном листе обязательно укажите номер варианта. 2. Общие сведения должны содержать (очень коротко) понятия: — генеральной и выборочной совокупности, — вариационного ряда, — среднего арифметического и математического ожидания, — дисперсии и ее оценки, — точечной и интервальной оценки выборки, — эмпирического распределения, — доверительных интервалов, 3. Задание для выполнения лабораторной работы. 4. Все необходимые расчеты, таблицы и графики. 5. Выводы. Конкретно, без общих рассуждений, обобщить результаты данной работы и сформулировать преимущества и недостатки различных способов определения параметров. 1.6. КОНТРОЛЬНЫЕ ВОПРОСЫ 1. Что такое одномерная генеральная совокупность и выборка из нее? 2. Как из статистического ряда построить вариационный ряд? 3. Для чего нужна интервальная группировка? 4. Как называется оценка математического ожидания? 28 5. Во сколько раз дисперсия отличается от среднеквадратичного отклонения? 6. Как по кривой распределения определить знак коэффициента ассиметрии? 7. Как называется мера островершинности нормального распределения? 8. По какой формуле определяется выборочная мода? 9. Какой геометрический смысл у выборочной медианы? 10. Какой геометрический смысл имеет площадь под частью эмпирической кривой распределения? 11. Что такое размах выборки? 12. На сколько величина рассеяния больше размаха выборки? 13. Симметричен ли доверительный интервал относительно точечной оценки дисперсии? 1.7. ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ 1. Результаты измерений значений параметра представлены в табл. 1.7. Таблица 1.7. Значения измерений параметра выборки № x № x № x № x № x № x 1 8,7 7 8,8 13 9,5 19 9,4 25 9,3 31 9,0 2 8,8 8 9,5 14 8,8 20 9,5 26 8,9 32 8,9 3 9,1 9 8,3 15 9,1 21 8,8 27 9,2 33 9,3 4 9,3 10 9,2 16 8,6 22 8,9 28 9,0 34 8,8 5 9,0 11 8,8 17 8,8 23 8,9 29 9,0 35 9,1 6 9,3 12 9,1 18 9,1 24 9,2 30 8,8 36 8,8 2. Измеренные значения, расположенные в порядке неубывания (возрастания) (табл.1.8). 29 Таблица 1.8. Вариационный ряд № x № x № x № x № x № x 1 8,3 7 8,8 13 8,9 19 9,0 25 9,1 31 9,3 2 8,6 8 8,8 14 8,9 20 9,0 26 9,2 32 9,3 3 8,7 9 8,8 15 8,9 21 9,1 27 9,2 33 9,4 4 8,7 10 8,8 16 8,9 22 9,1 28 9,2 34 9,5 5 8,7 11 8,8 17 9,0 23 9,1 29 9,3 35 9,5 6 8,8 12 8,8 18 9,0 24 9,1 30 9,3 36 9,5 4. Разбивка выборки на интервальные группировки (табл. 1.9). Таблица 1.9. Параметры группировок Интервалы группировки Свыше До (включительно) x ( Cек) x( Cек ) K 1 8,3 (включительно) 2 8,5 3 8,7 4 8,9 5 9,1 6 9,3 8,5 8,7 8,9 9,1 9,3 9,5 Середина интервала 𝑥𝑥инт 𝑖 8,4 8,6 8,8 9,0 9,2 9,4 Частота mi 1 4 11 9 7 4 Σ=36 4. Основные параметры выборки. 1) Среднее арифметическое (выборочное среднее): 1 1 𝑥𝑥 = ∑𝐾 𝑖=1 𝑚𝑖 𝑥𝑥инт 𝑖 = 36 (1 ∙ 8,4 + 4 ∙ 8,6 + 11 ∙ 8,8 + 9 ∙ 9,0 + 7 ∙ 9,2 + 4 ∙ 9,4) = 8,96. 𝑛 2) Выборочная (эмпирическая) несмещенная дисперсии: 𝑆2 = 1 𝑛−1 1 2 ∑𝐾 𝑖=1 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥 ) = 35 (1 ∙ 0,3136 + 4 ∙ 0,1296 + 11 ∙ 0,0256 + + 9 ∙ 0,0016 + 7 ∙ 0,576 + 4 ∙ 0,1936) = 0,066. 3) Стандартное среднее квадратичное отклонение: 𝐾 1 𝑆=� � 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥)2 = �0,066 = 0,257. 𝑛−1 𝑖=1 30 5. Расчет параметров: — коэффициент вариации V; — оценка коэффициента асимметрии As; — среднее квадратичное асимметрии SА, — оценка эксцесса Ex; — среднее квадратичное эксцесса SЕ; — выборочная мода Mo; — выборочная медиана Me. 1) Вычисление центральных моментов (табл. 1.10). Таблица 1.10. Расчетная таблица K 𝑥𝑥инт 𝑖 1 2 3 4 5 6 8,4 8,6 8,8 9,0 9,2 9,4 (𝑥𝑥инт 𝑖 − 𝑥𝑥)1 – 0,56 – 0,36 – 0,16 0,04 0,24 0,44 (𝑥𝑥инт 𝑖 − 𝑥𝑥)2 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥)3 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥)4 𝑚𝑖 0,3136 0,5184 0,2816 0,0144 0,4032 0,7744 Σ=2,3056 – 0,176 – 0,187 – 0,045 0,0 0,097 0,341 Σ=0,03 0,098 0,067 0,007 0,0 0,023 0,15 Σ=0,345 2) Коэффициент вариации: 𝑉= 𝑆 0,257 = = 0,029. 8,96 𝑥𝑥 3) Оценка коэффициента асимметрии: 1 𝐾 ∑1 (𝑥𝑥инт 𝑖 − 𝑥𝑥 )3 𝑚𝑖 0,03⁄36 𝐴𝑠 = 𝑛 = = 0,049. 0,017 𝑆3 Среднее квадратичное асимметрии: 6(𝑛 − 1) = 0,38. 𝑆𝐴 = � (𝑛 + 1)(𝑛 + 3) 4) Оценка эксцесса: 1 𝐾 ∑1 (𝑥𝑥инт 𝑖 − 𝑥𝑥 )4 𝑚𝑖 0,345⁄36 𝐸𝑥𝑥 = 𝑛 − 3 = − 3 = −0,6. 0,004 𝑆4 31 Среднее квадратичное эксцесса: 𝑆𝐸 = � 24𝑛(𝑛 − 2)(𝑛 − 3) = 0,70. (𝑛 − 1)2 (𝑛 + 3)(𝑛 + 5) 5) Выборочная мода – середина интервала с наибольшей частотой: 𝑀𝑜 = 𝑥𝑥инт 3 = 8,8. 6) Выборочная медиана Me. Определяется как величина, относительно которой выборка делится на две равные по объему части. При интервальной группировке сначала находят так называемый медианный интервал, номер которого определяют из неравенств (1.9). Если медианный интервал четвертый (визуальная оценка), то проверим условие: — левее медианного: � 𝑚𝑖 ≤ 𝑖<𝑖𝑀𝑒 𝑛 = 1 + 4 + 11 = 16 < 18. 2 — включая медианный: 𝑛 � 𝑚𝑖 > = 1 + 4 + 11 + 9 = 25 > 18. 2 𝑖≤𝑖𝑀𝑒 Следовательно, медианный интервал четвертый, а 𝑀𝑒 = 𝑥𝑥инт 4 = 9,0. 6. Проверка на соответствие выборки нормальному закону распределения (табл. 1.11). Таблица 1.11. Определение закона распределения Диапазон 𝑥𝑥 ± 𝑆 𝑥𝑥 ± 2𝑆 𝑥𝑥 ± 3𝑆 32 Нижнее значение 8,703 8,446 8,189 Верхнее значение 9,217 9,474 9,731 Реальная частота 25 ⁄ 36=0,69 35 ⁄ 36=0,97 36 ⁄ 36=1,00 Допустимая частота, % 68 95 100 Интеграл Лапласа, % 68,269 95,450 99,730 Графическая интерпретация данной таблицы представлена на рис. 1.8. Рис. 1.8. Диапазоны среднеквадратичных отклонений Предварительное заключение о нормальности распределения. Выборочное распределение близко к нормальному, если: 1. В интервалы 𝑥𝑥 ± 𝑆, 𝑥𝑥 ± 2𝑆, 𝑥𝑥 ± 3𝑆 должны попадать соответственно приблизительно 68%, 95% и 100% значений выборки. В нашем случае: 𝑥𝑥 ± 𝑆 = 0,69; 𝑥𝑥 ± 2𝑆 = 0,97; 𝑥𝑥 ± 3𝑆 = 1,00, т.е. условия выполняются. 2. Величина коэффициента вариации должна быть V< 0,33. В нашем случае V = 0,029, т.е. условие выполняется. 3. Оценка эксцесса Ex должна быть близка к нулю. В нашем случае 𝐸𝑥𝑥 = −0,6, 𝑆𝐸 = 0,70. Кроме того 4. Величина As 𝑆𝐴 коэффициента 𝐸𝑥 S𝐸 = 0,13 < 2, условие выполняется. = |−0,86| < 2, условие выполняется. асимметрии 𝐴𝑠 = 0,049, 𝜎𝐴 = 0,38, 5. 𝑥𝑥 = 8,96, Me = 9,0, т.е. 𝑥𝑥 ≈ Me – условие выполняется. 33 Таким образом, можно сделать вывод, что данное распределение близко к нормальному. Предварительная проверка распределения необходима для целесообразности проведения интервальных исследований. Полная проверка по критерию Пирсона будет проведена при интервальном оценивании. 7. Гистограмма и полигон распределения (рис. 1.9). Рис. 1.9. Гистограмма и полигон распределения. 8. Эмпирическая функция распределения (Рис. 1.10). Эмпирическую функцию распределения F(x) получают построением ступенчатой кривой относительных накопленных частот. Функция имеет скачки в точках, соответствующих серединам интервалов. 34 Рис. 1.10. Эмпирическая функция распределения Из рисунка следует, что медианный интервал – четвертый. Значение Ме = 9,0 (середина четвертого интервала), что подтверждает правильность предыдущих вычислений. 9. Доверительный интервал для математического ожидания. Границы доверительного интервала определяются величиной 𝑡𝛼,𝑛−1 При S = 0,257, 𝑥𝑥 = 8,96, n = 36, 𝑡𝛼,𝑛−1 = 2,03 (при α = 0,05, рис. 1.3). 𝑥𝑥 − 𝑡𝛼,𝑛−1 𝑆 √𝑛 0,257 ≤ µ ≤ x + t α,n−1 𝑆 √𝑛 . S √n 0,257 ≤ µ ≤ 8,96 + 2,03 8,96 − 2,03 √36 √36 8,873 ≤ 𝜇 ≤ 9,047 При этом: 𝑡𝛼,𝑛−1 𝑆 √𝑛 = 2,03 0,257 √36 = 0,087 35 10. Доверительная полоса для математического ожидания. Рис. 1.11. Доверительная полоса для математического ожидания 11. Доверительный интервал для дисперсии определяется выражением: (𝑛 − 1)𝑆 2 (𝑛 − 1) + 𝑍𝛼 �2(𝑛 − 1) 2 ≤𝜎 ≤ (𝑛 − 1)𝑆 2 (𝑛 − 1) − 𝑍𝛼 �2(𝑛 − 1) При n = 36, S2 = 0.066, P = 95%, Zα = 1,96 (при α = 0,05) 35∙𝑆 2 35+1,96√70 2 ≤𝜎 ≤ 35∙𝑆 2 35−1,96√70 0,67𝑆 2 ≤ 𝜎 2 ≤ 1,94𝑆 2 , 0,044 ≤ 𝜎 2 ≤ 0,128. 12. Доверительная полоса для дисперсии. 36 , Рис. 1.12. Доверительная полоса для дисперсии 13. Проверка гипотезы о нормальном распределении выборки по критерию Пирсона. 2 необходимо заполнить таблицу 1.12: Для определения 𝜒реал Таблица 1.12. Проверка гипотезы о распределении K 1 2 3 4 5 6 mi xинт i 1 4 11 9 7 4 8,4 8,6 8,8 9,0 9,2 9,4 𝑢𝑖 = xинт i − 𝑥𝑥 𝑆 –2,2 –1,4 –0,6 0,16 0,93 1,7 𝜑(𝑢𝑖 ) = 1 √2𝜋 0,0355 0,1497 0,3332 0,3939 0,2589 0,0940 𝑢2 𝑒− 2 𝑛ℎ 𝜑(𝑢𝑖 ) 𝑆 0,99 4,19 9,30 11 7,2 2,63 𝑚𝑖0 = Следовательно: (𝑚𝑖 − 𝑚𝑖0 )2 𝑚𝑖0 0,0 0,0 0,3 0,36 0,0 0,7 2 Σ = 𝜒реал = 1,36 2 =1.36, — значение статистики критерия Пирсона 𝜒реал — число степеней свободы 𝜈 = 6 − 1 − 2 = 3, уровень значимости α = 0,05, 37 — по таблице критических точек Пирсона (рис. 1.6, или таблица при2 = 7,81, ложения П.3) 𝜒кр 2 2 2 2 и 𝜒кр , 𝜒реал < 𝜒кр , т.к. 1,36 < 7,81, — сравниваем 𝜒реал — делаем вывод что, данные выборки не противоречат гипотезе о нор- мальном распределении. 38 2. ЭМПИРИЧЕСКИЕ ИССЛЕДОВАНИЯ ВЫБОРОК С ПОМОЩЬЮ КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО АНАЛИЗА Цель работы: исследование парной статистической выборки для определения корреляционной зависимости и построение статистической модели технологического процесса в виде уравнения регрессии. 2.1. ОБЩИЕ СВЕДЕНИЯ Для изучения взаимосвязи явлений и процессов их признаки делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называют факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называют результативными. В статистике различают функциональные и стохастические (вероятностные) связи явлений и процессов. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует только одно значение результативного. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической (вероятностной). Частным случаем стохастической связи является корреляционная связь. Кроме того, связи между факторами и результатами классифицируются по степени тесноты, направлению и аналитическому выражению. По направлению выделяют связь прямую и обратную. Прямая связь – это такая связь, при которой с увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) значений результативного. Например, увеличение температуры способствует увеличению скорости диффузии. 39 В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Например, при увеличении скорости движения уменьшается время перемещения. По аналитическому выражению выделяют связи прямолинейные линейные и нелинейные. Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют линейной связью вида: у = а + bх. Если же связь может быть выражена уравнением какой-либо кривой линии (параболы, гиперболы и др.), то такую связь называют нелинейной связью. Теснота связи показывает меру влияния факторного признака на общую вариацию результативного признака. Количественным критерием оценки тесноты связи является коэффициента корреляции. Для выявления наличия связи между величинами, ее характера и направления в статистике используются следующие методы: приведения параллельных данных аналитических группировок, графический, корреляции. Основным методом изучения статистической взаимосвязи является статистическое моделирование связи на основе корреляционного и регрессионного анализа. Корреляция – это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. В статистике принято различать следующие виды корреляции: — парная корреляция – связь между двумя признаками (результативным и факторным); 40 — частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков; — множественная корреляция – зависимость результативного и двух, или более факторных признаков, включенных в исследование. Задачей корреляционного анализа является количественное определение тесноты связи между результативным и факторным признаком. Этот показатель называется коэффициентом корреляции. Коэффициент корреляции может принимать значения от –1 до +1. Чем ближе абсолютное значение к единице, тем сильней связи между признаками. Если абсолютное значение равно единице, то можно говорить о функциональной связи между величинами, то есть одну величину можно выразить через другую посредством математической функции. Корреляция связана с регрессией, поскольку первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. Регрессионный анализ заключается в определении аналитического выражения связи в виде уравнения регрессии. Регрессией называется зависимость среднего значения случайной величины результативного признака от величины факторного, а уравнением регрессии – уравнение, описывающее корреляционную зависимость между результативным признаком и одним или несколькими факторными. Основные задачи, рассматриваемые в этой работе: — статистические методы оценки зависимости между двумя изучаемыми признаками; — регрессионный анализ, представляющий собой специальный случай метода наименьших квадратов и служащий анализу влияния независимой переменной на зависимую. 41 2.2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ 2.2.1. Определение коэффициента корреляции Для характеристики многомерного эмпирического распределения вычисляют его числовые параметры, позволяющие делать выводы о существовании зависимостей между признаками. Мерой силы (тесноты) и направления связи между двумя переменными x и y, вычисленной по ряду из n пар (𝑥𝑥1 , 𝑦1 ), (𝑥𝑥2 , 𝑦2 ), … (𝑥𝑥𝑛 , 𝑦𝑛 ) является эмпирический коэффициент корреляции 𝑟𝑥𝑦 , который вычисляется с использованием ковариации: 𝟏 𝒓𝒙𝒚 = 𝒄𝒐𝒗(𝒙, 𝒚) , 𝑺𝒙 𝑺𝒚 (2.1) где: 𝒄𝒐𝒗(𝒙, 𝒚) = ∑(𝒙𝒊 − 𝒙)(𝒚𝒊 − 𝒚) – ковариация случайных величин 𝑥𝑥 и 𝑦; 𝒏 𝟏 𝟏 𝒙 = ∑ 𝒙𝒊 ; 𝒚 = ∑ 𝒚𝒊 – оценки математического ожидания 𝑥𝑥 и 𝑦; 𝒏 𝑺𝒙 = � 𝟏 𝒏−𝟏 𝒏 ∑(𝒙𝒊 − 𝒙)𝟐 ; 𝑺𝒚 = � тичных отклонений 𝑥𝑥 и 𝑦. 𝟏 𝒏−𝟏 ∑(𝒚𝒊 − 𝒚)𝟐 – оценки среднеквадра- 2.2.2. Доверительный интервал для коэффициента корреляции Если выборка получена из генеральной совокупности, имеющей дву- мерное нормальное распределение, то при достаточно больших 𝑛 (𝑛 > 30) можно получить выражение для определения доверительного интервала ко- эффициента корреляции 𝑅0 : 𝟏 𝟏 + 𝒓𝒙𝒚 𝟏 𝟏 𝟏 + 𝒓𝒙𝒚 𝟏 𝐭𝐚𝐧𝐡 � 𝐥𝐧 − 𝒁𝜶 � < 𝑹𝟎 < 𝐭𝐚𝐧𝐡 � 𝐥𝐧 + 𝒁𝜶 �. 𝟐 𝟏 − 𝒓𝒙𝒚 𝟐 𝟏 − 𝒓𝒙𝒚 √𝒏 − 𝟑 √𝒏 − 𝟑 (2.2) Из таблицы П.2 распределения Стьюдента для различных значений α = 1– γ можно определить 𝑍𝛼 . При достаточно большом количестве измере- ний (𝑛 > 30) значения 𝑍𝛼 практически совпадает со значениями tα,∞ , которые приведены в таблице 2.1: 42 Таблица 2.1. Коэффициенты Стьюдента для tα,∞ = 𝑍𝛼 α 0,10 0,05 0,02 0,01 0,002 zα= t α,∞ 1,64 1,96 2,33 2,58 3,09 Иногда доверительный интервал для 𝑅0 удобно вычислять с помощью таблиц гиперболического тангенса из соотношения: 𝐀𝐫𝐜𝐭𝐡 𝒓𝒙𝒚 − 𝒁𝜶 𝟏 √𝒏 − 𝟑 < 𝐀𝐫𝐜𝐭𝐡 𝑹𝟎 < 𝐀𝐫𝐜𝐭𝐡 𝒓𝒙𝒚 + 𝒁𝜶 𝟏 √𝒏 − 𝟑 Соответствующая таблица П.4. приведена в приложении. . (2.3) Доверительный интервал для 𝑅0 целесообразно определять при доста- точно больших 𝑛 (𝑛 > 30). В противном случае необходимо проверять на значимость коэффициент корреляции. 2.2.3. Проверка значимости коэффициента корреляции (проверка гипотезы зависимости) Значимость вычисленного коэффициента корреляции представляет собой проверку следующей гипотезы: существенно ли (значимо ли) отличается от нуля рассчитанный эмпирический коэффициент корреляции? Проверка производится с помощью t-критерия Стьюдента. По таблице t-распределения необходимо найти критическое значение критерия (𝑡кр ) при заданном уровне значимости α и степени свободы ν. В нашем случае число степеней свободы 𝜈 = 𝑛 − 2. Реальное значение критерия 𝑡реал определяется по формуле: 𝒕реал = 𝒓𝒙𝒚 √𝒏 − 𝟐 �𝟏 − 𝒓𝟐𝒙𝒚 . (2.4) Если вычисленное по формуле (2.4) значение 𝑡реал по модулю окажется меньше чем табличное 𝑡кр , то зависимости между случайными величинами 𝑥𝑥 и 𝑦 нет. В противном случае, экспериментальные данные не противоречат гипотезе о зависимости случайных величин. 43 2.2.4. Модели регрессионного анализа Во многих ситуациях интерес представляет зависимость между двумя признаками продукта, материала, процесса и т.п. При одновременном изучении двух признаков получают двумерную выборку (𝑥𝑥𝑖 , 𝑦𝑖 ), 𝑖 = 1, … , 𝑛. Пары точек (𝑥𝑥𝑖 , 𝑦𝑖 ) наносят на координатную сетку, получая так называемое “облако точек”, которое дает предварительное представление о рассеянии и форме зависимости между признаками. На основании регрессионного анализа наблюдаемое "облако" аппроксимируется уравнением регрессии. Теоретически уравнение регрессии является условным математическим ожиданием одной случайной переменной (зависимой), при условии, что вторая переменная (независимая) принимает заданные (фиксированные) значения. Таким образом, регрессия это всегда «зависимость в среднем». Если эта зависимость задается уравнением прямой 𝑦 = 𝑎 + 𝑏𝑥𝑥, то говорят о линейной регрессии или линейной регрессионной модели. Параметры 𝑎 и 𝑏 часто оцениваются, используя метод наименьших квадратов. Сущность этого метода состоит в минимизации суммы квадратических отклонений между наблюдаемыми и расчетными величинами. Расчетные величины находятся по соответствующему уравнению – уравнению регрессии. Чем меньше квадраты расстояние между полученными эмпирическими значениями и расчетными, тем более точен прогноз, построенный на основе уравнения регрессии. Если обе переменные принадлежат двумерному нормальному распределению, то уравнение регрессии может быть записано в виде уравнений прямых линий: 𝒚=𝒚+𝒓 𝒙=𝒙+𝒓 44 𝑺𝒚 (𝒙 − 𝒙 ) 𝑺𝒙 𝑺𝒙 (𝒚 − 𝒚 ) 𝑺𝒚 (2.5) Прямые всегда пересекаются в точке (𝑥𝑥, 𝑦) и образуют «ножницы», причем тем уже, чем больше |𝑟|. При |𝑟| = 1 обе прямые регрессии совпада- ют, а при 𝑟 = 0 прямые регрессии перпендикулярны осям координат (пере- менные независимы). Во многих случаях графическое представление данных, т.е. "облако" точек, показывает, что зависимость между переменными не может быть описана прямой линией. В этом случае можно попробовать представить искомое уравнение в виде уравнения второго порядка, либо другим способом (например, методом эквивалентной замены факторного параметра). 2.2.5. Построение линейной регрессионной модели методом наименьших квадратов Как уже отмечалось, уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей) зависимость между случайными величинами 𝑥𝑥 и 𝑦. Если считать, что вели- чина 𝑥𝑥 свободная, а 𝑦 зависимая от 𝑥𝑥, то уравнение регрессии соответствует уравнению прямой: 𝒚 = 𝒂 + 𝒃𝒙 . (2.6) Если ранее проводился корреляционнй анализ, то значения оценок среднеквадратичных отклонений 𝑆𝑥 , 𝑆𝑦 и коэффициента корреляции 𝑟𝑥𝑦 известны. Коэффициент 𝑏 удобно рассчитать по формуле: 𝒃 = 𝒓𝒙𝒚 𝑺𝒚 . 𝑺𝒙 (2.7) При неизвестных 𝑆𝑥 , 𝑆𝑦 , 𝑟𝑥𝑦 , т.е. если корреляционнй анализ не прово- дился, следует пользоваться формулой: 𝒃= ∑ 𝒙𝒊 𝒚𝒊 − 𝒏 ∙ 𝒙 ∙ 𝒚 𝟐 ∑ 𝒙𝟐𝒊 − 𝒏 ∙ 𝒙 . В обоих случаях коэффициент 𝑎 рассчитывают по формуле: 𝒂=𝒚−𝒃∙𝒙. (2.8) (2.9) 45 Коэффициент 𝑏 называют коэффициентом линейной регрессии. В не- которых источниках 𝑎 называют постоянным коэффициентом регрессии, а 𝑏 –соответственно переменным. 2.2.6. Определение качества аппроксимации Мера ошибки, которая получается при оценке или прогнозировании 𝑦 по заданным значениям 𝑥𝑥 с помощью уравнения регрессии, называется стан- дартной ошибкой оценивания или стандартной ошибкой предсказания. При проведенном ранее корреляционном анализе значения 𝑆𝑦 и 𝑟𝑥𝑦 из- вестны. Тогда погрешности предсказания 𝑦 по заданному значению 𝑥𝑥 вычисляются по формулам: 𝑺𝒚⁄𝒙 = 𝑺𝒚 �𝟏 − 𝒓𝟐𝒙𝒚 ; (2.10) 𝑺𝒚⁄𝒙 𝜹𝒚⁄𝒙 = ∙ 𝟏𝟎𝟎% . 𝒚 При этом величина 𝛿𝑦⁄𝑥 называется относительной погрешностью, а 𝑆𝑦⁄𝑥 – абсолютной погрешностью. Иногда величину 𝑆𝑦⁄𝑥 еще называют оста- точным средним квадратическим отклонением, оно характеризует уход величины 𝑦 от линии регрессии при фиксированном (заданном) значении 𝑥𝑥. Так как значимость коэффициента корреляции проверялась на этапе корреляционного анализа, то нет необходимости заниматься проверкой значимости коэффициента регрессии. При необходимости можно сразу перейти к графической интерпретации исследований. Если нет данных корреляционного анализа, то определить стандартную ошибку аппроксимации (остаточное среднее квадратичное отклонение) можно по формуле: 𝟏 𝑺𝒚⁄𝒙 = � �(𝒚𝒊 − 𝒂 − 𝒃 ∙ 𝒙𝒊 )𝟐 . 𝒏−𝟐 (2.11) Для того, чтобы проверить значимость построенной линейной регрессионной модели, осуществляется проверка значимости коэффициента урав46 нения регрессии b. Другими словами, проверяется отличается ли статистически значимо оценка коэффициента уравнения регрессии от b нуля. Проверка проводится с помощью t-критерия Стьюдента. Реальное значение 𝒕реал t-критерия определяется по формулам: 𝒕реал = 𝑺𝒃 = � 𝒃 , 𝑺𝒃 𝒏 ∙ 𝑺𝟐𝒚𝒙 𝒏 ∙ ∑ 𝒙𝟐𝒊 − (∑ 𝒙𝒊 )𝟐 (2.12) Критическое значение критерия (𝑡кр ) при заданном уровне значимости α и степени свободы ν определяется по таблице t-распределения. В данном случае число степеней свободы 𝜈 = 𝑛 − 2. Если вычисленное по формуле значение 𝑡реал удовлетворяет условию �𝑡реал � > 𝑡кр , то 𝑏 значимо отличается от нуля, т.е. корреляция существует. 2.2.7. Диаграмма рассеяния (корреляционное поле) и график линии регрессии Диаграмма рассеяния это графическое изображение соответствующих пар (𝑥𝑥𝑖 , 𝑦𝑖 ) в виде точек на плоскости в прямоугольных координатах с осями 𝑥𝑥 и 𝑦. Корреляционное поле является одним из графических представлений связанной (парной) выборки. В той же системе координат строится и график линии регрессии. Следует выбирать масштабы и начальные точки на осях так, чтобы диаграмма была максимально наглядной. Следует иметь в виду, что линия регрессии всегда (с учетом погрешностей измерений и вычислений) проходит через точку средних значений с координатами ( 𝑥𝑥, 𝑦 ). Если соединить экспериментальные точки отрезками прямых, то сум- марная площадь между линией регрессии и полученной ломаной должна быть равна нулю. То есть площади над линией регрессии и под ней должны 47 быть равны, потому что аппроксимация проводилась методом наименьших квадратов. Так как мы имеем дело с действительными числами и неизбежно их округление, то хорошим считается результат, при котором теоретические и экспериментальные данные различаются менее, чем на 10%. Пример построения диаграммы рассеяния и графика линии регрессии будет рассмотрен ниже в разделе «Пример выполнения лабораторной работы». 2.3. ЗАДАНИЕ ДЛЯ ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ Произвести корреляционный и регрессионный анализ двумерной выборки из генеральной совокупности по двум количественным характеристикам (признакам) 𝑥𝑥 и 𝑦. Выборка представлена в виде семи пар случайных величин (𝑥𝑥𝑖 , 𝑦𝑖 ). Величина 𝑥𝑥 – факторный признак, представляющий собой диаметр из- делия. Величина 𝑦 – результативный признак, представляющий собой время прохождения изделием лабиринта, имитирующего технологический процесс. Для выполнения поставленной задачи необходимо: 1. Измерить время прохождения семи изделий по лабиринту. Изделия изготовлены из одного и того же материала с одинаковыми допусками. Их диаметры: 13,5; 14; 14,5; 15; 15,5; 16; 16,5 мм. Перемещение изделий в рабочей зоне происходит с помощью манипулятора. Время фиксируется с помощью контроллера робототехнической системы FANUC с точностью 0,1 с. 2. Составить таблицу двумерной выборки �𝑥𝑥𝑖 , 𝑦𝑖 � объемом семь пар. 3. Рассчитать средние арифметические значения (оценки математических ожиданий). 4. Составить расчетную таблицу, в которой представить значения: 𝑥𝑥𝑖2 , 𝑦𝑖2 , (𝑥𝑥𝑖 − 𝑥𝑥 ), (𝑦𝑖 − 𝑦), (𝑥𝑥𝑖 − 𝑥𝑥 )2 , (𝑦𝑖 − 𝑦)2 и их суммы. 5. Определить среднеквадратичные отклонения 𝑆𝑥 , 𝑆𝑦 . 48 6. Определить значение ковариации 𝑐𝑜𝑣 (𝑥𝑥, 𝑦). 7. Рассчитать эмпирический коэффициент корреляции с использовани- ем величины ковариации 𝑟𝑥𝑦 . 8. Для проверки значимости коэффициента корреляции определить: — реальную величину критерия распределения Стьюдента 𝑡реал . — критическое значение критерия (𝑡кр ) при уровне значимости α и сте- пени свободы 𝜈 = 𝑛 − 2. Уровень значимости α предлагается назначить са- мостоятельно. и 𝑡кр . 9. Сделать вывод о зависимости случайных величин 𝑥𝑥 и y, сравнив 𝑡реал 10. Вычислить коэффициенты 𝑎 и 𝑏 уравнения линейной регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥 методом наименьших квадратов. 11. Определить качество аппроксимации, вычислив абсолютную и от- носительную погрешность. 12. Определить остаточное среднее квадратичное отклонение, если корреляционный анализ не проводился. 13. Если значимость коэффициента корреляции не проверялась, следует проверить значимость коэффициента 𝑏 уравнения линейной регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥. Для этого: — определить реальное значение t-критерия для коэффициента 𝑏. — определить критическое значение критерия (𝑡кр ) при заданном уровне значимости α и степени свободы распределения. 𝜈 = 𝑛 − 2 из таблицы t- — сравнить 𝑡реал и 𝑡кр . Сделать вывод о зависимости случайных ве- личин 𝑥𝑥 и y. 14. Построить диаграмму рассеяния (корреляционное поле) и график линии регрессии. 49 2.4. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ 1. Измерить время прохождения деталей по лабиринту, который имитирует технологический процесс. Для этого использовать промышленный робот FANUC. 2. Составить таблицу измерений связанной выборки из семи пар значений (𝑥𝑥𝑖 , 𝑦𝑖 ). Таблица 2.2. Значения парной выборки № 1 2 3 4 5 6 7 Σ 𝑥𝑥 (диаметр) 𝑦 (время) 𝑥𝑥 ∙ 𝑦 13,5 14 14,5 15 15,5 16 16,5 105 3. Рассчитать средние арифметические значения (оценки математических ожиданий): 1 𝑥𝑥 = ∑ 𝑥𝑥𝑖 = 𝑛 1 105 7 𝑦 = ∑ 𝑦𝑖 ; 𝑛 = 15; 4. Составить расчетную таблицу 2.3. Таблица 2.3. Параметры выборки № 1 2 3 4 5 6 7 Σ 𝑥𝑥𝑖 𝑦𝑖 𝑥𝑥𝑖2 𝑦𝑖2 5. Определить 𝑆𝑥 , 𝑆𝑦 : 𝑆𝑥 = � 1 𝑛−1 (𝑥𝑥𝑖 − 𝑥𝑥) (𝑦𝑖 − 𝑦) ∑(𝑥𝑥𝑖 − 𝑥𝑥)2 ; 𝑆𝑦 = � 6. Определить значение ковариации: 50 𝑐𝑜𝑣 (𝑥𝑥, 𝑦) = (𝑥𝑥𝑖 − 𝑥𝑥)2 1 𝑛−1 ∑(𝑦𝑖 − 𝑦)2 . 1 �(𝑥𝑥𝑖 − 𝑥𝑥 )(𝑦𝑖 − 𝑦). 𝑛 (𝑦𝑖 − 𝑦)2 7. Рассчитать эмпирический коэффициент корреляции с использованием величины ковариации (2.1): 8. Для проверки значимости коэффициента корреляции определить реальную величину критерия распределения Стьюдента (2.4). 9. По таблице t-распределения найти критическое значение критерия (𝑡кр ) при уровне значимости α и степени свободы 𝜈 = 𝑛 − 2. (Таблица П.2 приложения). 10. Сравнить 𝑡реал и 𝑡кр . Сделать вывод о зависимости случайных ве- личин 𝑥𝑥 и y.Если: �𝑡реал � < 𝑡кр – зависимости между случайными величинами 𝑥𝑥 и 𝑦 нет, �𝑡реал � > 𝑡кр – между величинами 𝑥𝑥 и 𝑦 существует корреляционная за- висимость. 11. Вычислить коэффициенты 𝑎 и 𝑏 уравнения линейной регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥 методом наименьших квадратов: 𝑏 = 𝑟𝑥𝑦 𝑆𝑦 𝑆𝑥 ; или 𝑏 = ∑ 𝑥𝑖 𝑦𝑖 −𝑛∙𝑥∙𝑦 ∑ 𝑥𝑖2 −𝑛∙𝑥 2 ; 𝑎 = 𝑦 − 𝑏 ∙ 𝑥𝑥 . Коэффициенты 𝑎 и 𝑏 желательно рассчитать по двум формулам и сравнить результаты. Они не должны значимо отличаться друг от друга. 12. Определить качество аппроксимации, вычислив при этом величину 𝑆𝑦⁄𝑥 – абсолютную погрешность (остаточное среднее квадратическое откло- нение) и 𝛿𝑦⁄𝑥𝑥 – относительную погрешность: 2 𝑆𝑦⁄𝑥 = 𝑆𝑦 �1 − 𝑟𝑥𝑦 ; 𝛿𝑦⁄𝑥 = 𝑆𝑦⁄𝑥 𝑦 ∙ 100% . 13. Если корреляционный анализ не проводился, то для определения остаточного среднего квадратичного отклонения заполнить таблицу 2.4. 51 Таблица 2.4. Характеристики качества аппроксимации № 𝑥𝑥𝑖 1 2 3 4 5 6 7 Σ муле: 𝑎 𝑦𝑖 𝑏 (𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2 𝑏 ∙ 𝑥𝑥𝑖 14. Определить остаточное среднее квадратичное отклонение по фор1 𝑆𝑦⁄𝑥 = � �(𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2 . 𝑛−2 В этом случае значимости коэффициента корреляции не проверялась. Поэтому следует проверить значимость коэффициента 𝑏 уравнения линейной регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥. 15. Определить 𝑡реал – реальное значение t-критерия для коэффициента 𝑏 по формулам: 𝑆𝑏 = � 2 𝑛∙𝑆𝑦𝑥 𝑛∙∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 ; 𝑡реал = 𝑏 𝑆𝑏 . 16. Из таблицы t-распределения П.2 определить критическое значение критерия (𝑡кр ) при заданном уровне значимости α и степени свободы 𝜈 =𝑛−2 17. Сравнить 𝑡реал и 𝑡кр . Сделать вывод о зависимости случайных вели- чин 𝑥𝑥 и y. Если: �𝑡реал � < 𝑡кр – зависимости между случайными величинами 𝑥𝑥 и 𝑦 нет, �𝑡реал � > 𝑡кр – между величинами 𝑥𝑥 и 𝑦 существует корреляционная за- висимость. 18. Построить диаграмму рассеяния (корреляционное поле) и график линии регрессии. 52 2.5. СОДЕРЖАНИЕ ОТЧЕТА 1. Название и цель работы. На титульном листе обязательно укажите номер варианта. 2. Общие сведения должны содержать (очень коротко) понятия: — корреляции и регрессии, — задачи корреляционного и регрессионного анализа, — смысл коэффициента корреляции, — модели регрессионного анализа, — аппроксимация методом наименьших квадратов, — качество аппроксимации, — определение понятий корреляционного поля (диаграммы рассеяния). 3. Задание для выполнения лабораторной работы. 4. Все необходимые расчеты, таблицы и графики. 5. Выводы. Конкретно, без общих рассуждений, обобщить результаты данной работы и сформулировать преимущества и недостатки различных способов определения параметров. 2.6. КОНТРОЛЬНЫЕ ВОПРОСЫ 1. Что такое факторные и результативные признаки? 2. Чем отличается функциональная и корреляционная связь? 3. Какие признаки у линейной связи? 4. Что является количественным критерием оценки тесноты связи? 5. Чем характеризуются виды корреляции (парная, частная, множественная)? 6. Какие основные задачи корреляционного анализа? 7. Чем отличается корреляционный и регрессионный анализ? 8. Какие параметры влияют на доверительный интервал коэффициента корреляции? 53 9. Какими способами можно определить коэффициенты уравнения регрессии? 10. Что означает понятие качество аппроксимации? 11. Как по графику линии регрессии и диаграмме рассеяния определить достоверность аппроксимации? 12. В каких координатах строится корреляционное поле и график линии регрессии? 2.7. ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ 1. Результаты измерений представлены в таблице 2.5. Таблица 2.5 Параметры парной выборки № 𝑥𝑥 (диаметр) 𝑦 (время) 𝑥𝑥 ∙ 𝑦 1 13,5 8,7 117,45 2 14 9,0 126,0 3 14,5 9,0 130,5 4 15 9,0 135,0 5 15,5 9,1 141,05 6 16 9,3 148,8 7 16,5 9,3 153,45 Σ 105 63,4 952,25 2. Средние арифметические значения 𝑥𝑥, 𝑦, 𝑥𝑥𝑦 (оценки математических ожиданий): 1 𝑥𝑥 = ∑ 𝑥𝑥𝑖 = 𝑛 105 7 1 = 15; 1 𝑥𝑥𝑦 = ∑(𝑥𝑥𝑖 𝑦𝑖 ) = 𝑛 3. Расчетная таблица 2.6: 𝑦 = ∑ 𝑦𝑖 = 𝑛 952,25 7 63,4 7 = 136,04. = 9,06; Таблица 2.6. Определение параметров выборки № 1 𝑥𝑥𝑖 13,5 𝑦𝑖 8,7 𝑥𝑥𝑖2 182,25 𝑦𝑖2 75,69 (𝑥𝑥𝑖 − 𝑥𝑥) – 1,5 (𝑦𝑖 − 𝑦) – 0,36 (𝑥𝑥𝑖 − 𝑥𝑥)2 2,25 (𝑦𝑖 − 𝑦)2 2 14,0 9,0 196,0 81,0 – 1,0 – 0,06 1,0 0,0 3 14,5 9,0 210,25 81,0 – 0,5 – 0,06 0,25 0,0 4 15,0 9,0 225,0 81,0 0,0 – 0,06 0,0 0,0 5 15,5 9,1 240,25 82,81 0,5 0,04 0,25 0,0 6 16,0 9,3 256,0 86,49 1,0 0,24 1,0 0,06 7 16,5 9,3 272,25 86,49 1,5 0,24 2,25 0,06 Σ 105,0 63,4 1582,0 574,48 7,0 0,25 54 0,13 4. Определение 𝑆𝑥 , 𝑆𝑦 : 𝑆𝑥 = � 𝑆𝑦 = � 1 𝑛−1 1 𝑛−1 1 ∑(𝑥𝑥𝑖 − 𝑥𝑥)2 = � ∙ 7 = 1,08; 6 1 ∑(𝑦𝑖 − 𝑦)2 = � ∙ 0,25 = 0,2. 6 5. Определение значения ковариации: 1 1 �(𝑥𝑥𝑖 − 𝑥𝑥 )(𝑦𝑖 − 𝑦) = (0,54 + 0,06 + 0,02 + 0,24 + 0,36) = 0,174 𝑛 7 6. Эмпирический коэффициент корреляции: 𝑐𝑜𝑣 (𝑥𝑥, 𝑦) = 𝑐𝑜𝑣(𝑥𝑥, 𝑦) 0,174 = = 0,8. 1,08 ∙ 0,2 𝑆𝑥 𝑆𝑦 Коэффициент корреляции достаточно высок. Тем не менее, проверим 𝑟𝑥𝑦 = его на значимость по t-критерию. 7. Определить реальную величину критерия распределения Стьюдента: 𝑡реал = 𝑟𝑥𝑦 √𝑛 − 2 = 0,8√5 = 2,98. 2 2 1 − 𝑟 � �1 − 0,8 𝑥𝑦 8. Критическое значение критерия (𝑡кр ) при уровне значимости α = 0,05 и степени свободы 𝜈 = 7 − 2 = 5 (П.2, или табл. 2.7 в тексте). Таблица 2.7.Фрагмент таблицы Стьюдента ν 5 Уровень значимости α (двусторонняя область) 0,10 0,05 0,02 0,01 0,002 0,001 2,0150 2,5706 3,3649 4,0321 5,8934 6,8688 Критическое значение распределения Стьюдента 𝑡кр = 2,5706 9. Сравнить 𝑡реал = 2,98, 𝑡кр = 2,5706. Следовательно, �𝑡реал � > 𝑡кр – между величинами (𝑥𝑥 , 𝑦) существует корреляционная зависимость. 10. Вычисление коэффициенты 𝑎 и 𝑏 уравнения линейной регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥 : — для случая проведения корреляционного анализа: 𝑏 = 𝑟𝑥𝑦 𝑆𝑦 𝑆𝑥 = 0,8 0,2 1,08 = 0,148; 𝑎 = 𝑦 − 𝑏 ∙ 𝑥𝑥 = 9,06 − 0,148 ∙ 15 = 6,84. — в случае отсутствия корреляционного анализа: 55 𝑏= ∑ 𝑥𝑖 𝑦𝑖 −𝑛∙𝑥∙𝑦 2 ∑ 𝑥𝑖2 −𝑛∙𝑥 = 952,25−7∙15∙9,06 1582−7∙225 = 0,136; 𝑎 = 𝑦 − 𝑏 ∙ 𝑥𝑥 = 9,06 − 0,136 ∙ 15 = 7,02. * Все входящие в формулы параметры уже расчитаны ранее в п.п. 1 – 4. Коэффициенты 𝑎 и 𝑏 рассчитанные по разным формулам отличаются друг от друга менее, чем на 10%. 11. Определение абсолютной (остаточное среднее квадратическое отклонение) и относительной погрешности аппроксимации при проведенном корреляционном анализе: 2 = 0,2�1 − 0,82 = 0,12 𝑆𝑦⁄𝑥 = 𝑆𝑦 �1 − 𝑟𝑥𝑦 𝑆𝑦⁄𝑥 0,12 ∙ 100% = ∙ 100% = 1,3% 9,06 𝑦 Качество аппроксимации хорошее. 𝛿𝑦⁄𝑥 = 12. Определить остаточное среднее квадратическое отклонение. Значения 𝑎 и 𝑏 следует брать для случая отсутствия корреляционного анализа. Таблица 2.8. Параметры оценки качества аппроксимации № 1 2 3 4 5 6 7 Σ 𝑥𝑥𝑖 13,5 14,0 14,5 15,0 15,5 16,0 16,5 105 𝑦𝑖 8,7 9,0 9,0 9,0 9,1 9,3 9,3 63,4 𝑎 7,05 7,05 7,05 7,05 7,05 7,05 7,05 𝑏 0,136 0,136 0,136 0,136 0,136 0,136 0,136 𝑏 ∙ 𝑥𝑥𝑖 1,836 1,904 1,975 2,040 2,108 2,176 2,244 (𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2 0,0346 0,0021 0,0006 0,0081 0,0034 0,0055 0,0 0,0543 13. Остаточное среднее квадратическое отклонение, если корреляционный анализ не проводился: 1 1 �(𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2 = � ∙ 0,0543 = 0,104, 𝑆𝑦⁄𝑥 = � 𝑛−2 5 𝑆𝑦⁄𝑥 0,104 𝛿𝑦⁄𝑥 = ∙ 100% = ∙ 100% = 1,0%. 9,09 𝑦 Качество аппроксимации хорошее. 56 В этом случае значимости коэффициента корреляции не проверялась. Поэтому следует проверить значимость коэффициента 𝑏 уравнения линейной регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥. 14. Реальное значение t-критерия для коэффициента 𝑏: 2 𝑛 ∙ 𝑆𝑦𝑥 7 ∙ 0,1042 0,0757 � � 𝑆𝑏 = � = = = 0,04; 2 2 7 ∙ 1582 − 105 49 𝑛 ∙ ∑ 𝑥𝑥𝑖 − (∑ 𝑥𝑥𝑖 )2 𝑡реал = 𝑏 𝑆𝑏 = 0,136 0,04 = 3,4. 15. Критическое значение критерия (𝑡кр ) при уровне значимости α=0,05 и степени свободы 𝜈 = 𝑛 − 2 = 5 было определено в п. 8. 𝑡кр = 2,5706. 16. Сравнить 𝑡реал = 3,4, 𝑡кр = 2,5706. Следовательно, �𝑡реал � > 𝑡кр – между величинами (𝑥𝑥 , 𝑦) существует тесная корреляционная зависимость. 17. Диаграмма рассеяния (корреляционное поле) и графики линий ре- грессии представлен на рис. 2.1. Рис 2.1. Диаграмма рассеяния и линии регрессии (итоговый график) 57 Линия регрессии 1 соответствует уравнению 𝑦 = 6,84 + 0,148𝑥𝑥, т.е. ко- эффициенты уравнения рассчитывались после проведения корреляционного анализа. При этом проверялась достоверность значения коэффициента корреляции. Линия регрессии 2 соответствует уравнению 𝑦 = 7,02 + 0,136𝑥𝑥, т.е. коэффициенты уравнения рассчитывались непосредственно по результатам выборки. При этом проверялась значимость коэффициента регрессии 𝑏. Линии регрессии 1 и 2 практически совпадают друг с другом. К тому же рассчитанные средние значения 𝑥𝑥 = 15; 𝑦 = 9,06 подтверждаются графически (показано на графике). Погрешности аппроксимации абсолютной (остаточное среднее квадра- тичное отклонение) и относительной проверялись в обоих случаях. При этом качество аппроксимации хорошее, что наглядно следует из рисунка. То есть площади над линией регрессии и под ней примерно равны. На рисунке эти области выделены цветом. 58 3. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА ИЗМЕРЕНИЙ МЕТОДОМ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА Цель работы: освоение способов определения количества опытов для обеспечения требуемой точности измерений; получение практических навыков проведения последовательного эксперимента. 3.1. ОБЩИЕ СВЕДЕНИЯ При планировании эксперимента необходимо определить цели каждого эксперимента, число серий и количество измерений в каждой серии, достижение оптимума соотношения экономии материалов и адекватности проведенных измерений. Каждое измерение это затраты времени и ресурсов (трудовых, материальных, финансовых). Особенно это критично, если измерения связаны с разрушающим контролем. Измерения делятся на прямые и косвенные. При прямых измерениях определяемая величина сравнивается с единицей измерения непосредственно с помощью измерительного прибора. При косвенных измерениях определяемая величина вычисляется по результатам прямых измерений других величин, с которыми она связана функциональной зависимостью. Измерения характеризуются, в частности, точностью. Термин «точность измерения», т.е. степень приближения результатов измерения к некоторому действительному значению, используется для качественного сравнения измерительных операций. Для количественной оценки используется понятие «погрешность (ошибка) измерений». Эти термины тесно связаны друг с другом: чем меньше погрешность, тем выше точность. Таким образом, погрешностью измерения называется разность между истинным значением измеряемой величины и результатом измерения. Погрешности измерений делятся на систематические и случайные. Систематические погрешности это погрешности, которые сохраняют величину и знак от опыта к опыту, при равноточных измерениях. 59 Случайные погрешности это погрешности, изменяющие свою величину или знак от опыта к опыту, при измерениях, выполненных одинаковым образом и при одинаковых условиях. Случайные погрешности обуславливаются большим числом случайных причин, действующих в каждом отдельном измерении различным, неизвестным образом. Все это необходимо учитывать при проведении эксперимента. Существует два основных варианта проведения эксперимента: 1. Достоверные значения параметров распределения получают при фиксированном числе опытов. Такой вариант рассматривался в работе 1. 2. Статистические параметры функции распределения определяются с заданной точностью при минимальном объёме опытов. В любом случае необходимо учитывать случайные ошибки опыта. Для уменьшения влияния таких ошибок опыты повторяют и вычисляют среднее арифметическое значение. Причем количество необходимых повторений зависит от среднего квадратичного отклонения измерений и заданного коэффициента доверия полученного результата. Под надежностью опыта понимают вероятность получения тех же результатов при новых измерениях этой же величины в тех же условиях. Из теории вероятностей известно, что чем больше относительные отклонения результатов и чем большую достоверность результатов эксперимента желательно получить, тем больше должно быть произведено повторений опыта. Наиболее удобным образом для практического использования эта зависимость установлена В.И. Романовским. На основе методики Романовского Рожковым и Неверовым (2014) построена таблица, позволяющая определить число опытов с требуемыми доверительными параметрами и известным средним квадратичным отклонением измеряемой величины, которая устанавливается по данным предварительных экспериментов. В некоторых случаях для определения количества измерений можно пренебречь распределением Стьюдента и пользоваться методами анализа параметров нормального распределения Гаусса. Анализируя данные коэффици60 ентов t-распределения (таблица П.2), можно сделать предварительный вывод, что при уровне доверительной вероятности 68% нужно сделать более чем 10 измерений, более чем 30 измерений при уровне доверительной вероятности 95% и более чем 50 измерений при уровне доверительной вероятности 99% 3.2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ 3.2.1. Погрешность однократных измерений По количеству проводимых опытов, связанных с измерениями, можно разделить на многократные и однократные. Измерения называют однократными, когда для получения значения некоторой физической величины в опыте проводят только одно измерение. Измерения называют многократными, если для получения значения физической величины выполняют несколько измерений одними и теми же приборами при одних и тех же условиях. При единичных (однократных) измерениях существует определенная вероятность получить неточный результат. Эта вероятность связана, в частности, с точностью используемых измерительных приборов. При однократных измерениях случайная величина подчиняется равномерному распределению, при этом различные значения случайной величины появляются с одинаковой вероятностью (рис. 3.1). Рис. 3.1. Равномерное распределение случайной величины 61 Плотность вероятности f(x) случайной величины x имеет постоянное значение в некотором интервале (a, b) и равна нулю вне этого интервала. при x < a 0, f(x) = 𝟏 𝒃−𝒂 , 0, при a < x < b (3.1) при x > b Среднее арифметическое для равномерного закона распределения : ∞ 𝒃 −∞ 𝒂 𝟏 𝒂+𝒃 � 𝒙𝒅𝒙 = 𝒙 = � 𝒙𝒇(𝒙)𝒅𝒙 = . 𝒃−𝒂 𝟐 (3.2) Учитывая что 𝑎 = 𝑥𝑥 − 𝑑; 𝑏 = 𝑥𝑥 + 𝑑, плотность вероятности в интерва- ле (a, b): 𝒇(𝒙) = 𝟏 𝟏 = . 𝒃 − 𝒂 𝟐𝒅 (3.3) Дисперсия для равномерного распределения: ∞ 𝟐 𝟐 𝝈 = � �𝒙 − 𝒙� 𝒇(𝒙)𝒅𝒙 , −∞ 𝒃 𝟏 𝒙+𝒅 𝟐 ( ) ( 𝟏 𝒅𝟐 𝟐 � 𝒙 − 𝒙 𝒅𝒙 = � 𝝈 = 𝒙 − 𝒙) 𝒅𝒙 = . 𝒃−𝒂 𝒂 𝟐𝒅 𝒙−𝒅 𝟑 (3.4) 𝒅 (3.5) 𝟐 Среднее квадратичное отклонение: 𝝈 = � 𝝈𝟐 = √𝟑 = 𝟎, 𝟓𝟕𝟕 ∙ 𝒅. Обратим внимание, что в случае нормального распределения доверительная вероятность для интервала ( x − σ , x + σ ) равна 68,3% , а в данном случае 57,7%. Определим доверительный интервал Δx, в котором с вероятностью 95% будет находиться значение измеряемой величины. Очевидно, что вероятность получить значение измеряемой величины в интервале − 0,95d < x <+ 0,95d равна 95%. Чтобы найти доверительный интервал для случайной величины, подчиняющейся равномерному распределению, достаточно умножить величину 62 доверительной вероятности на параметр равномерного распределения d (на сколько меньше основание прямоугольника на столь же меньше и его площадь). Доверительный интервал такой величины обозначают Δxои называют погрешностью однократных измерений. Тогда, для доверительной вероятности 95%: Δxои= 0,95d, где d – параметр равномерного распределения. Погрешность однократных измерений связана с точностью используемых измерительных приборов. В этом случае параметр равномерного распределения называют приборной ошибкой. Кроме приборной погрешности на результат измерения влияет еще ряд объективных и субъективных причин. Точность параметра зависит от используемого измерительного прибора. Многие приборы имеют шкалу с делениями. Разность значений, выражаемых соседними делениями, называется ценой наименьшего деления. Следует помнить, что измерять величину, меньшую, чем цена наименьшего деления прибора, данным прибором некорректно. В зависимости от вида измерительного прибора параметр равномерного распределения d определяется одним из ниже перечисленных способов: 1. Точность измерения (цена наименьшего деления) указана непосредственно на приборе. В этом случае параметр равномерного распределения d равен точности прибора, т.е. равен цене наименьшего деления. 2. Иногда, на приборе указан его класс точности. При этом параметр равномерного распределения d = К·П./ 100, где К – класс точности прибора, П – предел измерения шкалы. 3. Индикатор значения измеряемой величины может отображать определенные (дискретные) положения. Такие приборы являются приборами дискретного действия. В этом случае (например, в электронных цифровых приборах) абсолютную погрешность рассчитывают по паспортным данным, содержащим формулу для расчета погрешности конкретного прибора. При отсутствии паспортных данных за параметр равномерного распределения d принимают единицу наименьшего разряда цифрового индикатора. Например, электронный секундомер показывает значение: 00:00:03.23. Цена деления та63 кого прибора равна 0,01 с, а параметр равномерного распределения также d = 0,01 Сек. 3.2.2. Совместный учет ошибки многократных и однократных измерений При многократных измерениях некоторой величины x каждое отдельное измерение можно рассматривать как однократное. Поэтому при оценке общей погрешности необходимо учитывать как случайные ошибки многократных измерений, которые подчиняются распределению Гаусса (Стьюдента), так и ошибки однократных измерений, подчиняющихся равномерному закону распределения. Факторы, способствующие появлению погрешностей того и другого типа, действуют независимо друг от друга. Поэтому для определения суммарной ошибки результата измерения используют закон сложения независимых величин (ошибок), который доказывается в теории вероятностей. Этот закон справедлив и для сложения доверительных интервалов. Поэтому доверительный интервал Δx (общая погрешность) измеряемой в серии опытов величины x определяется как: 𝟐 ∆𝒙 = �∆𝒙𝟐ои + ∆𝒙𝟐сл (3.6) где Δxои – доверительный интервал, соответствующий ошибке однократных измерений (приборная погрешность). Δxсл – доверительный интервал, соответствующий случайной ошибки многократных измерений, Если в результате непосредственных (прямых) измерений некоторой физической величины х получены значения x1 , x2 , х3 , … xn , то оценку погрешности рекомендуется проводить следующим образом: 1. По результатам измерений величины x определяется среднее арифметическое из n измерений 𝑥𝑥. 2. Вычисляется среднеквадратичное отклонение результатов измерений от среднего арифметического S. 64 3. Для заданной доверительной вероятности P и количестве измерений n по таблице П.2 определяется коэффициент Стьюдента tα,n–1 . 4. Рассчитывается граница доверительного интервала (случайная погрешность) для многократных измерений. Δxсл = tα,n–1S. (3.7) 5. Оценивается доверительный интервал (погрешность) однократных измерений. Δxои = P·d, (3.8) где d – параметр равномерного распределения, связанный с ценой деления или классом точности измерительного прибора. 6. По формуле (3.6) определяется общая погрешность серии измерений (доверительный интервал) Δx. 7. Окончательный результат записывается в виде 𝑥𝑥 = 𝑥𝑥 ± ∆𝑥𝑥 с довери- тельной вероятностью P. 8. Оценивается относительная погрешность результата измерений. 𝜹= ∆𝒙 ∙ 𝟏𝟎𝟎% 𝒙 (3.9) Относительная погрешность позволяет сравнивать неточности измерений величин, имеющих различную размерность. 3.2.3. Анализ промахов В отдельный тип погрешностей выделяются так называемые промахи (грубые ошибки), т.е. результаты с аномальными числовыми значениями. Промахи или грубые погрешности (ошибки) это ошибочные измерения или наблюдения, возникающие в результате небрежности при отсчете по прибору или неразборчивой записи показаний, при неправильном включении прибора, или при нарушении условий, в которых должен проводиться опыт (изменение напряжения, загрязнение материала и т.д.). Такие ошибочные данные следует отбросить или сделать повторные (контрольные) измерения. 65 Однако отбрасывать некоторый результат измерения как аномальный, руководствуясь только эмоциями, некорректно. Поэтому требуется определенная математическая процедура, которая позволит отличить промах от результата с допустимой (хотя и большой по величине) случайной погрешностью. Предлагаемый метод поиска промахов основан на том предположении, что случайные погрешности подчиняются нормальному распределению. Согласно теории вероятностей, случайные погрешности подчиняются нормальному распределению при выполнении трех условий: 1. Количество случайных факторов, влияющих на величину результата измерения, очень велико (практически неограниченно). 2. Каждый случайный фактор можно независим от остальных. 3. Из случайных факторов ни один не является доминирующим. Доказательство справедливости нижеизложенной процедуры поиска промахов приводится в курсах математической статистики. В данном разделе излагается лишь последовательность необходимых вычислений. Процедуру анализа аномальных результатов можно разделить на отдельные этапы. 1. Определить (задать) доверительную вероятность P (надёжность γ) цикла измерений. Для технических приложений это обычно 95%. 2. Из совокупности измерений x1 , x2 , х3 , … xn (возможно временно) исключить «подозрительный» результат, который заметно отличается от всех остальных, например xk. 3. Вычислить среднее арифметическое значение остальных измерений xi( i ≠ k ) 𝒏 𝟏 𝒙𝟏 = � 𝒙𝒊 . 𝒏−𝟏 𝒊=𝒌,𝒊≠𝒌 66 (3.10) 4. Из таблицы П.2 коэффициентов Стьюдента найти значение tα,n–2, соответствующее доверительной вероятности P и числу измерений (n–1) (т.е. числу степеней свободы ν = n – 2). 5. Вычислить критическую величину ∆𝑥𝑥𝑚 : 𝒏𝑫𝟏 ∆𝒙𝒎 = 𝒕𝜶,𝒏−𝟐 � , (𝒏 − 𝟏)(𝒏 − 𝟐) (3.11) где параметр D1– дисперсия для выборки с исключенным «подозрительным» результатом измерения xk: 𝒏 𝑫𝟏 = � (𝒙𝒊 − 𝒙𝟏 )𝟐 . 6. Проверяем условие: 𝒊=𝟏,𝒊≠𝒌 |𝒙𝟏 − 𝒙𝒌 | ≥ ∆𝒙𝒎 , (3.12) (3.13) — в случае выполнения условия (3.13) «подозрительное» значение xk считается промахом и исключается из совокупности результатов измерений. — при невыполнении условия (3.13) отклонение числа xk считается допустимым и не исключается из набора измерений. Обратите внимание! При использовании вышеописанной процедуры, возможно допустить ошибку 1-го рода — отбросить результат измерения, который следует учесть. Вероятность этой ошибки равна (1 – P). Увеличивая доверительную вероятность P (коэффициент доверия γ), уменьшается вероятность ошибки 1-го рода. Но при этом увеличивается величина коэффициента Стьюдента tα,ν и, следовательно, растёт вероятность ошибки 2-го рода — принять ложное значение за истинное, т.е. включить промах в серию измерений. Поэтому следует корректно выбирать величину γ (обычно это 0,9; 0,95; 0,99) — в зависимости от важности задачи. 67 3.2.4. Определение числа опытов для вычисления параметров математического ожидания Минимальное количество измерений (числа опытов) для определения величины математического ожидания можно из выражения для вычисления соответствующего доверительного интервала при нормальном законе распределения: 𝒙 − 𝒁𝜶 𝑺 √𝒏 ≤ 𝝁 ≤ 𝒙 + 𝒁𝜶 𝑺 (3.14) √𝒏 Данный интервал является доверительным интервалом для математического ожидания μ случайной величины 𝑥𝑥 с нормальным законом распре- деления, построенным с доверительной вероятностью P = 1 – α. Границы этого интервала равны 𝒙 − 𝒁𝜶 𝜹 = 𝒁𝜶 𝑺 √𝒏 . 𝑺 √𝒏 и 𝒙 + 𝒁𝜶 𝑺 √𝒏 , а половина его ширины Из этого выражения можно определить число измерений: 𝒁𝜶 ∙ 𝑺 𝟐 𝑺 𝟐 𝟐 𝒏≥� � = 𝒁𝜶 ∙ � � . 𝜹 𝜹 (3.15) Следовательно, увеличение количества измерений (числа опытов), даже при неизменной погрешности (S = const), может увеличить доверительную вероятность P или сузить доверительный интервал ±δ для определения действительного значения измеряемой величины (математического ожидания). Таким образом необходимое количество измерений n для достижения требуемой погрешности δ при заданной доверительной вероятности Р можно определить заранее в том случае, когда известно значение среднеквадратичного отклонения S, а экспериментальные данные (измерения) подчиняются нормальному закону распределения. Так, при γ=0,95, Z0,95= 1,96 и при δ=S число измерений равно 4. При уменьшении необходимой погрешности измерений в 2 раза, т.е. сужении доверительного интервала до величины δ=(1/2)S, 68 необходимое число измерений составит 16. Следовательно, необходимое число измерений с уменьшении погрешности увеличением возрастает в квадратичной зависимости. Количество опытов, необходимых для построения доверительных интервалов математического ожидания при некоторых 𝑆⁄𝛿 и γ, приведены в табл. 3.1 Таблица 3.1 Минимальное количество опытов (измерений) Коэффициент доверия γ, γ=1–α Погрешность измерений, δ 0,6 (Zα=0,84) 0,8 (Zα=1,28) 0,9 (Zα=1,64) 1S – 2 3 4 7 0,5S 3 7 11 16 27 0,4S 5 10 17 24 42 0,3S 8 19 30 48 74 0,2S 18 41 68 96 167 0,1S 71 164 269 384 665 0,95(Zα=1,96) 0,99(Zα=2,58) Приведенные выше рассуждения не совсем корректны, так как говорить о законе распределения, как о нормальном, мы имеем право только при n > 30 (для γ = 0,95). При меньшем числе опытов действительная дисперсия неизвестна, поэтому при построении доверительного интервала для математического ожидания используют выборочную дисперсию. При n < 30 пользуются распределением Стьюдента (t-распределение). При n → ∞ (практически при n ≥ 30 для P = 95%) распределение Стьюдента переходит в нормальное распределение с единичной дисперсией. В этом случае выражение для вычисления доверительного интервала математического ожидания при t- распределении запишется в виде: 𝒙 − 𝒕𝛼,𝑛−1 𝑺 √𝒏 ≤ 𝝁 ≤ 𝒙 + 𝒕𝛼,𝑛−1 𝑺 √𝒏 . (3.16) При этом необходимое число измерений можно определять из соотношения: 𝒕𝜶,𝒏−𝟏 ∙ 𝑺 𝟐 𝑺 𝟐 𝟐 𝒏≥� � = 𝒕𝜶,𝒏−𝟏 ∙ � � . 𝜹 𝜹 (3.17) 69 Отметим, что значение критерия Стьюдента зависит не от числа степеней свободы ν = n–1, т.е. от числа измерений. Поэтому аналитического решения относительно n данное уравнение не имеет. В связи с этим уравнение следует решать численными методами, например методом последовательных приближений. В качестве начального приближения можно задать число измерений, рассчитанных для нормального распределения (3.15). Так, если решить последнее уравнение методом последовательных приближений, то можно показать, что при γ = 0,95 для определения доверительного интервала с точностью δ = S требуется 7 измерений, а с точностью δ = 0,5S уже 18. Количество опытов, необходимых для построения доверительного интервала математического ожидания с учетом коэффициента Стьюдента приведены в табл. 3.2. Таблица 3.2. Необходимое количество опытов (измерений) Ошибка (погрешность) измерений, δ Коэффициент доверия γ, γ=1–α P = 0,6 P = 0,8 P = 0,9 P = 0,95 P = 0,99 0,5S (𝑡0,4,𝑛−1 ) 4 (𝑡0,2,𝑛−1 ) 9 (𝑡0,1,𝑛−1 ) 13 (𝑡0,05,𝑛−1 ) 18 (𝑡0,01,𝑛−1 ) 0,4S 6 12 19 27 46 0,3S 9 20 32 46 78 0,2S 19 43 70 99 171 0,1S 72 166 273 387 668 1S 2 4 5 7 11 31 Сравнивая таблицы 3.1 и 3.2, следует, что с повышением необходимой точности различие в числе измерений, рассчитанных для нормального и t- распределения, уменьшается и при величине δ ≤ 0,2S они практически совпадают. 70 3.2.5. Метод последовательного анализа при проведении эксперимента Для минимизации числа измерений используется последовательный анализ, т.е. такой способ статистической проверки гипотез, при котором необходимое число наблюдений не фиксируется заранее, а определяется в процессе самой проверки. То есть его смысл состоит в учете уже сделанных опытов в ходе эксперимента. Во многих случаях для получения достоверных результатов применение последовательного анализа позволяет ограничиться значительно меньшим числом опытов, чем при способах, в которых число опытов рассчитывается заранее. Имейте в виду, что сокращение числа опытов происходит в среднем, т.к. их число при последовательном анализе есть величина случайная. После каждого проведённого опыта определяют, как именно поступить с рассматриваемой гипотезой: принять её, отклонить, или продолжать испытания. Следует учитывать, что уменьшение количества измерений достигается за счет увеличения объема вычислений. Сущность последовательного анализа состоит в следующем. Пусть задача состоит в выборе между гипотезами H1 и H2 по результатам независимых опытов. Гипотеза H1 заключается в том, что случайная величина х имеет распределение вероятностей с плотностью f1(x), гипотеза H2 — в том, что величина х имеет плотность f2(x). Для решения этой задачи поступают следующим образом. Выбирают два числа А и В (0 < A < B). После первого наблюдения вычисляют отношение λ1 = f2(x1)/f1(x1), где x1 — результат первого наблюдения. Если λ1 < A, принимают гипотезу H1; если λ1 > B, принимают гипотезу H2, если A ≤ λ1 ≤ B, производят второе наблюдение и так же исследуют величину λ2: 𝒇 (𝒙𝟏 )𝒇𝟐 (𝒙𝟐 ) 𝝀𝟐 = 𝟐 𝒇𝟏 (𝒙𝟏 )𝒇𝟏 (𝒙𝟐 ) , (3.18) 71 где x2 — результат второго наблюдения, и т.д. до тех пор пока значение λ не выйдет за пределы А ÷ В. С вероятностью, равной единице, процесс оканчивается либо выбором H1, либо выбором H2. Реально возможны не два, а четыре исхода: — гипотеза верна и не отвергается согласно критерию (правильное решение); — гипотеза неверна и отвергается согласно критерию (правильное решение); — гипотеза верна, но отвергается согласно критерию (допущена ошибка I рода); — гипотеза неверна, но не отвергается согласно критерию (допущена ошибка II рода). Выбор величин А и В определяются из условий необходимой достоверности результатов и подробно рассматривается в курсах “Планирование эксперимента”, “Управление качеством”. В нашем случае ограничимся принятием решения о прекращении эксперимента при достижении заданной погрешности. Для этого достаточно ограничиться двумя интервалами: — заданная погрешность не устраивает, т. е. испытания продолжаются, — заданная погрешность устраивает, т. е. испытания прекращаются. Предельная погрешность измеряемого параметра δпред определяется точностью измерительной системы, т.е. параметром равномерного распределения d (см раздел 3.2.1). Погрешность однократных измерений, например, в электронных цифровых измерительных приборах, за параметр равномерного распределения d принимают единицу наименьшего разряда цифрового индикатора. Заданная погрешность δзад может быть не обязательно предельной и может определяться из каких-то других соображений, например, если для решения конкретной задачи предельная точность чрезмерна. 72 Определить момент прекращения эксперимента, когда заданная погрешность достигнута, можно из выражения: где δ = 𝐭 𝛂,𝐧−𝟏 𝐒 √𝐧 𝒙−𝜹≤𝝁≤𝒙+𝜹, (3.19) . Условие прекращения эксперимента: δ = 𝐭 𝛂,𝐧−𝟏 𝐒 √𝐧 ≤ δзад . Таким образом при последовательном анализе после каждого опыта необходимо определять текущую погрешность δ и сравнивать ее с заданной δзад . 3.2.6. Рекомендации при определении объема эксперимента 1. Измерять физическую величину с погрешностью δзад, выше, чем цена наименьшего деления, данным прибором некорректно. Определение приборной погрешности при прямых измерениях приведено в разделе 3.2.1. При косвенных измерениях необходимо пользоваться соответствующей литературой по метрологии или по теории планирования эксперимента. Не следует завышать требуемую погрешность измерения. Это приводит к неоправданному увеличению количества опытов. В данной работе примем, что δзад = ±d = 2d, иначе количество измерений будет слишком большим. 2. Если проведение измерений не сопряжены со значительными затратами времени и ресурсов (трудовых, материальных, финансовых) и не связаны с разрушающим контролем образцов целесообразно не оптимизировать их количество. При этом критерием для определения объема измерений служит значение, при котором можно пренебречь коэффициентом Стьюдента. Число измерений зависит от доверительной вероятности P.Обычно используют: — P = 68,3%, 𝑍𝛼 = 1 – параметры для предварительных экспериментов, часто для физических трудновоспроизводимых опытов. Чтобы иметь право 73 воспользоваться этими параметрами (распределение Стьюдента переходит в распределение Гаусса) необходимо произвести не менее 10 измерений. — P = 95%, 𝑍𝛼 = 1,96 – параметры для технических экспериментов. Необходимо произвести не менее 30 измерений. — P = 99%, 𝑍𝛼 = 2,58, параметры для оборудования, связанного с без- опасностью. Необходимо произвести не менее 50 измерений. Выше приведены минимальные значения количества измерений. По- этому при расчете доверительных интервалов они получатся достаточно большими. Для их уменьшения необходимо увеличить количество опытов. 3. Для определения минимального количества опытов (измерений). 𝒁𝜶 ∙𝑺 𝟐 можно воспользоваться формулой 𝒏𝒎𝒊𝒏 = � 𝜹 � 𝑺 𝟐 𝟐 = 𝒁𝜶 ∙ � � , 𝜹 или табли- цей 3.1. Значение погрешности измерений следует брать в пределах от δ = 1∙S до δ = 0,5∙S. Меньшее значение δ выбирать нецелесообразно, так как эта величина применяется как первое приближение для дальнейших вычислений. 4. Далее можно поступить двумя способами: — рассчитать необходимое количество опытов по формуле (3.17) и провести их. Целесообразно пользоваться, когда затраты на проведение опытов сравнительно невелики. При этом возможно избыточное количество измерений. Это компенсируется меньшим, по сравнению с методом последовательного анализа, объемом вычислений. — воспользоваться методом последовательного анализа. При этом после каждого опыта необходимо вычислять среднее арифметическое, оценку среднего квадратичного отклонения, ошибку погрешности измерения. Увеличение объема вычислений возможно компенсируется уменьшением количества опытов. Особенно это критично если их проведение затратно. В любом случае предварительно необходимо рассчитать и провести минимальное количество опытов по методике, описанной выше. 5. При определении достаточного количества опытов можно восполь𝑺 𝟐 зоваться зависимостью 𝒏дост = 𝒕𝟐𝜶,𝒏−𝟏 ∙ � � . Значение S рассчитывается по 74 𝜹 результатам минимального количества опытов, а величина δ не должна превышать возможности измерительной системы. Уравнение нелинейно и аналитического решения относительно n не имеет. Поэтому необходимо воспользоваться численными методами. За начальное приближение можно взять 𝑛𝑚𝑖𝑛 . Некоторые значения n представлены в таблице 3.2. 6. При использовании метода последовательного анализа проводится минимальное количество опытов. Рассчитывается среднее арифметическое, оценка среднего квадратичного отклонения, ошибка точности измерения. Ес- ли заданная точность не достигнута (что чаще всего) проводится еще один опыт, вычисляются 𝑥𝑥, 𝑆, 𝛿 и так далее пока заданная точность не будет до- стигнута. В любом случае эксперимент прекращают при достижении числа 𝑆 2 2 ∙ � � . При последовательном опытов рассчитанного по формуле 𝑛 = 𝑡𝛼,𝑛−1 𝛿 анализе всегда число опытов меньше, чем рассчитанное по приведенной формуле. На сколько меньше, предсказать невозможно, так как результат каждого последующего опыта величина случайная. 3.2.7. Некоторые выводы 1. Если требуется рассчитывать доверительные интервалы для параметров распределения необходимо производить достаточно большое количество опытов, т.е. такое, при котором распределение Стьюдента переходит в распределение Гаусса. Например, для технических приложений принята доверительная вероятность P = 95%. Для нее количество опытов n > 30. Даже в этом случае доверительный интервал может быть достаточно большим. Для получения приемлемого доверительного интервала нужно увеличивать количество опытов или уменьшать доверительную вероятность. 2. При ограниченном объеме эксперимента можно рассчитать и провести достаточное (для конкретного приложения) количество опытов или воспользоваться методом последовательного анализа. При этом доверительные 75 интервалы получаются достаточно большими из-за малого количества опытов. 3. Применение последовательного анализа не всегда дает существенное сокращение объема эксперимента, так как порядок выбора объектов измерения есть величина случайная. Как в лотерее, можно приз выиграть сразу, а можно в конце тиража. При этом увеличивается объем вычислений, т.к. после каждого дополнительного опыты необходимо пересчитывать статистические параметры. 3.3. ЗАДАНИЕ ДЛЯ ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ Определить объем эксперимента (количество измерений) методом последовательного анализа. Исследуемый параметр x, представляет собой время прохождения изделием лабиринта, имитирующего технологический процесс. Перемещение изделий в рабочей зоне происходит с помощью манипулятора. Время фиксируется с помощью контроллера робототехнической системы FANUC с величиной наименьшего разряда цифрового индикатора 0,1 с. То есть параметр равномерного распределения d при измерении времени с помощью контроллера FANUC равен 0,1с. Чтобы не затягивать эксперимент ограничимся погрешностью измерения исследуемого параметра δзад = ±d = 2d = 0,2 с. Для выполнения поставленной задачи необходимо: 1. Определить минимальное количество измерений опытов 𝑛𝑚𝑖𝑛 . 2. Провести минимальное количество измерений, фиксируя при этом время прохождения изделием лабиринта. 3. Для проведенных измерений рассчитать: — среднее арифметическое значение 𝑥𝑥, — среднее квадратичное отклонение S, — погрешность измерения δ (необходимо использовать коэффициент Стьюдента). 76 4. Используя предварительную оценку среднего квадратичного отклонения и задавшись погрешностью определения исследуемого параметра рассчитать достаточное количество измерений 𝑛дост . 5. Провести (𝑛𝑚𝑖𝑛 + 1)-й опыт, — рассчитать 𝑥𝑥, S, δ, — если δ ≤ δзад эксперимент прекращаем, — если δ > δзад эксперимент продолжаем, проводим (𝑛𝑚𝑖𝑛 + 2)-й опыт, производим расчеты и т.д. до тех пор пока не выполнится условие δ ≤ δзад, то есть условие прекращения эксперимента. 6. Если провели 𝑛дост опытов, а условие δ ≤ δзад так и не выполнилось: — прекратить эксперимент, удовлетворившись той погрешностью, ко- торая была достигнута, ⃓ . При — продолжить эксперимент, предварительно пересчитав 𝑛дост этом за оценку среднего квадратичного отклонения принять последнее значение, то есть то, которое получилось для количества опытов 𝑛дост . Такая ситуация может произойти если при определении 𝑛𝑚𝑖𝑛 измере- ния оказались нерепрезентативными. 7. Все данные результатов измерений и вычислений полученные в ходе проведения эксперимента свести в таблицу. 8. Проанализировать сводную таблицу эксперимента. Сделать аргументированные (на конкретном примере) выводы о более благоприятном ходе эксперимента. 9. Сделать выводы по всей работе. 3.4. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ 1. Определить минимальное 𝑛𝑚𝑖𝑛 по формуле: 𝑆 количество измерений (числа опытов) 2 𝑛𝑚𝑖𝑛 = 𝑍𝛼2 ∙ � � . 𝛿 Для технических приложений обычно принимают: 77 — доверительная вероятность P = 95% (γ =0,95) , то есть уровень значимости α = 1 – γ = 0,05, — для нормального распределения при уровне значимости α = 0,05 доверительный интервал Zα = 1,96, — значение 𝑆 𝛿 применяется лишь как первое приближение для даль- нейших вычислений. Поэтому величина обычно составляет более 0,5 (часто первоначально принимают δ = S). Величину 𝑛𝑚𝑖𝑛 также можно определить из таблицы 3.1. 2. Измерить время прохождения 𝑛𝑚𝑖𝑛 деталей по лабиринту, имитиру- ющем технологический процесс. Для этого использовать промышленный робот FANUC. 3. Для проведенных измерений рассчитать: 𝑥𝑥, S, δ, при этом заполнив таблицу 3.3: Таблица 3.3. Статистические параметры эксперимента № xi Σxi (n) 𝑥𝑥 (xi–𝑥𝑥)2 Σ(xi–𝑥𝑥)2 S=� 1 1 𝑛−1 ∑(𝑥𝑥𝑖 − 𝑥𝑥)2 𝑆 2 √𝑛 tα,n-1 α=0,05 δ= tα,n-1 𝑆 √𝑛 2 … 𝑛𝑚𝑖𝑛 4. Проанализировать данные таблицы. Если полученной точности не- достаточно, используя предварительные результаты рассчитать достаточное количество измерений 𝑛дост по формуле: 𝑆 2 2 𝑛дост = 𝑡𝛼,𝑛−1 ∙� � . 𝛿 Величина S берется из результатов уже проведенных предварительных измерений. Значение δ выбирается исходя из конкретных условий и возможностей. Чем выше точность, тем больше количество опытов, причем, зависимость квадратичная. Также необходимо учитывать возможности измерительной системы. 78 Для решения уравнения относительно 𝑛дост необходимо воспользовать- ся численными методами. Для начального приближения можно взять значение 𝑛𝑚𝑖𝑛 , из таблицы 3.2. С целью разумного использования учебных ресурсов в данной работе погрешность измерений ограничивается величиной δ = 0,2 с. 5. Провести последующие опыты (n > nmin), продолжая заполнять приведенную таблицу. Прекратить эксперимент, когда δ ≤ δзад. 6. Проанализировать полученные данные и сделать выводы по работе. 3.5. СОДЕРЖАНИЕ ОТЧЕТА 1. Название и цель работы. На титульном листе обязательно укажите номер варианта. 2. Общие сведения должны содержать (очень коротко) понятия: — измерения прямые, косвенные, однократные, многократные, — наблюдение, эксперимент, опыт, — погрешности систематические, случайные, — погрешность однократных измерений, — равномерное распределение случайной величины, — погрешность результата измерений, — минимальное количество опытов (измерений), — необходимое количество опытов (измерений), — метод последовательного анализа при проведении эксперимента, 3. Задание для выполнения лабораторной работы. 4. Все необходимые расчеты и таблицы. 5. Выводы. Конкретно, без общих рассуждений, обобщить результаты данной работы и сформулировать преимущества и недостатки различных способов проведения экспериментов. 79 3.6. КОНТРОЛЬНЫЕ ВОПРОСЫ 1. Чем отличается наблюдение от эксперимента? 2. Чем отличается пассивный эксперимент от активного? 3. Что такое точность и погрешность измерения? 4. Чем характеризуются систематические и случайные погрешности? 5. Что такое приборная погрешность? 6. Как определить приборную погрешность? 7. Чему равна дисперсия для равномерного распределения? 8. Смысл определения минимального количества опытов? 9. Когда необходимо применять коэффициент Стьюдента? 10. В каких случаях можно вообще не определять количество опытов? 11. От каких параметров зависит количество опытов? 12. Чем отличается закон распределения Стьюдента от закона распределения Гаусса? 13. От каких параметров зависит доверительный интервал? 14. Что нужно сделать, чтобы уменьшить доверительный интервал? 15. В чем смысл определения необходимого количества опытов? 16. Преимущества и недостатки последовательного эксперимента. 17. На сколько можно сократить объем эксперимента при последовательном анализе? 18.Чем отличается опыт от измерения? 3.7. ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ 1. Минимальное количество измерений (числа опытов) 𝑛𝑚𝑖𝑛 (с округ- лением до целого): 𝑆 2 𝑛𝑚𝑖𝑛 = 𝑍𝛼2 ∙ � � = 1,962 ∙12 = 4, 𝛿 где — при P = 95% (γ = 0,95, α = 1 – γ =0,05), Zα = 1,96, 80 𝑆 𝛿 = 1. 2. В учебных целях для наглядности возможности анализа данные измерений возьмем из таблицы результатов, полученных в работе 1 (табл.1.7) Копия этой таблицы: Копия таблицы 1.7.Параметры измерений выборки № 1 x 8,7 № 7 x 8,8 № 13 x 9,5 № 19 x 9,4 № 25 x 9,3 № 31 x 9,0 2 8,8 8 9,5 14 8,8 20 9,5 26 8,9 32 8,9 3 9,1 9 8,3 15 9,1 21 8,8 27 9,2 33 9,3 4 9,3 10 9,2 16 8,6 22 8,9 28 9,0 34 8,8 5 9,0 11 8,8 17 8,8 23 8,9 29 9,0 35 9,1 6 9,3 12 9,1 18 9,1 24 9,2 30 8,8 36 8,8 В нашем случае результаты измерений при минимальном количестве опытов это первые четыре значения: n1 = 8,7, n2 = 8,8, n3 = 9.1, n4 = 9,3. 3. Первоначальные измерения представлены в таблице 3.4: Таблица 3.4.Погрешность измерений (n=nmin) № xi (n) 1 8,7 Σxi 𝑥𝑥 Σ(xi–𝑥𝑥)2 (xi–𝑥𝑥)2 0,076 0,076 2 8,8 0,031 0,107 3 9,1 0,016 0,123 4 9,3 0,106 0,229 35,9 8,975 S=� 1 𝑛−1 ∑(𝑥𝑥𝑖 − 𝑥𝑥)2 0,276 𝑆 tα,n-1 α=0,05 δ= tα,n-1 0,138 3,18 0,44 √𝑛 𝑆 √𝑛 4. Достаточное количество измерений: 𝑆 2 2 𝑛дост = 𝑡𝛼,𝑛−1 ∙� � . При S = 0,276, δ = 0,2, 𝑆 𝛿 𝑆 2 𝛿 2 = 1,38, � � = 1,9, 𝑛дост = 1,9 ∙ 𝑡𝛼,𝑛−1 . 𝛿 Решим уравнение методом последовательных приближений. В качестве первого приближения используем результат предыдущих измерений (табл. 3.4). Для наглядности процесс решения уравнения сведем в таблицу 3.5. 81 n n–1 4 20 9 11 10 3 19 8 10 9 2 Таблица 3.5. Решение уравнения 𝑛дост = 1,9 ∙ 𝑡𝛼,𝑛−1 . 2 𝑡0,05,𝑛−1 t0,05,n–1 3,2 2,1 2,3 2,23 2,26 10,2 4,4 5,3 5,0 5,1 n⃓ ≥ 1,9t2 20 9 11 10 10 Итерации проводим до тех пор, пока значения в первом и последнем столбце не совпадут. Следовательно, в нашем случае 𝑛дост ≥ 10. То есть в лучшем случае необходимо провести еще шесть измерений (всего десять). 5. Продолжение эксперимента. После каждого опыта его результаты заносим в таблицу 3.6 и производим необходимые вычисления. Таблица 3.6. Таблица проведения эксперимента № xi Σxi (n) 1 8,7 2 𝑥𝑥 (xi–𝑥𝑥)2 Σ(xi–𝑥𝑥)2 S=� 1 𝑛−1 ∑(𝑥𝑥𝑖 − 𝑥𝑥)2 𝑆 tα,n-1 √𝑛 α=0,05 δ=tα,n-1 0,076 0,076 8,8 0,031 0,107 3 9,1 0,016 0,123 4 9,3 35,9 8,975 0,106 0,229 0,276 0,138 3,18 0,44 5 9,0 44,9 8,98 0,000 0,229 0,239 0,107 2,78 0,30 6 9,3 54,2 9,03 0,073 0,302 0,246 0,100 2,57 0,26 7 8,8 63,0 9,00 0,040 0,342 0,239 0,090 2,45 0,22 8 9,5 72,5 9,06 0,194 0,536 0,277 0,098 2,36 0,23 9 8,3 80,8 8,98 0,462 0,998 0,353 0,118 2,31 0,27 10 9,2 90,0 9,00 0,040 1,038 0,338 0,107 2,26 0,24 11 8,8 98,8 8,98 0,032 1,070 0,327 0,098 2,23 0,22 12 9,1 107,9 8,99 0,012 1,082 0,314 0,091 2,20 0,20 13 9,5 117,4 9,03 0,221 1,303 0,329 0,091 2,18 0,20 14 8,8 126,2 9,01 0,044 1,347 0,322 0,086 2,16 0,19 15 9,1 135,3 9,02 0,006 1,353 0,311 0,080 2,14 0,17 16 8,6 143,9 8,99 0,152 1,505 0,317 0,079 2,13 0,17 17 8,8 152,7 8,98 0,032 1,537 0,310 0,075 2,12 0,16 18 9,1 161,8 8,99 0.012 1,549 0,302 0,071 2.11 0,15 82 𝑆 √𝑛 Как следует из таблицы за предложенные десять опытов минимальная погрешность измерений составила δ = 0,22 с. (седьмой опыт). То есть заданная точность не достигнута (δзад= 0,2 с.). С целью принятия решения проанализируем результаты. Анализ результатов и некоторые выводы 1. На основании предварительных опытов (четыре измерения) было рассчитано, что для обеспечения требуемой точности необходимо провести еще шесть измерений (всего десять). Заявленная точность не достигнута. 2. Неточность рекомендаций о проведении еще шести опытов можно объяснить малым количеством предварительных опытов (четыре измерения). То есть выборка из четырех измерений оказалась нерепрезентативной. Хотя методика и говорит, что надо провести не менее десяти измерений. 3. Можно прекратить эксперимент, удовлетворившись полученным результатом. А можно продолжить опыты с надеждой достигнуть заданной точности. Предварительно лучше рассчитать количество дополнительных измерений. 4. Для расчета скорректированного количество измерений воспользу𝑆 2 2 ∙ � � . В качестве первого емся все той же зависимостью: 𝑛дост = 𝑡𝛼,𝑛−1 𝛿 приближения используем результаты десятого измерения. При S = 0,338, δ = 0,2, 𝑆 𝛿 𝑆 2 2 = 1,69, � � = 2,856, 𝑛дост = 2,856 ∙ 𝑡𝛼,𝑛−1 . 𝛿 Решим уравнение методом последовательных приближений, а для наглядности процесс решения сведем в таблицу 3.7. 2 Таблица 3.7. Решение уравнения 𝑛дост = 2,856 ∙ 𝑡𝛼,𝑛−1 n n–1 10 15 14 9 14 13 𝑡10,05,𝑛−1 2,26 2,14 2,16 2 𝑡0,05,𝑛−1 5,1 4,6 4,7 n⃓ ≥ 2,856∙t2 15 14 14 Следовательно, теперь 𝑛дост ≥ 14. То есть в лучшем случае предлагает- ся провести еще четыре измерения. 83 6. В учебных целях расчетная таблица 3.6 рассчитана с избытком. Поэтому констатируем, что заданная точность достигнута на двенадцатом опыте (выделено цветом). Поэтому продолжать эксперимент после этого нет необходимости. Дальнейшие измерения приведены с целью показать, что погрешность измерений монотонно убывает. 7. Так как процесс и порядок выполнения опытов величина случайная введем в работу элемент исследования. Сколько опытов необходимо провести, если результаты опытов будут соответствовать вариационному ряду. То есть, совершенно случайно, результаты измерений будут располагаться в порядке возрастания. Результаты измерений возьмем из таблицы вариационного ряда (табл. 1.8). Копия таблицы 1.8. Вариационный ряд № 1 2 3 4 5 6 x 8,3 8,6 8,7 8,7 8,7 8,8 № 7 8 9 10 11 12 x 8,8 8,8 8,8 8,8 8,8 8,8 № 13 14 15 16 17 18 x 8,9 8,9 8,9 8,9 9,0 9,0 № 19 20 21 22 23 24 x 9,0 9,0 9,1 9,1 9,1 9,1 № 25 26 27 28 29 30 x 9,1 9,2 9,2 9,2 9,3 9,3 № 31 32 33 34 35 36 x 9,3 9,3 9,4 9,5 9,5 9,5 Составим таблицу для анализа погрешности измерений на основании первых десяти значений вариационного ряда (табл. 3.8) Таблица. 3.8. Таблица оценки точности вариационного ряда № xi Σxi (n) 1 2 3 4 5 6 7 8 9 10 8,3 8,6 8,7 8,8 8,8 8,8 8,8 8,8 8,8 8,8 84 34,4 43,2 52,0 60,8 69,6 78,4 87,2 𝑥𝑥=Σxi⁄n 8,60 8,64 8,67 8,69 8,70 8,71 8,72 (xi–𝑥𝑥)2 0,090 0,000 0,010 0,400 0,026 0,017 0,012 0,010 0,008 0,006 Σ(xi–𝑥𝑥)2 0,09 0,09 0,10 0,14 0,17 0,18 0,19 0,70 0,21 0,21 S=� 1 𝑛−1 ∑(𝑥𝑥𝑖 0,22 0,21 0,19 0,18 0,17 0,16 0,15 − 𝑥𝑥)2 𝑆 tα,n-1 2 √𝑛 α=0,05 0,11 0,09 0,08 0,07 0,6 0,5 0,5 3,18 2,78 2,57 2,45 2,36 2,31 2,26 δ= tα,n-1 𝑆 √𝑛 0,35 0,25 0,20 0,17 0,14 0,12 0,11 Из анализа результатов следует, что в данном случае, для получения заданной точности измерений понадобилось лишь шесть опытов. Таким образом, метод последовательного эксперимента не приводит к обязательному сокращению количества опытов. Эта величина случайная и зависит, в каком порядке происходят и фиксируются результаты событий. Любопытно было бы проанализировать результаты последовательного эксперимента при исследовании выборки, состоящей из последних членов вариационного ряда; из середины ряда; один член из начала ряда, следующий из конца (наихудший вариант) и т.д. 85 ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ Активный эксперимент – эксперимент, в котором уровни факторов в каждом опыте задаются исследователем. Асимметрия – отношение центрального момента третьего порядка к кубу среднеквадратического отклонения. Вариационный ряд – последовательность элементов выборки, расположенных в неубывающем порядке (одинаковые элементы записываются последовательно друг за другом). Вероятность – отношение числа благоприятных исходов к общему числу исходов при равенстве событийной ценности (веса) исходов. Выборка – совокупность случайно отобранных из изучаемой совокупности объектов (генеральной выборки). Выборочная дисперсия – величина, равная сумме квадратов разностей между значением случайной величины и ее математическим ожиданием, деленная на объем выборки. Выборочное среднее – число, равное сумме значений случайной величины, деленной на объем выборки. Генеральная совокупность – конечная или бесконечная совокупность наблюдений над случайной величиной. Гистограмма – представление статистического ряда на плоскости в виде ступенчатой фигуры, состоящей из прямоугольников, основаниями которых служат интервалы, а высоты – частоты исследуемой величины. Доверительный интервал – интервал, который покрывает неизвестный параметр с заданной вероятностью. Закон распределения случайной величины – соответствие между возможными значениями случайной величины и их вероятностями. Корреляционная зависимость – зависимость, при которой при изменении одной из величин изменяется среднее значение другой. Коэффициент корреляции – отношение ковариации к произведению среднеквадратических отклонений двух случайных величин. 86 Математическое ожидание – число, относительно которого стабилизируется среднее арифметическое возможных значений случайной величины при достаточно большом количестве опытов. Наблюдение – систематическое, целенаправленное восприятие того или иного объекта или явления без воздействия на него. Опыт – воспроизведение исследуемого явления в определенных условиях проведения эксперимента при возможности регистрации его результатов. Пассивный эксперимент – эксперимент, при котором уровни факторов в каждом опыте регистрируются исследователем, но не задаются. План эксперимента – совокупность данных, определяющих число, условия и порядок реализации опытов. Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям. Последовательный эксперимент (шаговый эксперимент) – эксперимент, реализуемый в виде серий, в котором условия проведения каждой последующей серии определяются результатами предыдущих. Фактор – переменная величина, по предположению влияющая на результаты эксперимента. Эксперимент – система операций, воздействий и (или) наблюдений, направленных на получение информации об объекте при исследовательских операциях. Эксперимент состоит из опытов. 87 Таблица П.1 Плотность вероятностей нормированного нормального распределения: u 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0 0,3989 3970 3910 3814 3683 3521 3332 3123 2897 2661 0,2420 2179 1942 1714 1497 1295 1109 0940 0790 0656 0,0540 0440 0355 0283 0224 0175 0136 0104 0079 0060 0,0044 0033 0024 0017 0012 0009 0006 0004 0003 0002 88 1 3989 3965 3902 3802 3668 3503 3312 3101 2874 2637 2396 2155 1919 1691 1476 1276 1092 0925 0775 0644 0529 0431 0347 0277 0219 0181 0132 0101 0077 0058 0043 0032 0023 0017 0012 0008 0006 0004 0003 0002 2 3989 3961 3894 3790 3653 3485 3292 3079 2850 2613 2371 2131 1895 1669 1456 1257 1074 0909 0761 0632 0519 0422 0339 0270 0213 0167 0129 0099 0075 0056 0042 0031 0022 0016 0012 0008 0006 0004 0003 0002 𝝋(𝒖𝒊 ) = 3 3988 3956 3885 3778 3637 3467 3271 3056 2827 2589 2347 2107 1872 1647 1435 1238 1057 0893 0748 0620 0508 0413 0332 0264 0203 0158 0122 0096 0071 0053 0040 0030 0022 0016 0011 0008 0005 0004 0003 0002 𝟏 √𝟐𝝅 4 3986 3951 3876 3765 3621 3448 3251 3034 2803 2565 2323 2083 1849 1626 1415 1219 1040 0878 0734 0608 0498 0404 0325 0258 0203 0158 0122 0093 0071 0053 0039 0029 0021 0015 0011 0008 0005 0004 0003 0002 𝒖𝟐 −𝟐 𝒆 5 3984 3945 3867 3752 3605 3429 3230 3011 2780 2541 2299 2059 1826 1604 1394 1200 1023 0863 0721 0596 0488 0396 0317 0252 0198 0154 0119 0091 0069 0051 0038 0028 0020 0015 0011 0008 0005 0004 0003 0002 6 3982 3939 3857 3739 3589 3410 3209 2989 2756 2516 2275 2036 1804 1582 1374 1182 1006 0848 0707 0584 0478 0387 0310 0246 0194 0151 0116 0088 0067 0050 0037 0027 0020 0014 0010 0007 0005 0004 0002 0002 7 3980 3932 3847 3726 3572 3391 3187 2966 2732 2492 2251 2012 1781 1561 1354 1163 0989 0833 0694 0573 0468 0379 0303 0241 0189 0147 0113 0086 0065 0048 0036 0026 0019 0014 0010 0007 0005 0003 0002 0002 8 3977 3925 3836 3712 3555 3372 3166 2943 2709 2468 2227 1989 1758 1539 1334 1145 0973 0818 0681 0562 0459 0371 0297 0235 0184 0143 0110 0084 0063 0047 0035 0025 0018 0013 0009 0007 0005 0003 0002 0001 9 3973 3918 3825 3697 3538 3352 3144 2920 2685 2444 2203 1965 1736 1518 1315 1127 0957 0804 0669 0551 0449 0363 0290 0229 0180 0139 0107 0081 0061 0046 0034 0025 0018 0013 0009 0006 0004 0003 0002 0001 Таблица П.2 Критические точки распределения Стьюдента: P{|𝒕𝝂 | > 𝒕𝜶 } = 𝜶 Число степеней свободы, ν 1 2 3 4 5 б 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 120 200 ∞ Уровень значимости α (двусторонняя критическая область) 0,10 6,3138 2,9200 2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125 1,7959 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247 1,7207 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973 1,6896 1,6839 1,6794 1,6759 1,6706 1,6669 1,6641 1,6620 1,6602 1,6577 1,6525 1,6449 0,05 12,7062 4,3027 3,1824 2,7764 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281 2,2010 2,1788 2,1604 2,1448 2,1314 2,1199 2,1098 2,1009 2,0930 2,0860 2,0796 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423 2,0301 2,0211 2,0141 2,0086 2,0003 1,9944 1,9901 1,9867 1,9840 1,9799 1,9719 1,9600 0,02 31,8205 6,9646 4,5407 3,7469 3,3649 3,1427 2,9980 2,8965 2,8214 2,7638 2,7181 2,6810 2,6503 2,6245 2,6025 2,5835 2,5669 2,5524 2,5395 2,5280 2,5176 2,5083 2,4999 2,4922 2,4851 2,4786 2,4727 2,4671 2,4620 2,4573 2,4377 2,4233 2,4121 2,4033 2,3901 1,3808 2,3739 2,3685 2,3642 2,3578 2,3451 2,3263 0,01 63,6567 9,9248 5,8409 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693 3,1058 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 2,8784 2,8609 2,8453 2,8314 2,8188 2,8073 2,7969 2,7874 2,7787 2,7707 2,7633 2,7564 2,7500 2,7238 2,7045 2,6896 2,6778 2,6603 2,6479 2,6387 2,6316 2,6259 2,6174 2,6006 2,5758 0,002 318,3081 22,3271 10,2145 7,1732 5,8934 5,2076 4,7853 4,5008 4,2968 4,1437 4,0247 3,9296 3,8520 3,7874 3,7328 3,6862 3,6458 3,6105 3,5794 3,5518 3,5272 3,5050 3,4850 3,4668 3,4502 3,4350 3,4210 3,4082 3,3962 3,3852 3,3400 3,3069 3,2815 3,2614 3,2317 3,2108 3,1953 3,1833 3,1737 3,1595 3,1315 3,0902 0,001 636,6189 31,5991 12,9240 8,6103 6,8688 5,9588 5,4079 5,0413 4,7809 4,5869 4,4370 4,3178 4,2208 4,1405 4,0728 4,0150 3,9651 3,9216 3,8834 3,8495 3,8193 3,7921 3,7676 3,7454 3,7251 3,7066 3,6896 3,6739 3,6594 3,6460 3,5911 3,5510 3,5203 3,4960 3,4602 3,4350 3,4163 3,4019 3,3905 3,3735 3,3398 3,2905 89 Число степеней свободы, ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 90 Таблица П.3 Критические точки распределения Пирсона: 𝑷{𝝌𝟐𝝂 >𝝌𝟐𝜶 } = 𝜶 Уровень значимости α 0,01 6,63490 9,21034 11,3449 13,2767 15,0863 16,8119 18,4753 20,0902 21,6660 23,2093 24,7250 26,2170 27,6883 29,1413 30,5779 31,9999 33,4087 34,8053 36,1908 37,5662 38,9321 40,2894 41,6384 42,9798 44,3141 45,6417 46,9630 48,2782 49,5879 50,8922 63,6907 76,1539 88,3794 100,425 112,329 124,116 135,807 0,025 5,02389 7,37776 9,34840 11,1433 12,8325 14,4494 16,0128 17,5346 19,0228 20,4831 21,9200 23,3367 27,6883 29,1413 30,5779 31,9999 33,4087 34,8053 36,1908 37,5662 38,9321 40,2894 41,6384 42,9798 44,3141 45,6417 46,9630 48,2782 49,5879 50,8922 63,6907 76,1539 88,3794 100,425 112,329 124,116 135,807 0,05 3,84146 5,99147 7,81473 9,49773 11,0705 12,5916 14,0671 15,5073 16,9190 18,3070 19,6751 21,0261 24,7356 26,1190 27,4884 28,8454 30,1910 31,5264 32,8523 34,1696 35,4789 36,7807 38,0757 39,3641 40,6465 41,9232 43,1944 44,4607 45,7222 46,9792 59,3417 71,4202 83,2976 95,0231 106,629 118,136 129,561 0,95 0,003932 0,102587 0,351846 0,710721 1,145476 1,63539 2,16735 2,73264 3,32511 3,94030 4,57481 5,22603 5,89186 6,57063 7,26094 7,96164 8,67176 9,39046 10,1170 10,8508 11,5913 12,3380 13,0905 13,8484 14,6114 15,3791 16,1513 16,9279 17,7083 18,4926 26,5093 34,7642 43,1879 51,7393 60,3915 69,1260 77,9295 0,975 0,000982 0,050636 0,215795 0,484419 0,831211 1,237247 1,68987 2,17973 2,70039 3,24697 3,81575 4,40379 5,00874 5,62872 6,26214 6,90766 7,56418 8,23075 8,90655 9,59083 10,28293 10,9823 11,6885 12,4011 13,1197 13,8439 14,5733 15,3079 16,0471 16,7908 24,4331 32,3574 40,4817 48,7576 57,1532 65,6466 74,2219 0,99 0,000157 0,020101 0,114832 0,297110 0,554300 0,872085 1,239043 1,646482 2,087912 2,55821 3,05347 3,57056 4,10691 4,66043 5,22935 5,81221 6,40776 7,01491 7,63273 8,26040 8,89720 9,54249 10,1957 10,8564 11,5240 12,1981 12,8786 13,5642 14,2565 14,9535 22,1643 29,7067 37,4848 45,4418 53,5400 61,7541 70,0648 0,00 1 2 3 4 0,05 6 7 8 9 0,10 1 2 3 4 0,15 6 7 8 9 0,20 1 2 3 4 0,25 6 7 8 9 0,30 1 2 3 4 0,35 6 7 8 9 ,000 0000 0100 0200 0300 0400 0500 0601 0701 0802 0902 1003 1104 1206 1307 1409 1511 1614 1717 1820 1923 2027 2132 2237 2342 2448 2554 2661 2769 2877 2986 3095 3205 3316 3428 3541 3654 3769 3884 4001 4118 ,002 0020 0120 0220 0320 0420 0520 0621 0721 0822 0923 1024 1125 1226 1328 1430 1532 1634 1737 1841 1944 2048 2153 2258 2363 2469 2575 2683 2790 2899 3008 3117 3228 3339 3434 3564 3677 3792 3907 4024 4142 ,004 0040 0140 0240 0340 0440 0541 0641 0741 0842 0943 1044 1145 1246 1348 1450 1552 1655 1758 1861 1965 2069 2174 2279 2384 2490 2597 2704 2812 2920 3029 3139 3250 3361 3473 3586 3700 3815 3931 4047 4165 ,006 0060 0160 0260 0360 0460 0561 0661 0761 0862 0963 1064 1165 1267 1368 1471 1573 1676 1779 1882 1986 2090 2195 2300 2405 2512 2618 2726 2833 2942 3051 3161 3272 3383 3496 3609 3723 3838 3954 4071 4189 𝐀𝐫𝐜𝐭𝐡 𝐗 ,008 0080 0180 0280 0380 0480 0581 0681 0782 0882 0983 1084 1186 1287 1389 1491 1593 1696 1799 1903 2007 2111 2216 2321 2427 2533 2640 2747 2855 2964 3073 3183 3294 3406 3518 3632 3746 3861 3977 4094 4213 X 0,50 1 2 3 4 0,55 6 7 8 9 0,60 1 2 3 4 0,65 6 7 8 9 0,70 1 2 3 4 0,75 6 7 8 9 0,80 1 2 3 4 0,85 6 7 8 9 Таблица П.4 ,000 5493 5627 5763 5901 6042 6184 6328 6475 6625 6777 6931 7089 7250 7414 7582 7753 7928 8107 8291 8480 8673 8872 9076 9287 9505 0,973 0,996 1,020 1,045 1,071 1,099 1,127 1,157 1,188 1,221 1,256 1,293 1,333 1,376 1,422 ,002 5520 5654 5791 5929 6070 6213 6358 6505 6655 6807 6963 7121 7283 7447 7616 7788 7964 8144 8328 8518 8712 8912 9118 9330 9549 0,978 1,001 1,025 1,050 1,077 1,104 1,133 1,163 1,195 1,228 1,263 1,301 1,341 1,385 1,432 ,004 5547 5682 5818 5957 6098 6241 6387 6535 6685 6838 6994 7153 7315 7481 7650 7723 7999 8180 8366 8556 8752 8953 9160 9373 9594 0,982 1,006 1,030 1,056 1,082 1,110 1,139 1,169 1,201 1,235 1,271 1,309 1,350 1,394 1,442 ,006 5573 5709 5846 5985 6127 6270 6416 6565 6716 6869 7026 7185 7348 7514 7684 7858 8035 8217 8404 8595 8792 8994 9202 9417 9639 0,987 1,011 1,035 1,061 1,088 1,116 1,145 1,175 1,208 1,242 1,278 1,317 1,358 1,403 1,452 ,008 5600 5736 5874 6013 6155 6299 6446 6595 6746 6900 7057 7218 7381 7548 7718 7893 8071 8254 8441 8634 8832 9035 9245 9461 9684 0,991 1,015 1,040 1,066 1,093 1,121 1,151 1,182 1,214 1,249 1,286 1,325 1,367 1,412 1,462 91 БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учебное пособие для бакалавров / В.Е. Гмурман. - М.: Юрайт, 2013. - 479 c. 2. Горлач, Б.А. Теория вероятностей и математическая статистика: Учебное пособие /Б.А. Горлач. - СПб.: Лань, 2013. - 320 c. 3. Джонсон Н., Лион Ф. Статистика и планирование экспе-римента в технике и науке: Методы планирования экспе-римента. – М.: Мир, 1981. – 520 с. 4. Калинина, В.Н. Теория вероятностей и математическая статистика: Учебник для бакалавров / В.Н. Калинина. - М.: Юрайт, 2013. - 472 c. 5. Климов, Г.П. Теория вероятностей и математическая статистика / Г.П. Климов. -М.: МГУ, 2011. - 368 c. 6. Кобзарь, А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь. - М.: ФИЗМАТЛИТ, 2012. 816 c. 7. Колемаев, В.А. Теория вероятностей и математическая статистика: Учебник / В.А.Колемаев, В.Н. Калинина. - М.: КноРус, 2013. - 376 c. 8. Красовский Г.И., Филаретов Г.Ф. Планирование экспе-римента. – Мн.: Изд-во БГУ, 1982. – 302 с. 9. Кремер, Н.Ш. Теория вероятностей и математическая статистика: Учебник для студентов вузов / Н.Ш. Кремер. - М.: ЮНИТИ-ДАНА, 2012. 551 c. 10. Лебедев, А.В. Теория вероятностей и математическая статистика: Учебное пособие/ Л.Н. Фадеева, А.В. Лебедев; Под ред. проф. Л.Н. Фадеева. М.: Рид Групп, 2011. -496 c. 11. Павлов, С.В. Теория вероятностей и математическая статистика: Учебное пособие/ С.В. Павлов. - М.: ИЦ РИОР, ИНФРА-М, 2010. - 186 c. 12. Прохоров В.Т. Планирование эксперимента: Учеб. посо-бие по дисциплине "Основы науч. исслед." / Моск. тех-нол. ин-т. М, 1988. – 64 с. 92 13. Семенов, В.А. Теория вероятностей и математическая статистика: Учебное пособие / В.А. Семенов. - СПб.: Питер, 2013. – 192 c. 14. Сидняев, Н.И. Теория вероятностей и математическая статистика: Учебник для бакалавров / Н.И. Сидняев. - М.: Юрайт, ИД Юрайт, 2011. – 219 c. 15. Спирина, М.С. Теория вероятностей и математическая статистика: Учебник для студ. учреждений сред. проф. образования / М.С. Спирина, П.А. Спирин. - М.: ИЦ Академия, 2012. - 352 c. 16. Чашкин, Ю.Р. Математическая статистика. Анализ и обработка данных: Учебное пособие / Ю.Р. Чашкин; Под ред. С.Н. Смоленский. - Рн/Д: Феникс, 2010. - 236 c. 93 Введение ОГЛАВЛЕНИЕ 3 1. Обработка результатов эксперимента с помощью одномерной выборки………………………………………………………………………. 6 1.1. Общие сведения………………………………………………………. 6 1.2. Методические указания……………………………………………… 7 1.2.1 Точечный статистический анализ одномерной выборки……… 7 1.2.2. Предварительная проверка нормальности распределения…… 10 1.2.3. Графическое представление эмпирического распределения… 12 1.2.4. Интервальное оценивание………………………………………. 16 1.3. Задание для выполнения лабораторной работы……………………. 24 1.4. Порядок выполнения работы…………………………………… 26 1.5. Содержание отчета…………………………………………………… 28 1.6. Контрольные вопросы………………………………………………... 28 1.7. Пример выполнения работы…………………………………………. 29 2. Эмпирические исследования выборок с помощью корреляционного и регрессионного анализа…………………………………………………….. 39 2.1. Общие сведения………………………………………………………. 39 2.2. Методические указания………………………………………………. 42 2.2.1. Определение коэффициента корреляции……………………… 42 2.2.2. Доверительный интервал для коэффициента корреляции…… 42 2.2.3. Проверка значимости коэффициента корреляции (проверка гипотезы зависимости)………………………………………………… 43 2.2.4. Модели регрессионного анализа……………………………….. 44 2.2.5. Построение линейной регрессионной модели методом наименьших квадратов………………………………………………… 45 2.2.6. Определение качества аппроксимации………………………… 46 2.2.7. Диаграмма рассеяния (корреляционное поле) и график линии регрессии………………………………………………………………... 48 2.3. Задание для выполнения лабораторной работы……………………. 48 94 2.4. Порядок выполнения работы……………………………………. 50 2.5. Содержание отчета…………………………………………………… 53 2.6. Контрольные вопросы………………………………………………... 53 2.7. Пример выполнения работы…………………………………………. 54 3. Определение количества измерений методом последовательного анализа……………………………………………………………………….. 59 3.1. Общие сведения……………………………………………………… 59 3.2. Методические указания………………………………………………. 61 3.2.1. Погрешность однократных измерений………………………… 61 3.2.2. Совместный учет ошибки многократных и однократных измерений………………………………………………………………. 64 3.2.3. Анализ промахов………………………………………………… 65 3.2.4. Определение числа опытов……………………………………... 68 3.2.5. Метод последовательного анализа при проведении эксперимента…………………………………………………………… 71 3.2.6. Рекомендации при определении объема эксперимента………. 73 3.2.7. Некоторые выводы………………………………………………. 75 3.3. Задание для выполнения лабораторной работы…………………….. 76 3.4. Порядок выполнения работы……………………………………. 77 3.5. Содержание отчета…………………………………………………… 79 3.6. Контрольные вопросы………………………………………………... 79 3.7. Пример выполнения работы…………………………………………. 80 Основные понятия и определения…………………………………………. 86 Таблицы математической статистики……………………………………… 88 Библиографический список………………………………………………… 92 95 96