Загрузил Jane

СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТОВ (Учебное пособие) 2017

реклама
Московский авиационный институт
(национальный исследовательский университет)
СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ
ЭКСПЕРИМЕНТОВ
Учебное пособие
Москва, 2017
1
АННОТАЦИЯ
В учебном пособии изложены методики расчета статистических параметров одномерной выборки, построения доверительных интервалов для измеряемой случайной величины, исследования линейной корреляции переменных величин, различные варианты расчета параметров линейных аппроксимирующих функций методом наименьших квадратов, а также содержатся
краткие сведения об основных понятиях теории вероятностей. В пособии
описаны методы графического представления экспериментальных результатов. Прилагаются таблицы коэффициентов Стьюдента, Пирсона и функции
Лапласа, часто применяющиеся при обработке результатов эксперимента.
Учебное пособие предназначено для студентов изучающих дисциплины 09.03.02 «Информационные системы и технологии», 24.05.06 «Системы
управления движением и навигация»
2
ВВЕДЕНИЕ
Исследование технических систем может использовать теоретические и
эмпирические методы. Каждое из этих направлений обладает относительной
самостоятельностью, имеет свои достоинства и недостатки. В общем случае,
теоретические методы в виде математических моделей позволяют описывать
и объяснять взаимосвязи элементов изучаемой системы или объекта в относительно широких диапазонах изменения переменных величин. Однако при
построении теоретических моделей неизбежно введение каких-либо ограничений, допущений, гипотез и т.п. Поэтому возникает задача оценки достоверности (адекватности) полученной модели реальному процессу или объекту. Для этого проводится экспериментальная проверка разработанных теоретических моделей.
В настоящее время процедура обработки экспериментальных данных
разработана достаточно хорошо и исследователю необходимо только иметь
достаточную подготовку для того, чтобы правильно ее использовать. Основные задачи, решаемые при обработке результатов эксперимента: вопросы
подбора эмпирических формул и оценка их параметров, вопросы оценки истинных значений измеряемых величин и точности измерений, вопросы исследования корреляционных зависимостей и др.
Экспериментальные данные формируются путем наблюдений либо с
помощью пассивного и активного экспериментов.
Наблюдение — систематическое, целенаправленное восприятие того
или иного объекта или явления без воздействия на него. Наблюдение позволяет получить первоначальную информацию об изучаемом объекте или явлении.
Эксперимент — система операций, воздействий и (или) наблюдений,
направленных на получение информации об объекте при исследовательских
операциях. Эксперимент состоит из опытов.
Пассивный эксперимент — эксперимент, при котором уровни факторов в каждом опыте регистрируются исследователем, но не задаются.
3
Активный эксперимент — эксперимент, в котором уровни факторов в
каждом опыте задаются исследователем.
Опыт — это воспроизведение исследуемого явления в определенных
условиях проведения эксперимента при возможности регистрации его результатов.
Целью любого эксперимента является определение качественной и количественной связи между исследуемыми параметрами, либо оценка численного значения какого-либо параметра.
В некоторых случаях вид зависимости между переменными величинами известен по результатам теоретических исследований. Как правило, формулы, выражающие эти зависимости, содержат некоторые постоянные, значения которых необходимо определить из опыта.
Другим типом задачи является определение неизвестной функциональной связи между переменными величинами на основе данных эксперимента.
Такие зависимости называют эмпирическими.
Однозначно определить неизвестную функциональную зависимость
между переменными невозможно даже в том случае, если бы результаты эксперимента не имели ошибок. Тем более не следует этого ожидать, имея результаты эксперимента, содержащие различные ошибки измерения.
Данные результата эксперимента всегда содержит некоторую погрешность. Если погрешность мала, то ею можно пренебречь. Однако при этом
неизбежно возникают два вопроса: во-первых, что понимать под малой погрешностью, и, во-вторых, как оценить величину погрешности, то есть и результаты эксперимента нуждаются в определенном теоретическом осмыслении.
Итак, никогда истинного значения измеряемой величины не получить.
Это объясняется тем, что измерительные средства основаны на определенном
методе измерения, точность которого конечна. Ошибка измерения это разность между результатом измерения и истинным значением измеряемой величины. Эта ошибка также неизвестна, как неизвестно истинное значение
4
измеряемой величины. Кроме погрешности измерения на результат измерения влияет еще ряд объективных и субъективных причин.
Поэтому одной из важнейших задач математической обработки результатов эксперимента и является оценка истинного значения измеряемой величины по данным эксперимента с возможно меньшей ошибкой.
Основным типом погрешностей, изучению которых посвящено данное
пособие, являются случайные погрешности. Они поддаются строгому математическому описанию, что позволяет делать корректные выводы о качестве
эксперимента.
Изучение материалов учебного пособия должно помочь студентам
приобрести определенные образовательными стандартами РФ знания, умения и навыки.
Знать:
— числовые характеристики статистической выборки;
— точечное и интервальное оценивание параметров статистической
выборки;
основы корреляционного и регрессионного анализа.
Уметь:
— формулировать задачи для статистического анализа;
— пользоваться математическим аппаратом для обработки статистических данных;
— использовать технические средства для постановки эксперимента.
Владеть:
— выбором исходных данных для статистического анализа;
— анализом полученных числовых и графических характеристик экспериментальных исследований;
— методами обработки экспериментальных данных.
5
1. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА С
ПОМОЩЬЮ ОДНОМЕРНОЙ ВЫБОРКИ
Цель работы: освоение способов проведения экспериментов с использованием промышленных роботов; получение практических навыков точечной и интервальной оценки параметров партии деталей.
1.1. ОБЩИЕ СВЕДЕНИЯ
При выполнении экспериментальных исследований на значение измеряемой величины влияет множество случайных факторов, не имеющих прямого отношения к изучаемому явлению или объекту. Эти факторы (помехи)
могут весьма значительно влиять на результаты измерений, но не носить закономерный (постоянный) характер. Поэтому все получающиеся из эксперимента величины являются случайными.
Ошибки (погрешности), возникающие при этом, называют случайными. Случайные ошибки устранить нельзя, но благодаря тому, что они подчиняются закономерностям теории математической статистики при достаточно
большом числе измерений, всегда можно указать пределы, внутри которых
заключено истинное значение измеряемой величины.
Основное содержание математической статистики составляют методы
систематизации, обработки и использования статистических данных, выявление статистических закономерностей.
Множество всех объектов, подлежащих изучению, называется генеральной совокупностью. Множество случайно отобранных объектов из генеральной совокупности называется выборочной совокупностью или выборкой.
При изучении какого-либо одного параметра, используется одномерная генеральная совокупность и, соответственно, одномерная выборка.
Выборка называется случайной, если из генеральной совокупности
элементы берутся наугад и в выборку каждый из них может попасть с одинаковой вероятностью. Если случайная выборка такова, что по её распределе6
нию можно судить о распределении неизвестной генеральной совокупности,
то такая выборка называется репрезентативной, т.е. хорошо представляющей
генеральную совокупность.
Основные задачи, рассматриваемые в этой работе:
— получение рационально выбранных числовых характеристик, которые дали бы общее представление о всей совокупности;
— графическое представление эмпирического материала, дающее приближённые выражения для функции распределения и плотности распределения вероятности;
— интервальное оценивание, позволяющее по данным выборки указать
интервал, в котором с заданной вероятностью следует искать истинное, но
неизвестное значение параметра распределения генеральной совокупности.
1.2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ
1.2.1. Точечный статистический анализ одномерной выборки
Пусть x1, x2, …, xn.− выборка объема n из некоторой генеральной совокупности. По этой выборке можно оценить основные числовые характеристики генеральной совокупности. Различные элементы выборки xi называются вариантами. Ряд вариант, расположенных в порядке возрастания их значений называется вариационным рядом. Им пользуются, в основном, при
малых n.
Если n велико, то ряд разбивают на равные интервалы (интервальная
группировка). Количество интервалов можно определить по формуле Стерджеса 𝐾 ≈ 1 + 3,322 lg 𝑛. При величине выборки n < 50 можно пользоваться
и другими эмпирическими формулами, например, K ≈ √𝑛, или K < 5lg 𝑛. Они
дают приблизительно одинаковый результат. Обычно количество интервалов
выбирают в пределах 5 < K < 20. Под частотой mi интервала Ki понимается
число членов выборки, которые лежат в i– м интервале.
7
Числовые характеристики выборки называются выборочными (эмпирическими) числовыми характеристиками. Основные числовые характеристики:
1. Среднее арифметическое (среднее выборочное):
𝐧
𝐊
𝐢=𝟏
𝐢=𝟏
𝟏
𝟏
𝒙 = � 𝒙𝒊 = � 𝐦𝐢 𝒙инт 𝒊 ,
𝐧
𝐧
где mi – интервальная частота,
(1.1)
K – количество интервалов,
𝑥𝑥инт 𝑖 − середина i-го интервала.
2. Выборочная (эмпирическая) несмещенная дисперсия:
𝒏
𝑲
𝒊=𝟏
𝒊=𝟏
𝟏
𝟏
𝑺𝟐 =
�(𝒙𝒊 − 𝒙)𝟐 =
� 𝒎𝒊 (𝒙инт 𝒊 − 𝒙)𝟐 .
𝒏−𝟏
𝒏−𝟏
(1.2)
3. Стандартное среднее квадратичное отклонение:
𝒏
𝑲
𝒊=𝟏
𝒊=𝟏
𝟏
𝟏
𝑺=�
�(𝒙𝒊 − 𝒙)𝟐 = �
� 𝒎𝒊 (𝒙инт 𝒊 − 𝒙)𝟐 .
𝒏−𝟏
𝒏−𝟏
4. Коэффициент вариации:
𝑺
𝑽= ; 𝒙≠𝟎.
(1.3)
(1.4)
𝒙
При нормальном распределении коэффициент вариации должен быть
не более 0,33.
5. Оценка коэффициента асимметрии:
𝟏 𝑲
∑𝟏 𝐦𝐢 (𝒙инт 𝒊 − 𝒙)𝟑
𝐧
𝐀𝐬 =
.
𝐒𝟑
(1.5)
Коэффициент асимметрии характеризует симметричность распределения относительно среднего 𝒙. Он положителен, если правый "хвост" распре-
деления длиннее левого (правая часть кривой более пологая), и отрицателен в
8
противном случае. Если распределение симметрично относительно математического ожидания, то его коэффициент асимметрии равен нулю.
Среднее квадратичное асимметрии зависит от величины выборки:
𝑺𝑨 = �
6. Оценка эксцесса:
𝟔(𝒏 − 𝟏)
.
(𝒏 + 𝟏)(𝒏 + 𝟑)
𝟏 𝐊
�𝟏 (𝒙инт 𝒊 − 𝒙)𝟒 𝐦𝐢
𝐧
𝐄𝐱 =
−𝟑.
𝐒𝟒
(1.6)
(1.7)
Минус три» в конце формулы введено для того, чтобы коэффициент
эксцесса нормального распределения был равен нулю. Оценка эксцесса является мерой островершинности распределения по сравнению с нормальным
распределением. Если Ex > 0, то вершина более острая, а если Ex < 0 то более
плоская, чем у нормального распределения.
Среднее квадратичное эксцесса:
𝟐𝟒𝒏(𝒏 − 𝟐)(𝒏 − 𝟑)
𝑺𝑬 = �
.
(𝒏 − 𝟏)𝟐 (𝒏 + 𝟑)(𝒏 + 𝟓)
(1.8)
7. Выборочная мода Mo. Для дискретного вариационного ряда (дискретная группировка) мода определяется как значение варианты с наибольшей частотой. При интервальной группировке выбирается интервал, которому соответствует наибольшая интервальная частота Mo = mmax.
8. Выборочная медиана. При дискретной группировке это величина,
относительно которой выборка делится на две равные по объему части. При
интервальной группировке сначала находят так называемый медианный интервал, номер которого определяют из неравенств:
9
𝒏
⎧ � 𝐦𝐢 ≤ 𝟐
⎪ 𝐢<𝐢𝐌𝐞
𝑴𝒆 <=>
⎨ � 𝒎𝒊 > 𝒏
⎪
𝟐
⎩𝒊≤𝒊𝑴𝒆
(1.9)
Т.е. сумма частот всех интервалов левее медианного, должна быть
меньше суммы частот включающих частоту медианного интервала. За оценку медианы принимают значение середины медианного интервала.
1.2.2. Предварительная проверка нормальности распределения
С помощью вычисленных числовых характеристик можно определить,
является ли выборочное распределение нормальным. Если выборочное распределение близко к нормальному (или является таковым), то:
1. В интервалы 𝑥𝑥 ± 𝑆, 𝑥𝑥 ± 2𝑆, 𝑥𝑥 ± 3𝑆 должны попадать соответствен-
но 68,3%, 95,5% и 99,7% выборочных значений. Значения часто используе-
мых интервалов сведены в таблицу 1.1 и проиллюстрированы на рис. 1.1.На
графике кривая f(x) определяет плотность распределения непрерывной случайной величины X. Соответственно площадь под кривой в интервале от X1
𝑋
доX2 вычисляется как P(x)=∫𝑋 2 𝑓(𝑥𝑥)𝑑𝑥𝑥 и соответствует вероятности попада1
ния величины X в этот интервал. В таблицу, кроме стандартных значений
𝑥𝑥 ± 𝑆, 𝑥𝑥 ± 2𝑆, 𝑥𝑥 ± 3𝑆 включены интервалы для наиболее часто используемых
вероятностей 95,0% и 99,0%.
Таблица 1.1. Параметры нормального распределения
10
Интервал
Вероятность, %
𝑥𝑥 − 𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 𝑆
68,3
𝑥𝑥 − 2𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 2𝑆
95,5
𝑥𝑥 − 3𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 3𝑆
99,7
𝑥𝑥 − 1,96𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 1,96𝑆
95,0
𝑥𝑥 − 2,58𝑆 ≤ 𝑥𝑥 ≤ 𝑥𝑥 + 2,58𝑆
99,0
Рис. 1.1. Интервалы и вероятности нормального распределения
2. В не слишком маленькой выборке величина коэффициента вариации
V должна быть не более 0,33, т.е.V < 0,33.
3. Оценка коэффициента асимметрии As должны быть близка к нулю.
Объективная (количественной) характеристикой ассиметрии является отно𝐀𝐬
шение 𝑺 . Если:
—
𝑨
—
𝐀𝐬
𝑺𝑨
𝐀𝐬
𝑺𝑨
≥ 3, то гипотеза о нормальности отклоняется;
≤ 2, то гипотеза о нормальности принимается;
— 2<
𝐀𝐬
𝑺𝑨
< 3, то для проверки нормальности следует использовать
критерий χ2 (Пирсона) или критерий Колмогорова.
4. Оценка эксцесса Ex должна быть близка к нулю. Объективной характеристикой является отношение
—
𝑬𝒙
—
𝑬𝒙
𝑺𝑬
𝑺𝑬
𝑬𝒙
𝑺𝑬
. Если:
≥ 3, то гипотеза о нормальности отклоняется;
≤ 2, то гипотеза о нормальности принимается;
— 2<
𝑬𝒙
𝑺𝑬
< 3, то для проверки нормальности следует использовать
критерий χ2 (Пирсона) или критерий Колмогорова.
5. 𝒙 ≈ Me.
11
Интервал ±3S является почти достоверным, так как подавляющее
большинство отдельных результатов многократного измерения случайной
величины окажется сосредоточенным именно в нем.
Поэтому при обработке результатов эксперимента часто используется
«правило 3S», которое основано на указанном свойстве нормального распределения. С помощью него можно установить наличие промаха в результате
отдельного измерения. Это отдельное измерение можно отбросить, если его
значение более чем на 3S отличается от измеренного среднего значения случайной величины.
В то же время стоит более тщательно повторить измерения в этой области параметров. Возможно, что данный результат измерения не является
промахом, а свидетельствует о наличии необычного поведения изучаемой
системы, которое не укладывается в рамки существующей модели, т.е. речь
идет об открытии нового качественного состояния. Подробнее о промахах
будет рассмотрено ниже.
1.2.3. Графическое представление эмпирического распределения
Графическое представление результатов обладает большой наглядностью и информативностью. Графики экспериментальных зависимостей позволяют легко визуально предварительно определять характер зависимости,
судить о величине разброса экспериментальных данных по сравнению с
предсказаниями теории и т.д.
Графики, построенные при выполнении лабораторных работ должны
быть максимально информативными. Для этого необходимо соблюдать некоторые требования:
1. На координатных осях должны быть указаны обозначения откладываемых величин и единицы их измерения.
2. Начало координат может не совпадать с нулевыми значениями величин. Его выбирают таким образом, чтобы рабочая площадь была использована максимально.
12
3. Экспериментальные точки изображаются четко и крупно в виде
кружков, крестиков, разноцветных точек и т.п.
4. Масштабные деления на координатных осях следует наносить равномерно.
5. Масштаб выбирают таким образом, чтобы:
— кривая была равномерно растянута вдоль обеих осей (если график
представляет собой прямую, то угол ее наклона к осям должен быть близок к
45°).
— положение любой точки можно было определить легко и быстро.
Наиболее распространенными способами графического представления эмпирических данных (выборки) являются гистограмма, полигон частот и эмпирическая функция распределения (накопленные относительные частоты).
Пусть 𝑥𝑥𝑚𝑖𝑛 и 𝑥𝑥𝑚𝑎𝑥 − соответственно наименьшее и наибольшее значе-
ния вариант выборки. Величина R = 𝑥𝑥𝑚𝑎𝑥 − 𝑥𝑥𝑚𝑖𝑛 называется размахом вы-
борки. Размах делится на число интервалов K (интервальная группировка).
Их количество можно вычислить по приведенным выше формулам, округлив
до целого числа. При этом ширина интервала составит ℎ = 𝑅�𝐾
Левую границу интервала принято начинать , отступая примерно на 0,5
интервала в сторону меньших значений от 𝑥𝑥𝑚𝑖𝑛 и заканчивать, отступая примерно на 0,5 интервала в сторону больших значений от 𝑥𝑥𝑚𝑎𝑥 . Получается ве-
личина поля рассеивания.
В его пределах можно корректировать значения 𝑥𝑥𝑚𝑖𝑛 и 𝑥𝑥𝑚𝑎𝑥 таким об-
разом, чтобы величина размаха выборки хорошо делилась на интервалы.
После разбиения на интервалы определяют параметры выборки и за-
полняют таблицу 1.2 (пример).
13
Таблица 1.2. Разбивка выборки на интервалы
K
Интервалы группировки
Свыше
До (включительно)
1
2
3
4
5
6
Середина интервала 𝑥𝑥инт i
Частота mi
Σ
На основании таблицы строятся гистограмма, полигон частот и эмпи-
рическая функция распределения
Гистограмма строится следующим образом. На оси абсцисс откладываются интервалы, и на каждом из них строится прямоугольник, площадь которого равна частоте, соответствующей этому интервалу, т.е. высота прямоугольника (ордината) равна m i, т.е. гистограмма является эмпирическим аналогом плотности распределения (рис.1.2).
Полигон частот — ломаная линия, которая получается, если из середины каждого интервала восстановить перпендикуляр высотой mi и соединить вершины этих перпендикуляров (рис.1.2).
По гистограмме и полигону частот судят о виде плотности распределения исследуемой непрерывной случайной величины или о распределении вероятностей дискретной случайной величины.
14
Рис.1.2. Гистограмма и полигон распределения
Для данного фиксированного значения 𝑥𝑥i, чем больше ширина интерва-
ла h, тем больше соответствующая ему вероятность попасть в этот интервал
(т.е. тем больше площадь под кривой распределения).
Рассмотрим интервал h бесконечной ширины. Вероятность того, что
измеряемая случайная величина принимает какое-либо значение в интервале
от –∞ до +∞, равна 1 (достоверное событие – событие, которое происходит
всегда). Это означает, что площадь под кривой распределения равна единице.
Рассмотрим другой предельный случай. Устремим ширину интервала h
к нулю. Площадь при этом тоже обратится в ноль. Это значит, что вероятность получить при измерении конкретное фиксированное значение непрерывной случайной величины равна нулю. То есть для непрерывной случайной величины можно указать лишь интервал ее возможных значений с указанием вероятности ее пребывания в этом интервале. Это означает, что на основании результатов измерений (x1, x2, …, xn) невозможно указать истинное
значение величины, а лишь интервал близких к нему возможных значений.
Также невозможно указать точное значение допущенной при этом погрешности, а лишь интервал возможных значений погрешности с соответствующей
вероятностью.
15
Эмпирическую функцию распределения F(x) получают построением
ступенчатой кривой относительных накопленных частот. Она имеет скачки в
серединах интервалов группировок, 𝑥𝑥инт 𝑖 (рис. 1.3).
Рис.1.3. Эмпирическая функция распределения
По сути функция распределения F(x) определяет (для всех действительных х) вероятность того, что случайная величина Х принимает значение
не больше, чем x.
В частности, по графику задавая F(x) можно определить значение 𝑥𝑥𝑃 ,
которое исследуемая величина не превзойдет с вероятностью P. И наоборот,
задавая 𝑥𝑥𝑃 , по тому же графику можно найти соответствующую вероятность
𝑝. Например, из соотношения 𝐹 (𝑥𝑥𝑃 ) = 0,5 можно определить значение ме-
дианы.
1.2.4. Интервальное оценивание
В предыдущем разделе были рассмотрены оценки параметров распределения с помощью числовых значений, которые находятся по выборке и
называются точечными. К сожалению, точечные оценки параметров не дают
16
представления о степени точности, т.е. близости оценки к действительному
параметру. Да и надежность полученной оценки тоже не 100%. Особенно часто вопрос о точности и надежности оценки возникает тогда, когда объем
выборки недостаточно велик. В таких случаях для того, чтобы получить
представление о точности и надежности оценки параметра, строят интервальные оценки, которые еще называют доверительными интервалами.
1. Доверительный интервал для математического ожидания μ.
При построении доверительного интервала для математического ожидания μ, в качестве оценки используем среднее арифметическое (среднее) 𝑥𝑥 и
точечную оценку для среднего квадратичного отклонения 𝑺. Выражения для
определения 𝑥𝑥 и 𝑆 2 приведены выше.
В теории математической статистики доказывается, что значения мате-
матического ожидания подчиняются t-распределению f(t) (распределению
Стьюдента) (рис. 1.4).
Рис.1.4. Распределение Стьюдента
Одной из характеристик t-распределения является коэффициент Стьюдента tα,ν, зависящий от величины ν = ( n –1 ), которая называется степенью
свободы. Значение α называется коэффициентом значимости и определяет
вероятность выхода величины за пределы tα Величина 𝛼 ⁄2 характеризует од-
ностороннюю область уровня значимости, соответственно α – двустороннюю. Значение γ =1–α называется коэффициентом доверия. Кроме коэффи17
циента доверия часто используют термин доверительная вероятность
P = γ∙100%.
В итоге выражение для определения доверительного интервала для μ:
𝒙 − 𝒕𝛼,𝑛−1
𝑺
√𝒏
≤ 𝝁 ≤ 𝒙 + 𝒕𝛼,𝑛−1
𝑺
√𝒏
.
(1.10)
Для определения величины 𝑡𝛼,𝑛−1 пользуются таблицами распределе-
ния Стьюдента (таблица П.2 приложения). Фрагмент таблицы для n = 36
представлен в тексте.
Табл.1.3 Критические точки распределения Стьюдента (фрагмент)
ν = n–1
35
0,10
1,69
Уровень значимости α (двусторонняя область)
0,05
0,02
0,01
0,002
2,03
2,44
1,72
3,34
0,001
3,59
Для доверительной вероятности 95% при n > 30 можно пользоваться
таблицей для нормального распределения, так как при этих условиях распределение Стьюдента практически совпадает с распределением Гаусса, то есть
𝑡𝛼,𝑛−1 ≈ 𝑍𝛼 .
Величина 𝑡𝛼,𝑛−1
𝑆
√𝑛
задает границы доверительного интервала, т.е.
определяет пределы интервальной оценки.
Доверительный интервал для данных значений S и n можно представить с помощью доверительной полосы графически (рис. 1.5).
18
Рис.1.5. Доверительный интервал для математического ожидания
Используя рисунок, для любого вычисленного значения 𝑥𝑥 по выборке
данного объема n можно определить границы доверительного интервала для
математического ожидания μ. При росте n границы доверительной полосы
будут стремиться к линии μ = 𝑥𝑥. Рассмотренный доверительный интервал
симметричен относительно 𝑥𝑥. Кроме того, вероятность превзойти левую, ли-
бо правую границу интервала одинакова и равна α/2.
Обратим внимание, что с увеличением числа измерений погрешность
окончательного результата уменьшается. Однако уменьшение погрешности
никогда не дается бесплатно. Так, чтобы узнать дополнительную значимую
цифру в 𝑥𝑥, т.е. повысить точность в 10 раз, количество измерений необходи-
мо увеличить в 100 раз! Следует также учесть, что в конечную погрешность
вносит свой вклад приборная (систематическая) погрешность, и с какого-то
момента увеличение числа измерений становится неэффективным.
Из проведенного анализа можно сделать некоторые выводы:
19
1. При увеличении объема выборки n точность интервальной оценки
увеличивается, так как величина (𝑡𝛼,𝑛−1
𝑆
√𝑛
) уменьшается. При больших n хо-
рошей оценкой для μ становится 𝑥𝑥, т.е. точечная оценка.
2. При
(𝑥𝑥 − 𝑡𝛼,𝑛−1
𝑆
√𝑛
увеличении
коэффициента
доверия
), т.е. увеличивается погрешность.
𝛾𝛾
растет
величина
3. Для фиксированных значений коэффициента доверия надежности
𝛾𝛾 = 1 – α и погрешности можно определить необходимый объем выборки.
Следует иметь в виду, что при неизменном объеме выборки одновременно
увеличивать коэффициент доверия и уменьшать погрешность точность нельзя.
Поэтому для характеристики величины случайной погрешности
(ошибки) результата многократных измерений необходимо указывать
два числа: величину доверительного интервала Δx и величину соответствующей ему доверительной вероятности P.
Истинное значение измеряемой физической величины никогда неиз-
вестно. В теории погрешностей считают, что значение, появляющееся в экс-
перименте чаще всего и подчиняющееся нормальному распределению и есть
истинное значение 𝑥𝑥0 То есть за истинное значение 𝑥𝑥0 принимают математическое ожидание μ.
2. Доверительный интервал для дисперсии σ2
При определении доверительного интервала воспользуемся тем, что
значения для дисперсии принадлежат распределению Пирсона χ2 с ν =( n –1 )
степенями свободы. При этом воспользуемся точечной оценкой для дисперсии 𝑆 2 . Этого достаточно, чтобы определить интервал для σ2.
𝒏𝑺𝟐
𝒏𝑺𝟐
𝟐
≤𝝈 ≤ 𝟐
𝝌𝟐𝟐
𝝌𝟏
(1.11)
Значения 𝜒12 и 𝜒22 находим из таблиц распределения Пирсона χ 2 . При
этом параметрами распределения являются α и 𝜈 = 𝑛 − 1, т. е.
20
𝝌𝟐𝟏 <=> �
𝜶
𝟐 ;
𝝂=𝒏−𝟏
𝜶
𝟐
𝝂=𝒏−𝟏
𝟏−
(1.12)
𝝌𝟐𝟐 <=> �
Этими формулами можно пользоваться независимо от размера выборки. Однако при n > 30 распределение 𝜒𝜈2 близко к нормальному, поэтому для
нахождения границ доверительного интервала можно пользоваться стандартными значениями zα, которые приведены в таблице П.2 (фрагмент табл. 1.3 в
тексте). То есть при достаточно большом n можно брать значения из последней строки таблицы t – распределения, когда Zα= t α ,∞.
Таблица 1.4. Коэффициенты Стьюдента для t α ,∞=Zα(двусторонняя область)
α
zα= t α ,∞
0,10
1,64
0,05
1,96
0,02
2,33
0,01
2,58
0,002
3,09
0,001
3,29
При этом доверительный интервал для дисперсии можно определить из
выражения:
(𝒏 − 𝟏)𝑺𝟐
(𝒏 − 𝟏) + 𝒁𝜶 �𝟐(𝒏 − 𝟏)
𝟐
≤𝝈 ≤
(𝒏 − 𝟏)𝑺𝟐
(𝒏 − 𝟏) − 𝒁𝜶 �𝟐(𝒏 − 𝟏)
Например, при α = 0,05, Zα = 1,96, n = 36 получим:
.
(1.13)
0.67 S2 ≤ 𝝈𝟐 ≤ 𝟏. 𝟗𝟒 𝑺𝟐 .
Доверительный интервал для дисперсии при заданных значениях S и n
можно представить с помощью доверительной полосы графически. На
рис.1.6 доверительный интервал выделен темным фоном.
21
Рис.1.6. Доверительный интервал для дисперсии
3. Проверка гипотезы о нормальном распределении по критерию
Пирсона
Если данные представлены интервальной группировкой (K интервалов), то подсчитывается количество mi выборочных значений исследуемого
параметра. Это значение mi сравнивается со значением, вычисленным по теоретическим зависимостям для нормального распределения F0(x), т.е. пользуясь интегралом Лапласса. Теоретическое значение mi обозначается как 𝑚𝑖0 .
Далее применяется статистика критерия, которая определяется как:
𝑲
(𝒎𝒊 − 𝒎𝟎𝒊 )𝟐
𝝌 =�
𝒎𝟎𝒊
𝟐
(1.14)
𝒊=𝟏
Эта статистика имеет распределение Пирсона (χ2 ) с 𝜈 = 𝐾 − 1 степе-
нями свободы. Если для распределения F0(x) предварительно по выборке вы-
числялись L параметров, то 𝜈 = 𝐾 − 1 − 𝐿. Этот критерий требует, чтобы
были выполнены следующие соотношения для всех интервалов: 𝑚𝑖0 >5. Ги22
потеза о распределении отвергается, если вычисленное реальное значение
2
2
больше 𝜒кр
, найденного по таблицам для данных α и ν.
𝜒реал
Для проверки нормальности распределения предварительно необходи-
мо рассчитать среднее значение выборки 𝑥𝑥 и среднее квадратичное отклонение S. Таким образом, число степеней свободы в данном случае
𝜈 = 𝐾 − 1 − 2.
Сначала необходимо рассчитать 𝑚𝑖0 теоретические частоты, воспользо-
вавшись формулами:
𝒏𝒉
𝒎𝟎𝒊 = 𝝋(𝒖𝒊 );
𝑺
𝒖𝒊 =
𝒙𝒊 −𝒙
где 𝒉 − ширина интервала.
𝑺
; 𝝋(𝒖𝒊 ) =
𝟏
√𝟐𝝅
𝒆
−
𝒖𝟐
𝟐
;
(1.15)
Плотность вероятностей нормированного нормального распределения:
𝜑 (𝑢𝑖 ) =
1
√2𝜋
𝑒
−
𝑢2
2
можно определить из таблицы приложения П1.
Результаты вычислений удобно представить в виде таблицы:
Таблица 1.5.Параметры для определения закона распределения
№ mi xинт i
1
2
3
4
5
6
xинт i − 𝑥𝑥
𝑢𝑖 =
𝑆
𝜑(𝑢𝑖 ) =
1
√2𝜋
𝑢2
𝑒− 2
𝑚𝑖0 =
𝑛ℎ
𝜑(𝑢𝑖 )
𝑆
(𝑚𝑖 − 𝑚𝑖0 )2
𝑚𝑖0
2
Σ = 𝜒реал
=
2
Далее определим по таблице П.3 критических значений 𝜒кр
при уровне
2
2
< 𝜒кр
то
значимости α и числе степеней свободы 𝜈 = 𝐾 − 1 − 2. Если 𝜒реал
гипотезу о нормальном распределении можно принять при данном уровне
значимости.
23
В данной работе K = 6, поэтому 𝜈 = 6 − 1 − 2 = 3. Фрагмент таблицы
2
находится на
распределения Пирсона представлен на рис.1.7. Величина 𝜒кр
пересечении столбца α и строки ν.
ν=3
3
Уровень значимости, α
0,01 0,025
11,35 9,35
0,05
7,81
0,95
0,352
0,975
0,216
0,99
0,115
Рис. 1.7. Критические точки распределения Пирсона
Более полная таблица распределения Пирсона представлена в приложении (таблица П.3).
1.3. ЗАДАНИЕ ДЛЯ ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ
Произвести статистический анализ одномерной выборки. Выборка
представлена в виде статистического ряда (x1, x2, …, xn.). Объем выборки
36 значений.
Величина 𝑥𝑥 – исследуемый признак, представляющий собой время про-
хождения изделием лабиринта, имитирующего технологический процесс.
Для выполнения поставленной задачи необходимо:
1. Измерить время прохождения тридцати шести изделий по лабиринту. Изделия изготовлены из одного и того же материала и взяты из одной и
той же партии. Их номинальный диаметр 16 мм. Перемещение изделий в рабочей зоне происходит с помощью манипулятора. Время движения по лабиринту фиксируется с помощью контроллера робототехнической системы
FANUC с точностью 0,1 с.
2. Составить таблицу измерений выборочной совокупности (выборки).
3. Представить произведенные измерения в виде вариационного ряда.
4. Разбить выборку на интервалы. Результаты свести в таблицу.
5. Рассчитать основные характеристики выборки:
— среднее арифметическое (среднее),
— выборочную (эмпирическую) несмещенную дисперсию,
— стандартное среднее квадратичное отклонение.
24
6. Вычислить дополнительные характеристики выборки, необходимые
для установления закона распределения:
— коэффициент вариации,
— оценку коэффициента асимметрии,
— среднее квадратичное асимметрии,
— оценку эксцесса,
— среднее квадратичное эксцесса,
— выборочную моду,
— выборочную медиану.
7. Сделать предварительное заключение о степени соответствия распределения нормальному.
8. Построить гистограмму и полигон распределения.
9. Построить эмпирическую функцию распределения. Проверить правильность оценки медианы.
10. Определить доверительный интервал для математического ожида-
ния.
11. Определить доверительный интервал для дисперсии.
12. Представить в виде доверительной полосы интервал для математического ожидания графически.
13. Представить доверительный интервал для дисперсии при заданных
значениях S и n графически.
14. Проверить гипотезу о нормальном распределении выборки, воспользовавшись критерием Пирсона:
2
— вычислить реальное значение 𝜒реал
критерия Пирсона,
2
критерия Пирсона,
— по таблице определить критическое значение 𝜒кр
— сделать вывод о распределении выборки.
15. Сделать общие выводы по всей работе.
25
1.4. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
1. Измерить время прохождения выборки из партии деталей по лабиринту, имитирующему технологический процесс. Для этого использовать
промышленный робот FANUC. Составление программы для обеспечения автоматического измерения времени задача другой работы.
2. Составить таблицу измерений выборочной совокупностью (выборки). Размер выборки 36 значений. Выборка статистически значима.
3. Представить произведенные измерения в виде вариационного ряда,
т.е. измеренные значения расположить в порядке возрастания.
4. Систематизировать результаты измерений, т.е. разбить выборку на
интервалы (пример, табл. 1.1).
5. Рассчитать:
— среднее арифметическое (среднее) по формуле (1.1),
— выборочную (эмпирическую) несмещенную дисперсию (1.2),
— стандартное среднее квадратичное отклонение (1.3),
6. Произвести предварительный анализ статистических данных, необходимых для определения закона распределения. Для этого целесообразно
построить таблицу 1.5 центральных моментов:
Таблица 1.6.Расчет центральных моментов
K
1
2
3
4
5
6
xинт i
(xинт i − x)1 mi
(xинт i − x)2 mi
(xинт i − x)3 mi
(xинт i − x)4 mi
Σ=
Σ=
Σ=
Используя таблицу рассчитать:
— коэффициент вариации V (1.4):
— оценку коэффициента асимметрии As (1.5),
— среднее квадратичное асимметрии SA (1.6),
— оценку эксцесса Ex (1.7),
26
— среднее квадратичное эксцесса SE (1.8),
— выборочную моду (середина интервала с наибольшей частотой);
— выборочную медиану Me (1.9).
7. С помощью вычисленных числовых характеристик определить, является ли данное распределение близким к нормальному. Для наглядности
построим еще одну таблицу 1.6:
Таблица 1.7. Параметры закона распределения
Диапазон
𝑥𝑥 ± 𝑆
𝑥𝑥 ± 2𝑆
𝑥𝑥 ± 3𝑆
Нижнее
значение
Верхнее
значение
Реальная частота
Допустимая
частота
68
95
100
Интеграл
Лапласа
68.269
95.450
99.730
Для варианта задания необходимо заполнить второй, третий и четвер-
тый столбцы. Для этого целесообразно воспользоваться вариационным рядом.
Дополнительно рассчитать
As
𝑆𝐴
,
𝐸𝑥
𝑆𝐸
.
Сделать предварительное заключение о нормальности распределения.
8. Построить гистограмму и полигон распределения (пример, рис. 1.1).
9. Построить эмпирическую функцию распределения (пример, рис. 1.2).
Проверить, правильность оценки медианы (сравнить значение в п.6 с полученным из функции (𝐹 (𝑥𝑥𝑃 ) = 0,5).
10. Определить доверительный интервал для математического ожида-
ния μ (1.10).
В технике обычно принимают α = 0,05, при этом P1–α = P0,95 = 95%, а при
n > 30 => t0,05,∞ = Zα = Z0,05 = 1,96.
11. Представить в виде доверительной полосы интервал для математического ожидания графически (например, как на рис. 1.4).
12. Доверительный интервал для дисперсии (1.13) при
P1–α= P0,95 = 95% и n = 30 t0,05,∞= Z0,05 = 1,96 => 0,67 S2 ≤ 𝜎 2 ≤ 1,94 𝑆 2 .
27
13. Представить доверительный интервал для дисперсии при заданных
значениях S и n графически (пример, рис.1.6).
14. Проверить гипотезу о нормальном распределении выборки, воспользовавшись критерием Пирсона. Для этого необходимо заполнить таблицу 1.5, приведенную выше. Значения плотности вероятностей
𝜑 (𝑢𝑖 ) =
1
√2𝜋
𝑢2
𝑒 − 2 можно определить из таблицы приложения П.1.
1.5. СОДЕРЖАНИЕ ОТЧЕТА
1. Название и цель работы. На титульном листе обязательно укажите
номер варианта.
2. Общие сведения должны содержать (очень коротко) понятия:
— генеральной и выборочной совокупности,
— вариационного ряда,
— среднего арифметического и математического ожидания,
— дисперсии и ее оценки,
— точечной и интервальной оценки выборки,
— эмпирического распределения,
— доверительных интервалов,
3. Задание для выполнения лабораторной работы.
4. Все необходимые расчеты, таблицы и графики.
5. Выводы. Конкретно, без общих рассуждений, обобщить результаты
данной работы и сформулировать преимущества и недостатки различных
способов определения параметров.
1.6. КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Что такое одномерная генеральная совокупность и выборка из нее?
2. Как из статистического ряда построить вариационный ряд?
3. Для чего нужна интервальная группировка?
4. Как называется оценка математического ожидания?
28
5. Во сколько раз дисперсия отличается от среднеквадратичного отклонения?
6. Как по кривой распределения определить знак коэффициента ассиметрии?
7. Как называется мера островершинности нормального распределения?
8. По какой формуле определяется выборочная мода?
9. Какой геометрический смысл у выборочной медианы?
10. Какой геометрический смысл имеет площадь под частью эмпирической кривой распределения?
11. Что такое размах выборки?
12. На сколько величина рассеяния больше размаха выборки?
13. Симметричен ли доверительный интервал относительно точечной
оценки дисперсии?
1.7. ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ
1. Результаты измерений значений параметра представлены в табл. 1.7.
Таблица 1.7. Значения измерений параметра выборки
№
x
№
x
№
x
№
x
№
x
№
x
1
8,7
7
8,8
13
9,5
19
9,4
25
9,3
31
9,0
2
8,8
8
9,5
14
8,8
20
9,5
26
8,9
32
8,9
3
9,1
9
8,3
15
9,1
21
8,8
27
9,2
33
9,3
4
9,3
10
9,2
16
8,6
22
8,9
28
9,0
34
8,8
5
9,0
11
8,8
17
8,8
23
8,9
29
9,0
35
9,1
6
9,3
12
9,1
18
9,1
24
9,2
30
8,8
36
8,8
2. Измеренные значения, расположенные в порядке неубывания (возрастания) (табл.1.8).
29
Таблица 1.8. Вариационный ряд
№
x
№
x
№
x
№
x
№
x
№
x
1
8,3
7
8,8
13
8,9
19
9,0
25
9,1
31
9,3
2
8,6
8
8,8
14
8,9
20
9,0
26
9,2
32
9,3
3
8,7
9
8,8
15
8,9
21
9,1
27
9,2
33
9,4
4
8,7
10
8,8
16
8,9
22
9,1
28
9,2
34
9,5
5
8,7
11
8,8
17
9,0
23
9,1
29
9,3
35
9,5
6
8,8
12
8,8
18
9,0
24
9,1
30
9,3
36
9,5
4. Разбивка выборки на интервальные группировки (табл. 1.9).
Таблица 1.9. Параметры группировок
Интервалы группировки
Свыше
До (включительно)
x ( Cек)
x( Cек )
K
1 8,3 (включительно)
2
8,5
3
8,7
4
8,9
5
9,1
6
9,3
8,5
8,7
8,9
9,1
9,3
9,5
Середина интервала
𝑥𝑥инт 𝑖
8,4
8,6
8,8
9,0
9,2
9,4
Частота
mi
1
4
11
9
7
4
Σ=36
4. Основные параметры выборки.
1) Среднее арифметическое (выборочное среднее):
1
1
𝑥𝑥 = ∑𝐾
𝑖=1 𝑚𝑖 𝑥𝑥инт 𝑖 = 36 (1 ∙ 8,4 + 4 ∙ 8,6 + 11 ∙ 8,8 + 9 ∙ 9,0 + 7 ∙ 9,2 + 4 ∙ 9,4) = 8,96.
𝑛
2) Выборочная (эмпирическая) несмещенная дисперсии:
𝑆2 =
1
𝑛−1
1
2
∑𝐾
𝑖=1 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥 ) = 35 (1 ∙ 0,3136 + 4 ∙ 0,1296 + 11 ∙ 0,0256 +
+ 9 ∙ 0,0016 + 7 ∙ 0,576 + 4 ∙ 0,1936) = 0,066.
3) Стандартное среднее квадратичное отклонение:
𝐾
1
𝑆=�
� 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥)2 = �0,066 = 0,257.
𝑛−1
𝑖=1
30
5. Расчет параметров:
— коэффициент вариации V;
— оценка коэффициента асимметрии As;
— среднее квадратичное асимметрии SА,
— оценка эксцесса Ex;
— среднее квадратичное эксцесса SЕ;
— выборочная мода Mo;
— выборочная медиана Me.
1) Вычисление центральных моментов (табл. 1.10).
Таблица 1.10. Расчетная таблица
K 𝑥𝑥инт 𝑖
1
2
3
4
5
6
8,4
8,6
8,8
9,0
9,2
9,4
(𝑥𝑥инт 𝑖 − 𝑥𝑥)1
– 0,56
– 0,36
– 0,16
0,04
0,24
0,44
(𝑥𝑥инт 𝑖 − 𝑥𝑥)2 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥)3 𝑚𝑖 (𝑥𝑥инт 𝑖 − 𝑥𝑥)4 𝑚𝑖
0,3136
0,5184
0,2816
0,0144
0,4032
0,7744
Σ=2,3056
– 0,176
– 0,187
– 0,045
0,0
0,097
0,341
Σ=0,03
0,098
0,067
0,007
0,0
0,023
0,15
Σ=0,345
2) Коэффициент вариации:
𝑉=
𝑆 0,257
=
= 0,029.
8,96
𝑥𝑥
3) Оценка коэффициента асимметрии:
1 𝐾
∑1 (𝑥𝑥инт 𝑖 − 𝑥𝑥 )3 𝑚𝑖 0,03⁄36
𝐴𝑠 = 𝑛
=
= 0,049.
0,017
𝑆3
Среднее квадратичное асимметрии:
6(𝑛 − 1)
= 0,38.
𝑆𝐴 = �
(𝑛 + 1)(𝑛 + 3)
4) Оценка эксцесса:
1 𝐾
∑1 (𝑥𝑥инт 𝑖 − 𝑥𝑥 )4 𝑚𝑖
0,345⁄36
𝐸𝑥𝑥 = 𝑛
−
3
=
− 3 = −0,6.
0,004
𝑆4
31
Среднее квадратичное эксцесса:
𝑆𝐸 = �
24𝑛(𝑛 − 2)(𝑛 − 3)
= 0,70.
(𝑛 − 1)2 (𝑛 + 3)(𝑛 + 5)
5) Выборочная мода – середина интервала с наибольшей частотой:
𝑀𝑜 = 𝑥𝑥инт 3 = 8,8.
6) Выборочная медиана Me. Определяется как величина, относительно
которой выборка делится на две равные по объему части. При интервальной
группировке сначала находят так называемый медианный интервал, номер
которого определяют из неравенств (1.9).
Если медианный интервал четвертый (визуальная оценка), то проверим
условие:
— левее медианного:
� 𝑚𝑖 ≤
𝑖<𝑖𝑀𝑒
𝑛
= 1 + 4 + 11 = 16 < 18.
2
— включая медианный:
𝑛
� 𝑚𝑖 > = 1 + 4 + 11 + 9 = 25 > 18.
2
𝑖≤𝑖𝑀𝑒
Следовательно, медианный интервал четвертый, а
𝑀𝑒 = 𝑥𝑥инт 4 = 9,0.
6. Проверка на соответствие выборки нормальному закону распределения (табл. 1.11).
Таблица 1.11. Определение закона распределения
Диапазон
𝑥𝑥 ± 𝑆
𝑥𝑥 ± 2𝑆
𝑥𝑥 ± 3𝑆
32
Нижнее
значение
8,703
8,446
8,189
Верхнее
значение
9,217
9,474
9,731
Реальная частота
25 ⁄ 36=0,69
35 ⁄ 36=0,97
36 ⁄ 36=1,00
Допустимая
частота, %
68
95
100
Интеграл
Лапласа, %
68,269
95,450
99,730
Графическая интерпретация данной таблицы представлена на рис. 1.8.
Рис. 1.8. Диапазоны среднеквадратичных отклонений
Предварительное заключение о нормальности распределения.
Выборочное распределение близко к нормальному, если:
1. В интервалы 𝑥𝑥 ± 𝑆, 𝑥𝑥 ± 2𝑆, 𝑥𝑥 ± 3𝑆 должны попадать соответственно
приблизительно 68%, 95% и 100% значений выборки. В нашем случае:
𝑥𝑥 ± 𝑆 = 0,69; 𝑥𝑥 ± 2𝑆 = 0,97; 𝑥𝑥 ± 3𝑆 = 1,00, т.е. условия выполняются.
2. Величина коэффициента вариации должна быть V< 0,33. В нашем
случае V = 0,029, т.е. условие выполняется.
3. Оценка эксцесса Ex должна быть близка к нулю. В нашем случае
𝐸𝑥𝑥 = −0,6, 𝑆𝐸 = 0,70. Кроме того
4. Величина
As
𝑆𝐴
коэффициента
𝐸𝑥
S𝐸
= 0,13 < 2, условие выполняется.
= |−0,86| < 2, условие выполняется.
асимметрии
𝐴𝑠 = 0,049,
𝜎𝐴 = 0,38,
5. 𝑥𝑥 = 8,96, Me = 9,0, т.е. 𝑥𝑥 ≈ Me – условие выполняется.
33
Таким образом, можно сделать вывод, что данное распределение близко к нормальному.
Предварительная проверка распределения необходима для целесообразности проведения интервальных исследований. Полная проверка по критерию Пирсона будет проведена при интервальном оценивании.
7. Гистограмма и полигон распределения (рис. 1.9).
Рис. 1.9. Гистограмма и полигон распределения.
8. Эмпирическая функция распределения (Рис. 1.10).
Эмпирическую функцию распределения F(x) получают построением
ступенчатой кривой относительных накопленных частот. Функция имеет
скачки в точках, соответствующих серединам интервалов.
34
Рис. 1.10. Эмпирическая функция распределения
Из рисунка следует, что медианный интервал – четвертый. Значение
Ме = 9,0 (середина четвертого интервала), что подтверждает правильность
предыдущих вычислений.
9. Доверительный интервал для математического ожидания.
Границы доверительного интервала определяются величиной 𝑡𝛼,𝑛−1
При S = 0,257, 𝑥𝑥 = 8,96, n = 36, 𝑡𝛼,𝑛−1 = 2,03 (при α = 0,05, рис. 1.3).
𝑥𝑥 − 𝑡𝛼,𝑛−1
𝑆
√𝑛
0,257
≤ µ ≤ x + t α,n−1
𝑆
√𝑛
.
S
√n
0,257
≤ µ ≤ 8,96 + 2,03
8,96 − 2,03
√36
√36
8,873 ≤ 𝜇 ≤ 9,047
При этом: 𝑡𝛼,𝑛−1
𝑆
√𝑛
= 2,03
0,257
√36
= 0,087
35
10. Доверительная полоса для математического ожидания.
Рис. 1.11. Доверительная полоса для математического ожидания
11. Доверительный интервал для дисперсии определяется выражением:
(𝑛 − 1)𝑆 2
(𝑛 − 1) + 𝑍𝛼 �2(𝑛 − 1)
2
≤𝜎 ≤
(𝑛 − 1)𝑆 2
(𝑛 − 1) − 𝑍𝛼 �2(𝑛 − 1)
При n = 36, S2 = 0.066, P = 95%, Zα = 1,96 (при α = 0,05)
35∙𝑆 2
35+1,96√70
2
≤𝜎 ≤
35∙𝑆 2
35−1,96√70
0,67𝑆 2 ≤ 𝜎 2 ≤ 1,94𝑆 2 ,
0,044 ≤ 𝜎 2 ≤ 0,128.
12. Доверительная полоса для дисперсии.
36
,
Рис. 1.12. Доверительная полоса для дисперсии
13. Проверка гипотезы о нормальном распределении выборки по критерию Пирсона.
2
необходимо заполнить таблицу 1.12:
Для определения 𝜒реал
Таблица 1.12. Проверка гипотезы о распределении
K
1
2
3
4
5
6
mi xинт i
1
4
11
9
7
4
8,4
8,6
8,8
9,0
9,2
9,4
𝑢𝑖 =
xинт i − 𝑥𝑥
𝑆
–2,2
–1,4
–0,6
0,16
0,93
1,7
𝜑(𝑢𝑖 ) =
1
√2𝜋
0,0355
0,1497
0,3332
0,3939
0,2589
0,0940
𝑢2
𝑒− 2
𝑛ℎ
𝜑(𝑢𝑖 )
𝑆
0,99
4,19
9,30
11
7,2
2,63
𝑚𝑖0 =
Следовательно:
(𝑚𝑖 − 𝑚𝑖0 )2
𝑚𝑖0
0,0
0,0
0,3
0,36
0,0
0,7
2
Σ = 𝜒реал = 1,36
2
=1.36,
— значение статистики критерия Пирсона 𝜒реал
— число степеней свободы 𝜈 = 6 − 1 − 2 = 3, уровень значимости
α = 0,05,
37
— по таблице критических точек Пирсона (рис. 1.6, или таблица при2
= 7,81,
ложения П.3) 𝜒кр
2
2
2
2
и 𝜒кр
, 𝜒реал
< 𝜒кр
, т.к. 1,36 < 7,81,
— сравниваем 𝜒реал
— делаем вывод что, данные выборки не противоречат гипотезе о нор-
мальном распределении.
38
2. ЭМПИРИЧЕСКИЕ ИССЛЕДОВАНИЯ ВЫБОРОК С
ПОМОЩЬЮ КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО
АНАЛИЗА
Цель работы: исследование парной статистической выборки для определения корреляционной зависимости и построение статистической модели
технологического процесса в виде уравнения регрессии.
2.1. ОБЩИЕ СВЕДЕНИЯ
Для изучения взаимосвязи явлений и процессов их признаки делятся на
два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называют факторными, или просто факторами. Признаки,
изменяющиеся под действием факторных признаков, называют результативными.
В статистике различают функциональные и стохастические (вероятностные) связи явлений и процессов.
Функциональной называют такую связь, при которой определенному
значению факторного признака соответствует только одно значение результативного.
Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической (вероятностной). Частным случаем стохастической связи является корреляционная связь.
Кроме того, связи между факторами и результатами классифицируются
по степени тесноты, направлению и аналитическому выражению.
По направлению выделяют связь прямую и обратную.
Прямая связь – это такая связь, при которой с увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение)
значений результативного. Например, увеличение температуры способствует
увеличению скорости диффузии.
39
В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по
сравнению с изменением факторного признака. Например, при увеличении
скорости движения уменьшается время перемещения.
По аналитическому выражению выделяют связи прямолинейные линейные и нелинейные.
Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют линейной связью вида: у = а + bх.
Если же связь может быть выражена уравнением какой-либо кривой
линии (параболы, гиперболы и др.), то такую связь называют нелинейной
связью.
Теснота связи показывает меру влияния факторного признака на общую вариацию результативного признака. Количественным критерием оценки тесноты связи является коэффициента корреляции.
Для выявления наличия связи между величинами, ее характера и
направления в статистике используются следующие методы: приведения параллельных данных аналитических группировок, графический, корреляции.
Основным методом изучения статистической взаимосвязи является
статистическое моделирование связи на основе корреляционного и регрессионного анализа.
Корреляция – это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. В статистике принято различать следующие виды корреляции:
— парная корреляция – связь между двумя признаками (результативным и факторным);
40
— частная корреляция – зависимость между результативным и одним
факторным признаками при фиксированном значении других факторных
признаков;
— множественная корреляция – зависимость результативного и двух,
или более факторных признаков, включенных в исследование.
Задачей корреляционного анализа является количественное определение тесноты связи между результативным и факторным признаком. Этот
показатель называется коэффициентом корреляции.
Коэффициент корреляции может принимать значения от –1 до +1. Чем
ближе абсолютное значение к единице, тем сильней связи между признаками. Если абсолютное значение равно единице, то можно говорить о функциональной связи между величинами, то есть одну величину можно выразить
через другую посредством математической функции.
Корреляция связана с регрессией, поскольку первая оценивает силу
(тесноту) статистической связи, вторая исследует ее форму.
Регрессионный анализ заключается в определении аналитического
выражения связи в виде уравнения регрессии.
Регрессией называется зависимость среднего значения случайной величины результативного признака от величины факторного, а уравнением регрессии – уравнение, описывающее корреляционную зависимость между результативным признаком и одним или несколькими факторными.
Основные задачи, рассматриваемые в этой работе:
— статистические методы оценки зависимости между двумя изучаемыми признаками;
— регрессионный анализ, представляющий собой специальный случай
метода наименьших квадратов и служащий анализу влияния независимой переменной на зависимую.
41
2.2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ
2.2.1. Определение коэффициента корреляции
Для характеристики многомерного эмпирического распределения вычисляют его числовые параметры, позволяющие делать выводы о существовании зависимостей между признаками.
Мерой силы (тесноты) и направления связи между двумя переменными x и y, вычисленной по ряду из n пар (𝑥𝑥1 , 𝑦1 ), (𝑥𝑥2 , 𝑦2 ), … (𝑥𝑥𝑛 , 𝑦𝑛 ) является
эмпирический коэффициент корреляции 𝑟𝑥𝑦 , который вычисляется с использованием ковариации:
𝟏
𝒓𝒙𝒚 =
𝒄𝒐𝒗(𝒙, 𝒚)
,
𝑺𝒙 𝑺𝒚
(2.1)
где: 𝒄𝒐𝒗(𝒙, 𝒚) = ∑(𝒙𝒊 − 𝒙)(𝒚𝒊 − 𝒚) – ковариация случайных величин 𝑥𝑥 и 𝑦;
𝒏
𝟏
𝟏
𝒙 = ∑ 𝒙𝒊 ; 𝒚 = ∑ 𝒚𝒊 – оценки математического ожидания 𝑥𝑥 и 𝑦;
𝒏
𝑺𝒙 = �
𝟏
𝒏−𝟏
𝒏
∑(𝒙𝒊 − 𝒙)𝟐 ; 𝑺𝒚 = �
тичных отклонений 𝑥𝑥 и 𝑦.
𝟏
𝒏−𝟏
∑(𝒚𝒊 − 𝒚)𝟐 – оценки среднеквадра-
2.2.2. Доверительный интервал для коэффициента корреляции
Если выборка получена из генеральной совокупности, имеющей дву-
мерное нормальное распределение, то при достаточно больших 𝑛 (𝑛 > 30)
можно получить выражение для определения доверительного интервала ко-
эффициента корреляции 𝑅0 :
𝟏 𝟏 + 𝒓𝒙𝒚
𝟏
𝟏 𝟏 + 𝒓𝒙𝒚
𝟏
𝐭𝐚𝐧𝐡 � 𝐥𝐧
− 𝒁𝜶
� < 𝑹𝟎 < 𝐭𝐚𝐧𝐡 � 𝐥𝐧
+ 𝒁𝜶
�.
𝟐 𝟏 − 𝒓𝒙𝒚
𝟐 𝟏 − 𝒓𝒙𝒚
√𝒏 − 𝟑
√𝒏 − 𝟑
(2.2)
Из таблицы П.2 распределения Стьюдента для различных значений
α = 1– γ можно определить 𝑍𝛼 . При достаточно большом количестве измере-
ний (𝑛 > 30) значения 𝑍𝛼 практически совпадает со значениями tα,∞ , которые приведены в таблице 2.1:
42
Таблица 2.1. Коэффициенты Стьюдента для tα,∞ = 𝑍𝛼
α
0,10
0,05
0,02
0,01
0,002
zα= t α,∞
1,64
1,96
2,33
2,58
3,09
Иногда доверительный интервал для 𝑅0 удобно вычислять с помощью
таблиц гиперболического тангенса из соотношения:
𝐀𝐫𝐜𝐭𝐡 𝒓𝒙𝒚 − 𝒁𝜶
𝟏
√𝒏 − 𝟑
< 𝐀𝐫𝐜𝐭𝐡 𝑹𝟎 < 𝐀𝐫𝐜𝐭𝐡 𝒓𝒙𝒚 + 𝒁𝜶
𝟏
√𝒏 − 𝟑
Соответствующая таблица П.4. приведена в приложении.
.
(2.3)
Доверительный интервал для 𝑅0 целесообразно определять при доста-
точно больших 𝑛 (𝑛 > 30). В противном случае необходимо проверять на
значимость коэффициент корреляции.
2.2.3. Проверка значимости коэффициента корреляции
(проверка гипотезы зависимости)
Значимость вычисленного коэффициента корреляции представляет собой проверку следующей гипотезы: существенно ли (значимо ли) отличается
от нуля рассчитанный эмпирический коэффициент корреляции? Проверка
производится с помощью t-критерия Стьюдента.
По таблице t-распределения необходимо найти критическое значение
критерия (𝑡кр ) при заданном уровне значимости α и степени свободы ν. В
нашем случае число степеней свободы 𝜈 = 𝑛 − 2.
Реальное значение критерия 𝑡реал определяется по формуле:
𝒕реал =
𝒓𝒙𝒚 √𝒏 − 𝟐
�𝟏 − 𝒓𝟐𝒙𝒚
.
(2.4)
Если вычисленное по формуле (2.4) значение 𝑡реал по модулю окажется
меньше чем табличное 𝑡кр , то зависимости между случайными величинами
𝑥𝑥 и 𝑦 нет. В противном случае, экспериментальные данные не противоречат
гипотезе о зависимости случайных величин.
43
2.2.4. Модели регрессионного анализа
Во многих ситуациях интерес представляет зависимость между двумя
признаками продукта, материала, процесса и т.п. При одновременном изучении двух признаков получают двумерную выборку (𝑥𝑥𝑖 , 𝑦𝑖 ), 𝑖 = 1, … , 𝑛. Пары
точек (𝑥𝑥𝑖 , 𝑦𝑖 ) наносят на координатную сетку, получая так называемое “облако точек”, которое дает предварительное представление о рассеянии и
форме зависимости между признаками.
На основании регрессионного анализа наблюдаемое "облако" аппроксимируется уравнением регрессии. Теоретически уравнение регрессии является условным математическим ожиданием одной случайной переменной
(зависимой), при условии, что вторая переменная (независимая) принимает
заданные (фиксированные) значения. Таким образом, регрессия это всегда
«зависимость в среднем». Если эта зависимость задается уравнением прямой
𝑦 = 𝑎 + 𝑏𝑥𝑥, то говорят о линейной регрессии или линейной регрессионной
модели. Параметры 𝑎 и 𝑏 часто оцениваются, используя метод наименьших
квадратов.
Сущность этого метода состоит в минимизации суммы квадратических
отклонений между наблюдаемыми и расчетными величинами. Расчетные величины находятся по соответствующему уравнению – уравнению регрессии.
Чем меньше квадраты расстояние между полученными эмпирическими значениями и расчетными, тем более точен прогноз, построенный на основе
уравнения регрессии.
Если обе переменные принадлежат двумерному нормальному распределению, то уравнение регрессии может быть записано в виде уравнений
прямых линий:
𝒚=𝒚+𝒓
𝒙=𝒙+𝒓
44
𝑺𝒚
(𝒙 − 𝒙 )
𝑺𝒙
𝑺𝒙
(𝒚 − 𝒚 )
𝑺𝒚
(2.5)
Прямые всегда пересекаются в точке (𝑥𝑥, 𝑦) и образуют «ножницы»,
причем тем уже, чем больше |𝑟|. При |𝑟| = 1 обе прямые регрессии совпада-
ют, а при 𝑟 = 0 прямые регрессии перпендикулярны осям координат (пере-
менные независимы).
Во многих случаях графическое представление данных, т.е. "облако"
точек, показывает, что зависимость между переменными не может быть описана прямой линией. В этом случае можно попробовать представить искомое
уравнение в виде уравнения второго порядка, либо другим способом (например, методом эквивалентной замены факторного параметра).
2.2.5. Построение линейной регрессионной модели методом
наименьших квадратов
Как уже отмечалось, уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей)
зависимость между случайными величинами 𝑥𝑥 и 𝑦. Если считать, что вели-
чина 𝑥𝑥 свободная, а 𝑦 зависимая от 𝑥𝑥, то уравнение регрессии соответствует
уравнению прямой:
𝒚 = 𝒂 + 𝒃𝒙 .
(2.6)
Если ранее проводился корреляционнй анализ, то значения оценок
среднеквадратичных отклонений 𝑆𝑥 , 𝑆𝑦 и коэффициента корреляции 𝑟𝑥𝑦 известны. Коэффициент 𝑏 удобно рассчитать по формуле:
𝒃 = 𝒓𝒙𝒚
𝑺𝒚
.
𝑺𝒙
(2.7)
При неизвестных 𝑆𝑥 , 𝑆𝑦 , 𝑟𝑥𝑦 , т.е. если корреляционнй анализ не прово-
дился, следует пользоваться формулой:
𝒃=
∑ 𝒙𝒊 𝒚𝒊 − 𝒏 ∙ 𝒙 ∙ 𝒚
𝟐
∑ 𝒙𝟐𝒊 − 𝒏 ∙ 𝒙
.
В обоих случаях коэффициент 𝑎 рассчитывают по формуле:
𝒂=𝒚−𝒃∙𝒙.
(2.8)
(2.9)
45
Коэффициент 𝑏 называют коэффициентом линейной регрессии. В не-
которых источниках 𝑎 называют постоянным коэффициентом регрессии, а
𝑏 –соответственно переменным.
2.2.6. Определение качества аппроксимации
Мера ошибки, которая получается при оценке или прогнозировании 𝑦
по заданным значениям 𝑥𝑥 с помощью уравнения регрессии, называется стан-
дартной ошибкой оценивания или стандартной ошибкой предсказания.
При проведенном ранее корреляционном анализе значения 𝑆𝑦 и 𝑟𝑥𝑦 из-
вестны. Тогда погрешности предсказания 𝑦 по заданному значению 𝑥𝑥 вычисляются по формулам:
𝑺𝒚⁄𝒙 = 𝑺𝒚 �𝟏 − 𝒓𝟐𝒙𝒚 ;
(2.10)
𝑺𝒚⁄𝒙
𝜹𝒚⁄𝒙 =
∙ 𝟏𝟎𝟎% .
𝒚
При этом величина 𝛿𝑦⁄𝑥 называется относительной погрешностью, а
𝑆𝑦⁄𝑥 – абсолютной погрешностью. Иногда величину 𝑆𝑦⁄𝑥 еще называют оста-
точным средним квадратическим отклонением, оно характеризует уход величины 𝑦 от линии регрессии при фиксированном (заданном) значении 𝑥𝑥.
Так как значимость коэффициента корреляции проверялась на этапе
корреляционного анализа, то нет необходимости заниматься проверкой значимости коэффициента регрессии. При необходимости можно сразу перейти
к графической интерпретации исследований.
Если нет данных корреляционного анализа, то определить стандартную
ошибку аппроксимации (остаточное среднее квадратичное отклонение) можно по формуле:
𝟏
𝑺𝒚⁄𝒙 = �
�(𝒚𝒊 − 𝒂 − 𝒃 ∙ 𝒙𝒊 )𝟐 .
𝒏−𝟐
(2.11)
Для того, чтобы проверить значимость построенной линейной регрессионной модели, осуществляется проверка значимости коэффициента урав46
нения регрессии b. Другими словами, проверяется отличается ли статистически значимо оценка коэффициента уравнения регрессии от b нуля. Проверка
проводится с помощью t-критерия Стьюдента. Реальное значение 𝒕реал
t-критерия определяется по формулам:
𝒕реал =
𝑺𝒃 = �
𝒃
,
𝑺𝒃
𝒏 ∙ 𝑺𝟐𝒚𝒙
𝒏 ∙ ∑ 𝒙𝟐𝒊 − (∑ 𝒙𝒊 )𝟐
(2.12)
Критическое значение критерия (𝑡кр ) при заданном уровне значимости
α и степени свободы ν определяется по таблице t-распределения. В данном
случае число степеней свободы 𝜈 = 𝑛 − 2.
Если вычисленное по формуле значение 𝑡реал удовлетворяет условию
�𝑡реал � > 𝑡кр , то 𝑏 значимо отличается от нуля, т.е. корреляция существует.
2.2.7. Диаграмма рассеяния (корреляционное поле)
и график линии регрессии
Диаграмма рассеяния это графическое изображение соответствующих
пар (𝑥𝑥𝑖 , 𝑦𝑖 ) в виде точек на плоскости в прямоугольных координатах с осями
𝑥𝑥 и 𝑦. Корреляционное поле является одним из графических представлений
связанной (парной) выборки. В той же системе координат строится и график
линии регрессии. Следует выбирать масштабы и начальные точки на осях
так, чтобы диаграмма была максимально наглядной.
Следует иметь в виду, что линия регрессии всегда (с учетом погрешностей измерений и вычислений) проходит через точку средних значений с координатами ( 𝑥𝑥, 𝑦 ).
Если соединить экспериментальные точки отрезками прямых, то сум-
марная площадь между линией регрессии и полученной ломаной должна
быть равна нулю. То есть площади над линией регрессии и под ней должны
47
быть равны, потому что аппроксимация проводилась методом наименьших
квадратов.
Так как мы имеем дело с действительными числами и неизбежно их
округление, то хорошим считается результат, при котором теоретические и
экспериментальные данные различаются менее, чем на 10%.
Пример построения диаграммы рассеяния и графика линии регрессии
будет рассмотрен ниже в разделе «Пример выполнения лабораторной работы».
2.3. ЗАДАНИЕ ДЛЯ ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ
Произвести корреляционный и регрессионный анализ двумерной выборки из генеральной совокупности по двум количественным характеристикам (признакам) 𝑥𝑥 и 𝑦. Выборка представлена в виде семи пар случайных величин (𝑥𝑥𝑖 , 𝑦𝑖 ).
Величина 𝑥𝑥 – факторный признак, представляющий собой диаметр из-
делия.
Величина 𝑦 – результативный признак, представляющий собой время
прохождения изделием лабиринта, имитирующего технологический процесс.
Для выполнения поставленной задачи необходимо:
1. Измерить время прохождения семи изделий по лабиринту. Изделия
изготовлены из одного и того же материала с одинаковыми допусками. Их
диаметры: 13,5; 14; 14,5; 15; 15,5; 16; 16,5 мм. Перемещение изделий в рабочей зоне происходит с помощью манипулятора. Время фиксируется с помощью контроллера робототехнической системы FANUC с точностью 0,1 с.
2. Составить таблицу двумерной выборки �𝑥𝑥𝑖 , 𝑦𝑖 � объемом семь пар.
3. Рассчитать средние арифметические значения (оценки математических ожиданий).
4. Составить расчетную таблицу, в которой представить значения:
𝑥𝑥𝑖2 , 𝑦𝑖2 , (𝑥𝑥𝑖 − 𝑥𝑥 ), (𝑦𝑖 − 𝑦), (𝑥𝑥𝑖 − 𝑥𝑥 )2 , (𝑦𝑖 − 𝑦)2 и их суммы.
5. Определить среднеквадратичные отклонения 𝑆𝑥 , 𝑆𝑦 .
48
6. Определить значение ковариации 𝑐𝑜𝑣 (𝑥𝑥, 𝑦).
7. Рассчитать эмпирический коэффициент корреляции с использовани-
ем величины ковариации 𝑟𝑥𝑦 .
8. Для проверки значимости коэффициента корреляции определить:
— реальную величину критерия распределения Стьюдента 𝑡реал .
— критическое значение критерия (𝑡кр ) при уровне значимости α и сте-
пени свободы 𝜈 = 𝑛 − 2. Уровень значимости α предлагается назначить са-
мостоятельно.
и 𝑡кр .
9. Сделать вывод о зависимости случайных величин 𝑥𝑥 и y, сравнив 𝑡реал
10. Вычислить коэффициенты 𝑎 и 𝑏 уравнения линейной регрессии
𝑦 = 𝑎 + 𝑏𝑥𝑥 методом наименьших квадратов.
11. Определить качество аппроксимации, вычислив абсолютную и от-
носительную погрешность.
12. Определить остаточное среднее квадратичное отклонение, если
корреляционный анализ не проводился.
13. Если значимость коэффициента корреляции не проверялась, следует проверить значимость коэффициента 𝑏 уравнения линейной регрессии
𝑦 = 𝑎 + 𝑏𝑥𝑥. Для этого:
— определить реальное значение t-критерия для коэффициента 𝑏.
— определить критическое значение критерия (𝑡кр ) при заданном
уровне значимости α и степени свободы
распределения.
𝜈 = 𝑛 − 2 из таблицы t-
— сравнить 𝑡реал и 𝑡кр . Сделать вывод о зависимости случайных ве-
личин 𝑥𝑥 и y.
14. Построить диаграмму рассеяния (корреляционное поле) и график
линии регрессии.
49
2.4. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
1. Измерить время прохождения деталей по лабиринту, который имитирует технологический процесс. Для этого использовать промышленный
робот FANUC.
2. Составить таблицу измерений связанной выборки из семи пар значений (𝑥𝑥𝑖 , 𝑦𝑖 ).
Таблица 2.2. Значения парной выборки
№
1
2
3
4
5
6
7
Σ
𝑥𝑥 (диаметр)
𝑦 (время)
𝑥𝑥 ∙ 𝑦
13,5
14
14,5
15
15,5
16
16,5
105
3. Рассчитать средние арифметические значения (оценки математических ожиданий):
1
𝑥𝑥 = ∑ 𝑥𝑥𝑖 =
𝑛
1
105
7
𝑦 = ∑ 𝑦𝑖 ;
𝑛
= 15;
4. Составить расчетную таблицу 2.3.
Таблица 2.3. Параметры выборки
№
1
2
3
4
5
6
7
Σ
𝑥𝑥𝑖
𝑦𝑖
𝑥𝑥𝑖2
𝑦𝑖2
5. Определить 𝑆𝑥 , 𝑆𝑦 :
𝑆𝑥 = �
1
𝑛−1
(𝑥𝑥𝑖 − 𝑥𝑥)
(𝑦𝑖 − 𝑦)
∑(𝑥𝑥𝑖 − 𝑥𝑥)2 ;
𝑆𝑦 = �
6. Определить значение ковариации:
50
𝑐𝑜𝑣 (𝑥𝑥, 𝑦) =
(𝑥𝑥𝑖 − 𝑥𝑥)2
1
𝑛−1
∑(𝑦𝑖 − 𝑦)2 .
1
�(𝑥𝑥𝑖 − 𝑥𝑥 )(𝑦𝑖 − 𝑦).
𝑛
(𝑦𝑖 − 𝑦)2
7. Рассчитать эмпирический коэффициент корреляции с использованием величины ковариации (2.1):
8. Для проверки значимости коэффициента корреляции определить реальную величину критерия распределения Стьюдента (2.4).
9. По таблице t-распределения найти критическое значение критерия
(𝑡кр ) при уровне значимости α и степени свободы 𝜈 = 𝑛 − 2. (Таблица П.2
приложения).
10. Сравнить 𝑡реал и 𝑡кр . Сделать вывод о зависимости случайных ве-
личин 𝑥𝑥 и y.Если:
�𝑡реал � < 𝑡кр – зависимости между случайными величинами 𝑥𝑥 и 𝑦 нет,
�𝑡реал � > 𝑡кр – между величинами 𝑥𝑥 и 𝑦 существует корреляционная за-
висимость.
11. Вычислить коэффициенты 𝑎 и 𝑏 уравнения линейной регрессии
𝑦 = 𝑎 + 𝑏𝑥𝑥 методом наименьших квадратов:
𝑏 = 𝑟𝑥𝑦
𝑆𝑦
𝑆𝑥
; или 𝑏 =
∑ 𝑥𝑖 𝑦𝑖 −𝑛∙𝑥∙𝑦
∑ 𝑥𝑖2 −𝑛∙𝑥
2
; 𝑎 = 𝑦 − 𝑏 ∙ 𝑥𝑥 .
Коэффициенты 𝑎 и 𝑏 желательно рассчитать по двум формулам и
сравнить результаты. Они не должны значимо отличаться друг от друга.
12. Определить качество аппроксимации, вычислив при этом величину
𝑆𝑦⁄𝑥 – абсолютную погрешность (остаточное среднее квадратическое откло-
нение) и 𝛿𝑦⁄𝑥𝑥 – относительную погрешность:
2
𝑆𝑦⁄𝑥 = 𝑆𝑦 �1 − 𝑟𝑥𝑦
;
𝛿𝑦⁄𝑥 =
𝑆𝑦⁄𝑥
𝑦
∙ 100% .
13. Если корреляционный анализ не проводился, то для определения
остаточного среднего квадратичного отклонения заполнить таблицу 2.4.
51
Таблица 2.4. Характеристики качества аппроксимации
№
𝑥𝑥𝑖
1
2
3
4
5
6
7
Σ
муле:
𝑎
𝑦𝑖
𝑏
(𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2
𝑏 ∙ 𝑥𝑥𝑖
14. Определить остаточное среднее квадратичное отклонение по фор1
𝑆𝑦⁄𝑥 = �
�(𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2 .
𝑛−2
В этом случае значимости коэффициента корреляции не проверялась.
Поэтому следует проверить значимость коэффициента 𝑏 уравнения линейной
регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥.
15. Определить 𝑡реал – реальное значение t-критерия для коэффициента
𝑏 по формулам:
𝑆𝑏 = �
2
𝑛∙𝑆𝑦𝑥
𝑛∙∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2
;
𝑡реал =
𝑏
𝑆𝑏
.
16. Из таблицы t-распределения П.2 определить критическое значение
критерия (𝑡кр ) при заданном уровне значимости α и степени свободы
𝜈 =𝑛−2
17. Сравнить 𝑡реал и 𝑡кр . Сделать вывод о зависимости случайных вели-
чин 𝑥𝑥 и y. Если:
�𝑡реал � < 𝑡кр – зависимости между случайными величинами 𝑥𝑥 и 𝑦 нет,
�𝑡реал � > 𝑡кр – между величинами 𝑥𝑥 и 𝑦 существует корреляционная за-
висимость.
18. Построить диаграмму рассеяния (корреляционное поле) и график
линии регрессии.
52
2.5. СОДЕРЖАНИЕ ОТЧЕТА
1. Название и цель работы. На титульном листе обязательно укажите
номер варианта.
2. Общие сведения должны содержать (очень коротко) понятия:
— корреляции и регрессии,
— задачи корреляционного и регрессионного анализа,
— смысл коэффициента корреляции,
— модели регрессионного анализа,
— аппроксимация методом наименьших квадратов,
— качество аппроксимации,
— определение понятий корреляционного поля (диаграммы рассеяния).
3. Задание для выполнения лабораторной работы.
4. Все необходимые расчеты, таблицы и графики.
5. Выводы. Конкретно, без общих рассуждений, обобщить результаты
данной работы и сформулировать преимущества и недостатки различных
способов определения параметров.
2.6. КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Что такое факторные и результативные признаки?
2. Чем отличается функциональная и корреляционная связь?
3. Какие признаки у линейной связи?
4. Что является количественным критерием оценки тесноты связи?
5. Чем характеризуются виды корреляции (парная, частная, множественная)?
6. Какие основные задачи корреляционного анализа?
7. Чем отличается корреляционный и регрессионный анализ?
8. Какие параметры влияют на доверительный интервал коэффициента
корреляции?
53
9. Какими способами можно определить коэффициенты уравнения регрессии?
10. Что означает понятие качество аппроксимации?
11. Как по графику линии регрессии и диаграмме рассеяния определить
достоверность аппроксимации?
12. В каких координатах строится корреляционное поле и график линии регрессии?
2.7. ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ
1. Результаты измерений представлены в таблице 2.5.
Таблица 2.5 Параметры парной выборки
№
𝑥𝑥 (диаметр)
𝑦 (время)
𝑥𝑥 ∙ 𝑦
1
13,5
8,7
117,45
2
14
9,0
126,0
3
14,5
9,0
130,5
4
15
9,0
135,0
5
15,5
9,1
141,05
6
16
9,3
148,8
7
16,5
9,3
153,45
Σ
105
63,4
952,25
2. Средние арифметические значения 𝑥𝑥, 𝑦, 𝑥𝑥𝑦 (оценки математических
ожиданий):
1
𝑥𝑥 = ∑ 𝑥𝑥𝑖 =
𝑛
105
7
1
= 15;
1
𝑥𝑥𝑦 = ∑(𝑥𝑥𝑖 𝑦𝑖 ) =
𝑛
3. Расчетная таблица 2.6:
𝑦 = ∑ 𝑦𝑖 =
𝑛
952,25
7
63,4
7
= 136,04.
= 9,06;
Таблица 2.6. Определение параметров выборки
№
1
𝑥𝑥𝑖
13,5
𝑦𝑖
8,7
𝑥𝑥𝑖2
182,25
𝑦𝑖2
75,69
(𝑥𝑥𝑖 − 𝑥𝑥)
– 1,5
(𝑦𝑖 − 𝑦)
– 0,36
(𝑥𝑥𝑖 − 𝑥𝑥)2
2,25
(𝑦𝑖 − 𝑦)2
2
14,0
9,0
196,0
81,0
– 1,0
– 0,06
1,0
0,0
3
14,5
9,0
210,25
81,0
– 0,5
– 0,06
0,25
0,0
4
15,0
9,0
225,0
81,0
0,0
– 0,06
0,0
0,0
5
15,5
9,1
240,25
82,81
0,5
0,04
0,25
0,0
6
16,0
9,3
256,0
86,49
1,0
0,24
1,0
0,06
7
16,5
9,3
272,25
86,49
1,5
0,24
2,25
0,06
Σ
105,0
63,4
1582,0
574,48
7,0
0,25
54
0,13
4. Определение 𝑆𝑥 , 𝑆𝑦 :
𝑆𝑥 = �
𝑆𝑦 = �
1
𝑛−1
1
𝑛−1
1
∑(𝑥𝑥𝑖 − 𝑥𝑥)2 = � ∙ 7 = 1,08;
6
1
∑(𝑦𝑖 − 𝑦)2 = � ∙ 0,25 = 0,2.
6
5. Определение значения ковариации:
1
1
�(𝑥𝑥𝑖 − 𝑥𝑥 )(𝑦𝑖 − 𝑦) = (0,54 + 0,06 + 0,02 + 0,24 + 0,36) = 0,174
𝑛
7
6. Эмпирический коэффициент корреляции:
𝑐𝑜𝑣 (𝑥𝑥, 𝑦) =
𝑐𝑜𝑣(𝑥𝑥, 𝑦)
0,174
=
= 0,8.
1,08 ∙ 0,2
𝑆𝑥 𝑆𝑦
Коэффициент корреляции достаточно высок. Тем не менее, проверим
𝑟𝑥𝑦 =
его на значимость по t-критерию.
7. Определить реальную величину критерия распределения Стьюдента:
𝑡реал =
𝑟𝑥𝑦 √𝑛 − 2
=
0,8√5
= 2,98.
2
2
1
−
𝑟
�
�1 − 0,8
𝑥𝑦
8. Критическое значение критерия (𝑡кр ) при уровне значимости α = 0,05
и степени свободы 𝜈 = 7 − 2 = 5 (П.2, или табл. 2.7 в тексте).
Таблица 2.7.Фрагмент таблицы Стьюдента
ν
5
Уровень значимости α (двусторонняя область)
0,10
0,05
0,02
0,01
0,002
0,001
2,0150
2,5706
3,3649
4,0321
5,8934
6,8688
Критическое значение распределения Стьюдента 𝑡кр = 2,5706
9. Сравнить 𝑡реал = 2,98, 𝑡кр = 2,5706. Следовательно, �𝑡реал � > 𝑡кр –
между величинами (𝑥𝑥 , 𝑦) существует корреляционная зависимость.
10. Вычисление коэффициенты 𝑎 и 𝑏 уравнения линейной регрессии
𝑦 = 𝑎 + 𝑏𝑥𝑥 :
— для случая проведения корреляционного анализа:
𝑏 = 𝑟𝑥𝑦
𝑆𝑦
𝑆𝑥
= 0,8
0,2
1,08
= 0,148; 𝑎 = 𝑦 − 𝑏 ∙ 𝑥𝑥 = 9,06 − 0,148 ∙ 15 = 6,84.
— в случае отсутствия корреляционного анализа:
55
𝑏=
∑ 𝑥𝑖 𝑦𝑖 −𝑛∙𝑥∙𝑦
2
∑ 𝑥𝑖2 −𝑛∙𝑥
=
952,25−7∙15∙9,06
1582−7∙225
= 0,136; 𝑎 = 𝑦 − 𝑏 ∙ 𝑥𝑥 = 9,06 − 0,136 ∙ 15 = 7,02.
* Все входящие в формулы параметры уже расчитаны ранее в п.п. 1 – 4.
Коэффициенты 𝑎 и 𝑏 рассчитанные по разным формулам отличаются
друг от друга менее, чем на 10%.
11. Определение абсолютной (остаточное среднее квадратическое отклонение) и относительной погрешности аппроксимации при проведенном
корреляционном анализе:
2 = 0,2�1 − 0,82 = 0,12
𝑆𝑦⁄𝑥 = 𝑆𝑦 �1 − 𝑟𝑥𝑦
𝑆𝑦⁄𝑥
0,12
∙ 100% =
∙ 100% = 1,3%
9,06
𝑦
Качество аппроксимации хорошее.
𝛿𝑦⁄𝑥 =
12. Определить остаточное среднее квадратическое отклонение. Значения 𝑎 и 𝑏 следует брать для случая отсутствия корреляционного анализа.
Таблица 2.8. Параметры оценки качества аппроксимации
№
1
2
3
4
5
6
7
Σ
𝑥𝑥𝑖
13,5
14,0
14,5
15,0
15,5
16,0
16,5
105
𝑦𝑖
8,7
9,0
9,0
9,0
9,1
9,3
9,3
63,4
𝑎
7,05
7,05
7,05
7,05
7,05
7,05
7,05
𝑏
0,136
0,136
0,136
0,136
0,136
0,136
0,136
𝑏 ∙ 𝑥𝑥𝑖
1,836
1,904
1,975
2,040
2,108
2,176
2,244
(𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2
0,0346
0,0021
0,0006
0,0081
0,0034
0,0055
0,0
0,0543
13. Остаточное среднее квадратическое отклонение, если корреляционный анализ не проводился:
1
1
�(𝑦𝑖 − 𝑎 − 𝑏 ∙ 𝑥𝑥𝑖 )2 = � ∙ 0,0543 = 0,104,
𝑆𝑦⁄𝑥 = �
𝑛−2
5
𝑆𝑦⁄𝑥
0,104
𝛿𝑦⁄𝑥 =
∙ 100% =
∙ 100% = 1,0%.
9,09
𝑦
Качество аппроксимации хорошее.
56
В этом случае значимости коэффициента корреляции не проверялась.
Поэтому следует проверить значимость коэффициента 𝑏 уравнения линейной
регрессии 𝑦 = 𝑎 + 𝑏𝑥𝑥.
14. Реальное значение t-критерия для коэффициента 𝑏:
2
𝑛 ∙ 𝑆𝑦𝑥
7 ∙ 0,1042
0,0757
�
�
𝑆𝑏 = �
=
=
= 0,04;
2
2
7 ∙ 1582 − 105
49
𝑛 ∙ ∑ 𝑥𝑥𝑖 − (∑ 𝑥𝑥𝑖 )2
𝑡реал =
𝑏
𝑆𝑏
=
0,136
0,04
= 3,4.
15. Критическое значение критерия (𝑡кр ) при уровне значимости α=0,05
и степени свободы 𝜈 = 𝑛 − 2 = 5 было определено в п. 8. 𝑡кр = 2,5706.
16. Сравнить 𝑡реал = 3,4, 𝑡кр = 2,5706. Следовательно, �𝑡реал � > 𝑡кр –
между величинами (𝑥𝑥 , 𝑦) существует тесная корреляционная зависимость.
17. Диаграмма рассеяния (корреляционное поле) и графики линий ре-
грессии представлен на рис. 2.1.
Рис 2.1. Диаграмма рассеяния и линии регрессии
(итоговый график)
57
Линия регрессии 1 соответствует уравнению 𝑦 = 6,84 + 0,148𝑥𝑥, т.е. ко-
эффициенты уравнения рассчитывались после проведения корреляционного
анализа. При этом проверялась достоверность значения коэффициента корреляции.
Линия регрессии 2 соответствует уравнению 𝑦 = 7,02 + 0,136𝑥𝑥, т.е.
коэффициенты уравнения рассчитывались непосредственно по результатам
выборки. При этом проверялась значимость коэффициента регрессии 𝑏.
Линии регрессии 1 и 2 практически совпадают друг с другом. К тому
же рассчитанные средние значения 𝑥𝑥 = 15; 𝑦 = 9,06 подтверждаются графически (показано на графике).
Погрешности аппроксимации абсолютной (остаточное среднее квадра-
тичное отклонение) и относительной проверялись в обоих случаях. При этом
качество аппроксимации хорошее, что наглядно следует из рисунка. То есть
площади над линией регрессии и под ней примерно равны. На рисунке эти
области выделены цветом.
58
3. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА ИЗМЕРЕНИЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА
Цель работы: освоение способов определения количества опытов для
обеспечения требуемой точности измерений; получение практических навыков проведения последовательного эксперимента.
3.1. ОБЩИЕ СВЕДЕНИЯ
При планировании эксперимента необходимо определить цели каждого
эксперимента, число серий и количество измерений в каждой серии, достижение оптимума соотношения экономии материалов и адекватности проведенных измерений. Каждое измерение это затраты времени и ресурсов (трудовых, материальных, финансовых). Особенно это критично, если измерения
связаны с разрушающим контролем.
Измерения делятся на прямые и косвенные. При прямых измерениях
определяемая величина сравнивается с единицей измерения непосредственно
с помощью измерительного прибора. При косвенных измерениях определяемая величина вычисляется по результатам прямых измерений других величин, с которыми она связана функциональной зависимостью.
Измерения характеризуются, в частности, точностью. Термин «точность измерения», т.е. степень приближения результатов измерения к некоторому действительному значению, используется для качественного сравнения измерительных операций. Для количественной оценки используется понятие «погрешность (ошибка) измерений». Эти термины тесно связаны друг
с другом: чем меньше погрешность, тем выше точность. Таким образом, погрешностью измерения называется разность между истинным значением
измеряемой величины и результатом измерения.
Погрешности измерений делятся на систематические и случайные.
Систематические погрешности это погрешности, которые сохраняют
величину и знак от опыта к опыту, при равноточных измерениях.
59
Случайные погрешности это погрешности, изменяющие свою величину или знак от опыта к опыту, при измерениях, выполненных одинаковым
образом и при одинаковых условиях. Случайные погрешности обуславливаются большим числом случайных причин, действующих в каждом отдельном
измерении различным, неизвестным образом.
Все это необходимо учитывать при проведении эксперимента.
Существует два основных варианта проведения эксперимента:
1. Достоверные значения параметров распределения получают при
фиксированном числе опытов. Такой вариант рассматривался в работе 1.
2. Статистические параметры функции распределения определяются с
заданной точностью при минимальном объёме опытов.
В любом случае необходимо учитывать случайные ошибки опыта. Для
уменьшения влияния таких ошибок опыты повторяют и вычисляют среднее
арифметическое значение. Причем количество необходимых повторений зависит от среднего квадратичного отклонения измерений и заданного коэффициента доверия полученного результата.
Под надежностью опыта понимают вероятность получения тех же результатов при новых измерениях этой же величины в тех же условиях.
Из теории вероятностей известно, что чем больше относительные отклонения результатов и чем большую достоверность результатов эксперимента желательно получить, тем больше должно быть произведено повторений опыта. Наиболее удобным образом для практического использования эта
зависимость установлена В.И. Романовским. На основе методики Романовского Рожковым и Неверовым (2014) построена таблица, позволяющая определить число опытов с требуемыми доверительными параметрами и известным средним квадратичным отклонением измеряемой величины, которая
устанавливается по данным предварительных экспериментов.
В некоторых случаях для определения количества измерений можно
пренебречь распределением Стьюдента и пользоваться методами анализа параметров нормального распределения Гаусса. Анализируя данные коэффици60
ентов t-распределения (таблица П.2), можно сделать предварительный вывод,
что при уровне доверительной вероятности 68% нужно сделать более чем 10
измерений, более чем 30 измерений при уровне доверительной вероятности
95% и более чем 50 измерений при уровне доверительной вероятности 99%
3.2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ
3.2.1. Погрешность однократных измерений
По количеству проводимых опытов, связанных с измерениями, можно
разделить на многократные и однократные. Измерения называют однократными, когда для получения значения некоторой физической величины в
опыте проводят только одно измерение. Измерения называют многократными, если для получения значения физической величины выполняют несколько измерений одними и теми же приборами при одних и тех же условиях.
При единичных (однократных) измерениях существует определенная
вероятность получить неточный результат. Эта вероятность связана, в частности, с точностью используемых измерительных приборов. При однократных измерениях случайная величина подчиняется равномерному распределению, при этом различные значения случайной величины появляются с одинаковой вероятностью (рис. 3.1).
Рис. 3.1. Равномерное распределение случайной величины
61
Плотность вероятности f(x) случайной величины x имеет постоянное
значение в некотором интервале (a, b) и равна нулю вне этого интервала.
при x < a
0,
f(x) =
𝟏
𝒃−𝒂
,
0,
при a < x < b
(3.1)
при x > b
Среднее арифметическое для равномерного закона распределения :
∞
𝒃
−∞
𝒂
𝟏
𝒂+𝒃
� 𝒙𝒅𝒙 =
𝒙 = � 𝒙𝒇(𝒙)𝒅𝒙 =
.
𝒃−𝒂
𝟐
(3.2)
Учитывая что 𝑎 = 𝑥𝑥 − 𝑑; 𝑏 = 𝑥𝑥 + 𝑑, плотность вероятности в интерва-
ле (a, b):
𝒇(𝒙) =
𝟏
𝟏
=
.
𝒃 − 𝒂 𝟐𝒅
(3.3)
Дисперсия для равномерного распределения:
∞
𝟐
𝟐
𝝈 = � �𝒙 − 𝒙� 𝒇(𝒙)𝒅𝒙 ,
−∞
𝒃
𝟏 𝒙+𝒅
𝟐
(
)
(
𝟏
𝒅𝟐
𝟐
� 𝒙 − 𝒙 𝒅𝒙 =
�
𝝈 =
𝒙 − 𝒙) 𝒅𝒙 =
.
𝒃−𝒂 𝒂
𝟐𝒅 𝒙−𝒅
𝟑
(3.4)
𝒅
(3.5)
𝟐
Среднее квадратичное отклонение:
𝝈 = � 𝝈𝟐 =
√𝟑
= 𝟎, 𝟓𝟕𝟕 ∙ 𝒅.
Обратим внимание, что в случае нормального распределения доверительная вероятность для интервала ( x − σ , x + σ ) равна 68,3% , а в данном
случае 57,7%.
Определим доверительный интервал Δx, в котором с вероятностью 95%
будет находиться значение измеряемой величины. Очевидно, что вероятность получить значение измеряемой величины в интервале
− 0,95d < x <+ 0,95d равна 95%.
Чтобы найти доверительный интервал для случайной величины, подчиняющейся равномерному распределению, достаточно умножить величину
62
доверительной вероятности на параметр равномерного распределения d (на
сколько меньше основание прямоугольника на столь же меньше и его площадь). Доверительный интервал такой величины обозначают Δxои называют
погрешностью однократных измерений. Тогда, для доверительной вероятности 95%: Δxои= 0,95d, где d – параметр равномерного распределения.
Погрешность однократных измерений связана с точностью используемых измерительных приборов. В этом случае параметр равномерного распределения называют приборной ошибкой. Кроме приборной погрешности
на результат измерения влияет еще ряд объективных и субъективных причин.
Точность параметра зависит от используемого измерительного прибора. Многие приборы имеют шкалу с делениями. Разность значений, выражаемых соседними делениями, называется ценой наименьшего деления. Следует помнить, что измерять величину, меньшую, чем цена наименьшего деления прибора, данным прибором некорректно.
В зависимости от вида измерительного прибора параметр равномерного распределения d определяется одним из ниже перечисленных способов:
1. Точность измерения (цена наименьшего деления) указана непосредственно на приборе. В этом случае параметр равномерного распределения d
равен точности прибора, т.е. равен цене наименьшего деления.
2. Иногда, на приборе указан его класс точности. При этом параметр
равномерного распределения d = К·П./ 100, где К – класс точности прибора,
П – предел измерения шкалы.
3. Индикатор значения измеряемой величины может отображать определенные (дискретные) положения. Такие приборы являются приборами дискретного действия. В этом случае (например, в электронных цифровых приборах) абсолютную погрешность рассчитывают по паспортным данным, содержащим формулу для расчета погрешности конкретного прибора. При отсутствии паспортных данных за параметр равномерного распределения d
принимают единицу наименьшего разряда цифрового индикатора. Например,
электронный секундомер показывает значение: 00:00:03.23. Цена деления та63
кого прибора равна 0,01 с, а параметр равномерного распределения также
d = 0,01 Сек.
3.2.2. Совместный учет ошибки многократных и однократных
измерений
При многократных измерениях некоторой величины x каждое отдельное измерение можно рассматривать как однократное. Поэтому при оценке
общей погрешности необходимо учитывать как случайные ошибки многократных измерений, которые подчиняются распределению Гаусса (Стьюдента), так и ошибки однократных измерений, подчиняющихся равномерному
закону распределения.
Факторы, способствующие появлению погрешностей того и другого
типа, действуют независимо друг от друга. Поэтому для определения суммарной ошибки результата измерения используют закон сложения независимых величин (ошибок), который доказывается в теории вероятностей.
Этот закон справедлив и для сложения доверительных интервалов. Поэтому доверительный интервал Δx (общая погрешность) измеряемой в серии
опытов величины x определяется как:
𝟐
∆𝒙 = �∆𝒙𝟐ои + ∆𝒙𝟐сл
(3.6)
где Δxои – доверительный интервал, соответствующий ошибке однократных измерений (приборная погрешность).
Δxсл – доверительный интервал, соответствующий случайной
ошибки многократных измерений,
Если в результате непосредственных (прямых) измерений некоторой
физической величины х получены значения x1 , x2 , х3 , … xn , то оценку погрешности рекомендуется проводить следующим образом:
1. По результатам измерений величины x определяется среднее арифметическое из n измерений 𝑥𝑥.
2. Вычисляется среднеквадратичное отклонение результатов измерений
от среднего арифметического S.
64
3. Для заданной доверительной вероятности P и количестве измерений
n по таблице П.2 определяется коэффициент Стьюдента tα,n–1 .
4. Рассчитывается граница доверительного интервала (случайная погрешность) для многократных измерений.
Δxсл = tα,n–1S.
(3.7)
5. Оценивается доверительный интервал (погрешность) однократных
измерений.
Δxои = P·d,
(3.8)
где d – параметр равномерного распределения, связанный с ценой деления или классом точности измерительного прибора.
6. По формуле (3.6) определяется общая погрешность серии измерений
(доверительный интервал) Δx.
7. Окончательный результат записывается в виде 𝑥𝑥 = 𝑥𝑥 ± ∆𝑥𝑥 с довери-
тельной вероятностью P.
8. Оценивается относительная погрешность результата измерений.
𝜹=
∆𝒙
∙ 𝟏𝟎𝟎%
𝒙
(3.9)
Относительная погрешность позволяет сравнивать неточности измерений величин, имеющих различную размерность.
3.2.3. Анализ промахов
В отдельный тип погрешностей выделяются так называемые промахи
(грубые ошибки), т.е. результаты с аномальными числовыми значениями.
Промахи или грубые погрешности (ошибки) это ошибочные измерения
или наблюдения, возникающие в результате небрежности при отсчете по
прибору или неразборчивой записи показаний, при неправильном включении
прибора, или при нарушении условий, в которых должен проводиться опыт
(изменение напряжения, загрязнение материала и т.д.). Такие ошибочные
данные следует отбросить или сделать повторные (контрольные) измерения.
65
Однако отбрасывать некоторый результат измерения как аномальный,
руководствуясь только эмоциями, некорректно. Поэтому требуется определенная математическая процедура, которая позволит отличить промах от результата с допустимой (хотя и большой по величине) случайной погрешностью.
Предлагаемый метод поиска промахов основан на том предположении,
что случайные погрешности подчиняются нормальному распределению.
Согласно теории вероятностей, случайные погрешности подчиняются
нормальному распределению при выполнении трех условий:
1. Количество случайных факторов, влияющих на величину результата
измерения, очень велико (практически неограниченно).
2. Каждый случайный фактор можно независим от остальных.
3. Из случайных факторов ни один не является доминирующим.
Доказательство справедливости нижеизложенной процедуры поиска
промахов приводится в курсах математической статистики. В данном разделе
излагается лишь последовательность необходимых вычислений.
Процедуру анализа аномальных результатов можно разделить на отдельные этапы.
1. Определить (задать) доверительную вероятность P (надёжность γ)
цикла измерений. Для технических приложений это обычно 95%.
2. Из совокупности измерений x1 , x2 , х3 , … xn (возможно временно)
исключить «подозрительный» результат, который заметно отличается от всех
остальных, например xk.
3. Вычислить среднее арифметическое значение остальных измерений
xi( i ≠ k )
𝒏
𝟏
𝒙𝟏 =
� 𝒙𝒊 .
𝒏−𝟏
𝒊=𝒌,𝒊≠𝒌
66
(3.10)
4. Из таблицы П.2 коэффициентов Стьюдента найти значение tα,n–2, соответствующее доверительной вероятности P и числу измерений (n–1) (т.е.
числу степеней свободы ν = n – 2).
5. Вычислить критическую величину ∆𝑥𝑥𝑚 :
𝒏𝑫𝟏
∆𝒙𝒎 = 𝒕𝜶,𝒏−𝟐 �
,
(𝒏 − 𝟏)(𝒏 − 𝟐)
(3.11)
где параметр D1– дисперсия для выборки с исключенным «подозрительным» результатом измерения xk:
𝒏
𝑫𝟏 = � (𝒙𝒊 − 𝒙𝟏 )𝟐 .
6. Проверяем условие:
𝒊=𝟏,𝒊≠𝒌
|𝒙𝟏 − 𝒙𝒌 | ≥ ∆𝒙𝒎 ,
(3.12)
(3.13)
— в случае выполнения условия (3.13) «подозрительное» значение xk
считается промахом и исключается из совокупности результатов измерений.
— при невыполнении условия (3.13) отклонение числа xk считается
допустимым и не исключается из набора измерений.
Обратите внимание!
При использовании вышеописанной процедуры, возможно допустить
ошибку 1-го рода — отбросить результат измерения, который следует учесть.
Вероятность этой ошибки равна (1 – P). Увеличивая доверительную вероятность P (коэффициент доверия γ), уменьшается вероятность ошибки 1-го рода. Но при этом увеличивается величина коэффициента Стьюдента tα,ν и, следовательно, растёт вероятность ошибки 2-го рода — принять ложное значение за истинное, т.е. включить промах в серию измерений. Поэтому следует
корректно выбирать величину γ (обычно это 0,9; 0,95; 0,99) — в зависимости
от важности задачи.
67
3.2.4. Определение числа опытов для вычисления параметров
математического ожидания
Минимальное количество измерений (числа опытов) для определения
величины математического ожидания можно из выражения для вычисления
соответствующего доверительного интервала при нормальном законе распределения:
𝒙 − 𝒁𝜶
𝑺
√𝒏
≤ 𝝁 ≤ 𝒙 + 𝒁𝜶
𝑺
(3.14)
√𝒏
Данный интервал является доверительным интервалом для математического ожидания μ случайной величины 𝑥𝑥 с нормальным законом распре-
деления, построенным с доверительной вероятностью P = 1 – α. Границы
этого интервала равны 𝒙 − 𝒁𝜶
𝜹 = 𝒁𝜶
𝑺
√𝒏
.
𝑺
√𝒏
и 𝒙 + 𝒁𝜶
𝑺
√𝒏
, а половина его ширины
Из этого выражения можно определить число измерений:
𝒁𝜶 ∙ 𝑺 𝟐
𝑺 𝟐
𝟐
𝒏≥�
� = 𝒁𝜶 ∙ � � .
𝜹
𝜹
(3.15)
Следовательно, увеличение количества измерений (числа опытов), даже при неизменной погрешности (S = const), может увеличить доверительную вероятность P или сузить доверительный интервал ±δ для определения
действительного значения измеряемой величины (математического ожидания).
Таким образом необходимое количество измерений n для достижения
требуемой погрешности δ при заданной доверительной вероятности Р можно
определить заранее в том случае, когда известно значение среднеквадратичного отклонения S, а экспериментальные данные (измерения) подчиняются
нормальному закону распределения. Так, при γ=0,95, Z0,95= 1,96 и при δ=S
число измерений равно 4. При уменьшении необходимой погрешности измерений в 2 раза, т.е. сужении доверительного интервала до величины δ=(1/2)S,
68
необходимое число измерений составит 16. Следовательно, необходимое
число измерений с уменьшении погрешности увеличением возрастает в
квадратичной зависимости. Количество опытов, необходимых для построения доверительных интервалов математического ожидания при некоторых
𝑆⁄𝛿 и γ, приведены в табл. 3.1
Таблица 3.1 Минимальное количество опытов (измерений)
Коэффициент доверия γ, γ=1–α
Погрешность
измерений, δ
0,6 (Zα=0,84)
0,8 (Zα=1,28)
0,9 (Zα=1,64)
1S
–
2
3
4
7
0,5S
3
7
11
16
27
0,4S
5
10
17
24
42
0,3S
8
19
30
48
74
0,2S
18
41
68
96
167
0,1S
71
164
269
384
665
0,95(Zα=1,96) 0,99(Zα=2,58)
Приведенные выше рассуждения не совсем корректны, так как говорить о законе распределения, как о нормальном, мы имеем право только при
n > 30 (для γ = 0,95). При меньшем числе опытов действительная дисперсия
неизвестна, поэтому при построении доверительного интервала для математического ожидания используют выборочную дисперсию. При n < 30 пользуются распределением Стьюдента (t-распределение). При n → ∞ (практически при n ≥ 30 для P = 95%) распределение Стьюдента переходит в нормальное распределение с единичной дисперсией.
В этом случае выражение для вычисления доверительного интервала
математического ожидания при t- распределении запишется в виде:
𝒙 − 𝒕𝛼,𝑛−1
𝑺
√𝒏
≤ 𝝁 ≤ 𝒙 + 𝒕𝛼,𝑛−1
𝑺
√𝒏
.
(3.16)
При этом необходимое число измерений можно определять из соотношения:
𝒕𝜶,𝒏−𝟏 ∙ 𝑺 𝟐
𝑺 𝟐
𝟐
𝒏≥�
� = 𝒕𝜶,𝒏−𝟏 ∙ � � .
𝜹
𝜹
(3.17)
69
Отметим, что значение критерия Стьюдента зависит не от числа степеней свободы ν = n–1, т.е. от числа измерений. Поэтому аналитического решения относительно n данное уравнение не имеет. В связи с этим уравнение
следует решать численными методами, например методом последовательных
приближений. В качестве начального приближения можно задать число измерений, рассчитанных для нормального распределения (3.15). Так, если решить последнее уравнение методом последовательных приближений, то
можно показать, что при γ = 0,95 для определения доверительного интервала
с точностью δ = S требуется 7 измерений, а с точностью δ = 0,5S уже 18.
Количество опытов, необходимых для построения доверительного интервала математического ожидания с учетом коэффициента Стьюдента приведены в табл. 3.2.
Таблица 3.2. Необходимое количество опытов (измерений)
Ошибка
(погрешность)
измерений, δ
Коэффициент доверия γ, γ=1–α
P = 0,6
P = 0,8
P = 0,9
P = 0,95
P = 0,99
0,5S
(𝑡0,4,𝑛−1 )
4
(𝑡0,2,𝑛−1 )
9
(𝑡0,1,𝑛−1 )
13
(𝑡0,05,𝑛−1 )
18
(𝑡0,01,𝑛−1 )
0,4S
6
12
19
27
46
0,3S
9
20
32
46
78
0,2S
19
43
70
99
171
0,1S
72
166
273
387
668
1S
2
4
5
7
11
31
Сравнивая таблицы 3.1 и 3.2, следует, что с повышением необходимой
точности различие в числе измерений, рассчитанных для нормального и
t- распределения, уменьшается и при величине δ ≤ 0,2S они практически совпадают.
70
3.2.5. Метод последовательного анализа при проведении
эксперимента
Для минимизации числа измерений используется последовательный
анализ, т.е. такой способ статистической проверки гипотез, при котором необходимое число наблюдений не фиксируется заранее, а определяется в процессе самой проверки. То есть его смысл состоит в учете уже сделанных
опытов в ходе эксперимента. Во многих случаях для получения достоверных
результатов применение последовательного анализа позволяет ограничиться
значительно меньшим числом опытов, чем при способах, в которых число
опытов рассчитывается заранее. Имейте в виду, что сокращение числа опытов происходит в среднем, т.к. их число при последовательном анализе есть
величина случайная. После каждого проведённого опыта определяют, как
именно поступить с рассматриваемой гипотезой: принять её, отклонить, или
продолжать испытания.
Следует учитывать, что уменьшение количества измерений достигается
за счет увеличения объема вычислений.
Сущность последовательного анализа состоит в следующем. Пусть задача состоит в выборе между гипотезами H1 и H2 по результатам независимых опытов. Гипотеза H1 заключается в том, что случайная величина х имеет
распределение вероятностей с плотностью f1(x), гипотеза H2 — в том, что величина х имеет плотность f2(x). Для решения этой задачи поступают следующим образом. Выбирают два числа А и В (0 < A < B). После первого наблюдения вычисляют отношение λ1 = f2(x1)/f1(x1), где x1 — результат первого
наблюдения. Если λ1 < A, принимают гипотезу H1; если λ1 > B, принимают
гипотезу H2, если A ≤ λ1 ≤ B, производят второе наблюдение и так же исследуют величину λ2:
𝒇 (𝒙𝟏 )𝒇𝟐 (𝒙𝟐 )
𝝀𝟐 = 𝟐
𝒇𝟏 (𝒙𝟏 )𝒇𝟏 (𝒙𝟐 )
,
(3.18)
71
где x2 — результат второго наблюдения, и т.д. до тех пор пока значение
λ не выйдет за пределы А ÷ В.
С вероятностью, равной единице, процесс оканчивается либо выбором
H1, либо выбором H2. Реально возможны не два, а четыре исхода:
— гипотеза верна и не отвергается согласно критерию (правильное решение);
— гипотеза неверна и отвергается согласно критерию (правильное решение);
— гипотеза верна, но отвергается согласно критерию (допущена ошибка I рода);
— гипотеза неверна, но не отвергается согласно критерию (допущена
ошибка II рода).
Выбор величин А и В определяются из условий необходимой достоверности результатов и подробно рассматривается в курсах “Планирование
эксперимента”, “Управление качеством”.
В нашем случае ограничимся принятием решения о прекращении эксперимента при достижении заданной погрешности. Для этого достаточно
ограничиться двумя интервалами:
— заданная погрешность не устраивает, т. е. испытания продолжаются,
— заданная погрешность устраивает, т. е. испытания прекращаются.
Предельная погрешность измеряемого параметра δпред определяется
точностью измерительной системы, т.е. параметром равномерного распределения d (см раздел 3.2.1). Погрешность однократных измерений, например, в
электронных цифровых измерительных приборах, за параметр равномерного
распределения d принимают единицу наименьшего разряда цифрового индикатора.
Заданная погрешность δзад может быть не обязательно предельной и
может определяться из каких-то других соображений, например, если для
решения конкретной задачи предельная точность чрезмерна.
72
Определить момент прекращения эксперимента, когда заданная погрешность достигнута, можно из выражения:
где δ = 𝐭 𝛂,𝐧−𝟏
𝐒
√𝐧
𝒙−𝜹≤𝝁≤𝒙+𝜹,
(3.19)
.
Условие прекращения эксперимента: δ = 𝐭 𝛂,𝐧−𝟏
𝐒
√𝐧
≤ δзад .
Таким образом при последовательном анализе после каждого опыта
необходимо определять текущую погрешность δ и сравнивать ее с заданной
δзад .
3.2.6. Рекомендации при определении объема эксперимента
1. Измерять физическую величину с погрешностью δзад, выше, чем цена
наименьшего деления, данным прибором некорректно. Определение приборной погрешности при прямых измерениях приведено в разделе 3.2.1. При
косвенных измерениях необходимо пользоваться соответствующей литературой по метрологии или по теории планирования эксперимента.
Не следует завышать требуемую погрешность измерения. Это приводит
к неоправданному увеличению количества опытов. В данной работе примем,
что δзад = ±d = 2d, иначе количество измерений будет слишком большим.
2. Если проведение измерений не сопряжены со значительными затратами времени и ресурсов (трудовых, материальных, финансовых) и не связаны с разрушающим контролем образцов целесообразно не оптимизировать
их количество. При этом критерием для определения объема измерений служит значение, при котором можно пренебречь коэффициентом Стьюдента.
Число измерений зависит от доверительной вероятности P.Обычно используют:
— P = 68,3%, 𝑍𝛼 = 1 – параметры для предварительных экспериментов,
часто для физических трудновоспроизводимых опытов. Чтобы иметь право
73
воспользоваться этими параметрами (распределение Стьюдента переходит в
распределение Гаусса) необходимо произвести не менее 10 измерений.
— P = 95%, 𝑍𝛼 = 1,96 – параметры для технических экспериментов.
Необходимо произвести не менее 30 измерений.
— P = 99%, 𝑍𝛼 = 2,58, параметры для оборудования, связанного с без-
опасностью. Необходимо произвести не менее 50 измерений.
Выше приведены минимальные значения количества измерений. По-
этому при расчете доверительных интервалов они получатся достаточно
большими. Для их уменьшения необходимо увеличить количество опытов.
3. Для определения минимального количества опытов (измерений).
𝒁𝜶 ∙𝑺 𝟐
можно воспользоваться формулой 𝒏𝒎𝒊𝒏 = �
𝜹
�
𝑺 𝟐
𝟐
= 𝒁𝜶 ∙ � � ,
𝜹
или табли-
цей 3.1. Значение погрешности измерений следует брать в пределах от δ = 1∙S
до δ = 0,5∙S. Меньшее значение δ выбирать нецелесообразно, так как эта величина применяется как первое приближение для дальнейших вычислений.
4. Далее можно поступить двумя способами:
— рассчитать необходимое количество опытов по формуле (3.17) и
провести их. Целесообразно пользоваться, когда затраты на проведение опытов сравнительно невелики. При этом возможно избыточное количество измерений. Это компенсируется меньшим, по сравнению с методом последовательного анализа, объемом вычислений.
— воспользоваться методом последовательного анализа. При этом после каждого опыта необходимо вычислять среднее арифметическое, оценку
среднего квадратичного отклонения, ошибку погрешности измерения. Увеличение объема вычислений возможно компенсируется уменьшением количества опытов. Особенно это критично если их проведение затратно.
В любом случае предварительно необходимо рассчитать и провести
минимальное количество опытов по методике, описанной выше.
5. При определении достаточного количества опытов можно восполь𝑺 𝟐
зоваться зависимостью 𝒏дост = 𝒕𝟐𝜶,𝒏−𝟏 ∙ � � . Значение S рассчитывается по
74
𝜹
результатам минимального количества опытов, а величина δ не должна превышать возможности измерительной системы. Уравнение нелинейно и аналитического решения относительно n не имеет. Поэтому необходимо воспользоваться численными методами. За начальное приближение можно взять
𝑛𝑚𝑖𝑛 . Некоторые значения n представлены в таблице 3.2.
6. При использовании метода последовательного анализа проводится
минимальное количество опытов. Рассчитывается среднее арифметическое,
оценка среднего квадратичного отклонения, ошибка точности измерения. Ес-
ли заданная точность не достигнута (что чаще всего) проводится еще один
опыт, вычисляются 𝑥𝑥, 𝑆, 𝛿 и так далее пока заданная точность не будет до-
стигнута. В любом случае эксперимент прекращают при достижении числа
𝑆
2
2
∙ � � . При последовательном
опытов рассчитанного по формуле 𝑛 = 𝑡𝛼,𝑛−1
𝛿
анализе всегда число опытов меньше, чем рассчитанное по приведенной
формуле. На сколько меньше, предсказать невозможно, так как результат
каждого последующего опыта величина случайная.
3.2.7. Некоторые выводы
1. Если требуется рассчитывать доверительные интервалы для параметров распределения необходимо производить достаточно большое количество опытов, т.е. такое, при котором распределение Стьюдента переходит в
распределение Гаусса. Например, для технических приложений принята доверительная вероятность P = 95%. Для нее количество опытов n > 30. Даже в
этом случае доверительный интервал может быть достаточно большим. Для
получения приемлемого доверительного интервала нужно увеличивать количество опытов или уменьшать доверительную вероятность.
2. При ограниченном объеме эксперимента можно рассчитать и провести достаточное (для конкретного приложения) количество опытов или воспользоваться методом последовательного анализа. При этом доверительные
75
интервалы получаются достаточно большими из-за малого количества опытов.
3. Применение последовательного анализа не всегда дает существенное
сокращение объема эксперимента, так как порядок выбора объектов измерения есть величина случайная. Как в лотерее, можно приз выиграть сразу, а
можно в конце тиража. При этом увеличивается объем вычислений, т.к. после каждого дополнительного опыты необходимо пересчитывать статистические параметры.
3.3. ЗАДАНИЕ ДЛЯ ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ
Определить объем эксперимента (количество измерений) методом последовательного анализа. Исследуемый параметр x, представляет собой время прохождения изделием лабиринта, имитирующего технологический процесс. Перемещение изделий в рабочей зоне происходит с помощью манипулятора. Время фиксируется с помощью контроллера робототехнической системы FANUC с величиной наименьшего разряда цифрового индикатора 0,1
с. То есть параметр равномерного распределения d при измерении времени с
помощью контроллера FANUC равен 0,1с. Чтобы не затягивать эксперимент
ограничимся погрешностью измерения исследуемого параметра
δзад = ±d = 2d = 0,2 с.
Для выполнения поставленной задачи необходимо:
1. Определить минимальное количество измерений опытов 𝑛𝑚𝑖𝑛 .
2. Провести минимальное количество измерений, фиксируя при этом
время прохождения изделием лабиринта.
3. Для проведенных измерений рассчитать:
— среднее арифметическое значение 𝑥𝑥,
— среднее квадратичное отклонение S,
— погрешность измерения δ (необходимо использовать коэффициент
Стьюдента).
76
4. Используя предварительную оценку среднего квадратичного отклонения и задавшись погрешностью определения исследуемого параметра рассчитать достаточное количество измерений 𝑛дост .
5. Провести (𝑛𝑚𝑖𝑛 + 1)-й опыт,
— рассчитать 𝑥𝑥, S, δ,
— если δ ≤ δзад эксперимент прекращаем,
— если δ > δзад эксперимент продолжаем, проводим (𝑛𝑚𝑖𝑛 + 2)-й опыт,
производим расчеты и т.д. до тех пор пока не выполнится условие δ ≤ δзад, то
есть условие прекращения эксперимента.
6. Если провели 𝑛дост опытов, а условие δ ≤ δзад так и не выполнилось:
— прекратить эксперимент, удовлетворившись той погрешностью, ко-
торая была достигнута,
⃓
. При
— продолжить эксперимент, предварительно пересчитав 𝑛дост
этом за оценку среднего квадратичного отклонения принять последнее значение, то есть то, которое получилось для количества опытов 𝑛дост .
Такая ситуация может произойти если при определении 𝑛𝑚𝑖𝑛 измере-
ния оказались нерепрезентативными.
7. Все данные результатов измерений и вычислений полученные в ходе
проведения эксперимента свести в таблицу.
8. Проанализировать сводную таблицу эксперимента. Сделать аргументированные (на конкретном примере) выводы о более благоприятном ходе
эксперимента.
9. Сделать выводы по всей работе.
3.4. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
1. Определить минимальное
𝑛𝑚𝑖𝑛 по формуле:
𝑆
количество измерений (числа опытов)
2
𝑛𝑚𝑖𝑛 = 𝑍𝛼2 ∙ � � .
𝛿
Для технических приложений обычно принимают:
77
— доверительная вероятность P = 95% (γ =0,95) , то есть уровень значимости α = 1 – γ = 0,05,
— для нормального распределения при уровне значимости α = 0,05 доверительный интервал Zα = 1,96,
— значение
𝑆
𝛿
применяется лишь как первое приближение для даль-
нейших вычислений. Поэтому величина обычно составляет более 0,5 (часто
первоначально принимают δ = S).
Величину 𝑛𝑚𝑖𝑛 также можно определить из таблицы 3.1.
2. Измерить время прохождения 𝑛𝑚𝑖𝑛 деталей по лабиринту, имитиру-
ющем технологический процесс. Для этого использовать промышленный робот FANUC.
3. Для проведенных измерений рассчитать: 𝑥𝑥, S, δ, при этом заполнив
таблицу 3.3:
Таблица 3.3. Статистические параметры эксперимента
№
xi
Σxi
(n)
𝑥𝑥
(xi–𝑥𝑥)2
Σ(xi–𝑥𝑥)2
S=�
1
1
𝑛−1
∑(𝑥𝑥𝑖 − 𝑥𝑥)2
𝑆
2
√𝑛
tα,n-1
α=0,05
δ= tα,n-1
𝑆
√𝑛
2
…
𝑛𝑚𝑖𝑛
4. Проанализировать данные таблицы. Если полученной точности не-
достаточно, используя предварительные результаты рассчитать достаточное
количество измерений 𝑛дост по формуле:
𝑆
2
2
𝑛дост = 𝑡𝛼,𝑛−1
∙� � .
𝛿
Величина S берется из результатов уже проведенных предварительных
измерений. Значение δ выбирается исходя из конкретных условий и возможностей. Чем выше точность, тем больше количество опытов, причем, зависимость квадратичная. Также необходимо учитывать возможности измерительной системы.
78
Для решения уравнения относительно 𝑛дост необходимо воспользовать-
ся численными методами. Для начального приближения можно взять значение 𝑛𝑚𝑖𝑛 , из таблицы 3.2.
С целью разумного использования учебных ресурсов в данной работе
погрешность измерений ограничивается величиной δ = 0,2 с.
5. Провести последующие опыты (n > nmin), продолжая заполнять приведенную таблицу. Прекратить эксперимент, когда δ ≤ δзад.
6. Проанализировать полученные данные и сделать выводы по работе.
3.5. СОДЕРЖАНИЕ ОТЧЕТА
1. Название и цель работы. На титульном листе обязательно укажите
номер варианта.
2. Общие сведения должны содержать (очень коротко) понятия:
— измерения прямые, косвенные, однократные, многократные,
— наблюдение, эксперимент, опыт,
— погрешности систематические, случайные,
— погрешность однократных измерений,
— равномерное распределение случайной величины,
— погрешность результата измерений,
— минимальное количество опытов (измерений),
— необходимое количество опытов (измерений),
— метод последовательного анализа при проведении эксперимента,
3. Задание для выполнения лабораторной работы.
4. Все необходимые расчеты и таблицы.
5. Выводы. Конкретно, без общих рассуждений, обобщить результаты
данной работы и сформулировать преимущества и недостатки различных
способов проведения экспериментов.
79
3.6. КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Чем отличается наблюдение от эксперимента?
2. Чем отличается пассивный эксперимент от активного?
3. Что такое точность и погрешность измерения?
4. Чем характеризуются систематические и случайные погрешности?
5. Что такое приборная погрешность?
6. Как определить приборную погрешность?
7. Чему равна дисперсия для равномерного распределения?
8. Смысл определения минимального количества опытов?
9. Когда необходимо применять коэффициент Стьюдента?
10. В каких случаях можно вообще не определять количество опытов?
11. От каких параметров зависит количество опытов?
12. Чем отличается закон распределения Стьюдента от закона распределения Гаусса?
13. От каких параметров зависит доверительный интервал?
14. Что нужно сделать, чтобы уменьшить доверительный интервал?
15. В чем смысл определения необходимого количества опытов?
16. Преимущества и недостатки последовательного эксперимента.
17. На сколько можно сократить объем эксперимента при последовательном анализе?
18.Чем отличается опыт от измерения?
3.7. ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ
1. Минимальное количество измерений (числа опытов) 𝑛𝑚𝑖𝑛 (с округ-
лением до целого):
𝑆 2
𝑛𝑚𝑖𝑛 = 𝑍𝛼2 ∙ � � = 1,962 ∙12 = 4,
𝛿
где — при P = 95% (γ = 0,95, α = 1 – γ =0,05), Zα = 1,96,
80
𝑆
𝛿
= 1.
2. В учебных целях для наглядности возможности анализа данные измерений возьмем из таблицы результатов, полученных в работе 1 (табл.1.7)
Копия этой таблицы:
Копия таблицы 1.7.Параметры измерений выборки
№
1
x
8,7
№
7
x
8,8
№
13
x
9,5
№
19
x
9,4
№
25
x
9,3
№
31
x
9,0
2
8,8
8
9,5
14
8,8
20
9,5
26
8,9
32
8,9
3
9,1
9
8,3
15
9,1
21
8,8
27
9,2
33
9,3
4
9,3
10
9,2
16
8,6
22
8,9
28
9,0
34
8,8
5
9,0
11
8,8
17
8,8
23
8,9
29
9,0
35
9,1
6
9,3
12
9,1
18
9,1
24
9,2
30
8,8
36
8,8
В нашем случае результаты измерений при минимальном количестве
опытов это первые четыре значения: n1 = 8,7, n2 = 8,8, n3 = 9.1, n4 = 9,3.
3. Первоначальные измерения представлены в таблице 3.4:
Таблица 3.4.Погрешность измерений (n=nmin)
№ xi
(n)
1 8,7
Σxi
𝑥𝑥
Σ(xi–𝑥𝑥)2
(xi–𝑥𝑥)2
0,076
0,076
2
8,8
0,031
0,107
3
9,1
0,016
0,123
4
9,3
0,106
0,229
35,9
8,975
S=�
1
𝑛−1
∑(𝑥𝑥𝑖 − 𝑥𝑥)2
0,276
𝑆
tα,n-1
α=0,05
δ= tα,n-1
0,138
3,18
0,44
√𝑛
𝑆
√𝑛
4. Достаточное количество измерений:
𝑆
2
2
𝑛дост = 𝑡𝛼,𝑛−1
∙� � .
При S = 0,276, δ = 0,2,
𝑆
𝛿
𝑆
2
𝛿
2
= 1,38, � � = 1,9, 𝑛дост = 1,9 ∙ 𝑡𝛼,𝑛−1
.
𝛿
Решим уравнение методом последовательных приближений. В качестве
первого приближения используем результат предыдущих измерений (табл.
3.4). Для наглядности процесс решения уравнения сведем в таблицу 3.5.
81
n
n–1
4
20
9
11
10
3
19
8
10
9
2
Таблица 3.5. Решение уравнения 𝑛дост = 1,9 ∙ 𝑡𝛼,𝑛−1
.
2
𝑡0,05,𝑛−1
t0,05,n–1
3,2
2,1
2,3
2,23
2,26
10,2
4,4
5,3
5,0
5,1
n⃓ ≥ 1,9t2
20
9
11
10
10
Итерации проводим до тех пор, пока значения в первом и последнем
столбце не совпадут. Следовательно, в нашем случае 𝑛дост ≥ 10. То есть в
лучшем случае необходимо провести еще шесть измерений (всего десять).
5. Продолжение эксперимента. После каждого опыта его результаты
заносим в таблицу 3.6 и производим необходимые вычисления.
Таблица 3.6. Таблица проведения эксперимента
№
xi
Σxi
(n)
1
8,7
2
𝑥𝑥
(xi–𝑥𝑥)2 Σ(xi–𝑥𝑥)2
S=�
1
𝑛−1
∑(𝑥𝑥𝑖 − 𝑥𝑥)2
𝑆
tα,n-1
√𝑛
α=0,05
δ=tα,n-1
0,076
0,076
8,8
0,031
0,107
3
9,1
0,016
0,123
4
9,3
35,9
8,975
0,106
0,229
0,276
0,138
3,18
0,44
5
9,0
44,9
8,98
0,000
0,229
0,239
0,107
2,78
0,30
6
9,3
54,2
9,03
0,073
0,302
0,246
0,100
2,57
0,26
7
8,8
63,0
9,00
0,040
0,342
0,239
0,090
2,45
0,22
8
9,5
72,5
9,06
0,194
0,536
0,277
0,098
2,36
0,23
9
8,3
80,8
8,98
0,462
0,998
0,353
0,118
2,31
0,27
10 9,2
90,0
9,00
0,040
1,038
0,338
0,107
2,26
0,24
11 8,8
98,8
8,98
0,032
1,070
0,327
0,098
2,23
0,22
12 9,1 107,9
8,99
0,012
1,082
0,314
0,091
2,20
0,20
13 9,5 117,4
9,03
0,221
1,303
0,329
0,091
2,18
0,20
14 8,8 126,2
9,01
0,044
1,347
0,322
0,086
2,16
0,19
15 9,1 135,3
9,02
0,006
1,353
0,311
0,080
2,14
0,17
16 8,6 143,9
8,99
0,152
1,505
0,317
0,079
2,13
0,17
17 8,8 152,7
8,98
0,032
1,537
0,310
0,075
2,12
0,16
18 9,1 161,8
8,99
0.012
1,549
0,302
0,071
2.11
0,15
82
𝑆
√𝑛
Как следует из таблицы за предложенные десять опытов минимальная
погрешность измерений составила δ = 0,22 с. (седьмой опыт). То есть заданная точность не достигнута (δзад= 0,2 с.). С целью принятия решения проанализируем результаты.
Анализ результатов и некоторые выводы
1. На основании предварительных опытов (четыре измерения) было
рассчитано, что для обеспечения требуемой точности необходимо провести
еще шесть измерений (всего десять). Заявленная точность не достигнута.
2. Неточность рекомендаций о проведении еще шести опытов можно
объяснить малым количеством предварительных опытов (четыре измерения).
То есть выборка из четырех измерений оказалась нерепрезентативной. Хотя
методика и говорит, что надо провести не менее десяти измерений.
3. Можно прекратить эксперимент, удовлетворившись полученным результатом. А можно продолжить опыты с надеждой достигнуть заданной
точности. Предварительно лучше рассчитать количество дополнительных
измерений.
4. Для расчета скорректированного количество измерений воспользу𝑆
2
2
∙ � � . В качестве первого
емся все той же зависимостью: 𝑛дост = 𝑡𝛼,𝑛−1
𝛿
приближения используем результаты десятого измерения.
При S = 0,338, δ = 0,2,
𝑆
𝛿
𝑆
2
2
= 1,69, � � = 2,856, 𝑛дост = 2,856 ∙ 𝑡𝛼,𝑛−1
.
𝛿
Решим уравнение методом последовательных приближений, а для
наглядности процесс решения сведем в таблицу 3.7.
2
Таблица 3.7. Решение уравнения 𝑛дост = 2,856 ∙ 𝑡𝛼,𝑛−1
n
n–1
10
15
14
9
14
13
𝑡10,05,𝑛−1
2,26
2,14
2,16
2
𝑡0,05,𝑛−1
5,1
4,6
4,7
n⃓ ≥ 2,856∙t2
15
14
14
Следовательно, теперь 𝑛дост ≥ 14. То есть в лучшем случае предлагает-
ся провести еще четыре измерения.
83
6. В учебных целях расчетная таблица 3.6 рассчитана с избытком. Поэтому констатируем, что заданная точность достигнута на двенадцатом опыте (выделено цветом). Поэтому продолжать эксперимент после этого нет
необходимости. Дальнейшие измерения приведены с целью показать, что погрешность измерений монотонно убывает.
7. Так как процесс и порядок выполнения опытов величина случайная
введем в работу элемент исследования. Сколько опытов необходимо провести, если результаты опытов будут соответствовать вариационному ряду. То
есть, совершенно случайно, результаты измерений будут располагаться в порядке возрастания. Результаты измерений возьмем из таблицы вариационного ряда (табл. 1.8).
Копия таблицы 1.8. Вариационный ряд
№
1
2
3
4
5
6
x
8,3
8,6
8,7
8,7
8,7
8,8
№
7
8
9
10
11
12
x
8,8
8,8
8,8
8,8
8,8
8,8
№
13
14
15
16
17
18
x
8,9
8,9
8,9
8,9
9,0
9,0
№
19
20
21
22
23
24
x
9,0
9,0
9,1
9,1
9,1
9,1
№
25
26
27
28
29
30
x
9,1
9,2
9,2
9,2
9,3
9,3
№
31
32
33
34
35
36
x
9,3
9,3
9,4
9,5
9,5
9,5
Составим таблицу для анализа погрешности измерений на основании
первых десяти значений вариационного ряда (табл. 3.8)
Таблица. 3.8. Таблица оценки точности вариационного ряда
№
xi
Σxi
(n)
1
2
3
4
5
6
7
8
9
10
8,3
8,6
8,7
8,8
8,8
8,8
8,8
8,8
8,8
8,8
84
34,4
43,2
52,0
60,8
69,6
78,4
87,2
𝑥𝑥=Σxi⁄n
8,60
8,64
8,67
8,69
8,70
8,71
8,72
(xi–𝑥𝑥)2
0,090
0,000
0,010
0,400
0,026
0,017
0,012
0,010
0,008
0,006
Σ(xi–𝑥𝑥)2
0,09
0,09
0,10
0,14
0,17
0,18
0,19
0,70
0,21
0,21
S=�
1
𝑛−1
∑(𝑥𝑥𝑖
0,22
0,21
0,19
0,18
0,17
0,16
0,15
− 𝑥𝑥)2
𝑆
tα,n-1
2
√𝑛
α=0,05
0,11
0,09
0,08
0,07
0,6
0,5
0,5
3,18
2,78
2,57
2,45
2,36
2,31
2,26
δ= tα,n-1
𝑆
√𝑛
0,35
0,25
0,20
0,17
0,14
0,12
0,11
Из анализа результатов следует, что в данном случае, для получения
заданной точности измерений понадобилось лишь шесть опытов. Таким образом, метод последовательного эксперимента не приводит к обязательному
сокращению количества опытов. Эта величина случайная и зависит, в каком
порядке происходят и фиксируются результаты событий.
Любопытно было бы проанализировать результаты последовательного
эксперимента при исследовании выборки, состоящей из последних членов
вариационного ряда; из середины ряда; один член из начала ряда, следующий
из конца (наихудший вариант) и т.д.
85
ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ
Активный эксперимент – эксперимент, в котором уровни факторов в
каждом опыте задаются исследователем.
Асимметрия – отношение центрального момента третьего порядка к
кубу среднеквадратического отклонения.
Вариационный ряд – последовательность элементов выборки, расположенных в неубывающем порядке (одинаковые элементы записываются последовательно друг за другом).
Вероятность – отношение числа благоприятных исходов к общему
числу исходов при равенстве событийной ценности (веса) исходов.
Выборка – совокупность случайно отобранных из изучаемой совокупности объектов (генеральной выборки).
Выборочная дисперсия – величина, равная сумме квадратов разностей
между значением случайной величины и ее математическим ожиданием, деленная на объем выборки.
Выборочное среднее – число, равное сумме значений случайной величины, деленной на объем выборки.
Генеральная совокупность – конечная или бесконечная совокупность
наблюдений над случайной величиной.
Гистограмма – представление статистического ряда на плоскости в
виде ступенчатой фигуры, состоящей из прямоугольников, основаниями которых служат интервалы, а высоты – частоты исследуемой величины.
Доверительный интервал – интервал, который покрывает неизвестный параметр с заданной вероятностью.
Закон распределения случайной величины – соответствие между возможными значениями случайной величины и их вероятностями.
Корреляционная зависимость – зависимость, при которой при изменении одной из величин изменяется среднее значение другой.
Коэффициент корреляции – отношение ковариации к произведению
среднеквадратических отклонений двух случайных величин.
86
Математическое ожидание – число, относительно которого стабилизируется среднее арифметическое возможных значений случайной величины
при достаточно большом количестве опытов.
Наблюдение – систематическое, целенаправленное восприятие того
или иного объекта или явления без воздействия на него.
Опыт – воспроизведение исследуемого явления в определенных условиях проведения эксперимента при возможности регистрации его результатов.
Пассивный эксперимент – эксперимент, при котором уровни факторов в каждом опыте регистрируются исследователем, но не задаются.
План эксперимента – совокупность данных, определяющих число,
условия и порядок реализации опытов.
Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям.
Последовательный эксперимент (шаговый эксперимент) – эксперимент, реализуемый в виде серий, в котором условия проведения каждой последующей серии определяются результатами предыдущих.
Фактор – переменная величина, по предположению влияющая на результаты эксперимента.
Эксперимент – система операций, воздействий и (или) наблюдений,
направленных на получение информации об объекте при исследовательских
операциях. Эксперимент состоит из опытов.
87
Таблица П.1
Плотность вероятностей нормированного нормального распределения:
u
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0
0,3989
3970
3910
3814
3683
3521
3332
3123
2897
2661
0,2420
2179
1942
1714
1497
1295
1109
0940
0790
0656
0,0540
0440
0355
0283
0224
0175
0136
0104
0079
0060
0,0044
0033
0024
0017
0012
0009
0006
0004
0003
0002
88
1
3989
3965
3902
3802
3668
3503
3312
3101
2874
2637
2396
2155
1919
1691
1476
1276
1092
0925
0775
0644
0529
0431
0347
0277
0219
0181
0132
0101
0077
0058
0043
0032
0023
0017
0012
0008
0006
0004
0003
0002
2
3989
3961
3894
3790
3653
3485
3292
3079
2850
2613
2371
2131
1895
1669
1456
1257
1074
0909
0761
0632
0519
0422
0339
0270
0213
0167
0129
0099
0075
0056
0042
0031
0022
0016
0012
0008
0006
0004
0003
0002
𝝋(𝒖𝒊 ) =
3
3988
3956
3885
3778
3637
3467
3271
3056
2827
2589
2347
2107
1872
1647
1435
1238
1057
0893
0748
0620
0508
0413
0332
0264
0203
0158
0122
0096
0071
0053
0040
0030
0022
0016
0011
0008
0005
0004
0003
0002
𝟏
√𝟐𝝅
4
3986
3951
3876
3765
3621
3448
3251
3034
2803
2565
2323
2083
1849
1626
1415
1219
1040
0878
0734
0608
0498
0404
0325
0258
0203
0158
0122
0093
0071
0053
0039
0029
0021
0015
0011
0008
0005
0004
0003
0002
𝒖𝟐
−𝟐
𝒆
5
3984
3945
3867
3752
3605
3429
3230
3011
2780
2541
2299
2059
1826
1604
1394
1200
1023
0863
0721
0596
0488
0396
0317
0252
0198
0154
0119
0091
0069
0051
0038
0028
0020
0015
0011
0008
0005
0004
0003
0002
6
3982
3939
3857
3739
3589
3410
3209
2989
2756
2516
2275
2036
1804
1582
1374
1182
1006
0848
0707
0584
0478
0387
0310
0246
0194
0151
0116
0088
0067
0050
0037
0027
0020
0014
0010
0007
0005
0004
0002
0002
7
3980
3932
3847
3726
3572
3391
3187
2966
2732
2492
2251
2012
1781
1561
1354
1163
0989
0833
0694
0573
0468
0379
0303
0241
0189
0147
0113
0086
0065
0048
0036
0026
0019
0014
0010
0007
0005
0003
0002
0002
8
3977
3925
3836
3712
3555
3372
3166
2943
2709
2468
2227
1989
1758
1539
1334
1145
0973
0818
0681
0562
0459
0371
0297
0235
0184
0143
0110
0084
0063
0047
0035
0025
0018
0013
0009
0007
0005
0003
0002
0001
9
3973
3918
3825
3697
3538
3352
3144
2920
2685
2444
2203
1965
1736
1518
1315
1127
0957
0804
0669
0551
0449
0363
0290
0229
0180
0139
0107
0081
0061
0046
0034
0025
0018
0013
0009
0006
0004
0003
0002
0001
Таблица П.2
Критические точки распределения Стьюдента: P{|𝒕𝝂 | > 𝒕𝜶 } = 𝜶
Число
степеней
свободы, ν
1
2
3
4
5
б
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
120
200
∞
Уровень значимости α (двусторонняя критическая область)
0,10
6,3138
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7531
1,7459
1,7396
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,7056
1,7033
1,7011
1,6991
1,6973
1,6896
1,6839
1,6794
1,6759
1,6706
1,6669
1,6641
1,6620
1,6602
1,6577
1,6525
1,6449
0,05
12,7062
4,3027
3,1824
2,7764
2,5706
2,4469
2,3646
2,3060
2,2622
2,2281
2,2010
2,1788
2,1604
2,1448
2,1314
2,1199
2,1098
2,1009
2,0930
2,0860
2,0796
2,0739
2,0687
2,0639
2,0595
2,0555
2,0518
2,0484
2,0452
2,0423
2,0301
2,0211
2,0141
2,0086
2,0003
1,9944
1,9901
1,9867
1,9840
1,9799
1,9719
1,9600
0,02
31,8205
6,9646
4,5407
3,7469
3,3649
3,1427
2,9980
2,8965
2,8214
2,7638
2,7181
2,6810
2,6503
2,6245
2,6025
2,5835
2,5669
2,5524
2,5395
2,5280
2,5176
2,5083
2,4999
2,4922
2,4851
2,4786
2,4727
2,4671
2,4620
2,4573
2,4377
2,4233
2,4121
2,4033
2,3901
1,3808
2,3739
2,3685
2,3642
2,3578
2,3451
2,3263
0,01
63,6567
9,9248
5,8409
4,6041
4,0321
3,7074
3,4995
3,3554
3,2498
3,1693
3,1058
3,0545
3,0123
2,9768
2,9467
2,9208
2,8982
2,8784
2,8609
2,8453
2,8314
2,8188
2,8073
2,7969
2,7874
2,7787
2,7707
2,7633
2,7564
2,7500
2,7238
2,7045
2,6896
2,6778
2,6603
2,6479
2,6387
2,6316
2,6259
2,6174
2,6006
2,5758
0,002
318,3081
22,3271
10,2145
7,1732
5,8934
5,2076
4,7853
4,5008
4,2968
4,1437
4,0247
3,9296
3,8520
3,7874
3,7328
3,6862
3,6458
3,6105
3,5794
3,5518
3,5272
3,5050
3,4850
3,4668
3,4502
3,4350
3,4210
3,4082
3,3962
3,3852
3,3400
3,3069
3,2815
3,2614
3,2317
3,2108
3,1953
3,1833
3,1737
3,1595
3,1315
3,0902
0,001
636,6189
31,5991
12,9240
8,6103
6,8688
5,9588
5,4079
5,0413
4,7809
4,5869
4,4370
4,3178
4,2208
4,1405
4,0728
4,0150
3,9651
3,9216
3,8834
3,8495
3,8193
3,7921
3,7676
3,7454
3,7251
3,7066
3,6896
3,6739
3,6594
3,6460
3,5911
3,5510
3,5203
3,4960
3,4602
3,4350
3,4163
3,4019
3,3905
3,3735
3,3398
3,2905
89
Число
степеней
свободы, ν
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
90
Таблица П.3
Критические точки распределения Пирсона:
𝑷{𝝌𝟐𝝂 >𝝌𝟐𝜶 } = 𝜶
Уровень значимости α
0,01
6,63490
9,21034
11,3449
13,2767
15,0863
16,8119
18,4753
20,0902
21,6660
23,2093
24,7250
26,2170
27,6883
29,1413
30,5779
31,9999
33,4087
34,8053
36,1908
37,5662
38,9321
40,2894
41,6384
42,9798
44,3141
45,6417
46,9630
48,2782
49,5879
50,8922
63,6907
76,1539
88,3794
100,425
112,329
124,116
135,807
0,025
5,02389
7,37776
9,34840
11,1433
12,8325
14,4494
16,0128
17,5346
19,0228
20,4831
21,9200
23,3367
27,6883
29,1413
30,5779
31,9999
33,4087
34,8053
36,1908
37,5662
38,9321
40,2894
41,6384
42,9798
44,3141
45,6417
46,9630
48,2782
49,5879
50,8922
63,6907
76,1539
88,3794
100,425
112,329
124,116
135,807
0,05
3,84146
5,99147
7,81473
9,49773
11,0705
12,5916
14,0671
15,5073
16,9190
18,3070
19,6751
21,0261
24,7356
26,1190
27,4884
28,8454
30,1910
31,5264
32,8523
34,1696
35,4789
36,7807
38,0757
39,3641
40,6465
41,9232
43,1944
44,4607
45,7222
46,9792
59,3417
71,4202
83,2976
95,0231
106,629
118,136
129,561
0,95
0,003932
0,102587
0,351846
0,710721
1,145476
1,63539
2,16735
2,73264
3,32511
3,94030
4,57481
5,22603
5,89186
6,57063
7,26094
7,96164
8,67176
9,39046
10,1170
10,8508
11,5913
12,3380
13,0905
13,8484
14,6114
15,3791
16,1513
16,9279
17,7083
18,4926
26,5093
34,7642
43,1879
51,7393
60,3915
69,1260
77,9295
0,975
0,000982
0,050636
0,215795
0,484419
0,831211
1,237247
1,68987
2,17973
2,70039
3,24697
3,81575
4,40379
5,00874
5,62872
6,26214
6,90766
7,56418
8,23075
8,90655
9,59083
10,28293
10,9823
11,6885
12,4011
13,1197
13,8439
14,5733
15,3079
16,0471
16,7908
24,4331
32,3574
40,4817
48,7576
57,1532
65,6466
74,2219
0,99
0,000157
0,020101
0,114832
0,297110
0,554300
0,872085
1,239043
1,646482
2,087912
2,55821
3,05347
3,57056
4,10691
4,66043
5,22935
5,81221
6,40776
7,01491
7,63273
8,26040
8,89720
9,54249
10,1957
10,8564
11,5240
12,1981
12,8786
13,5642
14,2565
14,9535
22,1643
29,7067
37,4848
45,4418
53,5400
61,7541
70,0648
0,00
1
2
3
4
0,05
6
7
8
9
0,10
1
2
3
4
0,15
6
7
8
9
0,20
1
2
3
4
0,25
6
7
8
9
0,30
1
2
3
4
0,35
6
7
8
9
,000
0000
0100
0200
0300
0400
0500
0601
0701
0802
0902
1003
1104
1206
1307
1409
1511
1614
1717
1820
1923
2027
2132
2237
2342
2448
2554
2661
2769
2877
2986
3095
3205
3316
3428
3541
3654
3769
3884
4001
4118
,002
0020
0120
0220
0320
0420
0520
0621
0721
0822
0923
1024
1125
1226
1328
1430
1532
1634
1737
1841
1944
2048
2153
2258
2363
2469
2575
2683
2790
2899
3008
3117
3228
3339
3434
3564
3677
3792
3907
4024
4142
,004
0040
0140
0240
0340
0440
0541
0641
0741
0842
0943
1044
1145
1246
1348
1450
1552
1655
1758
1861
1965
2069
2174
2279
2384
2490
2597
2704
2812
2920
3029
3139
3250
3361
3473
3586
3700
3815
3931
4047
4165
,006
0060
0160
0260
0360
0460
0561
0661
0761
0862
0963
1064
1165
1267
1368
1471
1573
1676
1779
1882
1986
2090
2195
2300
2405
2512
2618
2726
2833
2942
3051
3161
3272
3383
3496
3609
3723
3838
3954
4071
4189
𝐀𝐫𝐜𝐭𝐡 𝐗
,008
0080
0180
0280
0380
0480
0581
0681
0782
0882
0983
1084
1186
1287
1389
1491
1593
1696
1799
1903
2007
2111
2216
2321
2427
2533
2640
2747
2855
2964
3073
3183
3294
3406
3518
3632
3746
3861
3977
4094
4213
X
0,50
1
2
3
4
0,55
6
7
8
9
0,60
1
2
3
4
0,65
6
7
8
9
0,70
1
2
3
4
0,75
6
7
8
9
0,80
1
2
3
4
0,85
6
7
8
9
Таблица П.4
,000
5493
5627
5763
5901
6042
6184
6328
6475
6625
6777
6931
7089
7250
7414
7582
7753
7928
8107
8291
8480
8673
8872
9076
9287
9505
0,973
0,996
1,020
1,045
1,071
1,099
1,127
1,157
1,188
1,221
1,256
1,293
1,333
1,376
1,422
,002
5520
5654
5791
5929
6070
6213
6358
6505
6655
6807
6963
7121
7283
7447
7616
7788
7964
8144
8328
8518
8712
8912
9118
9330
9549
0,978
1,001
1,025
1,050
1,077
1,104
1,133
1,163
1,195
1,228
1,263
1,301
1,341
1,385
1,432
,004
5547
5682
5818
5957
6098
6241
6387
6535
6685
6838
6994
7153
7315
7481
7650
7723
7999
8180
8366
8556
8752
8953
9160
9373
9594
0,982
1,006
1,030
1,056
1,082
1,110
1,139
1,169
1,201
1,235
1,271
1,309
1,350
1,394
1,442
,006
5573
5709
5846
5985
6127
6270
6416
6565
6716
6869
7026
7185
7348
7514
7684
7858
8035
8217
8404
8595
8792
8994
9202
9417
9639
0,987
1,011
1,035
1,061
1,088
1,116
1,145
1,175
1,208
1,242
1,278
1,317
1,358
1,403
1,452
,008
5600
5736
5874
6013
6155
6299
6446
6595
6746
6900
7057
7218
7381
7548
7718
7893
8071
8254
8441
8634
8832
9035
9245
9461
9684
0,991
1,015
1,040
1,066
1,093
1,121
1,151
1,182
1,214
1,249
1,286
1,325
1,367
1,412
1,462
91
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Гмурман, В.Е. Теория вероятностей и математическая статистика:
Учебное пособие для бакалавров / В.Е. Гмурман. - М.: Юрайт, 2013. - 479 c.
2. Горлач, Б.А. Теория вероятностей и математическая статистика:
Учебное пособие /Б.А. Горлач. - СПб.: Лань, 2013. - 320 c.
3. Джонсон Н., Лион Ф. Статистика и планирование экспе-римента в
технике и науке: Методы планирования экспе-римента. – М.: Мир, 1981. –
520 с.
4. Калинина, В.Н. Теория вероятностей и математическая статистика:
Учебник для бакалавров / В.Н. Калинина. - М.: Юрайт, 2013. - 472 c.
5. Климов, Г.П. Теория вероятностей и математическая статистика /
Г.П. Климов. -М.: МГУ, 2011. - 368 c.
6.
Кобзарь,
А.И.
Прикладная
математическая
статистика.
Для
инженеров и научных работников / А.И. Кобзарь. - М.: ФИЗМАТЛИТ, 2012. 816 c.
7. Колемаев, В.А. Теория вероятностей и математическая статистика:
Учебник / В.А.Колемаев, В.Н. Калинина. - М.: КноРус, 2013. - 376 c.
8. Красовский Г.И., Филаретов Г.Ф. Планирование экспе-римента. –
Мн.: Изд-во БГУ, 1982. – 302 с.
9. Кремер, Н.Ш. Теория вероятностей и математическая статистика:
Учебник для студентов вузов / Н.Ш. Кремер. - М.: ЮНИТИ-ДАНА, 2012. 551 c.
10. Лебедев, А.В. Теория вероятностей и математическая статистика:
Учебное пособие/ Л.Н. Фадеева, А.В. Лебедев; Под ред. проф. Л.Н. Фадеева. М.: Рид Групп, 2011. -496 c.
11. Павлов, С.В. Теория вероятностей и математическая статистика:
Учебное пособие/ С.В. Павлов. - М.: ИЦ РИОР, ИНФРА-М, 2010. - 186 c.
12. Прохоров В.Т. Планирование эксперимента: Учеб. посо-бие по
дисциплине "Основы науч. исслед." / Моск. тех-нол. ин-т. М, 1988. – 64 с.
92
13. Семенов, В.А. Теория вероятностей и математическая статистика:
Учебное пособие / В.А. Семенов. - СПб.: Питер, 2013. – 192 c.
14. Сидняев, Н.И. Теория вероятностей и математическая статистика:
Учебник для бакалавров / Н.И. Сидняев. - М.: Юрайт, ИД Юрайт, 2011.
– 219 c.
15. Спирина, М.С. Теория вероятностей и математическая статистика:
Учебник для студ. учреждений сред. проф. образования / М.С. Спирина, П.А.
Спирин. - М.: ИЦ Академия, 2012. - 352 c.
16. Чашкин, Ю.Р. Математическая статистика. Анализ и обработка
данных: Учебное пособие / Ю.Р. Чашкин; Под ред. С.Н. Смоленский. - Рн/Д:
Феникс, 2010. - 236 c.
93
Введение
ОГЛАВЛЕНИЕ
3
1. Обработка результатов эксперимента с помощью одномерной
выборки……………………………………………………………………….
6
1.1. Общие сведения……………………………………………………….
6
1.2. Методические указания………………………………………………
7
1.2.1 Точечный статистический анализ одномерной выборки………
7
1.2.2. Предварительная проверка нормальности распределения……
10
1.2.3. Графическое представление эмпирического распределения…
12
1.2.4. Интервальное оценивание……………………………………….
16
1.3. Задание для выполнения лабораторной работы…………………….
24
1.4. Порядок выполнения работы……………………………………
26
1.5. Содержание отчета……………………………………………………
28
1.6. Контрольные вопросы………………………………………………...
28
1.7. Пример выполнения работы………………………………………….
29
2. Эмпирические исследования выборок с помощью корреляционного и
регрессионного анализа……………………………………………………..
39
2.1. Общие сведения……………………………………………………….
39
2.2. Методические указания……………………………………………….
42
2.2.1. Определение коэффициента корреляции………………………
42
2.2.2. Доверительный интервал для коэффициента корреляции……
42
2.2.3. Проверка значимости коэффициента корреляции (проверка
гипотезы зависимости)…………………………………………………
43
2.2.4. Модели регрессионного анализа………………………………..
44
2.2.5. Построение линейной регрессионной модели методом
наименьших квадратов…………………………………………………
45
2.2.6. Определение качества аппроксимации…………………………
46
2.2.7. Диаграмма рассеяния (корреляционное поле) и график линии
регрессии………………………………………………………………...
48
2.3. Задание для выполнения лабораторной работы…………………….
48
94
2.4. Порядок выполнения работы…………………………………….
50
2.5. Содержание отчета……………………………………………………
53
2.6. Контрольные вопросы………………………………………………...
53
2.7. Пример выполнения работы………………………………………….
54
3. Определение количества измерений методом последовательного
анализа………………………………………………………………………..
59
3.1. Общие сведения………………………………………………………
59
3.2. Методические указания……………………………………………….
61
3.2.1. Погрешность однократных измерений…………………………
61
3.2.2. Совместный учет ошибки многократных и однократных
измерений……………………………………………………………….
64
3.2.3. Анализ промахов…………………………………………………
65
3.2.4. Определение числа опытов……………………………………...
68
3.2.5. Метод последовательного анализа при проведении
эксперимента……………………………………………………………
71
3.2.6. Рекомендации при определении объема эксперимента……….
73
3.2.7. Некоторые выводы……………………………………………….
75
3.3. Задание для выполнения лабораторной работы……………………..
76
3.4. Порядок выполнения работы…………………………………….
77
3.5. Содержание отчета……………………………………………………
79
3.6. Контрольные вопросы………………………………………………...
79
3.7. Пример выполнения работы………………………………………….
80
Основные понятия и определения………………………………………….
86
Таблицы математической статистики………………………………………
88
Библиографический список…………………………………………………
92
95
96
Скачать