Оценка значимости (достоверности) результата исследования. Доверительные оценки параметров. Пусть в результате статистического наблюдения получен ряд из n независимых измерений дискретных случайных величин Х1, Х2, …, Хn (т.е. выборка). Требуется оценить истинное значение а (т.е. для генеральной совокупности, из которой взяты выборки объемом n) измеряемой величины. Это значит: а) указать такую функцию g (Х1, Х2, …, Хn) от результатов измерений, которая дает достаточно хорошее приближение к значению а. Такая функция называется точечной оценкой или просто оценкой значения а ; g (Хi) a при п . б) указать границы интервала (g- X , g+ X ), который с заданной вероятностью Р покрывает истинное значение а. Такая оценка называется доверительной оценкой, вероятность Р – доверительной вероятностью (надежностью, достоверностью), интервал (g- X , g+ X ) – доверительным интервалом (точностью), а его границы – доверительными границами. Обычно доверительная вероятность задается в виде одного из трех уровней: 0.95, 0.99 или 0.999. Если все n измерений величины а произведены с одинаковой точностью (равноточные измерения), то в качестве оценки истинного значения а измеряемой СВ применяют среднее арифметическое значение результатов измерений. Если измерения не являются равноточными, но известны веса измерений, то в качестве оценки истинного значения СВ применяют среднее взвешенное значение. Таким образом, g (Х1, Х2, …, Хn) = X . При бесконечно большом числе измерений истинное значение измеряемой случайной величины равно среднему значению всех случайных величин, т.е. a X при n . Чем больше величина доверительного интервала ( X - X , X + X ), т.е. чем больше задаваемая погрешность результата измерений X , тем с большей надежностью искомая величина а попадет в этот интервал: X P . Естественно, что величина надежности будет зависеть от числа измерений n , а также от величины задаваемой погрешности X : n X . Доверительный интервал X , который покрывал бы истинное значение а случайной величины Хi с доверительной вероятностью Р, определяется по формуле X t ( P, n 1) a t ( P, n 1) n . 2 А для самого истинного значения а случайной величины можно записать выражения a X X X t ( P, n 1) n , или X t ( P, n 1) n a X t ( P, n 1) n , X [ X X , X X ] где X – среднее значение СВ, – среднеквадратичное отклонение, n – число измерений СВ, Р – доверительная вероятность, t – коэффициент Стьюдента. ( X X ) – нижняя граница доверительного интервала, ( X X ) – верхняя граница доверительного интервала. Коэффициент Стьюдента определяется из таблиц и зависит от доверительной вероятности Р и числа степеней свободы f = n-1. Называется он так в честь ученого, предложившего этот параметр в 1908 г., – английского статистика и химика В.С. Госсета, работавшего в пивоваренной промышленности и публиковавшего свои работы под псевдонимом "Стьюдент" (студент). Если, например, задана доверительная вероятность 95% , то уровень значимости в этом случае будет равняться 5%. Для этих параметров в таблице приведены для примера значения коэффициентов Стьюдента f (или n-1) t 1 12.71 2 4.3 5 2.57 10 2.23 20 2.09 1.96 Величину = 1 – Р, называют уровнем значимости. – это положительное малое число, которое говорит об ошибке результата исследования. Приближенная оценка величины доверительного интервала по правилу трех сигм Так как выбор надежности доверительной оценки допускает некоторый произвол, в практике статистической обработки результатов широкое распространение получило правило трех сигм: Отклонение истинного значения случайной величины от среднего арифметического значения результатов измерений не превосходит утроенной средней квадратической ошибки генеральной совокупности. Таким образом, правило доверительную оценку a X 3 a , или aX 3 n трех сигм представляет собой X 3 n a X 3 n 3 . Надежность этой оценки существенно зависит от количества измерений n в выборке. Зависимость Р от количества измерений n для правила трех сигм указана в следующей таблице n P 5 0.960 6 0.970 8 0.980 10 0.985 14 0.990 16 0.991 18 0.992 20 0.993 25 0.994 30 0.995 50 0.996 150 0.997 0.9973 Обычно для сгруппированного ряда применяют правило трех сигм с исправленной эмпирической дисперсией * 2 h 2 / 12 , где h 2 / 12 – поправка Шеппарда, h – ширина градации. Необходимое количество измерений Увеличивая количество измерений даже при неизменной их точности, можно n увеличить надежность доверительных оценок или сузить доверительный интервал для истинного значения случайной величины. a X t ( P, n 1) n . Предположим, величина доверительного интервала для выборки из n1 значений равна X 1 . Мы хотим сузить величину X 1 в m раз. Каков должен быть объем выборки для достижения этой цели? X 1 t ( P, n1 1) X 2 n1 , X 1 t ( P, n1 1) t ( P, n1 1) , m m n1 m 2 n1 Т.е. n 2 m 2 n1 . Таким образом, уменьшение доверительного интервала в увеличением количества измерений в m2 m раз обеспечивается раз. Например, уменьшение доверительного интервала в 2 раза обеспечивается увеличением количества измерений в 4 раза. Необходимое количество измерений для достижения требуемой достоверности Р можно определить заранее, задавая величину отношения q X / (т.е. задавая величину доверительного интервала X в долях от с.к.о., например, 0.5 или 0.1 ). Для определения количества измерений n в зависимости от q и Р применяется таблица 4 P q 1.0 ( X ) 0.5 ( X 0.5 ) 0.4 0.3 0.2 0.1 0.05 0.95 7 18 27 46 99 387 1540 0.99 11 31 46 78 171 668 2659 На практике можно ограничиться меньшим числом измерений, если применить следующий прием. Сначала нужно произвести сравнительно небольшое количество измерений (в 3-4 раза меньше указанного в таблице). По результатам этих измерений рассчитать доверительный интервал. Затем уточнить необходимое количество измерений из тех соображений, что уменьшение доверительного интервала в m раз обеспечивается увеличением количества измерений в m2 раз. Например, уменьшение доверительного интервала в 2 раза обеспечивается увеличением количества измерений в 4 раза. Односторонние и двухсторонние значения вероятностей Если нам известен закон распределения СВ (пусть – дискретной), то в этом случае очень часто приходится решать задачи, по крайней мере, трех стандартных типов: какова вероятность того, что случайная величина X окажется равной (или наоборот – не равной) некоторому значению, например – Xk ? какова вероятность того, что случайная величина X окажется больше (или наоборот – меньше) некоторого значения, например – Xk ? какова вероятность того, что случайная величина X окажется не меньше Xi и при этом не больше Xk ? Первую вероятность иногда называют точечной, ее можно найти из закона распределения, но только для дискретной случайной величины. Разумеется, что вероятность равенства задана самим законом распределения, а вероятность неравенства составляет P(X # Xk) = 1 – P(X = Xk). Вторую вероятность принято называть односторонней. Вычислять ее также достаточно просто – как сумму вероятностей всех допустимых значений, равных и меньших Xk . Вероятность третьего типа называют двухсторонней и вычисляют как сумму вероятностей значений X внутри заданного интервала. Односторонняя и двухсторонняя вероятности являются универсальными понятиями – они применимы как для дискретных, так и для непрерывных случайных величин.