Глава 8. Статические оценки параметров распределения. 8.1. Точечные оценки. 8.1.1. Пусть дано распределение изучаемого признака Х генеральной совокупности (ГС), содержащей неизвестный параметр . Например это параметр в распределении Пуассона. Так как исследование всех элементов ГС не представляется возможным, то о параметре судят по выборке, состоящей из значений x1 , x2 ,..., xn . Эти значения можно рассматривать как значения n независимых случайных величин X 1 , X 2 ,..., X n , имеющих тот же закон распределения, что и изучаемый признак Х. Статистической оценкой n* неизвестного параметра называют функцию результатов наблюдений над случайной величиной Х: n* = n* X 1 , X 2 ,..., X n . (8.1.1) Так как X 1 , X 2 ,..., X n - случайные величины, то и оценка n* является случайной величиной, зависящей от закона распределения Х и числа n. Точечной оценкой параметра называют статистическую оценку, которая определяется одним числом n* = f x1 , x2 ,..., xn по результатам n наблюдений x1 , x2 ,..., xn признака Х. Отметим основные требования к точечным оценкам. 1. Оценка n* должна быть несмещенной, т.е. ее математическое ожидание равно оцениваемому параметру при любом объеме n выборки; M n* . (8.1.2) В противном случае оценка называется смещенной. 2. Оценка n* должна быть состоятельной, т.е. сходиться по вероятности к параметру : limn P n* 1 . (8.1.3) Если оценка состоятельна, то практически достоверно, что при достаточно большом n n* . 3. Несмещенная оценка n* должна быть эффективной, т.е. иметь наименьшую дисперсию среди всех несмещенных оценок параметра . Так как для несмещенной оценки n* ее дисперсия *2 определяется в виде n 2 * n M n* 2 , (8.1.4) то эффективность является определяющим качеством оценки. 8.1.2. Оценка генеральной доли. Пусть в ГС объема N M элементов обладают признаком Х. 1 В качестве точечной оценки генеральной доли p M берется выборочная доля N m , где n – объем выборки, m – количество элементов выборки, обладающие n признаком Х. m Для повторной выборки выборочная доля является несмещенной и n M состоятельной оценкой генеральной доли p , причем ее дисперсия N 2 pq n , (8.1.5) где q 1 p , стремится к нулю при увеличении объема выборки. m также является n несмещенной и состоятельной оценкой генеральной доли, причем, если объем ГС Для бесповторной выборки выборочная доля значительно больше объема выборки, то и дисперсия 2 выборочной доли практически совпадает с (8.1.5). Пример 8.1.1. В таблице приведены результаты измерения роста случайной отобранных 100 студентов (юношей). Рост Число студентов 160-165 165-170 170-175 175-180 180-185 185-190 190-195 3 21 27 23 14 10 2 Найти несмещенную и состоятельную оценку доли студентов с ростом не менее 175 см. Решение. Оценкой доли p X 175 является выборочная доля X 175 . X 175 23 14 10 2 0, 49 . 100 8.1.3. Оценка генеральной средней. Выборочная средняя X B повторной выборки является несмещенной и состоятельной оценкой генеральной средней X Г , причем ее дисперсия 2 XB 2 n , (8.1.6) где 2 - генеральная дисперсия признака Х, n – объем выборки, стремится к 0 при n 0. Для бесповторной выборки выборочная средняя XB также является несмещенной и состоятельной оценкой генеральной средней. 2 Отметим, что если N n , то бесповторная выборка практически не отличается от повторной. Пример 8.1.2. Найти несмещенную и состоятельную оценку среднего роста студентов по данным выборки 8.1.1. Решение. По данным вариационного ряда найдем xB . 162,5 3 167,5 21 172,5 27 177,5 23 182,5 14 187,5 10 192,5 2 = 100 175, 6 . xB 8.1.4. Оценка генеральной дисперсии. Выборочная дисперсия DB повторной и бесповторной выборок является смещенной и состоятельной оценкой генеральной дисперсии 2 , так как n 1 2 M DB , (8.1.7) n где n – объем выборки. Несмещенной оценкой генеральной дисперсии служит генеральная выборочная дисперсия S 2 , вычисляемая по формуле n S2 DB . (8.1.8) n 1 Пример 8.1.3. Найти несмещенную и состоятельную оценку генеральной дисперсии случайной величины Х – рост студента, по данным выборки примера 8.1.1. Решение. Вычислим смещенную оценку DB X по формуле DB X DB U U 2 U , 2 (8.1.9) где U i xi c - условные варианты. В качестве с возьмем высокочастотную варианту 172,5, составим распределение условных вариант Ui ni -10 3 -5 21 0 27 5 23 10 14 15 10 20 2 и вычислим U и U 2 . U i ni 3,1 U 100 U i2 ni 58,5 U2 100 И DB X 58,5 3,1 48,89 . 2 Исправленная выборочная дисперсия n 100 S2 DB 48,89 49,38 . n 1 99 Заметим, что при достаточно больших n 30 различие между DB и S 2 практически незаметно. 3 8.2. Интервальные оценки. Для малых объемов выборки точечная оценка может значительно отличаться от исследуемого параметра. В этом случае используется интервальная оценка. Интервальной оценкой параметра называется числовой интервал 1 , 2 , который с заданной вероятностью накрывает неизвестное значение . Такой интервал называют доверительным, а вероятность - доверительной вероятностью или надежностью оценки. Зачастую доверительный интервал выбирают симметричным относительно исследуемого параметра , т.е. ; . 4