М.В.Дубатовская. Теория вероятностей и математическая статистика Лекция 14 § 5. Статистические оценки параметров распределения Пусть изучается некоторый количественный признак генеральной совокупности. Допустим. что из теоретических соображений удалось установить, какое именно распределение имеет наблюдаемый признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. В нашем распоряжении имеются лишь данные выборки, например, значения качественного признака x1, x 2 ,..., xn . Их рассматриваем как значения независимых СВ X1, X 2,..., X n . Найти оценку неизвестного параметра теоретического распределения – значит найти функцию от наблюдаемых СВ, которая дает приближенное значение оцениваемого параметра. Например, для оценки математического ожидания нормального распределения X1 X 2 ... X n служит функция X . n Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых СВ. Чтобы оценки давали хорошие приближения параметров распределения, они должны удовлетворять определенным требованиям. Пусть * - статистическая оценка параметра теоретического распределения. до- пустим, что по выборке объема n найдена оценка 1* . Повторим опыт, т.е. извлечем другую выборку из генеральной совокупности. Получим оценку *2 . Повторяя опыт многократно, получим числа 1*, *2 ,..., *k , которые, вообще говоря, различны между собой. Таким образом, оценку * можно рассматривать как СВ, а числа 1*, *2 ,..., *k как ее возможные значения. Если каждая такая оценка дает значение с недостатком (с избытком), то и среднее значение M ( * ) ( M ( *) ), т.е. больше или меньше истинного значения . Т.о. использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим (одного знака) ошибкам измерения. Систематическими ошибками называют неслучайные ошибки, искажающие результат измерений в одну сторону. Поэтому естественно требовать, чтобы M ( * ) . Это требование гарантирует от систематических ошибок. Несмещенной называют статистическую оценку, математическое ожидание от которой равно оцениваемому параметру при любом объеме выборки. Однако несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра. Возможные значения * могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия D( * ) может быть значительна. В этом случае найденная по данным выборки оценка 1* может оказаться весьма удаленной от среднего значения * , а, значит, и от самого оцениваемого параметра . Приняв 1* в качестве приближенного значения , мы допустили бы большую ошибку. Если потребовать, чтобы дисперсия * была малой, то возможность допустить большую ошибку будет исключена. К оценке предъявляется требование эффективности. Эффективной называется статистическая оценка, которая при заданной объеме выборки дает наименьшую возможную дисперсию. М.В.Дубатовская. Теория вероятностей и математическая статистика При рассмотрении выборок большого объема к статистическим оценкам предъявляют требование состоятельности. Состоятельной называется статистическая оценка, которая при n стремится по вероятности к оцениваемому параметру, т.е. * lim ( P ) 1 n Если дисперсия несмещенной оценки при n зывается и состоятельной. 0. стремится к нулю, то такая оценка ока- § 6. Средние значения Генеральная средняя Пусть изучается дискретная генеральная совокупность относительно количественного признака X . Генеральной средней x Г называется среднее арифметическое значений признака генеральной совокупности: x1 x2 ... xN . xГ N Если значения признака x1 , x2 ,..., xk имеют частоты N1 , N 2 ,..., N k , причем N1 N 2 ... N k N , то xГ x1 N1 x2 N 2 ... xk N k . N Выборочная средняя – среднее арифметическое значений признака выборочной совокупности: x1 x2 ... xn xВ . n n1 Если значения n2 ... nk n , то признака xВ x1 , x2 ,..., xk x1n1 имеют частоты n1 , n2 ,..., nk , причем x2 n2 ... xk nk . n Пусть из генеральной совокупности извлечена повторная выборка объема n со значениями признака x1 , x2 ,..., xn . Будем считать эти значения различными. Пусть генеральная средняя x Г неизвестна. Требуется оценить ее по выборочным данным. В качестве оценки генеральной средней примем выборочную среднюю x1 x2 ... xn xВ . n Оказывается, что это несмещенная оценка. Покажем, что математическое ожидание этой оценки равно x Г . Рассмотрим x В как СВ, а x1 , x2 ,..., xn как значения независимых одина- М.В.Дубатовская. Теория вероятностей и математическая статистика ково распределенных СВ X 1 , X 2 ,..., X n . Эти величины одинаково распределены, значит, имеют одинаковые математические ожидания a . Математическое ожидание среднего арифметического: M ( xВ ) M( X1 X 2 ... X n ) n a. Каждая из СВ X 1 , X 2 ,..., X n имеет то же распределение, что и генеральная совокупность, следовательно, числовые характеристики распределений этих СВ и генеральной совокупности одинаковы. В частности, математическое ожидание a каждой из величин равно математическому ожиданию признака X генеральной совокупности: M (X ) xГ a Значит, M ( xВ ) xГ , т.е. выборочная средняя есть несмещенная оценка генеральной средней. Можно показать, что выборочная средняя является состоятельной оценкой генеральной средней. Если допустить, что СВ X 1 , X 2 ,..., X n имеют ограниченные дисперсии, то по X 1 X 2 ... X n теореме Чеьышева X В стремится по вероятности к математическому n ожиданию a . Поскольку xГ a , то и к x Г . Если по нескольким выборкам достаточно большого объема из одной этом состоит свойство устойчивости выборочных средних. Допустим, что все значения количественного признака X разбиты на несколько групп. Рассматриваем каждую из групп как самостоятельную совокупность. Находим среднюю арифметическую. Групповой средней называется среднее арифметическое значений, принадлежащих группе. Общей средней называется среднее арифметическое значений признака, принадлежащих всей совокупности. Зная групповые средние и объемы групп можно найти общую среднюю. Общая средняя равна средней арифметической групповых средних, взвешенных по объемам групп.