d= P N - генеральная доля (удельный вес статистических единиц генеральной совокупности, обладающих данным значением признака), где P- число единиц генеральной совокупности, обладающих данным значением признака. X - генеральная средняя (среднее арифметическое значение признака в генеральной совокупности). σ 2 - генеральная дисперсия (дисперсия исследуемого признака в генеральной совокупности). σ - генеральное среднеквадратического отклонения (среднее квадратическое отклонение исследуемого признака в генеральной совокупности). Для их определения сформирована выборочная совокупность объемом n статистических единиц ( n << N ), обладающая аналогичными характеристиками: ω - выборочная доля (удельный вес статистических единиц, обладающих данным значением признака в выборочной совокупности). ~ x - выборочная средняя (среднее арифметическое значение признака в выборочной совокупности). S 2 - выборочная дисперсия (дисперсия исследуемого признака в выборочной совокупности). S – выборочное среднее квадратическое отклонение (среднее квадратическое отклонение изучаемого признака в выборке). Необходимо на основе известных характеристик выборки получить статистические оценки характеристик генеральной совокупности. 8.2. Статистические генеральной совокупности оценки параметров (характеристик) Статистической оценкой или статистикой характеристики (параметра) генеральной совокупности называют приближенное значение искомой характеристики (параметра), полученное по данным выборки. В статистике используются два вида оценок - точечные и интервальные. Точечной статистической оценкой параметра генеральной совокупности называется конкретное числовое значение искомой характеристики. Интервальная оценка представляет собой числовые интервалы, предположительно содержащие значение параметра генеральной совокупности. Качество статистических оценок определяется следующими их свойствами: • Состоятельность 151 Оценка считается состоятельной, если при неограниченном ⎯→ ∞ (N)], ее ошибка стремится к 0: увеличении объема выборки [ n ⎯ ~ lim(α − α ) = 0 , т. к. при n ↑ lim α~ = α ; n→∞ n →∞ где α - значение характеристики генеральной совокупности; α~ - значение характеристики выборки; α~ − α - ошибка выборки. • Несмещенность Оценка считается несмещенной, если при данном объеме выборки n математическое ожидание ошибки равно 0.Для несмещенной оценки ее математическое ожидание точно равно математическому ожиданию характеристики выборки: M [α~ − α ] = 0 или M [α~ ] = M [α ] . Несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра, так как возможные значения получаемой оценки могут быть сильно рассеяны вокруг своего среднего значения. Поэтому оценка должна соответствовать еще одному требованию – эффективности. • Эффективность Оценка считается эффективной, если ее ошибка, называемая ошибкой выборки, является величиной минимальной. В математической статистике доказывается, что ошибка выборки определяется как: μ (α~ ) = M 2 [α~ − α ] + S 2 ; где M 2 [α~ − α ] - квадрат математического ожидания ошибки выборки; S 2 - выборочная дисперсия. Оценка эффективна, если выполняется условие: μ (α~) → min . Для точечных оценок справедливы следующие утверждения: • Точечной оценкой генеральной доли является выборочная доля, то есть d ∼ ω . • Точечной оценкой генеральной средней является выборочная средняя, то есть x ∼ ~x . Таким образом, заранее известно, что оценки для указанных параметров являются состоятельными и несмещенными. Для остальных параметров генеральной совокупности это утверждение не является справедливым, то есть σ 2 ≠ S 2 , а σ ≠ S . В математической статистике доказывается, что точечной оценкой генеральной дисперсии является выборочная дисперсия, откорректированная на отношение увеличении n n , n −1 то есть σ 2 = S 2 × n ; n −1 при n → 1 , поэтому в выборках, объемом больше 30 единиц n −1 наблюдения, указанным отношением можно пренебречь. 152