Математическая обработка результатов измерения Лекция 2 Основы теория оценивания Проверка статистических гипотез Лектор: ст. преподаватель каф. ИИТ Вавилова Галина Васильевна 1 Содержание Статистические оценки 2. Точечная оценка параметров распределения 3. Интервальное оценивание параметров распределения 4. Проверка статистических гипотез 1. Сравнение средних 2. Сравнение дисперсий 3. Критерии согласия 1. 2 цель статистического анализа • исследование свойств случайных величин x1, x2, …, xn 3 Задачи статистического анализа Статистическое оценивание Построение статистических зависимостей Проверка статистических гипотез 4 Выборочный метод Генеральная совокупность Выборка Детальное исследование выборки 5 Статистические оценки Выборка x1, x2, …, xn Оцениваемый параметр Θ Оценка 6 Требование к оценкам Несмещенность • при любом объеме выборки n математическое ожидание оценки равно истинному значению искомого параметра. Эффективность • Оценку, которая при постоянном объеме выборки n имеет наименьшую возможную дисперсию. Состоятельность • Оценка при n →∞ стремится по вероятности к оцениваемому параметру. Устойчивость • Оценка характеризует чувствительность оценки к промахам и выбросам. 7 Точечная оценка параметров • числовая величина, которая и принимается за значение распределения искомого параметра Точечная оценка • среднее арифметическое значений признака генеральной совокупности Генеральное среднее • среднее арифметическое значение признака выборочной совокупности Выборочное • несмещенная оценка среднее 8 Генеральная и выборочная дисперсии Генеральная дисперсия Dг • среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения . Генеральное среднее квадратическое отклонение • квадратный корень из генеральной дисперсии. Выборочная дисперсия Dв • среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения. Выборочное среднее квадратическое отклонение • квадратный корень из выборочной дисперсии: 9 Оценка генеральной дисперсии Выборочная дисперсия • Смещенная оценкой Dг «Исправленная дисперсия» «Исправленное» среднее квадратическое отклонение 10 Выборочная и исправленная выборочная дисперсии Сравним формулы n . Dв (x i 1 i xв ) n k 2 и S 2 (x i 1 i xв ) 2 n 1 11 Методы получения оценок Cостоятельность Эффективности Несмещенность Метод максимального правдоподобия Метод моментов Метод порядковых характеристик Др. 12 Метод максимального правдоподобия 1. Доопытное распределение выборки х = (x1, x2, …, xn) 2. Плотность распределения f(x, Θ) 3. Функцией правдоподобия достигает максимума 4. Исследование функции правдоподобия на экстремум 13 ; Метод моментов Эмпирические моменты 1 n ~ k xi x n i 1 Теоретические моменты k 1 n k k xi n i 1 k k 1 , 2 ,..., n k k 1 , 2 ,..., n 14 Доверительный интервал и доверительная вероятность [Θi1; Θi2] • Доверительный интервал - интервал , в котором заключено истинное значение xi, т.е. P=1–α • Доверительная вероятность α • Уровень значимости [Θi1; Θi2] • оценка неизвестного параметра Θi. р • 0,90; 0,95; 0,98; 0,99 и реже 0,999 15 Интервальное оценивание 16 p1 p 2 t p t p t p 17 Интервальное оценивание мат. ожидания Нормальный закон с известной дисперсией • среднее арифметическое распределено нормально с дисперсией Нормальный закон с неизвестной дисперсией • среднее арифметическое распределено тоже нормально, оценка 18 Интервальная оценка дисперсии Интервальная оценка дисперсии уравнение относительно σ2 19 Пример Найти доверительный интервал для оценки с надежностью 0,95 мат. ожидания ь нормально распределенного признака X генеральной совокупности, если генеральное среднее квадратическое отклонение σ = 5, выборочная средняя = 14 и объем выборки n = 25. Решение. По условию задачи известно генеральное среднее квадратическое отклонение, поэтому доверительный интервал представим в виде Найдем Up из соотношения . По таблице значений функции Лапласа находим . Подставив данные, окончательно получим Искомый доверительный интервал 20 Пример Из генеральной совокупности извлечена выборка объема n = 10. Оценить с надежностью 0,95 мат. ожидание m нормально распределенного признака X генеральной совокупности по выборочной средней при помощи доверительного интервала. xi -2 1 2 3 4 5 ni Выборочную среднюю 2 1 2 2 2 1 , и исправленной среднее квадратическое отклонение По таблице распределения Стьюдента, по P = 0.95 и n = 10 находим t = 2,26. Искомый доверительный интервал определяется по формуле , Доверительный интервал 0,95. покрывает мат. ожидание m с надежностью 21 Пример По данным выборки объема n=16 из генеральной совокупности найдено «исправленное» среднее квадратическое отклонение S=1. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение σ с надежностью 0,95. Решение. Задача сводится к отысканию доверительного интервала . По таблице распределения Пирсона χ2 . 12 p 120.96 5,2 12 p 120.96 28,3 2 2 2 2 Доверительный интервал покрывает генеральное среднее квадратическое отклонение σ с надежностью 0,96. 22 Статистические гипотезы Статистическая гипотеза • любое предположение о виде неизвестного закона распределения или о параметрах известных распределений Параметрические гипотезы H 0 : m m0 ; • Гипотезы о значениях параметров распределений или о сравнительной величине параметров двух распределений H1 : m m0 Непараметрические гипотезы • Гипотезы о виде распределения 23 Где какая гипотеза: параметрическая и непараметрическая? Примеры статистических гипотез генеральная совокупность подчиняется нормальному закону распределения математические ожидания двух нормальных совокупностей равны между собой m1 m2 24 Проверить статистическую гипотезу • проверить, согласуются ли выборочные данные с выдвинутой гипотезой Нулевая (основная или проверяемая) гипотеза Конкурирующая (альтернативная) гипотеза • выдвинутая гипотеза, которая обозначается H0 • гипотеза H1 , которая противоречит нулевой гипотезе H 0 : m m0 ; H1 : m m0 или m m0 . 25 Пример. Нулевая и конкурирующая гипотезы Пусть основная гипотеза состоит в том, что математическое ожидание равно . Тогда альтернативная гипотеза может состоять в предположении, что математическое ожидание m не равно (больше или меньше) значению : H 0 : m m0 ; H1 : m m0 или m m0 . 26 Ошибки первого и второго рода Ошибка первого рода • состоит в том, что будет отвергнута верная гипотеза. Ошибка второго рода • состоит в том, что будет принята ложная гипотеза. Уровень значимости α • Вероятность совершения ошибки первого рода β ошибка второго рода • Вероятность не отклонить ложную гипотезу 27 Критическая область и область принятия гипотезы Статистический критерий • случайная величина (статистика), которую используется для проверки нулевой гипотезы Критическая область • множество возможных значений статистического критерия, при которых нулевая гипотеза отвергается. Область принятия гипотезы • множество возможных значений статистического критерия, при которых нулевая гипотеза принимается. Критические точки (квантили) • точки, которые разграничивают критическую область и область принятия гипотезы. 28 29 Порядок проверки статистической гипотезы задается уровень значимости α, выбирается статистический критерий К и вычисляется значение Ккр; по выборке вычисляется Кнабл; если Кнабл попадает в критическую область, нулевая гипотеза отвергается; при попадании Кнабл в область принятия гипотезы нулевая гипотеза принимается 30 Гипотезы о значениях числовых характеристик Гипотезы о равенстве среднего определенным числам m и . 0 значения m и дисперсии σ2 2 0 m0 - номинальное значение измеряемого параметра Точность прибора определяется значением прибор дает систематическую ошибку. , качество прибора не отвечает стандартным требованиям 31 Сравнение средних Сравнение средних — это проверка гипотезы о равенстве средних значений совокупностей, из которых получены выборки. 32 Сравнение средних 33 Сравнение дисперсий Дисперсия характеризует точность приборов, технологических процессов, риск, связанный с отклонением доходности от заданного уровня, и т. д. 34 Пример По результатам n=9 замеров установлено, что выборочное среднее время (в секундах) изготовления детали . Предполагая, что время изготовления – нормально распределенная случайная величина с дисперсией σ2=9, рассмотреть гипотезу против конкурирующей гипотезы . Доверительная вероятность P = 95%. Решение. На уровне P = 0,95 находим по таблицам нормального распределения (Функция Лапласа) Ukp = 1,96 . По формуле Так как , то гипотеза принимается. Выборка принадлежит генеральной совокупности со средним значением 35 Пример По утверждению руководства фирмы, средний размер дебиторского учета равен 187,5 тыс. руб. Ревизор составляет случайную выборку из 10 счетов и обнаруживает, что средняя арифметическая выборка равна 175 тыс. руб. при среднем квадратичном отклонении 35 тыс. руб. Может ли оказаться в действительности правильным объявленный размер дебиторского счета? Доверительная вероятность P=0.95. Решение. Здесь m = 187.5 тыс. руб., тыс. руб., n=10 , S=35, P=0.95. Так как дисперсия неизвестна, то для проверки гипотезы воспользуемся распределением Стьюдента. Тогда Число степеней свободных По таблице распределения Стьюдента при P=0.95 находим . Так как , то гипотеза H0 о среднем размере дебиторского счета принимается на уровне доверия P=0.95. 36 Пример По независимым данным объемами n1=31 и n2=25 вычислены выборочные 2 2 дисперсии S1 25, 0 и S2 16, 0 Необходимо проверить гипотезу о равенстве дисперсий исходных совокупностей на уровне значимости α = 0.01 . Решение. Так как объемы выборок сравнительно невелики, применим односторонний критерий Фишера. Вычислим статистику число степеней свободы k1 n1 1 31 1 30 , k2 n2 1 25 1 24 По таблице распределения Фишера находим критическое значение Так как , то гипотеза о равенстве дисперсий принимается. . 37 Спасибо за внимание! 38