Лекция 7 (продолжение) Проверка статистических гипотез « критерии согласия » 1 Критерий согласия хи-квадрат Пирсона Разработан первоначально для дискретных распределений: Статистический ряд: X P X v x1 v1 x1 p1 xL vL xL pL v1 vL N Нулевая гипотеза: исследуемая случайная величина имеет заданный закон распределения. 2 Статистика критерия: 2 2 X1, X 2 , L , XL l 1 vl Npl 2 Npl Является мерой близости теоретических вероятностей Рl и эмпирических (экспериментальных) частот vl Имеет асимптотическое (при n -->oo ) распределение хи-квадрат. Число степеней свободы равно: • L-1, если распределение полностью задано. • L - 1 - r, если дополнительно оценивается r неизвестных параметров распределения. 3 Для нахождения критической области необходимо по заданной вероятности ошибки первого рода (уровню значимости критерия) найти квантиль хи-квадрат распределения на уровне 1- . 1 1- Область принятия гипотезы C Критическая область 4 Подсчитываем значение статистики критерия и сравниваем его с критической точкой. Если 2 C То нулевая гипотеза отвергается. В противном случае она принимается на уровне значимости Критерий легко приспосабливается и для непрерывных распределений путем их дискретизации. Проверку гипотезы удобно совмещать с построением гистограмм. 5 Пять шагов проверки гипотезы 1. Сформулировать нулевую H0 и альтернативную H1 гипотезы. 2. Выбрать статистику критерия T(X) и уяснить её закон распределения. . 3. Задать уровень значимости критерия По таблицам квантилей распределения статистики найти критические точки и указать критическую область. 4. Подсчитать значение статистики критерия и проверить условие попадания в критическую область. 5. Сделать вывод о принятии нулевой или альтернативной гипотезы. 6 Простейшие параметрические гипотезы Гипотезы о среднем значении гауссовской случайной величины Дано: Проведено две серии независимых испытаний одинакового объема, по результатам которых получены оценки математического ожидания a0 и a1. Проверить нулевую гипотезу: a0 = a1 . 7 Случай 1. Дисперсия известна и равна 2 Статистика критерия a1 X 1 , a0 X 0 T a1 a0 D a1 a0 a1 a0 2 2 a1 a0 2 n n Имеет стандартное распределение 8 Выбор критической области зависит от вида альтернатив. Альтернатива первая: H1 : a0 a1