ТЕМА 11. Статистическая проверка гипотез Оглавление. § 11.1

реклама
ТЕМА 11. Статистическая проверка гипотез
Цель контента темы 11 — изложить основные критерии проверки статистических гипотез.
Задачи контента темы 11:
• Сформулировать задачу проверки статистических гипотез.
• Изложить критерии проверки гипотез о законе распределения.
• Изложить критерии проверки параметрических гипотез.
Оглавление.
§ 11.1. Основные определения и идеи.
§ 11.2. Критерий согласия Колмогорова.
§ 11.3. Критерий согласия Пирсона.
§ 11.4. Проверка гипотез о параметрах нормального распределения.
– Сравнение исправленной выборочной дисперсии с гипотетической
дисперсией нормального распределения
– Сравнение выборочной средней с гипотетическим средним нормального распределения.
§ 11.1
Основные определения и идеи
Определение 11.1.1. Статистической гипотезой называется любое предложение о законе распределения генеральной совокупности или его параметрах.
Если гипотеза однозначно определяет распределение, то ее называют
простой . В противном случае — сложной.
Будем обозначать основную гипотезу H0 , H1 — альтернативную гипотезу.
Определение 11.1.2. Критерием проверки (критерием согласия) гипотезы гипотезы называют правило, согласно которому принимается решение:
принять или отвергнуть гипотезу.
Критерии согласия дают возможность установить: согласуются ли H0 с
экспериментальными данными или нет. Если согласуется, то H0 принимается, если нет — отвергается.
1
Например, H0 : ξ < 0, а все элементы выборки xi > 0, то гипотезу H0
следует отклонить.
Основная идея статистической проверки гипотез заключается в следующем. Рассматривается случайная величина ηn = ηn (x1 , . . . , xn ), которая
является функцией элементов выборки. Эту случайную величину называют статистической статистикой и ее распределение известно в предположении, что H0 верна.
Пусть известна плотность распределение вероятностей fηn (x) случайной
величины ηn . Если гипотеза H0 верна, то значения ηn должны с большей
вероятностью попадать в (D) (смотрите рисунок 11.1.1.).
y=fηn(x)
D
x
O
Рис. 11.1.1.
Вероятность P {ηn ∈ D/H0 } — велика, а вероятность P {ξ ∈ (D/H0 )} —
мала.
Область D называется критической областью. Она может быть двусторонней, как на рисунке 11.1.1, так и односторонней (право- или левосторонней).
Итак, пусть имеется выборка из генеральной совокупности случайной
величины ξ: x1 , x2 , . . ., xn . Вычисляем ηn . Если ηn ∈ D, то гипотеза H0
принимается, если ηn ∈ D, гипотеза отвергается.
Определение 11.1.2. Если отвергается истинная гипотеза, то говорят, что
совершается ошибка первого рода. Ее вероятность α называется уровнем
значимости.
Определение 11.1.3. Если принимается ложная гипотеза, то говорят, что
совершается ошибка второго рода. Обозначим вероятность этой ошибки β,
тогда вероятность 1 − β называется мощностью критерия.
§ 11.2
Критерий согласия Колмогорова
Пусть ξ — случайная величина, имеющая функцию распределения Fξ (x).
x1 , x2 , . . . , xn –выборка объема n из генеральной совокупности этой случайной величины.
Fn∗ (x) — эмпирическая функция распределения, построенная по данной
2
выборке, причем Fn∗ (x) стремится к Fξ (x) по вероятности, то есть
P
Fn∗ (x) −→ Fξ (x).
n→+∞
Введем статистику
Kn =
√
n max |Fn∗ (x) − Fξ (x)|.
(11.2.1)
Теоремы 11.2.1. Для функции распределения любой случайной величины ξ случайная величина Kn асимптотически распределена по закону Колмагорова, то есть
 +∞
 P (−1)m e−2m2 y2 , y > 0
FKn (y) = P {Kn < y} −→ K(y) =
n→+∞
 m=−∞
0
, y≤0
(11.2.2)
Для значений функции K(y) составлены таблицы распределения Колмагорова.
Таким образом распределение Kn известно при достаточно больших n.
Итак, выдвигаем в качестве основной гипотезу о виде функции распределения случайной величины ξ:
H0 : Fξ (x) = F0 (x),
где F0 (x) — гипотетическая функция распределения. Проверку этой гипотезы проводим по следующему алгоритму:
√
1. выбираем статистику ηn = n max |Fn∗ (x) − F0 (x)|. Если гипотеза H0
верна, то Fξ (x) = F0 (x) и ηn = Kn , то есть распределение ηn удовлетворяет (11.2.2)
2. задаем уровень значимости α — вероятность попасть в критическую
область;
3. Найдем по таблице λα такую, что P {Kn ≥ λα } = α, тогда критическая
область D = [λα ; +∞);
4. вычисляем ηn по выборке;
5. если ηn < λα , тогда гипотеза H0 принимается; если ηn ≥ λα , то гипотеза H0 отвергается.
Рекомендации по использованию критерия:
1. рекомендуется использовать критерий для выборок, объем которых
n ≥ 50;
3
2. для удобства рекомендуем составить таблицу 11.2.1.
Таблица 11.2.1.
Jk
ak =
[x0 ; x1 )
[x1 ; x2 )
...
[xl−1 ; xl )
§ 11.3
xk−1 + xk
F0 (ak ) |Fn∗ (ak ) − F0 (ak )|
2
a1
F0 (a1 ) |Fn (a1 ) − F0 (a1 )|
a2
F0 (a2 ) |Fn (a2 ) − F0 (a2 )|
...
...
...
al
F0 (al ) |Fn (al ) − F0 (al )|
Критерий согласия Пирсона
Рассмотрим случайную величину χ2n = ξ12 + ξ22 + . . . + ξn2 , где ξk — независимые случайные величины, распределенные нормально с параметрами
a = 0 и σ = 1, то есть ξ ∈ N (0, 1), k = 1, n.
Тогда плотность распределения χ2n имеет следующий вид:
fχ2n (x) =
x
n
1
2 −1 · e− 2 , x > 0,
·
x
2 Γ( n2 )
n
2
(11.3.1)
где Γ(α) — гамма-функция, то есть
Z +∞
Γ(α) =
xα−1 e−x dx.
0
Пусть получена выборка из генеральной совокупности ξ: x1 , x2 , . . . , xn .
Функция распределения ξ неизвестна. Выдвинем гипотезу
H0 : Fξ (x) = F0 (x),
где F0 (x) — известная гипотетическая функция распределения.
Алгоритм проверки этой гипотезы заключается в следующем.
1. Разбиваем всю область изменения случайной величины ξ на r не пересекающихся промежутков: ∆1 = (−∞; z1 ), ∆2 = [z1 ; z2 ), ∆r−1 =
(zr−2 ; zr−1 ), ∆r = (zr ; +∞).
2. Если гипотеза H0 верна и Fξ (x) = F0 (x), то можно найти вероятность
pk = P {ξ ∈ ∆k }, k = 1, r.
3. Рассмотрим случайную величину mk — количество членов выборки
попавших в промежуток ∆k , k = 1, r. Можно считать, что mk распределены по биномиальному закону с вероятностью успеха pk и количеством испытаний n (mk — число успехов). Тогда M mk = npk .
4
Кроме того по локальной теореме Муавра-Лапласа mk — асимптотически нормальны. Эти соображения приводят к тому, что выбирается
статистика
r
X
(mk − npk )2
ηn =
.
(11.3.2)
npk
k=1
Заметим, что
r
P
k=1
mk = n, а
n
P
pk = 1.
k=1
Теорема 11.3.1 (Теорема Пирсона). Какой бы ни была функция распределения случайной величины Fξ (x), Случайная величина ηn асимптотически распределена по χ2 (хи-квадрат) с r − 1 степенью свободы, то
есть
Z y
P
Fηn (y) = P {ηn < y} −→ Fχ2r−1 (y) =
fχ2r−1 (t)dt.
(11.3.3)
n→+∞
−∞
4. Зададим малое значение α — уровня значимости. Так как χ2 одностороннее распределение, критическая область D = [χ2r−1,α ; +∞), где
χ2r−1,α ищем с помощью таблицы распределения χ2 (см. §12 приложение 5) и условия
P {χ2r−1 ≥ χ2r−1,α } = α.
5. Вычисляем статистику ηn для данной выборки, используя F0 (x). Если
ηn < χ2r−1,α , то гипотезу принимаем. Если ηn ≥ χ2r−1,α , то гипотеза
отвергается.
Замечание 11.3.1. Если неизвестны параметры распределения F0 (x), то их
можно заменять выборочными оценками. При этом если заменить k параметров распределения на выборочные оценки, то предельное распределение
будет не χ2r−1 , а χ2r−1−k . Рекомендации по использованию критерия:
1. объем выборки должны быть не менее 100 (n ≥ 100);
2. количество интервалов должно быть не менее 10;
3. в каждом интервале не менее 5 элементов (mk ≥ 5);
4. при использовании критерия рекомендуется составить таблицу 11.3.1.
5
Таблица 11.3.1.
(mk − npk )2
∆k
mk pk = F0 (zk ) − F0 (zk−1 )
npk
(m1 − np1 )2
(−∞; z1 ) m1
p1
np1
(m2 − np2 )2
[z1 ; z2 )
m2
p2
np2
...
...
...
...
(mr − npr )2
[zr−1 ; +∞) mr
pr )
npr
r (m − np )2
P
k
k
ηn =
npk
k=1
Пример 11.3.1. Используя данные таблицы 11.3.2 проверить на уровне значимости α = 0, 05 гипотезу H0 , состоящую в том, что рост взрослого мужчины (случайная величина ξ) имеет нормальное распределение.
Таблица 11.3.2.
рост (см)
[143; 146) [146; 149) [149; 152) [152; 155) [155; 158)
число мужчин
1
2
8
26
65
рост (см)
[158; 161) [161; 164) [164; 170) [170; 173) [173; 176)
число мужчин
120
201
170
120
64
рост (см)
[176; 179) [179; 182) [182; 185) [185; 188]
число мужчин
28
10
3
1
N (a; σ) имеет два неизвестных параРешение: Нормальное распределение
√
метра a и σ: a = M ξ; σ = Dξ. Найдем оценки этих параметров методом
моментов:
½
â = xB
σ̂ = s2
(xB — выборочное среднее; s2 — исправленная выборочная дисперсия).
Найдем объем выборки n = 1 + 2 + 8 + 26 + 65 + 120 + 181 + 201 + 170 +
120 + 64 + 28 + 10 + 3 + 1 = 1000.
1
â = xB =
(144, 5 · 1 + 147, 5 · 2 + 150, 5 · 8 + 153, 5 · 26 + 56, 5 · 65 +
1000
159, 5 · 120 + 162, 5 · 181 + 165, 5 · 181 + 165, 5 · 201 + 168, 5 · 170 + 171, 5 ·
120 + 174, 5 · 64 + 177, 5 · 25 + 180, 5 · 10 + 183, 5 · 3 + 186, 5 · 1) = 165, 77.
1000 1
(
((144, 5)2 · 1 + (147, 5)2 · 2 + (150, 5)2 · 8 + (153, 5)2 · 26 +
99 1000
(56, 5)2 · 65 + (159, 5)2 · 120 + (162, 5)2 · 181 + (165, 5)2 · 181 + (165, 5)2 · 201 +
s2 =
6
(168, 5)2 · 170 + (171, 5)2 · 120 + (174, 5)2 · 64 + (177, 5)2 · 25 + (180, 5)2 · 10 +
(183, 5)2 · 3 + (186, 5)2 · 1) − (165, 77)2 ) = 34, 24.
Таким образом получены оценки â = 165, 77 и σ̂ 2 = 34, 24.
Составим таблицу типа 11.3.1. Следуя рекомендациям, некоторые интервалы придется объединить, с тем, чтобы в каждом интервале было не
менее пяти значений выборки. В частности, объединим первые три и последние три интервала.
Вычислим гипотетические вероятности pk , k = 1, 8, попадания гауссовской случайной величины ξ в про ∆k по формуле:
µ
¶
µ
¶
zk − â
zk−1 − â
pk = Φ 0
− Φ0
.
σ̂
σ̂
Например,
µ
¶
143 − 165, 77
p1 = Φ 0
+ 0, 5 = 0, 000032;
5, 85
µ
¶
µ
¶
152 − 165, 77
143 − 165, 77
p2 = Φ 0
− Φ0
= 0, 009;
5, 85
5, 85
(значение Φ0 (x) берем из таблицы значений функции Лапласа ( см. §12
приложение 2).
∆k
mk
(−∞; 143)
[143; 152)
[152; 155)
[155; 158)
[158; 161)
[161; 164)
[164; 167)
[167; 170)
[170; 173)
[173; 176)
[176; 179)
[179; 188)
[188; +∞)
0
11
26
65
120
181
201
170
120
64
28
14
0
(mk − npk )2
pk
npk
0, 000032
0
0, 009
0, 444
0, 023
0, 391
0, 058
0, 845
0, 115
0, 217
0, 175
0, 206
0, 204
0, 044
0, 184
1, 065
0, 127
0, 386
0, 067
0, 134
0, 027
0, 037
0, 010968
0, 818
0
0
ηn = 4, 587
При справедливости гипотезы H0 статистика ηn имеет распределение
Тогда критическая область D имеет вид D = (18, 3; +∞), а доверительная область D = [0; 18, 3].
χ210 .
7
Так как вычисленная по выборке статистика попадает в доверительную
область D, то с вероятностью 0, 95 (1 − α = 0, 95) можно утверждать, что
данные согласуются с гипотезой H0 .
Ответ: гипотеза H0 принимается.
§ 11.4
Проверка гипотез о параметрах нормального распределения
Сравнение исправленной выборочной дисперсии с гипотетической дисперсией нормального распределения
Пусть генеральная совокупность распределена нормально, причем дисперсия неизвестна, но есть основания предполагать, что она равна σ02 .
Пусть из генеральной совокупности извлечена выборка объема n и по
ней найдена исправленная выборочная дисперсия s2 . Требуется проверить
основную гипотезу, состоящую в том, что дисперсия генеральной совокупности σ 2 равна гипотетическому значению σ02 , то есть
H0 : σ 2 = σ02 .
(n − 1)s2
, коσ02
торая имеет распределение χ2 с k = n − 1 степенями свободы.
Критическая область строится в зависимости от альтернативной гипотезы.
Правило 11.4.1. Для того, чтобы при заданном уровне значимости проверить гипотезу H0 при альтернативной гипотезе H1 : σ 2 > σ02 , необходимо
вычислить значения критерия
Для проверки этой гипотезы рассматривают статистику
(n − 1)s2
.
χнабл. =
σ02
2
(11.4.1)
Затем по таблице критических точек распределения χ2 по заданному уровню значимости α и числу степеней свободы k = n − 1 найти критическую
точку χ2кр. (α; k).
Если χ2набл. < χ2кр. , то принимается основная гипотеза.
Если χ2набл. > χ2кр. — основную гипотезу отвергают.
Пример 11.4.1. Точность наладки станка-автомата, производящего некоторые детали, имеет нормального распределения и характеризуется дисперсией длины деталей. Если эта величина будет больше 400 мкм2 , станок
останавливается для наладки. Выборочная дисперсия длины 15 случайно
8
отобранных деталей из продукции станка оказалась равной s2 = 680мкм2 .
Нужно, ли производить наладку станка, если α = 0, 001?
Решение: Основная гипотеза будет заключаться в том, что дисперсия
генеральной совокупности σ 2 = 400мкм2 , то есть H0 : σ 2 = 400мкм2 .
Тогда станок следует остановить для наладки.
χ2набл. =
(15 − 1) · 680
= 23, 8
400
χ2кр. (0, 01; 14) = 29, 1
Так как 23, 8 < 29, 1, то есть χ2набл. < χ2кр. , принимается основная гипотеза H0 . Следовательно, станок останавливать не требуется.
Ответ: нет.
Правило 11.4.2. При альтернативной гипотезе H1 : σ 2 6= σ02 находят левую χ2лев.кр. (1 − α2 , k) и правую χ2прав. кр. ( α2 , k) критические точки.
Если χ2лев.кр. < χ2набл. < χ2пр.кр. , то принимается основная гипотеза
H0 .
Если χ2набл. > χ2пр.кр. , то основную гипотезу отвергают.
Правило 11.4.3. При альтернативной гипотезе H1 : σ 2 < σ02 находят критическую точку χ2кр. (1 − α, k).
Если χ2набл. > χ2пр.кр. (1 − α, k), то основная гипотеза принимается.
Если χ2набл. > χ2кр. (1 − α, k), то основную гипотезу отвергается.
Сравнение выборочной средней с гипотетическим средним нормального распределения.
Пусть генеральная совокупность ξ распределена нормально, причем
средняя генеральной совокупности неизвестна, но есть основания полагать,
что она равна гипотетическом значению a0 .
Предположим, что дисперсия генеральной совокупности известна. Из
генеральной совокупности извлечена выборка объема n и по ней найдена
выборочная средняя xB . Требуется по выборочной средней при заданном
уровне значимости проверить гипотезу H0 : a = a0 о равенстве средней
генеральной совокупности a гипотетическому значению a0 .
Правило 11.4.4. Пусть альтернативная гипотеза H1 : a 6= a0 . Для того,
чтобы принять или отвергнуть гипотезу H0 при заданном уровне значимости α необходимо вычислить статистику
√
(x − a0 ) n
Uнабл. =
(11.4.2)
σ
9
Затем по таблице функции Лапласа (§12 приложение 2) найти критическую
точку uкр. из равенства
1−α
Φ(uкр. ) =
.
2
Если |Uнабл. | < uкр. , гипотеза H0 принимается.
Если |Uнабл. | ≥ uкр. , гипотеза H0 отвергается.
Пример 11.4.2. Из нормальной генеральной совокупности с известным
средним квадратическим отклонением σ = 40 извлечена выборка объема
n = 64 и по ней найдена выборочная средняя x = 136, 5. Требуется при
уровне значимости 0, 01 проверить гипотезу H0 : a = 130 при конкурирующей гипотезе H1 : a 6= 130.
Решение: Найдем Uнабл.
√
(136, 6 − 130) · 64 6, 5 · 8
Uнабл. =
=
= 1, 3.
40
40
Теперь найдем uкр. .
Φ(uкр. ) =
1 − 0, 01
= 0, 495.
2
По таблице значений функции Лапласа (см. §12 приложение 2) определяем
uкр. = 2, 58.
|Uнабл. | = Uнабл. < uкр.
Следовательно, гипотеза H0 принимается.
Правило 11.4.5. При альтернативной гипотезе H1 : a > a0 критическую
точку находят из равенства
Φ(uкр. ) =
1 − 2α
.
2
При этом, если Uнабл. < uкр. , гипотеза H0 принимается, если Uнабл. ≥
uкр. , то гипотеза отвергается.
Правило 11.4.6. При альтернативной гипотезе H1 : a < a0 сначала находят вспомогательную критическую точку по правилу 11.4.5, а затем полагают
u0кр. = −uкр.
Если
Если
Uнабл. > u0кр. , гипотеза H0 принимается.
Uнабл. ≤ u0кр. , то гипотеза H0 отвергается.
10
Выводы.
• При рассмотрении критериев согласия были изложены основные распределения математической статистики: распределение χ2 и распределение Колмагорова.
• Проверка гипотез подчеркивает прикладную значимость математической статистики в целом, так как имеет индуктивное построение: при
изучении кого-либо признака мы идем от наблюдений к гипотезе, и
затем либо принимаем ее, либо отвергаем.
Вопросы для самопроверки.
1. Что называют статистической гипотезой?
2. Какую статистическую гипотезу называют простой?
3. Какую область называют критической областью статистического критерия?
4. Какое событие называют ошибкой первого рода?
5. Что такое уровень значимости статистического критерия?
6. Запишите, какую статистику используют в критерии Пирсона.
7. Запишите, какую статистику используют в критерии Колмагорова.
Библиография.
1. Вентцель Е.С. Теория вероятностей. Москва, 2003.
2. Гмурман В.Е. Теория вероятностей и математическая статистика. Москва,
1997.
3. Гмурман В.Е. Руководство к решению задач по теории вероятностей
и математической статистике. Москва, 1997.
4. Буре В.М. , Евсеев Е.А., Кирпичников Б.К. Лекции по теории вероятностей и математической статистике. Санкт-Петербург, МБИ, 2004.
5. Кремер Н.Ш. Теория вероятностей и математическая статистика. Москва,
2004.
11
6. Общий курс высшей математики для экономистов (под редакцией
В.И.Ермакова). Москва, ИНФРА-М, 2005.
12
Скачать