Статистическая проверка гипотез

реклама
Методы анализа
данных
Статистическая
проверка гипотез


Общая схема проверки гипотез.
Проверка гипотез:
 о математическом ожидании;
 о дисперсиях;
 о равенстве математических ожиданий;
 о выявлении аномальных измерений;
 об однородности ряда дисперсий;
 о согласованности выбранного закона распределения
и гистограммы.
Общая схема проверки гипотез
f ( x| H1 )
f ( x| H 2 )
b a
G1
c
x
G2
Х – случайная величина.
Н1, Н2 – гипотезы.
f(x|Н1), f(x|Н2) – условные
плотности
Решающее правило: если x<c, то верна гипотеза Н1; если
x>c, то верна гипотеза Н2, где с – порог.
Условные вероятности ошибочных решений:
α – вероятность принять Н2, в то время как верна Н1;
β – вероятность принять Н1, в то время как верна Н2.
Общая схема проверки гипотез
Произведем сжатие этой информации: z=z(x1,…,xn).
Здесь z(·) – известная функция.
Исследователя интересуют не две гипотезы,
а одна: H1=H. При этом известна только
плотность распределения f(z|H).
f ( z| H 1 )
p
a
Два варианта для конкурирующей гипотезы:
a
2
2
c1
c2
z
1) H2=H, в конкурирующую гипотезу вводятся
все остальные возможности.
2) H2=часть H, в гипотезу вводится
дополнительное ограничение.
1.1. Проверка гипотезы о
математическом ожидании
Считаем, что случайная величина X распределена по
нормальному закону N(m, σ2) с неизвестным математическим
ожиданием m и известной дисперсией σ2.
По независимой выборке x1,…,xn проверить гипотезы:
H1:m=m0
f (z|H
H2:m≠m0

Вводим статистику:
a
mm
z
)
a
0

n
2
Порог с находим из условия P{z>c}=α/2
 c
0
Значение порога с можно взять из специальных таблиц.
Гипотеза H1 верна, если |z|<c.
2
z
c
1.2. Проверка гипотезы о
математическом ожидании
Условия те же, но дисперсия σ2 неизвестна.
Вводим статистику:

m  m0
tz 
 n
Если верна гипотеза H1, то величина z имеет распределение
Стьюдента Tn-1(0;1) с n-1 степенями свободы.
Значение порога с можно взять из специальных таблиц.
Гипотеза H1 верна, если |z|<c.
2.1. Проверка гипотезы о
дисперсиях
Случайная величина X распределена по нормальному закону
N(m, σ2) с неизвестным математическим ожиданием m и
неизвестной дисперсией σ2.
По независимой выборке x1,…,xn проверить гипотезы:
H1: σ2=σ02
2
H2: σ2≠σ02
(
n

1
)

2
z



Вводим статистику (хи-квадрат):
2
0
2
2
2
Если  2    1 ,то принимается H1.
2
Значения порогов χ2 берутся из
f n 1 ( | H )
специальных таблиц.
p
a
a
2
2
0

2
2

2
1

2
2.2. Проверка гипотезы о
дисперсиях
Рассмотрим случай, когда имеем две случайные величины X и
Y, распределенные по нормальным законам: N(m1, σ12) и
N(m2, σ22).
m1, m2 и σ12, σ22 – неизвестны.
По независимым выборкам: x1,…,xn1 и y1,…,yn2 проверить
гипотезы:
H1: σ12=σ22
H2: σ12>σ22
2
1
Вводим статистику: z   2  F(статистика Фишера).
2
В числитель ставится наибольшая из оценок.
Если z<c, то принимаем H1. Значение порога с берется из
специальных таблиц.
3.1. Проверка гипотезы
о равенстве математических ожиданий
Случайные величины X и Y, распределенные по нормальным
законам: N(m1, σ12) и N(m2, σ22).
m1, m2 – неизвестны, а σ12, σ22 – известны.
По независимым выборкам: x1,…,xn1 и y1,…,yn2 проверить
гипотезы:
H1: m1=m2
 
H2: m1≠m2
m1  m2
z
Вводим статистику:
2 / n  2 / n
1
Если |z|<c, то принимаем H1.
1
2
2
3.2. Проверка гипотезы
о равенстве математических ожиданий
Условия те же, а дисперсии одинаковы σ12=σ22=σ2 и неизвестны.
Вводим статистику:
 
m1  m2
z 
 1 / n1  1 / n2
Если гипотеза H1 верна, то z имеет распределение Стьюдента.
Пороги находим как в задаче 1.2.
4. Выявление аномальных
измерений
Случайная величина X распределена по нормальному закону
N(m, σ2) с неизвестным математическим ожиданием m и
известной дисперсией σ2.
Имеется выборка: x1,…,xn и x – новое измерение.
Проверить гипотезы:
H1: x принадлежит X.
H2: x не принадлежит X (x – аномальное измерение).
Вводим статистику:

xm
z

Пороги и решающее правило как для задачи 1.1.
Выявление аномальных
измерений
Условия те же, но дисперсия σ2 неизвестна.
Статистика имеет вид:
x  m̂
z
ˆ
При истинности гипотезы H1, z имеет распределение Стьюдента.
Пороги и решающее правило как для задачи 1.2.
5. Гипотеза об однородности ряда
дисперсий
Имеем несколько случайных величин X1,…,Xk, распределенных
по нормальному закону N(m1, σ12),…, N(mk, σk2). Все параметры
законов неизвестны.
Для каждой случайной величины имеется выборка одинакового
объема n.
Проверить гипотезы:
H1: σ12=…=σk2
H2: σi2≠σj2; i,j=1…k; i≠j
k
2
2
z  Gmax  max /  (статистика
j
Вводим статистику:
Кочрена)
j 1
Порог с выбирается по таблице. H1 верна, если z<c.
6. Проверка гипотезы о
распределениях
X – непрерывная случайная величина, закон распределения не
известен.
По независимой выборке x1,…,xn строится гистограмма,
экспертно выбирается закон распределения X: f(x|Θ) и
проверяются гипотезы:
H1: f(x|Θ) согласуется с гистограммой.
H2: f(x|Θ) не согласуется с гистограммой.
2
k
n
j
2


n

Вводим статистику:
j 1 np j
Порог находим по таблице. Если z<χ2, то принимается H1 .
В дальнейшем можно использовать f(x|Θ) в качестве оценки
истинной неизвестной плотности.
Скачать