Лекция 1 - Постовалов С.Н.

реклама
Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ
ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.
КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ
ПРАВДОПОДОБИЯ
Книга Бытие, глава 8
Воды убывали; ворон; выпуск голубя (1-14)
…
8 Потом выпустил от себя голубя, чтобы видеть, сошла ли вода с
лица земли,
9 но голубь не нашел места покоя для ног своих и возвратился к
нему в ковчег, ибо вода была еще на поверхности всей земли; и он
простер руку свою, и взял его, и принял к себе в ковчег.
10 И помедлил еще семь дней других и опять выпустил голубя из
ковчега.
11 Голубь возвратился к нему в вечернее время, и вот, свежий
масличный лист во рту у него, и Ной узнал, что вода сошла с земли.
12 Он помедлил еще семь дней других и выпустил голубя; и он уже
не возвратился к нему.
13 Шестьсот первого года к первому дню первого месяца иссякла
вода на земле; и открыл Ной кровлю ковчега и посмотрел, и вот,
обсохла поверхность земли.
14 И во втором месяце, к двадцать седьмому дню месяца, земля
высохла.
2
Проверка гипотезы о виде распределения
Пусть x1, x2, x3,… - последовательность независимых наблюдений
случайной величины ξ.
Гипотезы о виде распределения ξ:
H 0 : f ( x )  f 0 ( x,  0 )
H1 : f ( x)  f1 ( x, 1 )
• Критерий Неймана-Пирсона (1933)
• Критерий Вальда (1947)
• Проблема Кифера-Вейсса (1957)
• Критерий Айвазяна (1965)
• Критерий Лордена (1976)
3
Критерий Вальда (SPRT)
n
H1
c1
H0
c0
1
2
3
4
5
n
6
Абрахам Вальд (1902-1950)
Статистика критерия:

(n)
n
f1 ( xi )
i 1
f 0 ( xi )
  ln
Области принятия проверяемых гипотез и область неопределенности:
  
H
(n)
 n   :   c0  , c0  ln 

1  
0
1  
 nH0   :  ( n )  c1 , c1  ln 




*n   : c0   ( n )  c1
4
Оптимальность критерия Вальда
Теорема 1. (А. Вальд, Дж. Вольфовиц, 1948)
Пусть T – последовательный критерий отношения вероятностей с
критическими границами - < c0 < 0 < c1 < + , с вероятностями
ошибок первого и второго рода  и , а Т- другой критерий с
вероятностями ошибок первого и второго рода  и .
Если
  и  и
E[n|H0]<  и E[n|H1]< 
Тогда
E[n|H0]  E[n|H0] и E[n|H1]  E[n|H1]
(1)
(2)
(3)
Г. Саймонс (1976) доказал возможность заменить условие (1) на (4)
+ +
(4)
5
Потеря оптимальности критерия Вальда
1. Проверка сложной гипотезы
J. Kiefer and L. Weiss. Some properties of Generalized
Sequential Probability Ratio Tests.Ann. Math. Stat.,
28(1):57–75, March 1957.
2. Нарушение предположений об независимости наблюдений
Matthew Finkelman (2008): The Wald–Wolfowitz Theorem Is
Violated in Sequential Mastery Testing, Sequential Analysis:
Design Methods and Applications, 27:3, 293-303
6
Средний объем выборки в критерии Вальда
Теорема 2. (Вальда, 1947)
Оценка снизу среднего числа наблюдений для любого
последовательного критерия с вероятностями ошибок α и β имеет вид:
 ( ,  )
 ( , )
EH n( ,  )  
EH n( ,  ) 
 (H0 )
 ( H1 )
0
1


 1 x 
 x 
f1 ( x)
 ( x, y)   (1  x) ln 
dx
  x ln 
  ,  ( H i )   f i ( x) ln
f 0 ( x)
 y 
 1 y  


Теорема 3. (С.А. Айвазян, 1959).
Если f0(x)=f1(x) и 1 0, то при выполнении ряда условий
EH0 n( ,  ) 
2 ( ,  )
2 (  ,  )
EH1 n( ,  ) 
 ( H 0 , H1 )
 ( H 0 , H1 )

f1
 ( H 0 , H1 )   ( f1  f 0 ) ln dx   ( H1 )   ( H 0 )
f0

7
Распределение объема выборки в критерии Вальда
при проверке гипотез «нормальное-логистическое»
 ( H 0 )  0.010496503
 ( H1 )  0.01436227472
 ( H 0 , H1 )  0.0248587772
    0.05
 ( ,  )   (  ,  )  2,649995
EH 0 n( ,  )  252
EH1 n( ,  )  184
EHi n( ,  )  213
Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)
8
Усечение последовательного критерия отношения
правдоподобия
1. Потеря оптимальности
2. Нестатистические причины прекращения эксперимента

Высокая стоимость экспериментов

Этические причины в клинических испытаниях

…
9
Обобщенный последовательный критерий отношения
правдоподобия (GSPRT)
L. Weiss. Testing one simple hypothesis against another // Ann. Math. Stat.,
24(1953): pp. 273-281.
Области принятия проверяемых гипотез и область неопределенности:
 nH 0   :  ( n )  c0 (n)
 nH 0   :  ( n )  c1 (n)
*n   : c0 (n)   ( n )  c1 (n)
10
Armitage, P. (1957). Restricted sequential procedures. Biometrika, 44, 9–56.
11
Hemanta K. Baruah & G.P. Bhattacharjee (1980): A generalization of
anderson's modified sequential probability ratio test, Journal of Statistical
Computation and Simulation, 11:3-4, 197-208
12
Jennison C., Turnbull B.W.: Group sequential methods with applications to
clinical trials. Boca Raton, Chapman & Hall, 2000.
13
Критерий Айвазяна
n
c1
n 
H1
H0
c0
1
2
3
4
5
6
n*
n
8ln(min(, ))
( H 0 , H1 )
- граница усечения
 ( H 0 , H1 ) 

 ( f1  f0 ) ln

Айвазян С.А.
f1
dx
f0
Области принятия проверяемых гипотез и область неопределенности:

n 
1

 nH0   : ( n )  c0  1    , c0  2ln

 n * 


n 
1

 nH1   : ( n )  c1  1   , c1  2ln

 n * 


n
n 


*n   : c0  1     ( n )  c1  1    
 n 
 n 

Anderson, T.W. (1960). A modification of the sequential probability ratio test to reduce the sample
size. Ann. Math. Statist., 31, 165–197.
Айвазян С.А. Различение близких гипотез о виде распределения в схеме обобщенного
последовательного критерия // Теория вероятностей и ее применения Том X, №4 (1965) с.
713-725
14
Критерий Лордена (2-SPRT)
H0 | H2 ,
H 2 | H1
H 2 : f 2  f 0  (1  ) f1
 :  ( f 2 , f 0 )   ( f 2 , f1 )
Статистики критерия: 
n
(n)
0
  ln
i 1
f 2 ( xi )
f 0 ( xi )
, 
( n)
1
n
f1 ( xi )
i 1
f 2 ( xi )
  ln
Гарри Лорден
Области принятия проверяемых гипотез и область неопределенности:
  
H
 n  1 : 1  c0  , c0  ln 

1  
0


(n)
1  
   0 :  0  c1 , c1  ln 




H1
n
(n)
*n   0 :  0( n )  c1 , 1 : 1( n )  c0 
15
Оценивание точных критических границ методом
Монте-Карло
В работе Canner, P.L. (1977). Monitoring treatment differences in long-term
clinical trials. Biometrics, 33, 603–615. применялся метод Монте-Карло для
нахождения точных критических границ в последовательном критерии для
биномиального закона распределения.
В работах Гродзенской И.С. (2004) применялся метод Монте-Карло для
сравнения критериев Вальда, Айвазяна, Лордена и Павлова.
Постовалов С. Н. Проверка простых и сложных гипотез с использованием
последовательного критерия Вальда// ДОКЛАДЫ АН ВШ РФ. - 2011. - №
2(17). - С.140-150.
Постовалов С. Н. Проверка простых и сложных гипотез с использованием
последовательных критериев Лордена и Айвазяна / С. Н. Постовалов, М. Р.
Шахмаметова // Научный вестник НГТУ. - Новосибирск, 2011. - № 3 (44). - C.
17-28.
16
Вычисление вероятностей ошибок первого и второго
рода для критерия Вальда
Если нам нужно найти точные границы, мы должны вычислить
вероятности ошибок первого и второго рода:
i 1


1    P H 0 | H 0    P i  с0  j   с0 , с1  H 0 
i 1
j 1


i 1



1    P H1 | H1   P i  с1  j   с0 , с1  | H1 
i 1
j 1



Но это представляет собой сложную задачу, т.к.
i
зависит от
j
если i>j.
17
Вычисление вероятностей ошибок первого и второго
рода для критерия Вальда методом Монте-Карло
1. Выбирается область моделирования.
2. Строится сетка с маленьким шагом на выбранной области.
3. Моделируется случайная величина по H0 .
4. Вычисляется статистика критерия.
5. Проверяется условие выхода для каждой точки сетки
(с0,с1).
6. Если для какой-то точки сетки условие выхода не
выполнено, то перейти на шаг 3.
7. Шаги 3-6 повторяются N раз.
8. Для каждой точки сетки вероятность ошибки вычисляется
по формуле
число ошибок
 (c0 , c1 ) 
N
18
Выбор числа повторений N
Какое число повторений надо взять, чтобы отклонение
эмпирической вероятности ошибки первого рода от истинного
значения не превосходило заданного уровня ?
Согласно центральной предельной теореме
m

P        2Ф( )  1   , N  
N

где m – количество ошибок первого рода в серии из N повторов.
Отсюда
 (1   )
N  t
,
2

2
Например, если
19
1 
  1
t   

 2 
  0.99,   0.01,   0.15
тогда N  8 460
Проверяемые гипотезы
Нормальный закон распределения:
 ( x   )2 
1
H 0 : f ( x) 
exp 
 ,  0
2 
2

Логистический закон распределения:
H1 : f ( x ) 



e
x
3
x
3 


3
1  e 


2
20
Расчет параметров критериев Лордена и Айвазяна
 ( x   )2 
1
H 0 : f ( x) 
exp 
 ,  0
2 
2

H1 : f ( x ) 



x
e
3
x
3 


3
1  e 


2
Критерий Лордена
 :  ( f 2 , f 0 )   ( f 2 , f1 ), f 2   f 0  (1  ) f1


   0.5526149445
f1

  ( H 0 , H1 )   ( f1  f 0 ) ln f dx
0


Критерий Айвазяна
 ( H 0 , H1 )  0.0248587772
min(α,β)
0.05
0.1
0.15
n*
964
741
610
21
H0 : 
H1 : 
N (0,1)
Log  0,1
(с0, с1)
22
(с0, с1)
H0 : 
H1 : 
N (0,1)
Log  0,1
23
Вычисление точных критических границ для
критерия Вальда
24
Вычисление точных критических границ для
критерия Вальда
α
β
0.15
0.10
0.05
0.01
0.15
0.10
0.05
0.01
-1.67, 1.42
-2.07, 1.47
-2.74, 1.52
-4.33, 1.56
-1.72, 1.81
-2.12, 1.86
-2.80, 1.91
-4.39, 1.95
-1.78, 2.48
-2.18, 2.54
-2.85, 2.59
-4.45, 2.63
-1.82, 4.11
-2.22, 4.17
-2.89, 4.23
-4.48, 4.26
25
Вычисление точных критических границ для
критерия Лордена
26
Вычисление точных критических границ для
критерия Лордена
α
β
0.15
0.10
0.05
0.01
0.15
0.10
0.05
0.01
-1,18;0,95
-1,47; 1,02
-2,00; 1,14
-3,24; 1,29
-1,25; 1,23
-1,56; 1,31
-2,10; 1,44
-3,36; 1,62
-1,36; 1,75
-1,68; 1,86
-2,23; 1,98
-3,53; 2,21
-1,50; 2,98
-1,85; 3,11
-2,43; 3,29
-3,77; 3,55
27
Вычисление точных критических границ для
критерия Айвазяна, n*=964
28
Вычисление точных критических границ для
критерия Айвазяна, n*=964
α
β
0.15
0.10
0.05
0.01
0.15
0.10
0.05
0.01
-1,9; 1,59
-2,48; 1,68
-3,69; 1,81
----
-2,02; 2,11
-2,61; 2,20
-3,89; 2,35
----
-2,15; 3,12
-2,82;
-4,14;3,48
----
---
---
----
----
29
Распределение объема выборки в критерии Вальда
при использовании приближенных границ
 ( H 0 )  0.010496503
 ( H1 )  0.01436227472
 ( H 0 , H1 )  0.0248587772
    0.05
 ( ,  )   (  ,  )  2,649995
EH 0 n( ,  )  252
EH1 n( ,  )  184
EHi n( ,  )  213
Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)
30
Распределение объема выборки в критерии Вальда
при использовании оценок точных границ
  0, 05006
  0, 03467
  0, 05089
  0, 04712
Средний объем выборки по 100000 реализаций равен 251 (при H0) и 206 (при H1)
31
Сокращение среднего объема выборки на 6% (при H0) и на 11% (при H1)
Распределение объема выборки в критерии Лордена
при использовании оценок точных границ
  0, 05038
  0, 01776
  0, 04986
  0, 02469
Ср. объем выборки по 100000 реализаций равен 367 (при H0) и 318 (при H1) – приб.
Ср. объем выборки по 100000 реализаций равен 268 (при H0) и 223 (при H1) –точн.
32
Сокращение среднего объема выборки на 27% (при H0) и на 30% (при H1)
Распределение объема выборки в критерии Айвазяна
при использовании оценок точных границ (n*=964)
  0, 0513
  0, 02044
  0, 04999
  0, 03026
Ср. объем выборки по 100000 реализаций равен 355 (при H0) и 312 (при H1) – приб.
Ср. объем выборки по 100000 реализаций равен 265 (при H0) и 214 (при H1) –точн.
33
Сокращение среднего объема выборки на 25% (при H0) и на 31% (при H1)
Сравнение среднего объема выборки для разных
критериев (при H0, вероятности ошибок первого и
второго рода равны 0.05)
400
367
355
Средний объем выборки
350
300
267
251
265
268
250
СОВ, приближенные границы
200
СОВ точные границы
150
100
50
0
Критерий Вальда
Критерий Айвазяна
Критерий Лордена
34
Сравнение распределений объема выборки для разных
критериев (при H0, вероятности ошибок первого и
второго рода равны 0.05) – приближенные границы
35
Сравнение распределений объема выборки для разных
критериев (при H0, вероятности ошибок первого и
второго рода равны 0.05) – точные границы
36
Сравнение среднего объема выборки для разных
критериев (при H1, вероятности ошибок первого и
второго рода равны 0.05)
350
318
312
Средний объем выборки
300
250
232
206
214
223
200
СОВ, приближенные границы
СОВ точные границы
150
100
50
0
Критерий Вальда
Критерий Айвазяна
Критерий Лордена
37
Пусть x1, x2, x3,… - последовательность независимых
наблюдений случайной величины ξ, подчиненной
нормальному закону распределения N(,).
У. Госсет
Гипотезы о параметрах распределения ξ:
H 0 :   0 ,  0
H1 :   1   0 ,   0
Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна)
Статистика критерия имеет вид:
1   0
t
S
n
1  1  
 Fn1 


2


где Fn-1 – функция распределения Стьюдента с (n-1) степенью свободы
Гипотеза H0 не отвергается, если
t
38
Гипотезы о параметрах распределения ξ:
  0
  ,  0

  0
H1 :   1 :
,  0

H0 :
Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна)
Статистика критерия имеет вид:

p1n

p0 n
1 1
2 0  n

 1
exp
 2

 2


 1 n
2 
x





exp

x










  d

i
0
i
0
2 
i 1

 2 i 1


1
 1 n
2
exp

x




 d
i
0
0  n  2 2 
i 1

n
2
39
;
Гипотезы Н0 принимается, если
p1n
1 
 A
p0 n

Гипотезы Н1 принимается, если
p1n

B
p0 n
1
Производятся дополнительные наблюдения до тех пор, пока
выполняются неравенства
p1n
B
A
p0 n
40
Вычисление оценок точных критических границ
41
Вычисление оценок точных критических границ при H 0 :   0
Таблица 1. Приближенные критические границы (B,A)
α
β
0,01
0,05
0,1
0,15
0,1
0.01, 9.9
0.06, 9.5
0.11, 9
0.17, 8.5
0,15
0.01, 6.6
0.06, 6.33
0.12, 6
0.18, 5.66
Таблица 2. Оценки точных критических границ
α
β
0,01
0,05
0,1
0,15
0,1
0.15, 5.44
0.32, 4.68
0.44, 4.14
0.52, 3.72
0,15
0.15, 3.65
0.32, 3.14
0.44, 2.77
0.53, 2.50
H1 :   1.
Проблемы при оценивании точных границ
последовательного t-критерия

Есть зависимость от расстояния между гипотезами

Есть зависимость от ,
Границы [B,A]
Границы
[B,A]
  0.5
  0.6
  0.7
0.39, 4.95
0.25, 5.34
0.15, 5.44
 H 1  0.7
 H 1  0.75
0.02, 6.18
0.15, 5.40
H1  1
0.15, 5.44
H1  2
 H 1  15
0.65, 3.01
0.78, 1.65
43
План выступления

Обзор последовательных критериев проверки гипотез

Алгоритм построения оценок точных критических границ
методом Монте-Карло

Сравнение среднего объема выборки

Проверка сложных гипотез. Последовательный t-критерий
Стьюдента

Группированные и цензурированные наблюдения

Применение последовательных критериев
44
Использование последовательных критериев по
случайно цензурированным наблюдениям
• Для всех наблюдений известно время начала наблюдения;
• Для всех наблюдений известно время окончания наблюдения,
либо время выбытия из-под наблюдения;
• Выбор выбывших наблюдений производится случайно.
45
Модификация критерия Вальда по случайно
цензурированным наблюдениям
Введем обозначение:
f j ( x), x-не цензурированное наблюдение

p j ( x)  
 Pj {  x}  1  Fj ( x), x-цензурированное наблюдение
, j=0,1.
тогда статистика критерия
k
k  
i 1
p1 ( xi )
p0 ( xi )
или
 p (x ) 
 k   ln  1 i 
i 1
 p0 ( xi ) 
k
46
Актуальные области применения процедуры
последовательной проверки гипотез о виде
распределения
• Задачи приемочного контроля качества
Вальд А. Последовательный анализ. //М.: Физматгиз, 1960. - 325 с.
Page E.S. Continuous inspection schemes // Biometrika, 1954, v. 41, p. 100-114.
• Задачи статистического управления технологическими
операциями
Бендерский А.М. Статистическое регулирование технологических процессов
методом кумулятивных сумм. – М.: Знание, 1973 – 70 c.
47
Актуальные области применения процедуры
последовательной проверки гипотез о виде
распределения
• Задачи построения рациональных планов испытаний на
надежность
Гродзенская И. С., Гродзенский С. Я., Томилин Н. А. Рационализация
контроля надежности элементов и систем // Наукоемкие технологии, 2003,
№ 2, с. 85-87.
• Клинические
испытания
Armitage P. Sequential medical trials. Oxford: Blackwell, 1961. 105 p.
48
Актуальные области применения процедуры
последовательной проверки гипотез о виде
распределения
• Радиолокационные задачи различения сигнала при
наличии помех в системах, основанных на накоплении
полезного сигнала
Гродзенская И. С. Разработка и исследование методов обнаружения
радиосигналов при наличии помех на основе оптимальных статистических
последовательных критериев // Тезисы докладов Научно-технической
конференции студентов, аспирантов и молодых специалистов МИЭМ. – М.:
МИЭМ, 2006, с. 257.
49
Заключение
1. Использование оценок точных критических границ
дает ощутимый выигрыш в среднем числе
наблюдений, особенно для модификаций критерия
Вальда – критериев Айвазяна и Лордена.
2. В рассмотренном примере в случае использования
приближенных критических границ несколько лучше
работает критерий Айвазяна, однако при
использовании оценок точных критических границ
критерии Айвазяна и Лордена становятся практически
эквивалентными.
3. Вычисление оценок точных критических границ
требует определенных вычислительных затрат, а
также разработки программного обеспечения, поэтому
применять этот метод имеет смысл в случае
проведения дорогостоящих, трудоемких и длительных
экспериментов.
4. Нахождение оценок точных критических границ
возможно и в более сложных случаях: при проверке
сложных гипотез, при цензурировании и при
50
группировании наблюдений.
Скачать