Обработка результатов наблюдений Лямин Андрей Владимирович Определения Множество возможных значений случайной величины X называется генеральной совокупностью или пространством выборки. Множество измеренных значений (x1, x2,…xn) случайной величины называется выборкой, где n – объем выборки. Любая функция зависящая от наблюдений называется статистикой. Вариационный ряд Вариационным рядом называется последовательность элементов выборки, расположенных в неубывающем порядке. Минимальный xmin и максимальный xmax элементы выборки называются крайними. Разность R= xmax- xmin называется размахом. Пример 1: • {0, -2, 3, 2, 3, -1, -4, 0, 1, 2, -2} • {-4, -2, -2, -1, 0, 0, 1, 2, 2, 3, 3} • xmin=-4, xmax=3, R=7 Точечные оценки Точечной оценкой числовой характеристики генеральной совокупности называется ˆ ( x , x ,..., x ) приближенно n статистика ˆ n 1 2 n равная . Оценка называется состоятельной, если для n | ) 0 любого >0 lim P (| ˆ n Оценка называется несмещенной, если M[ˆ ] Оценки средних значений, дисперсии, корреляции n n 2 ˆ ( xi ) xi 2 i 1 ˆ ˆ , i 1 n n 1 n j , ( xi ˆ )( xi j ˆ ) ˆ kj ˆ ˆ j 2 , k j i 1 , n j ˆ где j 1,..., n 1. Пример 2: Последовательность случайных чисел: {0.42, 0.52, 0.33, 0.43, 0.23, 0.58, 0.76, 0.53, 0.64, 0.21} Оценка математического ожидания: 0.48. Оценка дисперсии: 0.07. Математическое ожидание оценки дисперсии (1 i / n ) i 2 2 i 1 ˆ ] 1 2 M[ n 1 n 1 Принцип максимального правдоподобия L() P ( x1 ) P ( x2 )...P ( xn ) L() f ( x1 ) f ( x2 )... f ( xn ) L L 0, 0 2 2 Пример 3: L() (1 ) k nk ln L() k ln (n k ) ln(1 ) ln L k n k k 0 1 n Интервальные оценки Доверительным интервалом числовой характеристики генеральной совокупности с доверительной вероятностью называется интервал (1, 2) со случайными границами 1= =1(x1, x2,…xn), 2= 2(x1, x2,…xn), который накрывает с вероятностью : P(1<< 2)=, где =1- – уровень значимости. Построение интервальной оценки для среднего значения ˆ )/ ˆ , ( x ) Y n ( 1 x e 2 2 /2 ( x ) : (0) 1/2; ( x ) 1 ( x ). ˆ P ( x n x ) 2( x ) 1 ˆ ˆx ˆx ˆ ˆ P ( ) 2( x ) 1 n n d Построение интервальной оценки для среднего значения ˆ P ( ˆx ˆ ˆx ) 2( x ) 1 n n 2( x ) 1 1 ( x ) 1 /2 1 x u1 /2 , где u1 /2 (1 /2) ˆ P ( ˆ u1 /2 n ˆ ˆ u1 /2 n )1 Пример 4: ˆ 0.132, ˆ 1.05, 0.05 n 100, ˆ u1 /2 ˆ u1 /2 ˆ ˆ P ( ) 1 n n u1 /2 u0.975 1.96 1.05 1.96 P (|0.132 | ) 0.95 10 P (0.07 0.34) 0.95 Пример 5: u1 / 2 1, 0.05, 0.1 n u1 / 2 u0.975 1.96 n u1 / 2 / 0.1 19.6 n 385 Распределение Стьюдента Нормальное распределение N(,2) Распределение Стьюдента tn-1,1-/2 Статистические гипотезы Статистической гипотезой называется предположение о виде и свойствах генерального и выборочного распределений. Критерием значимости называется правило проверки статистической гипотезы. Статистикой критерия значимости Z называется функция наблюдений, по значениям которой судят о справедливости гипотезы. Статистические гипотезы Критической областью критерия называется подмножество Vk множества V значений статистки Z, вероятность попадания в которое при условии истинности гипотезы равна уровню значимости 0, т.е. P(ZVk)=. Множество V\Vk называется областью допустимых значений статистики критерия. Схема проверки гипотез 1. Выдвигается проверяемая гипотеза H0 и ей альтернативная H1. 2. Выбирается уровень значимости (0.1, 0.05, 0.01, 0.001). 3. Выбирается статистика Z, строится критическая область Vk и область допустимых значений V\Vk. 4. Вычисляется выборочное значение статистики. 5. Если ZVk, гипотеза H0 отвергается, иначе – принимается. Мощность критерия • Мощностью критерия называется вероятность отклонения гипотезы H0, когда она ложна. • Ошибка первого рода – отклонение гипотезы H0, когда она верна. • Ошибка второго рода – принятие гипотезы H0, когда она ложна. Проверка гипотез с помощью доверительных интервалов Гипотеза H0: = 0 принимается, если построенный доверительный интервал покрывает 0, и отвергается в противном случае. ˆ 0 Z n ˆ | Z | u1 /2 H 0 принимается | Z | u1 /2 H 0 отвергается Пример 6: ˆ 0.132, ˆ 1.05, 0.05 n 100, H 0 : 0 0.5 u1 /2 u0.975 1.96 ˆ 0 0.132 0.5 Z n 10 3.5 ˆ 1.05 | Z | 3.5 1.96 Метод гистограмм 1) [b0 , b1 ),[b1 , b2 ),...,[bk 1 , bk ) 2) h( x) hi / n, bi 1 x bi , i 1, 2,..., k 3) P(bi 1 x bi ) bi f ( x)dx (bi bi 1 ) f ( y ) bi 1 4) h( y ) hi / n (bi bi 1 ) f ( y ) Пример 7: F(x) 0.5 0 0.25 0.5 0.75 1 1.25 x {0.42, 0.52, 0.33, 0.43, 0.23, 0.58, 0.76, 0.53, 0.64, 0.21} h( y )={0.2, 0.3, 0.4, 0.1}, (bi bi 1 ) f ( y) 0.25 Метод 2 1) [b0 , b1 ),[b1 , b2 ),...,[bk 1 , bk ) 2) h( x) hi , bi 1 x bi , i 1, 2,..., k f ( x)dx bi1 3) pi P( x j ) bi1 x j bi bi Метод 2 (hi npi ) 4) Z npi i 1 k 2 | Z | H 0 принимается 5) 2 | Z | k 1,1 H 0 отвергается 2 k 1,1 Пример 8: {0.42, 0.52, 0.33, 0.43, 0.23, 0.58, 0.76, 0.53, 0.64, 0.21} h={2, 3, 4, 1}, p ={0.25, 0.25, 0.25, 0.25} Z =2, 2 3,0.9 6.3, | Z | 2 3,0.9