Министерство образования и науки РФ Новосибирский Государственный Технический Университет Расчетно-графическое задание по курсу: «Математическая статистика» Факультет: Группа: Студент: Преподаватель: Вариант: 2 Часть 1 ПМИ ПМ-22 Бондарева И. В. Постовалов С. Н. Новосибирск 2005 Задание: Пусть X 1 , X 2 ,..., X n - выборка из отрицательного биномиального распределения. 1. Найти точечную оценку неизвестного параметра θ (или некоторой функции τ(θ)) по методу моментов или по методу максимального правдоподобия. Проверить полученную оценку на несмещённость, состоятельность и эффективность. 2. Найти достаточную статистику. 3. Найти функцию τ(θ), допускающую эффективную оценку. 4. Построить точный доверительный интервал. 5. Построить асимптотический доверительный интервал. Решение: Имеется выборка X 1 , X 2 ,..., X n , X i Bi (m, ) . P{X i k} Cmk k 1 m (1 ) k , k 0, m , m(1 ) m(1 ) MX i , DX i . 2 Найдем точечную оценку функции ( ) 1 , используя метод максимального правдоподобия: точка параметрического множества , в которой функция максимального 1. n L( X n , ) f ( X i , ) правдоподобия достигает наибольшего значения: i 1 L( X n , ) sup L( X n , ) , называется оценкой максимального правдоподобия параметра θ. Из условия нашей задачи имеем: n n n i 1 i 1 Xi L( X n , ) P{ X i xi } [ CmXi X i 1 ] * m n * (1 ) i 1 , n ln L( X n , ) ln( C mXi X i 1 ) nm * ln( ) n X * ln( 1 ) , i 1 ln L( X n , ) nm n X 1 m X . 0 , откуда получаем ( ) 1 m Проверим знак второй производной при таком значении оценки: 2 ln L( X n , ) mn nX , подставим вместо θ значение, выраженное из оценки 2 2 (1 )2 1 m ( ) , , получим: m X 2 2 m X 0 , 2 ln L( X n , ) n n m X m X mn nX m X m X n m X 2 m X mX значит, данная точка является точкой максимума для функции максимального правдоподобия. Для дальнейших рассуждений нам понадобится знать распределение случайной величины 1 n X X i . Для этого воспользуемся связью отрицательного биномиального n i 1 распределения с геометрическим: сумма m независимых случайных величин, распределённых геометрически является случайной величиной с распределением Bi ( m, ) . 2 2 3 n Тогда величину X i 1 i можно трактовать как сумму из m*n случайных величин, распределённых геометрически, значит ее распределение Bi ( mn, ) . Проверим τ(θ) на несмещённость: оценка θ несмещённая, если M . X 1 1 1 m X n 1 M M M 1 1 M Xi 1 , оценка несмещённая. m nm i 1 m Проверим τ(θ) на состоятельность, используя критерий состоятельности: оценка θ состоятельная, если lim M , lim D 0 . n 1 1 lim M , n состоятельная. n m X 1 lim D lim D n n m X 1 1 D 1 lim 2 2 nm 2 0 , lim m n m n n оценка Проверим τ(θ) на эффективность, используя неравенство Рао-Крамера: оценка, для которой [ `( )]2 достигается нижняя граница неравенства D[T ( X n )] , где i(θ) – информационное ni( ) количество Фишера, называется эффективной. Чтобы найти информационное количество Фишера, воспользуемся формулой: DU ( X n , ) ni ( ) . n ln L( X n , ) ln( C mXi X i 1 ) nm * ln( ) n X * ln( 1 ) , i 1 ln L( X n , ) nm n X . 1 2 nm n X nm 1 nm(1 ) nm[nm(1 ) 1] Получим: ni ( ) D , 2 2 2 1 (1 ) (1 ) 2 1 2 2 1 1 [ `( )] 1 D[T ( X n )] , , нижняя граница 2 nm[nm(1 ) 1] nm[nm(1 ) 1] mn 2 ni ( ) 2 (1 ) неравенства не достигнута, оценка не эффективная. U ( X n , ) 2. Для нахождения достаточной статистики воспользуемся критерием факторизации: чтобы статистика T ( X n ) была достаточной для θ, необходимо и достаточно, чтобы функция правдоподобия имела вид L( X n , ) g (T ( X n ); ) * h( X n ) . n n n i 1 i 1 Xi L( X n , ) P{ X i xi } [ CmXi X i 1 ] * m n * (1 ) i 1 . Для нашей задачи получаем: n h( X n ) [ C mXi X i 1 ] , g (T ( X n ); ) mn * (1 ) T ( X n ) , i 1 n где T ( X n ) X i n X - достаточная статистика. i 1 3. Для нахождения функции τ(θ), допускающей эффективную оценку, воспользуемся критерием эффективности (см. п.1.). Для нашей задачи получаем: n ln L( X n , ) ln( C mXi X i 1 ) nm * ln( ) n X * ln( 1 ) , i 1 ln L( X n , ) nm n X 1 nm n X , , откуда получаем (1 )U ( X n , ) 1 1 1 1 1 1 U ( X n , ) X , где a ( ) , а T ( X n ) X - эффективная оценка для nm m nm m 1 функции ( ) . U ( X n , ) Будем строить γ-доверительный интервал для параметра 4. распределения точечной оценки параметра τ(θ)=z. T ( X n ) 1 z с помощью m X , тогда m m X n FT ( x, z ) P Tn x P x P X m( x 1) P X i nm( x 1) i 1 m nm ( x 1) nm ( x 1) nm ( x 1) ( z 1) C nmx 1 mn (1 )nm ( x 1) C nmx 1 . z nmx n При выводе этой формулы мы учитываем, что величина X i 1 i имеет распределение Bi ( mn, ) . Получаем, что функция FT ( x, z ) непрерывна и монотонна по z, значит мы можем построить γ-доверительный интервал, основываясь на этой функции. 1 1 1 , FT ( x, z2 ) 2 . Для Решим относительно z1, z2 уравнения FT ( x, z1 ) 2 2 простоты выкладок будем решать его в общем виде, т.е. FT ( x, z ) , при этом обозначим C nm ( x 1) nmx 1 как С (т.к. оно не зависит ни от Г, ни от z), получим: ( z 1)nm ( x 1) ( z 1) nm ( x 1) z nmx , nm( x 1) ln( z 1) nmx ln z , , nmx C C z x x ln( z 1) log z ( z 1) , z C ( x 1) z 1 . Решив соответствующее уравнение при C ( x 1) ln z 1 1 , получим z1, а при получим z2. Один из них будет левой границей 2 2 искомого интервала, другой – правой границей. C 5. Оценки максимального правдоподобия являются асимптотически эффективными и асимптотически нормальными, следовательно: P z n z ni ( zn ) c (c ) ( c ) 2(c ) 1 , где Ф(х) – функция распределения стандартного нормального закона, i ( z ) - информационное количество Фишера, z n - ОМП. c c 1 - асимптотически кратчайший γОтсюда c 1 , тогда z , z n n 2 ni ( zn ) ni ( zn ) доверительный интервал для z. Ранее было получено соотношение для информационного количества Фишера: 1 nm[nm(1 ) 1] , учитывая, что z , получим: ni ( ) 2 (1 ) 1 nm nm 1 1 z nm[nm( z 1) z ]z 2 ni ( z ) . 1 1 z 1 1 z2 z m X m X nm nX 2 n m m 2 Тогда ni ( zn ) m X nmX m X . X mX m 2 1 Получаем, что z n и ni ( zn ) нам известны, c можно найти по формуле c 1 , взяв 2 любое интересующее нас γ. Получим асимптотический интервал: c c zn . , zn ni ( zn ) ni ( zn )