Метод максимального правдоподобия

реклама
Метод максимального правдоподобия
ММП позволяет получить по крайней мере
асимптотически несмещенные и эффективные
оценки параметров распределения, которые имеют
нормальный закон распределения.
В основе ММП лежит понятие функции правдоподобия
выборки.
Определение. Пусть имеем случайную величину Y,
которая имеет функцию плотности вероятностей Py(t,
a1,a2,…,ak) и случайную выборку наблюдений за
поведением этой величины Y(y1,y2,…,yn). Тогда
функцией правдоподобия выборки Y(y1,y2,…,yn)
называется функция L, зависящая от аргументов
а={a1,a2,…,ak}, а от элементов выборки как от
параметров и определяется равенством:
L(a1,a2,…,ak, y1,y2,…,yn)=Py(y1, a) Py(y2, a)…Py(yn, a)
Метод максимального правдоподобия
Функция правдоподобия:
L(a1,a2,…,ak, y1,y2,…,yn)=Py(y1, a) Py(y2, a)…Py(yn, a)
Основные свойства функции правдоподобия.
1. Правая часть равенства имеет смысл значения
закона распределения выборки при случайных
значениях аргументов t1=y1, t2=y2,…, tn=yn.
Следовательно, функция правдоподобия L также
случайная величина при любых значениях
аргументов а={a1,a2,…,ak}.
2. Все значения функции правдоподобия L ≥0.
Эти свойства являются следствием свойств выборки.
Метод максимального правдоподобия
Идея метода.
В качестве оценки неизвестного параметра
принимается такое, которое обеспечивает
максимум функции правдоподобия при всех
возможных значениях случайной величины Y.
Математически это выражается так:
ãj= argmax(L(a1,a2,…,ak, y1,y2,…,yn)
Очевидно, что оценка ãj зависит от случайной
выборки, следовательно, ãj= f(y1,y2,…,yn), где
f есть процедура вычисления оценки ãj по
результатам выборки.

Метод максимального правдоподобия
Алгоритм решения задачи с помощью ММП.
Предполагается:
1. Вид закона распределения известен;
2. Функция плотности вероятности гладкая во
всей области определения.
Последовательность решения:
1. Составляется функция правдоподобия.
2. Вычисляется логарифм функции
правдоподобия.
3. Оценки параметров получаются в результате
решения системы уравнений вида:
∂ln(L)/∂ai = 0; i=1,2,3,…,k
4. Проверяется условие максимума функции
правдоподобия.
Метод максимального правдоподобия
Пример 1. Рассмотрим случайную величину,
индикатор случайного события.
Закон распределения этой величины:
Py(t,p)=pt(1-p)(1-t) , где t=0, 1. p-параметр
закона распределения. M(Y)=p, σ2(Y)=p(1-p).
Имеем выборку наблюдений Y={y1,y2,…,yn,p}.
Решение.
1.
Составляем функцию правдоподобия:
L(y1,y2,…,yn,p)=py1(1-p)(1-y1) py2(1-p)(1-y2)… pyk(1-p)(1-yk)
=pΣyi(1-p)Σ(1-yi)
2. Вычисляем логарифм функции
правдоподобия:
ln(L)=Σyiln(p) + Σ(1-yi)ln(1-p)
Метод максимального правдоподобия
Пример 1. (продолжение)
3. Составляем уравнение для вычисления
оценки параметра «р».
 ln( L )  y n   y


0
i
p
Откуда
i
(1 p )
p
y

p
i
n
4. Проверяем условие максимума функции L.
2
yi n   yi
 ln( L )

 2 
0
2
2
dp
p
(1 p )
Метод максимального правдоподобия
Проверка свойств полученной оценки.
1. Несмещенность:
M(Σyi/n)=(1/n)ΣM(yi)=(1/n)(np) = p
Математическое ожидание оценки равно
его теоретическому значению.
Вывод: получена несмещенная оценка
на выборке ограниченного объема!
Метод максимального правдоподобия
Неравенство Рао-Крамера.
Метод проверки условия эффективности.
Оно позволяет оценить нижнюю границу точности, с которой можно
несмещенно оценить неизвестные параметры.
Нижняя граница соответствует минимальной дисперсии оценки.
Следовательно, если дисперсия полученной оценки равна
нижней границе, то эта оценка удовлетворяет условию
эффективности.
Теорема. Для любой ковариационной матрицы любой несмещенной
оценки вектора параметров «а» неравенство Рао-Крамера имеет
вид:
Cov(ã,ã) ≥ I-1
где: I – квадратная матрица, информационная матрица Фишера:
1.
ln( L)

 M (
)
a a
2
I
i
j
Если число оцениваемых параметров равно 1, то матрица Фишера
вырождается в число, которое называют информационным
количеством Фишера.
Метод максимального правдоподобия
Пример 1. (Продолжение)
Вычислим информационное количество Фишера.
2
n   yi
yi
n
d ln( L )

I  M( 
)

M
(
)

M
(
)

2
p( 1  p )
p( 1  p )
d p2
p
Тогда I-1 есть
I
1
p (1  p )

n
(6.2)
Величина (6.2) равна минимальному значению дисперсии
среди всех возможных несмещенных процедур оценки
параметра «р». Т.е., если дисперсия полученной оценки
равна значению (6.2), то эта оценка эффективная.
Метод максимального правдоподобия
y

p
Вычисляем дисперсию оценки
σ
2
y

(
n
i
)
1
n
2
σ
2
( yi ) 
1
n
2
σ
i
n
2
( yi ) 
n
n
2
σ
2
yi 
p( 1  p )
n
Полученное значение совпадает с выражением (6.2),
следовательно мы получили несмещенную и
эффективную оценку параметра «р» на выборке
ограниченного объема.
Метод максимального правдоподобия
Пример 2. Получить ММП оценки случайной величины,
имеющей нормальный закон распределения.
Имеем выборку Y={y1,y2,…,yn}. Переменная Y имеет
нормальный закон распределения:
(t  a )

2
p
y

(t , a,
2
)
1
(2 )
1
2

e

2
2
Тогда функция правдоподобия выборки примет вид:
( yi  a)
( y i  a)

2
L(Y , a, )  
2
1
1
2
(2 ) ( 2)

1
2
e

2
2
2

1
n
2
(2 ) ( 2)
n
2
e

2
Здесь символ «П» обозначает оператор произведения
выражения по всем i
Метод максимального правдоподобия
Решение. Для удобства введем s=σ2
2. Логарифм функции правдоподобия:
( yi a)
n
n
ln( L)   ln( 2 )  ln( s)  
2
2
2s
2
3. Составляем систему уравнений относительно
параметров «а» и «s»
Откуда получаем:
( y  a)
 ln( L )
i
 2
0
a
2s
 ln( L )
n


s
2s
a~ 
( y i  a )
2
2s
2
0
y
6.3
i
n
~s  ( y i  a )
n
2
6.4
Метод максимального правдоподобия
Проверка свойств полученных оценок.
1.
Несмещенность.
y 1

n
)  M(y )  a  a
M(ã)= M (
n
n
n
i
i
( y i  a)
2
M(σ2)= M (

n
2
1
n 1 2
)   M ( y  a) 
i
n
n 
Выводы: 1. Оценка параметра «а» является несмещенной на
ограниченной выборке;
2. Оценка параметра σ2 состоятельная, т.е.
несмещенная при n=>∞.
Метод максимального правдоподобия
Проверка свойств оценок (Продолжение).
2. Эффективность.
Вычисляется информационная матрица Фишера.
 1)  n
a
 
ln( L)
n  ( yi  a) 2
n

M (
)  M (

)
2
2
 ( 2)
2( 2)
n
n
n

  
2( 2) ( 2) 2
  ( y  a)  ( M ( y ))  na
ln( L)
M ( 
 M(

0
a( )
( 2)
( 2)
1. M ( 
2
ln( L)
2
)  M (
2
2
2
2
2.
2
4
2
2
2
2
3
4
2
3.
i
2
i
2
2

4
i  a) 
3
2
M ( ( y
( )
2
 n

0 
 2


I 
n 
 0
4

2


 2


0 
1
 n


4
I 
2
 0

n 





Метод максимального правдоподобия
Эффективность оценок (Продолжение).
Вычислим дисперсии оценок (6.3) и (6.4)

2
(
y
n
i
)

n
(
)

y
2 
i
n
n
1
2
( y i  a)

(
2

2
n
2

(n  1) 2
n 
Сравнение полученных результатов с элементами обратной
матрицы Фишера, показывает, что дисперсия оценки параметра
«а» совпадает с минимально возможной дисперсией, а дисперсия
оценки параметра «σ2» является состоятельной.
Скачать