ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ 3.1 МОДЕЛИ БИНАРНОГО, УПОРЯДОЧЕННОГО И МНОЖЕСТВЕННОГО ВЫБОР Демидова О.А., demidova@hse.ru Каф. Математической экономики и эконометрики, доцент Лаборатория «Эмпирический анализ предприятий и рынков», заведующий 1 Линейная вероятностная модель Yi 1 2 X i ui Yi E (Yi ) ui Найдем математическое ожидание Yi. pi p (Yi 1) E (Yi ) 1 pi 0 (1 pi ) pi 1 2 X i pi p(Yi 1) 1 2 X i 2 Линейная вероятностная модель pi p(Yi 1) 1 2 X i Если мы будем оценивать модель с качественной зависимой переменной, как и ранее, с помощью МНК, мы получим указанную выше модель, называемую линейной вероятностной моделью. 3 Линейная вероятностная модель pi p(Yi 1) 1 2 X i Однако линейная вероятностная модель имеет ряд серьезных недостатков. Одним из главных недостатков линейной вероятностной модели является следующий : оцененные значения вероятности могут оказаться больше 1 или меньше 0. Распределение случайного члена не только не является нормальным, но даже не непрерывным. Можно показать, что дисперсия случайного члена ui равна (b1 + b2Xi)(1 – b1 – b2Xi), т.е. зависит от X. Таким образом, имеет место проблема гетероскедастичности. 4 Логит - модель Y, p A 1 1 – 1 – 2Xi 1 +2Xi 1 1 + 2Xi B 0 Xi X Главным недостатком модели линейной вероятности являлась возможность для оцененных значений зависимой переменной5 принимать значение вне интервала (0, 1). Логит - модель 1.00 F (Z ) 1 p F(Z ) 1 e Z 0.75 0.50 Z 1 2 X 0.25 0.00 -8 -6 -4 -2 0 2 4 6 Z Обычным способом решения этой проблемы является предположение о том, что вероятность является S – образной функцией от переменной Z, F(Z) принимает значения на интервале (0, 1), где Z является линейной 6 функцией от объясняющих переменных. Одна из возможных интерпретаций модели P(Yi = 1) = F(β1 + β2Xi) (*) Предположим, что существует количественная переменная Yi*, cвязанная с переменной X обычным регрессионным уравнением: Yi* = β1 + β2X + εi, i = 1,…,n, где возмущения εi независимы и одинаково распределены, E(εi) = 0, D(εi) = σ2 и F – функция распределения нормированных возмущений. Функция плотности нормированных возмущений симметрична. 7 Yi* - латентная (ненаблюдаемая переменная) Yi = 1, если Yi* ≥ 0, i = 1,…,n, Yi = 0, если Yi* < 0, i = 1,…,n, 8 Тогда P(Yi = 1) = P(Yi* ≥ 0) = P(β1 + β2X + εi ≥ 0) = P(εi ≥ - β1 - β2X) = P(εi ≤ β1 + β2X) = F((β1 + β2X)/σ), что с точностью до нормировки совпадает с (*). 9 Логит - модель 1.00 F (Z ) 1 p F(Z ) 1 e Z 0.75 0.50 Z 1 2 X 0.25 0.00 -8 -6 -4 -2 0 2 4 6 Z Если функция F является логистической (формула для этой функции приведена выше), то соответствующая модель называется логит - моделью. 10 Логит - модель 1 p F(Z ) 1 e Z dp (1 e Z ) 0 1 ( e Z ) dZ (1 e Z ) 2 e Z (1 e Z ) 2 Производная функции F(Z) называется функцией плотности. Выше вычислена функция плотности для логистической функции. 11 Логит - модель F (Z ) dp e Z f (Z ) dZ (1 e Z )2 1 p F(Z ) 1 e Z 0.2 0.1 0 -8 -6 -4 -2 0 2 4 6 На рисунке изображен график функции плотности f(Z) для логистической функции. Z 12 Логит - модель 1.00 F (Z ) 1 p F(Z ) 1 e Z 0.75 0.50 Z 1 2 X 0.25 0.00 -8 -6 -4 -2 0 2 4 6 Z Функция F нелинейно зависит от параметров. Для нахождения оценок коэффициентов модели β1, β2 используется метод максимального правдоподобия. Решается некоторая система 13 нелинейных уравнений. Логит - модель 1.00 F (Z ) 1 p F(Z ) 1 e Z 0.75 0.50 Z 1 2 X 0.25 0.00 -8 -6 -4 -2 0 2 4 6 Z Функция F нелинейно зависит от параметров. Для нахождения оценок коэффициентов модели β1, β2 используется метод максимального правдоподобия. Решается некоторая система 14 нелинейных уравнений. Логит - модель 1.00 F (Z ) 1 p F(Z ) 1 e Z 0.75 0.50 Z 1 2 ASVABC 0.25 0.00 -8 -6 -4 -2 0 2 4 6 Z Пример использования логит – модели для оценки вероятности окончания средней школы. В качестве объясняющей выбрана 15 переменная ASVABC. Логит - модель . logit GRAD ASVABC Iteration Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: 5: Log Log Log Log Log Log Likelihood Likelihood Likelihood Likelihood Likelihood Likelihood Logit Estimates Log Likelihood = -117.35135 =-162.29468 =-132.97646 =-117.99291 =-117.36084 =-117.35136 =-117.35135 Number of obs chi2(1) Prob > chi2 Pseudo R2 = 570 = 89.89 = 0.0000 = 0.2769 -----------------------------------------------------------------------------grad | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---------+-------------------------------------------------------------------asvabc | .1666022 .0211265 7.886 0.000 .1251951 .2080094 _cons | -5.003779 .8649213 -5.785 0.000 -6.698993 -3.308564 ------------------------------------------------------------------------------ Пример оценивания логит – модели с помощью пакета STATA. 16 Логит - модель . logit GRAD ASVABC Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: log log log log log likelihood likelihood likelihood likelihood likelihood Logit estimates Log likelihood = -96.886017 = = = = = -118.67769 -104.45292 -97.135677 -96.887294 -96.886017 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 = = = = 540 43.58 0.0000 0.1836 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 ------------------------------------------------------------------------------ Zˆ 3.240 0.131 ASVABC Результаты оценивания. 17 Логит - модель 1.00 Cumulative effect 0.75 1 e 3.2400.131ASVABCi 0.03 0.50 0.02 0.25 0.01 0.00 0 10 20 30 40 50 60 70 80 90 0 100 ASVABC Zˆ 3.240 0.131 ASVABC Оцененная модель. 18 Marginal effect pi 1 Логит - модель . logit GRAD ASVABC Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: log log log log log likelihood likelihood likelihood likelihood likelihood Logit estimates Log likelihood = -96.886017 = = = = = -118.67769 -104.45292 -97.135677 -96.887294 -96.886017 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 = = = = 540 43.58 0.0000 0.1836 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 ------------------------------------------------------------------------------ Zˆ 3.240 0.131 ASVABC Коэффициент перед переменной ASVABC является значимым. 19 Логит - модель 1 p F(Z ) 1 e Z Z 1 2 X 2 ... k X k В случае нелинейных моделей говорят о предельном эффекте объясняющего фактора. 20 Логит - модель 1 p F(Z ) 1 e Z Z 1 2 X 2 ... k X k p dp Z e Z f ( Z ) i i Z 2 X i dZ X i (1 e ) Предельный эффект объясняющего фактора Хi (если Х – непрерывная переменная) – это частная производная по этой переменной. Вычисляется эта производная по правилу вычисления производной сложной функции. 21 Логит - модель 1 p F(Z ) 1 e Z Z 1 2 X 2 ... k X k dp e Z f (Z ) dZ (1 e Z )2 p dp Z e Z f ( Z ) i i Z 2 X i dZ X i (1 e ) Формула для расчета предельного эффекта. 22 Логит - модель 1 p F(Z ) 1 e Z Z 1 2 X 2 ... k X k dp e Z f (Z ) dZ (1 e Z )2 p dp Z e Z f ( Z ) i i Z 2 X i dZ X i (1 e ) Предельный эффект i – го объясняющего фактора не является константой, а зависит от других переменных. 23 Логит - модель p( X 1 , X 2 ,..., X j 1,..., X k ) p( X 1 , X 2 ,..., X j 0,..., X k ) Предельный эффект объясняющего фактора Хj (если Хj – dummy переменная). 24 Логит - модель . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Logit estimates Log likelihood = -96.886017 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 = = = = 540 43.58 0.0000 0.1836 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 ------------------------------------------------------------------------------ В рассмотренном примере средний результат ASVABC равен 51.36. 25 Логит - модель . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Z 1 2 X 3.240 0.131 51.36 3.507 Logit estimates Log likelihood = -96.886017 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 = = = = 540 43.58 0.0000 0.1836 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 ------------------------------------------------------------------------------ В этой точке Z равно 3.507. 26 Логит - модель . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Z 1 2 X 3.240 0.131 51.36 3.507 Logit estimates Log likelihood = -96.886017 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 = = = = 540 43.58 0.0000 0.1836 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 ------------------------------------------------------------------------------ В этой точке Z равно 3.507. 27 Логит - модель . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Z 1 2 X 3.240 0.131 51.36 3.507 e Z e 3.507 0.030 dp eZ 0.030 f (Z ) 0.028 Z 2 2 dZ (1 e ) (1 0.030) e–Z равно 0.030. Следовательно, f(Z) равно 0.028. 28 Логит - модель . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Z 1 2 X 3.240 0.131 51.36 3.507 e Z e 3.507 0.030 dp eZ 0.030 f (Z ) 0.028 Z 2 2 dZ (1 e ) (1 0.030) p dp Z f ( Z ) i 0.028 0.131 0.004 X i dZ X i Предельный эффект для имеющего средний результат тестирования равен 0.004. Это означает, что при увеличении результата тестирования ASVABC на 1 балл вероятность закончить школу возрастает на 0.4 29 процента. Логит - модель 0.75 0.03 0.50 0.02 0.25 0.01 0.00 0 10 20 30 40 51.36 50 60 70 80 90 0 100 ASVABC Предельный эффект при среднем результате очень мал. Это связано с тем, что вероятность закончить школу при средних результатах и так очень велика. 30 Marginal effect Cumulative effect 1.00 Логит - модель В пакете STATA предельные эффекты объясняющих переменных можно получить с помощью команды mfx 31 Пробит - модель 1.00 F (Z ) 0.4 p F (Z ) 0.3 0.50 0.2 0.25 Marginal effect Cumulative effect 0.75 0.1 0.00 0 -3 -2 -1 0 1 2 Z Z 1 2 X 2 ... k X k Для пробит – модели в качестве S – функции выбирается функция распределения стандартного нормального распределения. 32 Пробит - модель 1.00 1 1 2Z 2 f (Z ) e 2 0.3 0.50 0.2 0.25 Marginal effect Cumulative effect 0.75 0.4 0.1 0.00 0 -3 -2 -1 0 1 2 Z Z 1 2 X 2 ... k X k Выше приведена функция плотности. Оценки коэффициентов находятся по методу максимального правдоподобия. 33 Пробит - модель . probit GRAD ASVABC SM SF MALE Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: log log log log log likelihood likelihood likelihood likelihood likelihood = = = = = -118.67769 -98.195303 -96.666096 -96.624979 -96.624926 Probit estimates Log likelihood = -96.624926 Number of obs LR chi2(4) Prob > chi2 Pseudo R2 = = = = 540 44.11 0.0000 0.1858 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .0648442 .0120378 5.39 0.000 .0412505 .0884379 SM | -.0081163 .0440399 -0.18 0.854 -.094433 .0782004 SF | .0056041 .0359557 0.16 0.876 -.0648677 .0760759 MALE | .0630588 .1988279 0.32 0.751 -.3266368 .4527544 _cons | -1.450787 .5470608 -2.65 0.008 -2.523006 -.3785673 ------------------------------------------------------------------------------ Результаты оценки пробит- модели. 34 Пробит - модель . probit GRAD ASVABC SM SF MALE Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: log log log log log likelihood likelihood likelihood likelihood likelihood Probit estimates Log likelihood = -96.624926 = = = = = -118.67769 -98.195303 -96.666096 -96.624979 -96.624926 Number of obs LR chi2(4) Prob > chi2 Pseudo R2 = = = = 540 44.11 0.0000 0.1858 -----------------------------------------------------------------------------GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------ASVABC | .0648442 .0120378 5.39 0.000 .0412505 .0884379 SM | -.0081163 .0440399 -0.18 0.854 -.094433 .0782004 SF | .0056041 .0359557 0.16 0.876 -.0648677 .0760759 MALE | .0630588 .1988279 0.32 0.751 -.3266368 .4527544 _cons | -1.450787 .5470608 -2.65 0.008 -2.523006 -.3785673 ------------------------------------------------------------------------------ Как и для логит – модели, не существует интерпретации полученных оценок коэффициентов. С их помощью можно рассчитать предельные эффекты. 35 Пробит - модель p F (Z ) Z 1 2 X 2 ... k X k 1 12 Z 2 p dp Z i f ( Z ) i e X i dZ X i 2 Напомним, что предельный эффект объясняющего фактора Xi рассчитывается как частная производная от Xi. 36 Пробит - модель p F (Z ) Z 1 2 X 2 ... k X k 1 dp 1 2Z 2 f (Z ) e dZ 2 1 12 Z 2 p dp Z i f ( Z ) i e X i dZ X i 2 Формула для расчета предельного эффекта i – го объясняющего фактора для пробит - модели. 37 Пробит - модель . sum GRAD ASVABC SM SF MALE Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 SM | 540 11.57963 2.816456 0 20 SF | 540 11.83704 3.53715 0 20 MALE | 540 .5 .5004636 0 1 Таблица дескриптивных статистик для переменных. 38 Пробит - модель Probit: Marginal Effects mean b product f(Z) f(Z)b ASVABC 51.36 0.065 3.328 0.068 0.004 SM 11.58 –0.008 –0.094 0.068 –0.001 SF 11.84 0.006 0.066 0.068 0.000 MALE 0.50 0.063 0.032 0.068 0.004 constant 1.00 –1.451 –1.451 Total 1.881 p dp Z f ( Z ) i X i dZ X i Оцениваем предельные эффекты для объясняющих факторов. 39 Odd Ratio Для логит-модели Pr(Y 1) OR Pr(Y 0) Отношение вероятности «удачи» и «неудачи» ln( OR ) 1 2 X 2 ... k X k Если Xj изменится на 1 то OR изменится в exp( j ) Раз. 40 Модели упорядоченного множественного выбора с0 c1 ... cm 1 cm Yt ( X ) t t , * P (Y j ) P (c j 1 Yt* c j ), j 1,..., m P (Yt j ) F (c j ( X ) t ) F (c j 1 ( X ) t ) P (Yt k X ) F (ck ( X ) t ), k 1,..., m Надо проверить гипотезу о параллельности (parallel regression assumption). Это тест Бранта 41 Интерпретация результатов P (Yi 1) k f (c1 ( X )), X k P (Y j ) k [ f (c j ( X )) X k f (c j 1 ( X ))], j 1,..., m 1 P (Y j ) k f (cm 1 ( X )) X k 42 Мультиноминальная логит модель 1 P (Yt 1) , 1 exp( X t 2 ) ... exp( X t m ) P (Yt j ) exp( X t j ) 1 exp( X t 2 ... exp( X t m ) P (Yt j ) exp( X t j ) exp( X t ( j k )) P (Yt k ) exp( X t k ) 43 Проверка основной гипотезы IIA – independence from irrelevant alternatives Test Small-Hsiao 44 10