Последствия ошибок в спецификации моделей Замещающие переменные Последствия ошибок спецификации модели Возможные ошибки спецификации модели: 1. Неправильный выбор вида уравнения регрессии 2. В уравнение регрессии включена лишняя (незначимая) переменная 3. В уравнении регрессии пропущена значимая переменная Последствия ошибок спецификации модели 1. Неправильный выбор вида функции в уравнении Пусть на первом этапе была сделана спецификация модели в виде: y fF (x; a0 , a1 ) u M(u | x) 0 M(u 2 | x) σ u2 (1.1) в которой функция fF(x,a0,a1) выбрана не верно Предположим, что yT=fT(x,a0,a1) – правильный вид функции регрессии Тогда справедливо выражение: f x,a ,a f x,a ,a φx 0 T 0 1 F 0 1 (1.2) Последствия ошибок спецификации модели Из выражения (1.2) следует: M f T x ,a0 ,a1 f F x ,a0 ,a1 M f T x ,a0 ,a1 M f F x ,a0 ,a1 M φx 0 (1,3) Иными словами, математические ожидания эндогенной переменной, полученные с помощью функций fT и fF не совпадают, т.е. первая предпосылка теоремы ГауссаМаркова M(ulx)=0 не выполняется Следовательно, в результате оценивания такой модели параметры а0 и а1 будут смещенными Последствия ошибок спецификации модели Симптомы наличия ошибки спецификации первого типа: 1. Несоответствие диаграммы рассеяния, построенной по имеющейся выборке виду функции, принятой в спецификации 2. В динамических моделях длительно сохраняется знак у смежных (по номеру t уравнений наблюдений) значений оценок случайных возмущений Именно этот симптом и улавливается статистикой DW Дарбина–Уотсона! В силу данного обстоятельства тесту Дарбина– Уотсона в эконометрике придается большое значение. Пример исправления ошибки первого типа Задача. Построить модель относительной стоимости подержанных автомобилей фирмы Ситроен Продажа p % Колтво лет Продажа p % Колво лет Продажа p % Колво лет 1 100 0 9 52 3 17 42 6 2 80 1 10 57 3 18 40 6 3 76 1 11 50 4 19 40 6 4 80 1 12 50 4 20 37 7 5 70 2 13 45 4 21 37 7 6 65 2 14 50 5 22 33 7 7 60 2 15 45 5 23 35 8 8 49 3 16 45 5 24 37 8 25 32 9 Пример исправления ошибки первого типа 1. Линейная модель 2. Нелинейная модель t p a0 ea1 ( 1 u ) ln p lna0 a1 t ε ln p 4.39 0.113t ε p 76.882 5.933t u 2.46 0.504 5.4 2 R 0.87 0.04 0.007 0.08 DW 1.79 DL 1.44 1 u p 80.64 e 0.113 t 2 R 0.92 DW 1.79 Du 1.44 120 120 100 100 80 80 60 60 40 40 20 20 0 0 0 2 4 6 8 10 0 2 4 6 8 10 Последствия ошибок спецификации модели 2. В уравнение регрессии включена лишняя переменная Пусть на этапе спецификации в модель включена «лишняя» переменная, например, X2 y a0 a1 x1 a2 x 2 u M u | x1 , x 2 0 M u 2 | x1 , x 2 σ u2 (2.1) «Правильная» спецификация должна иметь вид: y a0 a1 x1 u M u | x1 0 M u 2 | x1 σ u2 (2.2) Последствия ошибок спецификации модели Последствия: 1. Оценки параметров а0, а1, а2 останутся несмещенными, но потеряют свою эффективность (точность) 2. Увеличивается ошибка прогноза по модели ~y ~a ~a x ~a x 0 0 1 1,0 2 2,0 как за счет ошибок оценок коэффициентов и σu, так и за счет последнего слагаемого Это особенно опасно при больших абсолютных значениях регрессора Последствия ошибок спецификации модели Диагностика: В моделях множественной регрессии необходимо для каждого коэффициента уравнения проверять статистическую гипотезу H0: ai=0 Вспомним, что для этого достаточно оценить дробь Стьюдента ~ a t 2 ~2 Sa 2 и сравнить ее значение с критическим значением распределения Стьюдента, которое вычисляется по значению доверительной вероятности и значению степени свободы 2 = n – (k+1) Последствия ошибок спецификации модели 3. В модели не достает важной переменной M u | x1 a0 a1 x1 a2 x 2 a0 a1 x1 a2 x 2 0 Последствия такие же, как и в первом случае: получаем смещенные оценки параметров модели. Для устранения необходимо вернуться к изучению особенностей поведения экономического объекта, выявить опущенные переменные и дополнить ими модель Вот тут и возникают неприятности! Замещающие переменные Проблемы в использовании переменных: 1. Не возможно получение данных по переменной 2. Не возможно измерить количественно переменную Такие ситуации характерны для переменных социально-экономического характера (качество образования и т.п.) Выход из ситуации – подбор переменной заместителя Замещающие переменные Определение. Переменные, которые вводятся в эконометрические модели вместо тех переменных, которые не поддаются измерению, называются замещающими. Требование. Замещающая переменная должна коррелировать с переменной, которую она замещает. Если Cor(x,xpr)=1, то xpr – называют совершенным регрессором В качестве замещающей переменной часто используется время и лаговые переменные Замещающие переменные Пример. Рассмотрим модель связывающую расходы потребителей на питание (y) с личным располагаемым доходом (х) и относительной ценой продовольствия (р) logy b0 b1logx b2 logp ε (4.1) Предположим, что нет доступа к данным о располагаемом личном доходе (х) Если эту переменную не учитывать, то оценки оставшихся параметров будут смещенными, а соответствующие тесты не корректны Предположим, что log(x) имеет временной тренд Замещающие переменные Тогда уравнение (4.1) можно записать в виде: y b0 b2 logp b3 t ε Регрес Оценки коэффициентов соры b1 b2 b3 Log(x), 0.64 log(p) (0.03) Log(p), t Log(p) -0.48 (0.12) -0.47 (0.13) 2.04 (0.33) R2 0.99 0.023 (0.001) 0.98 0.63 Замещающие переменные В общем случае, пусть «правильная» модель: y a0 a1 x1 a2 x2 ... ak xk u (4.2) Предположим, что х1 не доступна для наблюдений Введем переменную z, которая связана с х1 X 1 λ μz (4.3) где: λ и μ неизвестные коэффициенты y a0 a1 λ a1μz a2 x2 ... ak x k u После оценки модели (4.4) нет формальной возможности получить значения λ, μ, а1 (4.4) Проблемы с использованием замещающих переменных Пример построения производственной функции Кобба-Дугласа Индексы реального объема производства, Спецификация модели в промышленности США в 1899-1922 гг. a 1a Год Y K L Год Y K L 1899 100 100 100 1911 153 216 145 1900 101 107 105 1912 177 226 152 1901 112 114 110 1913 184 236 154 1902 122 122 118 1914 169 244 149 1903 124 131 123 1915 189 266 154 1904 122 138 116 1916 225 298 182 1905 143 149 125 1917 227 335 196 1906 152 163 133 1918 223 366 200 1907 151 176 138 1919 218 387 193 1908 126 185 121 1920 231 407 193 1909 155 198 140 1921 179 417 147 1910 159 208 144 1922 240 431 161 Yt a0 K t 1 Lt 1 1 ut lnYt lna0 a1 lnK t 1 a1 lnLt ln1 u Y K ln t b0 a1 ln t ε Lt Lt Оценка модели InYt /K t 0,02836 0,2007 ln K t /Lt ε t 0,017 0,039 0,048 t 0, 1, R 2 0,56; DW 1,32 [dL; dU] = [1,26; 1,44] Проблемы с использованием замещающих переменных Проверка адекватности модели Для проверки адекватности взяты данные за 1922г (Y1922 = 240; K1922 = 431; L1922 = 161). Для этого вычисляем величины x 0 1n(K 1922/L 1922 ) 0,9847; q 0 0,29; S y 0 0,048 1 q 0 0,0545 и делаем точечный прогноз значения y0 = ln(Y1922 /L1922) = 0,399: Критическое значение критерия Стьюдента tкрит(0.99,21)=2.8 Тогда доверительный интервал: y 0 y~0 t крит Sy 0 0,0734; y 0 y~0 t крит Sy 0 0,3786. Построение функции Кобба-Дугласа Модель оказалась не адекватной Дальнейшие возможности: - проверить возможность исключения незначимых параметров -попытаться изменить вид модели - исследовать возможность включения дополнительной переменной Делаем все по порядку Построение функции Кобба-Дугласа 1. Проверка возможности исключения параметров InYt /K t 0,02836 0,2007 ln K t /Lt ε t 0,017 0,039 0,048 Проверяем статистическую гипотезу Н0: bi=0, tкрит(0.95,21)=2.1 t0 b0 σb 0 0.02836 1.67 t крит 2.1 0.017 t1 b1 σb 0.201 25.6 t крит 2.1 0.039 1 Вывод: b0=ln(a0)=0,следовательно, a0=1 Построение функции Кобба-Дугласа Исследуется спецификация модели вида: Yt K t a1 Lt 1a 1 1 ut Yt Kt ln a1 ln ε Lt Lt (5.2) Оценка модели (5.2) по тем же данным есть: In(Yt /K t ) 0,2522 ln(K t /Lt ) ε t (0,023) (0,050) t 0, 1, R 2 0,51; DW 1,26 Построение функции Кобба-Дугласа Проверка адекватности модели (5.2) Вновь вычисляются необходимые величины: x 0 1n(K 1922/L1922) 0,9847; q 0 0,21; S y0 0,050 1 q 0 0,055 ~ ~ y 0 1n(Y1922 / L1922) 0,2522 x 0 0,248. Сделаем точечную проверку адекватности для доверительных вероятностей 0.99 и 0.95 tкрит(0.99,21)=2.8, tкрит(0.95,21)=2.1 t 0 ~ y0 y 0 σy 0 0.399 0.248 2.74 0.055 Построение функции Кобба-Дугласа 2. Введем дополнительную переменную Модели (5.1) и (5.2) не учитывают влияние технического прогресса на уровень выпуска продукции Учтем это влияние с помощью замещающей переменной t – время следующим образом Введем переменную Et –эффективность единицы труда Et зависит от квалификации, образования и др. личных качеств работников Простейшая модель технологического процесса t E t E 0 1 g (5.3) Построение функции Кобба-Дугласа С учетом технологического процесса спецификация модели принимает вид: Yt a0 e a3 t K ta1 L1t- a1 (1 ut ) a0 0; 0 a1 1; (5.4) t 0, 1, где: a3 = (1-a1) · ln(1+g) 0 В логарифмическом виде модель (5.4) имеет вид: ln(Yt /Lt ) 1n(a0 ) a1 ln(K t /Lt ) a3 t ε t E( ε t | K t , Lt , t) 0 E( ε 2 t | K t , Lt , t) σ 2 t 0, 1, (5.5) Построение функции Кобба-Дугласа Оценка модели (5.5) по тем же данным приняла вид: ln(Yt /Lt ) 0,0046 0,094 ln(K t /Lt ) 0,0120 t ε t (0,018) t 0, 1, R 2 0,67 (0,12) (0,0048) (0,043) (5.6) Из (5.6) легко видеть, что оценки коэффициентов b0=ln(a0) и а1 оказались незначимыми (гипотезы Н0:b0=0 и H0:a1=0 не отвергаются исходными данными) Но это приводит к абсурду: можно не затрачивая ни капитал ни труд производить продукцию Построение функции Кобба-Дугласа Вопрос. Почему статистические данные «не пустили» в модель время как заместитель технического прогресса? Ответ. Переменная К (капитальные затраты) так же являются функцией времени. В результате введения в модель еще переменной времени привело к мультиколинеарности матрицы коэффициентов наблюдения (матрица Х) Выражение a x x x T 1 T Y стало не устойчивым из-за неустойчивости обратной матрицы Построение функции Кобба-Дугласа Вывод. Последствием не аккуратного использования замещающих переменных при водит к нарушению обязательного условия МНК о не вырожденности матрицы коэффициентов уравнений наблюдений При использовании замещающих переменных необходим предварительный анализ степени корреляции между экзогенными переменными Построение функции Кобба-Дугласа 3. Проверка возможности изменить вид модели Откажемся от жесткого условия линейной однородности (а1+а2=1) производственной функции Тогда модель примет вид: a a Yt a0 K t 1 Lt 2 1 ut lnYt lna0 a1 lnK t a2 lnLt ln1 u (5.7) Оценка модели (5.7) в конечном итоге получилась следующей: y t K 0t .23 L0t .81 1 u R 2 0.96