Эконометрика Литература Доугерти К. Введение в эконометрику. - 3-е изд. - М.: ИНФРАМ, 2010. - XIV, 465 с. И.И.Елисеева, С.В. Курышева, Т.В. Костеева и др. Эконометрика: учебник. - М.: Финансы и статистика , 2008.576 с. Кремер Н.Ш., Путко Б.А. Эконометрика: учебник для студентов вузов. - 2-е изд.,стереотип. - М.: ЮНИТИ-ДАНА, 2008. - 311 с. Новиков А. И. Эконометрика: учебное пособие для студентов вузов / - 2-е изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с. Н. П. Тихомиров, Е. Ю. Дорохина .Эконометрика: учебник для студ. вузов, обучающихся по спец. "Математические методы в экономике" - М. : Экзамен, 2007. - 512 с. Тема 1. Парная линейная регрессионная модель Фрэнсис Га́льтон • 16 февраля 1822 — 17 января 1911) — английский исследователь, географ, антрополог и психолог. Родился в Бирмингеме, в Англии. Регрессия (лат. regressio - обратное движение, переход от более сложных форм развития к менее сложным) - одно из основных понятий в теории вероятности и математической статистике, выражающее зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин. Термин "регрессия" был введён Фрэнсисом Гальтоном (англ) в конце 19-го века. Гальтон обнаружил, что дети родителей с высоким или низким ростом обычно не наследуют выдающийся рост и назвал этот феномен "регрессия к посредственности". Сначала этот термин использовался исключительно в биологическом смысле. После работ Карла Пирсона этот термин стали использовать и в статистике. Регрессионная модель y f (x) x - независимая переменная, y - зависимая переменная, - случайная составляющая. Выбор вида f (x) • экономическая теория • опыт, интуиция исследователя • эмпирический анализ данных Поле корреляции 8 120 100 80 4 Y Y 6 60 2 40 0 0 5 10 15 20 20 0 5 10 X X 15 Поле корреляции 80 0.4 60 0.3 Y Y 40 0.2 20 0.1 0 0.0 -20 0 5 10 X 15 0 5 10 X 15 Парная линейная регрессионная модель y x Пусть есть набор значений двух переменных Меры отклонения функции набора наблюдений 1) F f (x ) 2 ( y f ( x )) t t n t 1 F yt f ( xt ) n 2) t 1 3) F g ( y f ( x )) n t t t 1 Пример. Функция Хубера x 2 , x c, g ( x) 2cx c 2 , x c, 2cx c 2 , x c. от Метод наименьших квадратов • Задача: найти оценки a, b параметров , такие, что y f ( x ) 2 i i i e или min, ei yi y x 2 i i где y a bx i min МНК (продолжение) S i yi y xi y a b x 2 2 i Необходимые условия экстремума: n a b x y 2 a x b x y x система нормальных уравнений МНК (продолжение) • Решение системы нормальных уравнений ( x x )( y y ) n yx y x b 2 2 x x i i i 1 2 ( x x ) i n i 1 a y b x • где cov (х, у) — ковариация признаков 2 • x — дисперсия признака х Cov( x, y ) 2 x Интерпретация уравнения регрессии • b – коэффициент регрессии • Показывает среднее изменение результата с изменением фактора на одну единицу • a – может не иметь экономического смысла Адекватность модели • Наличие связи между переменными • Оценка значимости уравнения в целом – Анализ дисперсии – F-критерий Фишера • Выдвигается нулевая гипотеза H0: – коэффициент регрессии равен нулю, т. е. b = 0, и, следовательно, фактор х не оказывает влияния на результат у. • Оценка значимости коэффициентов модели Теснота связи • Показатель тесноты связи rxy – линейный коэффициент корреляции x covx, y yx y x rxy b y x y x y 1 rxy 1 D( x) , x D( x) M x M ( x) , Cov( x, y ) M x M ( x) y M ( y ) . 2 Анализ дисперсии y y 2 = yx y + Общая сумма квадратов отклонений = Сумма квадратов отклонений объясненная регрессией RSS 2 • • • • • TSS TSS – total sum of squares, RSS – regression sum of squares, ESS – error sum of squares. + 2 y yx Остаточная сумма квадратов отклонений ESS Коэффициент детерминации Коэффициентом детерминации или долей объясненной нашим уравнением дисперсии называется величина RSS ESS R 1 . TSS TSS 2 2 0 R 1 Число степеней свободы (df— degrees of freedom) • df - число свободы независимого варьирования признака y y 2 2 2 yx y y yx n 1 1 (n 2) Дисперсии на одну степень свободы y y 2 Dобщ Dфакт Dост n 1 2 yx y 1 2 y yx n2 F-критерий • F-отношение F Dфакт Dост Вывод по F-критерию • Fфакт > Fтабл H0 отклоняется • Fфакт < Fтабл уравнение регрессии считается статистически незначимым и Н0 не отклоняется • Величина F-критерия связана с 2 коэффициентом детерминации R 2 R F (n 2) 2 1 R доказательство 2 2 2 yx y R y n 2 2 2 y yx (1 R ) y n Средняя ошибка аппроксимации • Средняя ошибка аппроксимации среднее отклонение расчетных значений от фактических: 1 yy A 100% n y • Допустимый предел значений - не более 8-10%. Пример: по группе предприятий, выпускающих один и тот же вид продукции, рассматривается функция издержек . № предприятия 1 2 3 4 5 6 7 Итого Выпуск продукции, тыс. ед. (х) 1 2 4 3 5 3 4 22 Затраты на производство, млн руб. (у) 30 70 150 100 170 100 150 770 ух x2 y2 30 140 600 300 850 300 600 2820 1 4 16 9 25 9 16 80 900 4900 22500 10000 28900 10000 22500 99700 yx 31,1 67,9 141,6 104,7 178,4 104,7 141,6 770,0 Пример (продолжение) • Система нормальных уравнений будет иметь вид 7a 22b 770 22a 80b 2820 • Тогда а = - 5,79; b= 36,84. • Уравнение регрессии y x 5,79 36,84 x • r2 = 0,982 Пример (продолжение) • общая сумма квадратов y y 2 y 2 n y 2 99700 7 110 2 15000 • факторная сумма квадратов 2 2 2 2 2 y y b x x 36 , 84 80 7 22 / 7 14735 x • остаточная сумма квадратов 2 y y x 15000 14735 265 Пример (продолжение) Dфакт 14735 Dостат 265 / 5 53 F 14735 / 53 278 F 0, 05 6,61; F 0, 01 16,26 • Вывод: уравнение регрессии значимо Fфакт >Fтабл Дисперсионный анализ результатов регрессии Источники вариации Общая Объясненная Остаточная Число степеней свободы Сумма квадратов отклонений Дисперсия на одну степень свободы 6 1 5 15000 14735 265 -14 735 53 F-отношение фактическое табличное при α=0,05 -278 -- -6,61 --