Модели и методы прикладного анализа территориальных систем. Коломак Евгения Анатольевна д.э.н., профессор Организация курса и оценивание • Курс включает 2 части: теоретическую и практическую. • В конце курса – зачет (недифференцированный). Чтобы получить зачет необходимо: 1. Сдать практическое задание 2. Получить не меньше 40 баллов за теоретическую контрольную. Аппарат прикладного анализа пространственных аспектов развития • Эмпирические методы: описательная статистика, эконометрические модели • Балансовые модели: модели региона, мультирегиональные модели. • Оптимизационные модели: модели региона, мультирегиональные модели. • Имитационные модели: модели региональной системы. • Теория графов и сетей. Статические и динамические Эмпирические методы. Описательная статистика • • • • Таблицы Диаграммы Графики Карты Описательная статистика. Таблицы. Индексы промышленного производства Год 2000 2001 2002 2003 2004 2005 2006 107,5 106,9 104,1 107,5 108,3 104,8 106,2 109,0 119,5 95,5 114,9 107,9 101,5 104,0 104,9 106,4 106,4 106,7 103,7 104,8 105,8 103,1 114,0 103,5 105,8 105,4 99,9 103,9 107,8 103,7 96,8 103,4 103,9 103,1 102,7 111,7 107,1 103,8 107,7 107,2 101,6 110,2 105,1 106,3 104,0 105,6 106,4 103,3 104,4 105,2 102,8 101,2 105,3 106,1 108,3 112,0 106,8 104,6 103,8 107,0 104,7 106,8 107,2 113,7 111,6 105,4 109,7 110,0 108,9 108,5 107,9 112,7 107,8 110,7 128,5 106,1 100,6 109,9 110,8 109,2 111,8 105,0 96,2 102,7 109,2 107,5 101,6 107,4 103,4 103,7 105,7 Сибирский федеральный округ Республика Алтай Республика Бурятия Республика Тыва Республика Хакасия Алтайский край Красноярский край Иркутская область Кемеровская область Новосибирская область Омская область Томская область Читинская область Описательная статистика. Таблицы. 1999 2000 2001 2002 2003 2004 2005 2006 2007 Валовой региональный продукт на душу населения, тыс. руб. Минимум 17.2 25.6 38.6 50.4 55.9 73.4 83.5 106.1 143.9 Максимум 180.7 339.3 420.0 535.0 659.3 832.2 1171.6 1389.9 1480.9 Среднее 50.9 74.8 93.8 114.1 138.9 175.0 213.5 259.0 328.3 Стандартное отклонение 27.3 54.1 65.3 82.2 100.6 129.2 172.6 200.4 238.8 Описательная статистика. Диаграммы. Описательная статистика. Графики Описательная статистика. Графики Описательная статистика. Графики Описательная статистика. Графики Описательная статистика. Графики. Описательная статистика. Графики. Описательная статистика. Карты. Описательная статистика. Карты. Описательная статистика. Карты. Описательная статистика. Карты. Описательная статистика. Карты. Описательная статистика. Карты. Описательная статистика. Карты Характеристики межрегионального неравенства Для представления информации о межрегиональном неравенстве используют: 1) графическую форму (плотность распределения, функция распределения, кривая Лоренца); 2) характеристики разброса (размах вариации, стандартное отклонение, к-т вариации); 3) индексы (к-т Джини, индекс Тейла). Индекс Тэйла 𝑅 𝑌𝑟 𝑌𝑟 𝑙𝑛 𝑌 𝑌 𝑅 𝑇= 𝑟=1 𝑇 = 𝑇𝑏𝑒𝑡𝑤𝑒𝑒𝑛 + 𝑇𝑤𝑖𝑡ℎ𝑖𝑛 𝑀 𝑇𝑏𝑒𝑡𝑤𝑒𝑒𝑛 = 𝑌𝑚 𝑌𝑚 /𝑅𝑚 𝑙𝑛 𝑌/𝑅 𝑚=1 𝑌 𝑀 𝑇𝑤𝑖𝑡ℎ𝑖𝑛 = 𝑌𝑚 𝑇𝑚 𝑚=1 𝑌 𝑇𝑚 = 𝑅𝑚 𝑌𝑟 𝑌𝑟 𝑙𝑛 𝑌𝑚 /𝑅𝑚 𝑟=1 𝑌𝑚 Пространственная концентрация числа предприятий 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1995 1996 1997 1998 1999 2000 2001 2002 T 2003 Tw 2004 Tb 2005 2006 2007 2008 2009 2010 Эконометрические методы. МНК i =1,..,n – индекс региона yi – наблюдения над зависимой переменной в регионе i, xi – вектор наблюдений над независимыми переменными в регионе i. T i i i y x e β - вектор коэффициентов регрессии, ei – ошибка регрессии, xiT – транспонированный вектор наблюдений над независимыми переменными в регионе i. x1i xi ... x ki 1 ... k Метод наименьших квадратов В матричном виде: y X e где y ( y1 ,..., yn )T x1T X ... xT n e (e1 ,..., en )T xi1=1 для i=1,…,n , в этом случае β1 является константой Метод наименьших квадратов Метод наименьших квадратов (Ordinary Least Squares - OLS) ˆ OLS arg min yˆi xiT ̂ n T 2 ( y x ) i i i 1 ˆOLS ( X T X )1 X T y eˆi yi yˆi Оценки метода наименьших квадратов являются несмещенными линейными оценками с минимальной дисперсией, если верны следующие предположения о стохастической структуре модели: • E(ei)=0 • E(ei2)=σ2 • E(eiej)=0 для всех i≠j • rk X=k<n • xj – детерминированы Оценки метода наименьших квадратов имеют нормальное распределение, если дополнительно выполнено условие о явной форме ошибок: ei ~N(0, σ2) Метод наименьших квадратов VarˆOLS 2 ( X T X ) 1 Ковариационная матрица Оценка дисперсии ошибок 1 n 2 s eˆi n k i1 σ2: 2 Стандартная ошибка коэффициента регрессии Коэффициент детерминации RSS eˆT eˆ yˆ T yˆ R 1 1 T T TSS y y y y 2 se (ˆ j ) s ( X T X ) 1 2 adj R eˆT eˆ (n k ) 1 T y y (n 1) RSS – сумма квадратов ошибки регрессии, TSS – сумма квадратов центрированных значений зависимой переменной МНК. Тестирование гипотез. ei ~N(0, σ2) Линейная гипотеза относительно коэффициентов: H 0 : R r где R – матрица размерности qxk, а r – вектор размерности qx1. Пример: 1 2 2 3 0 1 0 0 R 0 1 1 1 2 3 2 r 0 Статистика для проверки гипотез или ( Rˆ r )T ( R( X T X ) 1 RT ) 1 ( Rˆ r ) F ~ Fq,n-k qs 2 (eˆ rT eˆ r eˆT eˆ) q F eˆT eˆ (n k ) ~ Fq,n-k МНК. Тестирование гипотез. ei ~N(0, σ2) Наиболее часто тестируемые гипотезы: 1. Проверка на значимость регрессионной модели в целом H 0 : 2 .... k 0 (TSS RSS ) (k 1) yˆ T yˆ (k 1) R2 n k F T 2 ˆ ˆ RSS (n k ) e e (n k ) 1 R k 1 2. Проверка гипотезы о значении отдельного коэффициента H 0 : j (j 0) ˆ j (j 0) se ( ˆ j ) t nk ˆ tn k ˆ tn k ˆ ˆ s ( ) q ; s ( ) q j e j 1 j e j 1 2 2 Эконометрические методы. Панельные данные Пусть i=1,…,n – индекс региона, t=1,…,T – индекс момента времени, тогда yit – наблюдения над зависимой переменной в регионе i в год t, xit – вектор наблюдений над независимыми переменными в регионе i в год t. Имеем дело с панельными данными. Панельные данные представляют собой наблюдения над однородными объектами в течение определенного периода времени. Панельные данные объединяют кросс-секции и временные ряды. Линейная модель панельных данных Линейная панельная модель yit xitT uit i – индекс региона, t – индекс момента времени, β – вектор коэффициентов регрессии, xitT – транспонированный вектор наблюдений над k независимыми переменными. x1it xit ... x kit 1 ... k Однонаправленная модель ошибки: uit i it μi – ненаблюдаемые региональные эффекты, υit – остаточные идиосинкратические компоненты. Двунаправленная модель ошибки: uit i t it λt – ненаблюдаемые временные эффекты. Линейная модель панельных данных • Предполагается, что μi, λi и υit являются независимыми одинаково распределенными величинами с нулевой средней и постоянной дисперсией σμ2, σλ2 и συ2 соответственно. • Региональные и временные эффекты могут трактоваться как фиксированные, в этом случае оценивается модель с фиксированными эффектами, Однонаправленная модель с фиксированными эффектами. Постановка. В модели региональные эффекты μi предполагаются фиксированными неизвестными параметрами, поэтому в ошибке остается только идиосинкратическая компонента. Пусть i=1,…,n, t=1,…,T, υit ~ (0, συ2) yit i x it T it В сумме все региональные эффекты повторяют константу, поэтому необходимо избавляться либо от константы, либо от одного индивидуального эффекта Однонаправленная модель с фиксированными эффектами. Постановка. Модель в векторной форме Для i-го объекта: yi1 yi ... y iT yi iT i X i i xiT1 i1 X i ... i ... xT iT iT 1 iT ... 1 Модель в матричной форме: y1 y ... y n X1 X ... X n 1 ... n iT 0 0 iT D ... ... 0 0 y D X 0 ... ... 0 ... iT 0 1 ... n Однонаправленная модель с фиксированными эффектами. Постановка. По предположению υit не зависят от регрессоров и υit ~ (0, συ2) независимые одинаково распределенные величины, следовательно ковариационная матрица ошибок имеет идеальную структуру. В данном случае оценки метода наименьших квадратов β и μ будут несмещенными и эффективными. Необходимым техническим условием является, чтобы матрица (DX) имела полный ранг (n+k). Это означает, что: матрица X не должна включать константу; матрица X не должна содержать переменные неменяющиеся во времени; T должно быть не меньше 2, чтобы региональные эффекты были идентифицируемы. Однонаправленная модель с фиксированными эффектами. Оценка. Чтобы снизить размерность, можно использовать преобразование данных. Преобразование состоит в вычитании среднего значения по времени из каждого наблюдения. Оценивается следующая система: yit yi xit xi it i T 1 yi yit T t 1 1 T xi xit T t 1 1 T i it T t 1 Оценки μi равны оценкам метода наименьших квадратов в регрессии ˆ i yi xiT ˆ Однонаправленная модель с фиксированными эффектами. Свойства оценок. Асимптотические свойства оценок при n и фиксированном T различные. Оценки ˆ j являются асимптотически нормальными и состоятельными, т.е. ˆ n ˆ j (j 0) se ( ˆ j ) N (0,1) n Следовательно, можно проводить стандартное тестирование в отношении этих оценок. Оценки же i несостоятельны. Причина в том, что их количество растет пропорционально n. Однонаправленная модель с фиксированными эффектами. Тестирование. Нулевая гипотеза H : Пусть it~N 0, 2 , RSS RSS n 1 тогда F ~F 0 1 2 ...... n 0 r , RSS nT n k где RSSr – сумма квадратов остатков в регрессии без региональных эффектов n 1,nT n k yit x it T it Двунаправленная модель с фиксированными эффектами. Постановка. В двунаправленной модели ошибка включает наряду с региональными временные эффекты: uit i t it yit i t xitT it где i=1,…,n, t=1,…,T, υit ~ (0, συ2) - независимые одинаково распределенные величины. В этой модели константа дублируется дважды: как сумма всех μi как сумма всех λt. Пусть n 0 и T 0 Двунаправленная модель с фиксированными эффектами. Постановка. Матричная запись y inT D D X 1 n1 1 T 1 iT 0 0 iT D ... ... 0 0 0 ... 0 0 ... 0 ... ... iT 0 ... 0 I T 1 0 ... 0 D ... ... ... I T 1 0 ... 0 Благодаря предположению о структуре ошибок, метод наименьших квадратов будет давать несмещенную и эффективную оценку. Необходимым условием получения оценки является равенство ранга матрицы регрессоров (n+T-1+k). Это означает, что: матрица X не должна содержать переменные неменяющиеся во времени; матрица X не должна содержать переменные общие для всех объектов в каждый отдельный момент времени Если эти условия выполнены, то модель можно оценивать методом наименьших квадратов, но можно использовать и преобразование данных. Двунаправленная модель с фиксированными эффектами. Оценка. Оценка ˆ является оценкой МНК на данных преобразованных таким образом, чтобы исключить региональные и временные эффекты, уравнения модифицируются: yit yi yt y ( xit xi xt x )T it i t 1 T yi yit T t 1 1 y nT T n y t 1 i 1 it 1 T xi xit T t 1 1 n yt yit n i 1 1 T i it T t 1 1 n t it n i1 1 x nT T n x t 1 i 1 it 1 n xt xit n i1 1 nT T n t 1 i 1 it Двунаправленная модель с фиксированными эффектами. Свойства оценок. Дисперсия ошибки: ˆ2 RSS nT n k T 1 Асимптотически оценка ˆ является состоятельной и нормальной при фиксированном T и n . Оценки региональных эффектов при n и фиксированном T являются несостоятельными, так как их количество растет пропорционально размеру выборки. Оценки временных эффектов при n и фиксированном T могут быть состоятельными относительно друг друга. Но так как они связаны с несостоятельными оценками региональных эффектов через константу, то их свойства страдают тоже. Оценками константы, индивидуальных эффектов и временных эффектов можно пользоваться как состоятельными при n и T . Двунаправленная модель с фиксированными эффектами. Тестирование. 1. Тестирование на отсутствие региональных и временных эффектов H 0 : 1 2 ...... n1 1 2 ...... T 1 0 RSS F RSS n T 2 Пусть it ~ N 0, , тогда ~ FnT 2,nT nk T 1 где RSS nT n k T 1 RSSr – сумма квадратов остатков в регрессии без T региональных и временных эффектов yit xit it 2. Тестирование на отсутствие региональных эффектов 2 F RSS RSS n 1 RSS nT n k T 1 r r H 0 : 1 2 ...... n1 0 ~F n 1,nT n k T 1 , где RSSr из yit t xitT it Двунаправленная модель с фиксированными эффектами. Тестирование. 3. Тестирование на отсутствие временных эффектов H 0 : 1 2 ...... T 1 0 F RSS RSS T 1 RSS nT n k T 1 r ~ FT 1,nT nk T 1 где RSSr – сумма квадратов остатков в панельной регрессии с фиксированными региональными эффектами yit i xitT it Литература по панельным данным: • Коломак Е.А. Панельные данные: методы эконометрического анализа. Учебное пособие. Новосибирск. 2011. • Анатольев С.А. Курс лекций по эконометрике для подготовленных. www.nes.ru/russian/research/abstracts/2003/Anatolyev-r.htm • Магнус Я.Р., Катышев П.К., Пересецкий А.А. «Эконометрика. Начальный курс», Москва: «Дело», 2005. • Эконометрика, ред. И.И.Елисеева, Москва: «Финансы и статистика», 2005. • Baltagi B.H. “Econometric Analysis of Panel Data”, John Wiley and Sons, 2001. • Wooldridge J.M. “Econometric Analysis of Cross Section and Panel Data”, MIT Press, 2002 Статистические пакеты • STATA • EViews