Министерство экономического развития и торговли Российской Федерации Государственный университет — Высшая школа экономики Программа дисциплины Байесовский подход в эконометрике для направления 080100.68 « Экономика» подготовки магистра Автор: Айвазян С.А. Рекомендована секцией УМС «Математические и статистические методы в экономике» Одобрена на заседании кафедры «Математическая экономика и эконометрика» Председатель Зав. кафедрой ___________________ Шведов А.С. ________________ Канторович Г.Г. «_____» ____________ 2008 г. «____»__________ 2008 г Утверждена УС факультета экономики Ученый секретарь __________________ Протасевич Т.А. « ____» ____________ 2008 г. Москва Для усвоения курса необходимы знания (в рамках учебных программ ГУ-ВШЭ) по линейной алгебре, математическому анализу, теории вероятностей, математической статистике, эконометрике и многомерному статистическому анализу. Курс посвящен так называемому байесовскому подходу к эконометрическому анализу, основанному на субъективно-вероятностном способе операционализации принципа максимального использования (наряду с исходными статистическими данными) а п р и о р н о й информации об исследуемом процессе, и предназначен для студентов 2-го курса магистратуры специализаций «Математические методы анализа экономики» и «Экономическое моделирование и экономическая политика». Байесовские методы широко распространены в теории и практике эконометрического анализа и являются обязательной составной частью современных учебных программ магистерского уровня по эконометрике в ведущих университетах мира. Особенно заметные преимущества (по сравнению с классическими методами) с точки зрения точности получаемых статистических выводов они имеют в условиях о т н о с и т е л ь н о м а л ы х выборок, что весьма характерно для эконометрического моделирования макроэкономических процессов. 2 Тематический план учебной дисциплины №№ тем, подтем В том числе Всего часов Тема, подтема Лекции Семинары Самостоятельная работа 1 Основные принципы байесовского подхода. 4 2 — 2 2 Распределения, сопряженные с распределением наблюдаемой генеральной совокупности, их генезис и роль в байесовском анализе. 8 4 — 4 3 Байесовский анализ распределений, зависящих от единственного параметра. 16 6 — 10 4 Байесовский анализ одномерной нормальной генеральной совокупности. 8 4 — 4 5 Байесовский анализ классической линейной модели множественной регрессии. 18 8 — 10 54 24 0 30 Итого: Базовый учебник (и) или ридер (ы) [1]С.А. Айвазян. Байесовский подход в эконометрическом анализе. — «Прикладная эконометрика», №1(9), 2008, с. 93–130. Формы контроля: Итоговая оценка по учебной дисциплине складывается из следующих элементов: Зачет – 80% Домашнее задание – 20% 3 Содержание программы Тема1. Основные принципы байесовского подхода Исходные данные двух типов (априорные и статистические) как информационная база любого статистического вывода. Классификация возможных подходов к эконометрическому анализу в зависимости от удельного веса используемой априорной информации. Байесовский подход и субъективные вероятности: интерпретация вероятности как степени нашей уверенности в справедливости некоторого утверждения. Принцип повышения или ослабления степени нашей уверенности по мере накопления статистических данных об исследуемом процессе или явлении. Операционализация этого принципа, основанная на формуле Байеса. Общая логическая схема и основные формулы байесовского метода идентификации модели [1]: п.1. Тема2. Распределения, сопряженные с распределением наблюдаемой генеральной совокупности, и их роль в байесовском анализе Определение семейства распределений, сопряженных с распределением исследуемой (наблюдаемой) генеральной совокупности. Понятие достаточной статистики в задаче статистического оценивания неизвестных параметров. Проблема существования семейства сопряженных распределений, связь с достаточными статистиками. Семейства распределений, сопряженных с нормальной, биномиальной, пуассоновской, экспоненциальной, отрицательно-биномиальной и равномерной генеральными совокупностями (вывод, комментарии). Априорные распределения, представляющие «скудость априорного знания» (САЗраспределения), генезис сопряженных распределений. Понятие несобственных распределений. Равномерное априорное распределение значений параметра на всей числовой прямой. Равномерное априорное распределение параметра на положительной полупрямой. Априорные несобственные распределения, инвариантные относительно степенных преобразований. Связь САЗ-распределений с сопряженными. Примеры использования САЗраспределений: 1) оценка среднего нормальной генеральной совокупности; 2) оценка параметра точности нормального распределения; 3) оценивание обоих параметров нормальной генеральной совокупности; 4) оценка параметра формы в распределении Парето. [1]: пп. 2 и 3; [2]: §§9.1~9.5; [3]: Пример 2.2 и Приложение к гл. 2. 4 Т е м а 3 . Байесовский анализ распределений, зависящих от единственного неизвестного параметра Байесовское оценивание единственного неизвестного параметра в распределениях: нормальном (с неизвестным средним значением), нормальном (с неизвестной дисперсией), биномиальном (с неизвестной “вероятностью успеха”), отрицательно-биномиальном (с неизвестной “вероятностью успеха”), экспоненциальном (с неизвестным параметром масштаба), пуассоновском и ( 0, )-равномерном (с неизвестным максимальным значением ). [1]: пп. 35. Т е м а 4 . Байесовский анализ одномерной нормальной генеральной совокупности при неизвестных значениях среднего и дисперсии Двумерный гамма-нормальный з.р.в. и его свойства. Обобщенное одномерное распределение Стьюдента с параметрами сдвига и точности. Байесовские оценки обоих параметров одномерного нормального закона: общая схема и решение конкретной задачи. [1]: пп. 3 и 4 (пример 2); [2]: §9.6. Т е м а 5 . Байесовский анализ классической линейной модели множественной регрессии (КЛММР) Классическая линейная модель множественной регрессии (КЛММР). Функция правдоподобия наблюдений в схеме статистического анализа КЛММР. Многомерное гамма-нормальное распределение как априорное распределение параметров КЛММР, сопряженное по отношению к анализируемой генеральной совокупности. Байесовские точечные оценки и доверительные области для неизвестных параметров КЛММР. Байесовский прогноз зависимой переменной (точечный и интервальный). [1]: п.5 (задача 5), п.6 и Приложения 1 и 2; [2]: §§11.10, 11.11 и 11.12.; [3]: п.3.1.3 и задачи 9–12 из гл.3. Основная литература [1] С.А. Айвазян. Байесовский подход в эконометрическом анализе. — «Прикладная эконометрика», №1(9), 2008, с. 93–130. 5 Дополнительная литература М. Де Гроот. Оптимальные статистические решения. (Перев. с англ.), М.: Мир, [2] 1974, гл. 4, 5, 9 и §§ 11.10-11.12. А. Зельнер. Байесовские методы в эконометрии. (Перевод с англ.), М.: Статистика, [3] 1980, гл. 1, 2 и 3. [4] Ghosh J.K., Delampady M., Samanta T. An Introduction to Bayesian Analysis. Theory and Methods. — Springer, 2006. — 350 p. Тематика для домашнего задания: В какой мере валовой внутренний продукт (ВВП) страны, рассчитанный на душу населения в текущих ценах с учетом паритета покупательной способности местной валюты, определяет качество жизни населения? Для ответа на этот вопрос мы располагаем тыс.долл. данными за 1998 г. По ВВП xi и качеству жизни ( yi — экспертная оценка в год на душу в десятибалльной системе) по четырнадцати странам (т.е. i 1, 2, ,14 , см. таблицу 1). Еще по двум странам (Норвегии и Польше) мы располагаем только значениями ВВП, x15 и x16 . Анализ классической нормальной модели линейной регрессии yi 1 2 xi i , ε N (, h1I ) (1) по данным за другие годы позволил утверждать, что в качестве априорных значений 10 , 20 и h можно использовать величины, соответственно, 3,00, 0,20 и 0,5, причем эти данные характеризуются среднеквадратическими ошибками, соответственно, 0,60, 0,03 и 0,1. Требуется, используя априорное распределение параметров 1 , 2 и h , сопряженное к наблюдаемой генеральной совокупности: 1) построить точечные и интервальные (с уровнем доверия P=0,90) байесовские оценки для параметров 1 , 2 и h , сравнить их с классическими МНК-оценками; 2) восстановить (в виде соответствующих точечных и интервальных, — с тем же уровнем доверия, — байесовских оценок) недостающие значения y15 и y16, причем, интервальные оценки для y15 и y16 дать как автономно для каждого из этих двух значений, так и в виде совместной двумерной доверительной области (изобразить ее геометрически). 6 Анализируемые страны: 1. Австрия 8. Канада 2. Англия 9. Китай 3. Бразилия 10. Россия 4. Германия 11. США 5. Голландия 12. Франция 6. Испания 13. Швейцария 7. Италия 14. Япония 15*. Норвегия 16*. Польша Исходные статистические данные (за 1998 г.) yi — экспертная оценка (в 10-тибалльной системе) к.ж.н. i-й страны, тыс.долл. xi — ВВП. душу Таблица 1 (i) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 xi 20,46 17,92 5,74 19,94 18,07 14,29 18,90 22,32 2,52 5,26 26,65 19,98 23,48 21,62 21,61 6,52 yi 9,17 6,85 4,30 8,64 8,37 7,82 6,80 9,06 2,51 0,82 7,89 8,00 9,00 5,43 ? ? Вопросы для оценки качества освоения дисциплины Задача 1: классическое (ММП) оценивание (точечное и интервальное); сравнение с результатами байесовского оценивания. С помощью метода максимального правдоподобия постройте точечные и интервальные (с уровнем доверия P 0,95 ) оценки для неизвестного значения параметра Вашей модели. Исследуйте свойства ММП-оценки. Сравните полученные оценки с соответствующими точечными и интервальными байесовскими оценками при заданных априорном среднем значении 0 параметра и его среднеквадратической ошибки 0 D . 7 Замечания: 1) Желательно построить точные интервальные оценки. Если Вы не знаете, как это сделать, постройте асимптотически точные интервальные оценки. 2) При сравнении оценок воспользоваться результатами решения задачи 3. Задача 2: доказательство существования и выявление общего вида сопряженного априорного распределения оцениваемого параметра. Что такое достаточная статистика? Определите вид достаточной статистики (достаточных статистик) в задаче оценивания неизвестного значения параметра Вашей модели. Существует ли сопряженное априорное распределение этого параметра в задаче его байесовского оценивания? Каков общий вид этого распределения? Выведите формулы пересчета параметров апостериорного распределения по параметрам сопряженного априорного распределения и выборочным данным. Задача 3: байесовское оценивание неизвестных значений параметров. По заданным априорным значениям среднего 0 оцениваемого параметра и его среднеквадратической ошибки 0 D построить точечные и интервальные (с уровнем доверия P 0,95 ) байесовские оценки этого параметра. Замечание: Воспользоваться результатами решения задачи 2. 8 Варианты зачетной работы по курсу «Байесовский подход в эконометрике » № варианта задания Модель №№ задач ( ; 2 ) – нормальная ( 2 – известна) 1и3 2 ( ; 2 ) – нормальная ( 2 – известна) 2и3 3 1 a; – нормальная ( a – известна) 1~3 4 1 a; – нормальная ( a – известна) 2и3 5 Экспоненциальная с неизвестным параметром масштаба 1и3 6 Экспоненциальная с неизвестным параметром масштаба 2и3 7 ( ; ) – равномерный 1и3 xmax (n) 3,2; n 5; 0 5,38; 0 1,39 ; 8 ( ; ) – равномерный 2и3 x P max y y n 9 Пуассона с неизв. параметром 1~3 n 8; x (n) 1,25 ; 0 1,40; 0 0,07 10 ( N ; ) – биномиальная ( N - известно) 1~3 N 80; n 5; x (n) 1,6 ; 0 0,01; 0 0,003 (k ; ) – отрицательно-биномиальная ( k – известно) 1и3 12 (k ; ) – отрицательно-биномиальная ( k – известно) 2и3 0 6,85 103 ; 0 1,61 103 13 Парето с неизв. параметром формы 1и3 14 Парето с неизв. параметром формы 2и3 x x0 2; n 40; gn 3,8 ; 2 ln i x0 0 1,2; 0 0,2 15 1 1; – нормальная 2 1и3 1 1; – нормальная 2 2и3 1 11 16 Исходные данные, примечания n 10; x (n) 0,775; 2 0,28 ; 0 0,60 ; 0 0,03 n 24; a 0; s2 (n) 0,64; 0 2; 0 0,5 ; 2 xi 2 (2) n 12; x (n) 36; 2 xi 2 (2) ; 0 0,04; 0 0,01 при y [0;1] 10 n 10; k 1; xi 1000 ; i 1 2 (2) ; 10 2,5; 20 16; n 9; 0 (1 ) 0,2; 0 (2 ) 8 x 3,0; s 2 (n) 0,1 ----------------------------------------------------------------------------------------------------------------------------- ---------------------------- 9 Автор программы: _____________________________/ Айвазян С.А../ 10