FA-MIDAS: Краткосрочное прогнозирование (наукастинг) ВВП с

реклама
FA-MIDAS: Краткосрочное прогнозирование (наукастинг) ВВП с использованием регрессии
со смешанными частотами данных и динамическими факторами
Исаков Александр, главный экономист, Департамент денежно-кредитной политики, Банк России
Статистика ВВП является наиболее общим и информативным индикатором уровня деловой
активности. Вместе с тем, информация об уровне ВВП публикуется лишь ежеквартально и с задержкой в
полтора месяца, что создает препятствия для оперативного анализа и оценки состояния экономики.
Для получения предварительных оценок совокупного выпуска получили распространение подходы,
часто объединяемые понятием «наукастинг». Такие методы позволяют извлекать информацию о динамике
выпуска из больших массивов разнородных данных.
В настоящей работе рассматривается использование комбинации динамической факторной
модели в модификации, предложенной в работе (Bańbura, et al., 2014), и модели временных рядов со
смешанными частотами MIDAS (Mixed Data Sampling), представленной в работе (Bai, et al., 2013).
В качестве альтернативных рассматриваются наиболее популярные в современной литературе и на
практике подходы к получению предварительной оценке ВВП: динамические факторные модели (Banbura,
et al., 2010), уравнения «связки» (англ. bridge equations), опирающихся на построение одномерных моделей
временных рядов для ключевых показателей, и подходы, опирающиеся на агрегирование оценок
профессиональных аналитиков и альтернативных моделей.
На практике перспективность того или иного метода решения задачи получения предварительных
оценок выпуска зависит от его способности решать нескольких специфических для этой проблемы задач:
Большая размерность. Количество индикаторов, потенциально содержащих сведения об уровне
деловой активности и публикуемых ежемесячно или чаще, велико и превышает глубину временного ряда
ВВП. Значительная ширина панели в сочетании с невысокой глубиной временных рядов создаёт условия, в
которых невозможно достаточно точно идентифицировать параметры классических моделей временных
рядов.
Несбалансированности набора данных/пропущенные значения. Набор альтернативных
индикаторов экономической активности характеризуется так называемым «рваным краем» — ситуацией, в
которой из-за различной продолжительности задержек публикации данных панель объясняющих
переменных оказывается несбалансированной.
Смешанная частота данных. Статистка ВВП публикуется с квартальной частотой, тогда как
многие финансовые и экономические индикаторы доступны с более высокой, зачастую месячной,
периодичностью. Соответственно подход к построению предварительной оценки должен учитывать
наличие переменных с различной частотой наблюдения.
Настоящая работа является эмпирической. Точность оценок различных моделей по своей
природе является исключительно эмпирическим вопросом, и ответ на него может претендовать на
обобщающее значение только в том случае, если он основан на достаточно репрезентативном периоде
наблюдения. Вместе с тем, за последние десятилетия российская экономика прошла через ряд структурных
трансформаций, что ставит под сомнение возможность экстраполяции закономерностей, действующих в
определенные периоды на будущее. Проблема высокой изменчивости, характерная для многих переходных
экономик, усугубляется искусственными невязками в методиках расчета статистических временных рядов,
что приводит к несопоставимости значений индикатора за разные периоды (Бессонов, 2014).
В качестве компромисса между продолжительностью периода наблюдения и периода, в течении
которого сохраняется достаточная сопоставимость поведения временных рядов, выбран отрезок времени с
I квартала 2002 г. по II квартал 2014 года 1 . При этом, период с I квартала 2002 г. по II квартал 2005 г.
используется в качестве периода первоначальной оценки моделей2.
В работе дополнительно решается проблема выбора информативных индикаторов для получения
предварительных оценок выпуска. Полученные результаты согласуются с тенденцией, сложившейся в
данном направлении исследования, к более тщательному предварительному отбору временных рядов и
меньшему размеру итоговой выборки, как показано на рис. 1. Исходная выборка включала более 400
индикаторов, характеризирующих состояние экономики России, включающих ценовые, финансовые
показатели, индикаторы опросов, рынка труда, торговой и производственной активности.
При выборе расчетной базы были использованы качественные (по аналогии с правилами,
использованными в работе (Alarez, et al., 2012)), статистические критерии, так и специфические
рекомендации исследователей, предпринимавших попытки построения моделей оценки выпуска для
России, например, (Styrin, et al., 2009).
Для оценки перспективности применения указанных выше подходов к предварительной оценке
статистики выпуска был проведен расчет их прогнозной (вневыборочной) точности на основе данных
за период с I квартала 2002 г. по II квартал 2014 года. При этом данные с I квартала 2002 г. по IV квартал
2004 г. использовались для первичной оценки моделей, а первым прогнозным кварталом был I квартал 2005
года. Тестирование предусматривает расчет прогноза выпуска каждые две недели — с начала отчетного
квартала до публикации первой оценки Росстатом. Таким образом, для каждого из 38 кварталов
рассчитывается 8-9 предварительных оценок для каждой из моделей.
Будет дополнен данными, доступными на момент опубликования полного текста доклада.
Кроме моделей, основанных на данных опросов профессиональных аналитиков. Эти данные доступны с 2006 года.
Подробное описание подхода к расчету точности данного подхода приведены ниже.
1
2
Рисунок 1. По оси абсцисс указано количество индикаторов, использованных в работе, по
оси ординат – год опубликования работы
Проведенные расчеты подтверждают превосходство динамических факторных моделей над
альтернативными подходами. Динамика меры точности прогноза по мере приближения к дате публикации
(сокращения горизонта прогнозирования и увеличения объема доступных данных) говорит о
преимуществах FA-MIDAS в области учета поступающих данных о состоянии экономики для получения
более точных предварительных оценок динамики выпуска.
2.0
RMSE, %
1.5
1.0
0.5
0.0
2
4
6
8
10
12
14
16
18
Количество недель по публикации первой оценки ВВП, шт.
RW
AR(2)
FAVAR-MIDAS
BE
Проф. аналитики
Рисунок 2. Точность альтернативных подходов к прогнозированию ВВП, квартал к
кварталу, I кв. 2002 г. – II кв. 2014 г.
𝑅𝑊 — случайное блуждание,
𝐴𝑅(2) — авторегрессионный процесс второго порядка,
FA-MIDAS — сочетание ДФМ-модели FAVAR с регрессией для данных со смешанными
частотами MIDAS3,
𝐵𝑟𝐸𝑞 – среднее значение прогноза на основе уравнений «связки»,
Проф. аналитики — среднее значение прогноза профессионального аналитика (на основе
данных Bloomberg).
Необходимые для расчетов алгоритмы были реализованы с использованием пакета
математического моделирования Wolfram Mathematica. Материалы для репликации результатов
доступны по запросу.
3
Ghysels, E., Sinko, A., Valkanov, R. (2007) MIDAS Regressions: Further Results and New Directions. Econometric Reviews,
26 (1), 53–90.
Скачать