FA-MIDAS: Краткосрочное прогнозирование (наукастинг) ВВП с использованием регрессии со смешанными частотами данных и динамическими факторами Исаков Александр, главный экономист, Департамент денежно-кредитной политики, Банк России Статистика ВВП является наиболее общим и информативным индикатором уровня деловой активности. Вместе с тем, информация об уровне ВВП публикуется лишь ежеквартально и с задержкой в полтора месяца, что создает препятствия для оперативного анализа и оценки состояния экономики. Для получения предварительных оценок совокупного выпуска получили распространение подходы, часто объединяемые понятием «наукастинг». Такие методы позволяют извлекать информацию о динамике выпуска из больших массивов разнородных данных. В настоящей работе рассматривается использование комбинации динамической факторной модели в модификации, предложенной в работе (Bańbura, et al., 2014), и модели временных рядов со смешанными частотами MIDAS (Mixed Data Sampling), представленной в работе (Bai, et al., 2013). В качестве альтернативных рассматриваются наиболее популярные в современной литературе и на практике подходы к получению предварительной оценке ВВП: динамические факторные модели (Banbura, et al., 2010), уравнения «связки» (англ. bridge equations), опирающихся на построение одномерных моделей временных рядов для ключевых показателей, и подходы, опирающиеся на агрегирование оценок профессиональных аналитиков и альтернативных моделей. На практике перспективность того или иного метода решения задачи получения предварительных оценок выпуска зависит от его способности решать нескольких специфических для этой проблемы задач: Большая размерность. Количество индикаторов, потенциально содержащих сведения об уровне деловой активности и публикуемых ежемесячно или чаще, велико и превышает глубину временного ряда ВВП. Значительная ширина панели в сочетании с невысокой глубиной временных рядов создаёт условия, в которых невозможно достаточно точно идентифицировать параметры классических моделей временных рядов. Несбалансированности набора данных/пропущенные значения. Набор альтернативных индикаторов экономической активности характеризуется так называемым «рваным краем» — ситуацией, в которой из-за различной продолжительности задержек публикации данных панель объясняющих переменных оказывается несбалансированной. Смешанная частота данных. Статистка ВВП публикуется с квартальной частотой, тогда как многие финансовые и экономические индикаторы доступны с более высокой, зачастую месячной, периодичностью. Соответственно подход к построению предварительной оценки должен учитывать наличие переменных с различной частотой наблюдения. Настоящая работа является эмпирической. Точность оценок различных моделей по своей природе является исключительно эмпирическим вопросом, и ответ на него может претендовать на обобщающее значение только в том случае, если он основан на достаточно репрезентативном периоде наблюдения. Вместе с тем, за последние десятилетия российская экономика прошла через ряд структурных трансформаций, что ставит под сомнение возможность экстраполяции закономерностей, действующих в определенные периоды на будущее. Проблема высокой изменчивости, характерная для многих переходных экономик, усугубляется искусственными невязками в методиках расчета статистических временных рядов, что приводит к несопоставимости значений индикатора за разные периоды (Бессонов, 2014). В качестве компромисса между продолжительностью периода наблюдения и периода, в течении которого сохраняется достаточная сопоставимость поведения временных рядов, выбран отрезок времени с I квартала 2002 г. по II квартал 2014 года 1 . При этом, период с I квартала 2002 г. по II квартал 2005 г. используется в качестве периода первоначальной оценки моделей2. В работе дополнительно решается проблема выбора информативных индикаторов для получения предварительных оценок выпуска. Полученные результаты согласуются с тенденцией, сложившейся в данном направлении исследования, к более тщательному предварительному отбору временных рядов и меньшему размеру итоговой выборки, как показано на рис. 1. Исходная выборка включала более 400 индикаторов, характеризирующих состояние экономики России, включающих ценовые, финансовые показатели, индикаторы опросов, рынка труда, торговой и производственной активности. При выборе расчетной базы были использованы качественные (по аналогии с правилами, использованными в работе (Alarez, et al., 2012)), статистические критерии, так и специфические рекомендации исследователей, предпринимавших попытки построения моделей оценки выпуска для России, например, (Styrin, et al., 2009). Для оценки перспективности применения указанных выше подходов к предварительной оценке статистики выпуска был проведен расчет их прогнозной (вневыборочной) точности на основе данных за период с I квартала 2002 г. по II квартал 2014 года. При этом данные с I квартала 2002 г. по IV квартал 2004 г. использовались для первичной оценки моделей, а первым прогнозным кварталом был I квартал 2005 года. Тестирование предусматривает расчет прогноза выпуска каждые две недели — с начала отчетного квартала до публикации первой оценки Росстатом. Таким образом, для каждого из 38 кварталов рассчитывается 8-9 предварительных оценок для каждой из моделей. Будет дополнен данными, доступными на момент опубликования полного текста доклада. Кроме моделей, основанных на данных опросов профессиональных аналитиков. Эти данные доступны с 2006 года. Подробное описание подхода к расчету точности данного подхода приведены ниже. 1 2 Рисунок 1. По оси абсцисс указано количество индикаторов, использованных в работе, по оси ординат – год опубликования работы Проведенные расчеты подтверждают превосходство динамических факторных моделей над альтернативными подходами. Динамика меры точности прогноза по мере приближения к дате публикации (сокращения горизонта прогнозирования и увеличения объема доступных данных) говорит о преимуществах FA-MIDAS в области учета поступающих данных о состоянии экономики для получения более точных предварительных оценок динамики выпуска. 2.0 RMSE, % 1.5 1.0 0.5 0.0 2 4 6 8 10 12 14 16 18 Количество недель по публикации первой оценки ВВП, шт. RW AR(2) FAVAR-MIDAS BE Проф. аналитики Рисунок 2. Точность альтернативных подходов к прогнозированию ВВП, квартал к кварталу, I кв. 2002 г. – II кв. 2014 г. 𝑅𝑊 — случайное блуждание, 𝐴𝑅(2) — авторегрессионный процесс второго порядка, FA-MIDAS — сочетание ДФМ-модели FAVAR с регрессией для данных со смешанными частотами MIDAS3, 𝐵𝑟𝐸𝑞 – среднее значение прогноза на основе уравнений «связки», Проф. аналитики — среднее значение прогноза профессионального аналитика (на основе данных Bloomberg). Необходимые для расчетов алгоритмы были реализованы с использованием пакета математического моделирования Wolfram Mathematica. Материалы для репликации результатов доступны по запросу. 3 Ghysels, E., Sinko, A., Valkanov, R. (2007) MIDAS Regressions: Further Results and New Directions. Econometric Reviews, 26 (1), 53–90.