ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» Л.П.Рунова Бизнес-прогнозирование с помощью моделей временных рядов Методические указания для студентов 3 курса бакалавриата направления ”Бизнес-информатика” (профиль ”Бизнес-аналитика”) Ростов-на-Дону 2013 УДК 004.45/338 ББК 32.973.26-018.2/65.23 М 57 Рунова Л.П. Бизнес-прогнозирование с помощью моделей временных рядов. – Ростов-наДону: Изд-во ЮФУ, 2013. – 38 с. ISBN 978-5-699-22086-1 Предмет дисциплины “Методы и модели бизнес-прогнозирования” – самые разные вопросы профессиональной деятельности менеджеров, топ-менеджеров, управленческого персонала крупных, средних и малых предприятий, которые должны предвидеть ход развития бизнес-процесса, циклические колебания экономической конъюнктуры, уметь вырабатывать эффективную стратегию. Без этого принятые решения могут оказываться ошибочными, вложенные инвестиции не окупятся, последствия реализации бизнес-проектов будут противоположны ожидаемым. Методические указания предназначены для студентов бакалавриата направления ”Бизнес-информатика” (профиль ”Бизнес-аналитика”) при изучении дисциплины ”Методы и модели бизнес-прогнозирования”. Эти методические указания могут быть полезны для студентов и других направлений бакалавриата, а также для магистрантов и аспирантов, прогнозирования. Рецензенты: д-р экон. наук, проф. С.В.Крюков, д-р экон. наук, проф. Е.И.Лазарева ISBN 978-5-699-22-086-1 Южный федеральный университет, 2013 2 решающих задачи бизнес- Оглавление 1 Понятие временного ряда. Компоненты временного ряда………………….......…4 2 Сглаживание временных рядов…………………………………………………….11 3 Анализ периодических колебаний во временных рядах………………………...20 4 Сезонность. Аддитивная и мультипликативная модели…………………………...21 5 Понятие о стационарных временных рядах……………………………………….23 6 Понятие белого шума в моделях динамики временных рядов…………………..28 7 Модель случайного блуждания…………………………………………………….32 8 Понятие оператора лагового сдвига……………………………………………….32 9 Оценка и вывод среднего, автокорреляционной и частной автокорреляционной функций………………………………………………………………………………..35 Литература………………………………………………………………………….….38 Бизнес-прогнозирование с помощью моделей временных рядов 1 Понятие временного ряда. Компоненты временного ряда Статистическое описание развития экономических процессов во времени осуществляется с помощью временных рядов. Ряд наблюдений 𝑦(𝑡1 ), 𝑦(𝑡2 ), … , 𝑦(𝑡𝑁 ) (или 𝑦1 , 𝑦2 , … 𝑦𝑁 ), анализируемой случайной величины 𝜉(𝑡), произведенных в последовательные моменты времени 𝑡1 , 𝑡2 , … , 𝑡𝑁 называется временным рядом. Отдельные наблюдения временного ряда называются уровнями этого ряда. Уровни ряда могут принимать детерминированные или случайные значения. Временные ряды делятся на моментные и интервальные. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. В интервальных рядах уровни характеризуют значение показателя за определенные интервалы (периоды) времени. В общем случае модель временного ряда имеет следующий вид: 𝑦𝑡 = 𝑓(𝑡) + 𝜉𝑡 , где 𝑓(𝑡) - систематическая (детерминированная) составляющая ряда; 𝜉(𝑡) - случайная составляющая ряда с нулевым математическим ожиданием 𝑀[𝜉𝑡 ] = 0 и дисперсией 𝐷[𝜉𝑡 ] = 𝜎 2 . Детерминированная составляющая временного ряда различается в зависимости от типа факторов, под влиянием которых она формировалась. В общем случае в практике эконометрических исследований на основе временных рядов различают составляющие трех видов. Долговременная (вековая) составляющая, формирующая общую в длительной перспективе тенденцию в изменении анализируемого признака 𝑦𝑡 . Обычно эта тенденция описывается с помощью той или иной неслучайной функции - 𝑓𝑇𝑃 (𝑡), как правило, монотонной. Эту функцию называют функцией тренда или просто — трендом. 4 Сезонная составляющая – 𝑠(𝑡), формирующаяся под влиянием сезонных колебаний экономического показателя в течение заданного периода времени, обычно года. Циклическая (конъюнктурная) оставляющая – 𝑐(𝑡), формирующая изменения анализируемого признака в связи с действием долговременных циклов экономической, демографической или астрофизической природы (волны Кондратьева, демографические «ямы» и пики, циклы солнечной активности и т.п.). Естественно, что перечислить все факторы, которые прямо или косвенно оказывают влияние на интересующий нас показатель, мы не можем, хотя бы просто потому, что их бесконечно много. Именно с этим связывают возникновение стохастической (случайной) составляющей временного ряда, она является предметом серьезных исследований. Очевидно, что в процессе формирования значений каждого временного ряда не обязательно участвуют одновременно факторы всех четырех типов. Однако во всех случаях предполагается непременное участие случайных (эволюционных) факторов 𝑒𝑡 . В научной литературе их также именуют «белым шумом», в отличие от простых остаточных компонент исследуемого ряда. Если временной ряд представляется в виде суммы соответствующих компонент, то полученная модель носит название аддитивной (1), если в виде произведения - мультипликативной (2) или смешанного типа (3): 𝑌𝑡 = 𝑢𝑡 + 𝑠𝑡 + 𝑣𝑡 + 𝑒𝑡 (1) 𝑌𝑡 = 𝑢𝑡 × 𝑠𝑡 × 𝑣𝑡 × 𝑒𝑡 (2) 𝑌𝑡 = 𝑢𝑡 × 𝑠𝑡 × 𝑣𝑡 + 𝑒𝑡 (3) где 𝑌𝑡 - уровни временного ряда; 𝑢𝑡 -трендовая составляющая; 𝑠𝑡 - сезонная компонента; 𝑣𝑡 - циклическая компонента; 5 𝑒𝑡 - случайная компонента. Рисунок 1 - Месячная динамика производства отдельных видов промышленной продукции в натуральном выражении Рисунок 2 - Месячная динамика производства электроэнергии На рисунках 1 и 2 приведены примеры временных рядов, иллюстрирующие присутствие в них указанных компонент. Графики месячных временных рядов производства промышленной продукции наглядно демонстрируют устойчивые сезонные колебания при снижающемся тренде, причем на последнем участке темпы падения производства заметно снижаются. Решение любой задачи по анализу и прогнозированию временных рядов начинается с построения графика исследуемого показателя, тем более что современные программные средства предоставляют пользователю большие возможности для этого. Не всегда при этом четко прослеживается присутствие тренда во временном ряду. В этих случаях прежде, чем перейти к определению 6 тенденции и выделению тренда, нужно выяснить, существует ли вообще тенденция в исследуемом процессе. Основные подходы к решению этой задачи основаны на статистической проверке гипотез. Критерии выявления компонент ряда основаны на проверке гипотезы о случайности ряда. Рассмотрим наиболее часто используемые на практике критерии проверки "наличия-отсутствия" тренда: критерий серий, основанный на медиане выборки и метод Фостера - Стюарта. Критерий серий, основанный на медиане выборки, реализуется в виде следующей последовательности шагов: а) из исходного ряда 𝑦𝑡 длиной n образуется ранжированный (вариационный) ряд 𝑦𝑡, : 𝑦1, , 𝑦2, , … , 𝑦𝑛, , где 𝑦1, - наименьшее значение ряда 𝑦𝑡 . б) определяется медиана этого вариационного ряда Me.В случае нечетного , , значения 𝑛(𝑛 = 2𝑚 + 1)𝑀𝑒 = 𝑦𝑚+1 ́ , в противном случае 𝑀𝑒 = (𝑦𝑚 + 𝑦𝑚+1 )/2. в) Образуется последовательность 𝛿𝑖 из плюсов и минусов по следующему правилу: +, если 𝑦𝑡 > 𝑀𝑒, 𝑡 = 1,2, … , 𝑛 𝛿𝑖 = { −, если𝑦𝑡 < 𝑀𝑒, 𝑡 = 1,2, … , 𝑛 (4) Если значение 𝑦𝑖 равно медиане, то это значение пропускается. г) подсчитывается v(n) - число серий в совокупности 𝛿𝑖 , где под серией понимается последовательность подряд идущих плюсов или минусов. Один плюс или один минус тоже будет считаться серией. Определяется 𝜎𝑚𝑎𝑥 (𝑛) - протяженность самой длинной серии. д) проверка гипотезы основывается на том, что при условии случайности ряда (при отсутствии систематической составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий - слишком маленьким. Поэтому для того, чтобы не была отвергнута гипотеза о случайности исходного ряда (об отсутствии систематической составляющей) выполняться следующие неравенства (для 5% уровня значимости) 7 должны 𝜏𝑚𝑎𝑥 (𝑛) < [3.3(lg 𝑛 + 1)] { 1 𝑣(𝑛) > [ (𝑛 + 1 − 1,96√𝑛 − 1)] (5) 2 Если хотя бы одно из неравенств нарушается, то гипотеза об отсутствии тренда отвергается. Квадратные скобки в правой части неравенства означают целую часть числа. Напомним, что целая часть числа А – [А] - это целое число, ближайшее к А и не превосходящее его. Другой способ проверки гипотезы о наличии тенденции процесса основывается на методе Фостера-Стюарта. Этот метод может быть реализован в виде следующей последовательности шагов: а) каждый уровень ряда сравнивается со всеми предшествующими, при этом определяются значения вспомогательных характеристик 𝑚𝑖 и 𝑙𝑖 : 1, если 𝑦𝑡 > 𝑦𝑡−1 , 𝑦𝑡−2 , … , 𝑦𝑙 𝑚𝑡 = { 0, в противном случае Таким образом, 𝑚𝑡 =1 , если 𝑦𝑡 больше всех предшествующих уровней, 𝑎 ∗ 𝑙𝑡 = 1, если 𝑦𝑡 меньше всех предшествующих уровней. б) вычисляется 𝑑𝑡 = 𝑚𝑡 − 𝑙𝑡 , для всех 𝑡 = 2 ÷ 𝑛. Очевидно, что величина 𝑑𝑡 может принимать значения 0; 1; -1. в) находится характеристика 𝐷 = ∑𝑛𝑖=2 𝑑𝑖 . г) с помощью критерия Стьюдента проверяется гипотеза о том, что можно считать случайной разность D-0 (т.е. ряд можно считать случайным, не содержащим тренд). Для этого определяется: 𝑡набл = 𝐷 𝜎𝐷 где 𝜎𝐷 - средняя квадратическая ошибка величины D: 1 𝜎𝐷 = √2 ∑𝑛𝑡=2 ≈ √2 ln 𝑛 − 0.8456 𝑡 Значения 𝜎𝐷 затабулированы. 8 Таблица 1 Значения стандартных ошибок для 𝜎𝐷 для n от 10 до 100 n D n D n 10 15 20 25 30 1,964 2,153 2,279 2,373 2,447 35 40 45 50 55 2,509 2,561 2,606 2,645 2,681 60 65 70 75 80 D 2,713 2,742 2,769 2,793 2,816 n D 85 90 95 100 2,837 2,857 2,876 2,894 Расчетное значение 𝑡табл сравнивается с критическим значением, 𝑡кр взятым из таблицы t-распределения Стьюдента для заданного уровня значимости а и числа степеней свободы k=n-1. Если |𝑡табл | > 𝑡кр , то гипотеза об отсутствии тренда отвергается. Пример Изменения курса акций промышленной компании в течение месяца представлены в таблице 2: Таблица 2 Курс акций (дол.) t 1 2 3 4 5 Yt 509 507 508 509 518 t 6 7 8 9 10 Yt 515 520 519 512 511 t 11 12 13 14 15 Yt 517 524 526 519 514 t 16 17 18 19 20 Yt 510 516 518 524 521 Проверить утверждение об отсутствии тенденции в изменении курса акций двумя способами: а) с помощью метода Фостера - Стюарта; б) используя критерий серии, основанный на медиане выборки. Доверительную вероятность принять равной 0,95. Решение а) Вспомогательные вычисления по методу Фостера-Стюарта представлены в таблице 3. 1)Если уровень 𝑌𝑡 больше всех предшествующих уровней, то в графе 𝑚𝑡 ставим 1, если 𝑌𝑡 меньше всех предшествующих уровней, то ставим 1 в графе 𝑙𝑡 ; 9 2) Определяем 𝑑𝑡 = 𝑚𝑡 − 𝑙𝑡 для 𝑡 = 2 ÷ 20; 3) 𝐷 = ∑20 𝑡=2 𝑑𝑡 = 3 4) Значение 𝜎𝐷 для n=20 берем из таблицы 1. 𝜎𝐷 = 2,279. Значение 𝑡кр берем из таблицы t- распределения Стьюдента: t кр (α = 0,05; K = 19) = 2,093; t н = D σD = 1,316. 𝑡н < 𝑡кр , следовательно, нет оснований отвергнуть гипотезу об отсутствии тренда. С вероятностью 0,95 тренд во временном ряду отсутствует. Таблица 3 Вспомогательные вычисления по методу Фостера-Стюарта t yt 1 2 3 4 5 6 7 8 9 10 509 507 508 509 518 515 520 519 512 511 mt et d t t 0 0 0 1 0 1 0 0 0 yt mt et dt - - 11 517 0 1 -1 12 524 1 0 0 13 526 1 0 0 14 519 0 0 1 15 514 0 0 0 16 510 0 0 1 17 516 0 0 0 18 518 0 0 0 19 524 0 0 0 20 571 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 б) Проверим гипотезу об отсутствии тенденции в изменении курса акций с помощью критерия серий, основанного на медиане выборки. Вспомогательные вычисления представлены в таблице 4. 1) От исходного ряда y t переходим к ранжированному 𝑦𝑡, , расположив значения исходного ряда в порядке возрастания; 2) Так как n=20 (четное) => медиана 𝑀𝑒 = 10 , , 𝑦10 +𝑦11 2 516,5; Таблица 4 Вспомогательные вычисления для критерия серии t yt y t 1 2 39 47 58 69 8 5 50 50 507 508 519 519 0 1 50 50 50 50 51 51 3)Значение t + - каждого y t yt t yt y t 7 52 512 + 15 5 519 8 51 514 + 16 5 520 14 5 521 9 0 51 515 - 17 9 10 5 524 10 51 516 - 18 16 5 524 11 2 51 517 + 19 18 5 526 121 52 518 + 20 13 7 52 518 + 24 14 4 51 519 + 21 6 9 уровня исходного ряда 𝑦𝑡 + + + сравнивается со значением медианы. Если 𝑦𝑡 > 𝑀𝑒, то 𝛿𝑖 принимает значение «+», если меньше, то «-»; 4) v(20)=8- число серий; 𝜏𝑚𝑎𝑥 (20) = 4- протяженность самой большой серии. В соответствии с (5) делаем проверку: 𝜏𝑚𝑎𝑥 (20) < [3.3(lg 20 + 1)] { 1 𝑣(20) > [ (20 + 1 − 1,96√20 − 1)] 2 { 4<7 8>6 Оба неравенства выполняются. С вероятностью 0,95 тренд во временном ряду отсутствует, что согласуется с выводом, сделанным с помощью метода ФостераСтюарта. 2. Сглаживание временных рядов Следующим шагом в исследовании свойств ряда динамики является обнаружение характера его тенденций с последующей пролонгацией таковой в будущее, если конечно тенденция существует. При решении такого рода задач исследователь может воспользоваться хорошо разработанным инструментарием сглаживания временных рядов, методы которого условно можно разделить на две группы: 11 - аналитические, при использовании которых заранее предполагается вид зависимости, описывающей тенденцию ряда, с последующей оценкой параметров модели сглаживания; - алгоритмические, которые не предполагают априорных знаний сглаживающей кривой, ориентируясь лишь на алгоритм расчета сглаженных уровней ряда. Суть различных приемов сглаживания сводится к замене фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени. Это способствует более четкому проявлению тенденции развития. Метод скользящих средних Скользящие средние позволяют сгладить как случайные, так и периодические колебания, выявить имеющуюся тенденцию в развитии процесса, и поэтому, являются важным инструментом при фильтрации компонент временного ряда. Алгоритм сглаживания по простой скользящей средней может быть представлен в виде следующей последовательности шагов: 1. Определяют длину интервала сглаживания g, включающего в себя g последовательных уровней ряда (g<n). При этом надо иметь в виду, что чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный, сглаженный характер. Чем сильнее колебания, тем шире должен быть интервал сглаживания. 2. Разбивают весь период наблюдений на участки, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1. 3. Рассчитывают арифметические средние из уровней ряда, образующих каждый участок. 4. Заменяют фактические значения ряда, стоящие в центре каждого участка, на соответствующие средние значения. 12 При этом удобно брать длину интервала сглаживания g в виде нечетного числа: g=2p+l, т.к. в этом случае полученные значения скользящей средней приходятся на средний член интервала. Наблюдения, которые берутся для расчета среднего значения, называются активным участком сглаживания. При нечетном значении g все уровни активного участка могут быть представлены в виде: 𝑦𝑡−𝑝 , 𝑦𝑡−𝑝+1 , … , 𝑦𝑡−1 , 𝑦𝑡 , 𝑦𝑡−1 , … , 𝑦𝑡+𝑝+1 , 𝑦𝑡+𝑝 , а скользящая средняя определена по формуле 6: 𝑡+𝑝 𝑦̂𝑡 = ∑𝑖=𝑡−𝑝 𝑦𝑖 2𝑝+1 = 𝑦𝑡−𝑝 + 𝑦𝑡−𝑝+1 + … +𝑦𝑡+𝑝−1 + 𝑦𝑡+𝑝 2𝑝+1 , (6) где 𝑦𝑖 - фактическое значение i-ro уровня; 𝑦̂𝑡 - значение скользящей средней в момент t; 2𝑝 + 1 - длина интервала сглаживания. Процедура сглаживания приводит к полному устранению периодических колебаний во временном ряду, если длина интервала сглаживания берется равной или кратной циклу, периоду колебаний. Для устранения сезонных колебаний желательно было бы использовать четырех- и двенадцатичленную скользящие средние, но при этом не будет выполняться условие нечетности длины интервала сглаживания. Поэтому при четном числе уровней принято первое и последнее наблюдение на активном участке брать с половинными весами: 1 1 𝑦𝑡−𝑝 + 𝑦𝑡−𝑝+1 + ⋯ +𝑦𝑡−1 + 𝑦𝑡 + 𝑦𝑡+1 + ⋯ + 𝑦𝑡+𝑝+1 + 𝑦𝑡+𝑝 2 𝑦̂𝑡 = 2 2𝑝 = 1 1 𝑡+𝑝−1 𝑦 +∑𝑖=𝑡−𝑝+1 𝑦𝑖 + 𝑦𝑡+𝑝 2 𝑡−𝑝 2 (7) 2𝑝 13 Тогда для сглаживания сезонных колебаний при работе с временными рядами квартальной или месячной динамики можно использовать следующие скользящие средние: 𝑦̂𝑡 = 𝑦̂𝑡 = 1 1 𝑦 +𝑦𝑡−1 +𝑦𝑡 +𝑦𝑡+1 +2𝑦𝑡+2 2 𝑡−2 (8) 4 1 1 𝑦 +𝑦𝑡−5 +⋯+𝑦𝑡 +⋯𝑦𝑡+5 +2𝑦𝑡+6 2 𝑡−6 (9) 12 При использовании скользящей средней с длиной активного участка g=2p+l первые и последние p уровней ряда сгладить нельзя, их значения теряются. Очевидно, что потеря значений последних точек является существенным недостатком, т.к. для исследователя последние "свежие" данные обладают наибольшей информационной ценностью. Рассмотрим один из приемов, позволяющих восстановить потерянные значения временного ряда. Для этого необходимо: 1) Вычислить средний прирост на последнем активном участке 𝑦𝑡−𝑝 , 𝑦𝑡−𝑝+1 , … , 𝑦𝑡−1 , 𝑦𝑡 , 𝑦𝑡−1 , … , 𝑦𝑡+𝑝+1 , 𝑦𝑡+𝑝 ̅̅̅̅ ∆𝑦 = 𝑦𝑡+𝑝 −𝑦𝑡−𝑝 𝑔−1 , где g - длина активного участка; 𝑦𝑡+𝑝 - значение последнего уровня на активном участке; 𝑦𝑡−𝑝 - значение первого уровня на активном участке; ̅̅̅̅- средний абсолютный прирост. ∆𝑦 2) Получить Р сглаженных значений в конце временного ряда путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению. Аналогичную процедуру можно реализовать для оценивания первых уровней временного ряда. Метод простой скользящей средней применим, если графическое изображение динамического ряда напоминает 14 прямую. Когда тренд выравниваемого ряда имеет изгибы, и для исследователя желательно сохранить мелкие волны, применение простой скользящей средней нецелесообразно. Если для процесса характерно нелинейное развитие, то простая скользящая средняя может привести к существенным искажениям. В этих случаях более надежным является использование взвешенной скользящей средней. При сглаживании по взвешенной скользящей средней на каждом участке выравнивание осуществляется по полиномам невысоких порядков. Чаще всего используются полиномы 2-го и 3-его порядка. Так как при простой скользящей средней выравнивание на каждом активном участке производится по прямой (полиному первого порядка), то метод простой скользящей средней может рассматриваться как частный случай метода взвешенной скользящей средней. Простая скользящая средняя учитывает все уровни ряда, входящие в активный участок сглаживания, с равными весами, а взвешенная средняя приписывает каждому уровню вес, зависящий от удаления данного уровня до уровня, стоящего в середине активного участка. Выравнивание с помощью взвешенной скользящей средней осуществляется следующим образом. Для каждого активного участка подбирается полином вида 𝑦̂𝑡 = 𝑎0 + 𝑎1 𝑡 + 𝑎2 𝑡 2 + ⋯ , параметры которого оцениваются по методу наименьших квадратов. При этом начало отсчета переносится в середину активного участка. Например, для длины интервала сглаживания g=5, индексы уровней активного участка будут следующими i : -2, -1, 0, 1, 2. Тогда сглаженным значением для уровня, стоящего в середине активного участка, будет значение параметра a 0 подобранного полинома. Нет необходимости каждый раз заново вычислять весовые коэффициенты при уровнях ряда, входящих в активный участок сглаживания, т.к. они будут одинаковыми для каждого активного участка. Причем при сглаживании по 15 полиному k-ой нечетной степени весовые коэффициенты будут такими же, как при сглаживании по полиному (k-1) степени. Экспоненциальное сглаживание Для экспоненциального сглаживания ряда используется рекуррентная формула 𝑆𝑡 = 𝛼𝑦𝑡 + 𝛽𝑆𝑡−1 , где (10) 𝑆𝑡 – значение экспоненциальной средней в момент t; α – параметр сглаживания, α = const, 0< α <l; β=1 - α. Если последовательно использовать соотношение (10), то экспоненциальную среднюю 𝑆𝑡 можно выразить через предшествующие значения уровней временного ряда. При 𝑛 → ∞ 𝑆𝑡 = 𝛼 ∑𝑛𝑖=0 𝛽 𝑖 𝑦𝑡−𝑖 (11) Таким образом, величина 𝑆𝑡 оказывается взвешенной суммой всех членов ряда. Причем веса отдельных уровней ряда убывают по мере их удаления в прошлое соответственно экспоненциальной функции (в зависимости от "возраста" наблюдений). Именно поэтому величина названа экспоненциальной средней. Предположим, что модель временного ряда имеет вид: 𝑦𝑡 = 𝛼1 + 𝑒𝑡 . Английский математик Р. Браун показал, что математические ожидания ряда и экспоненциальной средней совпадут, но в то же время дисперсия экспоненциальной средней D[𝑆𝑡 ] меньше дисперсии временного ряда (𝜎 2 ) 𝐷[𝑆𝑡 ] = 𝛼 2−𝛼 𝜎 2. (12) Из (12) видно, что при высоком значении дисперсия экспоненциальной средней незначительно отличается от дисперсии ряда. С уменьшением α дисперсия экспоненциальной средней сокращается, возрастает ее отличие от 16 дисперсии ряда. Тем самым, экспоненциальная средняя начинает играть роль «фильтра», поглощающего колебания временного ряда. Таким образом, с одной стороны, следует увеличивать вес более свежих наблюдений, что может быть достигнуто повышением α (согласно(11)), с другой стороны, для сглаживания случайных отклонений величину α нужно уменьшить. Эти два требования находятся в противоречии. Поиск компромиссного значения параметра сглаживания составляет задачу оптимизации модели. Иногда поиск этого значения параметра осуществляется путем перебора. В этом случае в качестве оптимального выбирается то значение α, при котором получена наименьшая дисперсия ошибки. Например, при построении этих моделей с помощью пакета "Мезозавр" в меню предусмотрена ветвь "оптимизация", реализующая поиск значения по этой схеме. При использовании экспоненциальной средней для краткосрочного прогнозирования предполагается, что модель ряда имеет вид: 𝑦𝑡 = 𝑎1,𝑡 + 𝑒𝑡 , где 𝑎1,𝑡 – варьирующий во времени средний уровень ряда, 𝑒𝑡 случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и дисперсией 𝜎 2 . Прогнозная модель определяется равенством: 𝑦̂𝜏 (𝑡) = 𝑎̂1,𝑡 , где 𝑦̂𝜏 (𝑡) – прогноз, сделанный в момент t на τ единиц времени (шагов) вперед; 𝑎̂1,𝑡 – оценка 𝑎1,𝑡 (знак над величиной означает оценку). Единственный параметр модели 𝑎̂1,𝑡 определяется экспоненциальной средней: 𝑎̂1,𝑡 = 𝑆𝑡 𝑎̂1,0 = 𝑆𝑡 Выражение (10) можно представить по-другому, перегруппировав члены: 17 𝑆𝑡 = 𝑆𝑡−1 + 𝛼(𝑦𝑡 − 𝑆𝑡−1 ) (13) Величину (𝑦𝑡 − 𝑆𝑡−1 ) можно рассматривать как погрешность прогноза. Тогда новый прогноз S t получается в результате корректировки предыдущего прогноза с учетом его ошибки. В этом и состоит адаптация модели. Экспоненциальное сглаживание является примером простейшей самообучающейся модели. Вычисления чрезвычайно просты, выполняются итеративно, причем массив прошлой информации уменьшен до единственного значения. Полиномиальные модели Понятие экспоненциальной средней можно обобщить в случае экспоненциальных средних более высоких порядков. Выравнивание p-го порядка: (𝑝) 𝑆𝑡 (𝑝−1) = 𝛼𝑆𝑡 является 𝑝 + 𝛽𝑡−1 простым (14) экспоненциальным сглаживанием, примененным к результатам сглаживания (p-l)-гo порядка. Если предполагается, что тренд некоторого процесса может быть описан полиномом степени n, то коэффициенты предсказывающего полинома могут быть вычислены через экспоненциальные средние соответствующих порядков. В случае, когда исследуемый процесс, состоящий из детерминированной и случайной компоненты, описывается полиномом n-го порядка, прогноз на τ шагов вперед осуществляется по формуле: 1 1 2 𝑛! 𝑦̂𝜏 (𝑡) = 𝑎̂1 + 𝑎̂2 𝜏 + 𝑎̂3 𝜏 2 + ⋯ + 𝑎̂𝑛+1 𝜏 𝑛 , (15) где 𝑎̂1 , 𝑎̂2 , … , 𝑎̂𝑛+1 – оценки параметров. Фундаментальная теорема метода экспоненциального сглаживания и прогнозирования, впервые доказанная Р. Брауном и Р. Майером, говорит о том, что (n+1) неизвестных коэффициентов полинома n-го порядка 𝑎̂1 , 𝑎̂2 , … , 𝑎̂𝑛+1 могут быть (𝑖) оценены с помощью линейных комбинаций экспоненциальных средних 𝑆𝑡 , где 18 𝑖 = 1 ÷ 𝑛 + 1. Следовательно, задача сводится к вычислению экспоненциальных средних, порядок которых изменяется от 1 до (n+1), а затем через их линейные комбинации - к определению коэффициентов полинома. На практике обычно используются полиномы не выше второго порядка. Например, при использовании полинома первого порядка адаптивная модель временного ряда имеет вид: 𝑦𝑡 = 𝑎1,𝑡 + 𝑎2,𝑡 + 𝑒𝑡 , (16) где 𝑎1,𝑡 – значение текущего t-го уровня; 𝑎2,𝑡 – значение текущего прироста. Процедура прогнозирования временных рядов по методу экспоненциального сглаживания сравнительно проста и состоит из следующих этапов: 1. Выбирается вид модели экспоненциального сглаживания, задается значение параметра сглаживания α. При выборе порядка адаптивной полиномиальной модели могут использоваться различные подходы, например, графический анализ, метод изменения разностей и др. 2. Определяются начальные условия. Например, для полиномиальной модели первого порядка необходимо определить 𝑎̂1,0 ; 𝑎̂2,0 . Чаще всего в качестве этих оценок берут коэффициенты соответствующих полиномов, полученные методом наименьших квадратов. Начальные условия для модели нулевого порядка обычно получают усреднением нескольких первых уравнений ряда. Зная эти оценки, с помощью указанных в таблице формул находят начальные значения экспоненциальных средних. 3. Производится расчет значений соответствующих экспоненциальных средних. 4. Находятся оценки коэффициентов модели. 5. Осуществляется прогноз на одну точку вперед, находится отклонение фактического значения временного ряда от прогнозируемого. Шаги с 3 по 5 данной 19 процедуры повторяются для всех 𝑡 ≤ 𝑛, где n – длина ряда. 6. Окончательная прогнозная модель формируется на последнем шаге в момент t=n. Прогноз получается на базе выражения (15) путем подстановки в него последних значений коэффициентов и времени упреждения τ. К положительным особенностям рассмотренных моделей следует отнести то, что при поступлении новой, свежей информации расчеты повторять не придется. Достаточно принять в качестве начальных условий последние значения (𝑖) функций сглаживания 𝑆𝑡 и продолжить вычисления. 3 Анализ периодических колебаний во временных рядах Часто на практике встречаются процессы, носящие периодический характер и связанными с определенной циклической природой тех или иных социальноэкономических явлений. После формального исключения из соответствующих исходных уровней статистического ряда уровней, определяемых общей долгосрочной тенденцией развития (тренда), исследователь в качестве материала своего изучения имеет остаток по ряду наблюдений – вектор 𝑒𝑡 . (𝐷𝑒𝑡 = 𝜎 2 ). Часто даже визуального наблюдения за распределением уровней ряда бывает достаточно, чтобы заметить тенденции в их разбросе, колебания относительно некого среднего уровня. В этой связи может возникнуть мысль о наличии в ряду остатков возможной зависимости от фактора времени t, которая может фактически носить как циклическую, так и сезонную природу. Однако, несмотря на различную природу такого рода явлений, на принципиальную разницу их генезиса, формально мы можем попытаться идентифицировать произвольные колебательные движения социально-экономических процессов с помощью схожего аппарата формализации, в частности, попытаться представить изучаемый ряд (для дальнейшего рассмотрения примем вновь обозначение yt) разложением Фурье. 20 Пусть имеется N наблюдений над переменной Y (для упрощения дальнейших выкладок примем, что N - четное). m – период колебаний, т.е. промежуток времени, через который наша искомая функция в точности повторит свои значения. За исходное примем, что в N укладывается целое число (h) периодов длины m, т.е. h = N/m или N=h*m. Например, если аналитик изучает динамику некоторого явления, описанного показателем Y за три года с помесячной регистрацией статистики, то в наших обозначениях это запишется следующим образом: длина наблюдаемого ряда N=36 месяца; предполагаемая длина периода m=12; целое число периодов наблюдаемой статистики h=3). Заданную числовую последовательность Yt можно попытаться представить в виде: 𝑌𝑡 = 𝑓(𝑡) + 𝜀𝑡 , где 𝜀𝑡 – случайная составляющая изучаемого ряда (𝑀𝜀𝑡 = 0, 𝐷𝜀𝑡 = 𝜎 2 ); 𝑓(𝑡)– некоторая периодическая функция с периодом m. Утверждение. Если числовая последовательность y1, y2, … yN имеет период m, тогда эту последовательность можно представить как сумму m периодических тригонометрических функций, имеющих период m и меньше. Иначе говорят: функция 𝑓(𝑡) разложима в ряд Фурье вида: 𝑓(𝑡) = ∑𝑚−1 𝑖=0 𝛼𝑖 𝜑𝑖 (𝑡) (17) где 𝜑𝑖 (𝑡) – i-я тригонометрическая функция. 4 Сезонность. Аддитивная и мультипликативная модели Многие экономические временные ряды содержат периодические сезонные колебания. Такие ряды могут быть описаны моделями двух типов – моделями с мультипликативными (18) и с аддитивными коэффициентами сезонности (19): 𝑦𝑡 = 𝑎1,𝑡 𝑓𝑡 + 𝑒𝑡 (18) 21 𝑦𝑡 = 𝑎1,𝑡 + 𝑔𝑡 + 𝑒𝑡 , (19) Где 𝑎1,𝑡 – характеристика тенденции развития, 𝑔𝑡 , 𝑔𝑡−1 , … , 𝑔𝑡−𝑒+1 – аддитивные коэффициенты сезонности, 𝑓𝑡 , 𝑓𝑡−1 , … , 𝑓𝑡−𝑒+1 – мультипликативные коэффициенты сезонности, 𝑒𝑡 – количество фаз в полном сезонном цикле (для ежемесячных наблюдений 𝑒𝑡 =12, для квартальных – 𝑒𝑡 =4), 𝑒𝑡 – случайная компонента с нулевым математическим ожиданием. Очевидно, что можно составить множество адаптивных сезонных моделей, перебирая различные комбинации типов тенденций в сочетании с сезонными эффектами аддитивного и мультипликативного вида. Выбор той или иной модели будет продиктован характером динамики исследуемого процесса. В качестве примера рассмотрим модель Уинтерса с линейным характером тенденции и мультипликативным сезонным эффектом. Эта модель является объединением двухпараметрическои модели линейного роста Хольта и сезонной модели Уинтерса, поэтому ее чаще всего называют моделью Хольта-Уинтерса. Прогноз по модели Хольта-Уинтерса на τ шагов вперед определяется выражением: 𝑦̂𝜏 (𝑡) = (𝛼̂1,𝑡 + 𝜏 ∗ 𝛼̂2,𝑡 ) ∗ 𝑓̂𝑡−𝑒+𝜏 (20) Обновление коэффициентов осуществляется следующим образом: 𝑎̂1,𝑡 = 𝛼1 𝑓̂𝑡 = 𝛼2 𝑦𝑡 ̂ 𝑓𝑡−𝑒 𝑦𝑡 𝑎̂1,𝑡 + (1 − 𝛼1 )(𝑎̂1,𝑡−1 + 𝑎̂2,𝑡−1 ) + (1 − 𝛼2 )𝑓̂𝑡−𝑒 (21) 𝑎̂2,𝑡 = 𝛼3 (𝑎̂1,𝑡 − 𝑎̂1,𝑡−1 ) + (1 − 𝛼3 )𝑎̂2,𝑡−1 0 < 𝛼1 , 𝛼2 , 𝛼3 < 1 Из (20) видно, что 𝑎̂1,𝑡 является взвешенной суммой текущей оценки 𝑦𝑡 , 𝑓̂𝑡−𝑒 полученной путем очищения от сезонных колебаний фактических данных 𝑦𝑡 и предыдущей оценки 𝑎̂1,𝑡−1 . В качестве коэффициента сезонности 𝑓𝑡 берется его наиболее поздняя оценка, сделанная для аналогичной фазы цикла (𝑓̂𝑡−𝑒 ). 22 Затем величина 𝑎̂1,𝑡 , полученная по первому уравнению, используется для определения новой оценки коэффициента сезонности по второму уравнению. Оценки 𝑎̂2,𝑡 модифицируются по процедуре, аналогичной экспоненциальному сглаживанию. Оптимальные значения для 𝛼1 , 𝛼2 , 𝛼3 Уинтерс предлагает находить экспериментальным путем, задавая сетку значений этих параметров. Критерием сравнения при этом выступает стандартное отклонение ошибки. Адаптивные сезонные модели являются важной составной частью современных пакетов прикладных программ, ориентированных на решение задач прогнозирования. 5 Понятие о стационарных временных рядах Реализация временного ряда – это выборка типа {…, y-2, y-1, y0, y1, y2, …}. Обычно наблюдения упорядочены во времени – отсюда следует и название: временной ряд, хотя при более тщательном подходе это не всегда так. В теории его реализация начинается в неопределенном прошлом и продолжается до неопределенного будущего, но на практике, очевидно, наблюдаемые данные - это конечное подмножество реализации временного ряда y1, …, yN, которое называют выборочной траекторией. И если бы основная вероятностная структура ряда со временем изменялась, мы были бы обречены – не было бы никакого способа точно предсказать будущее, основываясь на прошлом, потому что законы, действующие в будущем отличались бы от действующих в прошлом. Если мы хотим строить прогнозы значений временного ряда, мы как минимум желаем, чтобы его математическое ожидание и ковариация (то есть ковариация между текущими и прошлыми значениями) были постоянны во времени. В этом случае мы говорим, что рассматриваемый ряд является 23 стационарным в широком смысле. То есть, стационарные в широком смысле временные ряды yt характеризуются тем, что их средние значения Myt, дисперсии Dyt и ковариации ( ) = M[(yt Myt)(yt+ Mxt+)] не зависят от t, для которого они вычисляются. Стохастический процесс называется строго стационарным (strictly stationary) или стационарным в узком смысле, если его свойства не зависят от изменения начала отсчета времени. Иными словами, если совместное распределение вероятностей m наблюдений 𝑦(𝑡)1 , 𝑦(𝑡)2 , … , 𝑦(𝑡)𝑚 , сделанные в любые моменты времени 𝑡1 , 𝑡2 , … , 𝑡𝑚 , такое же, как и для m наблюдений 𝑦(𝑡1 + 𝜏), 𝑦(𝑡2 + 𝜏), … , 𝑦(𝑡𝑚 + 𝜏) сделанных в моменты времени 𝑡1 + 𝜏, 𝑡2 + 𝜏, … , 𝑡𝑚 + 𝜏. Поэтому, чтобы дискретный процесс был строго стационарным, взаимное распределение любой совокупности наблюдений не должно изменяться при сдвиге всех времен наблюдений вперед или назад на любое целое число k. Другими словами, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени. Часто используется понятие слабой стационарности (weak stationary) или стационарности в широком смысле, которое состоит в том, что среднее, дисперсия и ковариация yt не зависят от момента времени t. Рассмотрим свойство стационарности временных рядов подробнее. Первое требование стационарности ряда – это постоянство среднего значения ряда во времени. Среднее значение ряда в момент t записывается как 𝑀𝑦𝑡 = 𝜇𝑡 (22) Если среднее значение не изменяется с течением времени, как того требует условие стационарности, то мы можем записать Myt = μ (23) для любых t. Поскольку среднее не изменяется со временем, нет никакой необходимости помечать его индексом времени. 24 Вторым требованием стационарности ряда является постоянство ковариации во времени. Для отслеживания этого факта используется понятие автоковариационной функции. Автоковариация при сдвиге τ -это ковариация для различных значений одного и того же временного ряда 𝑦𝑡 и 𝑦𝑡−𝜏 . Значение этой функции будет, конечно, зависеть от , но может также зависеть от t, поэтому в общем случае пишут 𝛾(𝑡, 𝜏) = 𝑐𝑜𝑣(𝑦𝑡 , 𝑦𝑡−𝜏 ) = 𝑀(𝑦𝑡 − 𝜇)(𝑦𝑡−𝜏 − 𝜇) (24) Если ковариация не зависит от времени, как того требует условие стационарности, а зависит только от величины сдвига по времени τ, то мы можем записать 𝛾(𝑡, 𝜏) = 𝛾(𝜏), для любого t. Автоковариационная функция важна, потому что она отражает основное понятие циклической динамики в стационарном ряде. Исследуя автоковариационную структуру ряда, мы узнаем о ее поведении в изменяющихся условиях. Это весьма удобно сделать, исследуя график поведения автоковариации как функции от τ. Обратим внимание на то, что автоковариационная функция симметричная; то есть 𝛾(𝜏) = 𝛾(−𝜏) для всех τ. Как правило, мы рассматриваем только неотрицательные значения . Симметрия отражает тот факт, что автоковариация стационарного ряда зависит только от смещения. Не имеет значения, смещаемся мы вперед или назад. Обратите внимание также, что 𝛾(0) = 𝐷(𝑦𝑡, 𝑦𝑡) = 𝐷(𝑦𝑡). Еще одно специальное требование стационарности – требование конечности дисперсии ряда (автоковариация при нулевом смещении 𝛾(0)). Можно показать, что никакая автоковариация не может быть больше по модулю чем 𝛾(0), так если 𝛾(0) < ∞, то также ведут себя и все остальные автоковариации. Может показаться, что требования для стационарности весьма строгие и не предвещают ничего хорошего для наших прогностических моделей, почти все из которых требуют, так или иначе, стационарность. На самом деле, многие экономические, деловые, финансовые ряды и т.д. – не являются стационарными. 25 Тенденция к росту, например, соответствует устойчиво увеличивающемуся среднему значению, а сезонность предполагает изменение среднего значения в зависимости от периода времени года. Оба случая – примеры нарушения стационарности. Но хотя многие ряды не стационарны, часто бывает возможно работать с моделями, которые дают специальную интерпретацию нестационарным компонентам вроде тенденции и сезонности, так, чтобы циклический компонент, вероятно, оставался стационарным. Мы часто принимаем эту стратегию. Для этого с помощью простых преобразований можно привести нестационарные ряды к стационарному виду. Например, многие ряды, которые являются определенно нестационарными в абсолютных единицах (уровнях), выглядят стационарными в относительных (темпах роста). Для этого используются специальные процедуры, именуемые интегрированием динамических рядов. Кроме того, хотя стационарность требует, чтобы средние и ковариации были устойчивыми и конечными, она не накладывает никаких ограничений на другие характеристики распределения ряда, например, асимметрию и эксцесс. По этой причине, такую стационарность часто называют стационарностью второго порядка, или слабой стационарностью. Таким образом, работаем ли мы непосредственно в уровнях и включаем специальные компоненты для нестационарных элементов наших моделей, или мы работаем на преобразованных данных типа темпов роста, предположение о стационарности не столь нереалистично, как это может показаться. Вспомним, что корреляция между двумя случайными переменными x и у (коэффициент парной корреляции) определяется как 𝑐𝑜𝑟𝑟(𝑥, 𝑦) = 𝑟𝑥𝑦 = 𝑐𝑜𝑣(𝑥,𝑦) (25) 𝜎𝑥 ,𝜎𝑦 То есть корреляция переменных x и y – это просто их ковариация, "нормализованная", или "стандартизированная", произведением стандартных 26 отклонений x и y. И корреляция, и ковариация - меры измерения тесноты линейной связи между двумя случайными переменными. Тем не менее, корреляция часто бывает более информативна и легко интерпретируется, потому что конструкция коэффициента корреляции гарантирует, что corr(x, y) [-1,1], в то время как ковариация между теми же самыми двумя случайными переменными может принимать любое значение. Корреляция, кроме того, не зависит от единиц, в которых переменные x и у измерены, тогда как ковариация зависит. Вследствие лучшей интерпретируемости корреляции по сравнению с ковариацией, исследователи часто работают с корреляцией охотнее, чем с ковариацией, между 𝑦𝑡 и 𝑦𝑡−𝜏 . То есть работа с функцией автокорреляции, , предпочтительней, чем с функцией автоковариации, 𝛾(𝜏). Функцию автокорреляции можно получить, разделив автоковариационную функцию на дисперсию 𝜌(𝜏) = 𝛾(𝜏) 𝛾(0) , 𝜏 = 0,1,2, … (26) Формула для автокорреляции - это обычная формула корреляции, только для измерения тесноты взаимосвязи между членами одного и того же временного ряда, т.е. между 𝑦𝑡 и 𝑦𝑡−𝜏 . Это объясняется тем, что дисперсия 𝑦𝑡 равна 𝛾(0), и вследствие стационарности, дисперсия 𝑦𝑡 в любое другое время 𝑦𝑡−𝜏 - также 𝛾(0). Таким образом, 𝜌(𝜏) = 𝑐𝑜𝑣(𝑦𝑡 ,𝑦𝑡−𝜏 ) √𝜎 2 (𝑦𝑡 )√𝜎 2 (𝑦𝑡−𝜏 ) = 𝛾(𝜏) √𝛾(0)√𝛾(0) Следует иметь в виду, что 𝜌(0) = = 𝛾(𝜏) 𝛾(0) 𝛾(0) 𝛾(0) (27) = 1, потому что любой ряд совершенно коррелируется сам с собой. Таким образом, только значения автокорреляции при ненулевых сдвигах информируют нас относительно динамической структуры рядов. Наконец, иногда полезной является частная автокорреляционная функция, 𝜌(𝜏), так как 𝜌(𝜏) - только коэффициент при 𝑦𝑡−𝜏 в совокупности линейной 27 регрессии 𝑦𝑡 на 𝑦𝑡−1 .,…, 𝑦𝑡−𝜏 . Такие регрессии именуют авто- регрессиями, потому что переменная регрессирована на своих же лаговых значениях. Легко видеть, что автокорреляция и частная автокорреляция, хотя и связаны, но отличаются важным образом. Автокорреляции - только "простые" или "регулярные" корреляции между 𝑦𝑡 и 𝑦𝑡−𝜏 . Частные автокорреляции, с другой стороны, измеряют тесноту взаимосвязи между 𝑦𝑡 и 𝑦𝑡−𝜏 при устранении влияния промежуточных членов 𝑦𝑡−1 ,…, 𝑦𝑡−𝜏+1 этого ряда; то есть они измеряют “очищенную” корреляцию между 𝑦𝑡 и 𝑦𝑡−𝜏 . Можно показать, что любой стационарный ряд должен иметь автокорреляционную и частную автокорреляционную функции, которые каким либо образом приближаются к 0 при увеличивающемся смещении. 6 Понятие белого шума в моделях динамики временных рядов Перед тем, как оценить параметры прогностической модели временного ряда, необходимо изучить ее совокупные свойства, предполагая, что выбранная модель значима. Простейшим из такого рода процессов временного ряда является основным стандартным блоком, из которого можно получить все остальные процессы. Записать его можно следующим образом 𝑦𝑡 = t, где t (0, 2) и t некоррелирован во времени. В данной ситуации говорят, что t, и следовательно, 𝑦𝑡 , последовательно (серийно) некоррелированы (т.е. отсутствует корреляция внутри ряда). Во всех ситуациях, если не установлено другое, мы будем полагать, что 2 < . Такой процесс, с нулевым математическим ожиданием, постоянной конечной дисперсией и отсутствием корреляции внутри ряда, называется белым шумом с нулевым средним, или просто белым шумом (white noise). Иногда для краткости пишут t WN (0, 2) и следовательно 𝑦𝑡 WN (0, 2). Следует обратить внимание, что t и аналогично 𝑦𝑡 , последовательно некоррелированны, но они необязательно последовательно независимы, потому 28 что они необязательно распределены нормально. Если в добавлении к последовательной некоррелированности 𝑦𝑡 является и серийно независимым, тогда мы можем сказать, что 𝑦𝑡 – это независимый белый шум. Таким образом, записывается iid yt ~ (0, 2 ) (28) и говорится, что “значения 𝑦𝑡 независимо и одинаково распределены с нулевым математическим ожиданием постоянной дисперсией”. Если в ряду 𝑦𝑡 отсутствует корреляция и ряд распределен нормально, то из этого следует, что ряд уt также независимо распределен. Тогда мы говорим, что уt – это нормальный iid 2 белый шум, или белый шум Гаусса: yt ~ N (0, ) . Мы читаем “ уt – это независимо, одинаково нормально распределенный ряд с нулевым средним и постоянной дисперсией” или просто “Гауссовский белый шум”. Возмущения в регрессионной модели рассматриваются как белый шум в том или ином роде. Тем не менее, имеется одно важное различие. Возмущения в регрессионной модели не поддаются наблюдению, тогда как временные ряды наблюдаемы. Позже, тем не менее, мы увидим, как все наши модели для наблюдаемых рядов могут быть применены для не поддающихся наблюдению переменных, таких как регрессионные возмущения. Охарактеризуем динамическую стохастическую структуру белого шума уt WN (0, 2). По построению, безусловное математическое ожидание уt будет M(уt) = 0, а безусловная дисперсия D (уt) = 2. Чтобы полностью понять линейную динамическую структуру стационарного процесса временного ряда, нам требуется рассчитать и проверить его среднее значение и автоковариационную функцию. Так как белый шум, по определению, не коррелирован во времени, все автоковариации и, следовательно, все автокорреляции, равны нулю, за исключением значения, зависящего от 29 нулевого сдвига. Формально автоковариационная функция для процесса белого шума записывается так 𝜎2, 𝜏 = 0 𝛾(𝜏) = { 0, 𝜏 ≥ 1 (29) Автокорреляционная функция для этого процесса запишется следующим образом 𝜌(𝜏) = { 1, 𝜏 = 0 0, 𝜏 ≥ 1 (30) Рассмотрим частную автокорреляционную функцию (ЧАКФ) для рядов содержащих белый шум. Так как АКФ при сдвиге равном 0 всегда равна 1, ЧАКФ при нулевом смещении принимает то же значение. Для белого шума, все значения ЧАКФ при больших, чем нуль, сдвигах равны нулю. Это следует опять-таки из того, что белый шум, по построению, серийно не коррелирован. Совокупные регрессии yt на yt-1, или на yt-1 и yt-2, или на другие лаги, приводит к нулевым коэффициентам, потому что процесс серийно не коррелирован. Формально, ЧАКФ процесса белого шума записывается так 𝜌(𝜏) = { 1, 𝜏 = 0 0, 𝜏 ≥ 1 (31) Это снова вырожденная функция и выглядит так же как АКФ. Из определения процесса типа «белый шум» ясно, что попытки спрогнозировать независимый белый шум, обречены на провал. Так как мы не можем сказать, что происходит с рядом, содержащим белый шум в любое время, не связанное с прошлым, и аналогично, что происходит в будущем, не связанным с настоящим или прошлым. Но понимание белого шума чрезвычайно важно как минимум по двум причинам. Во-первых, процессы с более ощутимой динамикой получаются простой трансформацией белого шума. Во-вторых, ошибки прогноза на один период вперед должны быть белым шумом. Так как, если эти ошибки не являются белым шумом, то они коррелированны, что означает, что прогностическая модель построена некорректно, а если это имеет место, то 30 прогноз не может быть хорошим. Поэтому важно понимание и распознавание этого явления. Таким образом, мы охарактеризовали белый шум через его среднее значение, дисперсию, АКФ и ЧАКФ. Другая характеристика динамики с важными выводами для прогнозирования, включает среднее и дисперсию процесса, обусловленные прошлой истории этого процесса. В частности, мы часто можем понять сущность динамики процесса, анализируя его условное математическое ожидание, которое является ключевым объектом для прогнозирования. Для сравнения безусловных и условных математических ожиданий и дисперсий, чтобы облегчить нашу попытку, рассмотрим пример независимого белого шума, iid yt ~ (0, 2 ) с теми же аргументами: безусловным средним 0 и безусловной дисперсией 2. Рассмотрим теперь условные среднее и дисперсию, где исходными ретроспективными данными является информационное множество t-1, которое по существу содержит или прошлую историю наблюдаемого ряда, т.е. t-1 = {…yt1, yt-2,…}, или прошлую историю возмущений ряда, т.е. t-1 = { t-1, t-2,… }. В сравнении с безусловными средним и дисперсией, которые должны быть постоянными, согласно требованиям стационарности, условные среднее и дисперсия необязательно постоянные, и в общем случае мы должны считать их непостоянными. Для независимого белого шума условное среднее имеет вид М(yt | t-1) = 0, (32) а условная дисперсия выглядит как D(yt | t-1) = М[(yt – М(yt | t-1))2 | t-1] = 2. (33) Условные и безусловные дисперсии и средние идентичны для рядов, содержащих белый шум. Рассматриваемый процесс не содержит динамики и, следовательно, нет динамики в условных моделировать. 31 моментах, которую можно 7 Модель случайного блуждания Важным примером стационарного временного ряда является процесс 𝑦𝑡 = 𝑦𝑡−1 + 𝑒𝑡 , 𝑒𝑡 → 𝑖𝑖𝑑(0, 𝜎 2 ), 𝑡 = 1, … , 𝑛 (34) называемый случайным блужданием (random walk). Учитывая, что ошибка t некоррелирована с yt-1, можно получить: М(yt ) = М(yt-1) +0; D(yt ) = D(yt-1) + 2. (35) Отсюда ясно, что случайное блуждание нестационарно, так как D(yt ) ≠ D(yt−1 ) (36) Если положить, что процесс начинается с момента t=1 и М(y1) =, D(y1) = 2, то М(yt) =, D(yt) = 2t, при t=1,2,…, т.е. дисперсия неограниченно возрастает во времени. 8 Понятие оператора лагового сдвига Оператор сдвига и связанные с ним структурные компоненты – это язык, на котором описываются прогностические модели. Оператор сдвига, обозначим его символом L, оперирует рядом, вводя в него запаздывания (лаги), так что 𝐿𝑦𝑡 = 𝑦𝑡−1 . (37) Аналогично, 𝐿2 𝑦𝑡 = 𝐿(𝐿(𝑦𝑡 )) = 𝐿(𝑦𝑡−1 ) = 𝑦𝑡−2 (38) и так далее. Однако в общем случае будем говорить, что речь идет об использовании полиномов от оператора сдвига. Полином от оператора сдвига степени m - это линейная функция различных степеней L до m-й степени 32 𝐵 (𝐿) = 𝑏0 + 𝑏1 𝐿 + 𝑏2 𝐿2 + … + 𝑏𝑚 𝐿𝑚 . (39) Пример полинома от оператора сдвига m-й степени, оперирующего с рядами, например, 𝐿𝑚 𝑦𝑡 = 𝑦𝑡 – 𝑚 . Хорошо известный оператор разности первого порядка - это в действительности полином первой степени от оператора сдвига: ∆𝑦𝑖 = (1 – 𝐿)𝑦𝑡 = 𝑦𝑡 – 𝑦𝑡 – 1 . Например, если необходимо рассмотреть полином второй степени от оператора сдвига вида (1 + 0.78L + 0.65L2), оперирующего с рядом yt. Эквивалентно это условие можно записать как равенство (1 + 0.78𝐿 + 0.65𝐿2 ) 𝑦𝑡 = 𝑦𝑡 + 0.78 𝑦𝑡−1 + 0.656 𝑦𝑡−2 , которое представляет собой взвешенную сумму, или распределенный лаг, настоящих и прошлых значений ряда yt. Все ранее рассмотренное относится к полиномам конечной степени. Полином бесконечного порядка можно записать так 𝑖 𝐵(𝐿) = 𝑏0 + 𝑏1 𝐿 + 𝑏2 𝐿2 + ⋯ = ∑∞ 𝑖=0 𝑏𝑖 𝐿 (40) Таким образом, например, для представления распределенного лага текущих и прошлых возмущений бесконечного порядка, можно записать 𝐵(𝐿)𝑒𝑡 = 𝑏0 𝑒𝑡 + 𝑏1 𝑒𝑡−1 + 𝑏2 𝑒𝑡−2 + ⋯ = ∑∞ 𝑖=0 𝑏𝑖 𝑒𝑡−𝑖 (41) Модели, содержащие бесконечное количество распределенных лагов, занимают центральное место в моделировании и прогнозировании временных рядов. Это находит выражение в так называемой теореме Уолда. Многие модели временных рядов не противоречат условиям стационарности. Так что, если мы знаем, что ряд стационарен, это ещё не дает четкого ответа на вопрос, какой вид модели мы можем применить для описания динамики ряда. Тренд и сезонные модели, которые мы уже изучили, здесь неприменимы, так они описывают специфические нестационарные компоненты. 33 Исследователю необходима подходящая модель для имитации стационарных остатков динамического ряда. Теорема о представлении Уолда указывает на соответствующий вид модели. Теорема. Пусть {yt} будет любым стационарным процессом с нулевым средним, не содержащим никаких детерминированных компонент. Тогда этот процесс можно записать как ∞ 2 2 𝑦𝑡 = 𝐵(𝐿)𝑒𝑡 = ∑∞ 𝑖=0 𝑏𝑖 𝑒𝑡−𝑖 , где 𝑒𝑡 ~𝑊𝑁(0, 𝜎 ), при 𝑏0 = 1 и ∑𝑖=0 𝑏𝑖 < ∞ (42) Иначе говоря, моделью для любого стационарного ряда является бесконечно распределенный лаг белого шума, называемый представлением Уолда. Такое представление ряда называется - общим линейным процессом. Общим, потому что любой стационарный ряд может быть записан в такой форме, а линейный, потому что представление Уолда изображает ряд в виде линейной комбинации его инноваций (т.е. его предшествующих значений). Ввиду особой важности для прогнозирования общего линейного процесса рассмотрим его условные и безусловные моменты. Зная средние и дисперсии по ряду, мы легко можем получить его безусловные моменты, т.е. математическое ожидание ряда ∞ ∞ 𝑀(𝑦𝑡 ) = 𝑀(∑∞ 𝑖=0 𝑏𝑖 𝜀𝑡−𝑖 ) = ∑𝑖=0 𝑏𝑖 𝑀(𝜀𝑡−𝑖 ) = ∑𝑖=0 𝑏𝑖 ∗ 0 = 0 (43) и дисперсию ряда ∞ 2 ∞ 2 2 2 2 ∞ 𝐷(𝑦𝑡 ) = 𝐷(∑∞ 𝑖=0 𝑏𝑖 𝜀𝑡−𝑖 ) = ∑𝑖=0 𝑏𝑖 𝐷(𝜀𝑡−𝑖 ) = ∑𝑖=0 𝑏𝑖 𝜎 = 𝜎 ∑𝑖=0 𝑏𝑖 (44) Условное математическое ожидание ряда определяется как М(yt | t-1) = М(t | t-1) +b1М(t-1 | t-1) + b2М(t-2 | t-1) +….= = 0 + b1t-1 + b2t-2 +…= b i 0 (45) i t i и условная дисперсия ряда D(yt | t-1) = М[ (yt – М(yt | t-1))2 | t-1] = М(t 2| t-1) = М(t 2) = 2 (46) 34 Существенным является то, что условное среднее смещается во времени в ответ на изменение информационного пространства. Модель фиксирует изменения процесса, и изменяющееся среднее – это один из способов интегрировать эти изменения. Важная цель при моделировании временных рядов, особенно для прогнозистов, - это уловить динамику условного среднего (т.к. безусловное среднее постоянно, это один из признаков стационарности ряда), а условное среднее изменяется в ответ на эволюцию исходного информационного пространства. 9 Оценка и вывод среднего, автокорреляционной и частной автокорреляционной функций Предположим, что у нас есть выборка данных временного ряда, и мы не знаем вида модели, которая генерирует эти данные, т.е. среднее, АКФ, или ЧАКФ, связанные с истинной моделью. Вместо этого, мы хотим использовать данные, чтобы оценить среднее, АКФ и ЧАКФ, которые мы можем потом использовать, чтобы помочь нам изучить лежащую в основе динамику, а потом решить, какая модель или набор моделей нам подходят. Оценка выборочного среднего Среднее стационарного ряда определяется как = М𝑦𝑡 . Основной принцип оценивания, который называется принципом аналогии, предполагает, что мы улучшаем формулу оценки (оценочную функцию) путем замещения математического ожидания выборочными средними. Так что наша оценка среднего совокупности, представленной как выборка размерностью Т, называется выборочным средним 1 𝑦̅ = ∑𝑇𝑡=1 𝑦𝑡 (47) 𝑇 35 Обычно нас прямо не интересует оценка среднего, но она нужна для оценки автокорреляционной функции. Оценка выборочной автокорреляции Значение автокорреляции при сдвиге уровней ряда на величину для стационарных рядов уt равно 𝜌(𝜎) = 𝑀[(𝑦𝑡 −𝜇)(𝑦𝑡−𝜎 −𝜇)] (48) 𝑀[(𝑦𝑡 −𝜇)2 ] Применяя принцип аналогии, получим в результате оценочную формулу T 1 T [( y y )( y y )] t [( yt y )( yt y )] t T t 1 t 1 ˆ ( ) T 1 T 2 ( y y ) ( yt y ) 2 t T t 1 t 1 (49) Эта формула, которая выглядит как функция от , называется выборочной автокорреляционной функцией, а ее графическое представление коррелограммой. Заметим, что некоторые суммы начинаются с t= + 1, а не с t= 1; это необходимо из-за наличия в формуле yt-. Обратим внимание на то, что производится деление одних и тех же суммы на Т, хотя в сумме только (Т- ) членов, т.е. происходит некоторое искажение числа степеней свободы. Деление на Т или на (Т- ) дает почти одинаковый результат в виду более чем существенной разницей между Т и , поэтому для практических целей это не имеет большого значения; кроме того, есть хорошие математические причины для предпочтения деления на Т. Часто требуется оценить, является ли исследуемый ряд возможной аппроксимацией к белому шуму, тогда можно сказать, равны ли нулю автокорреляции в совокупности. Лучшим результатом будет ряд белого шума. Тогда распределение выборочных автокорреляций в больших выборках будет 1 𝜌̂(𝜎)~𝑁(0, 𝑇) (50) 36 Выборочные автокорреляции ряда, содержащего белый шум, распределены приблизительно нормально, а нормальное распределение всегда “удобное” распределение. Среднее значение равно 0, и это говорит о том, что выборочные автокорреляции являются несмещенными оценками автокорреляции генеральной совокупности, которая на самом деле равна 0. Дисперсия выборочных автокорреляций приблизительно равна 1 𝑇 (стандартное отклонение 1 √𝑇 ). Выясним, является ли ряд белым шумом, то есть, равны ли все автокорреляции 0 одновременно. Простое расширение позволяет нам проверить эту гипотезу. 37 ЛИТЕРАТУРА 1. Арженовский С.В., Молчанов И.Н. Статистические методы прогнозирования. Учебное пособие /Рост. гос. экон. унив. - Ростов-н/Д. - 2001. 74 с. 2. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. - Москва: "Финансы и статистика", 2001. -228 с. 3. Большаков А.А., Каримов Р.Н. Методы обработки многомерных данных и временных рядов Учебное пособие для вузов. -М.: Горячая линия-Телеком, 2007. --522 с. 4. Дуброва Т.А. Статистические методы прогнозирования в экономике . -М.: МЭСИ, 2001. - 50 с. 5. Керимов А.К. Анализ и прогнозирование временных рядов. Учеб. пособие. - М.: Изд-во РУДН, 2005. - 138 с. 6. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. Учеб. пособие. -М.: Финансы и статистика, 2003 г. - 416 с. 7. Орлов А.И. Статистические методы прогнозирования. - В кн.: Малая российская энциклопедия прогностики. - М.: Институт экономических стратегий, 2007. - С.148-153. 8. Рунова Л.П., Рунов И.Л. Анализ временных рядов и прогнозирование. Учебно-методические экономического материалы по прогнозирования” дисциплине для “Методы студентов социально- специальности “Математические методы в экономике”. -Ростов-на-Дону, РГУ, 2006. –109с. 9. Татаренко С.И. Методы и модели анализа временных рядов: методические указания к лабораторным работам. -Тамбов: Изд-во Тамб. гос. техн. ун-та, 2008. – 32 с. 10. http://www.twirpx.com/file/134776/ 38