ЛЕКЦИЯ 4. ТЕМА: ВРЕМЕННЫЕ РЯДЫ Понятие ряда динамики Всякий ряд динамики (временной ряд) содержит: 1) показания времени (моменты или периоды); 2) соответствующие им значения количественного признака Y, которые принято называть уровнями развития или уровнями ряда. t 0 1 … n yt y0 y1 … yn 2 Составляющие ряда динамики Ряд динамики может содержать следующие составляющие (компоненты): 1) основную тенденцию развития (тренд); 2) циклические (в том числе и сезонные) колебания; 3) случайные колебания. Товарооборот магазина может: 1) расти от года к году; 2) увеличиваться в зимний сезон и снижаться в летний; 3) подвергаться колебаниям за счёт случайных факторов (пожар, появление нового товара и т.д.) Y t 3 Аддитивная и мультипликативная модели временного ряда Фактический уровень временного ряда обычно можно представить как сумму трендовой, циклической (сезонной) и случайной компонент: Y T+ S+E В этом случае говорят, что ряд представлен аддитивной моделью. Если же используется произведение компонент, то говорят о мультипликативной модели: Y T S E !!! Выбор одной из этих двух моделей осуществляется на основе анализа структуры циклических колебаний. Если амплитуда колебаний приблизительно постоянна, то строят аддитивную модель. Если амплитуда колебаний возрастает или убывает, то строят мультипликативную модель. 4 Общий вид временного ряда при наличии тренда Наличие тренда предполагает, что уровни ряда динамики можно представить в виде y t f (t ) t либо в виде yt f (t ) t где t – показания времени (далее для простоты будем полагать, что t 0, 1, 2, ..., n); f (t ) – функция, определяющая основную тенденцию развития; t – случайное и циклическое отклонение от тенденции. Записанные выше формулы отвечают аддитивной и мультипликативной модели соответственно. 5 Наиболее часто используемые вида тренда Подбор функции f (t ) можно свести к задаче оценивания регрессии, если выбрать подходящую форму тренда и применить метод наименьших квадратов. Такой подход называется аналитическим выравниванием. Чаще всего при выравнивании используются следующие виды тренда: • линейный f (t ) at b ; a f ( t ) bt • степенной ; at f ( t ) be • экспоненциальный . 6 Привлечение показателей статистики для выбора вида тренда Из общей теории статистики известны следующие показатели ряда динамики: ц t yt yt 1 • – абсолютный цепной прирост; • K tц yt yt 1 – цепной коэффициент роста. Пусть ряд динамики в качестве показаний времени имеет равноотстоящие моменты (или одинаковые периоды) . Какими свойствами должны обладать показатели динамики этого ряда, чтобы он идеально соответствовал: (а) линейному, (б) экспоненциальному видам тренда? 7 Линейный тренд Если абсолютные цепные приросты ряда цt yt yt 1 примерно постоянны, то тренд следует искать в виде линейной зависимости: f (t ) at b В идеальном случае уровни временного ряда являются членами арифметической прогрессии. Абсолютные цепные приросты постоянны - линейная зависимость yt 35 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 Моменты или периоды времени 8 Показательный (экспоненциальный) тренд Если цепные коэффициенты роста K tц yt yt 1 примерно постоянны, то тренд следует искать в виде показательной зависимости: f (t ) be at В идеальном случае уровни временного ряда являются членами геометрической прогрессии. Цепные коэффициенты роста постоянны - показательная зависимость (экспонента) yt 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 7 8 9 10 Моменты или периоды времени 9 Как линеаризовать модель с экспоненциальным трендом? Пусть истинное соотношение между Y и t близко к функции Y be at Требуется линеаризовать регрессионную модель y t be t at !!! Случайный член ε в регрессионной модели присутствует не как слагаемое, а как множитель (это соответствует мультипликативному соотношению). Логарифмирование даёт линейную модель регрессии: ln yt at ln b ln t at c t После оценивания коэффициентов линейной регрессии возвращаемся к экспоненциальной модели: c* a *t yt e e 10 Автокорреляция уровней ряда динамики Пример. Динамика курса доллара (к рублю) Столбцы таблицы сдвинуты друг относительно друга. Этот временной сдвиг называется лагом. t yt yt 1 yt 2 yt 3 1 кв. 1999 1 22.89 − 2 24.92 − − − 2 кв. 1999 − 22.89 − − 3 кв. 1999 3 24.88 24.92 22.89 − 4 кв. 1999 1 кв. 2000 2 кв. 2000 3 кв. 2000 4 кв. 2000 1 кв. 2001 2 кв. 2001 3 кв. 2001 4 кв. 2001 1 кв. 2002 2 кв. 2002 3 кв. 2002 4 кв. 2002 4 5 6 7 8 9 10 11 12 13 14 15 16 26.31 28.77 28.30 27.69 27.70 28.67 28.99 29.33 29.72 30.83 31.25 31.54 31.82 24.88 26.31 28.77 28.30 27.69 27.70 28.67 28.99 29.33 29.72 30.83 31.25 31.54 24.92 24.88 26.31 28.77 28.30 27.69 27.70 28.67 28.99 29.33 29.72 30.83 31.23 − 22.89 24.92 24.88 26.31 28.77 28.30 27.69 27.70 28.67 28.99 29.33 29.72 30.83 Момент yt 4 − 22.89 24.92 24.88 26.31 28.77 28.30 27.69 27.70 28.67 28.99 29.33 29.72 Автокорреляционная функция Для обнаружения и тренда (тенденции), и циклических колебаний используется автокорреляционная функция временного ряда. Это последовательный набор коэффициентов автокорреляции r ryt yt yt yt yt yt t t вычисленных с различным временным лагом . Если наиболее высоким оказался коэффициент с лагом 1, то имеется только линейная тенденция. Если наиболее высоким оказался коэффициент с лагом , то во временном ряде содержится циклическая составляющая с периодом . 12 Продолжение примера о динамике курса доллара Рассчитаем коэффициенты автокорреляции. !!! Считается, что временной лаг в автокорреляционной функции не должен превышать n/4, где n – общая длина временного ряда. Поэтому имеет смысл вычислить 4 первых коэффициента автокорреляции. Значение r1 0.9395 , достаточно близкое к единице, говорит о сильной зависимости между обменными курсами доллара текущего и непосредственно предшествующего кварталов и о наличии линейного тренда. Значения r 0.8676, r 0.8114 , r4 0.7241 2 3 оказываются меньше, чем значение r . Поэтому можно сделать вывод об отсутствии цикличности. 1 Таким образом, выявлена линейная тенденция и не выявлено цикличности. Окончание примера о динамике курса доллара Таким образом, выявлена линейная тенденция и не выявлено цикличности. Линейный тренд описывается уравнением регрессии yt 0.511 t 24.01 ( 0.85) ( 0.046 ) 32 31 30 29 28 27 26 25 24 23 22 Курс доллара (рублей за 1 доллар) y = 0,5108x + 24,008 R2 = 0,897 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 кв кв кв кв кв кв кв кв кв кв кв кв кв кв кв кв 99 99 99 99 00 00 00 00 01 01 01 01 02 02 02 02 ( 0.45) Рис. 1. Поквартальная динамика курса доллара в 1999-2002 годах 14 Моделирование циклических колебаний 15 Пример В течение 4 лет изучалась динамика потребления электроэнергии на промышленном предприятии в зимний и летний периоды времени. В табл. представлены среднесуточные объёмы потребления электроэнергии за каждый сезон ( y t , тыс. кВт час / сутки). Выявить и смоделировать линейную тенденцию и циклическую составляющую временного ряда. • Введём фиктивную переменную: 1 для зимы, x 0 для лета. Год Сезон 2000 зима t x yt 1 1 62 2000 лето 2 0 60 2001 зима 3 1 68 2001 лето 4 0 65 2002 зима 5 1 75 2002 лето 6 0 76 2003 зима 7 1 84 2003 лето 8 0 82 16 Решение (начало) Можно получить следующие значения коэффициентов автокорреляции: r1 0.796; r2 0.956 Это указывает на наличие заметной линейной тенденции и чётко выраженной сезонной цикличности. На рис. 2 зимние сезоны имеют нечётные, а летние сезоны – чётные номера. Действительно, можно видеть, что от года к году происходит рост значений количественного признака, однако на эту тенденцию накладываются колебания с лагом 2, т.е. с периодом в 1 год. В летние сезоны потребление электроэнергии снижается, или, по крайней мере, замедляет рост. Таким образом, ряд динамики имеет «пилообразную» структуру. Y, тыс. квт ч / сутки 90 80 70 60 Номер сезона 50 1 2 3 4 5 6 7 8 Рис. 2. Динамика потребления электроэнергии 17 Решение (окончание) Регрессионная модель будет иметь вид y t a 0 t a1 x b t Оценив параметры регрессии обычным методом наименьших квадратов, получим y t , x 3.75t 5.25 x 52 Полученное уравнение регрессии показывает, что за год (т.е. за 2 сезона) среднесуточный объём потребления электроэнергии в среднем возрастает на 7.5 тыс. кВт час. При этом зимнее среднесуточное потребление в среднем на 5.25 тыс. кВт час больше летнего (если исключить линейную тенденцию роста потребления со временем). 18