УДК 338.27 2014 Семёнычев В.К., Коробецкая А.А. ИДЕНТИФИКАЦИЯ МУЛЬТИТРЕНДОВОЙ ЭВОЛЮЦИОНИРУЮЩЕЙ МОДЕЛИ С МУЛЬТИПЛИКАТИВНОЙ ЛИНЕЙНО-ЭКСПОНЕНЦИАЛЬНОЙ СТРУКТУРОЙ В статье рассмотрены различные варианты мультрендовой структуры модели, предложена модель жизненного цикла на основе мультипликативного взаимодействия линейного и экспоненциального тренда. Охарактеризована область применения модели. Предложены методы идентификации модели и проведено исследование их точности, выбран наилучший метод идентификации, обеспечивающий точность модели по R2 свыше 0,75, а ошибку прогноза по kT2 менее 20% при уровне шума Kn/s 0-30%. Ключевые слова: мультитрендовая модель, эволюция, жизненный цикл, идентификация, алгоритм RPROP, метод «имитации отжига». Одной из широко распространенных задач эконометрического моделирования является идентификация параметров тренда Tt , различной степени сложности, как с линейным, так и с нелинейным вхождением параметров. Число применяемых моделей тренда велико и исчисляется десятками. Менее распространенными являются мультитрендовые [1] структуры рядов динамики, включающие в себя несколько взаимосвязанных или независимых трендов. Наиболее простым вариантом является алгебраическое взаимодействие двух трендов, например, аддитивное, мультипликативное или пропорционально-мультипликативное: Tt Tt I Tt II , (1) I II Tt Tt Tt , (2) Tt Tt I (1 Tt II ) . (3) Такие структуры позволяют описывать сложную эволюционирующую динамику, когда-либо один тренд постепенно сменяется другим, либо формируется новая динамика, существенно отличающаяся от динамики исходных трендов Tt I и Tt II . Взаимодействие вида (1) и (3) в большей степени соответствует первому случаю эволюционирующей динамики, если модели трендов Tt I и Tt II имеют асимптотические уровни. Примеры такой динамики представлены на рисунке 1. График (а) соответствует сумме экспоненциальных трендов, график (б) – сумме импульсных дробно-рациональных трендов, а график (в) – пропорциональному взаимодействию обобщенной экспоненциальной и импульсной модели. В каждом случае можно отчетливо визуально выделить на графике участки, на которых доминирует одна из составляющих тренда. Эволюция проявляется в виде постепенного перехода от одной доминирующей модели тренда к другой. Yt Yt Tt Tt I Tt II Yt Tt Tt I Tt II Tt Tt I (1 Tt II ) 0 (а) 0 t (б) t 0 (в) t Рис. 1. Примеры взаимодействия трендов вида (1) и (3) со сменой доминирующего тренда Второй случай чаще может быть представлен структурой (2). При этом в итоговом графике сложно или невозможно выделить участки, соответствующие исходным моделям. Тем не менее, полученная динамика также может быть эволюционирующей, с выделением участков эволюции за счет точек экстремума, перегиба и асимптотических уровней. На рисунке 2 (а) представлено взаимодействие линейного и симметричного импульсного тренда, в результате формируется асимметричная импульсная модель. На рисунке 2 (б) отображается взаимодействие степенного и экспоненциального трендов. Yt 0 Yt Tt Tt I Tt II (а) t 0 Tt Tt I Tt II (б) t Рис. 2. Примеры взаимодействия трендов вида (1) и (2) без смены доминирующего тренда В данной статье в качестве примера мультипликативного взаимодействия трендов (2) рассматривается модель в виде произведения линейного тренда на экспоненциальный: Tt Tt I Tt II ( A0 A1t )e t . (4) До настоящего времени данная модель не была исследована на предмет особенностей динамики, методов ее идентификации и областей возможного применения. Возможные формы динамики модели (4) в зависимости от сочетания знаков параметров представлены на рисунке 3. При отрицательных значениях A0 форма динамики будет аналогичной, но точка пересечения с осью ординат будет находиться в области отрицательных значений. Yt Yt t A0 A0>0 A1>0 α>0 A0>0 A1<0 α>0 t Yt Yt t A0>0 A1>0 α<0 t A0>0 A1<0 α<0 Рис. 3. Форма динамики модели (4) при различных знаках параметров A0, A1, α Наибольший практический интерес представляет форма динамики при A0>0, A1>0, α>0, соответствующая жизненному циклу продукта (ЖЦП). Под продуктом в данном случае понимается некий товар, услуга или выпускающий их субъект экономики в целом. Показателем ЖЦП может являться объем продаж в денежных или натуральных единицах, доля рынка, валовая выручка и др. На рисунке 4 представлено влияние значений параметров на форму кривой. Стрелками показано направление увеличения значений параметров. Yt Yt Yt A1 A0 α t t Рис. 4. Форма динамики модели (4) при изменении значений параметров A0, A1, α t Параметр A0 отмечает точку пересечения с осью ординат и соответствует уровню ЖЦП в начальный момент времени. Параметры A1 и α совместно определяют высоту ЖЦП, а также скорость и продолжительность спада. Модель имеет единственный экстремум и единственную точку перегиба. Точка экстремума определяется по формулам: A A1 A0 A , Tt 1 exp 0 1 . A1 A1 t Точка перегиба имеет координаты: t A 2A1 A0 2A , Tt 1 exp 0 2 . A1 A1 Указанные точки позволяют выделить в модели три стадии эволюции и ЖЦП: быстрый рост с замедлением, насыщение и медленный спад (рисунок 5). Yt 0 t* t** рост насыщение спад t Рис. 5. Выделение стадий ЖЦП в динамике модели (4) Динамика модели (4) во многом схожа с динамикой известной модели [2], показанной в качестве примера на рисунке 2 (б): Tt A0t e t . (5) Однако есть и различия. Модель (5) всегда проходит через начало координат, а модель (4) может начинаться с любого значения, заданного параметром A0. Модель (5) имеет две точки перегиба, что позволяет выделить четыре стадии ЖЦП. В то же время модель (5) обладает большей нелинейностью (оба образующих ее тренда нелинейны), что может затруднить ее идентификацию. Модель (4) в большей степени подходит для описания жизненного цикла «ожидаемых» товаров, для которых характерен высокий интерес с самого начала продаж. К ним относятся фильмы, книги, некоторые программы и видеоигры, мобильные устройства, в особенности - продолжения, ремейки и новые версии уже известных продуктов. Для этих товаров характерна широкая известность производителя или линейки продукта, масштабная предпродажная маркетинговая кампания. В некоторых случаях стадия роста полностью вырождается и после нескольких первых дней продаж объемы начинают снижаться. Идентификация модели (3) может быть выполнена различными методами. В данном исследовании были рассмотрены и сравнены три подхода к идентификации. Первый подход – конструирование обобщенной параметрической ARMA-модели с помощью Z-преобразования [3]. Раскрыв скобки в модели (4), получим: Tt A0e t A1te t . Прямое и обратное Z-преобразование приводит к следующей ARMA-модели: Tt 2Tt 1 Tt 2 , e . Параметры идентифицируются с помощью применения метода наименьших квадратов (МНК): n двукратного arg min Yt 2Yt 1 Yt 2 , 2 t 2 ln( ), A0 , A1 n arg min Yt A0 A1t e t . A0 , A1 t 1 2 Второй подход основан на методе итерационной параметрической декомпозиции [4] с независимой идентификацией, образующую модель трендов. Однако в данном случае невозможно выделить доминирующий тренд на первом этапе декомпозиции, поэтому необходимы начальные приближения, которые можно получить с помощью метода «имитационного отжига» [5]. Найденные с помощью «имитационного отжига» начальные приближения параметров подставляются в модели Tt I A0 A1t и Tt II Ae t для уточнения параметров путем итерационной параметрической декомпозиции. Третий подход ориентирован на численном решении МНК для модели в целом. С помощью «имитации отжига» определяется область локального минимума функции квадратичной ошибки (начальное приближение). Затем с помощью алгоритма RPROP [6] осуществляется спуск к найденному минимуму. Предложенные методы были исследованы на точность идентификации с помощью генерации тестовых выборок. Дисперсия аддитивной стохастической компоненты задавалась через коэффициент шум/сигнал Kn/s (отношения дисперсии стохастической компоненты к дисперсии мощности тренда) в диапазоне значений 0-30%. Объем выборки задавался равным 24, 36, 48 наблюдениям, а глубина прогноза назначалась в 12 наблюдений. При каждом наборе параметров было сгенерировано по 50 выборок, всего 63 000 выборок. Диапазон варьирования значений параметров модели представлен в таблице 1. При выбранных значениях параметров точка максимума модели находится в пределах выборки, а точка перегиба – на прогнозной части или в конце рабочей выборки. В прогнозную часть выносятся этапы насыщения и спада. Таблица 1. Диапазоны значений параметров для генерации тестовых выборок n=24 n=36 n=48 min min min max шаг max шаг max mаx A0 10 50 10 10 50 10 10 50 10 A1 30 70 20 20 80 20 20 80 20 α 0,05 0,07 0,01 0,04 0,06 0,01 0,03 0,05 0,01 В результате исследования было установлено, что первый и второй способы идентификации в подавляющем большинстве случаев не позволяют получить удовлетворительную по точности модель. В то же время третий способ («имитация отжига» + RPROP) позволяет идентифицировать модель с высокой точностью. На рисунке 6 показаны зависимости коэффициента детерминации R2 (показателя точности моделирования) и второго коэффициента Тейла kT2 (показателя точности прогнозирования) от уровня шума Kn/s при использовании третьего способа идентификации модели. Как видно из графиков, R2 во всех случаях превышает 0,75, характеризуя высокую точность моделирования. Второй коэффициент Тейла оказывается менее 20%, что тоже подтверждает высокую точность прогнозирования. Заметим, что реально используемый в эконометрической практике диапазон уровня шума обычно не превышает 10-15 %, что позволяет говорить о широкой области применения данного способа идентификации. Рис. 6. Выделение стадий ЖЦП в динамике модели (4) Небольшая доля выборок (3-4%) была идентифицирована неверно даже в условиях отсутствия шума из-за неудачного выбора начального приближения. Однако вероятностный характер «имитации отжига» при работе с каждой конкретной выборкой позволяет добиться получения другого, более точного начального приближения. Таким образом, для идентификации модели (4) наилучший результат обеспечивает численный метод решения МНК по алгоритму RPROP с выбором начального приближения по методу «имитации отжига». Возможно использование и других численных методов, однако во всех предыдущих исследованиях именно RPROP показывал наилучшую сходимость при более низкой вычислительной сложности. Рекомендуется использовать модель для ЖЦП товаров с быстрым выходом на рынок и продолжительным насыщением и спадом в целях прогнозирования стадии спада. Однако возможно и другое применение модели для описания различных эволюционирующих процессов. Литература 1. Перстенева Н.П. Количественные методы измерения трансформации социально-экономических систем: Монография / Н.П. Перстенева. – Самара: Изд-во НОАНО ВПО СИБиУ, 2012. – 80 с. 2. Hammond G.P., Mackay R.M. Projections of UK oil and gas supply and demand to 2010 // Applied Energy. Volume 44, Issue 2, 1993, Pages 93–3. Семёнычев, В.К. Идентификация экономической динамики на основе моделей авторегрессии / В.К. Семёнычев. – Самара: АНО «Изд-во СНЦ РАН», 2004. – 243 с. 3.Семёнычев, В.К. Метод параметрической итерационной декомпозиции тренд-сезонных рядов аддитивной структуры / В.К. Семёнычев, Е.В. Семёнычев, А.А. Коробецкая // Вестник Самарского муниципального института управления. – Самара: Издво «СМИУ», 2010. – № 1 (12). – С. 63-71. 4.Жиглявский А.А., Жилинскас А.Г. Методы поиска глобального экстремума. – М.: Наука, 1991. 5.Осовский, С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. – М.: Финансы и статистика, 2002. – 344 с.