Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики» Факультет бизнеса и менеджмента Школа бизнес-информатики Кафедра бизнес-аналитики ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА на тему: «Прогнозирование спроса на автомобили в России» Студент группы №242-М Прохоров В.С. Руководитель ВКР: к.э.н. Хачатрян Н.К. Москва 2015 1 Содержание Введение ................................................................................................................................. 4 Глава 1. Проблематика прогнозирования спроса ............................................................... 6 1.1 Теоретическая модель .................................................................................................. 6 1.2 Построение модели спроса .......................................................................................... 7 1.2.1 Основные этапы построения модели спроса ....................................................... 7 1.2.2 Принципы и методы построения линейных, нелинейных моделей спроса ..... 8 1.3 Применение эконометрических моделей на практике ........................................... 15 1.3.1 Моделирование экономики на основе эконометрической модели LAM ....... 16 1.3.2 Оценивание ценовой функции для картин ........................................................ 18 Глава 2. Эконометрическое моделирование спроса на автомобили в России .............. 19 2.1 Сбор статистических данных .................................................................................... 19 2.2 Анализ эконометрической модели ........................................................................... 21 2.2.1 Проверка значимости коэффициентов модели ................................................. 21 2.2.2 Проверка автокорреляции ................................................................................... 22 2.2.3 Проверка на наличие гетероскедастичности ..................................................... 23 2.2.4 Проверка качества модели .................................................................................. 24 2.3 Программное обеспечение для анализа модели...................................................... 27 2.3.1 Статистические пакеты для анализа данных .................................................... 27 2.3.2 Пакет SPSS ............................................................................................................ 32 Глава 3. Построенные эконометрические модели спроса на зарубежные и отечественные автомобили в России................................................................................. 36 3.1 Анализ парных корреляций ....................................................................................... 37 3.2 Модель общего спроса на автомобили в России .................................................... 39 3.2.1 Построение модели .............................................................................................. 39 3.2.2 Ретроспективный прогноз ................................................................................... 48 3.2.3 Качественные выводы из построенной модели ................................................ 49 3.3 Модель спроса на отечественных автомобилей...................................................... 50 3.3.1 Построение модели .............................................................................................. 50 2 3.3.2 Ретроспективный прогноз ................................................................................... 55 3.3.3 Качественные выводы из построенной модели ................................................ 56 3.4 Модель спроса на зарубежных автомобилей .......................................................... 57 3.4.1 Построение модели .............................................................................................. 57 3.4.2 Ретроспективный прогноз ................................................................................... 62 3.4.3 Качественные выводы из построенной модели ................................................ 63 Заключение ........................................................................................................................... 65 Литература............................................................................................................................ 67 Приложения.......................................................................................................................... 69 3 Введение Анализ объема и динамики продаж – один из основных этапов в управлении продажами. Выявление зависимостей спроса на товар и его прогнозирование помогает в принятии ответственных стратегических решений, планировании деятельности и организации работы отделов продаж. Современная экономическая теория, как на микро, так и на макро уровне стремительно развивается. Постоянно усложняющиеся экономические процессы привели к необходимости создания и совершенствования особых методов изучения и анализа. При этом широкое распространение получило использование моделирования и количественного анализа. На базе последних выделилось и сформировалось одно из направлений экономических исследований - эконометрика. Эконометрия экономических – наука, объектов и изучающая процессов при количественные помощи взаимосвязи математических и статистических методов и моделей. Основная задача эконометрии – построение количественно определенных экономико-математических моделей, разработка методов определения их параметров по статистическим данным и анализ их свойств. Наиболее часто используемым математическим аппаратом решения задач данного класса служат методы корреляционно-регрессионного анализа. Эконометрическое моделирование составляет основу математического описания экономического развития любой сферы хозяйственной деятельности. Наибольшую актуальность оно приобретает в момент развития рыночных отношений, поскольку функционирование компаний с учетом конкурентной среды так или иначе оценивается как работа в условиях неопределенности, которая предполагает присутствие различного рода возмущений, которые непосредственно влияют на объясняемые переменные. Построение прогноза на базовой методологии эконометрической модели, конечно, не исключит ошибки результирующих параметров модели, но определенно уменьшит их количественное значение. 4 Целью настоящей работы является построение эконометрической модели динамики продаж зарубежных и отечественных автомобилей на основе собранных статистических данных для прогнозирования спроса в России. Исходя из поставленной цели определен следующий круг задач: 1) Проанализировать общие принципы построения эконометрической модели; 2) Определить факторы, влияющие на уровень спроса на отечественные и зарубежные автомобили в России, собрать статистические данные по ним; 3) Построить эконометрическую модель спроса на автомобили в России; 4) Провести ретроспективный прогноз на основании построенной модели. Объект исследования – рынок продаж автомобилей в России. Предмет исследования – исследование спроса на отечественные и зарубежные марки автомобилей в России. 5 Глава 1. Проблематика прогнозирования спроса 1.1 Теоретическая модель Если обобщить теоретическую модель, описывающую взаимосвязи между явлениями или закономерности их развития, то можно записать следующее соотношение: y = (,x) + В указанном соотношении (,x) – это функционал, соответствующий виду и структуре взаимосвязей. Величина у называется результативным признаком или объясняющей (зависимой) переменной, она характеризует уровень исследуемого явления. Величина x = (x1,x2,..,xn) представляет собой вектор значений независимых (объясняющих) переменных xi. Величина α=(α0,α1,α2,...,αn) составляет вектор произвольных констант, которые называются параметрами модели, а ε – ошибка модели1. Ошибка модели ε рассматривается как случайная величина и характеризует различие реального значения объясняющей переменной y от вычисленного в соответствии с указанным соотношением при определенных условиях (конкретных значениях независимых переменных факторов xi). Для расчета числового значения параметров α0,α1,α2,...,αn используется заранее собранный массив наблюдений относящийся к изучаемому процессу и рассматриваемым факторам. В одном наблюдении присутствует множество значений (yt,x1t,x2t,...,xnt). Индекс t характеризует отдельное наблюдению. Зависимую переменную y часто называют эндогенной (внутренней) переменной модели, отображая той факт, что значения зависимой переменной определяется только значениями независимых переменных xi. Объясняющие переменные (предикаторы) x1,x2,...,xn называют экзогенными (внешними) переменными. Термин «внешний» сообщает о том, что значения предикаторов xi являются заданными, так как определяются вне исследуемой модели. 1 Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. – 5-е изд., испр. – М.: Дело, 2001. 6 По типу взаимосвязи факторов с зависимой переменной y модели разделяются на линейные и нелинейные. По характеристикам своих параметров модели можно разделить на две категории: модели с постоянной и переменной структурой. К взаимосвязанных специфичному виду эконометрических модели уравнений, можно отнести включающих системы несколько уравнений общего вида теоретической модели. В общем случае алгоритм создания модели можно разбить на несколько шагов: 1) Aнализ особых свойств исследуемых явлений и процессов, описание наиболее подходящих классов моделей для их обоснования; 2) Оценка выбранного типа эконометрической модели с учетом исходных данных, выражающих значения предикаторов в определенные моменты времени; 3) Проверка качества полученной модели и обоснования целесообразности ее применения в ходе дальнейшего эконометрического исследования; 4) В случае принятия решения о нецелесообразности использования созданной эконометрической модели необходимо вернуться к предыдущему этапу работы и попытаться построить другой вариант модели, который будет более точнее описывать изучаемые явления и процессы. 1.2 Построение модели спроса 1.2.1 Основные этапы построения модели спроса2 1) Постановочный этап На данном этапе производится определения итоговых целей строящейся модели, отбор задействованных факторов, анализ их влияния. Главными цели: оценка состояния и анализ изменения экономического объекта, прогнозирование основных экономических показателей объекта, сценарный анализ, применение полученных результатов для планирования управления. 2) Априорный этап 2 Айвазян С.А., Методы эконометрики: учебник– М.: Магистр: ИНФРА-М, 2010 7 На втором этапе оценивается сущность исследуемого объекта, идет систематизация имеющихся данных. 3) Этап параметризации На этапе параметризации определяется общий вид модели, типы взаимосвязей, их состав. Главная цель этапа – определить тип функции f(x). 4) Информационный этап Производится анализ и сбор статистических данных. 5) Этап идентификации На этапе идентификации модели осуществляется основная часть исследований. Проводится эконометрическая оценка модели и ее параметров. 6) Этап верификации При верификации модели идет оценка адекватности модели, проводится анализ точности полученных значений. Проверяется смоделированный процесс на соответствие с реальным, высчитывается ошибка прогноза. 1.2.2 Принципы и методы построения линейных, нелинейных моделей спроса Каждый раз анализируя предложения и спрос появляется необходимость сделать некоторый прогноз. Для корректного прогнозирования важно построить качественную модель, с помощью которой возможно будет сделать прогноз. При создании линейной модели спроса или предложения зачастую учитываются не только сами значения показателей, важно уделить внимание влияющим на спрос факторам. Например, на спрос напрямую влияет уровень доходов населения, период (сезонность), ставки процентов в банке и многие другие факторы. Так и на предложение могут повлиять высокие цены на ресурсы, новые дорогостоящие технологии, налоги и многое другое. 8 Разберем в первую очередь наиболее часто применяющуюся модель для описания спроса и других различных экономических показателей. yˆ a 0 a1 t 3 где а0 и а1 – расчетные параметры, t – временной фактор, относительно которого изменяется спрос и предложение;. Указанная выше модель называется трендовой моделью экономической динамики. Другими словами - кривая роста для экономических процессов. Главной целью данной модели является прогнозирование изучаемого процесса на исследуемый период времени. На данный момент существует большое количество типов кривых роста для экономических процессов. В приоритетном порядке в экономике применяются полиномиальные, экспоненциальные и S-образные кривые роста. Указанная выше модель относится к типу полиномиальной кривой роста. Наиболее простые кривые роста могут принимать схожий вид: yˆ a0 a1 t (полином первой степени) yˆ a 0 a1 t a 2 t 2 (полином второй степени) yˆ a 0 a1 t a 2 t 2 a 3 t 3 (полином третьей степени) где а1 - линейный прирост, а2 – ускорение роста, а3 – изменение ускорения роста. Для вычисления параметров модели применяется метод наименьших квадратов. Также можно записать уравнения в матричной форме. Опишем вычисление параметров с помощью метода МНК. Полином первой степени: a0 n a1 t yt 2 a0 t a1 t yt t 3 Экономико-математические методы и прикладные модели: Учеб. пособие для вузов / В.В. Федосеев, А.Н. Гармаш, Д.М. Дайитбегов и др.; Под ред В.В. Федосеева. – М.: ЮНИТИ, 2002. 9 Полином второй степени: a0 n a1 t a2 t 2 yt 2 3 a0 t a1 t a2 t yt t a 2 3 4 2 0 t a1 t a2 t yt t Полином третьей степени: a0 n a1 t a2 t 2 a3 t 3 yt 2 3 4 a0 t a1 t a2 t a3 t yt t 2 3 4 5 2 a0 t a1 t a2 t a3 t yt t 3 4 5 6 3 a 0 t a1 t a2 t a3 t yt t Подобным образом можно рассчитать все параметры для полиномиальных моделей. Для корректного выбора кривой роста для дальнейшего моделирования и прогнозирования нужно учитывать специфику каждого вида кривых. Но на практике получается так, что используется модель, анализ которой дает наилучшие результаты. Оценка качества модели осуществляется относительно случайной величине t. Параметры модели можно записать в следующем виде: y a0 a1 t t , где yˆ a0 a1 t кривая роста (полиномиальная или другая), а t – случайная величина. Существует две причины возникновения случайной величины: 1. Прогнозирование экономического показателя на основе временного ряда базируется на экстраполяции4 (анализ будущих значений на основании изменения прошедших) и относится к одномерным методам прогнозирования. Обычно в таких случаях исследуемых показатель зависит от множества факторов, четко определить которые достаточно проблематично. Исходя из этого модель является упрощением действительности, поэтому отклонения и возникают. 4 Бокс Дж., Дженкинс Г. Анализ временных рядов. Выпуск 1: Прогноз и управление. – М. Мир, 1974. 10 2. Возникновение неких препятствий при измерении данных (наличие ошибок измерений), а также возникновение ошибки при округлении расчетных значений. Процесс вычисления данного показателя во временном ряде соотносят не с фактором, а с течением времени, что отражается в создании одномерных временных рядов. Помимо полиномиальных кривых роста широко распространенным способом моделирования тенденции временного ряда является создание аналитической нелинейной функции, объясняющую зависимость ряда от времени. Так как зависимость от времени может быть различна, для представления модели используются разнообразные виды функций. В создании эконометрических моделей спроса и предложения зачастую применяют экспоненциальный тренд: yˆ a bt . Нужно выявить подходящую из рассмотренных модель, которая наиболее качественно описывает исследуемый параметр, другими словами определить тип тенденции. Вариантов для определения вида тенденции несколько. Среди известных способов наиболее распространены: качественный анализ исследуемого процесса, построение графика и его визуальный анализ, вычисление некоторых показателей динамики. В подобных случаях возможно рассмотреть коэффициент автокорреляции уровней ряда. Если рассчитать коэффициент автокорреляции по уровням ряда (исходным и преобразованным), тип тенденции можно определить путем их сравнения. Если тенденция временного ряда определена как линейная, его соседние значения yt и yt-1 коррелированы между собой. В такой ситуации коэффициент автокорреляции первого порядка для значений начального ряда должен быть высоким. Если для временного ряда наблюдается нелинейная тенденция, то коэффициент автокорреляции первого порядка по логарифмам значений начального ряда будет выше, чем соответствующий коэффициент, вычисленный по значениям ряда. Чем сильнее будут различаться величины 11 коэффициентов, тем более явно будет прослеживаться нелинейная тенденция в исследуемом временном ряде. Существует и другой случай – степенная модель, имеющая вид: yˆ a t Рассмотрим анализ параметров модели в нелинейных трендах5. Каждый из них может быть рассчитан с помощью метода МНК, если нелинейную модель привести к линейному виду. В таком случае экспоненциальный тренд примет следующий вид: ln yˆ t , где ln a, ln b . Отсюда вычислим и : ln yˆ t ln yˆ t t 2 t 2 ln yˆ t Параметры а и b вычисляются обратным способом. В случае степенной модели: ln yˆ b ln t , где ln a . Для получения параметров и b необходимо решить систему нормальных уравнений: n ln a b ln t ln y 2 ln a ln t b ln t ln y ln t Взаимосвязь спроса от времени не всегда четко выражена. Наилучший способ для анализа подобных явлений использовать модель множественной регрессии, в которой исследуемый фактор будет зависеть от набора переменных. На практике подобные модели используются чаще, так как позволяют оценить исследуемое значение при изменении влияющих на него факторов. Рассмотрим пример спроса на картофель (переменная y), который зависит от уровня заработной платы (х1), время года (х2), территориальной расположенности (х3), количества сбережений населения (х4), показателя динамики инфляции (х5). Для некоторых независимых переменных можно сопоставить количественные значения. В таком случае строится модель 5 Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2001. 12 многофакторной регрессии: yˆ a0 a1 x1 a2 x2 a3 x3 a4 x4 a5 x5 . Подобная модель будет четко отображать ситуации, при возможных изменениях различных факторов. При вычислении параметров модели применяют метод МНК или используют матричную запись. В матрице Х хранятся значения факторов, в матрице Y – зависимые переменные, в матрице А - коэффициенты регрессии. 1 x11 1 x 12 X 1 x1n 1 1 x 1n x21 x22 x2 n 1 x2 n xm1 y1 a0 a xm 2 y 2 1 Y A ; ; xmn 1 yn 1 am y a xmn n m 1 В данной случае уравнение множественной регрессии будет иметь вид: Yˆ X A . С помощью стандартных преобразований над матрицей получим выражение матрицы А: A X X 1 X Y , где X’ – транспонированная матрица Х. Среди моделей в теории спроса и предложения встречаются не только линейные и нелинейные. Большинство экономистов выявляют различные связи предложения и спроса. Можно привести пример системы совместных уравнений - модель кейнсианского типа: Qts a1 a 2 Pt a 3 Pt 1 1 Qtd 1 2 Pt 3 Yt 2 Qts Qtd d Q где t - спрос на товар; Q ts - предложение на товар; Pt - цена товара; 13 Yt - доход; Pt 1 - цена товара в предыдущий период; t – момент времени. Как правило, система совместных уравнений состоит из эндогенных и экзогенных переменных. В нашем случае эндогенные переменные обозначены как Q. Это объясняемые переменные, их количество должно соответствовать количеству уравнений в системе. Все остальное относится к экзогенным переменным. Это объясняющие переменные, которые влияют на эндогенные переменные, но сами от них не зависят. Структура подобной модели отражает уровень влияния любого фактора на значение зависимой переменной. Корректируя уровень цен на товары и доходы, есть возможность прогнозировать величины спроса и потребления. При оценке возможностей спроса часто используются однофакторные функции. Соответственно, кривую спроса можно описать следующим соотношением yi f i (Z ) 6, где Z – доход. Такие функции называются кривыми Энгеля. Формы подобных кривых могут различаться для различных видов товаров. Функция будет иметь линейный вид в случаях пропорционально возрастающего спроса и дохода. Подобный вид имеет спрос на фрукты и одежду, пример кривой представлен на рисунке 1.1. В случаях роста спроса относительно высокими темпами по сравнению с доходом, кривая примет более выпуклый вид (рис. 1.2). Такая ситуация наблюдается с дорогостоящим товаром. 6 Бабешко Л.О. Основы эконометрического моделирования: Учеб. Пособие. – М.: КомКнига, 2006. 14 В обратном случае, когда темп роста спроса замедляется с определенного момента, кривая Энгеля примет вогнутый вид (рис. 1.3). Подобная ситуация характерна для товаров первой необходимости. Рисунки 1.1-1.3. Кривые спроса Помимо перечисленных, для исследования спроса на товары применяются и другие функции (например, S-образные). Зачастую, для построение модели используются специфичные данные конкретной области, поэтому модели очень индивидуальны. 1.3 Применение эконометрических моделей на практике Существует три классификации задач, для решения которых применяются эконометрические модели7: 1) отличие по конечным целям; 2) отличие по уровню иерархии; 3) отличие по области исследования. По конечным прикладным целям различают две основные задачи: - прогнозирование экономических показателей, описывающих состояние и уровень развития исследуемой системы; 7 Вербик Марно Путеводитель по современной эконометрике. – М.: Научная книга, 2008. 15 - сценарный анализ: оценка состояния системы при возможных изменения ее параметров. По иерархии задачи подразделяются последующим уровням: - макроуровень (страна); - мезоуровень (области, отрасли, монополии); - микроуровень (семья, компании, магазин). Области исследования экономической системы: - рынок; - инвестиционная, финансовая, социальная политики; - ценообразование; - распределительные отношения; - спрос и потребление; - комплекс проблем. 1.3.1 Моделирование экономики на основе эконометрической модели LAM Первоначально модель LAM (Long-run Adjustment Model) разработали для моделирования и прогнозирования экономик стран восточной Европы в переходный период. Первые версии модели были использованы 1993 году для моделирования процесса приватизации в Польше и Чехословакии. Следующая версия модели применялась для прогнозирования основных макроэкономических показателей Венгрии, Польши, Литвы, Эстонии, Словакии, Чехии, Румынии. Во второй версии модели LAM-2 не учитывались уравнения, описывающие характеристику потребления и инвестиций. Это было основным недостатком модели, который был устранен в новой версии LAM-3. Помимо 16 исправления недочета предыдущей модели, для LAM-3 был доработан механизм коррекции ошибок: линейный заменен на билинейный. Принцип и назначение модели: 1) Модель LAM-3 считается малой моделью, целью которой является анализ и краткосрочный (квартальный) прогноз основных макроэкономических показателей: ВВП, импорт, экспорт, индекс потребительских цен, показатели доходов и потребления, инвестиций, средне-душевой доход и занятость населения, уровень безработицы, спрос на деньги и другие. 2) Модель легка в управлении и достаточна проста в сопровождении. Есть возможность быстрого доступа к корректировке модели при появлении новых данных. 3) Структура модели для различных национальных экономик не изменяется, отличается только входными параметрами. Сама модель состоит из 25 уравнений: четыре из них описывают долгосрочные зависимости, двадцать одно – краткосрочные. 4) Основу модели LAM-3 составляет билинейный вектор авторегрессии (Bilinear Vector AutoRegressive model— BiVAR). В статье «О моделировании экономик России и Беларуси на основе эконометрической модели LAM-3»8 с помощью универсальной методологии построены эконометрические модели LAM-Rus и LAM-Bel для квартального прогнозирования динамики основных макроэкономических показателей для экономики России и Беларуси соответственно. Также модель позволяет количественно измерить различные сценарии экономической политики. Анализ качества модели на основе полученных оценок показал практическую значимость модели. Вычисленные в статье показатели позволяют разработать 8 Харемза В.В., Харин Ю.С., Макарова С.Б. Прикладная эконометрика «О моделировании экономик России и Беларуси на основе эконометрической модели LAM-3» 3-е изд., 2006. 17 план дальнейших действий для эконометрических исследований. 1.3.2 Оценивание ценовой функции для картин Важность рынок произведений искусства с экономической точки зрения является общепризнанным фактом. Для инвесторов, которые нацелены на извлечения максимальной выгоды из своих активов, предметы искусства – лишь финансовый инструмент. В кризисный период цены на стандартные активы падают. Но цены на произведения искусства не подвергаются таким изменениям ввиду самостоятельности актива, что соответствует низкой корреляции с другими активами. Хотя рынок по продаже произведений искусства появился в семнадцатом веке, его анализ и исследование стали проводиться относительно недавно. В статье «Оценивание гедонистической ценовой функции для картин Клода Моне»9 оценивается гедонистическая регрессионная модель зависимости цены от набора факторов (характеристик работы), построенная на основе 296 случаях продажи картин мастера по всему миру с апреля 1997 года по декабрь 2009 года. Для объясняющих переменных были выбраны материал основы, техника исполнения, размер полотна, наличие даты и подписи, аукционный дом продажи, наличие упоминаний о работе, опыт мастера к моменту написания картины, порядок лота. Регрессии получилась значимой для 76% вариации цен. Рассчитанные коэффициенты модели позволяют оценить стоимость работ, определять случаи продажи по «завышенной» цене. В ходе построения модели была подтверждена гипотеза о том, что написанные маслом картины самые дорогие. Гипотеза об отсутствии влияния кризиса на цену, напротив, была опровергнута. 9 Ратникова Т.А., Сергеева Е.С. Прикладная эконометрика «Оценивание гедонистической ценовой функции для картин Клода Моне» 4-е изд., 2010. 18 Глава 2. Эконометрическое моделирование спроса на автомобили в России 2.1 Сбор статистических данных Для прогнозирования спроса на автомобили выделены доминантные факторы, описанные в таблице 2.1. Фактор Обозначение Средневзвешенная процентная Credite_rate ставка по кредитам, предоставленными кредитными организациями физическим лицам на срок свыше 1 года, % Бивалютная корзина, руб Currency_basket Розничная цена на бензин АИ-95, Cosoline_price руб/л Среднедушевой доход, руб/месяц Average income Численность населения Population Динамика инфляции, % Inflation_dynamic Таблица 2.1. Доминантные факторы спроса на автомобили В таблице 2.2 описаны марки автомобилей, по которым были собраны данные по продажам. Статистика продаж содержится в приложении 4. Отечественные автомобили Зарубежные автомобили Vortex, ГАЗ комм., ГАЗ легк., ЗАЗ, Acura, Alfa Romeo, Audi, BAW, BMW, Иж, Лада, Ока, ТагАЗ, УАЗ. Brilliance, BYD, Cadillac, Changan, Chery, Chevrolet, Chrysler, Citroen, Daewoo, Datsun, Dodge, Dongfeng, FIAT, Ford, Foton, Geely, Great Wall, Hafei, Haima, Honda, Hummer, 19 Hyundai, Infiniti, Iran Khodro, Isuzu, Iveco, JAC, Jaguar, Jeep, Kia, Land Rover, Lexus, Lifan, Luxgen, Mazda, Mercedes-Benz, Mercedes-Benz комм., Mini, Mitsubishi, Nissan, Opel, Peugeot, Porsche, Renault, SAAB, SEAT, Skoda, smart, SsangYong, Toyota, Subaru, Volkswagen, Suzuki, Volkswagen комм., Volvo, Богдан. Таблица 2.2. Список марок автомобилей, проданных в России с января 2007 года В таблице 2.3 описаны зависимые переменные: Описание переменной Обозначение Общие продажи автомобилей Sold_out Продажи отечественных марок авто Russian_cars Продажи зарубежных автомобилей Foreign_cars Таблица 2.3. Прогнозируемые переменные Статистические данные собраны из следующих источников: Фактор Источник Population, Average income Федеральная служба государственной статистики Sold_out, Russian_cars, Foreign_cars Association of European Businesses (AEB) Credite_rate, Currency_basket Статистика Центрального банка Российской Федерации Cosoline_price Котировки предоставлены: Яндекс Петрол (данные Плюс Регион) 20 Уровень-инфляции.рф (основаны на Inflation_dynamic индексах потреб. цен, взятых у ФСГС) Таблица 2.4. Источники статистических данных Для построения модели спроса использовалась линейная регрессионная модель зависимости показателей продаж от объясняющих переменных. Модель построена на основании 90 наблюдений: данные по каждому месяцу, начиная с января 2007 года (приложение 4). 2.2 Анализ эконометрической модели 2.2.1 Проверка значимости коэффициентов модели Чтобы оценить значимость того или иного коэффициента линейной регрессии, используется t-критерий Стьюдента. 1) Для проверки значимости выдвигается гипотеза H0 о статистической незначимости коэффициента уравнения регрессии; 2) Производится вычисление значение t-критерия фактического (tфакт) и с помощью таблицы t-распределения Стьюдента определяется табличное (критическое) значение t-критерия (tтабл); 3) Далее необходимо проверить условие | tфакт | ≤ tтабл. Если условие выполняется, то нулевая гипотеза H0 подтверждается, коэффициент уравнения регрессии статистически незначим (коэффициент недостоверен, равен нулю). Если | tфакт | > tтабл, то гипотеза H0 опровергается, статистическая значимость коэффициента признается. Формулы для вычисления величин tb,факт, ta,факт: где Sa и Sb – стандартные ошибки коэффициентов регрессии, которые вычисляются по формулам: 21 где ŷi – вычисленные значения зависимой переменной, yi – фактические значения объясняемой переменной, n – объем выборки, xi – фактические значения предикатора, 𝑥̅ – средняя величина фактических значений предикаторов. 2.2.2 Проверка автокорреляции10 Для тестирования автокорреляции первого порядка элементов исследуемой последовательности используется статистический критерий, известный как критерий Дарбина—Уотсона (или DW-критерий). Критерий назван в честь Джеффри Уотсона и Джеймса Дарбина. Вычисляется критерий Дарбина—Уотсона по следующей формуле: где 10 — коэффициент автокорреляции первого порядка. Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курдышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002. 22 Принято считать, что в распределены как модели , где регрессии специфировано, как белый шум ,а , , где В случае наличия положительной автокорреляции при ее отсутствии ошибки . стремится к нулю , ;, а при отрицательной — критерий стремится к 4: Применение критерия Дарбина—Уотсона на практике реализуется при сопоставлении величины DW с тобличными значениями dL и dU для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости α. 1. Если DW < dL, то гипотеза о независимости случайных отклонений отвергается (равносильно наличию положительная автокорреляция); 2. Если DW > dU, то гипотеза не отвергается; 3. Если dL < DW < dU, то оснований для принятия решений недостаточно. В тех случаях, когда DW превышает 2, с dL и dU необходимо сравнивать выражение (4 – DW), а не сам коэффициент DW. 2.2.3 Проверка на наличие гетероскедастичности11 Один из статистических критериев для проверки наличия гетероскедастичности (то есть непостоянной дисперсии) случайных ошибок модели линейной регрессии - Критерий Бройша-Пагана. Применяется, если есть 11 Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия – М.: Диалектика, 2007. 23 основания полагать, что дисперсия ошибок может зависеть от некоторой совокупности наблюдаемых переменных: , где . Проверяемая гипотеза сформулирована следующим образом: остатки гомоскедастичны; Альтернативная гипотеза: неверна (остатки гетероскедастичны). Процедуру вычисления статистики можно описать следующими шагами. 1) Начальная модель оценивается стандартным методом наименьших квадратов (МНК), определяются остатки . 2) Предположив гомоскедастичность модели, дисперсия ее ошибки вычисляется как . 3) Вычисляются стандартизированные остатки 4) Производится построение . дополнительной регрессия квадратов стандартизированных ошибок на начальные значения предикаторов: . 5) , где — коэффициент детерминации построенной на предыдущем этапе регрессии. Если статистика критерия имеет распределение хи-квадрат с степенями свободы, то гипотеза о гомоскедастичности остатков подтверждается. 2.2.4 Проверка качества модели Проверка адекватности модели или, другими словами, тестирование значимости объясняющей переменной X проводится по критерию Фишера. 24 Другими словами, проверяется, значимо ли влияние предикатора X влияет на значение объясняемой переменной Y. Используя суммы квадратов отклонений, вычислим F-критерий Фишера по формуле: При учете степеней свободы расчетная формула для вычисления критерия Фишера выглядит следующим образом: где m, (n-m-1) – число степеней свободы числителя и знаменателя зависимости соответственно; n – количество наблюдений; m – количество предикаторов. Тестирование значимости переменной X по критерию Фишера состоит из следующих этапов: 1. Формулируем нулевую гипотезу H: β1=0; 2. Принимаем вероятность ошибки (уровень значимости) α (5%); 3. Производим вычисления F-отношения; 4. Из таблицы F-распределения Фишера определяем величину F- критическое при заданном уровне значимости (или ошибки) и по степеням свободы f1 и f2; 5. Если Fфакт < Fтабл то гипотезу о незначимости предикатора отклоняем с 5%-ным риском ошибиться, где Fтабл - значение F при 5%-ном риске ошибки. Значение Fтабл определяют по специальным таблицам в зависимости от степеней свободы f1 и f2: f1=(n-m-1), f2=(n-1). Если неравенство Fфакт > Fтабл справедливо, то можно сделать заключение об адекватности построенной модели, следовательно линейная связь между предикатором и объясняемой переменной допустима. 25 Итоговое оценочное значение качества модели отражается в коэффициент детерминации R². Если регрессия является парной, коэффициент детерминации будет совпадать с квадратом коэффициента корреляции: где u²i – разница между исходным значением Y и предсказанным значением с помощью построенной модели. Коэффициент детерминации определяет долю разброса объясняемой переменной, которая определяется регрессией Y на X; дробное отношение определяет составляющую часть разброса объясняемой переменной, которая не определяется регрессией. Для общего случая корректным является соотношение 0≤R²≤1. Чем ближе коэффициент детерминации к единице, тем сильнее линейная связь между X и Y. Чем связь слабее, тем R² ближе к нулю. Средняя ошибка аппроксимации - еще одно средство оценки уравнения регрессии является. Фактические значения результативного признака отличаются от теоретических, вычисленных по уравнению регрессии, т.е. y и yx. Чем меньше эта разность, тем теснее теоретические значения к эмпирическим данным, качество модели лучше. Средняя ошибка аппроксимации рассчитывается по следующей формуле: Для качественно построенных моделей, величина этого показателя не должно превышать 10%. 26 2.3 Программное обеспечение для анализа модели 2.3.1 Статистические пакеты для анализа данных В связи с ростом потребности статистического анализа данных практически во всех сферах деятельность, а особенно в научной, рынок программного обеспечения для статистической обработки данных стремительно развивался. В течение последних 20 лет компьютерные программы, способные статистически анализировать большие объемы данных для прогнозирования событий, оценки вероятных альтернатив выбора, выявления закономерностей, сделали большой шаг в своем развитии. Постоянно ведутся работы по совершенствованию программ в части сокращения времени работы с данными, повышения качества представления отчетов с результатами, модернизации интерфейса, актуализации справочной информации, добавления новых статистических методов, процедур и прочего. Рынок программного обеспечения развивается стремительными темпами. Задачи по обработке данных разнообразны, для их решения применяются разноплановые типы статистических процедур анализа для получения ответов на вопросы по всем областям деятельности. Все это вызвало появление большого разнообразия статистических пакетов. На текущий момент на рынке можно встретить порядка тысячи статистических пакетов (компьютерных программ) для обработки данных. Для рынка ПО для статистического анализа данных характерна высокая конкуренция, зачастую происходит объединение или поглощение компаний по разработке программ. К примеру, один из лидеров на рынке компания SPSS Inc. поглотила компанию SYSTAT Software Inc в 1994 году, а в 1996 году – BMDP Statistical Software Inc. За счет данных “покупок” компания повысила качество своих продуктов. Приобретение SYSTAT позволило оптимизировать процедуру обработки и анализа данных, а поглощение BMDP Software – улучшить графические инструментарий SPSS. В 2009 году компанию IBM Inc. поглотила компанию SPSS Inc. 27 Пользователю каждый раз необходимо выбирать оптимальный и подходящий для него статистический пакет, исходя из поставленного круга задач. Ни для кого не секрет, что оптимальным является вариант, комбинирующий в себе высокий уровень работы, нужные функциональные возможности и умеренную цену. При выборе важно обратить внимание на следующие характеристики: соответствие параметрам поставленных задач; объем данных для статистического анализа; квалификация пользователя в области статистики (уровень знаний); соответствие компьютерного оборудования пользователя. По функциональности программы для статистического анализа можно разделить на 3 основные группы. 1. Универсальные пакеты, или пакеты общего назначения (например, Minitab, STATISTICA, STATA, S-PLUS, STATGRAPHICS, Stadia, SYSTAT, SPSS). Данные программы не заточены под определенную предметную область, их можно применять для анализа данных в различных областях деятельности. В основном в этих программах используется простой интерфейс и предложен широкий спектр статистических методов и процедур. Как правило, с подобными статистическими пакетами работают начинающие пользователи, обладающие начальным уровнем знаний в статистике, или же опытные пользователи, которые находятся на начальном этапе работы и с набором статистических методов еще не определились. Возможность использовать широкий спектр статистических методов для пробного анализа различных типов данных делает данный пакет многопрофильным и универсальным. Практические все универсальные пакеты имеют ряд схожих друг с другом встроенных статистических процедур. Каждый универсальный статистический пакет должен соответствовать следующему перечню требований: o иметь достаточно широкий перечень встроенных стандартных методов и процедур для статистического анализа.; 28 o быть понятным для «новичка» в освоении интерфейса и применении различных методов анализа; o быть способным обрабатывать большие базами данных и соответствовать высоким требованиям к хранению данных; o иметь стандартизированный вид представления данных для их последующего использования в других пакетах анализа и базах данных; o иметь в наличии широкий выбор в графическом представлении данных и результатов анализа; o иметь некую базу знаний, или справочную систему, в которой пользователь сможет найти ответы на свои вопросы по использованию пакета; иметь документационное. 2. Профессиональные пакеты (например, BMDP, SAS). Основное отличие профессиональных пакетов от универсальных в том, что первые позволяют обрабатывать гораздо больший объем данных, имеют более узкоспециализированные методы, есть возможность для создания своей системы для обработки данных. Зачастую, такие пакеты сложны для начинающих пользователей. Для профессионалов, наоборот, подобные пакеты предоставляют дополнительный широкий круг возможностей для более подробного анализа данных, исходя из своих потребностей к построенным моделям. Конечно, такие возможности добавляют к себестоимости, и профессиональные пакеты являются более дорогостоящи. Ценовой фактор препятствует широкому распространению использования профессиональных статистических пакетов в различных областях деятельности. 3. Специализированные пакеты (например, DATASCOPE, BioStat, MESOSAUR). Существуют некоторые области деятельности, исследуемые данные которых специфичны и отличны от других, требуют применения соответствующих специфических методов, которых нет в универсальных пакетах. 29 Специализированные пакеты предназначены для проведения анализа данных отдельно взятой предметной области с применением узкого круга специализированных статистических процедур. Подобные пакеты используют высококвалифицированные специалисты соответствующей предметной области. Приведем примеры существующих специализированных пакетов: BioStat – нацелен на анализ данных в области биологии и медицины. MESOSAUR – отечественный статистический пакет, используется при анализе одномерных и многомерных временных рядов и построении регрессионных моделей. DATASCOPE - российский статистический пакет, используется при анализе многомерных данных. В случаях необходимости систематического решения для конкретной области или решения с использованием ограниченного набора сложных статистических методов, следует использовать соответствующий специализированный пакет. Преобладающее количество существующих на рынке статистических пакетов имеют гибкую модульную структуру, которую можно изменять и дополнять за счет установки дополнительных плагинов (модулей), представленных для покупки или свободного скачивания в Интернете. Данная способность способствует адаптации пакета к требованиям конкретного пользователя. Перечень минимальных требований, которым должен соответствовать каждый статистический пакет: модульность; ассистирование при выборе способа обработки данных; использование простого проблемно-ориентированного языка для формулировки задания пользователя; автоматическая организация процесса обработки данных; ведение банка данных пользователя и составление отчета о результатах проделанного анализа; 30 диалоговый режим работы пользователя с пакетом; совместимость с другим программным обеспечением. Как правило, постоянно ведется поддержка существующих статистических пакетов. Каждая последующая версия приобретает новые возможности для анализа (добавление новых методов), не теряя при этом старый функционал. Новые версии зачастую остаются с начальным названием, меняется лишь порядковый номер версии. Распространенные пакеты поддерживают мультиязычность. Каждая команда разработчиков рекламирует свой статистический пакет, как самый наилучший для анализа данных. При широком выборе зачастую сложно выбрать правильный пакет. В любом случае, статистический пакет лишь инструмент в руках аналитика. Если специалист не компетентен в конкретной области, то никакой совершенный пакет не поможет ему проделать качественный анализ. С другой стороны, неверно выбранный пакет может сильно затруднить процесс работы даже высококвалифицированного специалиста. Универсальные пакеты или Профессиональные Специализированные пакеты общего назначения пакеты пакеты SPSS, STATA, STATISTICA, Stadia, STATGRAPHICS, SAS BioStat Minitab Таблица 2.1. Статистические пакеты Ниже приведен минимальный набор статистических методов, который включены в каждый наиболее известный программный продукт, предназначенный для статистической обработки данных и относящихся к упомянутым ранее трем основным группам программ (таб. 2.1). описательная статистика (базовые статистические методы, проверка нормальности распределения данных); дисперсионный анализ; кластерный анализ; 31 непараметрическая статистика (анализ таблиц сопряженности, непараметрические сравнения, дисперсионный анализ); контроль качества; обработка данных (сортировка, трансформация данных, отбор); анализ выживаемости; дискриминантный анализ; регрессионный анализ; факторный анализ. 2.3.2 Пакет SPSS Statistical Package for the Social Sciences (далее пакет SРSS) – один из универсальных статистических пакетов, который был разработан компанией SРSS Inc. Первая версия продукта была представлена еще в 1968 году. В 2009 году, после поглощения компанией IBM, название пакета включает в свое название аббревиатуру IBM (IBM SPSS Statistics). Команда разработчиков статистического данного пакета считает, что их программный существующих продукт по занимает одну из части решения лидирующих вопросов при позиций анализе среди данных в академической, правительственной и бизнессфере. SРSS относится к типу многомодульной программы. В стартовом пакете идет SPSS Base (базовый модуль), который предоставляет возможность управлять данными и содержит основные методы статистического анализа, перечисленные в предыдущей главе. Чтобы проделать более широкий и глубокий анализ данных, дополнительно потребуется установить модули пакета. Для 19 версии пакета IBM SPSS Statistics существует шестнадцать дополнительных модулей. Например, модуль Advanced Statistics позволяет проводить глубокий анализ взаимосвязей, процедуры, которые способны учитывать свойства данных. Также в модуле присутствуют мощные инструменты для создания моделей. Подобной возможности в базовом модуле нет. Среди разработанных модулей есть модуль Direct Marketing, с помощью 32 которого маркетологи могут самостоятельно проводить основные виды анализа. Модуль Bootstrapping предоставляет специалистам возможность тестировать модель на устойчивость. Модуль Data Entry облегчает процедуру создания анкет и заполнения результатов, автоматизируя его. Достоинства SPSS: мощный аппарат статистического анализа; пакет относится к универсальным (возможность использовать широкий спектр статистических методов для анализа различных типов данных в разных областях деятельности); большой ряд статистических и графических процедур и методов (свыше 50 типов диаграмм) для анализа данных исоздания отчетов; понятный для пользователя интерфейс, высокая производительность; открытый доступ для свободного скачивания пробной версии программного продукта на официальном сайте, поддержка мультиязычности; совместимость с ОС Windows, Mac, Linux; наличие достаточного количества справочной информации, литературы по работе с пакетом. Недостатки SPSS: для хорошей работы пакета необходима высокая производительная мощность компьютера; в сравнении с аналогичными статистическими пакетами относительно высокая стоимость. В последнюю на данный момент версию пакета добавлены следующие возможности: возможность импортировать данные из SAS и MS Excel; возможность экспортировать результаты в MS Office, PDF; сохранение результатов в формате HTML; способность обрабатывать несколько наборов данных одновременно; возможность создания диаграммы для переменных с несколькими ответами; 33 возможность создания диаграммы с двумя осями ординат; модернизированный редактор синтаксиса для самостоятельного написания скриптов (поддержка автозавершения, цветовое кодирование команд); с помощью Data Preparation осуществляется быстрая подготовка данных к анализу, что способствует облегчению процедуры ручного анализа данных, выявляя, объясняя и исправляя недочеты. С помощью указанной функции подготовки данных возможно построить различные отчеты по существующим данным. На рисунке 2.1 отображено окно редактора данных SPSS. В нижней части окна по центру расположены две вкладки: Данные и Переменные, позволяющие переключаться с режима просмотра/редактирования значений переменных в режим просмотра/редактирования их характеристик. Рисунок 2.1. Окно редактора данных SPSS Результаты статистического анализа приводятся в диалоговом окне под названием Вывод (рис. 2.2). 34 Рисунок 2.2. Окно вывода SPSS В качестве основного программного обеспечения, используемого в течение практической работы, выступает статистический пакет SPSS. SPSS обеспечивает достаточный инструментарий обработки данных, позволяет выполнять регрессионный анализ и строить прогностические модели. С помощью этого программного средства можно очень быстро выявить наличие статистической зависимости в анализируемых данных и затем, используя полученные взаимосвязи, сделать прогноз изучаемых показателей. 35 Глава 3. Построенные эконометрические модели спроса на зарубежные и отечественные автомобили в России В построении модели спроса использованы количественные переменные: 1) Credite_rate - средневзвешанная процентная ставка по кредитам, предоставленными кредитными организациями физическим лицам на срок свыше 1 года, % 2) Currency_basket – бивалютная корзина, руб 3) Cosoline_price –розничная цена на бензин АИ-95, руб/л 4) Average income – среднедушевой доход, руб/месяц5) Population – численность населения 6) Inflation_dynamic – динамика инфляции, % Для наблюдения сезонности продаж в процессе построения модели будут добавлены 11 номинальных переменных: February, March, April, May, June, July, August, September, October, November, December. Фиктивная переменная принимает значение 1 в соответствующем названию периоду наблюдения, во всех остальных случаях – 0. Также в модель будут добавлены две фиктивные переменные: Crisis и After_crisis. Переменная Crisis будет равна 1, если на момент наблюдения в стране будет финансовый кризис. After_crisis равна 1, если кризис закончился и начался послекризисный период. Во всех остальных случаях значения этих переменных принимают значение 0. В работе период кризиса напрямую отражает падение фондового рынка. 36 3.1 Анализ парных корреляций Так как для построения модели используются переменные с количественными шкалами, используем коэффициент корреляции Пирсона. Высоким коэффициент корреляции принимаем при значении коэффициента большем 0.75. Таблица 3.1. Парные корреляции независимых переменных Из таблицы 3.1 видно, что следующие переменные имеют наивысший коэффициент корреляции: Population и Gasoline_price. В значениях данных переменных наблюдается тендеция увеличения, можем сделать вывод о наличии временной зависимости. Избавимся от нее, убрав тренд из переменных Gasoline_price и Population. Разберем процедуру избавления от тренда на примере переменной Gasoline_price. Представим зависимость розничной цены на бензин y от времени t в виде линейной модели первого порядка: β0 и β1 – параметры модели, а ε — ошибка, распределение которой подчиняется нормальному закону с нулевым средним значением и постоянным отклонением σ2. 37 Построим линейную регрессию, где зависимой переменной будет Gasoline_price, независимой – Time (ряд натуральных чисел от 1 до 90, соответствующий номеру наблюдения). Таким образом мы можем записать: Где означает предсказанное моделью значение y при данном x, b0 и b1 — выборочные оценки параметров модели, а — значения ошибок аппроксимации. Убрав из уравнения b1xi, мы избавимся от явления тренда для переменной Gasoline_price. Рассчитаем новую переменную Gasoline_price_cor, как значение y без b1xi. Проделаем аналогичную процедуру для Population, получим скорректированную переменную Population_cor. Вновь построим таблицу парных корреляций для проверки зависимости переменных друг от друга. Таблица 3.2. Парные корреляции независимых переменных Из таблицы 3.2 видно, что убрав тренд из переменных Gasoline_price и Population, избавились от корреляционной зависимости. Все коэффициенты 38 меньше 0.75 - можно использовать переменные для построения модели прогноза уровня продаж. При построении моделей спроса вместо переменных Gasoline_price и Population будут использоваться скорректированные переменные Gasoline_price_cor и Population_cor соответственно. 3.2 Модель общего спроса на автомобили в России 3.2.1 Построение модели Зависимая переменная: Sold_out – общее кол-во продаж автомобилей в России за период Отбор переменных Рисунок 3.1.Блок-схема метода Forward Selection 39 Методом прямого отбора (рис. 3.1) определим переменные, которые будут использованы при построении модели. Фактор, который сильнее всего коррелирован с результирующим признаком, имеет больший приоритет на включение в модель. Credit Currency Gasoline_ _rate _basket price_cor Average_ Population income _cor Sold_ -0,359 -0,213 0,604 0,404 0,163 out Таблица 3.3.Корреляция входных переменных Inflatiom_ dynamic -0,179 с результирующим признаком Из таблицы 3.3 видно, наибольшая тесная связь с зависимой переменной наблюдается у показателя Gasoline_price_cor. Следуя алгоритму метода прямого отбора эту переменную в первую очередь следует проверить на включение в модель. Вычислим оценки значений результирующего признака, которые получим из модели, включающую в себя одну переменную Gasoline_price_cor. Результаты сведены в таблицу: Gasoline_ Sold_out proce_cor (X) (Y) № … Pred_Sold (Ŷ) Yср (Ŷ - Yср)^2 (Y - Ŷ)^2 1 20,01 117256 217657,7922 202988,1444 215198566,2 10080519883 2 20,9 130675 237946,7571 202988,1444 1222104599 11507229871 3 20,76 179057 234682,7005 202988,1444 1004544885 4 20,52 201867 229380,4017 202988,1444 696551243,6 756987273,7 5 20,48 204478 228381,0587 202988,1444 644800095,9 571356216,6 6 20,59 199013 230778,7862 202988,1444 7 20,85 211110 236800,0553 202988,1444 1143245318 659978943,4 8 21,15 218150 243500,7386 202988,1444 1641270286 642659948,1 … … … … 772319767 … 3094218558 1009065170 … 40 90 20,65 199398 232213,6789 202988,1444 Итого 854131866,6 1076868784 89323437298 1,55132E+11 Таблица 3.4.Расчетные данные для проверки переменной на включение в модель Исходя из данных таблицы 3.4 расcчитаем величину частного F-критерия, соответствующую Gasoline_price_cor. MSE = SSE/df = 1,55132E+11/88 = 1762859429 Freal = SSR / MSE = 89323437298 / 1762859429 = 50,66963131 По таблице значений F-критерия Фишера (Приложение 2)на уровне значимости α = 0,05 найдем граничное значение для Freal (при количестве степеней свободы d1 = 1 и d2 = 88). Ftable = 3.95 Freal > Ftable Рассчитанное значение F-критерия существенно превышает пороговое значение Ftable, что указывает на необходимость включения переменной X2 в регрессионную модель (при этом вероятность того, что решение о включении окажется неправильным, составляет α = 0,05). В таблице 3.5 отображены рассчитанные значения F-критерия для остальных независимых переменных в порядке убывания их корреляционной зависимости от объясняющей переменной Переменная Gasoline_price_cor Freal Ftable 50,67 3.95 Average_income_cor 17,189 3.95 Credit_rate 13,058 3.95 41 Currency_basket 4,184 3.95 Inflation_dynamic 2,918 3.95 Таблица 3.5. Рассчетные значения F-критериев для каждой переменной В ходе метода прямого отбора мы отобрали все объясняющие переменные, за исключением Infation_dynamic и Population_cor, так как их Freal < Ftable. Использовав метод обратного отбора, можно было сократить количество итераций алгоритма. Выявление зависимости спроса от сезона Построим модель линейной регрессии, где зависящей переменной будет Sold_out, а объясняющими – отобранные переменные, а также переменные, отвечающие за сезонность. Согласно t-таблице (Приложение 1), коэффициент для нашей модели будет значимым, если модуль его значения t будет больше 1,98. Вероятность того, что решение о включении окажется неправильным, составляет α = 0,05. Таблица 3.6. Коэффициенты модели (R2 = 0.770) 42 Исключим из модели фиктивные переменные, которые незначимы: February, June, July, August, September, October, November. Построим новую модель. Таблица 3.7. Коэффициенты модели (R2 = 0.762) Проверка значимости квадратичной формы переменных Для проверки функциональности количественных переменных будем поочередно включать их квадратичное значение в модель, проверять значимость. 1) Включаем Credit_rate_sqr: Таблица 3.8. Коэффициенты модели (R2 = 0.757) 43 Из таблицы 3.8: Credit_rate_sqr незначим. 2) Включаем Currency_basket _sqr: Таблица 3.9. Коэффициенты модели (R2 = 0.731) Из таблицы 3.9: Currency_basket_sqr незначим. 3) Включаем Gasoline_price_cor _sqr: Таблица 3.10. Коэффициенты модели (R2 = 0.736) Из таблицы 3.10: Gasoline_price_cor _sqr незначим. 4) Включаем Average_income _sqr2 (значение Average_income в квадрате и поделенное на 1000000): 44 Таблица 3.11. Коэффициенты модели (R2 = 0.786) Из таблицы 3.1: Average_income _sqr значим. Квадратичную форму переменной можно использовать только в том случае, когда сама переменная также входит в состав модели. По итогам проверки переменных в модели на квадратичную зависимость добавили новый предикатор Average_income_sqr2. Влияние кризиса на продажи Добавим в модель две новые фиктивные переменные: Crisis и After_crisis. Переменные отражают период финансового кризиса в стране. Соответственно, если в момент конкретного наблюдения в стране был кризис – значение Crisis равно 1, в после кризисный период – значение After_crisis равно 1. Во всех остальных случаях – 0. 45 Таблица 3.12. Коэффициенты модели (R2 = 0.812) Из таблицы 3.12: Crisis незначим, исключаем из модели: Таблица 3.13. Коэффициенты модели (R2 = 0.810) Исходя из результатов таблицы 3.13 все переменные значимы. Проверка логорифмической зависимости Построим линейную регрессию отобранных переменных от ln(Sold_out): 46 Таблица 3.14. Коэффициенты модели (R2 = 0.820) Результат оценки модели (таблица 3.14) с зависящей переменной, выраженной натуральным логарифмом Sold_out, показал лучшее значение коэффициента детерминации R2. Проверка на гетероскедастичность Количество степеней свободы p = 11 Критерий Бройша-Пагана LW = 24,21 LW имеет распределение с 10 степенями свободы (Приложение 3) при уровне значимости α = 0,01, следовательно гипотеза о гомоскедастичности остатков подтверждается. Проверка на автокорреляцию Для проверки модели на наличие автокорреляции использовался критерий Дарбина-Уотсона, подсчет производился автоматически системой SPSS. Для построенной модели DW = 0,463. Значение критерия меньше табличного dL, что говорит о наличии положительной автокорреляции, необходимо в модель к предикторам добавлять лаговое значение зависимой переменной 47 (Sold_out_ln_lag). Таблица 3.15. Коэффициенты модели (R2 = 0.895) 3.2.2 Ретроспективный прогноз На основе 90 наблюдений была построена модель и применена к 9 наблюдениям. Рассчитанные прогнозные значения сведены в таблицу 3.26. Средняя ошибка прогноза рассчитана по следующей формуле, где реальное значение продаж, прогнозное значение продаж, n - количество наблюдений. Период JUL 2014 AUG 2014 SEP 2014 OCT 2014 NOV 2014 DEC 2014 JAN 2015 FEB 2015 MAR 2015 Реальное Прогнозное Ошибка значение продаж значение продаж прогноза 180767 194822 7,77% 172016 161080 6,36% 197233 212856 7,92% 211365 199283 5,72% 229439 195346 14,86% 270653 298539 10,30% 115561 96853 16,19% 128333 114071 11,11% 139850 127655 8,72% MPE= 9,88% Таблица 3.16. Ошибка прогноза 48 60000 50000 40000 30000 Реальное значение продаж 20000 Прогнозное значение продаж 10000 0 JUL AUG SEP OCT NOV DEC JAN FEB MAR 2014 2014 2014 2014 2014 2014 2015 2015 2015 Диаграмма 3.1. Сравнение реального уровня продаж с прогнозным значением 3.2.3 Качественные выводы из построенной модели Модель спроса: Sold_out_ln = 8.017 – – 0.057Credit_rate 0.035Currency_basket + 0.002Gasoline_price_cor + 0.085Average_income2 + 0.161March + 0.071April + 0.058May – 0.174December – 0.001Average_income_sqr2 – 0.099After_crisis + 0.423Sold_out_ln_lag Выводы: 1) В ходе построения модели была исключена количесвтенная переменная Inflution_dynamic, следовательно динамика инфляции в стране не влияет на спрос в нашей стране. 2) Отрицательные Currency_basket коэффициенты свидетельствуют о перед переменными снижении спроса при Credit_rate и повышении процентной ставки по кредитам и увеличении стоимости бивалютной корзины. 3) Положительная зависимость продаж от цены на бензин объясняется желанием приобрести новый автомобиль, которые будет более экономичным по части расхода топлива. 49 4) Положительный коэффициент перед Average_income2 и отрицательный перед Average_income_sqr2 говорит о том, что при росте денежного дохода до определенного уровня спрос растет, но после его преодоления – падает. Это означает , что денежные средства идут, например, на покупку недвижимости. 5) Положительные коэффициенты перед March, April и May говорят о набольших значениях продаж весной, все хотят новый автомобиль к летнему сезону. Особенно пик продаж наблюдается в марте. 6) Отрицательный коэффициент перед December означает снижение спроса в конце года, описывая поведение покупателей: в январе следующего года автомобиль, произведенный в предыдущем месяце будет считаться прошлогодним, следовательно и стоимость его будет ниже. 7) Существование положительной зависимости от послекризисного периода объясняется возможным появлением дополнительных денежных средств, по сравнению с предшествующим периодом. 8) Наличие лагового значения переменной характеризует зависимость спроса от продаж в предыдущий период: коэффициент положительный – зависимость положительная. 9) Средняя ошибка прогноза модели составила 9.88%, что допускает использования данной модели на практике. 3.3 Модель спроса на отечественных автомобилей 3.3.1 Построение модели Зависимая переменная: Russian_cars – общее кол-во продаж отечественных автомобилей в России за период. 50 Отбор переменных Рисунок 3.2. Блок-схема метода Backward Elimination Методом обратного отбора (рис. 3.2) определим качественные переменные для включения в модель. Russian _cars Credit Currency Gasoline_price _rate _basket _cor Average _incom Population _cor Inflatiom_dy namic -0,611 -0,607 -0,062 -0,093 -0,082 0,39 Таблица 3.17. Корреляция входных переменных с результирующим признаком В первую очередь рассчитаем значение F-критерия для Average_income, затем для Inflation_dynamic и так далее. Переменная Freal Ftable Average_income 0,345 3.95 Inflation_dynamic 0,602 3.95 51 Population_cor Gasoline_price_cor 0,762 3.95 15,803 3.95 Таблица 3.18. Рассчетные значения F-критериев для каждой переменной Переменные Average_incom, Inflation_dynamic и Population_cor исключаем из модели, так как их Freal < Ftable . Проверка зависимости спроса от сезона Построим модель линейной регрессии, где зависящей переменной будет Russian_cars, объясняющими – отобранные переменные, а также переменные, отвечающие за сезонность. Допустимый уровень t-статистики остается на аналогичном предыдущим построениям уровне - 1,98. Вероятность того, что решение о включении окажется неправильным, составляет α = 0,05. Таблица 3.19. Коэффициенты модели (R2 = 0.692) Исключим из модели фиктивную переменную, которые незначима: February. Под исключение также попадает одна количественная переменная Gasoline_price_cor. Построим новую модель: 52 Таблица 3.20. Коэффициенты модели (R2 = 0.685) Проверка значимости квадратичной формы переменных При проверке системы не функциональность никаких зависимостей от квадратичных форм переменных выявлено не было Влияние кризиса на продажи Таблица 3.21. Коэффициенты модели (R2 = 0.738) 53 Проверка логорифмической зависимости Таблица 3.22. Коэффициенты модели (R2 = 0.732) Результат натуральным оценки модели логарифмом с зависящей Russian_cars, показал переменной, значение выраженной коэффициента детерминации R2 хуже. Проверка на гетероскедастичность Количество степеней свободы p = 13 Критерий Бройша-Пагана LW = 21,3 LW имеет в распределение с 12 степенями свободы (Приложение 3) при уровне значимости α = 0,05, следовательно гипотеза о гомоскедастичности остатков подтверждается, гетероскедастичность отсутствует. Проверка на автокорреляцию DW = 0,671. Значение критерия меньше табличного dL, что говорит о 54 наличии положительной автокорреляции, необходимо в модель к предикаторам добавлять лаговое значение зависимой переменной (Russian_cars_lag). Таблица 3.23. Коэффициенты модели (R2 = 0.830) 3.3.2 Ретроспективный прогноз Период JUL 2014 AUG 2014 SEP 2014 OCT 2014 NOV 2014 DEC 2014 JAN 2015 FEB 2015 MAR 2015 Реальное Прогнозное Ошибка значение продаж значение продаж прогноза 36892 42312 14,69% 35776 39387 10,09% 45900 36209 21,11% 51198 41826 18,31% 42790 37010 13,51% 50452 43252 14,27% 21843 26349 20,63% 29626 22606 23,69% 35599 28737 19,28% MPE= 17,29% Таблица 3.24. Ошибка прогноза 55 60000 50000 40000 30000 Реальное значение продаж 20000 Прогнозное значение продаж 10000 0 JUL AUG SEP OCT NOV DEC JAN FEB MAR 2014 2014 2014 2014 2014 2014 2015 2015 2015 Диаграмма 3.2. Сравнение реального уровня продаж с прогнозным значением Средняя ошибка прогноза составила 17.29%, применять данную модель на практике нельзя, мала прогнозная точность. 3.3.3 Качественные выводы из построенной модели Модель спроса: Russian_cars = 71426.709-1010.798 * Credit_rate - 953.538 * Currency_basket + 13596.024 * March + 18148.46 * April+ 8737.790 * May + 10.802 * June + 13711.629 * July + 13380.183 * August + 12320.970 * September + 15840.109 * October + 8046.444 * November - 12861.583 * December - 5573.331 * Crisis+0.469 * Russian_cars_lag 1) В ходе построения модели были исключены следующие количесвтенные переменные: Inflution_dynamic, Population, Average_income и Gasoline_price. Динамика инфляции в стране, численность населения, уровень среднедушевого дохода и цена на топливо незначительно влияют на спрос отечественных автомобилей. 56 2) Отрицательный Currency_basket коэффициент свидетельствуют о перед переменными снижении спроса Credit_rate при и повышении процентной ставки по кредитам и увеличении стоимости бивалютной корзины. 3) В модели остались практически все переменные для анализа сезонности продаж. Свидетельствует об относительно ровном распределении продаж в течение года. Пик продаж наблюдается в апреле. 4) Отрицательный коэффициент перед December означает снижение спроса в конце года, описывая поведение покупателей: в январе следующего года автомобиль, произведенный в предыдущем месяце будет считаться прошлогодним, следовательно и стоимость его будет ниже. 5) Отрицательные коэффициенты перед переменной Crisis говорит о снижение спроса на момент кризиса. 6) Наличие лагового значения переменной характеризует зависимость спроса от продаж в предыдущий период: коэффициент положительный – зависимость положительная. 3.4 Модель спроса на зарубежных автомобилей 3.4.1 Построение модели Зависимая переменная: Foreign_cars – общее кол-во продаж зарубежных автомобилей в России за период. Отбор переменных Методом обратного отбора (рис. 3.2) определим качественные переменные для включения в модель. 57 Credit Currency_ Gasoline_ Inflation_ Average _rate basket price_cor dynamic _income Foreign_ cars -0,239 Таблица -0,063 3.25.Корреляция 0,606 входных -0,19 0,509 переменных Population _cor 0,227 с результирующим признаком В первую очередь рассчитаем значение F-критерия для Currency_basket, затем для Inflation_dynamic и так далее. Переменная Freal Ftable Currency_basket 0,353 3.95 Inflation_dynamic 3,309 3.95 Population_cor 4,797 3.95 Таблица 3.26. Рассчетные значения F-критериев для каждой переменной Переменные Currency_basket и Inflation_dynamic исключаем из модели, так как их Freal < Ftable . Выявление зависимости спроса от сезона Построим модель линейной регрессии, где зависящей переменной будет Russian_cars, объясняющими – отобранные переменные, а также переменные, отвечающие за сезонность. Допустимый уровень t-статистики остается на аналогичном предыдущим построениям уровне - 1,98. Вероятность того, что решение о включении окажется неправильным, составляет α = 0,05. 58 Таблица 3.27. Коэффициенты модели (R2 = 0.781) Исключим из модели фиктивные переменные, которые существенно незначимы: February, June, July, August, September, October, November. Построим новую модель. Таблица 3.28. Коэффициенты модели (R2 = 0.764) 59 Проверка значимости квадратичной формы переменных Проверка показала аналогичную ситуацию, как и при построении модели общих продаж: добавилась новая переменная Average_income_sqr2. Таблица 3.29. Коэффициенты модели (R2 = 0.786) Влияние кризиса на продажи Таблица 3.30. Коэффициенты модели (R2 = 0.828) 60 Проверка логорифмической зависимости Таблица 3.31. Коэффициенты модели (R2 = 0.829) Результат натуральным оценки модели логарифмом с зависящей Foreign_cars, показал переменной, значение выраженной коэффициента детерминации R2 лучше. Проверка на гетероскедастичность Количество степеней свободы p = 11 Критерий Бройша-Пагана LW = 21,24 LW имеет распределение с 10 степенями свободы (Приложение 3) при уровне значимости α = 0,05, следовательно гипотеза о гомоскедастичности остатков подтверждается. Проверка на автокорреляцию DW = 0,448. Значение критерия меньше табличного dL, что говорит о наличии положительной автокорреляции, необходимо в модель к предикаторам 61 добавлять лаговое значение зависимой переменной Foreign_cars_ln _lag). Таблица 3.32. Коэффициенты модели (R2 = 0.856) 3.4.2 Ретроспективный прогноз Период JUL 2014 AUG 2014 SEP 2014 OCT 2014 NOV 2014 DEC 2014 JAN 2015 FEB 2015 MAR 2015 Реальное Прогнозное Ошибка значение продаж значение продаж прогноза 143875 142556 0,92% 136240 146116 7,25% 151333 149494 1,22% 160167 158441 1,08% 186649 173344 7,13% 220201 190003 13,71% 93718 81944 12,56% 98707 93685 5,09% 104251 125398 20,28% MPE= 7,69% Таблица 3.33. Ошибка прогноза 62 60000 50000 40000 30000 Реальное значение продаж 20000 Прогнозное значение продаж 10000 0 JUL AUG SEP OCT NOV DEC JAN FEB MAR 2014 2014 2014 2014 2014 2014 2015 2015 2015 Диаграмма 3.3. Сравнение реального уровня продаж с прогнозным значением Средняя ошибка прогноза составила 7.69%, модель можно применять на практике. 3.4.3 Качественные выводы из построенной модели Модель спроса: Foreign_cars_ln = 57.653 – 0.008 * Credit_rate + 0.157 * Gasolin_price_cor + 0.097 * Average_income2 – 0.001 * Average_income_sqr2 – 0.329 * Population_cor + 0.221 * March + 0.179 * April + 0.213 * May – 0.147 * December – 0.017 * Crisis – 0.175 * After_crisis + 0.269 * Foreign_cars_lag Выводы: 1) В ходе построения модели были исключены количесвтенные переменные Inflution_dynamic и Currency_basket, следовательно динамика инфляции в стране и курс валюты не влияет на спрос. 2) Отрицательный коэффициент перед переменной Credit_rate свидетельствуют о снижении спроса при повышении процентной ставки по кредитам. 63 3) Положительная зависимость продаж от цены на бензин объясняется желанием приобрести новый автомобиль, которые будет более экономичным по части расхода топлива. 4) Отрицательный коэффициент перед Population характеризует снижение уровня продаж при увеличении численности населения. Это объясняется перенасыщение автомобилей, возможно увеличивается спрос на вторичном рынке. 5) Положительный коэффициент перед Average_income2 и отрицательный перед Average_income_sqr2 говорит о том, что при росте денежного дохода до определенного уровня спрос растет, но после его преодоления – падает. Это означает , что денежные средства идут, например, на покупку недвижимости. 6) Положительные коэффициенты перед March, April и May говорят о набольших значениях продаж весной, все хотят новый автомобиль к летнему сезону. Особенно пик продаж наблюдается в марте. 7) Отрицательный коэффициент перед December означает снижение спроса в конце года, описывая поведение покупателей: в январе следующего года автомобиль, произведенный в предыдущем месяце будет считаться прошлогодним, следовательно и стоимость его будет ниже. 8) Отрицательные коэффициенты перед переменными Crisis и After_crisis говорят о снижение спроса на момент кризиса и в период после него. 9) Наличие лагового значения переменной характеризует зависимость спроса от продаж в предыдущий период: коэффициент положительный – зависимость положительная. 64 Заключение В практической части работы проведено исследование и прогнозирование уровня продаж автомобилей в России. Среди факторов, влияющих на спрос, были выделены следующие показатели: 1) Среднедушевой доход; 2) Процентная ставка по кредиту; 3) Величина бивалютной корзины; 4) Розничная цена на бензин; 5) Динамика инфляции; 6) Численность населения; 7) Период продажи (месяц); 8) Кризисный период. Первые шесть факторов выражены через количественные переменные. За седьмой и восьмой отвечали специальные фиктивные переменные. Исследование проводилось на 90 ежемесячных наблюдениях за период с января 2007 года по июнь 2014 года. Среди статистических пакетов для работы с данными был выбран IBM SPSS Statistics. Данный пакет относится к универсальной группе, что характеризует наличие широкого круга статистических методов. Интерфейс понятен для пользователя, имеется широкий выбор справочной литературы. Построены три модели спроса: 1) Модель общего спроса на новые автомобили в России; 2) Модель спроса на автомобили парок отечественного производителя; 3) Модель спроса на зарубежные автомобили в России. Модели общего спроса и спроса на зарубежные автомобили оказались значимыми для 90% вариаций показателя продаж, на отечественные – для 83%. При анализе моделей подтвердились следующие гипотезы: рост процентной ставки по кредиту и стоимости бивалютной корзины отрицательно влияют на уровень продаж, весной наблюдается пик продаж. Также, наблюдения показали, что спрос растет при увеличении дохода лишь до определенного уровня, после 65 чего падает. Такая ситуация объясняется возможным инвестированием денежных средств, например, в недвижимость. Гипотеза о уменьшении спроса при увеличении стоимости бензина была опровергнута. Обратная взаимосвязь цены на бензин и уровня продаж объясняется потребностью в более экономичных (в плане расхода топлива) новых автомобилях. Полученные модели были применены к данным за период с июля 2014 по март 2015, сделав тем самым ретроспективный прогноз. Модели общего спроса и спроса на автомобили показали хороший результат: средняя ошибка прогноза составила менее 10%, средняя ошибка для модели спроса на отечественные автомобили составила 17,29%. Улучшение последней модели возможно за счет добавления дополнительных объясняющих переменных, которые не были учтены. Основное препятствие к такому расширению модели заключается в отсутствии соответствующих данных для всех наблюдений. 66 Литература 1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. – 5-е изд., испр. – М.: Дело, 2001. 2. Айвазян С.А., Методы эконометрики: учебник– М.: Магистр: ИНФРА-М, 2010. 3. Вербик Марно Путеводитель по современной эконометрике. – М.: Научная книга, 2008. 4. Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002. 5. Харемза В.В., Харин Ю.С., Макарова С.Б. Прикладная эконометрика «О моделировании экономик России и Беларуси на основе эконометрической модели LAM-3» 3-е изд., 2006. 6. Ратникова Т.А., Сергеева Е.С. Прикладная эконометрика «Оценивание гедонистической ценовой функции для картин Клода Моне» 4-е изд., 2010. 7. Бабешко Л.О. Основы эконометрического моделирования: Учеб. Пособие. – М.: КомКнига, 2006. 8. Бокс Дж., Дженкинс Г. Анализ временных рядов. Выпуск 1: Прогноз и управление. – М. Мир, 1974. 9. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия – М.: Диалектика, 2007. 10. Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курдышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002. 11. Экономико-математические методы и прикладные модели: Учеб. пособие для вузов / В.В. Федосеев, А.Н. Гармаш, Д.М. Дайитбегов и др.; Под ред В.В. Федосеева. – М.: ЮНИТИ, 2002. 12. Орлова И.В. Экономико-математические методы и модели. Практикум: Учеб. пособие для вузов. - М.: Финстатинформ, 2000. 67 13. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 2001. 14. Плошко Б.Г., Елисеева И.И. История статистики: Учебное пособие. - М.: Финансы и статистика, 2000. 15. Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2001. 16. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания: Статистическая обработка неоднородных совокупностей. – М.: Статистика, 2000. 17. Экономико-математические методы и прикладные модели: Учеб. пособие для вузов / В.В. Федосеев, А.Н. Гармаш, Д.М. Дайитбегов, И.В. Орлова, А. Половников. - М.: ЮНИТИ, 2000. 18. Эконометрика: Учебник / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2001. 19. www.gks.ru – Федеральный сайт государственной статистики. 20. www.intuit.ru – Курс «Введение в программную среду и их разработку», Лекция 11 «Статистическая обработка данных». 21. www.aebrus.ru – Association of European Businesses/ 22. www.cbr.ru – Федеральный сайт ЦБ РФ 68 Приложения Приложение 1 Критические значения коэффициента Стьюдента (t-критерия) для различной доверительной вероятности p df Р df 0,10 0,05 0,01 0,001 1 6,314 12,70 63,65 636,61 2 2,920 4,303 9,925 3 2,353 3,182 4 2,132 5 Р df 0,10 0,05 0,01 0,001 31 1,696 2,040 2,744 3,633 31,602 32 1,694 2,037 2,738 5,841 12,923 33 1,692 2,035 2,776 4,604 8,610 34 1,691 2,015 2,571 4,032 6,869 35 6 1,943 2,447 3,707 5,959 7 1,895 2,365 3,499 8 1,860 2,306 9 1,833 10 Р 0,10 0,05 0,01 0,001 61 1,670 2,000 2,659 3,457 3,622 62 1,670 1,999 2,657 3,454 2,733 3,611 63 1,669 1,998 2,656 3,452 2,032 2,728 3,601 64 1,669 1,998 2,655 3,449 1,690 2,030 2,724 3,591 65 1,669 1,997 2,654 3,447 36 1,688 2,028 2,719 3,582 66 1,668 1,997 2,652 3,444 5,408 37 1,687 2,026 2,715 3,574 67 1,668 1,996 2,651 3,442 3,355 5,041 38 1,686 2,024 2,712 3,566 68 1,668 1,995 2,650 3,439 2,262 3,250 4,781 39 1,685 2,023 2,708 3,558 69 1,667 1,995 2,649 3,437 1,812 2,228 3,169 4,587 40 1,684 2,021 2,704 3,551 70 1,667 1,994 2,648 3,435 11 1,796 2,201 3,106 4,437 41 1,683 2,020 2,701 3,544 71 1,667 1,994 2,647 3,433 12 1,782 2,179 3,055 4,318 42 1,682 2,018 2,698 3,538 72 1,666 1,993 2,646 3,431 13 1,771 2,160 3,012 4,221 43 1,681 2,017 2,695 3,532 73 1,666 1,993 2,645 3,429 14 1,761 2,145 2,977 4,140 44 1,680 2,015 2,692 3,526 74 1,666 1,993 2,644 3,427 15 1,753 2,131 2,947 4,073 45 1,679 2,014 2,690 3,520 75 1,665 1,992 2,643 3,425 16 1,746 2,120 2,921 4,015 46 1,679 2,013 2,687 3,515 76 1,665 1,992 2,642 3,423 17 1,740 2,110 2,898 3,965 47 1,678 2,012 2,685 3,510 78 1,665 1,991 2,640 3,420 18 1,734 2,101 2,878 3,922 48 1,677 2,011 2,682 3,505 79 1,664 1,990 2,639 3,418 19 1,729 2,093 2,861 3,883 49 1,677 2,010 2,680 3,500 80 1,664 1,990 2,639 3,416 20 1,725 2,086 2,845 3,850 50 1,676 2,009 2,678 3,496 90 1,662 1,987 2,632 3,402 21 1,721 2,080 2,831 3,819 51 1,675 2,008 2,676 3,492 100 1,660 1,984 2,626 3,390 22 1,717 2,074 2,819 3,792 52 1,675 2,007 2,674 3,488 110 1,659 1,982 2,621 3,381 23 1,714 2,069 2,807 3,768 53 1,674 2,006 2,672 3,484 120 1,658 1,980 2,617 3,373 24 1,711 2,064 2,797 3,745 54 1,674 2,005 2,670 3,480 130 1,657 1,978 2,614 3,367 25 1,708 2,060 2,787 3,725 55 1,673 2,004 2,668 3,476 140 1,656 1,977 2,611 3,361 26 1,706 2,056 2,779 3,707 56 1,673 2,003 2,667 3,473 150 1,655 1,976 2,609 3,357 27 1,703 2,052 2,771 3,690 57 1,672 2,002 2,665 3,470 200 1,653 1,972 2,601 3,340 28 1,701 2,049 2,763 3,674 58 1,672 2,002 2,663 3,466 250 1,651 1,969 2,596 3,330 29 1,699 2,045 2,756 3,659 59 1,671 2,001 2,662 3,463 300 1,650 1,968 2,592 3,323 30 1,697 2,042 2,750 3,646 60 1,671 2,000 2,660 3,460 350 1,649 1,967 2,590 3,319 69 Приложение 2 Таблица значений F-критерия Фишера при уровне значимости 0,05 1 2 3 4 5 6 8 12 24 1 161,5 199,5 215,7 224,6 230,2 233,9 238,9 243,9 249,0 254,3 2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,61 2,40 12 4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50 2,30 13 4,67 3,80 3,41 3,18 3,02 2,92 2,77 2,60 2,42 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35 2,13 15 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,29 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,42 2,24 2,01 17 4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,19 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,15 1,92 19 4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,11 1,88 20 4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,28 2,08 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,42 2,25 2,05 1,81 22 4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,23 2,03 1,78 23 4,28 3,42 3,03 2,80 2,64 2,53 2,38 2,20 2,00 1,76 24 4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,18 1,98 1,73 25 4,24 3,38 2,99 2,76 2,60 2,49 2,34 2,16 1,96 1,71 26 4,22 3,37 2,98 2,74 2,59 2,47 2,32 2,15 1,95 1,69 27 4,21 3,35 2,96 2,73 2,57 2,46 2,30 2,13 1,93 1,67 28 4,20 3,34 2,95 2,71 2,56 2,44 2,29 2,12 1,91 1,65 29 4,18 3,33 2,93 2,70 2,54 2,43 2,28 2,10 1,90 1,64 30 4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,09 1,89 1,62 35 4,12 3,26 2,87 2,64 2,48 2,37 2,22 2,04 1,83 1,57 40 4,08 3,23 2,84 2,61 2,45 2,34 2,18 2,00 1,79 1,51 45 4,06 3,21 2,81 2,58 2,42 2,31 2,15 1,97 1,76 1,48 50 4,03 3,18 2,79 2,56 2,40 2,29 2,13 1,95 1,74 1,44 60 4,00 3,15 2,76 2,52 2,37 2,25 2,10 1,92 1,70 1,39 70 3,98 3,13 2,74 2,50 2,35 2,23 2,07 1,89 1,67 1,35 80 3,96 3,11 2,72 2,49 2,33 2,21 2,06 1,88 1,65 1,31 90 3,95 3,10 2,71 2,47 2,32 2,20 2,04 1,86 1,64 1,28 100 3,94 3,09 2,70 2,46 2,30 2,19 2,03 1,85 1,63 1,26 125 3,92 3,07 2,68 2,44 2,29 2,17 2,01 1,83 1,60 1,21 150 3,90 3,06 2,66 2,43 2,27 2,16 2,00 1,82 1,59 1,18 200 3,89 3,04 2,65 2,42 2,26 2,14 1,98 1,80 1,57 1,14 300 3,87 3,03 2,64 2,41 2,25 2,13 1,97 1,79 1,55 1,10 400 3,86 3,02 2,63 2,40 2,24 2,12 1,96 1,78 1,54 1,07 500 3,86 3,01 2,62 2,39 2,23 2,11 1,96 1,77 1,54 1,06 1000 3,85 3,00 2,61 2,38 2,22 2,10 1,95 1,76 1,53 1,03 3,84 2,99 2,60 2,37 2,21 2,09 1,94 1,75 1,52 1 k24 70 Приложение 3 Таблица распределения χ2 для различной доверительной вероятности α 0,99 0,98 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,000 0,001 0,004 0,016 0,064 0,148 0,455 1,074 1,642 2,71 3,84 5,41 6,64 10,83 0,020 0,040 0,103 0,211 0,446 0,713 1,386 2,41 3,22 4,60 5,99 7,82 9,21 13,82 0,115 0,185 0,352 0,584 1,005 1,424 2,37 3,66 4,64 6,25 7,82 9,84 11,34 16,27 0,297 0,429 0,711 1,064 1,649 2,20 3,36 4,88 5,99 7,78 9,49 11,67 13,28 18,46 0,554 0,752 1,145 1,610 2,34 3,00 4,35 6,06 7,29 9,24 11,07 13,39 15,09 20,5 0,872 1,134 1,635 2,20 3,07 3,83 5,35 7,23 8,56 10,64 12,59 15,03 16,81 22,5 1,239 1,564 2,17 2,83 3,82 4,67 6,35 838 9,80 12,02 14,07 16,62 18,48 24,3 1,646 2,03 2,73 3,49 4,59 5,53 7,34 9,52 11,03 13,36 15,51 18,17 20,1 26,1 2,09 2,53 3,32 4,17 5,38 6,39 8,34 10,66 12,24 14,68 16,92 19,68 21,7 27,9 2,56 3,06 3,94 4,86 6,18 7,27 9,34 11,78 13,44 15,99 18,31 21,2 23,2 29,6 3,05 3,61 4,58 5,58 6,99 8,15 10,34 12,90 14,63 17,28 19,68 22,6 24,7 31,3 3,57 4,18 5,23 6,30 7,81 9,03 11,34 14,01 15,81 18,55 21,0 24,1 26,2 32,9 4,11 4,76 5,89 7,04 8,63 0,93 12,34 15,12 16,98 19,81 22,4 25,5 27,7 34,6 4,66 5,37 6,57 7,79 9,47 10,82 13,34 16,22 18,15 21,1 23,7 26,9 29,1 36,1 5,23 5,98 7,26 8,55 10,31 11,72 14,34 17,32 19,31 22,3 25,0 28,3 30,6 37,7 5,81 6,61 7,96 9,31 11,15 12,62 15,34 18,42 20,5 23,5 26,3 29,6 32,0 39,3 6,41 7,26 8,67 10,08 12,00 13,53 16 34 19,51 21,6 24,8 27,6 31,0 33,4 40,8 7,02 7,91 9,39 10,86 12,86 14,44 17,34 20,6 22,8 26,0 28,9 32,3 34,8 42,3 7,63 8,57 10,11 11,65 13,72 15,35 18,34 21,7 23,9 27,2 30,1 33,7 36,2 43,8 8,26 9,24 10,85 12,44 14,58 16,27 19,34 22,8 25,0 28,4 31,4 35,0 37,6 45,3 8,90 9,92 11,59 13,24 15,44 17,18 20,3 23,9 26,2 29,6 32,7 36,3 38,9 46,8 9,54 10,60 12,34 14,04 16,31 18,10 21,3 24,0 27,3 30,8 33,9 37,7 40,3 48,3 10,20 11,29 13,09 14,85 17,19 19,02 22,3 26,0 28,4 32,0 35,2 39,0 41,6 49,7 10,86 11,99 13,85 15,66 18,06 19,94 23,3 27,1 29,6 33,2 36,4 40,3 43,0 51,2 11,52 12,70 14,61 16,47 18,94 20,9 24,3 23,2 30,7 34,4 37,7 41,7 44,3 52,6 2,20 13,41 15,38 17,29 19,82 21,8 25,3 29,2 31,8 35,6 38,9 42,9 45,6 54,1 12,88 14,12 16,15 18,11 20,7 22,7 26,3 30,3 32,9 36,7 40,1 44,1 47,0 55,5 13,56 14,85 16,93 18,94 21,6 23,6 27,3 31,4 34,0 37,9 41,3 45,4 48,3 56,9 14,26 15,57 17,71 19,77 22,5 24,6 28,3 32,5 35,1 39,1 42,6 46,7 49,6 58,3 14,95 16,31 18,19 20,6 23,4 25,5 29,3 33,5 36,2 40,3 43,8 48,0 50,9 59,7 71 Приложение 4 Статистические данные № 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Год 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2008 2008 2008 2008 2008 2008 2008 2008 2008 2008 2008 Квар Ме Ставка по Бивалютна тал сяц кредитам, я корзина, % руб 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 15,7 15,7 15,6 15,5 15,4 15,1 15 14,6 14,8 14,8 14,7 15 15,2 15,1 15,2 15,3 15,5 15,6 15,8 16 16,1 16,6 17,7 29,67306 29,86859 29,9159 29,91245 29,91271 29,899 29,81084 29,7973 29,75509 29,61971 29,61592 29,61835 29,67782 29,74544 29,62434 29,61066 29,65655 29,51 29,42013 29,5997 30,25538 30,37231 30,67904 РЦ на бензин , руб/л 20,15 21,19 21,19 21,1 21,2 21,45 21,86 22,3 22,15 21,88 21,27 21,43 21,52 21,7 21,89 22,54 23,23 24,01 24,81 25,14 25,02 24,95 24,25 Инфляция Среднедушевой ,% доход, руб/месяц 1,68 1,11 0,59 0,57 0,63 0,95 0,87 0,09 0,79 1,64 1,23 1,13 2,31 1,2 1,2 1,42 1,35 0,97 0,51 0,36 0,8 0,91 0,83 8347,32 10313,03 11130,02 11665,35 11738,87 12395,18 12528,69 12617,10 12843,32 13071,10 14115,56 19625,86 10425,80 12901,60 13311,50 14745,00 14344,90 15159,30 15635,80 16011,10 15090,90 15240,90 15513,00 Общие Продажи Продажи Численность продажи зарубежн отечествен населения автомоби ых авто ных авто лей 117256 72845 44411 142,8 130675 90270 40405 142,8 179057 126007 53050 142,8 201867 140852 61015 142,8 204478 137970 66508 142,8 199013 136831 62182 142,8 211110 139316 71794 142,8 218150 140018 78132 142,8 205658 144108 61550 142,8 229804 151137 78667 142,8 222537 157142 65395 142,8 242537 174007 68530 142,8 174488 113303 61185 142,8 220953 156077 64876 142,8 258033 184819 73214 142,8 292662 200269 92393 142,8 283554 199733 83821 142,8 273909 201979 71930 142,8 275090 199076 76014 142,8 244274 175449 68825 142,8 249918 179465 70453 142,8 243719 169052 74667 142,8 201243 136512 64731 142,8 72 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 2008 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 2011 2011 2011 2011 2011 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 18,1 19,4 19,8 20,2 20,2 20,1 20,5 20,2 20,3 20,1 19,8 19,7 19,2 20,3 19,2 18,8 18,5 18,5 18,1 18 17,9 18 18 17,7 16,7 17,5 17,5 17,6 17,4 17,2 32,58015 37,15372 40,30411 39,42265 38,39669 37,20951 36,67074 37,28956 37,70004 37,16315 35,84349 35,30141 36,2037 35,56952 35,17493 34,31618 33,70965 33,95777 34,29493 34,4558 34,33911 34,98837 35,61605 36,09066 35,32371 34,59543 34,13134 33,56455 33,69482 33,3713 22,84 21,92 21,22 20,6 20,08 18,77 20,37 21,82 22,7 23,4 23,5 23,5 23,39 23,09 22,91 22,7 23,14 23,53 23,94 24,04 24,31 24,49 24,55 24,82 25,07 25,48 25,76 25,44 25,52 26,35 0,69 2,37 1,65 1,31 0,69 0,57 0,6 0,63 0 -0,03 0 0,29 0,41 1,64 0,86 0,63 0,29 0,5 0,39 0,36 0,55 0,84 0,5 0,81 1,08 2,37 0,78 0,62 0,43 0,48 19959,50 11254,10 15077,90 15863,50 17028,50 16583,70 17291,40 17187,30 16236,70 16767,80 17716,00 17323,40 24460,50 13699,00 17052,80 17687,40 19116,20 17900,40 19053,40 18985,10 18137,20 18526,10 19609,60 19585,30 28173,20 15108,80 18909,10 19113,90 20872,00 19101,70 212359 118054 134926 136914 136343 120387 120767 117264 111514 119640 116676 105300 128132 74114 92130 126761 165554 158980 175989 177192 169775 186731 189278 189732 204588 128270 166158 223843 235815 235455 159661 82960 99391 98041 93019 83563 81881 74123 71912 79249 77274 71802 86159 50031 64875 83019 100218 101033 110762 110459 109820 121529 120848 123326 134387 82593 116664 160119 164325 168852 52698 35094 35535 38873 43324 36824 38886 43141 39602 40391 39402 33498 41973 24083 27255 43742 65336 57947 65227 66733 59955 65202 68430 66406 70201 45677 49494 63724 71490 66603 142,8 142,7 142,7 142,7 142,7 142,7 142,7 142,7 142,7 142,7 142,7 142,7 142,7 142,8 142,8 142,8 142,8 142,8 142,8 142,8 142,8 142,8 142,8 142,8 142,8 142,9 142,9 142,9 142,9 142,9 73 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 2011 2011 2011 2011 2011 2011 2011 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 17,1 17,3 17,1 17 17 17,1 17,1 17,7 17,8 18,1 18,5 18,6 18,4 19 19,1 19,6 19,7 19,9 19,7 20,8 20,5 20,4 20,2 20,1 19,3 19,3 18,7 18,6 17,9 17,8 33,51141 33,3101 34,35833 35,80259 36,57828 35,79206 35,99251 35,30355 34,20401 33,58691 33,68649 34,69095 36,62899 35,89642 35,38304 35,5433 35,26594 35,4013 35,04646 34,74866 34,75854 34,91116 35,59357 35,46199 36,9364 37,27327 37,94988 37,49837 37,34103 37,81337 26,94 27,17 27,66 27,83 28,12 28,26 28,33 28,3 28,26 28,29 28,4 28,75 28,96 28,99 29,03 29,26 29,93 30,34 30,4 30,46 30,68 30,82 30,91 30,88 30,85 30,83 31,37 32,02 32,55 32,68 0,23 -0,01 -0,24 -0,04 0,48 0,42 0,44 0,5 0,37 0,58 0,31 0,52 0,89 1,23 0,1 0,55 0,46 0,34 0,54 0,97 0,56 0,34 0,51 0,66 0,42 0,82 0,14 0,21 0,57 0,56 21278,90 21207,50 19953,10 20376,20 20727,10 21309,90 31568,00 15963,40 20258,10 20690,80 22190,20 21140,10 23960,20 22875,60 23239,00 23230,70 23178,40 24886,80 35364,00 17588,40 23128,90 24542,90 26009,40 22796,50 26213,10 25716,20 25757,40 24803,10 25958,10 26876,80 246783 224858 224810 235707 240904 239563 251682 154446 207304 253100 266597 261461 272599 255926 259051 259962 254020 240577 253579 162077 210663 244225 245333 229670 241355 234567 231915 246895 234481 232009 173484 157731 155870 168116 174055 181385 189746 117184 159120 195470 200779 200972 211537 194325 191723 194159 188231 179526 193431 124552 162698 191686 188326 179695 191203 184690 180633 194575 184628 183487 73299 67127 68940 67591 66849 58178 61936 37262 48184 57630 65818 60489 61062 61601 67328 65803 65789 61051 60148 37525 47965 52539 57007 49975 50152 49877 51282 52320 49853 48522 142,9 142,9 142,9 142,9 142,9 142,9 142,9 143 143 143 143 143 143 143 143 143 143 143 143 143,3 143,3 143,3 143,3 143,3 143,3 143,3 143,3 143,3 143,3 143,3 74 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 2013 2014 2014 2014 2014 2014 2014 2014 2014 2014 2014 2014 2014 2015 2015 2015 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 17,5 18,31 18 17,78 17,74 17,67 17,53 17,53 17,39 17,66 17,6 17,72 17,37 19,46 19,21 18,68 38,35827 39,30782 41,03212 42,42333 41,77559 40,6853 40,03563 40,18003 41,49881 42,88614 45,72924 51,37721 61,61731 69,73618 68,46774 62,63551 32,63 32,51 32,49 32,76 32,25 33,42 33,62 33,87 34,56 35,1 35,47 35,74 35,61 35,41 35,17 35,17 0,51 0,59 0,7 1,02 0,9 0,9 0,62 0,49 0,24 0,65 0,82 1,28 2,62 3,85 2,22 1,21 38712,00 18682,70 24890,20 24464,00 28335,00 26084,00 27567,40 28143,80 28581,20 26937,20 27846,30 28943,20 41073,40 13833,20 27666,30 27251,30 264257 152662 206526 243332 226526 201487 199398 180767 172016 197233 211365 229439 270653 115561 128333 139850 210774 123135 167826 196307 178737 158245 159357 143875 136240 151333 160167 186649 220201 93718 98707 104251 53483 29527 38700 47025 47789 43242 40041 36892 35776 45900 51198 42790 50452 21843 29626 35599 143,3 143,7 143,7 143,7 143,7 143,7 143,7 143,7 143,7 143,7 143,7 143,7 143,7 144,1 144,1 144,1 75