оценка и прогнозирование спроса Доц. Касимовская Елена Николаевна 1 Простая линейная регрессия ( одна независимая переменная) У = А +bХ Y – зависимая переменная(функция) Х – независимая переменная ( аргумент) b – угол наклона= ∆У/ ∆Х Например: У – объем продаж, Х – период времени : Q = A + bt Используется для прогнозирования Стандартный пакет Excel 2 ПЕРИОД ДАННЫЕ 1 3100 2 4500 3 4400 4 5400 5 7500 6 8100 Исходные данные Excel: функция TREND ПЕРИОД ДАННЫЕ 1 3100 2 4500 3 4400 4 5400 5 7500 6 8100 7 9000 8 10000 9 11000 y = 1000x + 2000 R² = 0.9338 3 4 Пусть известны объемы продаж по периодам. Необходимо дать прогноз на 9-ий период, используя простую линейную регрессию 1 2 3 4 5 6 3100 4500 4400 5400 7500 8100 ОТВЕТ: 11000 Формула из Excel: =SUM(LINEST(B1:B6,A1:A6)*{9,1}) ЗАДАНИЕ: рассчитайте объем продаж на 11 период 5 ПЕРИОД 1 2 3 4 5 6 7 8 9 10 11 12 ФАКТ 291 320 142 198 389 412 271 305 492 518 363 388 6 ПЕРИОД 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ФАКТ 291 320 142 198 389 412 271 305 492 518 363 388 ТРЕНД Отклонение 241.46 1.205160879 259.51 1.233074197 277.57 0.511589237 295.62 0.669781305 313.67 1.2401516 331.72 1.241997196 349.78 0.774781079 367.83 0.829190392 385.88 1.275004077 403.93 1.282389093 421.99 0.860218083 440.04 0.881741107 458.09 476.14 1 2 3 4 1 2 3 4 1 2 3 4 1 2 Ср. Сезон индекс Тренд с сезон сост 1.240105519 1.252486829 0.715529466 0.793570934 1.240105519 1.252486829 0.715529466 0.793570934 1.240105519 1.252486829 0.715529466 0.793570934 1.240105519 568.0810645 1.252486829 596.3632829 7 8 Ценовые и неценовые факторы спроса ( несколько аргументов) Y = A + b1 + b1 X1 + b2 X2 +…… + bn Xn Где X1 , X2 ... Xn – различные факторы, определяющие поведение спроса ( цена, доход, цены на сопряженные товары и пр.); знак (+/-) перед b определяет характер связи функции и аргумента ( прямая или обратная) Количественное значение факторов – результат статистической обработки первичных данных 9 У (зависимая переменная) – стоимость офисного здания 4 независимых переменных: Х1 – площадь в кв.м., Х2- количество офисов, Х3количество входов в здание, Х4- возраст здания( в годах) Случайная выборка 11 зданий из 1500. Цель – определить зависимость цены здания от выявленных переменных 10 Floor space (x1) 2310 2333 2356 2379 2402 2425 2448 2471 2494 2517 2540 Formula =LINEST(E2: E12,A2:D12, B Offices (x2) 2 2 3 3 2 4 2 2 3 4 2 C Entrances (x3) 2 2 1.5 2 3 2 1.5 2 3 4 3 D Age (x4) 20 12 33 43 53 23 99 34 23 55 22 E Assessed value (y) 142,000 144,000 151,000 150,000 139,000 169,000 126,000 142,900 163,000 169,000 149,000 11 1 2 3 4 5 А mn sen r2 F ssrg В mn-1 Sen-1 sev df ssresid С … … D m2 se2 E m1 se1 F b seb 12 y = 27.64*x1 + 12,530*x2 + 2,553*x3 - 234.24*x4 + 52,318 Результаты: -234.2371645 2553.21066 12529.7682 27.6413874 52317.8305 13.26801148 530.669152 400.066838 5.42937404 12237.3616 0.996747993 970.578463 #N/A #N/A #N/A 459.7536742 6 #N/A #N/A #N/A 1732393319 5652135.32 #N/A #N/A #N/A 13 Используя полученную модель, можно рассчитать стоимость здания площадью 2500 кв.м., с тремя офисами и двумя входами, построенное 25 лет назад: y = 27.64*2500 + 12530*3 + 2553*2 234.24*25 + 52318 = $158,261 Можно рассчитать коэффициенты эластичности(чувствительности) цены по каждому параметру, например: E(по площади)= 27.64*2500/158258= 0,44 14 Прямая зависимость между ценой на здание и: ◦ Площадью ◦ Количеством офисов ◦ Количеством входов Обратная зависимость между ценой и временем постройки 15 R2 – коэффициент детерминации: показывает, какая часть изменения зависимой переменной вызвана изменением всех объясняющих переменных в уравнении ( чем ближе к 1, тем лучше) F-статистика: измеряет статистическую значимость всего уравнения ( т.е. Модели). Проверяется по таблицам критических значений при заданном уровне достоверности ( зависит от числа наблюдений и количества независимых параметров). См. пример Стандартные ошибки и t-статистики: значение tстатистики получают путем деления коэффициента переменной на стандартную ошибку. Проверяется по таблицам критических значений при заданном уровне достоверности ( зависит от числа наблюдений и количества независимых параметров). В большинстве случаев – «правило двух»: если значение больше двух, параметр признается значимым 16 R2 = 0,99,т.е. Параметры уравнения почти на 100% объясняют изменение в цене F-статистика : очень большая, критическое значение при 11 наблюдениях и 4-х переменных =3.36 ( при уровне достоверности 95%), т.е. Построенное нами уравнение статистически значимо t-статистика: -17.6542781 4.81130409 31.3191871 5.0910818 4.27525411 что значительно больше двух, т.е. Все параметры значимы 17 Проблема идентификации Мультиколлинеарность: если независимые переменные связаны между собой, то мы получим искаженную картину ( например, доход и образование как переменные). Если F-статистика хорошая, а t-статистика нет, то вероятна мультиколлинеарность. Нужно провести корреляционный анализ ( коэф. Пирсона и\или Спирмена). Одну из переменных надо будет удалить. Автокорреляция ( или корреляция внутри ряда наблюдений) – некая систематическая связь между зависимой и независимой переменной ( например, циклическая\сезонная). Используют показатель\статистику Дарбина-Уотсона ( таблицы критических значений). Или применяют дополнительные методы обработки данных, как то выделение данной циклической составляющей и ее учет в прогнозах, выводах и пр. 18 19 На основе приводимых далее данных построить регрессионную модель Выделить значимые факторы ( объяснить почему) Рассчитать значения эластичностей по кадому фактору для уровня цены=25 Построить функцию спроса с учетом только значимых параметров и на ее основе определить уровень цен, при которых доход фирмы будет максимальным 20 объем продаж (цена тыс. за штук) шт сезон (зима 1-лето 0) доход(ср\мес тыс.руб))цена сопр товара ( за шт в руб.) 100 40 1 50 5 230 20 0 60 6 160 20 1 100 3 260 17 0 100 7 215 17 0 40 8 178 23 0 80 7 280 10 1 80 6 220 14 1 100 9 165 35 1 60 5 120 35 0 50 6 130 32 0 60 7 240 13 1 100 4 158 30 0 100 5 269 10 1 40 5 220 13 1 80 6 178 38 1 80 3 168 37 0 100 8 209 16 1 60 7 198 19 1 50 5 157 40 0 60 6 203 29 1 100 4 220 22 1 100 6 Y=241.7 246 16 1 40 7 t= 6 178 38 0 80 5 140 42 0 80 8 168 34 0 100 4 129 32 0 60 5 206 25 1 70 6 245 22 1 50 8 256 20 1 120 6 21