Содержание Задача 1 Задача 2 Приложения Задача 1 Обследовано 50 торговых точек по объему ежедневного дохода. Данные обследования приведены в приложении 1. 1. Провести группировку торговых точек по объему ежедневного дохода. 2. Построить гистограмму, полигон, кумуляту. 3. Вычислить выборочные характеристики: a. среднее, b. дисперсию, c. среднее квадратическое отклонение, d. моду, e. медиану, f. нижний и верхний квартили, g. коэффициент вариации. 4. На основе анализа полученных данных выдвинуть гипотезу о законе распределения дохода. Решение: Количество групп определим по формуле Стерджесса: n = 1 + 3.222*lgN, где n - число групп; N - число единиц совокупности. n = 6 групп. Величина равного интервала: h = R / n, где R - размах вариации; n - число групп. h = 145.7 Получим интервалы для построения групп: 1-я группа: (638-783.67]; 2-я группа: (783.67-929.34]; 3-я группа: (929.34-1075.01]; 4-я группа: (1075.01-1220.68]; 5-я группа: (1220.68-1366.35]; 6-я группа: (1366.35-1512.02]. Построим группы: Группы торговых № группы точек по объему Число торговых точек Накопленные частоты ежедневного дохода 1 638-783.67 7 7 2 783.67-929.34 11 18 3 929.34-1075.01 15 33 4 1075.01-1220.68 12 45 5 1220.68-1366.35 4 49 6 1366.35-1512.02 1 50 50 - Итого Построим гистограмму, полигон, кумуляту. Проведем расчет выборочных характеристик. Группы торговых точек Число по объему ежедневного торговых дохода точек Середина интервала 638-783.67 7 710.84 4975.88 570611.72 7 783.67-929.34 11 856.5 9421.5 929.34-1075.01 15 1002.17 15032.55 508.09 33 1075.01-1220.68 12 1147.85 13774.2 275427 45 1220.68-1366.35 4 1293.51 5174.04 353216.26 49 1366.35-1512.02 1 1439.18 1439.18 196098.41 50 Итого 50 - 49817.35 1610999.73 - Накопленные частоты 215138.25 18 Среднее значение определим по формуле средней арифметической взвешенной: = 996.35 д. ед. Дисперсию определим по формуле: = 32219.99 д. ед. Среднее квадратическое отклонение определим по формуле: = 179.5 д. ед. Рассчитаем значение моды. Наибольшая частота: 15. Мода находится в интервале между 929.34 и 1075.01. Точное значение моды определим по формуле: = 1012.58 д. ед. Рассчитаем значение медианы. Середина ряда: 25. Медианным является интервал с накопленной частой 33. Точное значение медианы определим по формуле: = 997.32 д. ед. Определим место нижней квартили: NQ1 = (50+1) /4 = 12.75. Определим место верхней квартили: NQ3 = (50+1) /4*3 = 38.25. Квартили определим по формулам: = 783.67+145.67* ( (12.5-7) /11) = 856.51 д. ед. = 1075.01+145.67* ( (37.5-33) /12) = 1129.64 д. ед. Коэффициент вариации определим по формуле: = 18.02%. В исследуемой совокупности средний размер объема ежедневного дохода составил 996.35 д. ед. Самым распространенным значением объема ежедневного дохода является 1012.58 д. ед.50% торговых точек имеют объем ежедневного дохода более 997.32 д. ед., а 50% менее 997.32 д. ед. Полученное значение среднего квадратического отклонения говорит о том, что в среднем в исследуемой совокупности конкретные величины признака отклоняются от своего среднего значения на 179.5д. ед. 25% торговых точек имеют доход менее 856.51 д. ед.; 25% торговых точек имеют доход более 856.51 д. ед., а остальные торговые точки имеют доход в пределах от 856.51 д. ед. до 1129.64 д. ед. Так как значение коэффициента вариации меньше 33%, то исследуемую совокупность можно считать однородной. В целом на основе полученных данных можно выдвинуть гипотезу о нормальном законе распределения дохода. Задача 2 Имеются ежемесячные уровни дохода фирмы (тыс. у. е.) в 2008 г (приложение 2). 1. Графически отобразить динамику дохода. 2. Рассчитать цепные и базисные: абсолютные приросты (изменения) уровней; темпы роста; темпы прироста (снижения) уровней, средние значения ряда, темпа роста и прироста. 3. Провести сглаживание методом скользящей средней с базой равной четырем. 4. Осуществить аналитическое выравнивание сглаженной зависимости по линейному тренду. 5. Оценить адекватность и точность полученной линейной модели. 6. Осуществит точечный и интервальный прогноз дохода фирмы в январе 2009. Решение: Графически отобразим динамику дохода: группировка кумулята точечный прогноз Рассчитаем цепные и базисные показатели: Показатели январь февраль март апрель май Абсолютный уровень ряда, 25 тыс. у. е. июнь июль август сентябрь октябрь ноябрь декаб 32 40 26 32 61 49 44 55 74 73 62 Абсолютный прирост, тыс. у. е. 7 8 -14 6 29 -12 -5 11 19 -1 -11 Коэффициент роста 1.28 1.25 0.65 1.231 1.906 0.803 0.898 1.25 1.345 0.986 0.849 Темп роста, % 128 125 65 123.08 190.63 80.33 89.8 134.55 98.65 84.93 Темп прироста, % 28 25 23.077 90.625 25 19.672 10.204 34.545 -1.351 -15.0 Абсолютное значение 1% прироста, тыс. у. е. 0.25 0.32 0.4 0.26 0.61 0.55 Цепные: Базисные: -35 0.32 0.49 125 0.44 0.74 0.73 Абсолютный прирост, тыс. у. е. 7 15 1 7 36 24 19 30 49 48 37 Коэффициент роста 1.28 1.6 1.04 1.28 2.44 1.96 1.76 2.2 2.96 2.92 2.48 Темп роста, % 128 160 104 128 244 196 176 220 296 292 248 Темп прироста, % 28 60 28 144 96 76 120 196 192 148 Абсолютное значение 1% прироста, тыс. у. е. 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 4 Цепные и базисные показатели динамики были определены по следующим формулам: Далее определим средние показатели ряда динамики. Средний уровень ряда определим по формуле: = 47.75 тыс. у. е. Средний абсолютный прирост определим по формуле: = 3.36 тыс. у. е. Средний коэффициент роста определим по формуле: = 1.0859 Средний темп роста определим по формуле: = 108.59% Средний темп прироста определим по формуле: = 8.59% Среднюю величину абсолютного значения 1% прироста определим по формуле: = 0.39 тыс. у. е. Анализ полученных результатов показывает, что средний размер дохода фирмы составил 47.75 тыс. у. е. при среднемесячном увеличении на 3.36 тыс. у. е. или на 8.59%. Значение 1% прироста возросло с 0.25 до 0.73 тыс. у. е. Проведем сглаживание методом скользящей средней с базой равной четырем: Месяц Доход фирмы, тыс. у. е. Выровненные значения, тыс. у. е. январь 25 - февраль 32 30.75 март 40 32.5 апрель 26 39.75 май 32 42 июнь 61 46.5 июль 49 52.25 август 44 55.5 сентябрь 55 61.5 октябрь 74 66 ноябрь 73 - декабрь 62 - Осуществим аналитическое выравнивание сглаженной зависимости по линейному тренду. Для этого построим вспомогательную таблицу: Порядковый № значения Фактическое значение уровня ряда Квадрат Произведение порядкового порядкового № № на фактическое значение признака 1 30.75 30.75 1 2 32.5 65 4 3 39.75 119.25 9 4 42 168 16 5 46.5 232.5 25 6 52.25 313.5 36 7 55.5 388.5 49 8 61.5 492 64 9 66 594 81 Итого 426.75 2403.5 285 Система нормальных уравнений будет иметь вид: Для определения параметров уравнения подставим в приведенную систему исходные данные и получим: 426.75 = 9a0+45a1 2403.5 = 45a0+285a1 Выравняем коэффициенты при а0, разделив первое уравнение на 9, а второе на 45 и получим: 47.42 = a0+5a1, 53.41 = a0+6.33a1 Вычтем из второго уравнения первое и определим значение а1: а1 = 4.5. Подставим полученное значение а1 в одно из уравнений и определим значение а0: а0 = 24.92. Тогда уравнение будет иметь вид: = 24.92+4.5*t. Оценим адекватность и точность полученной линейной модели. № п/п yi А 1 30.75 29.42 1.7689 277.89 4.33 2 32.5 222.61 4.37 3 39.75 38.42 1.7689 58.83 3.35 4 42 42.92 0.8464 29.38 2.19 5 46.5 47.42 0.8464 0.85 1.98 6 52.25 51.92 0.1089 23.33 0.63 7 55.5 56.42 0.8464 65.29 1.66 8 61.5 60.92 0.3364 198.25 0.94 9 66 65.42 0.3364 345.22 0.88 Итого 426.75 426.78 8.8751 1221.65 20.33 - 2.26 33.92 2.0164 Среднее 47.42 - - Остаточная дисперсия: 8.8751/9 = 0.9861. Общая дисперсия: 1221.65/9 = 135.74. Систематическая дисперсия: 135.74-0.9861 = 134.7539. На систематическую дисперсию, определяемую тенденцией развития, приходится (134.7539/135.74) * 100 = 99.27% общей дисперсии, а остальные 0.73% вариации объясняются сезонными особенностями того или иного месяца и другими особенностями отдельных месяцев. Следовательно, построенную модель адекватна, точность и адекватность модели подтверждает и средняя ошибка аппроксимации = 2,26%, что существенно меньше 10%. Осуществим точечный и интервальный прогноз дохода фирмы в январе 2009 на основе полученной трендовой модели: = 24.92+4.5*10 = 69.92 тыс. у. е. Доверительный интервал прогноза определим по формуле: где L - период упреждения (L = 1); - точечный прогноз по модели на (n+L) - й момент времени, 69.92 тыс. у. е.; n - количество наблюдений во временном ряду (9); - стандартная ошибка оценки прогнозируемого показателя для числа параметров модели, равного двум; tα - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2. = 1.13. 5,59. = 62.09 тыс. у. е. = 77.75 тыс. у. е. Таким образом, с вероятностью 95% можно утверждать, что в январе 2009 г. доход фирмы составит от 62.09 тыс. у. е. до 77.75 тыс. у. е. Приложения Приложение 1 647 1010 875 1115 1124 1044 1015 985 1155 1229 1251 796 981 1293 1046 907 691 1053 770 933 899 1161 638 721 979 1144 886 1163 1512 816 875 819 1325 1085 973 1105 1203 681 1062 1049 887 867 1172 1052 783 1104 1130 839 935 992 Приложение 2 Месяц январь 25 февраль 32 март 40 апрель 26 май 32 июнь 61 июль 49 август 44 сентябрь 55 октябрь 74 ноябрь 73 декабрь 62