В соответствии с учебным планом и рабочей программой по дисциплине «Эконометрика» каждый студент, обучающийся по направлению 080100.62 – экономика должен выполнить в VI семестре одну домашнюю контрольную работу (№ 1). Задания контрольной работы ориентированы на освоение начального курса эконометрики. Изучение этой дисциплины предполагает приобретение студентами опыта построения эконометрических моделей, принятия решения о спецификации и идентификации модели, оценки параметров модели, интерпретации результатов, получения прогнозных оценок. Контрольная работа № 1 «Парная регрессия и корреляция» содержит 5 заданий. Перед выполнением заданий контрольной работы рекомендуется ознакомиться /1/ с соответствующими темами указанного раздела эконометрики: – линейная модель наблюдений; – оценка существенности параметров линейной регрессии и корреляции; – нелинейная связь между переменными; – интервалы прогноза по линейному уравнению регрессии; – нелинейная регрессия; – корреляция для нелинейной регрессии; – средняя ошибка аппроксимации. В данных методических указаниях в краткой форме приведены основные понятия перечисленных тем, предложен пример выполнения контрольной работы В конце методических указаний содержатся варианты заданий контрольной работы №1 и основные статистико– математические таблицы, необходимые для решения задач. 1. Однофакторный регрессионно-корреляционный анализ экономической модели Уравнение связи двух переменных у и х y f (x) называется уравнением парной регрессии (однофакторной моделью). Переменную y при этом называют результативным признаком (эндогенной переменной), а переменную х – факторным признаком (экзогенной переменной). Пусть имеется n значений переменных у и х: уi и хi (i = 1, 2 ,…, n). Разместив на плоскости в прямоугольной системе координат точки (хi, уi) с абсциссами хi и ординатами уi , получим диаграмму регрессии (поле корреляции). Эти точки будут образовывать облако рассеяния, вытянутое в некотором направлении. По виду поля корреляции формулируют гипотезу о форме связи. Различают линейные и нелинейные регрессии. Линейная модель наблюдений имеет вид у i (а b хi ) i , (i = 1, 2,…, n). Нелинейные регрессии делятся на два класса: – регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам. Например, полиномы разных степеней у а bx cx 2 , у а bx cx 2 dx 3 , b ; x – регрессии нелинейные по оцениваемым параметрам. Например, степенная функция у аx b , равносторонние гиперболы у а показательная функция у аb x , экспоненциальная функция у e a bx . Построение уравнения регрессии сопровождается оценкой его параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). Согласно МНК, среди всех возможных значений параметров и , претендующих на роль оценок параметров а и b, следует выбрать такую пару , , для которой 2 ( у i у i ) 2 min ( у i у i ) 2 . n n i 1 i 1 n , i 1 Иначе говоря, выбирается такая пара параметров , , для которой сумма квадратов невязок оказывается наименьшей. Для линейных и приводимых к линейным нелинейных уравнений, заданное условие приводит к системе нормальных уравнений n n n x i y i , i 1 i 1 n n n i 1 i 1 i 1 xi xi2 xi yi . решая которую, имеем где cov( x, y ) у х у х , у х , var( x) х2 х 2 n х xi i 1 n – среднее значение последовательности х1, х2,…, хn, n у уi i 1 n – среднее значение последовательности у1, у2,…, уn, n var( x) ( xi x ) 2 i 1 – выборочная дисперсия, n n соv( x, y ) ( xi x )( у i у ) i 1 – выборочная ковариация. n Для любой точки (хi, уi) на диаграмме рассеяния можно записать уi y ( уi уi ) ( уi y ) , где у i х i – ордината точки линии регрессии (модели), имеющей абсциссу хi. Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной. Возведем обе части последнего представления в квадрат и просуммируем левые и правые части полученных для каждого из i равенств соответственно, получим n ( уi i 1 n n n y ) 2 ( у i y i ) 2 ( у i y ) 2 2 ( у i y i ) ( у i y ) . Рассмотрев сумму i 1 n ( уi i 1 i 1 i 1 y i )( у i y ) более подробно, можно показать, что она в силу системы нормальных уравнений равна нулю. Тогда n ( уi i 1 общая сумма квадратов отклонений TSS сумма квадратов отклонений, объясненная регрессией ESS n n y ) 2 ( уi y ) 2 ( уi yi ) 2 i 1 (1) i 1 остаточная сумма квадратов отклонений RSS Выражение (1) представляет собой разложение полной суммы квадратов на сумму квадратов, объясненную моделью, и остаточную сумму квадратов. Долю дисперсии, объясняемую регрессией в общей дисперсии результативного признака у, характеризует коэффициент (индекс) детерминации R 2 n ( у i y ) 2 ESS R 2 i n1 . TSS 2 ( уi y) i 1 Этот коэффициент изменяется в пределах от 0 (при 0 , т.е. RSS = TSS) до 1 (при RSS = 0). Таким образом, 0 R2 1. Значение R 2 тем выше, чем больше доля объясненной моделью суммы квадратов ESS по отношению к полной сумме квадратов TSS. Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции ryx для линейной регрессии ( 1 r 1 ) rхy х cov( x, y) у х у х , у х у х у где y , x – средние квадратические ошибки выборки величин х и у, и индекс корреляции хy – для нелинейной регрессии ( 0 хy 1 ) ( уi yi ) 2 ( уi y) n ху 1 i 1 n . 2 i 1 Чем ближе значение коэффициента (или индекса) корреляции к единице, тем теснее корреляционная связь. Заметим, что коэффициент детерминации есть квадрат коэффициента или индекса корреляции. Средний коэффициент эластичности для рассматриваемой парной модели регрессии рассчитывается по формуле Э yх f ( x) х у и показывает, на сколько процентов в среднем по совокупности изменится результативный признак у от своей средней величины при изменении факторного признака х на один процент. Бета–коэффициент показывает, на какую часть величины своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднего квадратического отклонения и задается формулой yх x . y После того, как построено уравнение регрессии, необходимо провести оценку значимости как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии часто делается с помощью F – критерия Фишера. При этом выдвигается нулевая гипотеза Н0 о том, что коэффициент регрессии равен нулю ( = 0) и тем самым предполагается, что фактор х не оказывает влияния на результат у. Существует равенство между числом степеней свободы общей и факторной с остаточной суммами квадратов. Имеем два соответствующих друг другу равенства n n i 1 i 1 n ( у y ) 2 ( у y) 2 ( у y) 2 , i 1 n – 1 = 1 + (n –2). Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или дисперсию D на одну степень свободы n Dобщ ( у y) 2 i 1 n 1 n , Dфакт ( у y) 2 i 1 1 n , Dост ( у y) 2 i 1 n2 . Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим F – критерий F Dфакт Dост rxy2 1 rxy2 (n 2) . Разработаны таблицы (см. приложение) критических значений F – критерия при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Вычисленное значение F – критерия признается достоверным (отличным от единицы), если оно больше табличного (Fфакт>Fтабл,). В этом случае нулевая гипотеза Но об отсутствии связи признаков отвергается. Если же его величина окажется меньше табличной (Fфакт<Fтабл,), то вероятность нулевой гипотезы Но выше заданного уровня значимости (например = 0,05) и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым, Но не отклоняется. Оценка значимости уравнения регрессии обычно дается в виде таблицы 1 дисперсионного анализа Таблица 1 Источники вариации Число степене й свобод ы Сумма квадратов отклонений n–1 ( у y) 2 Dобщ i 1 ( у y) 2 ( у y) 2 i 1 n 1 1 i 1 n–2 i 1 Dфакт 1 n ( у y) 2 n Остаточная n ( у y) 2 n Объясненная F – отношение таблич. факт при =0,05 n n Общая Дисперсия на одну степень свободы Dост i 1 ( у y) 2 i 1 n2 В линейной регрессии обычно оценивается не только уравнение в целом, но и отдельные его параметры. С этой целью по каждому из параметров определяется его стандартная ошибка: m, m. Стандартная ошибка коэффициента регрессии определяется по формуле n m ( y y) 2 (n 2) i 1 n (x x) где n (x x) 2 i 1 2 ост 2 ост 2 ост x n , i 1 Dост – остаточная дисперсия на одну степень свободы n ост ( yi yi ) 2 i 1 n2 . Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t – критерия Стьюдента t , m которое затем сравнивается с табличным значением (см. приложение) при определенном уровне значимости и числе степеней свободы (n – 2). 2 Можно показать справедливость равенства t F . Если фактическое значение t – критерия превышает табличное, то гипотезу о существенности коэффициента можно отклонить. Границы доверительного интервала коэффициента регрессии определяются как t m . Стандартная ошибка параметра определяется по формуле n ( y y) 2 i 1 m n2 n n x2 i 1 n n ( x x ) 2 ост 2 i 1 Процедура оценивания x2 ост i 1 n n ( x x ) 2 n x2 i 1 n x . i 1 существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется t – критерий: t , его m величина сравнивается с табличным значением при (n –2) степенях свободы и заданном уровне значимости . Границы доверительного интервала параметра определяются как t m . Предельная ошибка каждого показателя имеет вид t табл m , tтаблm . Значимость линейного коэффициента корреляции проверяется по коэффициента корреляции m rху При этом, t r rxy m rху 1 rxy2 n2 величине ошибки . – фактическое значение t – критерия Стьюдента. Данная формула свидетельствует о том, что в парной линейной регрессии t r F , и t t 2 r 2 . Т.о., проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности уравнения регрессии. Если значение t r значительно превышает табличное значение при заданном уровне значимости , то коэффициент корреляции существенно отличен от нуля, и построенная модель является достоверной. Рассмотренная оценка коэффициента корреляции рекомендуется к применению при большом числе наблюдений и если r не близок к +1 или –1. Фактические значения результативного признака у отличаются от теоретических значений у , рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, лучше качество модели. Величина отклонений фактических и расчетных значений результативного признака ( у у ) по каждому наблюдению представляет ошибку аппроксимации. Их число соответствует объему совокупности. Отклонения ( у у) несравнимы между собой. Так, если для одного наблюдения ( у у) 5 , а для другого оно равно 10, то это не означает, что во втором случае модель дает вдвое худший результат. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям. Чтобы иметь общее представление о качестве модели, из относительных отклонений по каждому наблюдению определяют среднюю ошибку аппроксимации – среднее отклонение расчетных значений от фактических 1 n у yi 1 n А i 100 % Ai 100 % . n i 1 у i n i 1 Допустимый предел значений А – не более 8–10%. Прогнозное значение ур определяется путем подстановки в уравнение регрессии у х х соответствующего (прогнозного) значения хр. Средняя стандартная ошибка прогноза определяется по формуле m y p ост 1 ( x p x )2 1 . n n 2 ( xi x ) i 1 Границы доверительного интервала прогноза определяются как y p y p , где y p t табл m y p – ошибка прогноза. 2. Типовой пример выполнения контрольной работы № 1 Задача По территориям региона приводятся данные за 199Х год (табл.2). Требуется: 1. Построить поле корреляции. 2. Для характеристики зависимости у от х: а) построить линейное уравнение парной регрессии у от х; б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации; в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации; г) дать оценку силы связи с помощью среднего коэффициента эластичности и бета – коэффициента; д) оценить статистическую надежность результатов регрессионного моделирования с помощью F – критерия Фишера. е) оценить статистическую значимость параметров регрессии и корреляции. 3. Проверить результаты, полученные в п. 2 с помощью ППП Excel. 4. Рассчитать параметры показательной парной регрессии. Проверить результаты с помощью ППП Excel. Оценить статистическую надежность указанной модели с помощью F – критерия Фишера. 5. Обоснованно выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости = 0,05. Таблица 2 Средне душевой № региона 1 2 3 4 5 6 7 8 9 10 11 12 прожиточный минимум в день, руб . Среднедневная зарплата, руб. х у 78 82 87 79 89 106 67 88 73 87 76 115 133 148 134 154 162 195 139 158 152 162 159 173 Решение 1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной системе координат точки (хi, уi) (рис 1.) Поле корреляции 250 200 150 100 50 60 80 100 120 Рисунок 1 2. Для расчета параметров линейной регрессии строим расчетную таблицу 3 Таблица 3 2 а) Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 3, имеем ух ух х2 х 2 13844 155,75 85,58 0,92 , 7492,25 85,58 2 у х 155,8 0,92 85,58 76,976 . Тогда линейное уравнение парной регрессии имеет вид у 76,976 0,92 х . Оно показывает, что с увеличением среднедушевого прожиточного минимума на 1 руб. средняя зарплата возрастает в среднем на 0,92 руб. 2 б) Тесноту линейной связи оценим с помощью линейного коэффициента парной корреляции rхy х 12,95 0,92 0,721 . у 16,53 Найдем коэффициент детерминации R 2 rхy2 0,5198 . Это означает, что почти 52% вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума. 2 в) Для оценки качества полученной модели найдем среднюю ошибку аппроксимации А 1 n уi yi 1 n 69,025 100% Ai 100% % 5,752% . n i 1 уi n i 1 12 В среднем, расчетные значения отклоняются от фактических на 5,752%. Качество построенной модели оценивается как хорошее, т.к. значение А – менее 8 %. 2 г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности Э yх f ( x) х х 0,92 85,58 0,5057 . у х 76,976 0,92 85,58 Т.о., в среднем на 0,5% по совокупности изменится среднедневная зарплата от своей средней величины при изменении среднедушевого прожиточного минимума в день одного трудоспособного на 1%. Бета–коэффициент yх x 12,95 0,92 0,72 , y 16,53 показывает, что среднее квадратическое отклонение среднедневной зарплаты изменится в среднем на 72% от своего значения при изменении прожиточного минимума в день одного трудоспособного на величину его среднего квадратического отклонения. 2 д) Для оценки статистической надежности результатов используем F – критерий Фишера. Выдвигаем нулевую гипотезу Но о статистической незначимости полученного линейного уравнения. Рассчитаем фактическое значение F – критерия при заданном уровне значимости = 0,05 Fфакт rxy2 1 rxy2 (n 2) 0,52 2 1 0,52 2 (12 2) 10,828 . Сравнивая табличное Fтабл=4,96 и фактическое Fфакт 10,828 значения, отмечаем, что Fфакт Fтабл , что указывает на необходимость отвергнуть выдвинутую гипотезу Но. 2 е) Оценку статистической значимости параметров регрессии проведем с помощью t – статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигаем гипотезу H0 о статистически незначимом отличии показателей регрессии от нуля: = = rxy = 0. Табличное значение t – статистики tтабл для числа степеней свободы df = n – 2 = 12 – 2 = 10 при заданном уровне значимости = 0,05 составляет 2,23. Определим величину случайных ошибок ост m n x2 i 1 n x 12,55 89907 24,212 , 12 12,95 m m rху ост x n 1 rxy2 n2 12,55 0,28 , 12,95 12 1 0,52 0,219 . 12 2 Найдем соответствующие фактические значения t – критерия Стьюдента t 76,976 0,92 3,291 , t 3,179 , m 0,28 m 24,212 tr rxy m rху 0,721 3,291 . 0,219 Фактические значения t – статистики превосходят табличное значение tтабл= 2,23 t 3,291 t табл , t 3,179 t табл , t r 3,291 t табл , поэтому гипотеза H0 о статистически незначимом отличии показателей регрессии от нуля отклоняется, т.е. параметры , и rxy не случайно отличаются от нуля, а статистически значимы. Для расчета доверительных интервалов для параметров и определим их предельные ошибки t табл m 2,23 24,212 53,947 , tтаблm 2,23 0,28 0,623 . Доверительные интервалы для параметра : (23,029; 130,923), для параметра : (0,297; 1,5436). С вероятностью р = 1 – = 1 – 0,05 = 0,95 можно утверждать, что параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля. 3. Проверим результаты, полученные в п. 2 с помощью ППП Excel. Параметры парной регрессии вида у х определяет встроенная статистическая функция ЛИНЕЙН. Порядок вычисления следующий: 1) ведите исходные данные или откройте существующий файл, содержащий анализируемые данные; 2) выделите область пустых ячеек 5х2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики; 3) активизируйте Мастер функций любым из способов: а) в главном меню выберете Вставка/Функция; б) на панели Стандартная щелкните по кнопке Вставка функции (рис. 4) (в результате появится диалоговое окно Мастер функций (рис. 2)); 4) в окне Категория (рис. 2) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК (в результате появится диалоговое окно ввода аргументов функции ЛИНЕЙН (рис. 3)); Рисунок 2. Диалоговое окно «Мастер функций» Рисунок 3. Диалоговое окно ввода аргументов функции ЛИНЕЙН 5) заполните аргументы функции (рис. 3): Известные значения у – диапазон, содержащий данные результативного признака; Известные значения х – диапазон, содержащий данные факторов независимого признака; Константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается свободным образом, если Константа = 0, то свободный член равен 0; Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет; если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения Щелкните кнопкой ОК; 6) в левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу. Нажмите клавишу <F2>, а затем – на комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>. Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме (табл. 4) Таблица 4 Значение коэффициента Значение коэффициента Среднее квадратическое отклонение Среднее квадратическое отклонение Коэффициент детерминации R2 Cреднеквадратическое отклонение у F – статистика Число степеней свободы Регрессионная сумма квадратов Остаточная сумма квадратов Для данных рассматриваемого примера результат вычисления функции ЛИНЕЙН представлен на рис. 4 Мастер функции Рисунок 4. Результат вычисления функции ЛИНЕЙН Замечание С помощью инструмента анализа данных Регрессия, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий следующий: 1) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Настройки. Установите флажок Пакет анализа (рис. 5); Рисунок 5. Подключение надстройки Пакет анализа 2) в главном меню выберите Сервис/Анализ данных/Регрессия (рис. 6). Щелкните по кнопке ОК; Рисунок 6. Диалоговое окно Анализ данных 3) заполните диалоговое окно ввода данных и параметров вывода (рис. 7): Входной интервал Y – диапазон, содержащий данные результативного признака; Входной интервал Х – диапазон, содержащий данные факторов независимого признака; Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет; Константа – нуль – флажок, указывающий на наличие или на отсутствие свободного члена в уравнении; Входной интервал – достаточно указать левую верхнюю ячейку будущего диапазона; Новый рабочий лист – можно задать произвольное имя нового листа. Если необходимо получить информацию и графики остатков, установите соответствующие флажки в диалоговом окне. Щелкните кнопкой ОК. Рисунок 7. Диалоговое окно ввода параметров инструмента Регресси Результаты регрессионного представлены на рис. 8 анализа для данных рассматриваемой Рисунок 8. Результаты применения инструмента Регрессия задачи Сравнивая полученные вручную и с помощью ППП Excel. правильности выполненных действий. данные, убеждаемся в 4. Построению показательной модели у х (2) предшествует процедура линеаризации переменных. Прологарифмируем обе части уравнения (2), получим ln у ln х ln . (3) Введем обозначения Y ln у , C ln , В ln . Тогда уравнение (3) запишется в виде Y C Вх. (4) Параметры полученной линейной модели (4) рассчитываем аналогично тому, как это было сделано выше. Используем данные расчетной таблицы 5 Таблица 5 Построим линейное уравнение парной регрессии Y по х. Используя данные таблицы 5, имеем В Y X Y X X X 2 2 432 ,528 85,58 5,043 0,0056 , 7492 ,3 85,58 2 C Y В X 5,0428 0,0056 85,58 4,559 . Получим линейное уравнение регрессии Y 4.559 0,0056 х . (5) Тесноту полученной линейной модели характеризует линейный коэффициент парной корреляции rхy В х 12,95 0,0056 0,706 . Y 0,104 Коэффициент детерминации при этом равен R 2 rхy2 0,4986 . Это означает, что почти 50% вариации фактора Y объясняется вариацией фактора х. Средняя ошибка линейной аппроксимации составляет 1 n уi yi 1 n 1,149 А 100% Ai 100% % 0,0957 % . n i 1 уi n i 1 12 Проведя потенцирование уравнения (5), получим искомую нелинейную (показательную) модель у 95,5328 х1,0056 . (6) Результаты вычисления параметров показательной кривой (2) можно проверить с помощью ППП Excel, для чего используем встроенную статистическую функцию ЛГРФПРИБЛ. Порядок вычисления аналогичен применению функции ЛИНЕЙН. В результате применения функции ЛГРФПРИБЛ дополнительная регрессионная статистика будет выводиться в порядке, указанном выше (табл. 4), причем в первой строке таблицы (рис. 9) функция ЛГРФПРИБЛ возвращает коэффициенты показательной модели (2), остальные параметры соответствуют линейной модели (4) (рис. 9). Рисунок 9. Результат вычисления функции ЛГРФПРИБЛ индекса корреляции вспомогательной таблицей 6 Для расчета хy Таблица 6 нелинейной регрессии воспользуемся ( уi yi ) 2 ( уi y) 2 n ху 1 i 1 n 1 1572 ,8455 0,7215 . 3280 ,25 i 1 Найдем коэффициент детерминации R 2 2хy 0,7215 2 0,52051 . Это означает, что 52% вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума. Рассчитаем фактическое значение F – критерия при заданном уровне значимости = 0,05 Fфакт 2xy 1 2xy (n 2) 0,7215 2 1 0,7215 2 (12 2) 10,855 . Сравнивая табличное Fтабл=4,96 и фактическое Fфакт 10,855 значения, отмечаем, что Fфакт Fтабл , что указывает на необходимость отвергнуть гипотезу Но о статистически незначимых параметрах уравнения (6). 5. Так как коэффициенты детерминации, соответствующие линейной и показательной моделям практически равны (около 52% вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума в обеих моделях), то нет весомых оснований отдать предпочтение какой либо модели. Тем не менее, прогнозное значение результата 2 2 рассчитаем по показательной модели ( R лин 0,5198 < Rпоказ 0,52051 ). По условию задачи прогнозное значение фактора выше его среднего уровня х 85,58 на 5%, тогда оно составляет х р 1,05 х 1,05 85,58 89,86 , и прогнозное значение зарплаты при этом составит у р 95,5328 х1,0056 95,5328 89,861,0056 158,69 руб. Найдем ошибку прогноза m y p ост 1 (x p x)2 1 1 (89,86 85,58) 2 n 1 13,1081 n 12 2012 ,917 2 ( xi x ) i 1 и доверительный интервал прогноза при уровне значимости = 0,05. Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит у р t табл m у р 2,23 13,1081 29,2067 . Доверительный интервал прогноза (60,6558; 119,0692). 3. Варианты заданий контрольной работы №1 В таблице 7 приведены данные по территориям региона за 199Х год. Число k рассчитывается по формуле k = 100 + 10i + j, где i, j – две последние цифры зачетной книжки соответственно. Требуется: 1. Построить поле корреляции. 2. Для характеристики зависимости у от х: а) построить линейное уравнение парной регрессии у от х; б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации; в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации; г) дать оценку силы связи с помощью среднего коэффициента эластичности и бета – коэффициента; д) оценить статистическую надежность результатов регрессионного моделирования с помощью F – критерия Фишера. е) оценить статистическую значимость параметров регрессии и корреляции. 3. Проверить результаты, полученные в п. 2 с помощью ППП Excel. 4. Рассчитать параметры показательной парной регрессии. Проверить результаты с помощью ППП Excel. Оценить статистическую надежность указанной модели с помощью F – критерия Фишера. 5. Обоснованно выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости = 0,05. № региона 1 2 3 4 5 6 7 Среднедушевой прожиточный минимум в день, руб. х 97 79 86 77 104 69 100 Таблица 7 Среднедневная зарплата, руб. у k +2i k – 4j k+j k – 3i k+i k – 5i k–j 8 9 10 11 12 93 81 102 74 90 k + 2j k–i k + 4i k – 3j k Литература 1. Доугерти К. Введение в эконометрику.– М.: Финансы и статистика, 1999. 2. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс.– М.: Дело, 2001. 3. Эконометрика. Под ред. И. И. Елисеевой.– М.: Финансы и статистика, 2001. 4. Афанасьев В. Н., Юзбашев М. М. Анализ временных рядов и прогнозирование.– М.: Финансы и статистика, 2001. 5. Экономико–математические методы и прикладные модели. Под ред. В. В. Федосеева.– М.: ЮНИТИ, 2001. 5. Экономико–математические методы и модели. Под ред. А. В. Кузнецова.– Минск: БГЭУ, 2000. 4. Кулинич Е. И. Эконометрика.– М.: Финансы и статистика, 2001. Приложения Приложение 1. Критические значения t – критерия Стьюдента при уровне значимости 0,01, 0,05, 0,01 (двухсторонний) Число степеней свободы, df 0,1 0,05 0,01 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 6,3137 2,9200 2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125 1,7959 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 12,7062 4,3027 3,1824 2,7765 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281 2,2010 2,1788 2,1604 2,1448 2,1315 2,1199 2,1098 63,6559 9,9250 5,8408 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693 3,1058 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 Число степеней свободы, df 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 0,1 0,05 0,01 1,7341 1,7291 1,7247 1,7207 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973 1,6839 1,6706 1,6576 1,6449 2,1009 2,0930 2,0860 2,0796 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423 2,0211 2,0003 1,9799 1,9600 2,8784 2,8609 2,8453 2,8314 2,8188 2,8073 2,7970 2,7874 2,7787 2,7707 2,7633 2,7564 2,7500 2,7045 2,6603 2,6174 2,5758 Приложение 2. Таблица значений F – критерия Фишера при уровне значимости = 0,05 K1 K2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 125 150 200 1 2 3 4 5 6 7 8 12 24 161,4462 199,4995 215,7067 224,5833 230,1604 233,9875 236,7669 238,8842 243,9047 249,0524 18,5128 10,1280 7,7086 6,6079 5,9874 5,5915 5,3176 5,1174 4,9646 4,8443 4,7472 4,6672 4,6001 4,5431 4,4940 4,4513 4,4139 4,3808 4,3513 4,3248 4,3009 4,2793 4,2597 4,2417 4,2252 4,2100 4,1960 4,1830 4,1709 4,1213 4,0847 4,0566 4,0343 4,0012 3,9778 3,9604 3,9469 3,9362 3,9169 3,9042 3,8884 19,0000 9,5521 6,9443 5,7861 5,1432 4,7374 4,4590 4,2565 4,1028 3,9823 3,8853 3,8056 3,7389 3,6823 3,6337 3,5915 3,5546 3,5219 3,4928 3,4668 3,4434 3,4221 3,4028 3,3852 3,3690 3,3541 3,3404 3,3277 3,3158 3,2674 3,2317 3,2043 3,1826 3,1504 3,1277 3,1108 3,0977 3,0873 3,0687 3,0564 3,0411 19,1642 9,2766 6,5914 5,4094 4,7571 4,3468 4,0662 3,8625 3,7083 3,5874 3,4903 3,4105 3,3439 3,2874 3,2389 3,1968 3,1599 3,1274 3,0984 3,0725 3,0491 3,0280 3,0088 2,9912 2,9752 2,9603 2,9467 2,9340 2,9223 2,8742 2,8387 2,8115 2,7900 2,7581 2,7355 2,7188 2,7058 2,6955 2,6771 2,6649 2,6498 19,2467 9,1172 6,3882 5,1922 4,5337 4,1203 3,8379 3,6331 3,4780 3,3567 3,2592 3,1791 3,1122 3,0556 3,0069 2,9647 2,9277 2,8951 2,8661 2,8401 2,8167 2,7955 2,7763 2,7587 2,7426 2,7278 2,7141 2,7014 2,6896 2,6415 2,6060 2,5787 2,5572 2,5252 2,5027 2,4859 2,4729 2,4626 2,4442 2,4320 2,4168 19,2963 9,0134 6,2561 5,0503 4,3874 3,9715 3,6875 3,4817 3,3258 3,2039 3,1059 3,0254 2,9582 2,9013 2,8524 2,8100 2,7729 2,7401 2,7109 2,6848 2,6613 2,6400 2,6207 2,6030 2,5868 2,5719 2,5581 2,5454 2,5336 2,4851 2,4495 2,4221 2,4004 2,3683 2,3456 2,3287 2,3157 2,3053 2,2868 2,2745 2,2592 19,3295 8,9407 6,1631 4,9503 4,2839 3,8660 3,5806 3,3738 3,2172 3,0946 2,9961 2,9153 2,8477 2,7905 2,7413 2,6987 2,6613 2,6283 2,5990 2,5727 2,5491 2,5277 2,5082 2,4904 2,4741 2,4591 2,4453 2,4324 2,4205 2,3718 2,3359 2,3083 2,2864 2,2541 2,2312 2,2142 2,2011 2,1906 2,1719 2,1595 2,1441 19,3531 8,8867 6,0942 4,8759 4,2067 3,7871 3,5005 3,2927 3,1355 3,0123 2,9134 2,8321 2,7642 2,7066 2,6572 2,6143 2,5767 2,5435 2,5140 2,4876 2,4638 2,4422 2,4226 2,4047 2,3883 2,3732 2,3593 2,3463 2,3343 2,2852 2,2490 2,2212 2,1992 2,1665 2,1435 2,1263 2,1131 2,1025 2,0836 2,0711 2,0556 19,3709 8,8452 6,0410 4,8183 4,1468 3,7257 3,4381 3,2296 3,0717 2,9480 2,8486 2,7669 2,6987 2,6408 2,5911 2,5480 2,5102 2,4768 2,4471 2,4205 2,3965 2,3748 2,3551 2,3371 2,3205 2,3053 2,2913 2,2782 2,2662 2,2167 2,1802 2,1521 2,1299 2,0970 2,0737 2,0564 2,0430 2,0323 2,0133 2,0006 1,9849 19,4125 8,7447 5,9117 4,6777 3,9999 3,5747 3,2839 3,0729 2,9130 2,7876 2,6866 2,6037 2,5342 2,4753 2,4247 2,3807 2,3421 2,3080 2,2776 2,2504 2,2258 2,2036 2,1834 2,1649 2,1479 2,1323 2,1179 2,1045 2,0921 2,0411 2,0035 1,9745 1,9515 1,9174 1,8932 1,8753 1,8613 1,8503 1,8304 1,8172 1,8008 19,4541 8,6385 5,7744 4,5272 3,8414 3,4105 3,1152 2,9005 2,7373 2,6090 2,5055 2,4202 2,3487 2,2878 2,2354 2,1898 2,1497 2,1141 2,0825 2,0540 2,0283 2,0050 1,9838 1,9643 1,9464 1,9299 1,9147 1,9005 1,8874 1,8332 1,7929 1,7618 1,7371 1,7001 1,6738 1,6542 1,6389 1,6267 1,6048 1,5902 1,5720