Федеральное государственное бюджетное образовательное учреждение высшего образования «Оренбургский государственный аграрный университет» Экономический факультет Кафедра «Статистики и экономического анализа» КОНТРОЛЬНАЯ РАБОТА по дисциплине «Эконометрика» Вариант № 1 Работу выполнила студентка Направления подготовки 38.03.01 Экономика Профиля подготовки «Финансы кредит» Артамонова В.Е. Работу проверила Кибатаева Аида Нурабековна Оренбург - 2019 и Содержание Задание 1. Парная линейная регрессия 3 Задание 2. Нелинейная регрессия 9 Задание 3. Множественная линейная регрессия 15 Список литературы 18 2 Задание 1. Парная линейная регрессия 1. Постройте поле корреляции и сформулируйте гипотезу о форме связи между темпом прироста затрат электроэнергии и темпом прироста выпуска продукции предприятия. Рисунок 1 - Поле корреляционной зависимости темпа прироста выпуска продукции от темпа прироста затрат электроэнергии По расположению точек на графике делается вывод о виде корреляционной зависимости. Анализ рисунка 1 позволяет предположить наличие прямой линейной корреляционной зависимости между темпом прироста выпуска продукции и темпом прироста затрат электроэнергии 2. Рассчитайте оценки параметров парной линейной регрессии, х – темп прироста затрат электроэнергии (%), а у– темп прироста выпуска продукции (%). Параметры а и b линейной регрессии𝑦 = 𝑎 + 𝑏𝑥 рассчитываются результате решения системы нормальных уравнений относительно а и b: ∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑥 { ∑ 𝑦𝑥 = 𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥 2 По исходным данным рассчитаем ∑ 𝑦, ∑ 𝑥,∑ 𝑥𝑦, ∑ 𝑥 2 ,∑ 𝑦 2 . Система нормальных уравнений составит: 821.1 = 12𝑎 + 472𝑏 { 36884.06 = 472𝑎 + 26749.56𝑏 3 Решаем ее методом определителей: определитель системы ∆ равен: 472 | = (12 ∗ 26749.56 − 472 ∗ 472) = 98210.72, 26749.56 ∆𝑎 821.1 472 ∆𝑎 = | | = 4554787,39, 𝑎 = ∆ = 46.38, 36884.06 26749.56 ∆𝑏 12 821 ∆𝑏 = | | = 55049.52, 𝑏 = ∆ = 0.561. 472 36884.06 ∆= | 12 472 Получаем уравнение регрессии: 𝑦̃𝑥 = 46.38 + 0.561𝑥 Этот же результат можно получить, используя следующие формулы длянахождения параметров: 𝑏= где, 𝜎𝑥2 = ∑ 𝑥2 𝑛 Получаем 𝑏 = ̅̅̅̅−𝑦̅𝑥̅ 𝑦𝑥 𝜎𝑥2 , 𝑎 = 𝑦̅ − 𝑏𝑥̅ − 𝑥̅ 2 –дисперсия по факторному признаку. 3073.67−68.43∗39.33 2229.13−39.33 = 0.561, 𝑎 = 68.43 − 0.561 ∗ 39.33 = 46.37 При решении с помощью компьютера уравнение регрессии составило: 𝑦̃𝑥 = 46.38 + 0.561𝑥 Величина коэффициента регрессии 𝑏 = 0.561означает, что с ростом темпа прироста затрат электроэнергии на 1 %, темп прироста выпуска продукции увеличивается на 0,561 % . 4 Номер предприятия 1 2 3 4 5 6 7 8 9 10 11 12 Сумма Среднее значение x y yx x^2 y^2 y͂ y-y͂ (y-y͂)^2 (y-y ср)^2 (y͂-y ср)^2 (x - x ср)^2 |(yy͂)/y|*100 6,4 12,3 13,5 19,7 20 27,1 42,5 44 56,9 66,5 72,9 90,2 472 31,7 53,3 46,2 65,7 63,3 70,2 75,1 76,3 83,2 83,2 85,1 87,8 821,1 202,88 655,59 623,7 1294,29 1266 1902,42 3191,75 3357,2 4734,08 5532,8 6203,79 7919,56 36884,06 40,96 151,29 182,25 388,09 400 734,41 1806,25 1936 3237,61 4422,25 5314,41 8136,04 26749,56 1004,89 2840,89 2134,44 4316,49 4006,89 4928,04 5640,01 5821,69 6922,24 6922,24 7242,01 7708,84 59488,67 49,97 53,27 53,94 57,42 57,59 61,57 70,20 71,04 78,27 83,65 87,24 96,94 821,1 -18,27 0,03 -7,74 8,28 5,71 8,63 4,90 5,26 4,93 -0,45 -2,14 -9,14 0 333,61 0,00 59,98 68,56 32,62 74,51 24,01 27,66 24,29 0,20 4,58 83,49 733,52 1348,73 228,77 493,95 7,43 26,27 3,15 44,56 62,02 218,30 218,30 278,06 375,39 3304,90 340,77 229,61 209,68 121,11 117,44 47,02 3,15 6,84 96,95 231,88 354,00 812,94 2571,38 1084,60 730,80 667,36 385,47 373,78 149,65 10,03 21,78 308,59 738,03 1126,72 2587,42 8184,23 57,62 0,05 16,76 12,60 9,02 12,30 6,52 6,89 5,92 0,54 2,51 10,41 141,16 39,33 68,43 3073,67 2229,13 4957,39 - - - - - - - Таблица 1 – Расчетные данные 5 Оцените тесноту связи между признаками. 3. Линейное уравнение регрессии дополняется расчетом линейного коэффициента корреляции: 𝑟𝑦𝑥 = ̅̅̅̅−𝑦̅𝑥̅ 𝑦𝑥 𝜎𝑦 𝜎𝑥 или 𝑟 = 𝑏 𝜎𝑥 𝜎𝑦 Так как 𝜎𝑥 = √2229.13 − 39.332 = 26.11, 𝜎𝑦 = √4957.39 − 68.432 = 16.59, то 26.11 𝑟 = 0.561 16.59 = 0.882, что означает тесную прямую связь рассматриваемых признаков. 4. Рассчитайте коэффициент детерминации. 2 Коэффициент детерминации составит: 𝑟𝑦𝑥 = 0.8822 = 0.778, т.е.вариация у на 77.8% объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится 22,2 %. 5. Проверьте значимость оценки коэффициента регрессии с помощью критерия Стьюдента при уровне значимости α=0,05. Оценку статистической значимости коэффициента регрессии проведем с помощью t - критерия Стьюдента. Выдвигаем две гипотезы: Н0 – коэффициент регрессии является статистически незначимым, т.е. b=0; Н1 – коэффициент регрессии статистически значим, т.е. b≠0. Определим стандартную ошибку для коэффициента регрессии mb: ∑(𝑦−𝑦̃ )2 733.5 𝑥 𝑚𝑏 = √∑(𝑥−𝑥̅ )2 (𝑛−2) = √8184.23∗10 = 0.095. Далее вычисляем значения t – критерия Стьюдента: 𝑡= 𝑏 0.561 = = 5.92 𝑚𝑏 0.095 Фактическое значение t – критерии превосходит табличное значение на 5 %-м уровне значимости при числе степеней свободы𝑛 − 2 = 10 𝑡табл = 2,228 Поэтому гипотеза Н0 отклоняется, т.е. b отличается от нуля не случайно икоэффициент регрессии является статистически значимым. 6 6. Постройте доверительный интервал для коэффициента регрессии. Рассчитаем доверительный интервал для коэффициента регрессии, для чего определим предельную ошибку для параметра b. ∆𝑏 = 𝑡табл 𝑚𝑏 = 2.228 ∗ 0.095 = 0.211 Доверительные интервалы: 𝛾𝑏 = 𝑏 ± ∆𝑏 = 0.561 ± 0.211, т.е. 0.350 ≤ 𝑏 ≤ 0.771 Анализ верхней и нижней границ доверительного интервала приводит к выводу о том, что с вероятностью 95% коэффициент регрессии, находясь в указанных границах, не принимает нулевых значение, т.е. не является статистически незначимым и существенно отличен от нуля. 7. Составить таблицу дисперсионного анализа. Результаты дисперсионного анализа приведены в таблице 2. Таблица 2 – Таблица дисперсионного анализа Вариация результата Число степеней свободы Общая Факторная Остаточная 8. Оцените 11 1 10 с Сумма квадратов отклонений Дисперсия на одну степень свободы 3304,9 2571,38 733,52 помощью F - критерий факт 35,055 табл 4,96 2571,38 27,08 F – критерия Фишера-Снедекора значимость уравнения линейной регрессии. В силу того, что 𝐹факт = 35,05 > 𝐹табл = 4,96, гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны,статистически значимы, уравнение значимо, показатель тесноты связи надежени отражает устойчивую зависимость темпа прироста выпуска продукции от темпа прироста затрат электроэнергии. 9. Рассчитайте, каковы будут темпы прироста выпуская продукции, если темп прироста затрат электроэнергии составит 39 %. 7 Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если примем прогнозное значение темпа прироста затрат электроэнергии х=38, то точечный прогноз темпа прироста выпуска продукции составит:𝑦 𝑝 = 46.37 + 0.561 ∗ 39 = 68,24 % Чтобы получить интервальный прогноз, найдем стандартную ошибку предсказываемого значения расходов 𝑚𝑝 : (𝑥 𝑝 −𝑥̅ ) 1 𝑚𝑝 = 𝑆√1 + + ∑(𝑥−𝑥̅ )2, 𝑛 Где𝑆 = √ ∑(𝑦−𝑦̃)2 𝑛−2 - стандартная ошибка регрессии. 𝑆=√ 𝑚𝑝 = 8.564√1 + 733.52 = 8.564 10 1 (39 − 39.3)2 + = 0.103 13 8184.23 Предельная ошибка прогнозируемого расхода составит: ∆𝑦𝑝 = 𝑡табл 𝑚𝑝 = 2.228 ∗ 0.103 = 0.231 Доверительный интервал прогнозируемого расхода составит: 𝑦𝑝 = 68.24 ± 0.231 Т.е. при темпе прироста затрат электроэнергии 39 %, темп прироста выпуска продукции не меньше чем 68,009 % и не больше чем 68,47 %. 10. Рассчитайте средний коэффициент эластичности. Средний коэффициент эластичности для линейной регрессии рассчитывается по формуле: Э=𝑏 𝑥̅ 39,33 = 0,561 = 0,322 𝑦̅ 68,43 Таким образом, получаем, что с ростомтемпа прироста затрат электроэнергии на 1 %, темп прироста выпуска продукции увеличивается на 0,322 %. 11. Определить среднюю ошибку аппроксимации. 8 Средняя ошибка аппроксимации находится как средняя арифметическая простая из индивидуальных ошибок: 1 𝑦−𝑦̃ 141.16 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 12 = 11.76 % Так как средняя ошибка аппроксимации меньше 10-13%, что говорит о высокой точности модели. Задание 2. Нелинейная регрессия 1. Рассчитать параметры следующих функций: - степенной; - равносторонней гиперболы; - показательной. 2. Найти показатели тесноты связи по каждой модели. 3. Оценить каждую модель через показатель детерминации, F – критерий Фишера, ошибку аппроксимации и выбрать наилучшую из них. Регрессия в виде степенной функции имеет вид:𝑦̃𝑥 = 𝑎 ∙ 𝑥 𝑏 Для оценки параметров модели линеаризуем модель путем логарифмирования: ln 𝑦 = ln 𝑎 ∙ 𝑏 𝑙𝑛 𝑥 Обозначимln 𝑦 = 𝑌 , ln 𝑎 = 𝐴, 𝑙𝑛𝑥 = 𝑋 . Тогда получим: 𝑌 = 𝐴 + 𝑏𝑋 Для расчетов составим таблицу 3. Таблица 3 - Расчетные данные для степенной функции Номер предприятия X Y XY X^2 Y^2 Y͂ y͂ (y-y͂)^2 |(y-y͂)/y|*100 1 2 3 4 5 6 7 8 9 10 11 1,856 2,510 2,603 2,981 2,996 3,300 3,750 3,784 4,041 4,197 4,289 3,456 3,976 3,833 4,185 4,148 4,251 4,319 4,335 4,421 4,421 4,444 6,416 9,978 9,976 12,474 12,426 14,027 16,193 16,403 17,868 18,557 19,060 3,446 6,298 6,774 8,884 8,974 10,887 14,059 14,320 16,332 17,617 18,396 11,946 15,808 14,692 17,515 17,205 18,074 18,652 18,789 19,547 19,547 19,748 3,653 3,880 3,912 4,043 4,048 4,154 4,310 4,322 4,411 4,465 4,497 38,603 48,415 50,003 57,003 57,302 63,666 74,414 75,314 82,334 86,907 89,720 47,657 23,861 14,463 75,645 35,976 42,693 0,471 0,973 0,749 13,740 21,341 21,777 9,165 8,232 13,238 9,475 9,308 0,914 1,293 1,040 4,455 5,428 9 12 Сумма 4,502 40,808 4,475 50,264 20,147 173,526 20,268 146,255 20,026 211,550 Среднее значение 3,401 4,189 14,460 12,188 17,629 Запишем систему { 4,571 50,264 96,593 820,273 77,318 354,887 нормальных 10,015 94,341 уравнений: 50.264 = 12𝐴 + 40.808𝑏 173.526 = 40.808𝐴 + 146.255𝑏 Отсюда ∆= 89.789, ∆𝐴 = 270.251, 𝐴 = 3.009 ∆𝑏 = 31.126, 𝑏 = 0.347. Получаем уравнение регрессии: 𝑙𝑛𝑦 = 3.009 + 0.347𝑙𝑛𝑥 Выполнив потенцирование, получим:𝑦̃𝑥 = 𝑒 3.009 ∙ 𝑥 0.347 = 20.28 ∙ 𝑥 0.347 Параметр 𝑏 = 0.347 означает коэффициент эластичности, который показывает, что с ростом темпа прироста затрат электроэнергии на 1 %, темп прироста выпуска продукции увеличивается на 0,347 %. Теоретические значения зависимой переменной 𝑦̃𝑥 получим, подставив в уравнение𝑙𝑛𝑦 = 3.009 + 0.347𝑙𝑛𝑥 значения х и потенцируя значения 𝑙𝑛𝑦̃𝑥 . В таблице 3представлены𝑙𝑛𝑦̃𝑥 = 𝑌̃𝑥 и 𝑦̃𝑥 . Показателем тесноты связи выступает индекс корреляции: 𝑅 = √1 − ∑(𝑦 − 𝑦̃)2 ∑(𝑦 − 𝑦̅)2 Величина ∑(𝑦 − 𝑦̅)2 = 3304.9 представлена в таблице 1 В результате имеем: ∑(𝑦−𝑦̃)2 𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,892 = 0,945 Коэффициент детерминации составит: 2 𝑅𝑦𝑥 = 0.9452 = 0.892, т.е.вариация у на 89.2% объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится 10.8 %. F – критерий Фишера составит: 𝐹= 𝑅2 0.892 (𝑛 − 2) = (12 − 2) = 83.12 2 1−𝑅 1 − 0.89 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии𝑦̃𝑥 = 20.28 ∙ 𝑥 0.347 статистически значимо. 10 Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3. 1 𝑦−𝑦̃ 94.341 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 12 = 7.86т.е. среднее отклонение фактических и расчетных значений у составляет 7.86 %, что свидетельствует о хорошем качестве модели. Регрессия в виде показательной функции имеет вид:𝑦̃𝑥 = 𝑎 ∙ 𝑏 𝑥 Для оценки параметров модели линеаризуем модель путем логарифмирования: ln 𝑦 = ln 𝑎 ∙ 𝑥 𝑙𝑛 𝑏 Обозначимln 𝑦 = 𝑌 , ln 𝑎 = 𝐴, 𝑙𝑛𝑏 = 𝐵 . Тогда получим: 𝑌 = 𝐴 + 𝑥𝐵 Для расчетов составим таблицу 4. Таблица 4 - Расчетные данные для показательной функции Номер предприятия x 1 2 3 4 5 6 7 8 9 10 11 12 Сумма 6,4 12,3 13,5 19,7 20 27,1 42,5 44 56,9 66,5 72,9 90,2 472 Среднее значение 39,33333 Y xY x^2 Y͂ y͂ 3,456 22,120 40,960 3,892 49,000 3,976 48,904 151,290 3,945 51,676 3,833 51,745 182,250 3,956 52,238 4,185 82,446 388,090 4,012 55,241 4,148 82,958 400,000 4,014 55,391 4,251 115,212 734,410 4,078 59,052 4,319 183,550 1806,250 4,217 67,847 4,335 190,726 1936,000 4,231 68,770 4,421 251,569 3237,610 4,347 77,251 4,421 294,013 4422,250 4,434 84,235 4,444 323,955 5314,410 4,491 89,238 4,475 403,651 8136,040 4,647 104,299 50,264 2050,848 26749,560 50,264 814,239 4,189 Запишем 170,904 y-y͂ -17,300 1,624 -6,038 10,459 7,909 11,148 7,253 7,530 5,949 -1,035 -4,138 -16,499 6,861 (y-y͂)^2 (y-y ср)^2 299,275 1348,726 2,636 228,766 36,462 493,951 109,385 7,426 62,554 26,266 124,275 3,151 52,610 44,556 56,695 62,016 35,385 218,301 1,071 218,301 17,121 278,056 272,222 375,391 1069,693 3304,903 |(yy͂)/y|*100 54,573 3,046 13,070 15,919 12,495 15,880 9,658 9,868 7,150 1,244 4,862 18,792 166,557 2229,130 систему { нормальных уравнений: 50.264 = 12𝐴 + 472𝐵 2050.84 = 472𝐴 + 26749.56𝐵 В результате:𝑙𝑛𝑎 = 3.834 𝑙𝑛𝑏 = 0.009. Получаем уравнение регрессии: 𝑙𝑛𝑦 = 3.834 + 0.009𝑥.Теперь потенцируем оба параметра, чтобы получить уравнение регрессии в формепоказательной кривой: 11 𝑎 = 𝑒 3.834; 𝑏 = 𝑒 0.009 ; 𝑎 = 46.25; 𝑏 = 1.009 𝑦̃𝑥 = 46.25 ∙ 1.009𝑥 Теоретические значения зависимой переменной 𝑦̃𝑥 получим, подставив в уравнение𝑙𝑛𝑦 = 3.834 + 0.009𝑥 значения х и потенцируя значения 𝑙𝑛𝑦̃𝑥 . Показателем тесноты связи выступает индекс корреляции: 𝑅 = √1 − ∑(𝑦 − 𝑦̃)2 ∑(𝑦 − 𝑦̅)2 Величина ∑(𝑦 − 𝑦̅)2 = 3304.9 представлена в таблице 4 В результате имеем: ∑(𝑦−𝑦̃)2 𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,676 = 0,882 Коэффициент детерминации составит: 2 𝑅𝑦𝑥 = 0.8822 = 0.676, т.е.вариация у на 67.6% объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится32.4 %. F – критерий Фишера составит: 𝐹= 𝑅2 0.676 (𝑛 (12 − 2) = 20.89 − 2) = 1 − 𝑅2 1 − 0.676 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии 𝑦̃𝑥 = 46.25 ∙ 1.009𝑥 статистически значимо. Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3. 1 𝑦−𝑦̃ 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 13.87т.е. среднее отклонение фактических и расчетных значений у составляет13.87 %, что свидетельствует о хорошем качестве модели. 𝑏 Регрессия в виде равносторонней гиперболы имеет вид:𝑦̃𝑥 = 𝑎 + 𝑥 Чтобы оценить параметры уравнения приведем модель к линейному 1 виду,заменив = 𝑧. Тогда 𝑦̃ = 𝑎 + 𝑏𝑧. Применяя МНК, получаем систему 𝑥 нормальных уравнений: 12 ∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑧 { ∑ 𝑦𝑧 = 𝑎 ∑ 𝑧 + 𝑏 ∑ 𝑧 2 Для расчета параметров составим таблицу 5. Таблица 5 - Расчетные данные для равносторонней гиперболы Номер предприятия x y 1/x=z yz z^2 y͂ y-y͂ (y-y͂)^2 1 2 3 4 5 6 7 8 9 10 11 12 Сумма 6,4 12,3 13,5 19,7 20 27,1 42,5 44 56,9 66,5 72,9 90,2 472 31,7 53,3 46,2 65,7 63,3 70,2 75,1 76,3 83,2 83,2 85,1 87,8 821,1 0,156 0,081 0,074 0,051 0,050 0,037 0,024 0,023 0,018 0,015 0,014 0,011 0,553 4,953 4,333 3,422 3,335 3,165 2,590 1,767 1,734 1,462 1,251 1,167 0,973 30,154 0,024 0,007 0,005 0,003 0,003 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,045 24,767 54,468 57,332 66,570 66,872 72,063 77,361 77,679 79,721 80,726 81,250 82,292 821,100 6,933 -1,168 -11,132 -0,870 -3,572 -1,863 -2,261 -1,379 3,479 2,474 3,850 5,508 0,000 48,068 1,364 123,911 0,757 12,756 3,470 5,114 1,902 12,103 6,118 14,826 30,336 260,723 Среднее значение 39,33 68,43 0,05 2,51 0,00 Запишем систему нормальных уравнений: { 821,1 = 12𝑎 + 0.0053𝑏 30.154 = 0.553𝑎 + 0.045𝑏 Отсюда ∆= 0.232, ∆𝐴 = 20.164, 𝐴 = 86.68 ∆𝑏 = −92.183, 𝑏 = −396.27. Получаем уравнение регрессии:𝑦̃𝑥 = 86.68 − 369.27 𝑥 Показателем тесноты связи выступает индекс корреляции: 𝑅 = √1 − ∑(𝑦 − 𝑦̃)2 ∑(𝑦 − 𝑦̅)2 Величина ∑(𝑦 − 𝑦̅)2 = 3304.9 представлена в таблице 4 В результате имеем: ∑(𝑦−𝑦̃)2 𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,921 = 0,959 13 |(y-y͂)/y|*100 21,871 2,191 24,094 1,324 5,642 2,653 3,011 1,808 4,181 2,973 4,525 6,273 80,546 Коэффициент детерминации составит: 2 𝑅𝑦𝑥 = 0.9592 = 0.921, т.е.вариация у на 92.1% объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится 7.9 %. F – критерий Фишера составит: 𝐹= 𝑅2 0.921 (𝑛 − 2) = (12 − 2) = 228.8 2 1−𝑅 1 − 0.921 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии 𝑦̃𝑥 = 86.68 − 369.27 𝑥 статистически значимо. Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3. 1 𝑦−𝑦̃ 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 6.71т.е. среднее отклонение фактических и расчетных значений у составляет 6.71 %, что свидетельствует о хорошем качестве модели. Выберем наилучшую модель, для чего объединим результаты построения парных регрессий в одну таблицу. Таблица 6 - Сводная таблица построенных уравнений Функции Степенная Показательная Равносторонняя гипербола Коэффициент детерминации 0,892 0,676 F- критерий Фишера 83,1 20,89 Средняя ошибка аппроксимации 7,86 13,87 0,921 228,8 6,71 Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать равносторонней гиперболе, длякоторой значение коэффициента детерминации наибольшее, а ошибка аппроксимации – наименьшая. 14 Задание 3. Множественная линейная регрессия В процессе изучения зависимости прибыли (тыс. руб.) у от выработки продукции на одного работника (ед.) х1 и индекса цен на продукцию (%) х2получены данные по 30 предприятиям. Признак Среднее Парный Среднее квадратическое коэффициент значение отклонение корреляции y x1 x2 250 47 112 38 ryx1=0,68 12 ryx2=0,63 21 rx1x2=0,42 Построить уравнение множественной линейной регрессии 1. стандартизованном масштабе и в естественной форме. Линейное уравнение множественной регрессии у от х1 и х2 имеет вид: 𝑦̃𝑥 = 𝑎 + 𝑏1 𝑥1 + 𝑏2 𝑥2 Для расчета его параметров применим метод стандартизации переменны и построим искомое уравнение в стандартизованном масштабе: 𝑡𝑦 = 𝛽1 𝑡𝑥1 + 𝛽2 𝑡𝑥2 Расчет β – коэффициентов выполним по формулам 𝛽1 = 𝑟𝑦𝑥1 − 𝑟𝑦𝑥2 𝑟𝑥1𝑥2 0.68 − 0.63 ∙ 0.42 = = 0.504 1 − 𝑟𝑥1𝑥2 2 1 − 0.42 𝛽2 = 𝑟𝑦𝑥2 − 𝑟𝑦𝑥1 𝑟𝑥1𝑥2 0.63 − 0.68 ∙ 0.42 = = 0.418 1 − 𝑟𝑥1𝑥2 2 1 − 0.42 Получим уравнение 𝑡𝑦 = 0.504𝑡𝑥1 + 0.418𝑡𝑥2 Для построения уравнения в естественной рассчитаем𝑏1 и 𝑏2 используя формулы для перехода от𝛽𝑖 к 𝑏𝑖 𝛽1 = 𝑏𝑖 𝑏1 = 0.504 38 12 𝜎𝑥 𝜎𝑦 ; 𝑏1 = 𝛽𝑖 𝜎𝑦 𝜎𝑥 = 1.59; 𝑏2 = 0.418 38 21 = 0.757 Значение a определим из соотношения 𝑎 = 𝑦̅ − 𝑏1 𝑥̅1 − 𝑏2 𝑥̅2 = 250 − 1.59 ∙ 47 − 0.757 ∙ 112 = 90.18 𝑦̃𝑥 = 90.18 + 1.59𝑥1 + 0.757𝑥2 15 форме Рассчитайте частные коэффициенты эластичности. 2. Рассчитаем средние коэффициенты эластичности для определения относительной силы влияния х1 и х2 на у: Э𝑦𝑥𝑗 = 𝑏𝑗 ∙ 𝑥̅𝑗 𝑦̅ 47 112 = 0.3Э𝑦𝑥2 = 0.757 ∙ = 0.339 250 250 С увеличением выработки продукции на одного работника х1 на 1% от Э𝑦𝑥1 = 1.59 ∙ ее среднего уровня прибыль у возрастет на 0,3 % от своего среднего уровня; при увеличениих2 на 1 % прибыль уувеличивается на 0,339 % от своего среднего уровня. Очевидно, что сила влияния индекса цен на продукциюх2 на прибыль у оказалась большей, чем сила влияния выработки продукции на одного работника х1. К аналогичным выводам о силе связи приходим при сравнении модулей значений β1 и β2. 3. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле: 𝑟𝑦𝑥1= 𝑟𝑦𝑥1 −𝑟𝑦𝑥2 𝑟𝑥1 𝑥2 0.68−0.63∙0.42 = =0.589 2 2 √(1−𝑟𝑦𝑥 )(1−𝑟𝑥 𝑥 ) √(1−0.632 )(1−0.422 ) 2 1 2 𝑥2 𝑟𝑦𝑥2= 𝑥1 𝑟𝑦𝑥2 −𝑟𝑦𝑥1 𝑟𝑥1 𝑥2 0.63−0.68∙0.42 = =0.515 2 2 2 √(1−𝑟2 𝑦𝑥1 )(1−𝑟𝑥1 𝑥2 ) √(1−0.68 )(1−0.42 ) При сравнении значений коэффициентов парной и частной корреляции приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают: 𝑟𝑦𝑥1 = 0.684,𝑟𝑦𝑥2 = 0.63, 𝑟𝑥1𝑥2 = 0.42 𝑟𝑦𝑥1 = 0.589,𝑟𝑦𝑥2 = 0.518, 𝑟𝑥1𝑥2 = 0.594 𝑥2 𝑥1 𝑦 16 Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и 𝑅𝑦𝑥1𝑥2 = √𝑟𝑦𝑥1 ∙ 𝛽1 + 𝑟𝑦𝑥2 ∙ 𝛽2 = √0.68 ∙ 0.504 + 0.63 ∙ 0.418 = 0.778 Зависимость у от х1 и х2 характеризуется как тесная, в которой 77.8% вариации прибыли определяются вариацией учтенных в модели факторов: выработки продукции на одного работника и индекса цен на продукцию. Прочие факторы, не включенные в модель, составляют соответственно 22.2% отобщей вариации у. 4. Оцените значимость уравнения регрессии в целом с помощью F – критерия Фишера. Общий F – критерий проверяет гипотезу Н0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2=0): 𝐹= 𝑅𝑦𝑥1𝑥2 𝑚−1 0.778 27 ÷ = ∙ = 77.5 1 − 𝑅𝑦𝑥1𝑥2 𝑛 − 𝑚 1 − 0.778 2 𝐹табл = 3.35 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 3.35.Делаем выводо статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались под неслучайным воздействием факторов 17 х1 и х2. . Список литературы 1. Гладилин, А. В. Практикум по эконометрике / А.В. Гладилин, А.Н. Герасимов, Е.И. Громов. - М.: Феникс, 2016. - 336 c. 2. Дайитбегов, Д. М. Компьютерные технологии анализа данных в эконометрике / Д.М. Дайитбегов. - Москва: ИЛ, 2015. - 592 c. 3. Колемаев, В. А. Эконометрика / В.А. Колемаев. - М.: ИНФРА- М, 2016. - 160 c. 4. Кочетыгов, А. А. Основы эконометрики / А.А. Кочетыгов, Л.А. Толоконников. - М.: Издательский центр "МарТ", 2015. - 352 c. 5. Кремер, Н. Ш. Математика для экономистов. От Арифметики до Эконометрики. Учебно-справочное пособие / Н.Ш. Кремер, Б.А. Путко, И.М. Тришин. - М.: Юрайт, 2017. - 724 c. 6. Математика для экономистов. От Арифметики до Эконометрики / Н.Ш. Кремер и др. - М.: Юрайт, 2017. - 688 c. 7. Математика для экономистов. От Арифметики до Эконометрики. - Москва: Мир, 2017. - 648 c. 8. Новак, Эдвард Введение в методы эконометрики. Сборник задач / Эдвард Новак. - М.: Финансы и статистика, 2016. - 248 c 9. (+ Плохотников, К. Э. Основы эконометрики в пакете STATISTICA CD-ROM) / К.Э. Плохотников. 18 - Москва: ИЛ, 2015. - 304 c.