ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ Методические рекомендации по выполнению задач Определение: Уравнение вида 𝑦 = 𝑎𝑥 + 𝑏 + 𝜀 называется уравнением линейной регрессии, где y – зависимая (результирующая переменная), x независимая переменная (регрессор), a и b – параметры, 𝜀 - ошибка. Модель линейной регрессии (линейное уравнение) является наиболее простым и распространенным видом зависимости между экономическими переменными. Кроме того, построение уравнения линейной регрессии может служить начальной точкой эконометрического анализа. Одна из задач линейного регрессионого анализа состоит в том, чтобы по имеющимся статистическим данным (xi, yi, i = 1, 2, 3, … n) для переменных X и Y получить наилучшие оценки неизвестных праметров a и b и построить модель . Для расчета модели необходимо найти параметры модели а и b. Наиболее простым и теоретически обоснованным является метод наименьших квадратов (МНК). Оценки коэффициентов регресии, наиденные МНК, обладают рядом оптимальных свойств. Рассмотрим на примере применение МНК к построению модели линейной регрессии. Пример. Построить линейную модель связи между стоимостью основных производственных фондов и среднесуточной производительностью основных предприятий региона N. Стоимость основных Среднесуточная производительность фондов (Y, тонн) (X, млн. руб.) Пред. 1 Пред. 2 Пред. 3 Пред. 4 Пред. 5 Пред. 6 Пред. 7 Пред. 8 Пред. 9 Пред. 10 2 2,1 2,3 2,4 2,9 3,3 3,8 4,6 5,1 5,4 18,6 19,1 20,2 20,7 22,3 25,4 29,6 30,2 34 35,7 1) Построим поле корреляции, на котором отразим табличные данные: 40 35 30 25 20 #REF! 15 10 5 0 0 2 4 6 2) Расcчитаем параметры линейной регрессии: ̅̅̅̅̅−𝑥̅ ∙𝑦̅ 𝑥∙𝑦 𝑎МНК = ̅̅̅̅2 )2 и 𝑏 = 𝑦̅ − 𝑎МНК ∙ 𝑥̅ , где 𝑥 −(𝑥̅ 𝑥̅ = 𝑦̅ = ∑10 𝑖=1 𝑥𝑖 - среднее значение независимой переменной, 10 ∑10 𝑖=1 𝑦𝑖 - среднее значение зависимой переменной, 10 ∑10 𝑖=1 𝑥𝑖 ∙𝑦𝑖 ̅̅̅̅̅̅ 𝑥 ∙𝑦 = - среднее значение произведения независимой и зависимой 10 переменной, 10 2 ̅̅̅2 = ∑𝑖=1 𝑥𝑖 - среднее значение квадрата независимой переменной. 𝑥 10 Для удобства вычислений построим таблицу, в которую внесем все расчеты: 𝑦 1 2 18,6 2 2,1 19,1 3 2,3 20,2 4 2,4 20,7 5 2,9 22,3 6 3,3 25,4 7 3,8 29,6 8 4,6 30,2 9 5,1 34 10 5,4 35,7 Сумма 33,9 255,8 Среднее 3,39 25,58 𝑥2 𝑥 Таким образом, 𝑥̅ = 𝑦̅ = 255,8 10 4 4,41 5,29 5,76 8,41 10,89 14,44 21,16 26,01 29,16 129,53 12,953 33,9 10 = 3,39, = 25,58, 939,52 𝑥 ̅̅̅̅̅̅ ∙𝑦= = 93,952, 10 ̅̅̅2 = 129,53 = 12,953, 𝑥 10 𝑎МНК = 93,952−3,39∙25,58 12,953−3,392 𝑥∙𝑦 37,2 40,11 46,46 49,68 64,67 83,82 112,48 138,92 173,4 192,78 939,52 93,952 = 4,953 𝑏 = 25,58 − 4,953 ∙ 3,39 = 8,789 Значит, уравнение линейной регрессии имеет вид: 𝒚 = 𝟒, 𝟗𝟓𝟑𝒙 + 𝟖, 𝟕𝟖𝟗. 3) Рассчитаем коэффициент детерминации 𝑅2 и вычислим ошибку аппроксимации 𝜀, используя формулы: 2 2 ∗ ∑10 ̅) 𝑖=1(𝑦𝑖 −𝑦 1 𝑦𝑖 −𝑦𝑖∗ 𝑛 𝑦𝑖 𝑅 = ∑10 ̅)2 𝑖=1(𝑦𝑖 −𝑦 𝜀 = ∙ ∑10 𝑖=1 | , | ∙ 100%, где 𝑦𝑖∗ = 4,953𝑥𝑖 + 8,789. Для удобства вычислений расширим таблицу расчетов 𝑥 1 2 3 4 5 6 7 8 9 10 Сумма Среднее 2 2,1 2,3 2,4 2,9 3,3 3,8 4,6 5,1 5,4 33,9 3,39 𝑦 𝑥2 𝑥∙𝑦 18,6 4 37,2 19,1 4,41 40,11 20,2 5,29 46,46 20,7 5,76 49,68 22,3 8,41 64,67 25,4 10,89 83,82 29,6 14,44 112,48 30,2 21,16 138,92 34 26,01 173,4 35,7 29,16 192,78 255,8 129,53 939,52 25,58 12,953 93,952 𝑦𝑖∗ 𝑦𝑖∗ − 𝑦̅ (𝑦𝑖∗ − 𝑦̅)2 18,6954 -6,8846 19,1907 -6,3893 20,1813 -5,3987 20,6766 -4,9034 23,153 -2,427 25,1342 -0,4458 27,6107 2,03072 31,5731 5,9931 34,0496 8,46959 35,5355 9,95548 Таким образом, 𝑅2 = 358,387 365,076 47,3982 40,8236 29,1464 24,0438 5,89012 0,19871 4,12382 35,9172 71,7339 99,1115 358,387 𝑦𝑖 − 𝑦̅ -6,98 -6,48 -5,38 -4,88 -3,28 -0,18 4,02 4,62 8,42 10,12 (𝑦𝑖 − 𝑦̅)2 48,7204 41,9904 28,9444 23,8144 10,7584 0,0324 16,1604 21,3444 70,8964 102,4144 365,076 | 𝑦𝑖 −𝑦𝑖∗ 𝑦𝑖 | 0,005127 0,004747 0,000928 0,001133 0,038253 0,010463 0,067205 0,045467 0,001458 0,004608 0,17939 0,017939 = 0,982, 𝜀 = 0,017939 ∙ 100% = 1,8%. Коэффициент детерминации близок к 1, что соответствует линейной взаимосвязи между переменными X и Y, ошибка апроксимации не более 2 %, что свидетульствует о высокой точности построенной модели линейной регрессии.