Методические указания по построению модели линейной

реклама
ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Методические рекомендации по выполнению задач
Определение: Уравнение вида 𝑦 = 𝑎𝑥 + 𝑏 + 𝜀 называется уравнением
линейной регрессии, где y – зависимая (результирующая переменная), x независимая переменная (регрессор), a и b – параметры, 𝜀 - ошибка.
Модель линейной регрессии (линейное уравнение) является наиболее
простым и распространенным видом зависимости между экономическими
переменными. Кроме того, построение уравнения линейной регрессии может
служить начальной точкой эконометрического анализа.
Одна из задач линейного регрессионого анализа состоит в том, чтобы
по имеющимся статистическим данным (xi, yi, i = 1, 2, 3, … n) для
переменных X и Y получить наилучшие оценки неизвестных праметров a и b
и построить модель .
Для расчета модели необходимо найти параметры модели а и b.
Наиболее простым и теоретически обоснованным является метод
наименьших квадратов (МНК). Оценки коэффициентов регресии, наиденные
МНК, обладают рядом оптимальных свойств.
Рассмотрим на примере применение МНК к построению модели
линейной регрессии.
Пример. Построить линейную модель связи между стоимостью основных
производственных фондов и среднесуточной производительностью основных
предприятий региона N.
Стоимость основных
Среднесуточная производительность
фондов
(Y, тонн)
(X, млн. руб.)
Пред. 1
Пред. 2
Пред. 3
Пред. 4
Пред. 5
Пред. 6
Пред. 7
Пред. 8
Пред. 9
Пред. 10
2
2,1
2,3
2,4
2,9
3,3
3,8
4,6
5,1
5,4
18,6
19,1
20,2
20,7
22,3
25,4
29,6
30,2
34
35,7
1) Построим поле корреляции, на котором отразим табличные данные:
40
35
30
25
20
#REF!
15
10
5
0
0
2
4
6
2) Расcчитаем параметры линейной регрессии:
̅̅̅̅̅−𝑥̅ ∙𝑦̅
𝑥∙𝑦
𝑎МНК = ̅̅̅̅2 )2 и 𝑏 = 𝑦̅ − 𝑎МНК ∙ 𝑥̅ , где
𝑥 −(𝑥̅
𝑥̅ =
𝑦̅ =
∑10
𝑖=1 𝑥𝑖
- среднее значение независимой переменной,
10
∑10
𝑖=1 𝑦𝑖
- среднее значение зависимой переменной,
10
∑10
𝑖=1 𝑥𝑖 ∙𝑦𝑖
̅̅̅̅̅̅
𝑥
∙𝑦 =
- среднее значение произведения независимой и зависимой
10
переменной,
10
2
̅̅̅2 = ∑𝑖=1 𝑥𝑖 - среднее значение квадрата независимой переменной.
𝑥
10
Для удобства вычислений построим таблицу, в которую внесем все
расчеты:
𝑦
1
2
18,6
2
2,1
19,1
3
2,3
20,2
4
2,4
20,7
5
2,9
22,3
6
3,3
25,4
7
3,8
29,6
8
4,6
30,2
9
5,1
34
10
5,4
35,7
Сумма
33,9
255,8
Среднее
3,39
25,58
𝑥2
𝑥
Таким образом, 𝑥̅ =
𝑦̅ =
255,8
10
4
4,41
5,29
5,76
8,41
10,89
14,44
21,16
26,01
29,16
129,53
12,953
33,9
10
= 3,39,
= 25,58,
939,52
𝑥
̅̅̅̅̅̅
∙𝑦=
= 93,952,
10
̅̅̅2 = 129,53 = 12,953,
𝑥
10
𝑎МНК =
93,952−3,39∙25,58
12,953−3,392
𝑥∙𝑦
37,2
40,11
46,46
49,68
64,67
83,82
112,48
138,92
173,4
192,78
939,52
93,952
= 4,953
𝑏 = 25,58 − 4,953 ∙ 3,39 = 8,789
Значит, уравнение линейной регрессии имеет вид: 𝒚 = 𝟒, 𝟗𝟓𝟑𝒙 + 𝟖, 𝟕𝟖𝟗.
3) Рассчитаем коэффициент детерминации 𝑅2 и вычислим ошибку
аппроксимации 𝜀, используя формулы:
2
2
∗
∑10
̅)
𝑖=1(𝑦𝑖 −𝑦
1
𝑦𝑖 −𝑦𝑖∗
𝑛
𝑦𝑖
𝑅 =
∑10
̅)2
𝑖=1(𝑦𝑖 −𝑦
𝜀 = ∙ ∑10
𝑖=1 |
,
| ∙ 100%, где 𝑦𝑖∗ = 4,953𝑥𝑖 + 8,789.
Для удобства вычислений расширим таблицу расчетов
𝑥
1
2
3
4
5
6
7
8
9
10
Сумма
Среднее
2
2,1
2,3
2,4
2,9
3,3
3,8
4,6
5,1
5,4
33,9
3,39
𝑦
𝑥2
𝑥∙𝑦
18,6
4
37,2
19,1
4,41 40,11
20,2
5,29 46,46
20,7
5,76 49,68
22,3
8,41 64,67
25,4
10,89 83,82
29,6
14,44 112,48
30,2
21,16 138,92
34
26,01 173,4
35,7
29,16 192,78
255,8 129,53 939,52
25,58 12,953 93,952
𝑦𝑖∗
𝑦𝑖∗ − 𝑦̅
(𝑦𝑖∗ − 𝑦̅)2
18,6954 -6,8846
19,1907 -6,3893
20,1813 -5,3987
20,6766 -4,9034
23,153
-2,427
25,1342 -0,4458
27,6107 2,03072
31,5731 5,9931
34,0496 8,46959
35,5355 9,95548
Таким образом, 𝑅2 =
358,387
365,076
47,3982
40,8236
29,1464
24,0438
5,89012
0,19871
4,12382
35,9172
71,7339
99,1115
358,387
𝑦𝑖 − 𝑦̅
-6,98
-6,48
-5,38
-4,88
-3,28
-0,18
4,02
4,62
8,42
10,12
(𝑦𝑖 − 𝑦̅)2
48,7204
41,9904
28,9444
23,8144
10,7584
0,0324
16,1604
21,3444
70,8964
102,4144
365,076
|
𝑦𝑖 −𝑦𝑖∗
𝑦𝑖
|
0,005127
0,004747
0,000928
0,001133
0,038253
0,010463
0,067205
0,045467
0,001458
0,004608
0,17939
0,017939
= 0,982,
𝜀 = 0,017939 ∙ 100% = 1,8%.
Коэффициент детерминации близок к 1, что соответствует линейной
взаимосвязи между переменными X и Y, ошибка апроксимации не более 2 %,
что свидетульствует о высокой точности построенной модели линейной
регрессии.
Скачать