Лекция №8, пример отбора факторов во множественной регрессии

реклама
Лекция № 4
множественная регрессия и
корреляция.
(продолжение)
• Стандартизованные коэффициенты
связаны с коэффициентами парной
корреляции следующими формулами
1 
ry x 1  ry x 2 r x 1 x 2
2 
1 r
2
x1x 2
ry x 2  ry x 1 r x 1 x 2
1 r
2
x1x 2
Индекс множественной
корреляции
• Оценивает тесноту совместного влияния
факторов на результат
(0;1)
Свойство: значение R должно быть
больше или равно максимальному
парному индексу корреляции
• Коэффициент детерминации R2
показывает долю объясненной
дисперсии зависимой переменной.
• Низкое значение R2 не свидетельствует
о низком качестве модели, и может
объяснятся наличием существенных
факторов, не включенных в модель
• Скоректированный R2 показывает
долю объяснённой дисперсии с
учетом числа факторов
m
2
R R 
(1  R )
n  m 1
2
2
ЧАСТНАЯ КОРРЕЛЯЦИЯ
• Частные коэффициенты (или индексы)
корреляции характеризуют тесноту
связи между результатом и
соответствующим фактором при
неизменном уровне других факторов,
включенных в уравнение регрессии
• (-1;1)
• Порядок частного коэффициента
корреляции определяется количеством
факторов, влияние которых исключается.
• Например, ryx1  x 2 — коэффициент
частной корреляции первого порядка.
ryx2  x1х3 x 4 
• Коэффициенты частной корреляции
ryxi x1 x2  x p 
ryxi x1 x2  x p1  ryx p x1 x2 x p1  rxi x p x1 x2 x p1
(1  r
2
yx p  x1 x2  x p1
)  (1  r
2
xi x p  x1 x 2  x p1
)
При двух факторах и i = 1 данная
формула примет вид:
ryx1  x2 
ryx1  ryx2  rx1x2
(1  r )  (1  r
2
yx2
2
x1 x2
.
)
• Соответственно при i = 2 и двух факторах
частный коэффициент корреляции у с фактором
х2 можно определить по формуле
ryx2 x1 
ryx2  ryx1  rx1x2
(1  r )  (1  r )
2
yx1
2
x1 x2
.
ОЦЕНКА НАДЕЖНОСТИ
РЕЗУЛЬТАТОВ МНОЖЕСТВЕННОЙ
РЕГРЕССИИ И КОРРЕЛЯЦИИ
• 1)
n  m 1
F 

2
1 R
m
R
2
• 2) Частный F-критерий оценивает
статистическую значимость присутствия
каждого фактора в уравнении
Fчаст x1
Ryx2 1x2  ryx2 2 n  m  1


2
1  Ryx1x2
m
Fчаст x2
Ryx2 1x2  ryx2 1 n  m  1


2
1  Ryx1x2
m
• если Fxi>Fтабл то приходим к выводу о
целесообразности включения в
уравнение фактора xi.
• 3) значимость коэффициентов чистой регрессии
оценивается с помощью t-критерия Стьюдента и
доверительных интервалов.
Частные уравнения регрессии
• Частное уравнение регрессии связывает
результативный фактор с фактором xi при
фиксировании остальных экзогенных
переменных
yxi  x1x2...xi1xi1.....x p  f ( xi )
• На основе линейного уравнения
множественной регрессии
y  a  b1  x1  b2  x 2    b p  x p
• могут быть найдены частные уравнения
регрессии
 y x1  x , x3
2

 y x2  x1 , x3


y
 x p  x1, x2
x p
 f ( x1 ),
xp
 f ( x2 ),
x p 1
 f ( x p ),
• Частные уравнения регрессии имеют
следующий вид:
 yx1  x , x3  x p
2

 yx2  x1 , x3  x p


y
 x p  x1, x2 x p1
 a  b1 x1  b2 x2  b3 x3 
 bp x p ,
 a  b1 x1  b2 x2  b3 x3 
 bp x p ,
 a  b1 x1  b2 x2  b3 x3 
 bp x p ,
или
yxi  x1x2....xi1xi1...x p  Ai  bi xi
где
Ai  a  b1 x1  ...  bi 1 xi 1  bi 1 xi 1  ...b p x p
• частные уравнения регрессии
характеризуют изолированное влияние
фактора на результат
• Частный коэффициент эластичности
Э y x  bi
i
xi
yˆ xi  x1 x2....xi1 xi1...x p
Фиктивные переменные во
множественной регрессии.
Предположим, что по группе лиц изучается
линейная зависимость потребления кофе
от цены.
В общем виде зависимость имеет вид:
y a b x
где у – количество потребляемого кофе;
х – цена.
• Аналогичные уравнения могут быть
найдены отдельно для лиц мужского
пола:
y1  a1  b1  x1
• женского пола
y2  a2  b2  x2
• возможно построение общего уравнения
регрессии с включением в него фактора
“пол” в виде фиктивной переменной.
y  a1  z1  a2  z 2  b  x
• где z1 и z2 - фиктивные переменные,
принимающие значения :
1  мужской пол
z1  
0  женский пол
0  мужской пол
z2  
1  женский пол
• На практике количество фиктивных
переменных в модели на 1 меньше чем
число градаций признака.
• Например, при исследовании заработной платы
y от уровня образования можно рассматривать 3
значения признака х ( начальное, среднее,
высшее (учитывается наивысшее из имеющихся
у работника образований)
Фиктивные переменные:
1  начальное
z1  
0  другое
1  среднее
z2  
0  другое
z1
z2
1
0
0
1
0
0
Скачать