Лекция № 4 множественная регрессия и корреляция. (продолжение) • Стандартизованные коэффициенты связаны с коэффициентами парной корреляции следующими формулами 1 ry x 1 ry x 2 r x 1 x 2 2 1 r 2 x1x 2 ry x 2 ry x 1 r x 1 x 2 1 r 2 x1x 2 Индекс множественной корреляции • Оценивает тесноту совместного влияния факторов на результат (0;1) Свойство: значение R должно быть больше или равно максимальному парному индексу корреляции • Коэффициент детерминации R2 показывает долю объясненной дисперсии зависимой переменной. • Низкое значение R2 не свидетельствует о низком качестве модели, и может объяснятся наличием существенных факторов, не включенных в модель • Скоректированный R2 показывает долю объяснённой дисперсии с учетом числа факторов m 2 R R (1 R ) n m 1 2 2 ЧАСТНАЯ КОРРЕЛЯЦИЯ • Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при неизменном уровне других факторов, включенных в уравнение регрессии • (-1;1) • Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. • Например, ryx1 x 2 — коэффициент частной корреляции первого порядка. ryx2 x1х3 x 4 • Коэффициенты частной корреляции ryxi x1 x2 x p ryxi x1 x2 x p1 ryx p x1 x2 x p1 rxi x p x1 x2 x p1 (1 r 2 yx p x1 x2 x p1 ) (1 r 2 xi x p x1 x 2 x p1 ) При двух факторах и i = 1 данная формула примет вид: ryx1 x2 ryx1 ryx2 rx1x2 (1 r ) (1 r 2 yx2 2 x1 x2 . ) • Соответственно при i = 2 и двух факторах частный коэффициент корреляции у с фактором х2 можно определить по формуле ryx2 x1 ryx2 ryx1 rx1x2 (1 r ) (1 r ) 2 yx1 2 x1 x2 . ОЦЕНКА НАДЕЖНОСТИ РЕЗУЛЬТАТОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ • 1) n m 1 F 2 1 R m R 2 • 2) Частный F-критерий оценивает статистическую значимость присутствия каждого фактора в уравнении Fчаст x1 Ryx2 1x2 ryx2 2 n m 1 2 1 Ryx1x2 m Fчаст x2 Ryx2 1x2 ryx2 1 n m 1 2 1 Ryx1x2 m • если Fxi>Fтабл то приходим к выводу о целесообразности включения в уравнение фактора xi. • 3) значимость коэффициентов чистой регрессии оценивается с помощью t-критерия Стьюдента и доверительных интервалов. Частные уравнения регрессии • Частное уравнение регрессии связывает результативный фактор с фактором xi при фиксировании остальных экзогенных переменных yxi x1x2...xi1xi1.....x p f ( xi ) • На основе линейного уравнения множественной регрессии y a b1 x1 b2 x 2 b p x p • могут быть найдены частные уравнения регрессии y x1 x , x3 2 y x2 x1 , x3 y x p x1, x2 x p f ( x1 ), xp f ( x2 ), x p 1 f ( x p ), • Частные уравнения регрессии имеют следующий вид: yx1 x , x3 x p 2 yx2 x1 , x3 x p y x p x1, x2 x p1 a b1 x1 b2 x2 b3 x3 bp x p , a b1 x1 b2 x2 b3 x3 bp x p , a b1 x1 b2 x2 b3 x3 bp x p , или yxi x1x2....xi1xi1...x p Ai bi xi где Ai a b1 x1 ... bi 1 xi 1 bi 1 xi 1 ...b p x p • частные уравнения регрессии характеризуют изолированное влияние фактора на результат • Частный коэффициент эластичности Э y x bi i xi yˆ xi x1 x2....xi1 xi1...x p Фиктивные переменные во множественной регрессии. Предположим, что по группе лиц изучается линейная зависимость потребления кофе от цены. В общем виде зависимость имеет вид: y a b x где у – количество потребляемого кофе; х – цена. • Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: y1 a1 b1 x1 • женского пола y2 a2 b2 x2 • возможно построение общего уравнения регрессии с включением в него фактора “пол” в виде фиктивной переменной. y a1 z1 a2 z 2 b x • где z1 и z2 - фиктивные переменные, принимающие значения : 1 мужской пол z1 0 женский пол 0 мужской пол z2 1 женский пол • На практике количество фиктивных переменных в модели на 1 меньше чем число градаций признака. • Например, при исследовании заработной платы y от уровня образования можно рассматривать 3 значения признака х ( начальное, среднее, высшее (учитывается наивысшее из имеющихся у работника образований) Фиктивные переменные: 1 начальное z1 0 другое 1 среднее z2 0 другое z1 z2 1 0 0 1 0 0