(8) анализ (2015)

реклама
ТЕМЫ на промежуточную
аттестацию в среде тестирования
СИТО:
1. Основные понятия и категории
статистики;
2. Сводка и группировка;
3. Абсолютные, относительные и
средние величины в статистике;
4. Меры вариации;
5. Выборочное наблюдение.
ЛЕКЦИЯ № 8
КОРРЕЛЯЦИОННОРЕГРЕССИОННЫЙ
АНАЛИЗ.
МОДЕЛИРОВАНИЕ
СВЯЗЕЙ.
Астафурова И.С.
Компетенции:

В области оценки влияния
признаков:
выявления зависимого и независимого
признака, поиска аналитического
выражения зависимости признаков,
характеризующих реальные социальноэкономические процессы;
выбор уравнения для эмпирических
данных и его оценка (адекватность
построенной модели);
по различным позициям оценка
выявленной связи: наличие, направление,
сила и теснота.
§ 1. ОСНОВНЫЕ ПОНЯТИЯ
функциональная
С изменением значений
переменных (xi)
другая переменная (y)
изменяется
определённым образом
(по определённому
закону)
статистическая
Связь между величинами, при
которой с изменением значений
одной переменной вторая с
определённой вероятностью
принимает значения в определённых
границах, а другие статистические
величины , например, средние, могут
изменяться по определённому закону
~
y  f ( x1 , x2 ,..., xn ) y  f ( x1 , x2 ,..., xn )
Корреляционная связь
Классификация
корреляционных связей
в зависимости
от направления действия
по аналитическому
выражению
по количеству
факторов
прямые
прямолинейные
однофакторные
обратные
криволинейные
многофакторные
ПРЯМАЯ
~
~
x1  x2  y1  y2
~
~
x1  x2  y1  y2
ОБРАТНАЯ
ПРЯМОЛИНЕЙНАЯ
ЗАВИСИМОСТЬ ВЫРАЖЕНА
УРАВНЕНИЕМ ЛИНЕЙНОЙ
ЗАВИСИМОСТИ:
~
y  a0  a1  x1  a2  x2  ...  an  xn
ЗАВИСИМОСТЬ ВЫРАЖЕНА
УРАВНЕНИЕМ ДРУГОЙ ФУНКЦИИ
КРИВОЛИНЕЙНАЯ
ОДИН ФАКТОР
~y  f ( x )
~y  f ( x , x ,..., x )
1 2
n
МНОГО
ФАКТОРОВ
§ 2. Статистические методы
моделирования связей
метод сопоставления параллельных
рядов;
метод аналитических группировок;
корреляционнорегрессионный анализ;
некоторые непараметрические методы
(для оценки связи атрибутивных
признаков).
Метод сопоставления
параллельных рядов
Позволяет установить наличие
связи между признаками,
направление связи.
Для этого факторы располагают
по возрастанию или убыванию
и прослеживают изменение
величины результата.
Метод сопоставления
параллельных рядов
Объем
произведенной
продукции, тыс.у.е.
3- 7
7-14
14-23
23-33
33-56
АСТАФУРОВА И.С.
средняя заработная
плата в группе, тыс.
руб.
13,5
14,2
14,4
14,6
15,1
Метод аналитических
группировок
Для изучения влияния фактора
группировки используются общая,
межгрупповая и средняя
из внутригрупповых дисперсий.
С их помощью можно оценить
направление, силу и тесноту
связи, но нельзя построить
аналитическое выражение
этой связи
Метод аналитических
группировок
Средняя
величина затрат,
тыс.руб.
100-120
Сумма прибыли,
тыс.руб.
120-150
47,8
150-165
40,6
165-200
35,4
АСТАФУРОВА И.С.
50,1
Корреляционнорегрессионный анализ
(КРА)
•Корреляционный анализ
измеряет тесноту известной связи
между факторами и результатом,
оценивает факторы, оказывающие
наибольшее влияние.
•Регрессионный анализ
осуществляет выбор модели связи,
определяет расчётные значения
функции, устанавливает степень
влияния признаков
Корреляционно -регрессионный
анализ
осуществляет построение
аналитического выражения
зависимости признаков,
оценивает это аналитическое
выражение, оценивает
существующие между факторами
и результатом связи, рассчитывает
теоретические значения функции
УРАВНЕНИЕ КОРРЕЛЯЦИИ
ЭТО- математическое выражение
связи признаков, которое
представляет собой приближение
(аппроксимацию) изменений
условной средней величины
результативного признака с
изменением факторов
~
y  f ( x1 , x2 ,...xn )
~y  f ( x )
Виды уравнений парной
корреляции
~
1. y  a  b  x
2
~
2. y  a  b  x  c  x
~
3. y  a  b  log x
b
~
4. y  a 
x
и т.д.
Для определения
параметров a и b в
уравнении линейной
парной корреляции
применяют метод
наименьших квадратов,
решают систему
линейных неоднородных
уравнений:
n  a  b  xi  yi
a  xi  b  xi  xi  yi
2
( xi  x )  ( yi  y )
b
2
( xi  x )
a  y b x
Экономический смысл
параметров уравнения
линейной корреляции
b
a
b
Вариация результата
на
единицу вариации
фактора
Минимальное значение
фактора, при котором
возможно изменение
результата
Экономический смысл
параметров уравнения
линейной корреляции
b0
b0
Последовательность
выполнения
корреляционнорегрессионного
анализа
1. Графическое изображение
исходных данных в виде
сглаженной линии для выбора типа
модели;
2. Расчёт параметров в
аналитическом выражении типа
модели (уравнении);
3. Проверка адекватности
(соответствия) фактических
данных - построенной модели;
4. Оценка силы и тесноты связи с
помощью коэффициентов.
Коэффициенты
для определения
силы, тесноты и
направления
связи
( yi  ~
yi ) 2
,
Коэффициент детерминации:   1 
2
( yi  y )
Подкоренное выражение показывает долю
вариации результата под влиянием вариации
фактора – теснота связи
Линейный коэффициент корреляции – сила связи
по специальной шкале :
( xi  x )  ( yi  y )
rxy 
, где
n  x  y
( xi  x ) 2
 ( yi  y ) 2
x 
; y 
n
n
Шкала Чеддока
rxy
сила
связи
0,1-0,3
0,3-0,5
0,5-0,7
0,7-0,9
слабая умеренная заметная сильная
0,9-0,99
очень
сильная
ПРОВЕРКА
АДЕКВАТНОСТИ
ЛИНЕЙНОЙ
КОРРЕЛЯЦИОННОЙ
МОДЕЛИ
Состоит в проверке
равенства
коэффициентов:
  rxy
Пример
№ банка
Сумма
представленных
кредитов, млн.руб.
Сумма полученной
прибыли, млн.руб.
1
2
3
4
5
6
7
8
9,4
11,2
12,1
15,2
13,0
15,9
12,8
13,6
1,41
1,70
1,80
2,37
1,96
2,35
1,84
2,04
Найти:
•корреляционную
зависимость признаков;
•оценить адекватность
построенной модели;
•оценить направление,
силу и тесноту связи
признаков.
ЗАВИСИМОСТЬ ПРИБЫЛИ КОММЕРЧЕСКИХ
БАНКОВ ОТ КРЕДИТНЫХ ОПЕРАЦИЙ
2,50
2,37
1,80
2,00
1,50
1,84
1,96
2,35
2,04
1,70
1,41
1,00
0,50
0,00
9,4
11,2
12,1
12,8
13,0
13,6
15,2
15,9
№ банка
1
2
3
7
5
8
4
6
Итого:
в среднем на
1 банк
Сумма представленных Сумма полученной прибыли,
кредитов, млн.руб.
млн.руб.
9,4
11,2
12,1
12,8
13
13,6
15,2
15,91
103,21
1,41
1,7024
1,8029
1,8432
1,963
2,04
2,3712
2,35468
15,49
12,90125
1,9359225
( xi  x )2
12,25875156
2,894251563
0,642001562
0,010251562
0,009751563
0,488251563
5,284251563
9,052576563
30,64
( xi  x ) *
( yi  y )
( yi  y ) 2
1,841386153
0,397280153
0,106584278
0,009388153
0,002673903
0,072724153
1,000594153
1,259936628
4,69
0,276594476
0,054532758
0,017694986
0,008597462
0,000733191
0,010832126
0,189466502
0,175357844
0,73
~
y  a b x
a  y b x
a  0,039
( xi  x )  ( yi  y )
b
( xi  x ) 2
b  0,153
~
y  0,039  0,153  x
№ банка
1
2
3
7
5
8
4
6
Итого:
в среднем на
1 банк
Сумма представленных Сумма полученной прибыли,
кредитов, млн.руб.
млн.руб.
9,4
11,2
12,1
12,8
13
13,6
15,2
15,91
103,21
1,41
1,7024
1,8029
1,8432
1,963
2,04
2,3712
2,35468
15,49
12,90125
1,9359225
~
y x ( yi  ~y ) 2
1,399930241
1,67548499
1,813262365
1,920422545
1,95103974
2,042891323
2,287828878
2,396519918
15,49
0,0001014
0,000724418
0,000107379
0,005963322
0,000143048
8,35975E-06
0,006950744
0,001750579
0,02
Сумма представленных Сумма полученной прибыли,
кредитов, млн.руб.
млн.руб.
№ банка
1
2
3
7
5
8
4
6
Итого:
в среднем на
1 банк
rxy 
9,4
11,2
12,1
12,8
13
13,6
15,2
15,91
103,21
1,41
1,7024
1,8029
1,8432
1,963
2,04
2,3712
2,35468
15,49
12,90125
1,9359225
( xi  x )  ( yi  y )
( xi  x )  ( yi  y )
2
2
~
( yi  yi )
  1
( yi  y ) 2
2
( xi  x )2
12,25875156
2,894251563
0,642001562
0,010251562
0,009751563
0,488251563
5,284251563
9,052576563
30,64
( xi  x ) *
( yi  y )
( yi  y ) 2
1,841386153
0,397280153
0,106584278
0,009388153
0,002673903
0,072724153
1,000594153
1,259936628
4,69
0,276594476
0,054532758
0,017694986
0,008597462
0,000733191
0,010832126
0,189466502
0,175357844
0,73
rxy  0,98921
  0,98921
~
y  0,039  0,153  x
  0,98921
 100%  97,85%
2
Связь– очень сильная;
Теснота связи – почти 98%
изменений прибыли зависит от
размеров кредитных операций
Увеличение суммы кредитных операций
На 1ооо рублей приводит к увеличению
прибыли на 153 рубля
Направление связи – прямое.
ВЫВОДЫ
I. Для изучения влияния фактора на результат в статистике
применяют парную линейную корреляцию и методы
корреляционного и регрессионного анализа;
II. Для оценки тесноты связи используют коэффициент
детерминации;
III.Для оценки силы связи используют коэффициент
корреляции или теоретическое корреляционное отношение и
шкалу Чеддока;
IV.Для уравнения парной линейной корреляции если b >0, то
связь- прямая, если b <0, то связь- обратная;
V. Применение корреляционно-регрессионного анализа
начинается с построения графического изображения
зависимости и выбора типа связи.
САМОСТОЯТЕЛЬНО
ИЗУЧИТЬ:
НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ
ОЦЕНКИ СВЯЗИ МЕЖДУ
АТРИБУТИВНЫМИ ПРИЗНАКАМИ;
ПОНЯТИЕ АВТОКОРРЕЛЯЦИИ И ЕЁ
ИСПОЛЬЗОВАНИЕ ПРИ ОЦЕНКЕ
АДЕКВАТНОСТИ УРАВНЕНИЙ
КОРРЕЛЯЦИИ;
МЕТОДЫ ОЦЕНКИ АДЕКВАТНОСТИ
УРАВНЕНИЙ ПАРНОЙ КОРРЕЛЯЦИИ.
b
~
y a
x
1. По направлению связи;
2. По аналитическому
выражению;
3. По величине вариации;
4. По количеству факторов;
5. По графическому
изображению.
Если факторы располагают
по возрастанию или убыванию
и прослеживают изменение
величины результата, то какой
из статистических методов
использован?
Какие из уравнений определяют
корреляционную зависимость?
1) y  a  b * x1  c * x2
b
~
4) y  a  x
y  58  897 * x
2)
~
y  a  b * x  c * x2
5)
3)
~
y  1,23  0,15 * x
a2
~
6) y  a0  a1 * x  x
Если
фактор – выручка от
реализации,
результат – средняя
заработная плата
продавца, коэффициент
детерминации – 0,5, то
сделайте вывод о силе и
тесноте связи.
~y  2,15  0,46  x
Какие из уравнений определяют
линейную зависимость?
1) y  a  b * x1  c * x2
b
~
4) y  a  x
y  58  897 * x
2)
~
y  a  b * x  c * x2
5)
3)
~
y  1,23  0,15 * x
a2
~
6) y  a0  a1 * x  x
Какие из уравнений определяют
функциональную зависимость?
1) y  a  b * x1  c * x2
2)
2
~
y  a  b* x  c* x
3)
~
y  1,23  0,15 * x
b
~
4) y  a  x
5)
y  58  897 * x
a2
~
6) y  a0  a1 * x  x
Какие из уравнений определяют
многофакторную модель?
1) y  a  b * x1  c * x2
b
~
y

a

4)
x
y  58  897 * x
2)
~
y  a  b * x  c * x2
5)
3)
~
y  1,23  0,15 * x
a2
~
6) y  a0  a1 * x  x
Для каких уравнений можно
определить направление
связи?
1) y  a  b * x1  c * x2
2)
2
~
y  a  b* x  c* x
3)
~
y  1,23  0,15 * x
b
~
4) y  a  x
5)
y  58  897 * x
a2
~
6) y  a0  a1 * x  x
СПАСИБО
ЗА
ВНИМАНИЕ!
Скачать