Министерство образования и науки РФ «Национальный исследовательский Томский политехнический университет» Институт кибернетики Кафедра прикладной математики Отчет по лабораторной работе 3 «Коэффициенты корреляции Пирсона и Спирмена» По дисциплине «Прикладная математическая статистика» Выполнила студентка гр. 8БМ21 Дядова А.В. Проверил профессор кафедры ПМ Берестнева О.Г. Томск — 2013 Постановка задачи Изучить возможности статистического пакета StatGraphics в области корреляционного анализа. С помощью пакета провести корреляционный анализ экспертных оценок показателей студентов с использованием критерия Пирсона и критерия Спирмена. Теоретические положения Корреляционный анализ Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию. Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции. Коэффициент корреляции оценивается по выборке объема n связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин X и Y. Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону. Коэффициент корреляции — параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле: rxy ( x x )( y y ) ( x x ) ( y y ) i i 2 i 2 . i Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между двумя выборками нет. Критерий Пирсона, или критерий χ² (Хи-квадрат) — наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки. Обозначим через X исследуемую случайную величину. Пусть требуется проверить гипотезу H0 о том, что эта случайная величина подчиняется закону распределения F(x). Для проверки гипотезы произведём выборку, состоящую из n независимых наблюдений над случайной величиной X. По выборке можно построить эмпирическое распределение F*(x) исследуемой случайной величины. Сравнение эмпирического распределения F*(x) и теоретического (или, точнее было бы сказать, гипотетического — то есть соответствующего гипотезе H0) распределения F(x) производится с помощью специального правила — критерия согласия. Одним из таких критериев и является критерий Пирсона. Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Ход работы Таблица 1 Переменные Сдержанность – активность в контактах с людьми жесткость – чувствительность Доверчивость – подозрительность по отношению к другим людям в общении Практичный – мечтательный стиль мышления Результаты корреляционного анализа По Пирсону Значение p жесткость – 0,4358 0,0288 чувствительность Доверчивость – подозрительность 0,2501 по отношению к 0,0130 другим людям в общении Практичный – 0,4325 мечтательный 0,0027 стиль мышления Простота – изощрённость 0,4267 0,0804 поведения в обществе Уверенность – 0,4467 неуверенность в 0,1011 себе. Доверчивость – подозрительность 0,4584 по отношению к 0,0712 другим людям в общении Практичный – 0,3077 мечтательный 0,1719 стиль мышления Простота – изощрённость 0,3584 0,0095 поведения в обществе Уверенность – 0,4735 неуверенность в 0,0092 себе. Практичный – 0,5522 мечтательный 0,0004 стиль мышления Простота – изощрённость 0,501 0,0088 поведения в обществе Уверенность – 0,4875 неуверенность в 0,0174 себе. Простота – изощрённость 0,4515 0,009 поведения в обществе По Спирмену Значение p 0.3168 0.0325 0.3745 0.002 0.3757 0.0164 0.3139 0.0444 0.4168 0.0425 0.5355 0.0006 0.4619 0.1031 0,3564 0,0049 0.4389 0.005 0,5332 0,0012 0.5745 0.002 0.5355 0.0106 0.4967 0.0063 Простота – изощрённость поведения в обществе Уверенность – неуверенность в себе. 0,4735 0,0073 0,4584 0,0020 Уверенность – неуверенность в себе. 0,2320 0,0020 0,2920 0,0109 Вывод В ходе данной работы были изучены возможности статистического пакета StatGraphics в области корреляционного анализа, с помощью пакета проведен корреляционный анализ экспертных оценок показателей студентов с использованием критерия Пирсона и критерия Спирмена. Наибольшее количество взаимосвязей с другими параметрами проявили параметры «Доверчивость – подозрительность по отношению к другим людям в общении» и «Практичный – мечтательный стиль мышления».