Лекция 3 1.8. Алгоритмы параметрических критериев. Параметрические критерии применяются для выборок с нормальным законом распределения. Формула расчета этих критериев содержат параметры выборки: среднее, дисперсии и др. Поэтому они называются параметрическими. Нормальность закона распределения должна быть статистически доказана с помощью одного из критериев согласия: критерий Пирсона, F-критерия Фишера, -критерия Колмогорова и др. В ряде случаев параметрические критерии мощнее непараметрических критериев. У последних выше вероятность возникновения ошибки второго рода – принятия ложной нулевой гипотезы. К параметрическим методам относятся следующие: – Критерий Стьюдента – Критерий Фишера – Методы однофакторного анализа – Методы двухфакторного анализа 1.9.Критерий Стьюдента Назначение. Критерий позволяет оценивать различия средних значений выборок, имеющих нормальное распределение. Описание критерия. Критерий применим для сравнения средних значений двух выборок полученных до и после воздействия некоторого фактора. Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент). Зависимые(связанные) и независимые (несвязанные) выборки При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми. Примеры зависимых выборок: пары близнецов, два измерения какого-либо признака до и после экспериментального воздействия, мужья и жёны и т. п. В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми, например: мужчины и женщины, психологи и математики. Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться. 1.9.1.Двухвыборочный t-критерий для независимых выборок Для двух несвязанных выборок(наблюдения не относятся к одной и той же группе объектов ) возможны два варианта расчета: – когда дисперсии известны – когда дисперсии неизвестны, но равны друг другу. 1. Предварительно проверяется нормальность закона распределения по одному из критериев согласия. 2. Рассчитывается средне арифметические значения X и Y для каждой выборки по 1 n формуле X xi где xi – значение i-го результата наблюдения. n i 1 3. Рассчитывается t ýěď - эмпирическое значение критерия Стьюдента: t X Y Sd Где S d S x2 S y2 2 2 квадратичного отклонения. Здесь S x и S y – оценки дисперсий. Рассмотрим сначала равночисленные выборки . В этом случае n1 n2 n Sd S S 2 x 2 y x x yi y 2 i 2 n 1n В случае наравночисленных выборок n1 n2 , выражение Sd S S 2 x 2 y x x yi y n1 n2 n1 n2 2 n1 n2 2 2 i В обоих случаев подсчет числа степеней свободы осуществляется по формулам df (n1 1) (n2 1) n1 n2 2 Понятно, что при численном равенстве выборок 2n 2 4. Эмпирическое значение t 'ýěď критерия Стьюдента сравнивается с критическим значением t 'ęđ (по таблице 1 приложения) для данного числа степеней свободы. Нулевая гипотеза H 0 при заданном уровне значимости принимается, если эмпирическое значение t 'ýěď . t ęđ . . Пример рассчитаем на лабораторной работе. Пример. Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальных группах. В экспериментальную группу (Х) входило 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог приверяет гипотезу о том , что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем та же величина у людей, не занимающихся спортом. № Группы 1 2 3 4 5 6 7 8 9 Сумма Среднее X Y 504 560 420 600 580 530 490 580 470 4734 526 580 692 700 621 640 561 680 630 5104 638 Отклонения от среднего xi x yi y Квадраты отклонений -22 34 -106 74 54 4 -36 54 -56 0 484 1156 11236 5476 2916 16 1296 2916 3136 28632 Cредне арифметические значения X и У: -58 54 62 -17 -2 -77 42 -8 0 x x 2 i y y 2 i 3368 2916 3844 289 4 5929 1764 64 18174 4734 5104 526 , в контрольной группе 638 . 9 8 X Y 526 638 112 Sd S S 2 x 2 y x x yi y n1 n2 n1 n2 2 n1 n2 2 i 2 28632 18174 8 9 736,8 27.14 892 8*9 Тогда t X Y Sd 112 4.1 27.14 Число степеней свободы k=9+8-2=15 По таблице приложения для данного числа степеней находим t ęđ 2,13 äë˙ p 0.05 2,95 äë˙ p 0.01 4,07 äë˙ p 0.001 Строим ось значимости Зона неопределенности Зона незначимости Зона значимости 0.05 t 2,13 0.01 t 2,95 t 4,07 t ýěď 4,1 Т.о. обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне или иначе говоря средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше чем в группе людей активно не занимающихся спортом. В терминах статистических гипотез это утверждение звучит так : гипотеза Н0 о сходстве отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза Н1 – о различии между экспериментальной и контрольной группой. 1.9.2. Двухвыборочный t-критерий для зависимых(связанных) выборок Под связанными выборками понимаются наблюдения для одной группы объектов, причем все наблюдения попарно связаны с каждый объектом исследования и характеризуют его состояние до воздействия и после воздействия некоторого фактора. Гипотезы H 0 : среднее значение в выборке не отличается от нуля. H 1 : среднее значение в выборке отличается от нуля. Данные в выборке измерены по шкале интервалов или по шкале отношений Сравниваемые данные должны иметь нормальный закон распределения Сравниваемых выборок две для оной группы объектов наблюдения, причем имеет место парность наблюдений в выборках. 1. Предварительно проверяется нормальность закона распределения по одному из критериев согласия. 2. Рассчитывается i xi yi (i=1..n) – попарные разности вариант, xi и yi результаты измерений для i-го объекта до и после воздействия некоторого фактора. Величину i будем считать независимой для разных объектов и нормально распределенной 3. Рассчитываются (лучше в табличной форме): сумма попарных разностей n i 1 i и 2 n вспомогательные параметры i и i . i 1 i 1 4. Рассчитывается t ýěď - эмпирическое значение критерия (n 1) степенями свободы по формуле n 2 n t i 1 n i n n i ( i ) 2 2 i 1 i 1 n 1 Где n – численность выборки. 5.Найденное эмпирическое значение t 'ýěď критерия Стьюдента сравнивается с критическим значением t 'ęđ (по таблице 1 приложения) для данного числа степеней свободы. Нулевая гипотеза H 0 при заданном уровне значимости принимается, если эмпирическое значение t 'ýěď . t ęđ . Критическое значение для выбранной вероятности и заданного числа степеней свободы можно найти по встроенной в Excel функции СТЬЮДРАСПОБР. Пример. Психолог предположил, что в результате тренировки, время решения эквивалентных задач (т.е. имеющих один и тот же алгоритм решения ) будет значительно уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задачи. Решение задачи представим в таблице. Номер испытуемого 1 2 3 4 5 6 7 8 Суммы 1 задача 4,0 3,5 4,1 5,5 4,6 6,0 5,1 4,3 37,1 3 задача 3,0 3,0 3,8 2,1 4,9 5,3 3,1 27 27,9 i ( i ) 2 1 0,5 0,3 3,4 -0,3 0,7 2,0 1,6 9,2 10 0,25 0,09 11,56 0,09 0,49 4 2,56 20,04 n t ýěď i 1 n i n n i ( i ) 2 i 1 2 i 1 9,2 8 20,04 (9.2) 8 1 2 9.2 10.81 9.2 2.8 3.2879 n 1 Число степеней свободы =8-1=7. По таблице Приложения находим t ęđ 2,37 äë˙ p 0.05 3.5 äë˙ p 0.01 5.41 äë˙ p 0.001 Строим ось значимости Зона неопределенности Зона незначимости Зона значимости 0.05 t 2,37 0.01 t ýěď 2.8 t 3,5 t 5,41 Т.о. на 5% уровне значимости, первоначальное предположение подтвердилось, действительно, среднее время решения 3-ей задачи, существенно меньше времени решения 1-ой задачи. В терминах статистических гипотез полученный результат будет звучать так: на5% уровне гипотеза Н0 отклоняется и принимается гипотеза Н1 о различиях. 1.10. Критерий Фишера. Критерий используется для сравнения дисперсий двух выборок с нормальным распределением. Сравнения дисперсий двух выборок производятся по отношению большей по величине дисперсии(записывается в числителе) к меньшей (записывается в знаменателе). Поэтому значения критерия больше или равно 1,0. Гипотезы H 0 : Дисперсия выборке 1 не отличается от дисперсии в выборке 2 H 1 : Дисперсия выборке 1 отличается от дисперсии в выборке 2 Ограничения Данные в выборках должны быть измерены по шкале интервалов или по шкале отношений. Обе сравниваемые выборки должны иметь нормальный закон распределения. Алгоритм. 1. Предварительно проверяется нормальность закона распределения по одному из критериев согласия. 2. Рассчитывается средне арифметические значения x1 и x2 для каждой выборки по 1 n формуле x xi где xi – значение i-го результата наблюдения n i 1 3. Рассчитываются значение S x21 и S x22 –дисперсии для каждой выборке по 1 n x i x 2 n i 1 4. Определяется число степеней свободы по выборкам: df1 (n1 1) - по первой выборке и df 2 (n2 1) по второй выборке. 5. Рассчитывается Fýěď - эмпирическое значение критерия по одной из формул: формуле S x2 S x21 S x22 или с учетом того, что дисперсия в числителе должна быть F ýěď S x22 S x21 больше дисперсии в знаменателе. Fýěď 6. Найденное эмпирическое значение критерия Фишера F'ýěď сравнивается критическим значением F'ęđ (по таблице 2 приложения) для данного числа степеней свободы . Если эмпирическое значение F'ýěď < F'ęđ , то нулевая гипотеза H 0 о равенстве дисперсий в выборках при заданном уровне значимости принимается. Пример. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога волнует вопрос – есть ли различия в степени однородности показателей умственного развития между классами. Решение Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице Номер учащегося 1 2 3 4 5 6 7 8 9 10 Суммы Среднее Первый класс Х 90 29 39 79 88 53 34 40 75 79 606 60,6 Второй класс Y 41 49 56 64 72 65 63 87 77 62 636 63,6 Как видно из таблицы, величины средних в обеих группах практически совпадают между собой 60.3 60.6 и величина t критерия Стьюдента оказалась равной 0,341 и незначимой. Рассчитав дисперсии S x21 515,44 S x22 158,44 Тогда S x21 515.44 Fýěď 2 3.25 S x 2 158.44 По таблице приложения 1 для F критерия при степенях свободы 10-1=9 находим Fкр. 3,18 äë˙ p 0.05 Fęđ 5.35 äë˙ p 0.01 Строим ось значимости Зона неопределенности Зона незначимости Зона значимости 0.05 Fęę 3,18 0.01 Fýěď 3.25 Fęę 5,35 Т.о. полученная величина попала в зону неопределенности. В терминах статистических гипотез можно утверждать, что Н0 (гипотеза о сходстве) м.б. отвергнута на 5% уровне значимости, а принимается в этом случае гипотеза Н1. Психолог может утверждать, что по степени однородности, такого показателя, как умственное развитие, имеется различие между выборками 2-х классов.