Загрузил syrat.valera

matematicheskie metody obrabotki dannyh

реклама
ФГБОУ ВО ТУВИНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Кафедра математики и методики преподавания математики
Ивирсина Н.Б., Танзы М.В.,
Бичи-оол Е.К., Хомушку А.М.
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ
Учебно-методическое пособие для студентов
бакалавров педагогического направления
Кызыл – 2021 г
.
УДК 51
ББК И1я73
И 25
Печатается по решению учебно-методического Совета ТувГУ
Ивирсина Н.Б.
Математические методы обработки данных: учебно-методическое пособие для студентов
бакалавров физико-математического факультета / Н.Б. Ивирсина, М.В. Танзы, Е.К. Бичи-оол,
А.М. Хомушку.: Тувинский государственный университет. – Кызыл : Издательство ТувГУ,
2021. – 129 с. – Текст : непосредственный.
Пособие предназначено для студентов бакалавров физико-математического факультета.
Содержит краткие теоретические сведения, примеры решения типовых задач, упражнения
для практических занятий, задачи для индивидуальной работы. Может быть
рекомендовано студентам всех педагогических направлений подготовки.
Рецензенты: Сотников А.И., к.ф.-м.н., старший преподаватель кафедры математики и
методики преподавания математики
Монгуш С.К. – к.п.н. заведующий кафедрой физико-математического и дистанционного
образования ТИРО и ПК
© Ивирсина Н.Б., Танзы М.В., Бичи-оол Е.К., Хомушку А.М. 2021 г.
© Тувинский государственный университет, 2021 г.
2
Оглавление
Введение ....................................................................................................................................4
Глава 1. Первоначальные понятия ..........................................................................................5
Глава 2. Выборочный метод ..................................................................................................13
Глава 3. Группировка..............................................................................................................18
Глава 4. Числовые характеристики выборки .......................................................................23
Глава 5. Общие принципы проверки статистических гипотез ...........................................30
Глава 6. Выявление различий в уровне признака ................................................................35
Глава 7. Оценка сдвига значений признака ..........................................................................43
Глава 8. Выявление различий в распределении признака ..................................................50
Глава 9. Выявление степени согласованности изменений..................................................59
Индивидуальная работа ..........................................................................................................69
Приложения ...........................................................................................................................117
Литература .............................................................................................................................128
3
ВВЕДЕНИЕ
Математические методы давно и успешно использовались в таких точных науках как
механика, физика, астрономия, находили широкое применение в технике. В последнее время
существенно расширилось приложение математики к экономике, химии и другим областям
знаний.
В процессе изучения дисциплины «Основы математической обработки информации»
студент должен осознать ее прикладной характер, уметь использовать математический
аппарат при изучении и описании практических задач. Дисциплина призвана прежде всего
ознакомить студентов с математическими методами, которые могут применяться в
дальнейшей профессиональной деятельности.
В данном пособии каждой теме предшествуют теоретические пояснения,
включающие важнейшие определения. Затем идут блоки задач, состоящие из решения
основных типовых задач и задач для самостоятельного решения. В конце пособия
представлена индивидуальная работа на 30 вариантов.
Большинство рассматриваемых методов обработки информации являются
традиционными параметрическими методами, например, t-критерий Стьюдента и метод
линейной корреляции Пирсона. Принцип каждого метода иллюстрируется графически,
чтобы знать какого рода преобразования совершаются.
Авторы признательны рецензентам за плодотворное обсуждение и ценные замечания.
4
Глава 1. Первоначальные понятия
Информация, данные.
Информация (от лат. informatio) - означает «сведения, разъяснения».
Сведения должны быть новыми, полезным для потребителя. Если в полученных
сведениях ничего нового нет, то количество полученной информации будет равно нулю.
Более общим является понятие данные.
Данные - любые сведения без оценки их значимости для потребителя.
Под понятием «информация» в выражении: «математическая обработка
информации» будем понимать любые сведения (данные), являющиеся объектом
преобразования.
Под «математической обработкой» будем понимать определенные алгоритмы
действий при выполнении обработки информации с применением математического аппарата.
Одной из важнейших наук, занимающихся сбором, систематизацией и обработкой
различных данных, является статистика.
Статистика (от лат.status - «статус») – положение, состояние явлений.
Математическая статистика – раздел математики, в котором изучаются методы
сбора, систематизации и обработки результатов наблюдений массовых явлений для
выявления закономерностей.
Измерение данных, шкалы.
Измерение – это процедура, с помощью которой измеряемый объект сравнивается с
некоторым эталоном и получает выражение в определенном масштабе или шкале.
Виды шкал:
1.номинальная (шкала наименований);
2.порядковая (ранговая шкала);
3.интервальная (шкала равных интервалов);
4.шкала отношений (абсолютная шкала).
Измерения, осуществляемые с помощью двух первых шкал, считаются
качественными, а осуществляемые с помощью двух последних шкал – количественными.
Методы обработки данных зависят от того, в какой шкале измерены собранные
статистические данные.
Номинальная шкала.
Измерение в номинальной шкале состоит в присваивании измеряемому объекту
определенного наименования или символа (числового, буквенного). Эта шкала используется
для классификации объектов по принципу: «объекты аналогичные по измеряемому признаку
попадают в один класс», а «объекты, различающие по этому признаку, попадают в другие
классы».
Примеры данных, измеренных в номинальной шкале:
1.пол человека: мужской и женский;
2.тип темперамента: сангвиник, меланхолик, холерик, флегматик;
3.обозначение класса: «7а», «7б», «7в» и т.д.
Порядковая шкала.
Измеренные по этой шкале объекты делятся на множества, которые связаны между
собой отношением типа «больше – меньше». Но при этом нельзя сказать, на сколько больше?
Примеры данных, измеренных в порядковой шкале:
1.военные звания: майор, лейтенант, капитан и др.;
2.категории работников образования: ассистент, преподаватель, доцент и др.
5
В порядковой шкале все объекты располагаются по рангу (месту) – от самого
большого до самого маленького или наоборот. Для кодирования данных, измеренных в
порядковой шкале, применяется процедура ранжирования.
Ранг – это порядковый номер наблюдения в упорядоченном ряду.
Ранжирование – это процесс присвоения наблюдениям их рангов.
Проверка правильности ранжирования.
Для проверки правильности ранжирования применяется правило.
Сумма рангов для 𝑛 ранжируемых величин равна:
𝑛(𝑛 + 1)
1+2+⋯+𝑛 =
2
Замечание. Ранжировать можно величины, измеренные не только в ранговой шкале,
но также в интервальной и абсолютной шкале.
Пример. Результаты олимпиады по математике указаны в таблице
Учащийся
1
2
3
4
5
6
7
8
9
10
Баллы
2
24
10
14
28
8
6
0
5
16
Чтобы определить места, которые заняли учащиеся проранжируем учащихся по
количеству набранных баллов.
Минимальный ранг - 1 (место) запишем учащемуся, набравшему максимальное
количество баллов; остальные ранги запишем в порядке убывания набранных баллов.
Учащийся
Баллы
1
2
2
24
3
10
4
14
5
28
6
8
7
6
8
0
9
5
10
16
сумма
Ранг
9
2
5
4
1
6
7
10
8
3
55
Проверка ранжирования.
Количество ранжируемых величин: 𝑛 = 10.
10(10 + 1)
= 55
2
Замечание. В зависимости от поставленной задачи можно проставлять ранги и в
противоположном порядке.
6
Пример. Необходимо проранжировать учащихся, принявших участие в забеге на 100
метров. В этом случае учащийся, финишировавший с минимальным временем, займет первое
место (первый ранг).
Случай одинаковых рангов.
Одинаковые ранги можно присваивать любому числу ранжируемых одинаковых
величин. Если несколько значений оказались равными, то им приписывается ранг, равный
средней величине тех рангов, которые эти величины получили бы, если бы они стояли по
порядку друг за другом и не были бы равными.
Пример. Результаты ЕГЭ по математике учащихся представлены в таблице.
Учащийся
Баллы
1
26
2
35
3
35
4
46
5
48
6
52
7
52
8
52
9
68
10
82
Проранжируем учащихся по количеству набранных баллов.
В примере есть учащиеся, набравшие одинаковое количество баллов.
Вначале расставим условные ранги в порядке возрастания баллов (можно выбрать
порядок убывания). При этом для одинаковых величин запишем «условно» разные ранги, как
будто эти величины стоят друг за другом и различаются (выделим для них условные ранги в
скобках).
На следующем этапе для одинаковых величин необходимо сложить условные ранги
для каждой группы одинаковых величин и поделить на их количество.
В результате одинаковые величины будут иметь одинаковые средние ранги, а ранги
остальных величин совпадут с условными рангами.
Учащийся
Баллы
1
2
3
4
5
6
7
8
9
10
26
35
35
46
48
52
52
52
68
82
сумма
Условные
Ранги
1
(2)
(3)
4
5
(6)
(7)
(8)
9
10
2+3
6+7+8
= 2,5;
=7
2
3
7
Ранги
1
2,5
2,5
4
5
7
7
7
9
10
55
Интервальная шкала.
В интервальной шкале объекты классифицируются по принципу «больше (меньше) на
определенное количество единиц». В шкале интервалов каждое из возможных значений
измеренных величин отстоит от ближайшего на равном расстоянии. Особенность шкалы
является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на
отсутствие измеряемого свойства).
Примеры данных, измеренных в интервальной шкале:
1.температура по Цельсию (ноль не означает отсутствие температуры);
2.коээфициент интеллекта IQ (ноль не означает отсутствие интеллекта);
3.тестовые шкалы и т.д.
Шкала отношений.
В шкале отношений объекты классифицируются по принципу «больше (меньше) в
определенное количество раз». Особенность этой шкалы является наличие твердо
фиксированного нуля, который означает полное отсутствие какого-либо свойства
исследуемого объекта.
Примеры данных, измеренных в шкале отношений:
1.рост человека;
2.вес человека;
3.количество решенных задач и т.д.
Формы представления информации.
1.Таблицы;
2.Графики;
3.Диаграммы.
Любая таблица представляет собой прямоугольник, разбитый на горизонтальные
строки и вертикальные столбцы (колонки, графы). На пересечении строк и столбцов
образуются ячейки, куда и записываются элементы данных.
Чаще всего каждый столбец имеет название, которое указывается в первой строке
таблицы.
Примеры статистических данных в форме таблиц:
1.расписание уроков,
2.страница школьного журнала,
4.прайс-лист с ценами на товары и услуги и др.
График (от греч. graphikos - начертанный) - чертеж, применяемый для наглядного
изображения зависимости одной величины от другой в виде кривой, прямой, ломаной линии,
построенной в той или иной системе координат.
Графики могут определять последовательность выполнения действий, протекания
событий во времени.
Примеры статистических данных в форме графика:
1.график движения поездов,
2.график дежурств,
3.график изменения цен на товары с течением времени и др.
Пример. Были собраны статистические данные о изменении роста учащегося с
течением времени. Необходимо изобразить данные изменения роста на графике.
В 9 лет Коля имел вес 30кг, в 10 лет— 35кг, в 11 лет— 38кг, в 12 лет— 42 кг, в 13
лет— 45 кг, в 14 лет— 51 кг, в 15 лет— 55 кг.
Для удобства построения графика, оформим данные сначала в виде таблицы:
8
возраст, лет
Вес Коли
9
10 11 12
13
14
15
вес, кг
30
45
51
55
35
38
42
Построим систему координат, где по горизонтальной оси отложим значения возраста
мальчика (в годах), а по вертикальной оси соответствующие значения веса (в кг).
Замечания.
Для наглядности графика для статистических данных масштаб по осям можно
выбирать разный;
Так как собранные статистические данные принимают только положительные
значения, то и изобразить можно только первую четверть для выбранной системы
координат;
Если минимальные значения собранных данных принимают значение достаточно
превышающие ноль, то пустое место между началом координат и минимальные значениями
можно не оставлять.
Вес, кг
Вес Коли
60
55
50
45
40
35
30
25
20
8
9
10
11
12
13
14
15
16
Возраст, лет
Диаграмма (греч. Diagramma – изображение, рисунок, чертеж) – графическое
представление данных, позволяющее быстро оценить соотношение нескольких величин,
выполненное при помощи линий, плоскостей, геометрических фигур, рисунков и т.д.
Виды диаграмм.
1) столбиковые;
2) круговые;
3) диаграмма рассеивания и др.
На столбчатой (столбиковой) диаграмме по горизонтали откладывают различные
значения одного признака, а над каждым таким значением рисуют столбик, высота которого
равна соответствующему значению другого признака.
На столбчатой диаграмме особенно наглядно видны количественные соотношения
величин друг с другом.
Пример. Для данных по результатам 1 сессии 1 курса на факультете постройте
столбиковую диаграмму.
Оценки за экзамены
Отлично
Хорошо
Удовлетворительно
Неудовлетворительно
Количество оценок
78
192
105
150
9
Количество оценок
Результаты 1 сессии
250
192
200
150
150
100
105
78
50
0
Оценки за экзамены
Круговая диаграмма представляет собой круг, разрезанный на части, величина
которых пропорциональна значениям изучаемого признака. При этом под величиной может
пониматься угол, длина дуги, площадь - это не меняет вида диаграммы.
Чтобы построить круговую диаграмму, нужно поделить всю окружность на дуги так,
чтобы их длины (или соответствующие им центральные углы) оказались в том же
отношении, что и представленные на диаграмме величины.
Пример. Для представленных выше результатов сессии постройте круговую
диаграмму.
Оценки за экзамены
Количество оценок
Отлично
78
Хорошо
192
Удовлетворительно
105
Неудовлетворительно
150
Всего
525
Вычислим долю в % от общего количества полученных оценок:
Отлично
78 : 525 = 0,15 ·100 = 15%
Хорошо
192 : 525 = 0,36 ·100 = 36%
Удовлетворительно
105 : 525 = 0,20 ·100 = 20%
Неудовлетворительно
105 : 525 = 0,20 ·100 = 20%
Вычислим значения градусной меры углов для круговой диаграммы:
Отлично
360°·0,15 = 54°
Хорошо
360°·0,36 = 130°
Удовлетворительно
360°·0,2 = 72°
Неудовлетворительно
360°·0,29 = 104°
Оценки за экзамены
Отлично
Хорошо
Удовлетворительно
Неудовлетворительно
Всего
Количество
оценок
78
192
105
150
525
Доля в % от общего
количества оценок
15 %
36 %
20 %
29 %
100 %
10
Угол
540
1300
720
1040
3600
78
15%
150
29%
Отлично
Хорошо
Удовлетворительно
Неудовлетворительно
192
36%
105
20%
Диаграмма рассеивания используется для изучения связи между величинами. Эта
диаграмма представляет собой конечный набор точек, абсциссы которых равны одному из
изучаемых признаков, а ординаты - другому. Если при построении диаграммы рассеивания
все ее точки ложатся в окрестности некоторой воображаемой прямой (или гладкой кривой),
то связь между изучаемыми величинами существует (тем больше, чем больше «видна» эта
прямая). Если эти точки образуют бесформенное облако, которое одинаково плохо
приближается к любой прямой (или гладкой кривой), то связи между величинами нет.
Построим две диаграммы рассеивания: зависимости цены от площади и площади от
этажа:
Пример. Имеются данные о площади и стоимости квартир, полученные из газетных
объявлений:
Площадь квартиры 30 26 18,8 44,2 34 34,6 45 19 17,4 36,6
(в кв. м.)
3 5
7
10
3
5
1 12
7
6
Этаж
32 29 30 36 18 14
28
Цена (в тыс. дол.) 24 22 17
Построим две диаграммы рассеивания: зависимости цены от площади и площади от
этажа:
Зависимость этажа от площади
40
14
35
12
30
10
25
Этаж
Цена (тыс. дол.)
Зависимость цены от площади
20
15
8
6
10
4
5
2
0
0
0
10
20
30
40
50
0
Площадь ( кв.м.)
20
40
Площадь (кв. м. )
Выводы:
1) Между площадью и ценой наблюдается связь.
2) Между площадью и этажом нет связи.
11
60
Упражнения.
1. В таблице даны денежные вклады граждан России в Сбербанке РФ в каждом
месяце 2010г.
1
2
3
4
5
6
7
8
9
10
Месяц
Вклад, млрд. 550 560 560 640 640 1100 1100 1100 1630 1610
руб.
Постройте столбиковую диаграмму, отражающую данные таблицы.
11
1610
12
2500
2. В
таблице
приведена
приблизительная
численность
учителей
общеобразовательных школ и интернатов в России по годам (тыс.чел. к началу
учебного года).
1940/
1950/
1960/
1970/ 1980/ 1990/ 2000/
1941
1951
1961
1971
1981
1991
2001
700
800
1010
1230
1070
1440
1710
Учителя
Постройте столбиковую диаграмму, отражающую данные таблицы.
Годы
2005/
2006
1540
2006/
2007
1480
3. В таблице представлен объём поставок российского газа в три страны в 2001 году,
в млрд. куб. м:
Страны
Экспорт газа из России в 2001 г., млрд. куб. м
Болгария
3,32
Швейцария
0,34
Турция
11,12
Постройте круговую диаграмму, отражающую распределение долей.
4. В таблице приведено количество уроков в третьей четверти по категориям:
ЕстественноМатематические
Другие
научные
143
91
75
51
Постройте круговую диаграмму, отражающую распределение долей.
Гуманитарные
Всего
5. Имеются данные о площади и стоимости квартир, полученные из газетных
объявлений:
30 26 18,8 44,2 34 34,6 45 19 17,4 36,6
Площадь, кв. м.
24 22 17 32 29 30 36 18 14 28
Цена, тыс. долл. США
Построить диаграмму рассеивания и сделайте вывод о наличии зависимости цены за
квартиру от ее площади.
12
Глава 2. Выборочный метод
Статистические совокупности.
Статистическое исследование начинают с выделения совокупности объектов
наблюдения.
Виды совокупностей.
1.генеральная совокупность;
2.выборочная совокупность (выборка).
Генеральная совокупность это совокупность всех объектов наблюдения и для ее
изучения применяется сплошное исследование.
Выборочной совокупностью (выборкой) называют совокупность объектов
наблюдения, выбранных случайным образом из генеральной совокупности. Для ее изучения
применяется выборочное исследование (выборочный метод).
Основная идея выборочного метода состоит в том, чтобы по выборке сделать
заключения о свойствах всей генеральной совокупности.
Пример. При изучении брака продукции не требуется изучать всю произведенную
продукцию, а можно случайным образом отобрать определенное количество товара и его
проверить. Выводы по выборке будут распространяться на весь произведенный товар.
Для достоверности таких заключений необходимо строить выборку с учетом
определенных требований: случайный отбор, достаточный объем, однородность,
репрезентативность (представительность).
Объемом совокупности называют количество объектов этой совокупности.
Объем генеральной совокупности обозначим – 𝑁.
Объем выборочной совокупности (выборки) – 𝑛.
Пример. Нужно изучить 1000 деталей, изготовленных заводом за смену на долю
брака. На практике выбирают случайным образом для проверки 100 деталей.
Объем генеральной совокупности: 𝑁 = 1000.
Объем выборки: 𝑛 = 100.
По объему выборки разделяют:
малая выборка, если n<30;
средняя выборка, если 30<n<100;
большая выборка, если n>100.
Выделяют независимые и зависимые выборки.
Выборки называются независимыми (несвязными), если полученные наблюдения в
одной выборке не оказывают влияние на наблюдения в другой выборке.
Выборки называются зависимыми (связными), если полученные наблюдения в
одной выборке оказывают влияние на наблюдения в другой выборке.
Пример. Результаты одинаковой контрольной работы по одной теме в двух разных
классах представляют собой независимые выборки.
Результаты одинакового теста по одной теме в одном классе в разное время
представляют собой зависимые выборки. Через определенное время проверяются остаточные
знания.
Выбрав совокупность объектов наблюдения, дальше ее требуется изучить
относительно некоторого признака 𝑿.
Пример. При изучении рождаемости собирают данные по количеству детей в семье.
Изучаемый признак 𝑋 – количество детей в семье.
Вариантами называются значения признака. Обозначим 𝑥𝑖 (𝑖 – «индекс», номер).
13
Пример. Признак 𝑋 – количество детей в семье может принимать значения 0, 1, 2, …
и т.д. Варианты 𝑥1 = 0, …
Виды значений вариант.
1.Дискретные;
2.Непрерывные.
Дискретными значениями вариант называются такие варианты, которые
отличаются на некоторую конечную величину (как правило, целое число).
Пример. При изучении количества детей в семьях варианты могут принимать
значения два или три, но не могут принимать значение два с половиной.
Значения вариант называются непрерывными, если они могут отличаться на сколь
угодно малую величину.
Пример. При изучении времени забега на определенную дистанцию варианты могут
отличаться на доли секунды.
Дальнейшая обработка собранных данных зависит от вида значений вариант.
Если исследуемый признак принимает дискретные значения, то в выборке варианты,
как правило, повторяются.
Частотой варианты называется количество повторений данной варианты во всей
выборке. Обозначим 𝑛𝑖 .
Свойство:
Сумма частот всех вариант выборки равна объему этой выборки:
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛.
Относительной частотой варианты называется величина равная доле частоты этой
варианты относительно объема выборки. Обозначим 𝑤𝑖 .
𝑛
Найдем по формуле: 𝑤𝑖 = 𝑛𝑖.
Замечание.
Если 𝑤𝑖 умножить на 100, то получим долю варианты в процентах.
Свойство:
Сумма относительных частот всех вариант выборки равна единице.
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑘 = 1
Пример. В 6 «а» классе учащиеся писали контрольную работу по математике и
получили следующие оценки:
2, 3, 4, 4, 5, 2, 3, 3, 4, 4, 4, 5, 4, 4, 5, 2, 3, 4, 3, 4.
Определим объем выборки, варианты и их частоты.
Объем выборки: 𝑛 = 20 (количество собранных данных).
Выпишем варианты (оценки) и соответствующие частоты (повторы):
𝑥1 = 2, 𝑛1 = 3 (количество повторений «двоек»);
𝑥2 = 3, 𝑛2 = 5 (количество повторений «троек»);
𝑥3 = 4, 𝑛3 = 9 (количество повторений «четверок»);
𝑥4 = 5, 𝑛4 = 3 (количество повторений «пятерок»);
Проверим: 𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 = 3 + 5 + 9 + 3 = 20 = 𝑛 (верно).
𝑛
Относительные частоты рассчитаем по формуле: 𝑤𝑖 = 𝑛𝑖 .
𝑛
3
𝑛
5
𝑛
9
𝑛
3
𝑤1 = 𝑛1 = 20 = 0,15 (15%);
𝑤2 = 𝑛2 = 20 = 0,25 (25%);
𝑤3 = 𝑛3 = 20 = 0,45 (45%);
𝑤4 = 𝑛4 = 20 = 0,15 (15%).
Проверим: 𝑤1 + 𝑤2 + 𝑤3 + 𝑤4 = 0,15 + 0,25 + 0,45 + 0,15 = 1 (верно).
14
В педагогике используют такие понятия, как процент успеваемости и процент
качества.
Процент успеваемости – это доля количества оценок: 3,4,5 в общем количестве
оценок.
Сумму повторений (частоты) оценок 3,4,5 делим на общее количество оценок (объем
выборки) и умножаем на 100.
Процент качества – это доля количества оценок: 4,5 в общем количестве оценок.
Сумму повторений (частоты) оценок 4,5 делим на общее количество оценок (объем
выборки) и умножаем на 100.
В примере с оценками 6 «а» класса за контрольную работу посчитаем процент
успеваемости и процент качества:
5+9+3
Процент успеваемости: 20 ∙ 100 = 0,85 ∙ 100 = 85%,
9+3
Процент качества: 20 ∙ 100 = 0,6 ∙ 100 = 60%.
Для более удобного и наглядного представления статистические данные оформляются
в виде таблиц и графиков.
Таблица частот представляет собой таблицу, в которой в первую строку записывают
значения вариант, а во вторую соответствующие им частоты.
Варианты 𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑘
Частоты 𝑛𝑖
𝑛1 𝑛2 … 𝑛𝑘
Таблица относительных частот представляет собой таблицу, в которой в первую
строку записывают значения вариант, а во вторую соответствующие им относительные
частоты.
Варианты 𝑥𝑖
𝑥1 𝑥2 … 𝑥𝑘
Относительные частоты 𝑤𝑖 𝑤1 𝑤2 … 𝑤𝑘
Полигон частот – это ломаная линия на координатной плоскости, построенная из
точек с координатами: (𝑥1 ; 𝑛1 ), (𝑥2 ; 𝑛2 ), …, (𝑥𝑘 ; 𝑛𝑘 ), соединенных последовательно
отрезками.
Полигон относительных частот – это ломаная линия на координатной плоскости,
построенная из точек с координатами: (𝑥1 ; 𝑤1 ), (𝑥2 ; 𝑤2 ), …, (𝑥𝑘 ; 𝑤𝑘 ), соединенных
последовательно отрезками.
В примере с оценками 6 «а» класса за контрольную работу построим таблицы частот
и полигоны частот.
Частоты были посчитаны выше, осталось оформить их в таблицы.
Чтобы построить полигоны, необходимо на плоскости построить точки, координаты
которых возьмём из таблиц частот, а затем соединим отрезками, получившиеся точки.
Таблица частот
𝑥𝑖
𝑛𝑖
2
3
3
5
15
4
9
5
3
Частоты
Полигон частот
10
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
Варианты
Таблица относительных частот
3
4
5
𝑥𝑖 2
𝑤𝑖 0,15 0,25 0,45 0,15
Полигон относительных частот
Относительные
частоты
0,5
0,4
0,3
0,2
0,1
0
0
1
2
3
4
5
6
Варианты
Упражнения
1.На основании данных размера одежды учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот и полигон относительных частот.
36
46
36
36
38
40
42
42
44
36
42
44
42
42
42
44
42
40
36
38
38
44
46
36
40
38
38
38
50
46
44
42
40
44
42
42
46
40
44
38
46
44
40
42
38
2. На основании данных температуры:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот.
-3 -5
2
1
-1 -3 -1
2
-1 1
-1 -2 0
-3
2
0
-3 -2 -1 -4
0
-2 -1 -4
0
-5
-4 -1
1
-3
2
0
-2
1
-5 1
-3
1
1
-1
0
1
1
1
2
-5 -4
1
-4
2
-3 -5
16
36
42
44
48
36
0
-2
-1
-3
1
-1
0
1
3. По результатам тестирования группы студентов:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот.
3
2
4
4
6
6
4
9
2
2
6
8
6
4
9
1
5
8
4
10
7
10
2
7
10
2
3
10
9
8
1
6
2
4
2
4
7
3
4
6
10
3
6
2
6
8
4
4
10
8
4. На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот и полигон относительных частот.
в) вычислить процент успеваемости и качества.
2
5
4
2
2
3
3
3
4
5
4
2
5
4
3
3
5
3
5
2
4
4
2
3
3
2
5
2
3
3
2
5
4
2
3
3
2
5
2
4
3
3
3
4
3
5
5
5
4
3
3
3
5
5
5
5
2
3
2
2
5
2
2
2
3
4
4
5
2
4
2
3
3
3
4
4
3
2
4
2
3
4
4
3
2
5
2
4
3
4
5. Для отрывка из поэмы А.С. Пушкина «Медный всадник» составьте таблицы частот
и относительных частот букв «а», «и», «о», «е», «у», «я».
На берегу пустынных волн
Стоял он, дум великих полн,
И вдаль глядел. Пред ним широко
Река неслася; бедный чёлн
По ней стремился одиноко.
По мшистым, топким берегам
Чернели избы здесь и там,
Приют убогого чухонца;
И лес, неведомый лучам
В тумане спрятанного солнца,
Кругом шумел.
И думал он:
Отсель грозить мы будем шведу,
Здесь будет город заложен
На зло надменному соседу.
Природой здесь нам суждено
В Европу прорубить окно,
Ногою твердой стать при море.
Сюда по новым им волнам
Все флаги в гости будут к нам,
И запируем на просторе.
17
Глава 3. Группировка
Если варианты принимают непрерывные значения или дискретные, но имеющие
большой разброс значений, то для обработки таких данных, как правило, выполняют
группировку.
Процесс группировки состоит в том, что весь диапазон вариант разбивают на
небольшое количество групп (интервалов).
Пример. Собирая демографические данные о возрасте населения, исследователи
получают большой разброс значений. В дальнейшем данные разбивают на возрастные
группы, например: от 0 до 14 лет, …
Чтобы произвести группировку необходимо:
1.определить количество интервалов;
2.определить длину каждого интервала;
3.составить интервалы;
4.посчитать интервальные частоты.
Количество интервалов.
Количество интервалов определяется спецификой собранных данных.
Пример. Собирая данные по возрастам, социолог может выделить одно количество
интервалов, психолог другое, педагог третье.
Количество интервалов обозначим – 𝑘.
Нужно учесть, что малое количество интервалов может сильно исказить результаты
дальнейших расчетов, а большое количество может затруднить дальнейшие расчеты.
Рекомендуемое оптимальное количество интервалов можно рассчитать по формуле
Стерджесса:
𝑘 = 1 + 3,3 ∙ lg 𝑛,
где 𝑛 - объем выборки, lg 𝑛- десятичный логарифм.
Длина интервалов.
Длина интервалов также определяется спецификой собранных данных.
Пример. Психолог может разбить данные о возрасте на группы, связанные с
возрастными кризисами, а педагог связанные с уровнем образования.
Длину интервалов обозначим - ℎ𝑖 .
Одинаковую для всех интервалов длину обозначим - ℎ и найдем, как:
𝑅
ℎ= ,
𝑘
где 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 (размах выборки).
Замечание.
В процессе группировки необходимо следить, чтобы ни одна из вариант не оказалась
за пределами созданных интервалов. Это может возникнуть, например, когда величину ℎ
округляют. Рекомендуется округлять в большую сторону, независимо от математических
правил округления.
Интервалы.
Существует следующий вариант построения интервалов.
Вид интервалов: [𝑎𝑖 ; 𝑎𝑖+1 ); последний интервал вида: [𝑎𝑘 ; 𝑎𝑘+1 ].
Начнем составлять интервалы с 𝑎1 = 𝑥𝑚𝑖𝑛 , и последовательно каждый раз будем
прибавлять длину интервала 𝑎2 = 𝑎1 + ℎ, 𝑎3 = 𝑎2 + ℎ, ….
Замечание.
В качестве начальной границы 𝑎1 можно взять величину меньше, чем 𝑥𝑚𝑖𝑛 . При этом
границу подбирать нужно так, чтобы ни одна из вариант не оказалась за пределами
созданных интервалов.
18
Интервальные частоты.
Под интервальной частотой будем понимать количество вариант, «попавших» в
соответствующий интервал.
Варианта 𝑥 «попадает» в интервал [𝑎𝑖 ; 𝑎𝑖+1 ), если для нее выполняется неравенство
𝑎𝑖 ≤ 𝑥 < 𝑎𝑖+1 ; «попадает» в интервал [𝑎𝑘 ; 𝑎𝑘+1 ], если выполняется неравенство 𝑎𝑘 ≤ 𝑥 ≤
𝑎𝑘+1.
Замечание.
«круглая» скобка - граница «не принадлежит», неравенство строгое;
«квадратная» скобка - граница «принадлежит», неравенство нестрогое.
Обозначим интервальные частоты - 𝑛𝑖 .
Для найденных интервальных частот можно рассчитать интервальные
относительные частоты.
𝑛
Обозначим их 𝑤𝑖 и найдем по формуле: 𝑤𝑖 = 𝑛𝑖 .
Пример. Результаты ЕГЭ по математике учащихся 11 «а» имеют большой разброс
значений. Необходимо выполнить группировку с интервалами одинаковой длины.
71
49
50
46
49
51
70
59
53
44
75
57
44
50
47
52
46
38
61
36
23
41
66
63
34
41
30
55
84
71
1 шаг. Количество интервалов.
Объем выборки n = 30.
Количество интервалов найдем по формуле Стерджесса:
k = 1 + 3,3 ∙ lg30 = 1 + 3,3 ∙ 1,5 ≈ 6.
2 шаг. Длина интервалов.
Разброс значений: xmin = 23, xmax = 84, R = 84 − 23 = 61.
𝑅
Длину интервалов найдем по формуле h = 𝑘 :
61
ℎ=
= 10,17 ≈ 11
6
(округление в большую сторону).
3 шаг. Интервалы.
Первый интервал начнем составлять с 𝑎1 = 𝑥𝑚𝑖𝑛 = 23 и затем каждый раз будем
прибавлять ℎ = 11.
1) [23; 34); 2) [34; 45); 2) [45; 56); 2) [56; 67); 2) [67; 78); 6) [78; 89].
4 шаг. Интервальные частоты.
Определим, сколько вариант «попадет» в каждый интервал, проверяя выполнение
неравенства для каждой варианты:
Интервал Неравенство Варианты
[23; 34)
23 ≤ 𝑥 < 34 23;30.
[34; 45)
34 ≤ 𝑥 < 45 44;44;38;36;41;34;41.
[45; 56)
45 ≤ 𝑥 < 56 49;50;46;49;51;53;50;47;52;46;55.
[56; 67)
56 ≤ 𝑥 < 67 59;57;61;66;63.
[67; 78)
67 ≤ 𝑥 < 78 71;70;75;71.
[78; 89]
78 ≤ 𝑥 ≤ 89 84.
Проверка: 2 + 7 + 11 + 5 + 4 + 1 = 30 (верно).
𝑛
Интервальные относительные частоты найдем по формуле: 𝑤𝑖 = 𝑛𝑖 .
[23; 34): n1 = 2, 𝑤1 =
[34; 45): n2 = 7, 𝑤2 =
2
30
7
30
= 0,07;
= 0,23;
19
𝒏𝒊
2
7
11
5
4
1
[45; 56): n3 = 11, 𝑤3 =
[56; 67): n4 = 5, 𝑤4 =
[67; 78): n5 = 4, 𝑤5 =
11
30
5
30
4
30
1
= 0,37;
= 0,17;
= 0,13;
[78; 89]: n6 = 1, 𝑤8 = = 0,03.
30
Проверка: 0,07 + 0,23 + 0,37 + 0,17 + 0,13 + 0,03 = 1 (верно).
Для более удобного и наглядного представления
оформляют в виде интервальных таблиц и гистограмм.
сгруппированные данные
Интервальная таблица частот
Интервалы
[𝑎1 ; 𝑎2 ) [𝑎2 ; 𝑎3 ) … [𝑎𝑘 ; 𝑎𝑘+1 ]
…
Интервальные частоты 𝑛𝑖
𝑛1
𝑛2
𝑛𝑘
Интервальная таблица относительных частот
Интервалы
[𝑎1 ; 𝑎2 ) [𝑎2 ; 𝑎3 ) … [𝑎𝑘 ; 𝑎𝑘+1 ]
…
Интервальные относительные частоты 𝑤𝑖
𝑤1
𝑤2
𝑤𝑘
Плотностями частот называются величины равные отношению интервальных частот
𝑛
на длины соответствующих интервалов:ℎ𝑖 (или на ℎ).
𝑖
Гистограмма частот - это фигура, составленная из прямоугольников, в основании
которых лежат интервалы, а высотами являются плотности частот.
Свойство:
Площадь гистограммы частот равна объему выборки.
Площадь гистограммы рассчитаем, как сумму площадей всех прямоугольников, из
которых она состоит:
𝑛1
𝑛2
𝑛𝑘
𝑆 = ℎ1 ∙ + ℎ2 ∙ + ⋯ . +ℎ𝑘 ∙
= 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛
ℎ1
ℎ2
ℎ𝑘
Плотностями относительных частот называются величины равные отношению
𝑤
относительных интервальных частот на длины соответствующих интервалов: ℎ 𝑖 (или на ℎ).
𝑖
Гистограмма относительных частот – это фигура, составленная из
прямоугольников, в основании которых лежат интервалы, а высотами являются плотности
относительных частот.
Свойство:
Площадь гистограммы относительных частот равна единице.
𝑤1
𝑤2
𝑤𝑘
𝑆 = ℎ1 ∙
+ ℎ2 ∙
+ ⋯ . +ℎ𝑘 ∙
= 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑘 = 1
ℎ1
ℎ2
ℎ𝑘
В примере с баллами ЕГЭ по математике 11 «а» класса построим интервальные
таблицы частот и гистограмму частот.
Составленные интервалы, посчитанные интервальные частоты и интервальные
относительные частоты занесем в таблицы:
20
Интервальная таблица частот
Интер- [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89]
валы
2
7
11
5
4
1
𝑛𝑖
Интервалы
𝑤𝑖
Интервальная таблица относительных частот
[23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89]
0,07
0,23
0,37
0,17
0,13
0,03
Рассчитаем плотности частот:
𝑛1
2
𝑛2
7
𝑛3 11
=
= 0,18;
=
= 0,64;
=
= 1;
ℎ
11
ℎ
11
ℎ
11
𝑛4
5
𝑛5
4
𝑛6
1
=
= 0,45;
=
= 0,36; =
= 0,09.
ℎ
11
ℎ
11
ℎ
11
На плоскости построим гистограмму частот, отложив по горизонтальной оси
интервалы, а на вертикальной оси – плотности частот.
Диаграмма
1,2
1
0,8
0,6
0,4
0,2
0
23
34
45
56
67
78
89
Упражнения
1. На основании данных по оплате труда работников одного предприятия (в усл.ед.):
а) построить интервальную таблицу частот;
б) построить интервальную таблицу относительных частот;
в) изобразить гистограмму частот.
214 204 212 201 190 222 226 216 228 240
224 220 260 204 240 190 218 232 254 224
204 221 256 260 228 232 204 182 230 214
242 222 260 198 216 198 232 242 216 226
208 221 202 204 222 196 222 238 224 223
2. Группу студентов протестировали на уровень интеллекта IQ. На основании
результатов:
а) построить интервальную таблицу частот;
б) построить интервальную таблицу относительных частот;
в) изобразить гистограмму частот.
95
123 100 130 74
115 69
70
114 80
61
116
21
88
126
104
110
112
84
73
74
135
99
105
118
89
95
101
96
88
102
77
69
101
119
76
69
100
100
102
81
113
112
109
87
102
109
114
87
82
119
128
108
102
99
107
101
124
129
98
127
3. На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот;
б) построить интервальную таблицу относительных частот;
в) изобразить гистограмму частот.
62
44
48
53
73
65
67
56
49
43
57
69
62
15
59
96
78
47
78
48
33
41
69
38
35
75
70
65
48
54
96
49
59
69
64
37
39
66
75
93
28
91
64
60
74
78
54
53
47
64
87
73
61
49
97
48
60
41
71
60
65
43
55
76
40
81
65
67
47
61
88
64
46
38
51
89
61
63
48
58
64
73
63
64
76
78
61
60
36
66
4. В школе одного из районов провели опрос учащихся: сколько минут тратят они на
дорогу в школу? На основании результатов:
а) построить интервальную таблицу частот;
б) построить интервальную таблицу относительных частот;
в) изобразить гистограмму частот.
17 42 33 28 37 8 11 30 22 43 35 44 25 18 30 8 21 35 14 20
27 5 29 24 38 15 20 7 22 3 16 25 6 19 25 42 31 22 11 29
45 15 19 8 26 34 16 45 24 9 32 44 17 10 35 10 21 40 8 9
31 4 28 30 13 39 23 5 14 36 26 18 22 27 41 10 19 37 23 17
31 12 29 30 16 14 35 6 33 18 7 31 33 35 40 38 21 34 10 32
22
Глава 4. Числовые характеристики выборки
Построение таблиц и графиков является первым шагом в обработке статистических
данных. Для дальнейшего исследования необходимы обобщающие показатели, выявляющие
общие свойства данных. Эти показатели показывают тенденцию развития изучаемого
признака, сглаживая случайные индивидуальные отклонения, позволяют сравнивать
выборки, а также используются при более полном математическом анализе статистических
данных.
Рассмотрим некоторые основные числовые характеристики выборки.
Среднее арифметическое.
Среднее арифметическое равно сумме всех вариант деленной на объем выборки.
Обозначим 𝑥̅ .
Особенности вычисления среднего арифметического:
1. При малом объеме выборки удобно применить формулу:
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥̅ =
;
𝑛
2. При достаточном объеме выборки удобно вначале построить таблицу частот, а
затем применить формулу:
𝑥1 ∙ 𝑛1 + 𝑥2 ∙ 𝑛2 + ⋯ + 𝑥𝑘 ∙ 𝑛𝑘
𝑥̅ =
;
𝑛
3. При выполненной группировке данных удобно применить вторую формулу, где 𝑥𝑖 это середины соответствующих интервалов.
Пример. Учащийся получил по математике за четверть оценки:
5, 2, 3, 3, 4, 4, 4, 5, 4, 4.
Найдем среднюю оценку, как среднее арифметическое.
Объем выборки 𝑛 = 10.
При малом объеме выборки применим первую формулу:
5 + 2 + 3 + 3 + 4 + 4 + 4 + 5 + 4 + 4 38
𝑥̅ =
=
= 3,8 ≈ 4.
10
10
Пример. Учащиеся писали контрольную работу по математике. По результатам
построили таблицу частот.
𝑥𝑖 2 3 4 5
𝑛𝑖 3 5 9 3
Найдем среднюю оценку, как среднее арифметическое.
Объем выборки 𝑛 = 20.
При посчитанных частотах применим вторую формулу:
2 ∙ 3 + 3 ∙ 5 + 4 ∙ 9 + 5 ∙ 3 72
𝑥̅ =
=
= 3,6 ≈ 4.
20
20
Пример. Учащиеся 11 «а» класса писали ЕГЭ по математике. По результатам была
построена интервальная таблица частот.
Интер- [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89]
валы
2
7
11
5
4
1
𝑛𝑖
Найдем средний балл.
Посчитаем 𝑥𝑖 - середины соответствующих интервалов.
Например, можно сложить концы интервалов и поделить пополам.
23
Интервалы
[23; 34)
[34; 45)
[45; 56)
[56; 67)
[67; 78)
[78; 89]
𝑛𝑖
Середины
интервалов
𝑥𝑖
2
23 + 34
2
=28,5
7
34 + 45
2
=39,5
11
45 + 56
2
=50,5
5
56 + 67
2
=61,5
4
67 + 78
2
=72,5
1
78 + 89
2
=83,5
При посчитанных частотах применим вторую формулу:
28,5 ∙ 2 + 39,5 ∙ 7 + 50,5 ∙ 11 + 61,5 ∙ 5 + 72,5 ∙ 4 + 83,5 ∙ 1
𝑥̅ =
=
30
1570
=
= 52,3 ≈ 52.
30
Замечание.
Данные взяты из примера Главы 3.
Если без группировки применить первую формулу, то:
1556
𝑥̅ =
= 51,87 ≈ 52.
30
(погрешность небольшая).
Дисперсия.
Дисперсия – это среднее арифметическое квадратов отклонений вариант от их
среднего арифметического. Обозначим 𝐷.
Особенности вычисления дисперсии:
1. При малом объеме выборки и больших значениях вариант удобно применить
формулу:
(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2
𝐷=
𝑛
2. При малом объеме выборки и малых значениях вариант удобно применить
формулу:
𝑥1 2 + 𝑥2 2 + ⋯ + 𝑥𝑛 2
𝐷=
− 𝑥̅ 2
𝑛
3. При достаточном объеме выборки и больших значениях вариант удобно применить
формулу:
(𝑥1 − 𝑥̅ )2 ∙ 𝑛1 + (𝑥2 − 𝑥̅ )2 ∙ 𝑛2 + ⋯ + (𝑥𝑘 − 𝑥̅ )2 ∙ 𝑛𝑘
𝐷=
𝑛
4. При достаточном объеме выборки и малых значениях вариант удобно применить
формулу:
𝑥1 2 ∙ 𝑛1 + 𝑥2 2 ∙ 𝑛2 + ⋯ + 𝑥𝑛 2 ∙ 𝑛𝑘
𝐷=
− 𝑥̅ 2
𝑛
5. При выполненной группировке данных удобно применить третью или четверную
формулу, где 𝑥𝑖 - это середины соответствующих интервалов.
Замечания:
1) В формулы входит величина среднего арифметического, которую можно
округлить. Подставив в формулы для дисперсии округленную величину, разные формулы
дадут результаты с разной погрешностью.
2) Погрешность вычисления, при которой дисперсия получится отрицательной
величиной, является недопустимой. Дисперсия должна быть неотрицательной величиной.
3) Применяя выборочный метод при исследовании, различают дисперсию для
генеральной совокупности и дисперсию для выборки. Если требуется оценить величину
дисперсии генеральной совокупности, то дисперсию выборки вычисляют по аналогичным
формулам с «поправкой»:
24
Такую дисперсию также называют «выборочная», «исправленная» дисперсия и
обозначают - 𝑠 2 .
(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2
2
𝑠 =
𝑛−1
Если объем выборки малый 𝑛 < 30, то в расчетах рекомендуется использовать
величину «исправленной» дисперсии.
При больших объемах выборки 𝑛 → ∞ значение «исправленной» дисперсии все
меньше будет отличаться от значения «просто» дисперсии.
Среднее квадратическое (стандартное) отклонение.
Предположим, что в эксперименте измерялся рост в сантиметрах, тогда дисперсия
будет измеряться в сантиметрах в квадрате. Чтобы средняя величина отклонения переменной
выражалась в тех же единицах измерения, нужно применить операцию извлечения
квадратного корня.
Стандартное отклонение – это величина равная квадратному корню, извлеченному
из дисперсии. Обозначим 𝜎.
𝜎 = √𝐷
Замечание:
Стандартное отклонение равное квадратному корню, извлеченному из
«исправленной» дисперсии обозначается:
𝑠 = √𝑠 2
Пример. Учащиеся писали контрольную работу по математике. По результатам
построили таблицу частот:
𝑥𝑖 2 3 4 5
𝑛𝑖 3 5 9 3
Найдем дисперсию и стандартное отклонение.
Ранее было посчитано среднее арифметическое: 𝑥̅ = 3,6 ≈ 4.
𝑥̅ = 3,6 – точное значение, а 𝑥̅ = 4 – округленное значение.
Рассчитаем дисперсию, применив третью формулу:
(2 − 3,6)2 ∙ 3 + (3 − 3,6)2 ∙ 5 + (4 − 3,6)2 ∙ 9 + (5 − 3,6)2 ∙ 3
𝐷=
20
16,8
=
= 0,84
20
(точное значение)
(2 − 4)2 ∙ 3 + (3 − 4)2 ∙ 5 + (4 − 4)2 ∙ 9 + (5 − 4)2 ∙ 3 20
𝐷=
=
=1
20
20
(допустимая погрешность)
Применим четвертую формулу:
22 ∙ 3 + 32 ∙ 5 + 42 ∙ 9 + 52 ∙ 3
𝐷=
− 3,62 = 0,84
20
(точное значение)
22 ∙ 3 + 32 ∙ 5 + 42 ∙ 9 + 52 ∙ 3
276
𝐷=
− 42 =
− 16 = −2,2
20
20
(недопустимая погрешность, дисперсия не может быть отрицательной).
Рассчитаем стандартное отклонение:
𝜎 = √𝐷 = √0,84 = 0,92
Пример. Учащиеся 11 «а» класса писали ЕГЭ по математике. По результатам была
построена интервальная таблица частот.
25
Интер- [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89]
валы
2
7
11
5
4
1
𝑛𝑖
Найдем дисперсию и стандартное отклонение.
Ранее было рассчитаны середины интервалов и среднее арифметическое: 𝑥̅ = 52,3 ≈
52.
Интервалы
[23; 34)
[34; 45)
[45; 56)
[56; 67)
[67; 78)
[78; 89]
𝑛𝑖
Середины
интервалов
𝑥𝑖
2
28,5
7
39,5
11
50,5
5
61,5
4
72,5
1
83,5
Применим третью формулу:
(28,5 − 52,3)2 ∙ 2 + (39,5 − 52,3)2 ∙ 7 + (50,5 − 52,3)2 ∙ 11 +
𝐷=
30
+(61,5 − 52,3)2 ∙ 5 + (72,5 − 52,3)2 ∙ 4 + (83,5 − 52,3)2 ∙ 1
=
5344,2
=
= 178,14.
30
𝜎 = √𝐷 = √178,14 = 13,35.
Число степеней свободы.
Число степеней свободы – это число свободно варьирующих единиц в составе
выборки.
Если выборка состоит из 𝑛 элементов и характеризуется средним арифметическим 𝑥̅ ,
то любой элемент выборки можно получить как разность между 𝑛 ∙ 𝑥̅ и суммой всех
остальных элементов, кроме самого этого элемента.
Пример. Рассмотрим ряд чисел: 4, 7, 15, 19, 25; 𝑥̅ = 14; 𝑛 = 5.
Выразим, например, первый элемент через другие элементы и среднее
арифметическое:
4 = 14 ∙ 5 − (7 + 15 + 19 + 25)
Аналогично можно выразить любой элемент выборки.
Таким образом, один элемент выборки не имеет свободы вариации и всегда может
быть выражен через другие элементы и среднее арифметическое. В рассмотренном примере
число степеней свободы 𝑘 будет определяться как 𝑘 = 𝑛 − 1.
При наличии нескольких ограничений свободы вариации, число степеней свободы
обозначается как 𝜈 («ню») и будет равно:
𝜈 = 𝑛 − 𝑘, где 𝑘 – число ограничений свободы вариации.
В общем случае для таблицы экспериментальных данных число степеней свободы
определяется по формуле:
𝜈 = (𝑐 − 1) ∙ (𝑛 − 1), где с – число столбцов, а 𝑛 – число строк.
Нахождение числа степеней свободы для каждого метода имеет свои специфические
особенности.
Нормальное распределение.
Пример. Измерим рост, вес, интеллект или какие-либо свойства личности. Затем
построим график частоты встречаемости показателей любой из этих величин. В результате
26
мы можем получить распределение, у которого крайние значения встречаются редко, а от
крайних значений к середине частота повышается.
Форма и положение графика нормального распределения определяется двумя
параметрами: средним арифметическим 𝑥̅ и стандартным отклонением 𝜎. График
нормального распределения имеет вид симметричной, колоколообразной кривой. Среднее
арифметическое задает положение кривой на числовой оси, а стандартное отклонение задает
ширину этой кривой.
Любое нормальное распределение может быть сведено к одной кривой, если
применить, так называемое, 𝒛 – преобразование (нормирование) ко всем измерениям по
формуле:
𝑥𝑖 − 𝑥̅
𝑧𝑖 =
𝜎
В результате нормальное распределение будет иметь среднее арифметическое равное
нулю, а стандартное отклонение равное единице. Такое распределение называется
стандартным нормальным распределением. Функция данного распределения задается
формулой:
𝑧2
1
−
𝑓(𝑧) =
∙𝑒 2
√2𝜋
Для вычисления значений данной функции в любой конкретной точке можно
воспользоваться Таблицей №1 (см. Приложение).
Свойство функции: 𝑓(−𝑧) = 𝑓(𝑧).
27
Нормальное распределение имеет большое значение в статистических исследованиях.
Некоторые статистические методы можно применять только при условии, что данные имеют
нормальное распределение.
Упражнения
1. Проводя осмотр среди мальчиков-десятиклассников, получили данные об их росте:
168, 159, 181, 172, 161, 163, 164, 170, 169, 154, 168, 175 см. На основании данных:
а) вычислить средний рост;
б) вычислить стандартное отклонение роста.
2. Проведен анализ оценок восьмиклассника по математике во 2 четверти: 5, 3, 4, 2, 5,
5, 4, 3, 3, 5. На основании данных:
а) вычислить среднюю оценку;
б) вычислить стандартное отклонение оценок.
3. Собраны данные о тарифных разрядах рабочих одного из цехов завода. На
основании данных:
а) вычислить средний тарифный разряд;
б) вычислить стандартное отклонение разрядов.
𝒙𝒊
𝒏𝒊
2
10
3
26
4
32
5
20
6
12
4. При проверке деталей ОТК получили данные взвешивания в граммах. На основании
данных:
а) вычислить средний вес;
б) вычислить стандартное отклонение веса.
𝒙𝒊
𝒏𝒊
246
20
247
40
248
110
249
180
250
305
251
215
252
100
253
20
254
10
5. Для анализа деятельности заводов в районе собрали информацию о стоимости их
основных фондов (млн.руб.). На основании данных:
а) вычислить среднюю стоимость основных фондов;
б) вычислить стандартное отклонение стоимости фондов.
Интервалы
𝒏𝒊
[𝟓; 𝟕)
9
[𝟕; 𝟗)
16
[𝟗; 𝟏𝟏)
11
[𝟏𝟏; 𝟏𝟑)
8
[𝟏𝟑; 𝟏𝟓)
6
6. Собрали данные о заработной плате рабочих в цеху в руб. На основании данных:
а) вычислить среднюю заработную плату;
б) вычислить стандартное отклонение заработной платы.
Интервалы
[𝟕𝟐𝟎𝟎; 𝟖𝟎𝟎𝟎)
[𝟖𝟎𝟎𝟎; 𝟖𝟖𝟎𝟎)
[𝟖𝟖𝟎𝟎; 𝟗𝟔𝟎𝟎)
[𝟗𝟔𝟎𝟎; 𝟏𝟎𝟒𝟎𝟎)
[𝟏𝟎𝟒𝟎𝟎; 𝟏𝟏𝟐𝟎𝟎)
[𝟏𝟏𝟐𝟎𝟎; 𝟏𝟐𝟎𝟎𝟎)
28
𝒏𝒊
8
12
20
32
40
56
[𝟏𝟐𝟎𝟎𝟎; 𝟏𝟐𝟖𝟎𝟎)
[𝟏𝟐𝟖𝟎𝟎; 𝟏𝟑𝟔𝟎𝟎)
30
15
7. Собраны данные о результатах экзамена студентов 1 курса по математике. На
основании данных:
а) вычислить среднюю оценку;
б) вычислить стандартное отклонение оценок.
3 3 2 3 3 4 4 4 4 5 2 3 2 3 3
4 3 5 4 5 4 2 2 4 3 3 4 3 5 3
3 3 3 4 3 5 5 3 2 3 3 2 3 4 3
2 2 2 2 4 3 2 3 4 3 4 2 3 5 4
8. Собраны данные о результатах ЕГЭ (баллы) учащихся школы по математике. На
основании данных:
а) вычислить средний балл;
б) вычислить стандартное отклонение баллов.
60 58 44 64 38 38 44 65 55 54 64 53 35 52 42
51 65 67 42 50 53 66 48 57 52 48 58 50 37 28
51 26 67 57 26 57 42 22 56 61 67 64 26 55 59
40 45 52 37 39 48 41
4 78 56 62 83 41 60 41
29
Глава 5. Общие принципы проверки статистических гипотез
Статистическая гипотеза – это научная гипотеза (предположение), допускающая
статистическую проверку.
Пример. Проводится исследование интеллекта у подростков из полных и неполных
семей. Можно ли утверждать, что неполная семья ведет к снижению интеллекта у
подростков?
Чтобы ответить на поставленный вопрос, необходимо провести статистическое
исследование. При этом выводы будут носить вероятностный характер. Связано это с тем,
что результаты наблюдений носят случайный характер, так как исследователь не может
учесть всех факторов.
На уровень интеллекта у подростка, например, может влиять не только состав семьи,
но и здоровье, и другие факторы.
Задача исследователя определить, является ли исследуемый фактор статистически
значимым.
Нулевая и альтернативная гипотезы.
При проверке статистических гипотез используются два понятия:
нулевая (основная) гипотеза: обозначение Н0 .
альтернативная гипотеза: обозначение Н1 .
В психолого-педагогических исследованиях чаще всего:
нулевая гипотеза – гипотеза о сходстве
(об отсутствии различий или отсутствии связи);
альтернативная гипотеза – гипотеза о различии
(о наличии различий или наличии связи).
В примере с исследованием связи интеллекта подростков и наличием полной семьи
можно сформулировать гипотезы:
Н0: между интеллектом подростков и наличием полной семьи отсутствует
статистически значимая связь.
Н1: между интеллектом подростков и наличием полной семьи существует
статистически значимая связь.
При проверке гипотезы экспериментальные данные могут противоречить гипотезе
Н0 , тогда эта гипотеза отклоняется. При этом альтернативная гипотеза Н1 принимается.
Если же экспериментальные данные согласуются с гипотезой Н0 , она не
отклоняется (в таких случаях, как правило, говорят, что гипотеза Н0 принимается). При
этом альтернативная гипотеза Н1 отклоняется.
Замечание. Заострим внимание на корректности статистических выводов. Вместо
выражения «гипотеза не отклоняется» часто говорят «гипотеза принимается». В целом, это
выражение также приемлемо, если его понимать правильно, т.е. если считать, что
принимается именно гипотеза (одно из возможных объяснений!), а не конкретное
утверждение. Но понимают его часто неправильно, подразумевая, что в случае не
отклонения гипотезы принимается сама идея гипотезы. Например, если гипотеза о
равенстве вероятностей в двух выборках не отклоняется, то делают заключение, что, мол,
вероятности действительно равны. Такое заключение ошибочно.
На самом деле принятие гипотезы означает, что она не противоречит данным и
может рассматриваться до тех пор, пока не будет доказано обратное. Принятие гипотезы не
может доказать ее правильность, для этого есть лишь один способ: исследовать все
анализируемое явление в целом, собрав генеральную совокупность. По выборке можно
только опровергнуть маловероятные или невозможные предположения, противоречащие
фактическим данным, сузив тем самым круг для поиска истины.
30
Ошибки первого и второго рода.
Статистическая проверка гипотез, основанная на экспериментальных данных, связана
с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов.
Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу
Н0 , хотя в действительности она оказывается верной.
Ошибка второго рода произойдет, когда будет принято решение не отклонять
гипотезу Н0 , хотя в действительности она будет неверна.
Результаты проверки
На самом деле
гипотезы Н0
Верна гипотеза Н0
Верна гипотеза Н1
Ошибка
первого
рода
Правильное
решение
Гипотеза Н0
отклоняется
Правильное решение
Ошибка второго рода
Гипотеза Н0
не отклоняется
Абсолютно исключить ошибки при принятии статистических гипотез невозможно и
поэтому необходимо минимизировать возможные последствия. В большинстве случаев это
можно сделать, увеличив объем выборки.
Уровень статистической значимости
В результате статистического исследования одна из двух выдвинутых гипотез
отклоняется, а другая принимается. Для разделения областей принятия гипотез нужно
провести между ними границу. Но, так как в эксперименте всегда присутствуют случайные
неучтенные факторы, то эта граница не может быть проведена абсолютно точно. Она связана
с понятием уровня значимости.
Уровень значимости – это вероятность ошибочного отклонения верной нулевой
гипотезы, т.е. вероятность ошибки первого рода. Обозначается или 𝛼, или 𝑝.
Выделяют стандартные значения уровня значимости:
р=0,05 – достаточный уровень значимости;
р=0,01 – высокий уровень значимости;
р=0,001 – очень высокий уровень значимости.
С уменьшением вероятности допустить ошибку повышается значимость принятого
решения.
С другой стороны, не всегда целесообразно выбирать очень высокий уровень
значимости. Если исследователь заинтересован в принятии гипотезы Н1, то при очень
высоком уровне значимости он будет чаще отклонять гипотезу Н1 в пользу гипотезы Н0.
Если же он выберет более низкий допустимый уровень значимости он сможет чаще
принимать интересующую его гипотезу Н1 (за счет увеличения вероятности допустить
ошибку).
Замечание:
В разной литературе для уровня значимости используется обозначения как 𝛼, так и 𝑝.
При этом можно встретить сразу оба этих символа, обозначающих разные понятия.
Например, уровень значимости 𝛼, а 𝑝 = 1 − 𝛼, так называемая доверительная
вероятность.
Ориентируемся на значение величин:
-уровень значимости это величина ≤ 0,05;
-доверительна вероятность это величина ≥ 0,95.
Правило принятия статистического решения.
На основании полученных экспериментальных данных исследователь рассчитывает
так называемое эмпирическое значение (полученное опытным путем).
Эмпирическое значение Чэм – это величина, которая рассчитывается по
экспериментальным данным и выбранному статистическому методу.
31
Для каждого метода существует своя формула или правило, по которым
рассчитывается данная величина.
Эмпирическое значение сравнивается с так называемым критическим значением.
Критическое значение Чкр – это величина, которая находится в соответствии с
выбранным уровнем значимости и выбранным статистическим методом по соответствующей
таблице.
Эти таблицы приводятся в Приложениях к литературе по данной тематике. Также
можно вычислять критические значения с помощью компьютерных программ.
Замечание.
На величину критического значения также может влиять: объем выборки, число
степеней свободы.
Сравнивать эмпирическое и критическое значения можно как числовые значения.
Например, Чэм ≤ Чкр (или Чэм ≥ Чкр ). Результат проверки статистической гипотезы зависит
от конкретного статистического метода.
Для наглядности значения можно изобразить на числовой прямой.
Критическое значение разбивает числовую прямую на две граничащие области:
критическую и доверительную. Эмпирическое значение однозначно попадает в одну из
областей.
1 случай: эмпирическое значение попало в доверительную область.
Вывод: основная гипотеза Н0 не отклоняется (принимается) на выбранном
уровне значимости.
2 случай: эмпирическое значение попало в критическую область.
Вывод: основная гипотеза Н0 отклоняется и принимается альтернативная
гипотеза Н1 на выбранном уровне значимости.
Замечание.
В литературе, посвященной психолого-педагогическим исследованиям принято
находить сразу два критических значения для стандартных уровней значимости р = 0,05 и
р = 0,01 соответсвенно. Тогда на числовой прямой появляется две граничные точки, и три
области, которые обозначают зонами: зона значимости, зона незначимости и зона
неопределенности.
1.Зоне значимости соответствует критическая область для р ≥ 0,01.
2.Зоне незначимости соответствует доверительная область для уровня значимости
р ≤ 0,05.
3.Зоне неопределенности соответствует критическая область для уровня значимости
р = 0,05 и одновременно доверительная область для уровня значимости р = 0,01.
Неопределенность появляется, т.к. одновременно принимаются обе гипотезы, но на
разных уровнях значимости. Рекомендуется в таких случаях провести дополнительное
исследование, увеличив при этом объем выборки или применить другой статистический
метод.
Этапы принятия статистического решения.
Принятие статистического решения разбивается на этапы или шаги:
1.Формулировка нулевой и альтернативной гипотез.
2.Выбор статистического метода
3.Вычисление эмпирического значения.
4. Выбор уровня значимости и нахождение критического значения (если требуется
нахождение числа степеней свободы).
5.Сравнение критического и эмпирического значений.
6.Формулировка принятия решения (выбор принимаемой гипотезы Н0 или Н1 на
выбранном уровне значимости).
32
Статистические критерии.
Статистический критерий означает метод (правило) расчета эмпирического
значения и само это число.
Критерии имеют свою специфику и различаются между собой по различным
основаниям:
1.тип измерительной шкалы;
2.зависимость или независимость выборок;
3.количество сравниваемых выборок;
4.равность сравниваемых выборок по численности;
5.максимальный объем выборки;
6.мощности критерия и др.
Мощность критерия.
Мощность критерия – это его способность отклонить нулевую гипотезу, если она
неверна.
Если вероятность ошибки второго рода обозначить как 𝛽, то мощность критерия – это
его способность не допустить ошибку второго рода, поэтому:
Мощность = 1 − 𝛽.
Мощность критерия определяется опытным путем. Одна и та же задача может быть
решена с помощью разных критериев, при этом обнаруживается, что некоторые критерии
позволяют отклонить неверную нулевую гипотезу там, где другие оказываются
неспособными это сделать.
При этом основанием для выбора критерия является не только мощность, но и другие
характеристики критерия:
-простота (более мощные критерии более трудоемки для расчета);
-более широкий диапазон использования (более мощные критерии нельзя применять,
например, для данных измеренных в номинальной или ранговой шкалах);
- применимость по отношению к неравным по объему выборкам и др.
Виды критериев:
1.параметрические;
2.непараметрические.
Параметрические критерии основаны на конкретном типе распределения
(например, нормальном и др.) или используют параметры исследуемой совокупности, т.е.
числовые характеристики (например, среднее, дисперсия и др.).
Непараметрические критерии не основаны на типе распределения и не используют
параметры исследуемой совокупности.
При нормальном распределении генеральной совокупности параметрические
критерии являются более мощными по сравнению с непараметрическими. Однако если
данные не распределены нормально, то применять параметрические критерии становится
недопустимым и непараметрические критерии становятся более мощными.
Задачи
1.Выявление
различий в уровне
исследуемого
признака.
2.Оценка сдвига
Классификация задач и методов их решения
Условия
Методы
2 выборки испытуемых
Q-критерий Розенбаума
U-критерий Манна-Уитни
φ-критерий (угловое преобразование
Фишера)
t-критерий Стьюдента
3 и более выборок
S-критерий Джонкира
испытуемых
H-критерий Крускала-Уоллиса
2 замера на одной и той
G-критерий знаков
33
значений
исследуемого
признака.
3.Выявление
различий в
распределении
признака.
4.Выявление
степени
согласованности
изменений.
же выборке испытуемых
3 и более замеров на
одной и той же выборке
испытуемых
при сопоставлении
эмпирического
распределения с
теоретическим
при сопоставлении двух
эмпирических
распределений
двух признаков,
(иерархий)
трех и более признаков
5. Анализ изменений под влиянием одного
признака под
фактора
влиянием
контролируемых
условий
под влиянием двух
факторов
34
T-критерий Вилкоксона
φ-критерий (угловое преобразование
Фишера)
t-критерий Стьюдента
𝜒 2 - критерий Фридмана
L-критерий тенденций Пейджа
𝜒 2 -критерий Пирсона
𝜆-критерий Колмогорова-Смирнова
биномиальный критерий
𝜒 2 -критерий Пирсона
𝜆-критерий Колмогорова-Смирнова
φ-критерий (угловое преобразование
Фишера)
Коэффициент ранговой корреляции
Спирмера
Коэффициент линейной корреляции
Пирсона
Коэффициент корреляции Кендалла
Бисериальный коэффициент
корреляции
Линейная, криволинейная регрессия
Множественная и частная корреляция
Множественная регрессия
Факторный и кластерный анализы
S-критерий Джонкира
L-критерий тенденций Пейджа
однофакторный дисперсионный
анализ Фишера
двухфакторный дисперсионный
анализ Фишера
Глава 6. Выявление различий в уровне признака
В психолого-педагогических исследованиях может возникнуть задача: выявить
различия между двумя, тремя и более выборками испытуемых. Сравнивать выборки можно
по-разному. Например, выборки могут различаться по уровню исследуемого признака. От
того, что брать за уровни для сравнения, будет зависеть, какие критерии можно применять
при исследовании.
Пример. За уровни для сравнения можно взять значения среднего арифметического
исследуемого признака выборок. Сравнив эти значения, можно будет сделать вывод, что
выборки статистически значимо различаются или не различаются по уровню исследуемого
признака. Такую задачу можно решить с помощью параметрического критерия.
При применении непараметрических критериев уровень может быть определен
условно (например, «низкий», «средний», «высокий»). При этом, при сравнении в другой
выборке он может быть просто «выше». Это позволяет сравнивать выборки, для которых
исследуемый признак выражен даже в порядковой шкале, т.е. для качественных данных.
Критерий U-Манна-Уитни.
1.Назначение критерия.
Критерий U-Манна-Уитни является непараметрическим и применяется для
независимых (несвязных) выборок.
Он предназначен для установления различий между двумя выборками по уровню
исследуемого признака.
2.Гипотезы.
Н0: уровень признака в выборке 1 статистически значимо не превышает уровень
признака в выборке 2.
Н1: уровень признака в выборке 1 статистически значимо превышает уровень
признака в выборке 2.
3.Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1. Обозначаем наблюдения каждой из выборок отдельным способом (символом,
цветом).
2. Объединяем выборки в одну и ранжируем.
3. Варианты с соответствующими им рангами делим опять на две первоначальные
выборки и считаем сумму рангов для каждой выборки отдельно.
Рекомендуется проверять правильность расчетов: сумма рангов для объединенной
выборки должна совпадать с суммой рангов для выборок отдельно.
4. Определяем большую их двух ранговую сумму. Обозначим 𝑅𝑚𝑎𝑥 .
5. Эмпирическое значение находим по формуле:
𝑛𝑥 ∙ (𝑛𝑥 + 1)
𝑈эмп = (𝑛1 ∙ 𝑛2 ) +
− 𝑅𝑚𝑎𝑥 ,
2
где 𝑛1 - объемы первой выборки;
𝑛2 - объем второй выборки;
𝑛𝑥 - объем выборки с наибольшей ранговой суммой.
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и объемов выборок:
𝑛1 и 𝑛2 .
Таблица критических значений для критерия Манна-Уитни представлена в Таблице
№2 (см. Приложение).
4. Правило сравнения эмпирического и критического значений.
Н0 принимается, если 𝑈эмп > 𝑈кр .
Н0 отклоняется, если 𝑈эмп ≤ 𝑈кр .
Критическая область располагается слева, а доверительная область справа.
35
5.Ограничения критерия.
Критерий применяется в тех случаях, когда данные представлены, по крайней мере, в
порядковой шкале.
Допускается неравное количество элементов в сравниваемых выборках.
Объем каждой выборки должен быть не менее 3 и не более 60.
Допускается, чтобы объем одной выборки был равен 2, но тогда объем второй должен
быть не менее 5.
Пример. Проведение срезовой контрольной работы по математике (алгебра и
геометрия) в средней общеобразовательной школе дало следующие результаты по 10балльной шкале для класса, обучающегося по программе «Развивающее обучение» (7 «Б»), и
класса, обучающего по традиционной системе (7 «А»).
Определите, превосходит ли учащиеся 7 «Б» учащихся 7 «А» по уровню знаний по
математике?
№
испытуемого
1
2
3
4
5
6
7
8
9
10
11
12
7 «А»
7 «Б»
9
7
7
8
6
4
4
8
6
6
5
5
10
7
8
8
4
6
8
8
9
7
10
Решение.
Исследуется признак – результаты контрольной работы в двух разных классах.
Полученные данные представляют собой две независимые (несвязные) выборки. Требуется
установить различия между двумя выборками по уровню исследуемого признака.
Предварительное сравнение результатов показывает, что баллы, полученные за
контрольную работу в 7 «Б» классе несколько выше. Требуется определить, можно ли
считать имеющуюся разницу между баллами статистически значимой. Если можно, то это
будет означать, что класс, обучающийся по системе развивающего обучения, имеет более
качественные знания по математике.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: уровень результатов контрольной работы в 7 «Б» классе статистически
значимо не превышает уровень в 7 «А» классе.
Н1: уровень результатов контрольной работы в 7 «Б» классе статистически
значимо превышает уровень в 7 «А» классе.
2.Выбор статистического метода.
Для установления различий между двумя независимыми выборками выберем
критерий Манна-Уитни.
3.Вычисление эмпирического значения.
1. Обозначим наблюдения первой выборки за A, второй за Б.
2. Объединим выборки в одну и ее проранжируем.
символ
баллы
36
ранг
9
20,5
А
7
11,5
А
7
11,5
А
8
16,5
А
6
7,5
А
4
2
А
4
2
А
8
16,5
А
6
7,5
А
6
7,5
А
5
4,5
А
5
4,5
Б
10
22,5
Б
7
11,5
Б
8
16,5
Б
8
16,5
Б
4
2
Б
6
7,5
Б
8
16,5
Б
8
16,5
Б
9
20,5
Б
7
11,5
Б
10
22,5
Б
276
сумма
Проверка ранжирования: 𝑛1 = 11, 𝑛2 = 12, 𝑛1 + 𝑛2 = 23 (общее количество
ранжируемых данных),
23∙(23+1)
= 276 (верно)
2
3. Варианты с соответствующими им рангами разделим опять на две первоначальные
выборки и посчитаем сумму рангов для каждой выборки отдельно.
7 «А» ранги
7 «Б» ранги
баллы
баллы
9
20,5
5
4,5
7
11,5
10
22,5
7
11,5
7
11,5
8
16,5
8
16,5
6
7,5
8
16,5
4
2
4
2
4
2
6
7,5
8
16,5
8
16,5
6
7,5
8
16,5
6
7,5
9
20,5
5
4,5
7
11,5
10
22,5
сумма 𝑅1 =107,5
𝑅2 = 168,5
Проверка: 𝑅1 + 𝑅2 = 107,5 + 168,5 = 276 (верно)
4. Определим большую их двух ранговую сумму: 𝑅𝑚𝑎𝑥 = 168,5.
5. Найдем эмпирическое значение:
𝑛1 = 11, 𝑛2 = 12,
𝑛𝑥 = 12 (наибольшая ранговая сумма у второй выборки)
37
12 ∙ (12 + 1)
− 168,5 = 41,5
2
4.Нахождение критического значения.
Объем 1 выборки 𝑛1 = 11, объем 2 выборки 𝑛2 = 12.
По Таблице №2 (см. Приложения):
𝑈кр1 = 38 для уровня значимости 𝑝 = 0,05;
𝑈кр2 = 28 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
при 𝑝 = 0,05, 𝑈эмп = 41,5 > 𝑈кр1 = 38;
при 𝑝 = 0,01, 𝑈эмп = 41,5 > 𝑈кр2 = 28;
6.Формулировка принятия решения.
Гипотеза Н0 принимается, а гипотеза Н1 отклоняется на уровне значимости 𝑝 = 0,01.
Статистически значимые различия результатов контрольной работы по математике не
выявлены. Различия в уровне знаний по математике среди учащихся двух классов
несущественны.
𝑈эмп = (11 ∙ 12) +
t-критерий Стьюдента
(для независимых выборок).
1.Назначение критерия.
Критерий t-Стьюдента является параметрическим и может применяться для
независимых (несвязных) выборок.
Он предназначен для установления различий между двумя выборками. Различие
между выборками устанавливается по такому параметру, как среднее арифметическое
исследуемого признака.
𝑥̅ – среднее арифметическое признака для 1 выборки.
𝑦̅ – среднее арифметическое признака для 2 выборки.
2.Гипотезы.
Н0: 𝑥̅ = 𝑦̅ (средние арифметические исследуемых признаков двух выборок
статистически значимо не различаются).
Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические исследуемых признаков двух выборок
статистически значимо различаются).
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1. Обозначаем исследуемые признаки 1 выборки – 𝑋, 2 выборки – 𝑌.
2. Находим среднее арифметическое для признаков: 𝑥̅ , 𝑦̅.
3. Находим эмпирическое значение по формуле:
|𝑥̅ − 𝑦̅|
𝑡эмп =
,
𝑆𝑑
𝑆𝑑 = √
∑(𝑥𝑖 − 𝑥̅ )2 + ∑(𝑦𝑖 − 𝑦̅)2 (𝑛1 + 𝑛2 )
∙
(𝑛1 + 𝑛2 − 2)
(𝑛1 ∙ 𝑛2 )
где 𝑛1 - объемы первой выборки; 𝑛2 - объем второй выборки.
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и числа степеней
свободы:
𝑘 = 𝑛1 + 𝑛2 − 2.
Таблица критических значений для критерия t-Стьюдента представлена в Таблице №3
(см. Приложение).
4. Правило сравнения эмпирического и критического значений.
Н0 принимается, если 𝑡эмп < 𝑡кр .
38
Н0 отклоняется, если 𝑡эмп ≥ 𝑡кр .
Критическая область располагается справа, а доверительная область слева.
5.Ограничения критерия.
Критерий применяется в тех случаях, когда данные представлены в шкале интервалов
или отношений.
Допускается неравное количество элементов в сравниваемых выборках.
Сравниваемые выборки должны иметь нормальное распределение.
Пример. Для определения стрессоустойчивости было проведено тестирование
испытуемых двух профессий: учителей и менеджеров по продажам. Требуется определить,
отличаются ли две группы статистически значимо по уровню стрессоустойчивости?
Устойчивость к
Устойчивость к
Устойчивость к
Устойчивость к
стрессу (баллы)
стрессу (баллы)
стрессу (баллы)
стрессу (баллы)
учителей
менеджеров
учителей
менеджеров
23
25
16
26
17
24
17
21
18
17
21
24
19
23
25
23
22
24
20
25
18
22
15
22
19
24
16
23
17
20
18
20
20
21
21
22
21
22
20
24
24
23
19
21
19
19
17
20
21
23
18
25
20
21
19
24
22
20
16
22
23
19
22
18
25
Решение.
Исследуется признак – результаты тестирования стрессоустойчивости (в баллах) в
двух группах. Полученные данные представляют собой две независимые (несвязные)
выборки. Требуется установить различия между двумя выборками по уровню исследуемого
признака.
В качестве уровня исследуемого признака выберем среднее арифметическое
исследуемого признака.
𝑥̅ – среднее арифметическое показателя стрессоустойчивости учителей.
𝑦̅ – среднее арифметическое показателя стрессоустойчивости менеджеров.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: 𝑥̅ = 𝑦̅ (средние арифметические показателей стрессоустойчивости учителей и
менеджеров статистически значимо не различаются).
Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические показателей стрессоустойчивости учителей и
менеджеров по продажам статистически значимо различаются).
2.Выбор статистического метода.
Для установления различий между двумя независимыми выборками выберем
критерий Стьюдента.
3.Вычисление эмпирического значения.
39
1. Обозначим исследуемые признаки 1 выборки – 𝑋, 2 выборки – 𝑌.
2. Найдем среднее арифметическое для признаков: 𝑥̅ , 𝑦̅.
Расчеты приведем в таблице:
̅ (𝒙𝒊 − 𝒙
̅
𝒀
𝒙𝒊 − 𝒙
̅ ) 𝟐 𝒚𝒊 − 𝒚
25
3,7
2,7
13,69
24
-2,3
1,7
5,29
17
-1,3
-5,3
1,69
23
-0,3
0,7
0,09
24
2,7
1,7
7,29
22
-1,3
-0,3
1,69
24
-0,3
1,7
0,09
20
-2,3
-2,3
5,29
21
0,7
-1,3
0,49
22
1,7
-0,3
2,89
23
4,7
0,7
22,09
19
-0,3
-3,3
0,09
23
1,7
0,7
2,89
21
0,7
-1,3
0,49
20
2,7
-2,3
7,29
19
3,7
-3,3
13,69
25
-1,3
2,7
1,69
26
-3,3
3,7
10,89
21
-2,3
-1,3
5,29
24
1,7
1,7
2,89
23
5,7
0,7
32,49
25
0,7
2,7
0,49
22
-4,3
-0,3
18,49
23
-3,3
0,7
10,89
20
-1,3
-2,3
1,69
22
1,7
-0,3
2,89
24
0,7
1,7
0,49
21
-0,3
-1,3
0,09
20
-2,3
-2,3
5,29
25
-1,3
2,7
1,69
24
-0,3
1,7
0,09
22
-3,3
-0,3
10,89
22
-0,3
сумма 619 736
191,28
619
736
𝑥̅ =
= 19,3; 𝑦̅ =
= 22,3
32
33
3. Найдем эмпирическое значение:
𝑿
23
17
18
19
22
18
19
17
20
21
24
19
21
20
22
23
18
16
17
21
25
20
15
16
18
21
20
19
17
18
19
16
(𝒚𝒊 − 𝒚
̅ )𝟐
7,29
2,89
28,09
0,49
2,89
0,09
2,89
5,29
1,69
0,09
0,49
10,89
0,49
1,69
5,29
10,89
7,29
13,69
1,69
2,89
0,49
7,29
0,09
0,49
5,29
0,09
2,89
1,69
5,29
7,29
2,89
0,09
0,09
140,97
191,28 + 140,97 (32 + 33)
𝑆𝑑 = √
∙
= √0,32 = 0,57
(32 + 33 − 2)
(32 ∙ 33)
|19,3 − 22,3|
𝑡эмп =
= 5,26.
0,57
4.Нахождение критического значения.
Объем 1 выборки 𝑛1 = 32, объем 2 выборки 𝑛2 = 33.
Число степеней свободы: 𝑘 = 32 + 33 − 2 = 63.
По Таблице №3 (см. Приложения):
40
𝑡кр1 = 3,46 для уровня значимости 𝑝 = 0,05;
𝑡кр2 = 2,66 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
при 𝑝 = 0,05, 𝑡эмп = 5,26 ≥ 𝑡кр1 = 3,46;
при 𝑝 = 0,01, 𝑡эмп = 5,26 ≥ 𝑡кр1 = 2,66;
6.Формулировка принятия решения.
Гипотеза Н1 принимается, а гипотеза Н0 отклоняется на уровне значимости 𝑝 = 0,01.
Между уровнем стрессоустойчивости учителей и менеджеров по продажам выявлены
статистически значимые различия. У менеджеров по продажам в отличие от учителей
средний уровень стрессоустойчивости выше.
Замечание. Ограничением применения данного критерия является необходимость,
чтобы данные имели нормальное распределение. Как доказать, что данные имеют
нормальное распределение, рассмотрим ниже. Приближенно оценим распределения по
диаграммам частот.
Диаграмма
Диаграмма
для переменной Х
для переменной Y
Перемен.: Пер2, Рас пред.:Нормальное
Перемен.: Пер1, Рас пред.:Нормальное
Хи-квадрат: ------ , cc = 0 , p = ---
14
12
12
10
10
Число наблюдений
Число наблюдений
Хи-квадрат: ------ , cc = 0 , p = ---
14
8
6
8
6
4
4
2
2
0
0
13,0
15,6
18,2
20,8
23,4
15,4
26,0
17,6
19,8
22,0
24,2
26,4
Визуально нельзя точно сказать, что данные имеют нормальное распределение.
Статистические выводы носят приближенный характер.
Группа (верхние границы)
Группа (верхние границы)
Упражнения.
1. Имеются данные об итоговой успеваемости (по 10-бальной системе) студентов,
посещавших факультативные занятия по данному предмету и не посещавших. Определить,
имеются ли различия между этими двумя группами студентов?
Посещавшие 8
8
7
9
8
6
7
8
6
5
8
10 6
8
9
Не
5
6
7
6
8
7
7
5
8
6
5
9
6
7
5
посещавшие
2. Две группы выпускников двух высших заведений получили оценки своих
административных способностей (в баллах), приведенные ниже в таблице. Можно ли
утверждать, что не существует различия в уровне подготовки выпускников вузов?
1
26
22
19
21
14
18
29
17
11
34
ВУЗ
2
16
10
8
13
19
11
7
13
9
21
ВУЗ
3. Имеются показатели уровня интеллекта IQ среди группы детей и их родителей.
Определить, имеются ли различия между родителями и детьми по уровню интеллекта?
Родители
117 108 121 106 117 105 118 128 116 122
Дети
109 119 110 123 109 122 102 90 111 92
Родители 98 128 99 126 103
41
Дети 111
111 116 98
121
4. Можно ли утверждать, что у девочек наблюдается более высокий уровень
готовности к профессиональному самоопределению, чем у мальчиков?
Девочки
10,5 7,5 10,5 9,5 10 9,5 10 10 10,5 10 10,5 9 8,5
Мальчики 3
10,5 6,5 10 7,5 9
5,5 9,5 7
7 6
5. Изучались психологические особенности школьников 9-а и 9-в классов. Оцените,
различаются ли оценки интеллекта у учеников обоих классов?
Учащиеся 9-а класса 16 16 20 14 18 20 23 19 18 21 19 21 18
Учащиеся 9-в класса 19 19 10 13 18 13 11 16 16 16 11 13 11
6. При переходе из младшего звена школы в пятый класс у учащихся городской и
сельской школ проведен тест на общую осведомленность. Будут ли обнаружены
статистически значимые различия по общей осведомленности между учащимися городской и
сельской школ?
Городские школьники 8 9 8 9 8 9 10 8 9 9 7 7 8 9
Сельские школьники 6 6 8 8 4 5 7 9 8 9 5 7 7 4
7. У студенток химического и гуманитарного факультетов был измерен уровень
вербального интеллекта. Можно ли утверждать, что «студентки-гуманитарии» имеют более
высокий уровень вербального интеллекта?
Студентки химического 14 12 14 11 8 5 12 17 22
факультета
Студенки гуманитарного 9 12 15 27 16 5 7 6 15
факультета.
42
Глава 7. Оценка сдвига значений признака
В психолого-педагогических исследованиях бывает необходимо доказать, что в
результате действий каких-либо факторов произошли достоверные изменения (сдвиги) в
измеряемых показателях.
Сдвиг – это разность между вторым и первым замерами.
Выделяют:
1. Временной сдвиг, когда сравнивают данные, полученные на одной и той же
выборке, но в разное время.
2. Ситуационный сдвиг, когда сравнивают данные, полученные на одной и той же
выборке, но в разных условиях измерения (например, «покоя» и «стресса»)
3. Сдвиг под влиянием контролируемых или не контролируемых воздействий,
когда сравнивают данные, полученные на одной и той же выборке, но замеры произведены
до и после экспериментального воздействия (например, мы можем проверить,
способствовал ли проведенный тренинг увеличению мотивации в обучении или нет?)
В данном случае необходимо обязательно ввести контрольную группу, которая не
испытывала на себе воздействия данного экспериментального фактора. Если нет
контрольной группы, то сдвиг в экспериментальной группе может объясняться действием
самых разных причин, например, временем суток в которое производились замеры и т.д.
Мы никогда не сможем исключить той возможности, что изменения, достигнутые, как нам
кажется, в результате наших воздействий, на самом деле объясняются неучтенными
причинами. Если в экспериментальной группе сдвиги окажутся достоверными, а в
контрольной группе – недостоверными, то это, действительно, может свидетельствовать об
эффективности воздействий. При отсутствии контрольной группы мы констатируем лишь,
что сдвиг произошел, но не имеем права приписывать его именно изучаемым нами факторам
воздействия.
Критерий Т-Вилкоксона
1.Назначение критерия.
Критерий Т-Вилкоксона является непараметрическим и применяется только для
зависимых (связных) выборок.
Он предназначен для установления выраженности (интенсивности) сдвига
исследуемого признака.
2.Гипотезы.
Н0:интенсивность сдвигов в типичном направлении статистически значимо не
превосходит интенсивность сдвигов в нетипичном направлении.
Н1:интенсивность сдвигов в типичном направлении статистически значимо
превышает интенсивность сдвигов в нетипичном направлении.
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1.Подсчитываем сдвиги. Определяем, какие сдвиги типичные, а какие нетипичные.
Сдвиги, количество которых получилось наибольшим, называются типичными
сдвигами.
Сдвиги, количество которых получилось наименьшим, называются нетипичные
сдвиги.
Замечание: нулевые сдвиги в расчетах не учитываются.
2.Вычисяем абсолютную величину сдвигов и их ранжируем.
3. Находим эмпирическое значение как сумму нетипичных сдвигов. Обозначим 𝑇эм .
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и объема выборки 𝑛
(𝑛1 = 𝑛2 = 𝑛.)
43
Таблица критических значений для критерия T-Вилкоксона представлена в Таблице
№4 (см. Приложение).
4. Правило сравнения эмпирического и критического значений.
Н0 принимается, если 𝑇эмп > 𝑇кр .
Н0 отклоняется, если 𝑇эмп ≤ 𝑇кр .
Критическая область располагается слева, а доверительная область справа.
5.Ограничения критерия.
Этот критерий применим в тех случаях, когда признаки измерены, по крайней мере, в
шкале порядка.
Не допускается неравное количество элементов в сравниваемых выборках. Замеры
производятся на одной группе испытуемых.
Минимальный объем выборки – 5, максимальный – 50.
Пример. Способствовал ли проведенный тренинг улучшению вербальной памяти
учащихся, измеренной в баллах?
№
испытуемого
1
2
3
4
5
6
7
8
9
10
до
после
6
5
4
3
7
6
4
4
5
6
8
5
6
4
7
7
5
3
8
7
Решение.
Исследуется признак – вербальная память в баллах в одной и той же группе
испытуемых «до» и «после» проведения тренинга. Следовательно, полученные наблюдения
представляют собой две связные выборки.
Преобладает положительное направление сдвига показателя вербальной памяти (в
сторону повышения). Требуется определить, можно ли считать имеющийся положительный
сдвиг выраженным (интенсивным) статистически значимо.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: интенсивность положительного сдвига показателя вербальной памяти после
тренинга не является статистически значимой.
Н1: интенсивность положительного сдвига показателя вербальной памяти после
тренинга является статистически значимой.
2.Выбор статистического метода.
Для установления интенсивности сдвига для двух связных выборок выберем критерий
Вилкоксона.
3.Вычисление эмпирического значения.
1.Посчитаем сдвиги и определим, какие сдвиги типичные, а какие нетипичные.
№
испытуемого
1
до
после
сдвиг
6
8
+2
44
2
3
4
5
6
7
8
9
10
5
4
3
7
6
4
4
5
6
5
6
4
7
7
5
3
8
7
0
+2
+1
0
+1
+1
-1
+3
+1
Отрицательные сдвиги – «нетипичные» сдвиги (их меньше – 1шт).
Положительные сдвиги – «типичные» сдвиги (их больше – 7шт).
Нулевые сдвиги не учитываются (их – 2шт).
2.Вычислим абсолютную величину сдвигов и их проранжируем.
Добавим два дополнительных столбца для дальнейших расчетов:
-в столбец «абсолютный сдвиг» запишем значения сдвигов без знаков;
-в столбце «ранг абсолютного сдвига» проранжируем значения из столбца
«абсолютный сдвиг».
№
сдвиг
испытуемого
1
2
3
4
5
6
7
8
9
10
сумма
Проверка ранжирования:
+2
0
+2
+1
0
+1
+1
-1
+3
+1
10∙(10+1)
2
абсолютный ранг
сдвиг
абсолютного
сдвига
2
8,5
0
1,5
2
8,5
1
5
0
1,5
1
5
1
5
1
(5)
3
10
1
5
55
= 55 (верно)
3. Найдем эмпирическое значение.
Запишем ранги нетипичных сдвигов в скобках (в примере это лишь одно число).
Тэм = 5.
4.Нахождение критического значения.
Объем выборки 𝑛 = 𝑛1 = 𝑛2 = 10.
По Таблице №4 (см. Приложения):
Ткр1 = 10 для уровня значимости 𝑝 = 0,05;
Ткр2 = 5 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
при 𝑝 = 0,05, 𝑇эмп = 5 ≤ 𝑇кр1 = 10;
при 𝑝 = 0,01, 𝑇эмп = 5 ≤ 𝑇кр2 = 5;
6.Формулировка принятия решения.
Гипотеза Н0 отклоняется и принимается гипотеза Н1 на ровне значимости р = 0,01.
45
Выявлена статистически значимая интенсивность положительного сдвига показателя
вербальной памяти учащихся. На высоком уровне значимости можно утверждать, что
тренинг способствовал повышению вербальной памяти.
t-критерий Стьюдента (для зависимых выборок)
1.Назначение критерия.
Критерий t-Стьюдента является параметрическим и может применяться для
зависимых (связных) выборок.
Критерий предназначен для исследования сдвига между показателями двух замеров
изучаемого признака. Сравниваются средние арифметические показателей замеров.
𝑥̅ – среднее арифметического признака для 1 замера (выборки).
𝑦̅ – среднее арифметического признака для 2 замера (выборки).
2.Гипотезы.
Н0: 𝑥̅ = 𝑦̅ (средние арифметические двух замеров статистически значимо не
различаются).
Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические двух замеров
статистически значимо
различаются).
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1. Обозначаем исследуемые признаки 1 замера – 𝑋, 2 замера – 𝑌.
2. Находим среднее арифметическое для замеров: 𝑥̅ , 𝑦̅.
3. Эмпирическое значение находим по формуле:
|𝑑̅ |
𝑡эмп =
,
𝑆𝑑
𝑆𝑑 = √(∑ 𝑑𝑖2 −
(∑ 𝑑𝑖 )2
) /(𝑛2 − 𝑛)
𝑛
где 𝑑𝑖 = 𝑥𝑖 − 𝑦𝑖 – сдвиги исследуемого признака;
𝑑̅ – среднее арифметическое сдвигов; 𝑛 = 𝑛1 = 𝑛2 - объем выборок.
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и числа степеней
свободы:
𝑘 = 𝑛 − 1.
Таблица критических значений для критерия t-Стьюдента представлена в Таблице №3
(см. Приложение).
4. Правило сравнения эмпирического и критического значений.
Н0 принимается, если 𝑡эмп < 𝑡кр .
Н0 отклоняется, если 𝑡эмп ≥ 𝑡кр .
Критическая область располагается справа, а доверительная область слева.
5.Ограничения критерия.
Критерий применяется в тех случаях, когда данные представлены в шкале интервалов
или отношений.
Не допускается неравное количество элементов в сравниваемых выборках. Замеры
производятся на одной группе испытуемых.
Сравниваемые выборки (замеры) должны иметь нормальное распределение.
Пример. Способствует ли научение значимому уменьшению времени решения
эквивалентных задач, т.е. имеющихся один и тот же алгоритм решения? Время решения
измерено в минутах.
№
1 задача 3 задача
испытуемого
46
1
2
3
4
5
6
7
8
4,0
3,5
4,1
5,5
4,6
6,0
5,1
4,3
3,0
3,0
3,8
2,1
4,9
5,3
3,1
2,7
Решение.
Исследуется признак – время решения эквивалентных задач в одной и той же группе
испытуемых в процессе научения. Следовательно, полученные наблюдения представляют
собой две связные выборки.
Преобладает отрицательное направление сдвига времени решения задач (в сторону
уменьшения). Требуется определить, можно ли считать имеющийся отрицательный сдвиг
выраженным статистически значимым.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: 𝑥̅ = 𝑦̅ (средние арифметические времени решения 1 и 3 задачи статистически
значимо не отличаются).
Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические времени решения 1 и 3 задачи статистически
значимо отличаются).
2.Выбор статистического метода.
Для сравнения средних арифметических сдвигов для двух связных выборок выберем
критерий t-Стьюдента.
3.Вычисление эмпирического значения.
1. Обозначим исследуемые признаки 1 замера – 𝑋, 2 замера – 𝑌.
№
сдвиг
сдвиг в квадрате
𝑋
𝑌
испытуемого
𝒅𝒊
𝒅𝟐𝒊
1
4
3
-1
1
2
3,5
3
-0,5
0,25
3
4,1
3,8
-0,3
0,09
4
5,5
2,1
-3,4
11,56
5
4,6
4,9
0,3
0,09
6
6
5,3
-0,7
0,49
7
5,1
3,1
-2
4
8
4,3
2,7
-1,6
2,56
37,1
27,9
-9,2
20,04
сумма
2. Найдем среднее арифметическое для замеров: 𝑥̅ , 𝑦̅.
37,1
27,9
𝑥̅ =
= 4,64; 𝑦̅ =
= 3,49.
8
8
3. Найдем эмпирическое значение:
−9,2
𝑑̅ =
= −1,15
8
(−9,2)2
𝑆𝑑 = √(20,04 −
) /(82 − 8) = 0,41
8
|−1,15|
𝑡эмп =
= 2,8,
0,41
4.Нахождение критического значения.
Объем выборки 𝑛 = 𝑛1 = 𝑛2 = 8.
47
Число степеней свободы: 𝑘 = 8 − 1 = 7.
По Таблице №3 (см. Приложения):
𝑡кр1 = 2,37 для уровня значимости 𝑝 = 0,05;
𝑡кр2 = 3,5 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
при 𝑝 = 0,05, 𝑡эмп = 2,8 ≥ 𝑡кр1 = 2,37;
при 𝑝 = 0,01, 𝑡эмп = 2,8 < 𝑡кр2 = 3,5;
6.Формулировка принятия решения.
Гипотеза Н0 отклоняется и принимается гипотеза Н1 на уровне значимости р = 0,05
и, одновременно, гипотеза Н0 принимается на уровне значимости р = 0,01.
Только на уровне значимости р = 0,05 установлено, что среднее время решения
третье задачи существенно меньше среднего времени решения первой задачи. Научение
способствовало уменьшению времени решения задач.
Если провести исследование на выборке большего объема, возможно, удастся
установить такой же результат на более высоком уровне значимости.
Замечание. Ограничением применения данного критерия является необходимость,
чтобы данные имели нормальное распределение.
Приближенно оценим распределение по диаграмме частот.
Диаграмма
Диаграмма
для переменной Х
для переменной Y
Перемен.: Пер3, Рас пред.:Нормальное
Перемен.: Пер4, Рас пред.:Нормальное
Хи-квадрат: ------ , cc = 0 , p = ---
Хи-квадрат: ------ , cc = 0 , p = ---
3,5
4,5
4,0
3,0
3,5
Число наблюдений
Число наблюдений
2,5
2,0
1,5
3,0
2,5
2,0
1,5
1,0
1,0
0,5
0,5
0,0
0,0
3,2
4,0
4,8
5,6
6,4
2,10
3,15
4,20
5,25
6,30
Группа (верхние границы)
Группа (верхние границы)
Визуально видно, что распределения переменных не имеют нормальное
распределение. Применять данный метод для данного примера некорректно. Статистические
выводы нельзя считать обоснованными. Также не рекомендуется применять
параметрические критерии при малом объеме выборки.
Необходимо увеличить объем выборки или применить другой критерий для решения
данной задачи.
Упражнения
1. Имеются данные о результатах группы учащихся по скоростному чтению до и
после специального курса по быстрому чтению. Определить, произошли ли статистически
значимые изменения скорости чтения у учащихся?
До
86 83 86 70 66 90 70 85 77 86
После 82 79 91 77 68 86 81 90 85 94
2. Имеются данные о физической подготовке спортсменов при поступлении на
факультет физической культуры и после первого семестра. Определить, произошли ли
статистически значимые изменения физической подготовки у спортсменов?
«при
75 72 55 60 68 28 65 58 71 48
поступлении»
48
«после
1 семестра»
80
85
51
60
62
35
83
61
87
52
3. Для определения «остаточных» знаний у студентов по математике им было
предложено 10 задач: после изучения дисциплины в конце второго курса, а затем через три
года – на пятом курсе. Можно ли утверждать, что количество решенных задач после трех лет
значимо не различается?
На 2 курсе 6 7 4 5 8 4 7 4 9 7
На 5 курсе 5 6 4 5 3 5 6 6 4 6
4. Перед началом учебного первого учебного года был измерен уровень интеллекта у
группы студентов. В начале второго учебного года при помощи параллельной методики
вновь был измерен уровень интеллекта. Можно ли сказать, что за год обучения
интеллектуальный уровень студентов значимо изменился?
Начальный 100 102 105 120 110 106 109 115 114 111 120 125
срез
Конечный 116 102 114 119 119 116 100 121 118 119 122 121
срез
5. Представлены результаты по количеству правильно выполненных заданий.
Сравнить эффективность до и после применения методики обучения на одной группе
студентов.
«до»
12 9 11 10 9 12 7 16 25 22 14 24 9 15 15
«после» 13 9 10 15 8 16 9 16 23 22 20 26 8 15 15
19 10 24 11 11
21 10 25 11 10
6. Будет ли разработанная программа способствовать снижению эмоциональных
барьеров в общении у старшеклассников?
«до»
9
9 7 10 5 5 11 6 10 10 3 10 8 10
«после» 8
9 9 6 5 7 11 7 15 10 5 6 9 8
13
8 10 12 9
12
8
8 14 9
49
Глава 8. Выявление различий в распределении признака
Еще одним способом установить различия между выборками является способ
сравнить распределения исследуемого признака. Распределение признака в выборке можно
представить в виде соответствия вариант (интервалов) и их частот (таблица частот или
интервальная таблица частот). Это позволит сравнить выборки, для которых признак
измерен даже в номинальной шкале. Также выборки могут иметь одинаковый уровень
исследуемого признака, но при этом разное распределение признака, т.е. выборки по уровню
признака могут не различаться, а по распределению признака различаться.
Пример. Средняя оценка за одинаковую контрольную в разных классах может
совпадать, но при этом в классах будет разная вариативность оценок. В одном классе
большинство оценок близко к среднему значению, а в другом классе много оценок как выше,
так и ниже среднего значения. Классы будут различать по дифференцированности знаний.
Критерий 𝝌𝟐 -Пирсона («хи-квадрат»)
(сравнение эмпирических распределений).
1.Назначение критерия.
Критерий предназначен для сравнения эмпирических распределений одного и того же
признака.
2.Гипотезы.
Н0: Эмпирические распределения выборок статистически значимо не различаются.
Н1: Эмпирические распределения выборок статистически значимо различаются.
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1. Для эмпирических частот - 𝑛𝑖_э считаем суммы по строкам и столбцам.
2. Для каждой эмпирической частоты вычисляем соответствующие теоретические
частоты - 𝑛𝑖_т .
При сравнении двух независимых выборок:
сумма частот
сумма частот
( по строке ) ∙ ( по столбцу )
𝑛𝑖_т =
общее количество данных
3. Находим эмпирическое значение по формуле:
𝑘
(𝑛𝑖_э − 𝑛𝑖_т )
𝜒2 = ∑
𝑛𝑖_т
𝑖=1
2
𝑘- количество вариант (или интервалов).
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и числа степеней
свободы:
𝜈 = (𝑟 − 1) ∙ (𝑐 − 1), где r – число строк, а 𝑐 – число столбцов.
Таблица критических значений для критерия 𝜒 2 -Пирсона представлена в Таблице №5
(см. Приложение).
4. Правило сравнения эмпирического и критического значений.
2
2
Н0 принимается, если 𝜒эмп
< 𝜒кр
.
2
2
Н0 отклоняется, если 𝜒эмп ≥ 𝜒кр .
Критическая область располагается справа, а доверительная область слева.
5.Ограничения критерия.
При 𝑛 < 30 критерий дает приближенные значения. Точность критерия повышается
при больших объемах выборки.
Для большей точности критерия требуется, чтобы теоретическая частота для каждого
разряда была больше пяти 𝑛𝑖_т ≥ 5. Если условие не выполняется, то рекомендуют соседние
разряды объединить так, чтобы суммарная частота оказалась не менее пяти.
50
Если в задаче число степеней свободы равно единице 𝜈 = 1, то при вычислении
эмпирического значения необходимо делать «поправку на непрерывность». В этом случае
эмпирическое значение находим по формуле:
𝑘
(|𝑛𝑖_э − 𝑛𝑖_т | − 0,5)
𝜒 =∑
𝑛𝑖_т
2
2
𝑖=1
Пример. В ходе социологического опроса среди взрослых сотрудников, на вопрос о
перенесенном в детстве заболевании ответы распределились следующим образом:
Да
Нет
Не помню
Мужчины
58
11
10
Женщины
35
25
23
Определить, имеются ли достоверные отличия в ответах женщин и мужчин?
Решение.
Исследуется признак – результаты социологического опроса в двух разных группах
(мужичины и женщины). Полученные данные представляют собой две независимые
(несвязные) выборки. Требуется установить различия между двумя выборками по
распределению исследуемого признака.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: Эмпирические распределения выборок статистически значимо не различаются.
Н1: Эмпирические распределения выборок статистически значимо различаются.
2.Выбор статистического метода.
Для установления различий между выборками по распределению исследуемого
признака выберем критерий 𝜒 2 -Пирсона («хи-квадрат»).
3.Вычисление эмпирического значения.
1. Для эмпирических частот посчитаем суммы по строкам и столбцам.
Да
Нет
Не помню
сумма
Мужчины
58
11
10
79
Женщины
35
25
23
83
сумма
93
36
33
162
2. Для каждой эмпирической частоты вычислим соответствующие теоретические
частоты.
Да
Нет
Не помню
сумма
Мужчины (79 ∙ 93)/162 (79 ∙ 36)/162 (79 ∙ 33)/162
79
Женщины (83∙ 93)/162
83
(83∙ 36)/162 (83 ∙ 33)/162
сумма
93
36
33
162
Да
Нет
Мужчины
45,35
17,56
Женщины
47,65
18,44
сумма
93
36
3. Найдем эмпирическое значение.
Расчеты оформим в таблице:
𝑛𝑖_э
𝑛𝑖_т
(𝑛𝑖_э − 𝑛𝑖_т )
58
11
10
35
45,35
17,56
16,09
47,65
12,65
-6,56
-6,09
-12,65
51
Не помню
16,09
16,91
33
(𝑛𝑖_э − 𝑛𝑖_т )
160,02
43,03
37,09
160,02
сумма
79
83
162
2
(𝑛𝑖_э − 𝑛𝑖_т )
𝑛𝑖_т
3,53
2,45
2,31
3,36
2
25
18,44
6,56
43,03
2,33
23
16,91
6,09
37,09
2,19
сумма
162
162
0
16,17
∑(𝑛
Выполним проверку расчетов:
𝑖_э − 𝑛𝑖_т ) = 0 (верно).
𝜒 2 = 16,17
4.Нахождение критического значения.
Число степеней свободы: 𝜈 = (2 − 1) ∙ (3 − 1) = 2.
По Таблице №5 (см. Приложения):
𝜒 2 = 5,991 для уровня значимости 𝑝 = 0,05;
𝜒 2 = 9,210 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
2
2
при 𝑝 = 0,05, 𝜒эмп
= 16,17 ≥ 𝜒кр
= 5,991;
2
2
при 𝑝 = 0,01, 𝜒эмп = 16,17 ≥ 𝜒кр = 9,210;
6.Формулировка принятия решения.
Гипотеза Н1 принимается, а гипотеза Н0 отклоняется на уровне значимости 𝑝 = 0,01.
Выявлены статистически значимые различия результатов социологического опроса
между мужичинами и женщинами.
Пример. Имеются данные о результатах оценки студентами условий проживания в
общежитиях. Определить, зависит ли оценка от общежития?
Оценка
Отрицательная
Положительная
Общежитие
№1
№2
15
18
34
38
Решение.
Исследуется признак – результаты оценки студентами условий проживания в
зависимости от общежития (общежитие №1 и №2). Полученные данные представляют собой
две независимые (несвязные) выборки. Требуется установить различия между двумя
выборками по распределению исследуемого признака.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: Эмпирические распределения выборок статистически значимо не различаются.
Н1: Эмпирические распределения выборок статистически значимо различаются.
2.Выбор статистического метода.
Для установления различий между выборками по распределению исследуемого
признака выберем критерий 𝜒 2 -Пирсона («хи-квадрат»).
3.Вычисление эмпирического значения.
1. Для эмпирических частот посчитаем суммы по строкам и столбцам.
№1 №2
сумма
Отрицательная
15
18
33
Положительная 34
38
72
сумма
49
56
105
2. Для каждой эмпирической частоты вычислим соответствующие теоретические
частоты.
№1
№2
сумма
Отрицательная (33 ∙ 49)/105 (33 ∙ 56)/105
33
Положительная (72 ∙ 49)/105 (72 ∙ 56)/105
72
сумма
49
56
105
52
№1
15,4
33,6
49
№2
17,6
38,4
56
сумма
33
72
105
Отрицательная
Положительная
сумма
3. Найдем эмпирическое значение.
Замечание. Число степеней свободы: 𝜈 = (2 − 1) ∙ (2 − 1) = 1.
При вычислении эмпирического значения необходимо выполнить «поправку на
непрерывность».
Расчеты оформим в таблице:
𝑛𝑖_э
𝑛𝑖_т
(𝑛𝑖_э − 𝑛𝑖_т )
|𝑛𝑖_э − 𝑛𝑖_т |
|𝑛𝑖_э − 𝑛𝑖_т | − 0,5
15
15,4
-0,4
0,4
-0,1
18
17,6
0,4
0,4
-0,1
34
33,6
0,4
0,4
-0,1
38
38,4
-0,4
0,4
-0,1
сумма
105
105
0
2
2
(|𝑛𝑖_э − 𝑛𝑖_т | − 0,5)
𝑛𝑖_т
0,01
0,0006
0,01
0,0006
0,01
0,0003
0,01
0,0003
сумма
0,0018
Выполним проверку расчетов: ∑(𝑛𝑖_э − 𝑛𝑖_т ) = 0 (верно).
𝜒 2 = 0,0018
4.Нахождение критического значения.
Число степеней свободы: 𝜈 = 1.
По Таблице №5 (см. Приложения):
𝜒 2 = 3,841 для уровня значимости 𝑝 = 0,05;
𝜒 2 = 6,635 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
2
2
при 𝑝 = 0,05, 𝜒эмп
= 0,0018 < 𝜒кр
= 3,841;
2
2
при 𝑝 = 0,01, 𝜒эмп = 0,0018 < 𝜒кр = 6,635;
6.Формулировка принятия решения.
Гипотеза Н1 отклоняется, а гипотеза Н0 принимается на уровне значимости 𝑝 = 0,01.
Между оценками студентами условий проживания в зависимости от общежития не
выявлены статистически значимые различия.
(|𝑛𝑖_э − 𝑛𝑖_т | − 0,5)
Критерий 𝝌𝟐 -Пирсона («хи-квадрат»)
(сравнение эмпирического и теоретического распределений).
1.Назначение критерия.
Критерий предназначен для сравнения эмпирического распределения признака с
теоретическим – равномерным, нормальным или каким-то иным.
2.Гипотезы.
Н0: Эмпирическое распределение выборки статистически значимо не отличается от
теоретического распределения.
Н1: Эмпирическое распределение выборки статистически значимо отличается от
теоретического распределения.
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
53
1. Вычисляем теоретические частоты -𝑛𝑖_т .
а) если теоретическое распределение равномерное, то:
𝑛
𝑛𝑖_т = ,
𝑘
где 𝑛- объем выборки, 𝑘 – количество вариант (или интервалов).
б) если теоретическое распределение нормальное, то необходимо:
1) вычислить среднее арифметическое выборки - 𝑥̅ ;
2) вычислить стандартное отклонение выборки - 𝜎;
3) выполнить нормирование для каждого интервала по формуле:
𝑥𝑖 − 𝑥̅
𝑧𝑖 =
,
𝜎
где 𝑥𝑖 – середины интервалов.
4) вычислить значения функции стандартного нормального распределения 𝜑(𝑧𝑖 ) по
Таблице №1 (см. Приложение).
5) вычислить теоретические частоты по формуле:
𝑛ℎ𝑖
𝑛𝑖_т =
∙ 𝜑(𝑧𝑖 ),
𝜎
где 𝑛- объем выборки, ℎ𝑖 – длины интервалов.
2. Находим эмпирическое значение по формуле:
𝑘
(𝑛𝑖_э − 𝑛𝑖_т )
𝜒 =∑
𝑛𝑖_т
2
2
𝑖=1
𝑘- количество интервалов.
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и числа степеней
свободы.
а) для равномерного распределения:
𝜈 = 𝑘 − 1, где 𝑘- количество вариант (или интервалов).
б) для нормального распределения:
𝜈 = 𝑘 − 3, где 𝑘- количество интервалов.
Таблица критических значений для критерия 𝜒 2 -Пирсона представлена в Таблице №5
(см. Приложение).
4. Правило сравнения эмпирического и критического значений.
2
2
Н0 принимается, если 𝜒эмп
< 𝜒кр
.
2
2
Н0 отклоняется, если 𝜒эмп ≥ 𝜒кр .
Критическая область располагается справа, а доверительная область слева.
5.Ограничения критерия.
Ограничения аналогичные случаю сравнения двух эмпирических распределений.
Объем выборки должен быть достаточно большим. Не рекомендуется сравнивать
эмпирическое и теоретическое распределения при 𝑛 < 30.
Теоретическая частота для каждого разряда (интервала) должна быть больше пяти
𝑛𝑖_т ≥ 5, иначе требуется соседние разряды объединять.
Аналогично при числе степеней свободы 𝜈 = 1 необходимо делать «поправку на
непрерывность».
Пример. В эксперименте подбрасывают игральный кубик с цифрами на гранях от 1
до 6. В результате эксперимента получены следующие результаты подбрасывания кубика:
Грани кубика
1
2
3
4
5
6
эмпирические частоты
12
9
11
14
8
6
54
Игральный кубик будет считаться «идеальным», если при достаточно большом числе
подбрасываний каждая его грань выпала примерно равное число раз. Необходимо выяснить,
можно ли считать подбрасываемый кубик «идеальным»?
Решение.
Исследуется признак – результаты выпадения игрального кубика на определенную
грань. Полученные данные представляют собой распределение частот исследуемого
признака (эмпирическое распределение). Требуется сравнить эмпирическое распределение
исследуемого признака с равномерным распределением.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: Эмпирическое распределение выборки статистически значимо не отличается от
равномерного распределения.
Н1: Эмпирическое распределение выборки статистически значимо отличается от
равномерного распределения.
2.Выбор статистического метода.
Для сравнения распределения исследуемого признака выборки с равномерным
распределением выберем критерий 𝜒 2 -Пирсона («хи-квадрат»).
3.Вычисление эмпирического значения.
1. Вычислим теоретические частоты.
Для каждой варианты (грани):
60
𝑛𝑖_т = 6 = 10, 𝑛 = 60, 𝑘 = 6.
2. Найдем эмпирическое значение.
Расчеты оформим в таблице:
𝟐
𝟐
Грани
𝒏𝒊_э
𝒏𝒊_т
(𝒏𝒊_э − 𝒏𝒊_т )
(𝒏𝒊_э − 𝒏𝒊_т )
(𝒏𝒊_э − 𝒏𝒊_т )
кубика
𝒏𝒊_т
1
12
10
2
4
0,4
2
9
10
-1
1
0,1
3
11
10
1
1
0,1
4
14
10
4
16
1,6
5
8
10
-2
4
0,4
6
6
10
-4
16
1,6
сумма
60
60
0
4,2
Выполним проверку расчетов: ∑(𝑛𝑖_э − 𝑛𝑖_т ) = 0.
𝜒 2 = 4,2
4.Нахождение критического значения.
для равномерного распределения:
𝜈 = 6 − 1 = 5, где 𝑘 = 6 - количество вариант.
По Таблице №5 (см. Приложения):
𝜒 2 = 11,070 для уровня значимости 𝑝 = 0,05;
𝜒 2 = 15,086 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
2
2
при 𝑝 = 0,05, 𝜒эмп
= 4,2 < 𝜒кр
= 11,070;
2
2
при 𝑝 = 0,01, 𝜒эмп = 4,2 < 𝜒кр = 15,086;
6.Формулировка принятия решения.
Гипотеза Н0 принимается, а гипотеза Н1 отклоняется на уровне значимости 𝑝 = 0,01.
Между эмпирическим и равномерным распределением не выявлены статистически
значимые различия. Подбрасываемый кубик можно считать «идеальным».
Пример. В результате выборочного обследования стажа работы профессорскопреподавательского состава получены следующие данные:
55
Стаж работы (лет)
0-4 4-8 8-12 12-16 16-20 20-24 24-28 28-32
Число преподавателей 3
8
25
40
46
31
6
2
Выяснить, является ли распределение стажа работы нормальным?
Решение.
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: Эмпирическое распределение выборки статистически значимо не отличается от
нормального распределения.
Н1: Эмпирическое распределение выборки статистически значимо отличается от
нормального распределения.
2.Выбор статистического метода.
Для сравнения распределения исследуемого признака выборки с нормальным
распределением выберем критерий 𝜒 2 -Пирсона («хи-квадрат»).
3.Вычисление эмпирического значения.
1. Вычислим теоретические частоты.
Промежуточные вычисления оформим в таблице.
Интервалы
Частота Середина
𝒙𝒊 ∙ 𝒏𝒊_э
𝒙𝒊 𝟐 ∙ 𝒏𝒊_э
𝒙𝒊 𝟐
𝒏𝒊_э
𝒙𝒊
[0; 4)
3
2
6
4
12
[4; 8)
8
6
48
36
288
[8; 12)
25
10
250
100
2500
[12; 16)
40
14
560
196
7840
[16; 20)
46
18
828
324
14904
[20; 24)
31
22
682
484
15004
[24; 28)
6
26
156
676
4056
[28; 32)
2
30
60
900
1800
сумма
161
2590
46404
1) среднее арифметическое выборки:
2590
𝑥̅ =
≈ 16,09
161
2) стандартное отклонение выборки:
46404
𝐷=
− 16,092 ≈ 29,33
161
𝜎 = √29,33 ≈ 5,42
̅ 𝝋(𝒛𝒊 )
𝒙𝒊 − 𝒙
𝒏𝒉𝒊
Середина 𝒙𝒊 − 𝒙
̅
𝒛𝒊 =
𝒏𝒊_т =
∙ 𝝋(𝒛𝒊 ),
𝒙𝒊
𝝈
𝝈
2
-14,09
-2,60
0,0136
1,62
6
-10,09
-1,86
0,0707
8,40
10
-6,09
-1,12
0,2131
25,32
14
-2,09
-0,39
0,3697
43,93
18
1,91
0,35
0,3752
44,58
22
5,91
1,09
0,2203
26,18
26
9,91
1,83
0,0748
8,89
30
13,91
2,57
0,0147
1,75
3) нормирование для каждого интервала 𝑧𝑖 .
4) значения функции стандартного нормального распределения 𝜑(𝑧𝑖 ).
5) теоретические частоты 𝑛𝑖_т .
2. Найдем эмпирическое значение.
56
Интервалы
𝒏𝒊_э
𝒏𝒊_т
[0; 4)
3
1,62
[4; 8)
8
8,4
[8; 12)
25
25,32
[12; 16)
40
43,93
[16; 20)
46
44,58
[20; 24)
31
26,18
[24; 28)
6
8,89
[28; 32)
2
1,75
Замечание. Для двух интервалов получились теоретические частоты меньше пяти
𝑛𝑖_т < 5. Объединим соседние интервалы, чтобы частоты стали не менее пяти.
𝟐
𝟐
Интервалы
𝒏𝒊_э
𝒏𝒊_т
(𝒏𝒊_э − 𝒏𝒊_т )
(𝒏𝒊_э − 𝒏𝒊_т )
(𝒏𝒊_э − 𝒏𝒊_т )
𝒏𝒊_т
0,096
0,004
0,352
0,045
0,887
0,655
2,039
[0; 8)
11
10,02
0,98
0,96
[8; 12)
25
25,32
-0,32
0,10
[12; 16)
40
43,93
-3,93
15,44
[16; 20)
46
44,58
1,42
2,02
[20; 24)
31
26,18
4,82
23,23
[24; 32)
8
10,64
-2,64
6,97
сумма
161 160,67
0,33
Выполним проверку расчетов: ∑(𝑛𝑖_э − 𝑛𝑖_т ) = 0 , 33 (погрешность).
𝜒 2 = 2,039
4.Нахождение критического значения.
для нормального распределения:
𝜈 = 6 − 3 = 3, где 𝑘 = 6 - количество интервалов после объединения.
По Таблице №5 (см. Приложения):
𝜒 2 = 7,815 для уровня значимости 𝑝 = 0,05;
𝜒 2 = 11,345 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
2
2
при 𝑝 = 0,05, 𝜒эмп
= 2,039 < 𝜒кр
= 7,815;
2
2
при 𝑝 = 0,01, 𝜒эмп
= 2,039 < 𝜒кр
= 11,345;
6.Формулировка принятия решения.
Гипотеза Н0 принимается, а гипотеза Н1 отклоняется на уровне значимости 𝑝 = 0,01.
Между эмпирическим и нормальным распределением не выявлены статистически
значимые различия.
Упражнения
1. Имеются данные о результатах оценки слушателями курсов метода подачи
теоретического материала. Определить, зависит ли оценка от метода подами материала?
Оценка
Метод подачи нового материала
I
II
Отрицательная
12
18
Положительная
21
25
2. Имеется распределение студентов по количеству пропусков за семестр.
Определить, зависит ли количество пропусков от пола?
Пол
Количество пропусков
Меньше 10 От 10 до 30 Более 30
Юноши
120
40
10
57
Девушки
100
35
5
3. Имеются данные об отношении школьников к проведенному мероприятию. Есть ли
отличия в отношении мальчиков и девочек к мероприятию?
Пол
Количество школьников,
высказавших свое мнение о проведенном мероприятии
Положительное
Безразличное
Отрицательное
Мальчики
15
25
6
Девочки
30
35
30
4. В школе были проведены некоторые мероприятия, предположительно влияющие на
успеваемость. Влияет ли вид мероприятия на успеваемость?
Вид мероприятия
Успеваемость
Увеличилась Не изменилась Уменьшилась
Мероприятие А
14
22
20
Мероприятие В
47
37
25
5. Проводился опрос работников одного предприятия об удовлетворенности их
работой. В качестве ответов предлагались следующие альтернативы:
1 – работой вполне доволен;
2 – скорее доволен, чем не доволен;
3 – трудно сказать, не знаю, безразлично;
4 – скорее недоволен, чем доволен;
5 – совершенно недоволен работой.
Полученные ответы (эмпирические частоты) представлены в таблице
Альтернативы
1
2
3
4
5
эмпирические частоты
8
22
14
9
12
Требуется определить, будет ли удовлетворенность работой на данном предприятии
распределена равномерно?
6. В эксперименте испытуемый должен произвести выбор левого или правого стола с
заданиями. В инструкции исследователь подчеркивает, что задания на обоих столах
одинаковы. Из 150 испытуемых правый стол выбрали 98 человек, а левый 52. Можно ли
утверждать, что подобный выбор левого или правого стола равновероятен или он обусловлен
какой-либо неизвестной причиной?
7. Дано следующее распределение абонентов по потребляемой мощности
электроэнергии (в кВт.ч)
Интервалы
5–10 10–15 15–20 20–25 25–30 30–35 35–40 40–45 45–50
мощности
Число
3
13
70
190
290
абонентов
Выяснить, является ли распределение нормальным?
230
130
62
12
8. В таблице приведены сгруппированные данные измерений роста у случайно
отобранных студентов.
Рост студентов, см 162–166 166–170 170–174 174–178 178–182 182–186
Число студентов
3
7
15
Выяснить, является ли распределение нормальным?
58
13
11
1
Глава 9. Выявление степени согласованности изменений
Понятие корреляции
Исследователя нередко интересует, как связаны между собой две или большее
количество переменных в одной или нескольких изучаемых группах?
Например, связан ли уровень тревожности учащихся с их показателями
успеваемости?
Корреляция – это согласованное изменение признаков. Если при изменении одной
величины изменяется другая, то между показателями этих явлений будет наблюдаться
корреляция.
Наличие корреляции между двумя переменными ничего не говорит о причинноследственных зависимостях между ними. Оно свидетельствует лишь о том, что изменениям
одного признака сопутствуют определенные изменения другого. При этом является ли
исследуемый признак причиной изменения другого исследуемого признака, или причиной
является какой-то не учтенный третий признак, не известно.
Направление корреляции:
1.положительная (прямая);
2.отрицательная (обратная);
3.нулевая.
Корреляция является положительной (прямой), если увеличение одной переменной
связано с увеличением другой переменной.
Например, чем выше тревожность, тем выше риск заболеть язвой желудка.
Корреляция является отрицательной (обратной), если увеличение одной
переменной связано с уменьшением другой.
Например, чем выше уровень страха, тем меньше шансов занять доминирующее
положение в группе.
Корреляция является нулевой, если отсутствует связь между переменными.
Например, связь между ростом учеников и их успеваемостью отсутствует.
Форма корреляции:
1.линейная;
2.нелинейная.
Связь линейная, если с увеличением или уменьшением одной переменной вторая
переменная в среднем также либо растет, либо убывает.
Например, связь между количеством тренировок на учебном тренажере и
количеством правильно решаемых задач в контрольной сессии является линейной.
Связь нелинейна, если при увеличении одной величины характер изменения другой
величины нелинеен, а описывается другими законами.
Например, связь между уровнем мотивации и эффективностью выполнения задачи не
является линейной. При повышении мотивации эффективность выполнения задачи сначала
растет, затем достигается оптимальный уровень мотивации, которому соответствует
максимальная эффективность выполнения задачи; дальнейшему повышению мотивации
сопутствует уже снижение эффективности.
59
Корреляцию можно количественно измерить.
Сила или теснота корреляционной связи между признаками выражается
величиной, называющейся коэффициентом корреляции. Обозначается 𝑟.
Значения данного коэффициента могут находиться в диапазоне:
от -1 до +1.
Сила связи не зависит от ее направленности и определяется по абсолютному
значению коэффициента корреляции.
Классификация корреляционных связей по их силе:
1) сильная, или тесная
|𝑟| ≥ 0,7
2) средняя
0,5 ≤ |𝑟| < 0,7
3) умеренная
0,3 ≤ |𝑟| < 0,5
4) слабая
0,2 ≤ |𝑟| < 0,3
5) очень слабая
|𝑟| ≤ 0,2
Возможные варианты связей, соответствующие им коэффициенты корреляции и их
интерпретации изобразим на диаграммах рассеивания:
Коэффициенты корреляции характеризуются не только силой, но и значимостью.
Чтобы установить значимость корреляционной связи необходимо дополнительно
выполнить проверку статистических гипотез с указанием уровня значимости.
Н0: корреляционная связь незначимая;
Н1: корреляционная связь значимая.
Сильная корреляция может оказаться случайной при малом объеме выборки, а слабая
корреляция может оказаться высокозначимой при большом объеме выборки.
Коэффициенты корреляции.
Если необходимо установить, существует ли корреляционная связь между двумя
исследуемыми признаками, то нужно вначале выбрать меру связи, затем рассчитать ее
величину и сделать выводы.
Выбор меры связи зависит от шкалы измерения исследуемых признаков.
Первый исследуемый признак (переменную) обозначим за Х.
Второй исследуемый признак (переменную) обозначим за У.
Соотношения между типами шкал и мерами связи:
60
Тип шкалы
переменная Х
переменная У
дихотомическая
дихотомическая
(номинальная)
(номинальная)
ранговая,
ранговая,
интервальная
интервальная
или отношений
или отношений
ранговая
ранговая
интервальная
или отношений
интервальная
или отношений
Мера связи
коэффициент 𝜑
коэффициент
Спирмена
коэффициент
Кенделла
коэффициент
Пирсона
Метод ранговой корреляции Спирмена.
Если исследователь хочет установить, есть ли связь между исследуемыми
признаками, то можно начать с расчета коэффициента ранговой корреляции Спирмена.
Основанием для выбора этого коэффициента служат его особенности:
-универсальность,
-простота,
-широкие возможности в решении разного типа задач.
Универсальность проявляется в том, что он применим к любым количественно
измеренным или ранжируемым данным (в том числе и качественным данным, измеренным в
ранговой шкале).
Простота выражается в простоте вычисления коэффициента.
Уникальность метода состоит в том, что он позволяет сопоставлять не только
индивидуальные показатели (наблюдения), но и индивидуальные иерархии, что
недоступно ни одному из других статистических методов.
Например, испытуемые могут сами проставить иерархии своих предпочтений
(ценностей) и можно исследовать между ними связь.
Коэффициент ранговой корреляции рекомендуется применять в тех случаях, когда
необходимо проверить, согласованно ли изменяются разные признаки у одного и того же
испытуемого, насколько совпадают индивидуальные ранговые показатели у двух отдельных
испытуемых или у испытуемого и группы?
1.Назначение критерия.
Метод ранговой корреляции Спирмена позволяет определить силу и направление
корреляционной связи между двумя признаками или двумя иерархиями признаков.
Коэффициент ранговой корреляции Спирмена относится к непараметрическим
показателям связи между переменными, измеренными, по крайней мере, в ранговой шкале.
2.Гипотезы.
Н0: между переменными (иерархиями) не наблюдается статистически значимая
связь
Н1: между переменными (иерархиями) наблюдается статистически значимая связь
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1. Показатели ранжируем отдельно по каждому из признаков, выбрав одинаковый
порядок ранжирования.
2. Коэффициент ранговой корреляции Спирмена вычисляем по формуле:
6 ∙ ∑ 𝑑2
𝑟 =1−
,
𝑛 ∙ (𝑛2 − 1)
где 𝑑 – это разность рангов, символ Σ - означает сумму, а 𝑛 - число пар наблюдений
или иерархий.
Случай одинаковых рангов.
61
Коэффициент ранговой корреляции Спирмена при большом количестве одинаковых
рангов по одной или обеим переменным дает завышенное значение. Если это условие не
соблюдается, необходимо вносить поправку на одинаковые ранги. В этом случае
коэффициент корреляции Спирмена вычисляем по формуле:
6 ∙ ∑ 𝑑 2 + 𝑑1 + 𝑑2 + 𝑑3
𝑟 =1−
,
𝑛 ∙ (𝑛2 − 1)
𝑡 3 −𝑡
𝑘 3 −𝑘
𝑑1 = 12 , 𝑑2 = 12 ,
t - число одинаковых рангов для первого признака;
𝑘 – число одинаковых рангов для второго признака;
если имеется две группы одинаковых рангов для какого-либо признака:
(𝑙 3 − 𝑙) + (𝑚3 − 𝑚)
𝑑3 =
12
𝑙 – число одинаковых рангов в первой группе ранжируемого признака,
𝑚 – число одинаковых рангов во второй группе ранжируемого признака.
3. Выполняем предварительные выводы:
Наблюдается ли корреляционная связь между признаками или нет?
Какова сила (теснота) этой связи: сильная, умеренная или слабая?
Какая это связь: положительная, отрицательная или нулевая?
4. Эмпирическое значение обозначаем, как модуль вычисленного коэффициента
ранговой корреляции: 𝑟эм = |𝑟|.
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и числа пар
экспериментальных данных 𝑛.
Таблица критических значений для метода ранговой корреляции Спирмена
представлена в Таблице №6 (см. Приложение).
4. Правило сравнения эмпирического и критического значений.
Н0 принимается, если 𝑟эмп < 𝑟кр .
Н0 отклоняется, если 𝑟эмп ≥ 𝑟кр .
Критическая область располагается справа, а доверительная область слева.
5.Ограничения критерия.
Должно быть не менее 5 и не более 40 пар наблюдений (такие значения доступны для
Таблицы №6).
Пример. Определить, наблюдается ли статистически значимая связь между
ранговыми оценками качеств личности, входящими в представление испытуемого о своем
«Я реальном» и «Я идеальном»?
Качества
«Я реальное»
«Я идеальное»
личности
7
ответственность
1
1
общительность
5
3
настойчивость
7
2
энергичность
6
5
жизнерадостность
4
4
терпеливость
3
6
решительность
2
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
Н0: между ранговыми оценками качеств личности испытуемого не наблюдается
статистически значимая связь.
62
Н1: между ранговыми оценками качеств личности испытуемого наблюдается
статистически значимая связь.
2.Выбор статистического метода.
Для установления статистически значимой связи между двумя рангами качеств
личности выберем метод ранговой корреляции Спирмера.
3.Вычисление эмпирического значения.
1. Показатели качеств личности уже проранжированны.
2. Расчеты запишем в таблице и вычислим коэффициент корреляции Спирмена.
«Я
«Я
Разность
Квадрат
реальное»
идеальное» рангов
разности
Ранг X
Ранг Y
𝒅
рангов 𝒅𝟐
7
1
6
36
1
5
-4
16
3
7
-4
16
2
6
-4
16
5
4
1
1
4
3
1
1
6
2
4
16
сумма
0
102
6 ∙ ∑ 𝑑2
6 ∙ 102
𝑟 =1−
= 1−
= −0,82,
2
𝑛 ∙ (𝑛 − 1)
7 ∙ (72 − 1)
3. Сделаем предварительные выводы:
Между оценками качеств личности наблюдается корреляционная связь.
Сила (теснота) этой связи сильная.
Связь отрицательная.
4. Вычислим эмпирическое значение 𝑟эм = |𝑟| = |−0,82| = 0,82.
4.Нахождение критического значения.
Число пар экспериментальных данных 𝑛 = 7.
По Таблице №6 (см. Приложения):
𝑟кр1 = 0,78 для уровня значимости 𝑝 = 0,05;
𝑟кр2 = 0,94 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
при 𝑝 = 0,05, 𝑟эмп = 0,82 ≥ 𝑟кр1 = 0,78;
при 𝑝 = 0,01, 𝑟эмп = 0,82 < 𝑟кр2 = 0,94;
6.Формулировка принятия решения.
Гипотеза Н0 отклоняется и принимается гипотеза Н1 на уровне значимости р = 0,05
и, одновременно, гипотеза Н0 принимается на уровне значимости р = 0,01.
Только на уровне значимости р = 0,05 установлено, что между оценками качеств
личности испытуемого наблюдается статистически значимая тесная отрицательная связь.
Можно предположить, что у испытуемого низкая самооценка, поскольку большей величине
«Я реального» соответствует меньшая величина «Я идеального».
Пример. Психолог, используя тест умственного развития (ШТУР), проводит
исследование интеллекта у группы учащихся 9 класса, одновременно с этим он просит
учителей литературы и математики провести ранжирование этих же учащихся по
показателям умственного развития. Требуется определить, как связаны между собой
объективные показатели умственного развития (данные ШТУРа) и экспертные оценки
учителей?
Ранги тестирования
Экспериментальные
Экспериментальные
с помощью ШТУРа
оценки учителей по
оценки учителей по
63
6
7
4
5
9
12
2,5
2,5
10
8
11
1
математике
литературе
5
10
8
4
6
8
2
3
8
11
12
1
5
8
7
11
3
6
11
11
1
3
3
9
Выполним исследование по этапам:
1.Формулировка статистических гипотез.
А) Н0:между объективными показателями умственного развития и экспертными
оценками учителя по математике не наблюдается статистически значимая связь.
Н1:между объективными показателями умственного развития и экспертными
оценками учителя по математике наблюдается статистически значимая связь.
Б) Н0:между объективными показателями умственного развития и экспертными
оценками учителя по литературе не наблюдается статистически значимая связь.
Н1:между объективными показателями умственного развития и экспертными
оценками учителя по литературе наблюдается статистически значимая связь.
2.Выбор статистического метода.
Для установления статистически значимой связи между рангами умственного
развития и экспертных оценок учителей выберем метод ранговой корреляции Спирмера.
3.Вычисление эмпирического значения.
1. Показатели умственного развития и экспертные оценки учителей уже
проранжированны.
2. Расчеты запишем в таблице и вычислим коэффициент корреляции Спирмена.
Введем обозначения:
𝑋 – показатели тестирования с помощью ШТУРа;
𝑌 – экспериментальные оценки учителя по математике;
𝑍 - экспериментальные оценки учителя по литературе.
Ранг X
Ранг Y
Ранг Z
6
7
4
5
9
12
2,5
2,5
10
8
11
5
10
8
4
6
8
2
3
8
11
12
5
8
7
11
3
6
11
11
1
3
3
𝒅
(между
X и Y)
1
-3
-4
1
3
4
0,5
-0,5
2
-3
-1
64
𝒅
(между
X и Z)
1
-1
-3
-6
6
6
-8,5
-8,5
9
5
8
𝒅𝟐
(между
X и Y)
1
9
16
1
9
16
0,25
0,25
4
9
1
𝒅𝟐
(между
X и Z)
1
1
9
36
36
36
77,25
77,25
81
25
64
1
1
сумма
9
0
0
-8
0
0
66,5
64
471,5
При ранжировании переменных X,Y,Z встречаются одинаковые ранги. При расчете
коэффициента Спирмена введем поправку.
Для переменной X два одинаковых ранга 𝑡 = 2:
𝑡 3 − 𝑡 23 − 2
𝑑1 =
=
= 0,5.
12
12
Для переменной Y три одинаковых ранга 𝑘 = 3:
𝑘 3 − 𝑘 33 − 3
𝑑2 =
=
= 2.
12
12
Для переменной Z две группы по три одинаковых ранга 𝑙 = 3, 𝑚 = 3:
(𝑙 3 − 𝑙) + (𝑚3 − 𝑚) (33 − 3) + (33 − 3)
𝑑3 =
=
= 4.
12
12
А) рассчитаем коэффициент корреляции Спирмена между X и Y:
6 ∙ ∑ 𝑑2 + 𝑑1 + 𝑑2 + 𝑑3
6 ∙ 66,5 + 0,5 + 2
𝑟 =1−
=1−
= 0,767,
2
𝑛 ∙ (𝑛 − 1)
12 ∙ (122 − 1)
Замечание. Коэффициент корреляции Спирмена без поправки:
6 ∙ ∑ 𝑑2
6 ∙ 66,5
𝑟 =1−
=1−
= 0,768.
2
𝑛 ∙ (𝑛 − 1)
12 ∙ (122 − 1)
При небольшом количестве одинаковых рангов величины коэффициентов с
поправкой и без поправки отличаются незначительно и можно поправку не вводить.
Б) рассчитаем коэффициент корреляции Спирмена между X и Z:
6 ∙ ∑ 𝑑 2 + 𝑑1 + 𝑑2 + 𝑑3
6 ∙ 471,5 + 0,5 + 4
𝑟 =1−
=1−
= −0,651,
2
𝑛 ∙ (𝑛 − 1)
12 ∙ (122 − 1)
3. Сделаем предварительные выводы:
А) Между рангами умственного развития и экспертных оценок учителя по математике
наблюдается корреляционная связь.
Сила (теснота) этой связи сильная.
Связь положительная.
Б) Между рангами умственного развития и экспертных оценок учителя по литературе
наблюдается корреляционная связь.
Сила (теснота) этой связи средняя.
Связь отрицательная.
4. Вычислим эмпирическое значение:
А) 𝑟эм = |𝑟| = |0,767| = 0,767.
Б) 𝑟эм = |𝑟| = |−0,651| = 0,651.
4.Нахождение критического значения.
Число пар экспериментальных данных 𝑛 = 12.
По Таблице №6 (см. Приложения):
𝑟кр1 = 0,58 для уровня значимости 𝑝 = 0,05;
𝑟кр2 = 0,73 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
А) при 𝑝 = 0,05, 𝑟эмп = 0,767 ≥ 𝑟кр1 = 0,58;
при 𝑝 = 0,01, 𝑟эмп = 0,767 ≥ 𝑟кр2 = 0,73;
Б) при 𝑝 = 0,05, 𝑟эмп = 0,651 ≥ 𝑟кр1 = 0,58;
при 𝑝 = 0,01, 𝑟эмп = 0,651 < 𝑟кр2 = 0,73;
6.Формулировка принятия решения.
А) Гипотеза Н1 принимается на уровне значимости р = 0,01.
65
Между объективными показателями умственного развития (данные ШТУРа) и
экспертными оценками учителя по математике наблюдается статистически значимая тесная
положительная связь. Чем выше экспертные оценки учащихся по тесту ШТУР, тем выше их
экспертные оценки учителем по математике.
Б) Гипотеза Н1 принимается только на уровне значимости р = 0,05.
Между объективными показателями умственного развития (данные ШТУРа) и
экспертными оценками учителя по литературе наблюдается статистически значимая средняя
отрицательная связь. Чем выше экспертные оценки учащихся по тесту ШТУР, тем ниже их
экспертные оценки учителем по литературе.
Метод линейной корреляции Пирсона
Еще одним методом для выявления связи между признаками является метод линейной
корреляции Пирсона. Он является параметрическим и для количественных данных может
оказаться более мощным для обоснования статистически значимой связи.
Мерой связи между признаками также будет являться коэффициент корреляции.
Перед вычислением коэффициента корреляции рекомендуется для собранных данных
изобразить диаграмму рассеивания. Визуально по диаграмме можно определить,
наблюдается ли между признаками связь или нет? При этом, связь между разными
признаками может наблюдаться как линейная, так и нелинейная.
Метод линейной корреляции Пирсона эффективен при линейной связи, но становится
неэффективен при нелинейной связи.
1.Назначение критерия.
Метод линейной корреляции Пирсона позволяет определить силу и направление
линейной корреляционной связи между двумя признаками.
Коэффициент линейной корреляции Пирсона относится к параметрическим
показателям связи между переменными, измеренными в интервальной шкале или шкале
отношений.
2.Гипотезы.
Н0: между переменными не наблюдается статистически значимая линейная связь
Н1: между переменными наблюдается статистически значимая линейная связь
3. Подсчет эмпирического и критического значений.
Подсчет эмпирического значения.
1. Коэффициент линейной корреляции Пирсона вычисляем по формуле:
𝑥 ∙ 𝑦 − 𝑥̅ ∙ 𝑦̅
̅̅̅̅̅̅
𝑟=
,
𝜎𝑥 ∙ 𝜎𝑦
где 𝑥̅ – среднее арифметическое первой переменной X;
𝑦̅ – среднее арифметическое второй переменной Y;
𝜎𝑥 - стандартное отклонение первой переменной X;
𝜎𝑦 - стандартное отклонение второй переменной Y.
Также можно вычислять по преобразованной формуле:
𝑛 ∙ ∑ 𝑥𝑦 − ∑ 𝑥 ∙ ∑ 𝑦
𝑟=
,
√(𝑛 ∙ ∑ 𝑥 2 − (∑ 𝑥)2 ) ∙ (𝑛 ∙ ∑ 𝑦 2 − (∑ 𝑦)2 )
2. Выполняем предварительные выводы:
Наблюдается ли корреляционная связь между признаками или нет?
Какова сила (теснота) этой связи: сильная, умеренная или слабая?
Какая это связь: положительная, отрицательная или нулевая?
Выводы выполняются аналогично, как для метода ранговой корреляции Спирмена.
3. Эмпирическое значение обозначаем, как модуль вычисленного коэффициента
линейной корреляции: 𝑟эм = |𝑟|.
66
Определение критического значения.
Критическое значение зависит от выбранного уровня значимости и числа степеней
свободы: 𝑘 = 𝑛 − 2.
Сила (теснота) этой связи средняя.
Связь положительная.
3. Вычислим эмпирическое значение:
𝑟эм = |𝑟| = |0,669| = 0,669.
4.Нахождение критического значения.
Число пар экспериментальных данных 𝑛 = 20.
Число степеней свободы: 𝑘 = 20 − 2 = 18
По Таблице №6 (см. Приложения):
𝑟кр1 = 0,44 для уровня значимости 𝑝 = 0,05;
𝑟кр2 = 0,56 для уровня значимости 𝑝 = 0,01.
5.Сравнение критического и эмпирического значений.
при 𝑝 = 0,05, 𝑟эмп = 0,669 ≥ 𝑟кр1 = 0,44;
при 𝑝 = 0,01, 𝑟эмп = 0,669 ≥ 𝑟кр2 = 0,56;
6.Формулировка принятия решения.
Гипотеза Н1 принимается на уровне значимости р = 0,01.
Между средним временем решения наглядно-образных заданий и вербальных заданий
тестов наблюдается средняя положительная корреляционная связь. Чем выше время решения
наглядно-образных задач, тем выше время решения вербальных задач, и наоборот.
Упражнения
1. Применив метод ранговой
корреляции Спирмера определить, имеется ли
статистически значимая связь между результатами ЕГЭ по математике и физике для группы
учащихся?
Количество баллов ЕГЭ по физике – 𝑋
Количество баллов ЕГЭ по математике – 𝑌
95
90
86
82
75
75
64
60
57
50
𝑿
92
94
83
80
55
60
45
72
61
70
𝒀
2. Применив метод ранговой
корреляции Спирмера определить, имеется ли
статистически значимая связь между показателями сфорсированности отношения к здоровью
между старшеклассниками и их родителями?
Показатели (баллы) учащегося – 𝑋
Показатели (баллы) родителей учащегося – 𝑌
𝑿 14 11 18 17 15 24 18 18 18 17 13 22 15 17 14 27 19
𝒀 23 27 23 21 27 19 28 19 21 19 19 19 28 14 19 21 23
3. Применив метод ранговой корреляции Спирмера определить, существует ли
статистически достоверная связь между самооценкой работников и их межличностными
отношениями в педагогическом коллективе?
Балл по самооценке работником – 𝑋
Балл по оценке работником психологического климата – 𝑌
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
𝑿 0, 1
2
2
2
2
3
3
3
3
3
3
4
4
4
4
5
5
5
3
4
1
9
1
6
1
5
2
1
2 -6
2
2 -2 6 -6
𝒀 1
8
4
2
0
6
6
1
1
3
1
0
1
67
4. Имеются результаты ежемесячных наблюдений за состоянием погоды и
посещаемостью кинотеатра, парка и бассейна. Применив метод линейной корреляции
Пирсона определить, имеется ли статистически значимая связь:
а) между состоянием погоды и посещаемостью кинотеатра?
б) между состоянием погоды и посещаемостью парка?
в) между состоянием погоды и посещаемостью бассейна?
Число
ясных дней
8
14
20
25
20
15
Число
посетителей
кинотеатров
495
503
380
305
348
465
Число
посетителей
парка
132
348
643
865
743
541
Число
посетителей
бассейна
164
182
153
203
169
199
5. Имеются следующие результаты группы студентов: средний балл сессии студента
(по 10-бальшой шкале), количество пропусков студентом в месяц, балл уровня интеллекта IQ
студента и время, проведенное студентом в социальных сетях (часов в день). Определить,
имеется ли статистически значимая связь:
а) между средним баллом сессии и количеством пропусков в месяц?
б) между средним баллом сессии и количеством баллов IQ?
в) между средним баллом сессии и количеством времени, проведенном в социальных
сетях?
Метод корреляции выбрать самостоятельно.
Средний Количество
балл
пропусков
сессии
в месяц
7,4
3
6,7
11
5,2
4
4,8
0
8,6
1
8,3
0
8,6
0
7
3
9,5
0
5,3
0
7,5
3
8,7
0
6,2
2
5,5
2
4,9
3
5,2
7
5
0
5,9
0
5,1
2
5,6
3
IQ
104
110
105
148
160
125
143
111
134
101
117
164
94
99
86
103
105
85
100
88
68
Время проведенное
в соц.сетях,
часов в день
2,1
1,4
1,8
1,7
1,5
1,4
1,1
1,4
1,2
1,8
1,7
1,8
2,1
1,7
2,1
1,8
1,8
2,1
2,1
2
Индивидуальная работа
Вариант 1
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
2
2
2
3
4
2
5
3
2
3
3
5
5
2
2
3
4
5
4
3
3
5
2
3
5
5
5
5
4
5
3
3
3
2
5
2
4
5
2
2
2
2
4
3
4
2
2
5
5
3
5
4
3
2
3
2
3
4
5
2
2
3
5
2
5
4
2
4
3
4
5
3
4
4
5
4
4
5
4
3
4
2
2
5
3
2
4
5
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
49 79 45 55 66 60 66 64 50
80 82 80 38 54 67
34 80 74 53 79 53 52 56 68
77 45 64 53 52 51
58 85 57 47 49 28 66 31 59 100 93 38 46 52 69
70 70 58 54 41 73 59 64 55
56 61 48 53 59 55
64 60 67 75 59 50 65 71 50
69 30 52 54 61 71
71 69 66 80 64 56 61 48 79
53 78 84 56 72 51
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
39 28 64 42 70 73 58 42 58 67 64 89 77 63 62
2 класс
42 49 53 54 81 60 53 66 69 28 88 36 42 22 30
1 класс 56 46
64 60 54
2 класс 52 58
43 53 62
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
62
66
27
30
59
65
35
35
57
62
26
28
29
28
69
36
44
53
46
49
59
42
47
49
54
28
34
31
30
18
18
До 8
После
48
49
51
50
35
40
51
50
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
20
«3»
31
22
«4»
44
26
«5»
41
22
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 124 116 116 116
Дети 128 104 128 110
Родители 88 137 102 108 141 133
Дети 91 126 85 114 147 121
105
114
122
118
120 103 101 122 104
123 100 104 119 95
111 114 122
129 94 125
Вариант 2
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
5
2
4
2
2
4
3
3
2
3
5
5
3
5
4
2
5
4
4
5
2
5
4
2
2
2
2
5
3
4
4
4
4
2
2
5
5
2
4
2
4
3
2
4
5
2
3
4
3
4
2
5
5
2
3
5
5
4
2
3
4
3
4
4
4
5
2
4
2
5
2
3
4
5
2
4
4
4
5
3
2
5
2
4
3
5
5
5
2
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
70
83
51
54
66
84
62
57
44
35
59
50
23
49
28
63
57
31
55
61
67
69
72
83
35
65
71
88
28
40
59
49
54
57
48
52
51
41
80
85
71
35
56
60
38
70
67
61
54
62
56
53
45
53
74
68
59
62
74
67
54
48
36
42
18
44
70
63
59
61
66
59
69
49
79
46
59
66
67
71
82
43
53
80
51
84
65
36
70
66
62
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
2 класс
1 кл 63 45
2 кл 36 72
60
66
64
81
33
56
59
66
74
49
32
60
84
70
55
74
48
52
74
73
66
67
43
51
42
70
69
63
81
66
61
51
61
82
50
33
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 25
После 23
40
46
41
49
42
41
52
51
47
53
52
48
42
48
62
62
24
28
37
41
37
40
20
26
32
37
33
36
36
43
36
32
31
34
41
44
41
37
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
29
18
«3»
37
23
«4»
37
23
«5»
47
26
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
71
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 92 116
Дети 68 114
106 104 119 97 111 137 111 115 132
102 116 120 78 122 147 93 135 121
105 96 138 102 125 86 116 126
117 100 143 102 107 84 113 116
Вариант 3
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
4
2
2
2
4
2
4
2
4
5
4
5
3
2
5
3
5
5
5
3
5
4
5
5
5
2
3
4
2
5
5
4
2
5
2
3
2
3
5
4
5
3
2
4
2
5
4
4
5
3
2
5
3
3
3
2
4
4
3
5
2
4
5
2
4
2
3
2
4
3
3
2
2
3
4
4
5
2
5
4
3
4
5
3
4
5
5
2
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
58 61 71 46 56 80 81 75 93 52 69 76 77 55 65
73 45 47 56 73 58 79 73 54 57 83 50 46 53 69
72 39 85 63 50 100 89 74 66 58 71 82 55 63 60
69 52 62 67 68 50 48 59 60 75 83 61 52 81 38
48 67 83 66 75 39 57 50 64 62 80 56 53 68 59
56 64 71 79 57 58 77 70 49 47 47 70 69 51 50
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
2 класс
1 класс 43 47
2 класс 47 51
55
62
68
49
51
45
64
51
68
68
59
46
51
41
47
66
43
24
57
33
75
75
45
60
64
66
91
87
42
79
42
53
63
52
62
43
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
72
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
16
29
43
54
47
48
55
48
31
43
41
48
22
20
15
26
49
48
29
31
30
44
53
51
50
51
39
34
37
48
23
31
51
59
29
32
63
66
64
78
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
«2»
32
23
1 школа
2 школа
«3»
38
26
«4»
31
23
«5»
49
18
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 23 151
Дети 105 159
114
116
117
109
124 93 92 94 102 123 89 110
116 102 97 106 96 107 88 116
104 94
100 115 116 117 124
102 104
115 143 111 104 129
Вариант 4
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
3
5
4
2
4
2
2
5
4
4
5
3
3
2
2
4
4
4
3
5
3
5
4
3
2
5
3
2
2
2
4
4
5
2
3
3
5
5
3
5
2
2
2
2
4
3
5
73
3
5
5
5
3
3
3
4
4
3
5
5
2
3
3
3
3
3
4
3
2
4
5
4
2
4
3
4
3
4
4
5
4
3
5
4
4
5
4
3
3
2
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
45
31
52
45
37
46
45
65
32
58
64
53
49
46
58
57
76
47
37
48
55
76
49
55
67
18
43
88
68
30
55
66
29
45
60
62
36
38
73
60
67
44
36
61
58
56
63
63
54
77
50
52
54
47
56
32
65
37
45
49
41
64
83
68
86
53
75
64
50
68
72
72
65
26
64
48
75
60
68
70
37
70
59
34
53
70
53
65
54
52
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 37 50 55 53 33 56 90 60 59 61 63 40 67 69 74
2 класс 59 68 56 61 62 54 41 69 68 48 60 55 73 50 55
1 класс 4 63 48 48 100
2 класс 74 46 81 59
66
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
67
после
74
44
53 47
45
66 59
43
47
33
35
46
52
56
63
35
33
32
28
43
51
22
29
37
43
34
47
44
48
29
41
63
60
69
79
33
46
62
63
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
29
24
«3»
39
18
«4»
43
27
«5»
39
21
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
74
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 138 118
Дети 121 111
114
105
111
112
110 127 147 152 130 90 120 101
100 130 132 164 133 102 112 107
111 99 128 118 110 120 109
120 102 120 106 115 121 114
Вариант 5
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
5
5
4
5
4
4
4
2
5
3
5
3
3
5
3
5
3
2
4
3
2
5
5
3
3
4
3
2
5
2
3
5
5
3
5
5
3
2
4
2
2
3
2
5
5
3
5
5
4
2
3
2
2
2
4
5
2
2
2
4
3
3
2
5
5
3
4
5
3
5
3
5
2
3
3
3
4
4
2
2
4
3
2
4
5
2
4
3
3
2
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
46
81
60
72
72
60
58
70
75
50
67
61
70
63
73
67
68
84
77
76
60
82
63
66
87
55
52
69
72
71
57
53
50
69
82
51
81
62
64
66
57
73
77
58
66
55
57
66
83
70
70
73
49
84
67
64
72
44
69
59
60
61
61
53
69
64
67
58
63
74
83
82
44
77
56
79
48
88
48
66
55
76
63
57
64
66
94
62
61
89
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
75
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 62 44 36 73 66 61 44 76 66 68 43 54 46 55 41
2 класс 77 45 68 55 67 78 55 43 11 52 27 64 40 39 71
1 класс 63 54 89 85 64
2 класс 27 68 65 48 46
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 12
После 2
45
50
14
31
19
30
25
22
15
18
47
43
44
53
45
49
35
42
38
45
32
40
30
31
7
13
40
53
22
28
36
36
33
35
22
30
49
57
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
31
19
«3»
38
25
«4»
41
26
«5»
40
20
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 126 110
Дети 123 98
126
122
112
118
122
124
114
109
107
111
118
116
76
118
120
116
125
126
111
119
125
129
144
117
119
108
112
132
147
109 108
111 113
117
107
Вариант 6
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
4
5
3
3
3
5
5
3
5
5
2
2
3
4
4
2
5
3
4
4
5
2
4
5
3
5
5
2
5
4
4
5
3
5
2
2
2
4
2
5
3
2
5
3
4
2
3
2
4
4
3
2
3
5
5
3
4
5
2
2
5
2
4
3
4
5
3
5
4
5
3
5
4
4
5
5
3
2
3
4
2
4
3
5
5
4
4
2
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
64
38
46
53
52
52
59
69
55
74
36
57
68
75
38
70
49
63
69
37
52
46
52
66
45
40
66
76
48
30
45
40
62
42
69
53
39
60
32
78
24
74
51
74
62
47
50
78
36
40
78
58
51
59
47
61
71
39
40
42
56
37
71
79
31
31
62
47
50
54
76
28
55
60
72
61
35
58
16
78
39
70
64
54
66
48
47
66
66
76
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 58 78 68 62 55 67 59 68 48 80 30 58 77 55 65
2 класс 58 56 72 95 62 68 57 76 52 90 70 75 59 49 91
1 класс 60 54 49 45 47
2 класс 58 72 85 54 65
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
13
6
37
44
41
39
36
27
26
20
47
47
53
66
77
28
32
50
54
44
44
37
33
27
32
29
44
27
38
25
40
До 50
После 41
32
35
37
44
56
62
18
31
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
33
22
«3»
40
26
«4»
42
20
«5»
35
22
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 109 118
Дети 118 111
114 135 107 129 100 122 101 107 116
124 122 114 136 89 100 90 115 110
135 98 103 99 122 144 85 89
164 90 99 94 118 148 93 87
Вариант 7
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
2
5
3
3
4
3
4
4
3
5
4
2
5
3
2
2
5
5
4
2
4
2
5
5
4
4
4
2
2
2
4
5
5
4
4
3
4
4
3
2
3
5
4
4
3
5
5
2
5
3
5
2
3
2
3
3
4
2
4
4
4
3
3
5
5
2
3
5
3
4
4
4
3
4
5
3
2
4
4
3
2
4
4
5
5
4
3
5
2
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
78
в) вычислить среднее арифметическое и стандартное отклонение.
40
52
72
54
81
57
55
64
75
71
56
73
77
78
72
62
89
64
52
57
88
79
77
80
83
72
60
66
73
53
91
57
67
72
80
74
48
61
76
66
89
65
65
87
63
42
70
94
76
61
58
75
61
78
58
50
70
67
59
72
71
70
71
67
56
76
53
44
55
70
58
50
83
61
47
70
62
79
62
72
66
62
71
60
84
51
64
58
57
78
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 58 78 68 62 55 67 59 68 48 80 30 58 77 55 65
2 класс 58 56 72 95 62 68 57 76 52 90 70 75 59 49 91
1 класс 60 54 49 45 47
2 класс 58 72 85 54 65
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 34
После 39
31
35
45
45
14
25
50
49
42
48
41
41
37
32
39
36
35
38
44
54
13
13
38
24
58
54
48
57
26
33
51
47
36
49
25
32
40
56
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
26
22
«3»
45
16
«4»
43
25
«5»
36
27
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
79
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 135 111 104 98
Дети 117 113 99 105
Родители 120 113 80 106 121 99
Дети 119 122 80 102 134 110
132
119
124
113
115
132
128
130
132
136
112
111
155 118
154 130
111
112
Вариант 8
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
5
3
2
4
3
3
3
5
2
5
4
3
2
2
4
3
2
4
2
3
3
2
2
4
5
5
4
4
4
3
3
2
2
5
2
4
5
3
3
4
3
4
3
4
4
4
3
3
4
5
2
4
2
5
5
5
5
2
3
2
2
5
2
3
2
5
2
3
4
2
3
5
4
4
3
2
5
2
4
4
3
3
4
4
5
2
3
2
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
37
53
53
53
47
79
75
66
35
58
55
20
40
55
63
49
68
73
26
60
51
76
17
54
68
32
45
30
65
68
49
53
55
61
44
27
57
51
63
26
64
59
27
56
87
47
78
70
46
57
48
57
68
50
75
42
41
53
28
13
45
38
48
57
57
74
45
69
70
42
57
36
60
79
76
43
73
73
74
29
70
66
66
63
23
59
71
56
71
56
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
2 класс
1 класс 62 74
2 класс 50 57
Задача 4
51
69
53
48
43
85
39
26
62
69
44
64
58
65
65
65
51
61
80
56
74
70
64
58
60
61
66
53
64
67
46
53
66
58
75
86
53
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 17
После 28
28
29
41
43
37
42
30
39
25
20
29
33
44
43
38
41
33
36
25
32
28
25
32
44
26
25
30
41
25
41
33
52
29
29
28
36
29
32
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
35
19
«3»
35
20
«4»
42
24
«5»
38
27
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 112 116
Дети 113 129
124 121 116 142 111 112 91 93 93
117 131 115 147 127 110 97 97 100
108 93 120 105 102 148 115
137
103 93 120 100 93 142 111
140
Вариант 9
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
4
2
4
2
3
3
4
5
5
5
5
3
4
3
4
2
5
5
5
3
3
3
4
2
2
5
4
2
2
4
3
81
4
4
2
4
2
3
3
4
4
5
5
5
3
2
5
3
3
4
3
4
5
5
2
5
2
2
5
3
4
2
4
2
5
4
5
5
3
3
2
4
3
5
2
3
5
5
5
4
2
4
4
5
3
3
3
5
4
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
71
57
60
68
84
60
60
70
56
55
64
67
69
100
53
42
68
76
77
85
58
96
61
68
51
79
59
77
77
66
69
65
65
63
78
78
72
85
85
75
65
50
63
63
68
67
56
59
52
51
74
69
66
57
65
89
65
55
73
85
60
73
60
56
83
69
68
70
75
72
67
67
83
55
52
63
65
63
78
65
56
76
61
58
50
54
68
78
62
53
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 64 100 56 38 86 55 68 71 62 63 58 50 38 61 72
2 класс 42 49 70 58 32 50 61 64 28 90 38 61 79 18 46
1 кл 73 80 59 73 56
2 кл 39 30 56 57 68
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
15
23
27
30
30
19
32
30
31
36
39
39
48
44
30
29
24
36
23
23
44
39
29
30
39
44
38
50
32
38
11
19
46
53
18
28
40
41
19
25
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
20
«3»
39
26
82
«4»
42
23
«5»
35
21
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 123 120
Дети 115 111
126
137
109
108
124
116
118
106
118
112
134
133
130 100 105 79 126 133
109 98 97 88 128 135
171 146 108
125 122
166 150 118
128 122
Вариант 10
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
3
2
4
3
2
4
3
3
3
4
5
4
2
5
4
4
5
4
4
4
3
5
4
3
4
5
2
2
2
3
2
2
4
4
2
4
5
4
2
5
3
2
2
5
5
2
3
4
2
5
5
4
2
3
4
3
5
3
3
3
4
3
4
4
3
2
4
3
4
4
5
5
4
4
4
5
4
4
3
5
4
2
4
4
2
2
4
3
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
58
43
21
48
62
46
68
54
61
44
75
63
39
19
62
52
21
55
10
66
74
49
52
62
41
30
27
56
67
60
41
60
47
24
29
69
55
59
40
61
61
42
60
72
56
51
68
34
Задача 3
83
61
36
58
51
65
51
86
29
28
89
38
67
72
71
42
52
58
23
75
61
52
36
38
44
39
49
71
78
37
40
22
55
50
48
38
71
63
56
39
52
54
56
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 63 61 73 35 68 43 70 64 87 71 61 72 56 58
2 класс 60 52 70 29 35 54 62 51 73 92 75 59 65 62
1 кл 63 68 81 51 87
2 кл 58 47 80 52 76
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
48
49
31
39
17
18
43
44
22
28
46
62
53
58
37
40
53
62
24
41
21
32
7
10
43
51
28
29
35
34
28
31
52
59
20
23
47
48
43
41
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
22
«3»
36
19
«4»
38
27
«5»
42
22
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 125 118
Дети 129 128
107
115
122
110
130
121
122
136
124
109
131
137
84
109
110
110
106
109 132 93 112 107
127 143 85 102 107
101 103
135 135
114 97
127 149
Вариант 11
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
4
3
2
5
2
4
3
3
5
2
5
2
5
3
3
3
2
2
2
3
5
3
5
3
5
2
3
5
3
3
4
3
5
3
3
2
4
4
3
5
3
2
2
4
2
5
4
5
2
3
4
5
2
4
5
5
3
2
5
4
5
3
3
5
2
2
5
2
4
3
5
3
4
2
5
2
2
5
3
5
2
2
4
4
5
4
3
2
2
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
59
81
71
59
67
66
91
54
55
51
61
36
66
47
74
58
41
55
72
51
53
64
39
61
68
61
82
78
41
66
59
71
63
51
60
49
80
53
64
73
77
49
80
67
61
52
66
55
56
49
77
51
82
51
61
48
59
67
74
69
37
46
46
47
74
38
79
68
81
63
88
79
50
47
52
62
54
60
70
82
52
59
77
61
56
67
58
77
62
56
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 72 52 43 33 55 77 52 69 43 77 60 55 30 39
2 класс 63 69 47 74 84 54 99 48 84 56 60 65 55 65
1 кл 67 56 66 26 42
2 кл 57 53 59 66 67
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
47
43
33
39
50
49
46
54
23
25
32
40
39
32
85
23
26
39
48
54
61
40
39
49
62
44
52
32
30
42
56
35
42
43
56
45
41
42
56
17
28
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
36
17
«3»
40
24
«4»
45
25
«5»
29
24
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 98 109 77 126 120 121 121 121 115
Дети 107 117 95 123 106 121 126 119 96
Родители 102 114 132 117
105 125 123 125 115 109
Дети 81 118 132 114
98 109 124 136 111 122
Вариант 12
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
3
5
5
2
2
4
4
2
3
2
5
4
5
4
5
3
4
2
3
2
4
2
4
5
2
3
2
5
3
2
4
5
3
2
3
3
5
4
5
5
4
5
5
4
5
3
4
5
5
5
4
2
5
2
3
4
4
3
2
2
5
3
5
2
4
3
2
3
4
5
5
5
4
2
3
4
5
3
4
3
4
4
4
2
4
2
2
3
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
86
62
67
56
48
47
75
72
41
64
73
57
56
63
47
40
48
52
62
74
48
23
53
58
60
56
45
40
72
38
67
61
41
42
54
40
73
66
41
46
55
73
57
81
49
67
46
60
49
76
77
39
64
83
69
75
73
64
67
53
67
52
55
51
43
63
48
57
74
64
61
74
65
67
68
72
63
64
64
52
70
57
75
51
47
52
88
51
55
78
94
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 63 54 69 39 49 34 56 74 61 57 31 70 53 61
2 класс 61 44 48 75 63 30 68 45 75 67 47 47 31 41
1 кл 42 26 54 42 95
2 кл 76 66 44 31 54
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
35
32
43
52
46
48
36
40
37
37
51
62
42
52
28
36
43
54
6
18
15
27
22
28
11
27
40
47
46
52
43
52
13
11
59
62
41
42
22
24
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
20
«3»
43
20
«4»
43
23
«5»
30
27
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
87
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 132 121
Дети 149 134
125 143 103 103 113 109 116
151 141 101 104 120 103 122
109 102 137 89 103 121 130
102 94 131 87 102 125 143
111 104
128 107
105
118
Вариант 13
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
4
5
3
4
4
2
3
5
5
5
4
5
5
2
2
3
4
3
2
3
3
4
4
5
3
2
3
3
2
3
2
3
3
4
3
2
3
5
2
2
2
4
4
2
5
3
4
2
3
5
3
4
2
4
5
3
5
5
2
4
3
3
5
4
2
5
4
3
3
5
4
2
4
4
3
3
2
5
2
3
4
2
3
5
2
4
2
2
4
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
61
59
76
41
51
65
54
73
51
70
73
46
79
66
50
78
67
74
48
36
59
65
58
62
65
63
58
62
42
45
38
45
53
39
66
60
65
79
45
84
63
69
76
77
65
73
73
63
76
62
65
73
45
95
56
51
45
68
52
49
43
99
64
59
87
57
39
47
71
74
53
67
56
60
64
51
52
41
65
76
55
53
34
66
78
67
61
76
75
55
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 57 69 22 65 73 58 60 61 76 76 45 60 67 57
2 класс 64 67 93 44 76 84 79 57 40 55 71 60 56 67
1 кл 67 49 51 55 100
2 кл 65 63 47 90 54
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
88
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 54
После 67
37
38
26
26
30
32
42
46
16
12
39
44
24
36
46
56
34
44
30
37
31
43
29
39
1
4
47
59
31
37
40
43
38
44
43
43
24
30
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
32
22
«3»
40
26
«4»
35
24
«5»
43
18
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 128 136
Дети 122 135
135 99 93 122
140 120 95 123
139 118 86 133
153 130 78 131
132
130
139
147
93
94
95
95
77 120 121
86 112 111
91 82
87 91
Вариант 14
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
3
3
4
4
5
5
5
5
3
3
2
5
3
2
5
2
3
3
2
5
3
3
2
2
2
5
5
5
4
3
4
2
3
5
5
2
3
4
2
2
5
3
5
5
4
4
4
89
2
3
5
2
4
2
4
5
3
2
5
2
4
4
2
4
3
2
4
2
5
5
2
4
3
4
5
3
3
3
4
4
2
5
3
5
3
2
5
5
5
4
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
67
68
50
78
75
50
51
48
47
66
62
58
33
53
71
63
46
31
46
51
58
44
51
53
62
37
61
46
48
33
52
43
39
79
37
49
69
76
33
94
50
46
78
67
61
48
58
57
35
65
75
36
28
60
61
53
53
58
35
80
57
74
76
52
42
68
48
68
45
62
34
42
40
35
63
49
61
36
97
41
73
45
67
30
37
52
37
78
49
57
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 84 67 49 50 55 81 47 81 86 51 56 87 75 40
2 класс 68 58 69 63 85 65 74 70 52 77 57 61 59 79
1 кл 57 53 51 65 26
2 кл 80 59 56 92 42
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 30
После 9
27
33
34
46
23
18
40
37
49
54
56
64
47
54
46
51
38
44
44
54
10
12
19
34
42
53
35
28
21
35
30
41
38
41
31
39
49
56
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
32
17
«3»
49
27
«4»
37
24
«5»
32
22
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
90
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 126 117
Дети 118 124
129
140
125
115
125
135
115
122
115
111
104
104
114
122
118
112
144
135
132
124
113
112
135
152
121
125
119
111
110 103
111 104
132
106
Вариант 15
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
5
3
4
3
4
4
3
2
3
5
4
5
3
3
4
5
2
3
2
4
4
3
5
4
3
5
2
2
5
5
4
5
3
3
2
3
4
2
4
2
5
3
5
3
5
5
2
4
4
2
2
2
4
5
5
3
5
4
4
3
2
4
3
3
4
3
3
5
2
2
4
2
4
2
2
5
4
4
3
3
2
2
5
5
5
4
4
3
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
46
74
50
89
60
74
71
57
61
69
74
77
82
60
76
54
47
79
68
58
55
43
84
59
55
67
73
72
44
49
64
56
90
70
71
51
36
76
60
62
71
63
74
69
63
53
53
68
52
76
67
75
67
63
64
64
43
59
69
57
46
72
82
65
66
37
59
60
72
80
46
71
65
76
67
54
53
64
71
93
63
32
64
48
56
75
75
57
66
56
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
91
1 класс 35 63 80 56 54 73 83 61 63 49 56 59 55 49
2 класс 85 55 76 54 70 86 87 73 70 64 68 78 60 74
1 кл 43 64 63 45 57
2 кл 73 54 56 70 61
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 31
После 48
49
52
24
23
42
40
40
52
29
33
51
56
28
43
22
32
24
34
56
67
32
36
38
47
48
52
47
55
36
33
27
28
40
45
8
6
36
40
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
30
19
«3»
35
23
«4»
39
28
«5»
46
20
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 90 108 113 88 123 97 105 120 118
Дети 92 96 102 77 120 89 121 113 106
Родители 114 130
110 114 115 75 137 104 109 99
Дети 124 144
93 116 133 88 133 96 101 112
92
Вариант 16
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
4
5
5
2
5
3
5
2
2
5
3
2
4
5
5
2
4
3
3
2
3
4
2
2
3
2
3
4
5
2
2
5
2
5
4
5
5
2
4
2
2
2
2
4
4
3
4
3
5
2
5
2
2
3
4
3
3
4
2
4
2
4
2
2
5
5
4
3
5
4
4
4
2
5
3
2
5
2
4
4
3
2
2
3
2
3
5
4
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
51
53
56
21
81
54
63
74
73
32
65
62
68
57
42
62
61
59
28
50
40
33
70
51
38
35
39
53
23
44
34
77
59
72
43
72
41
34
59
50
71
69
56
50
71
54
54
64
51
62
43
54
31
48
61
17
58
69
63
52
57
73
40
64
2
38
61
62
57
71
60
63
43
27
64
32
62
78
69
32
47
69
51
45
43
27
87
10
56
61
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 67 67 53 73 52 71 47 59 56 40 50 79 75 60
2 класс 57 69 70 30 65 45 56 46 64 60 53 43 55 25
1 кл 43 50 58 47 66
2 кл 85 53 68 61 66
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
43
47
37
42
39
34
37
46
26
21
54
62
40
42
93
62
71
66
65
51
58
38
45
24
23
32
34
41
43
20
34
До 52
После 52
35
45
30
32
37
44
42
57
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
«2»
30
21
1 школа
2 школа
«3»
44
23
«4»
44
24
«5»
32
22
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 111 102
Дети 119 119
111
121
139
144
109 95 143
122 83 132
141 131 117
130 144 131
138 113 137 130 97
143 115 152 136 97
118 93 127 112
108 89 134 116
Вариант 17
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
5
2
3
2
3
3
2
3
2
2
5
4
4
3
4
3
4
5
2
2
4
2
3
4
4
5
5
4
2
2
5
3
5
5
3
2
2
5
2
2
4
5
4
2
3
4
4
4
4
5
2
3
5
5
2
3
3
3
4
3
2
3
4
2
2
3
4
2
2
5
3
5
5
4
5
3
2
5
3
4
4
4
5
4
3
3
5
2
2
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
94
67
61
44
66
55
58
71
55
71
74
77
56
62
54
69
71
61
79
67
53
86
67
74
56
76
79
64
75
72
80
37
73
74
61
71
84
58
81
70
71
74
90
92
44
68
61
51
58
69
55
63
53
71
60
72
83
56
72
46
58
57
50
69
65
91
59
72
83
71
64
62
58
90
57
73
76
63
50
72
50
68
78
68
61
57
67
64
65
75
87
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 56 73 92 76 60 56 62 51 55 93 60 77 49 32
2 класс 94 69 62 70 77 66 57 71 92 70 62 66 52 69
1 кл 74 66 64 43 61
2 кл 63 84 65 65 76
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 38
После 57
43
42
29
34
46
42
53
60
20
26
37
49
41
43
40
48
33
37
36
46
43
47
52
67
43
48
39
41
37
43
31
42
37
42
27
29
25
32
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
20
«3»
39
15
«4»
47
25
«5»
30
30
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
95
Родители
Дети
Родители 122 129
Дети 112 134
118
116
113
115
128
139
134
122
121
128
145
157
110 111 80 129 92 103
109 107 88 114 103 107
115 92 94 109 79
105 82 93 124 82
Вариант 18
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
4
4
2
4
5
4
4
3
3
4
4
5
4
3
5
2
5
2
3
3
5
4
5
4
5
5
4
4
5
5
2
2
4
4
4
3
3
2
2
3
3
5
3
5
2
2
3
5
5
2
5
3
4
3
4
2
2
2
5
5
4
3
2
3
4
5
5
5
3
5
2
5
4
5
3
4
2
2
5
5
5
3
4
4
2
5
2
5
4
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
38
36
52
24
10
92
56
53
43
68
43
41
45
57
55
68
47
29
45
71
74
29
41
45
38
49
52
39
75
68
30
16
67
50
71
55
32
56
42
54
29
85
62
68
73
33
38
69
41
84
41
70
47
48
61
36
47
45
60
77
46
53
56
54
64
87
59
40
42
58
34
80
45
84
61
49
22
72
77
53
43
63
15
53
26
65
45
71
61
30
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 68 59 41 50 65 65 50 69 64 71 61 74 61 25
2 класс 43 40 58 43 60 21 43 29 40 49 11 48 62 57
1 кл 43 43 56 48 70
2 кл 17 5 79 54 14
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
96
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
47
53
40
44
54
56
52
53
30
35
19
28
38
47
38
41
25
30
19
24
26
30
16
13
65
77
40
48
35
38
26
16
40
52
36
34
19
40
58
68
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
31
16
«3»
48
25
«4»
28
27
«5»
43
22
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 134 115 146 116 95 125 100 132 119
Дети 110 101 128 114 97 109 97 159 97
Родители 132 112 117 109 98 121 116 132 116 116
Дети 127 115 97 109 98 132 108 114 120 117
Вариант 19
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
5
2
4
3
2
2
5
5
4
4
4
5
5
4
2
2
3
5
4
4
2
3
4
3
2
2
5
5
5
2
5
3
5
2
2
3
4
3
2
4
5
2
4
3
2
2
3
4
97
3
2
4
2
2
3
5
5
3
4
4
5
5
3
2
2
2
2
2
3
2
3
5
2
5
3
3
5
4
3
5
5
4
2
5
2
4
3
5
2
5
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
65
75
53
69
85
64
89
68
47
71
59
76
72
61
72
60
75
66
53
61
68
56
88
67
61
71
83
64
61
63
64
91
58
66
59
72
59
76
67
69
49
70
61
64
82
49
68
82
90
66
73
82
66
70
51
66
74
90
72
83
73
51
79
73
61
68
82
64
61
62
52
63
76
53
53
62
61
74
61
76
67
70
63
78
55
92
72
63
59
70
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 38 65 75 67 75 77 80 74 65 63 59 39 63 69
2 класс 59 61 40 40 46 57 83 60 65 85 56 76 69 61
1 кл 49 80 81 87 81
2 кл 57 61 50 71 47
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 36
После 7
29
24
41
52
23
23
25
32
38
32
47
49
51
60
21
33
9
8
42
47
41
49
55
56
39
27
47
55
35
43
59
56
13
20
54
51
38
40
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
36
21
«3»
40
26
«4»
46
26
«5»
28
17
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
98
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 115 88 125 107
Дети 106 90 136 114
Родители 114 104 103 84 130 104
Дети 128 107 87 79 113 110
100
100
138
159
86
86
91
88
122 125 94
122 122 90
128 99
123 83
Вариант 20
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
4
2
5
2
3
3
2
3
5
2
4
2
4
4
3
4
3
5
5
5
5
5
3
2
3
4
4
5
4
2
3
3
2
4
4
3
2
4
3
3
2
3
2
4
2
4
4
4
5
2
5
4
3
5
5
5
4
5
3
4
2
4
5
5
2
4
4
2
4
2
2
2
2
4
3
3
3
4
4
2
3
5
3
2
5
5
3
3
4
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
61
58
32
57
64
30
44
6
38
65
54
52
61
33
67
53
54
16
44
55
33
52
35
52
38
49
28
57
75
50
39
67
26
71
58
27
34
68
30
62
44
48
45
25
75
14
40
55
49
42
76
22
52
40
64
59
27
82
49
93
47
53
52
52
77
39
64
50
70
44
49
57
65
56
68
35
36
34
80
85
67
65
47
71
56
53
48
45
42
34
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
99
1 класс 61 65 65 84 57 56 60 91 45 51 71 61 72 62
2 класс 59 61 65 26 87 45 52 53 38 44 60 62 78 66
1 кл 56 65 72 55 75
2 кл 41 52 59 19 42
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 30
После 19
23
26
39
38
36
35
56
57
31
45
51
60
33
40
44
59
47
56
40
46
35
39
26
32
20
25
29
45
29
34
37
47
40
44
37
34
50
49
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
32
15
«3»
37
18
«4»
34
28
«5»
47
29
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 133 97
Дети 114 119
124
123
137
142
87
86
92
85
128 107 142 110 132 107 127
161 113 123 102 144 101 134
127 99 127 114 108 120
113 95 117 94 99 108
100
Вариант 21
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
2
5
3
4
4
4
3
5
4
3
3
5
3
2
3
4
2
5
3
2
4
3
4
3
3
4
2
4
2
3
4
2
5
2
2
2
4
3
2
4
2
2
2
5
4
3
2
4
5
5
2
2
5
5
2
3
3
5
4
3
5
5
4
3
2
5
2
3
4
4
5
2
3
5
3
5
4
3
3
2
4
3
3
2
5
4
4
3
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
80
74
63
66
58
58
57
71
65
56
45
75
33
64
60
57
50
58
82
58
39
58
45
70
55
84
49
73
69
69
47
49
46
71
30
60
40
66
53
51
78
65
52
43
80
73
52
51
59
71
95
60
45
57
60
67
75
62
33
65
90
44
53
45
40
35
43
68
58
77
55
67
57
42
65
67
40
37
71
76
64
73
61
67
53
54
58
92
45
63
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 61 65 65 84 57 56 60 91 45 51 71 61 72 62
2 класс 45 60 62 74 75 57 22 53 57 55 72 70 64 39
1 кл 56 65 72 55 75
2 кл 40 72 64 68 61
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
30
39
35
32
45
57
41
58
46
48
25
21
27
33
101
36
39
48
50
38
38
38
45
38
45
60
66
37
52
6
8
До 33
После 40
41
35
44
50
12
17
30
41
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
35
19
«3»
42
20
«4»
35
30
«5»
38
21
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 97 109 110 103 122 106 129 120 128
Дети 107 121 123 111 120 99 137 111 125
Родители 113 113 115 125 114 99 140 103 88 132
Дети 115 113 117 116 84 97 133 111 100 154
Вариант 22
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
5
4
3
2
2
4
5
5
2
3
4
3
3
5
5
5
3
5
3
2
4
4
4
5
3
5
2
4
2
5
5
3
5
4
4
4
5
3
2
2
4
3
3
3
2
2
5
4
2
3
4
3
2
3
2
4
2
5
3
2
3
4
5
5
3
3
2
4
2
3
5
4
4
4
2
2
3
4
4
2
3
3
4
4
2
4
5
2
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
102
68
45
36
60
64
40
65
75
46
51
67
66
64
56
84
52
43
52
82
72
51
53
42
71
63
33
48
77
49
96
65
69
74
51
55
64
56
50
35
79
68
59
76
85
67
73
59
59
38
54
32
46
47
49
28
54
58
64
63
80
57
64
69
38
60
42
60
60
80
61
68
78
66
38
36
76
82
73
46
55
49
60
58
66
48
43
49
60
60
55
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 52 68 72 59 57 56 91 41 65 58 78 50 83 68
2 класс 65 59 67 63 77 68 61 59 60 82 68 63 92 54
1 кл 35 68 55 75 43
2 кл 72 44 66 71 84
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 38
После 42
38
47
45
51
50
44
34
44
32
39
23
26
34
36
46
53
10
17
29
37
22
21
27
28
15
18
18
29
42
45
22
26
54
61
26
21
46
58
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
30
20
«3»
38
21
«4»
47
24
«5»
35
25
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
103
Родители 104 102 135 133
Дети 101 110 128 163
Родители 104 112 106 103 136 116
Дети 107 77 99 96 140 117
122 125 96 117 116
118 118 108 114 115
118 115 135 105
105 98 156 104
Вариант 23
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
3
3
3
4
3
5
5
4
5
3
2
4
2
4
5
2
4
4
5
2
3
2
3
3
2
3
3
3
2
4
4
4
2
3
4
2
3
4
3
3
5
3
3
5
2
2
4
5
2
2
5
2
5
5
4
5
4
5
2
2
4
2
2
5
3
5
3
3
5
2
3
5
2
5
2
2
5
4
4
5
2
4
5
2
2
2
5
4
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
67
56
84
60
60
75
56
71
83
68
72
66
73
56
61
69
65
71
76
57
66
87
71
60
46
42
64
64
68
54
78
70
60
66
62
60
62
32
62
39
64
48
80
51
48
73
65
52
65
25
55
51
63
72
80
51
73
43
84
71
68
59
54
47
52
65
78
52
41
56
53
66
81
66
50
77
42
53
39
57
74
72
62
45
71
55
65
84
85
72
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 52 67 48 66 70 55 73 45 49 66 78 48 71 61
2 класс 23 51 40 66 48 44 42 59 68 46 57 63 59 60
1 кл 75 54 75 47 45
2 кл 35 30 38 78 64
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
104
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 41
После 46
47
61
56
66
50
50
30
30
50
57
26
33
50
49
37
31
36
45
47
56
40
45
38
54
55
53
36
39
58
70
30
28
31
40
52
62
44
41
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
37
18
«3»
42
29
«4»
43
19
«5»
28
24
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 116 121 113 147 126 115 126
Дети 105 118 115 140 121 136 116
Родители 119 111 99 127 113 89 118 124 109
Дети 122 98 88 135 136 87 110 125 103
109 135
117 121
131
133
Вариант 24
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
3
5
3
2
4
2
3
5
4
3
2
3
3
3
5
4
4
2
5
2
3
4
4
2
5
2
4
5
3
2
3
2
4
4
2
5
4
2
5
3
3
4
4
3
3
2
2
105
5
4
3
2
3
5
4
4
5
4
2
4
2
4
5
4
2
4
4
5
3
2
4
2
4
3
4
5
3
4
2
4
4
5
5
3
5
5
3
2
4
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
66
58
74
64
85
65
78
46
37
55
71
84
64
81
52
67
85
68
55
29
49
26
67
74
25
70
45
46
47
76
60
92
58
61
45
53
53
63
44
62
36
53
44
70
60
54
44
35
76
40
61
57
63
50
47
77
66
61
72
58
67
48
18
40
58
65
45
50
54
48
41
62
60
70
78
82
18
51
29
50
78
69
27
65
46
19
47
71
72
67
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 39 72 67 43 83 69 62 35 54 63 62 41 64 75
2 класс 71 82 88 66 53 62 64 56 66 62 73 73 87 69
1 кл 78 84 48 77 63
2 кл 59 49 54 59 64
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
44
44
53
58
67
70
50
51
33
32
38
51
35
39
30
46
40
55
32
39
40
48
35
38
33
40
31
27
28
40
48
59
37
41
31
26
40
48
46
51
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
19
«3»
46
28
«4»
40
24
«5»
30
19
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
106
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 96 118
Дети 89 110
109 110 91 105 111 122 135 126 102
107 93 82 114 86 119 132 137 118
134 85 122 124 114 103 129 110
118 86 107 109 123 111 129 100
Вариант 25
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
4
5
5
3
3
4
2
3
3
2
5
5
5
2
2
2
5
3
4
5
4
5
5
5
3
4
3
5
3
3
5
2
2
4
5
2
2
4
2
4
3
3
2
3
5
3
4
4
5
5
2
3
5
5
3
5
2
3
2
4
2
4
4
3
4
3
2
5
5
5
2
3
3
3
2
4
4
3
5
4
3
3
4
2
2
5
4
5
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
63 79 57 52 61 87 67 53 56 41 65 53 46 61 76
74 70 63 79 42 58 61 73 61 72 84 60 71 63 62
72 61 56 64 66 67 87 42 69 83 76 51 64 55 55
48 83 66 64 64 48 53 61 90 74 80 73 43 56 75
66 76 71 73 64 52 65 49 74 75 68 74 65 43 67
72 76 62 71 61 61 62 71 48 55 48 55 63 82 69
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
2 класс
53
33
68
70
61
42
54
49
78
41
42
62
107
67
32
46
45
73
41
81
31
42
62
61
60
82
54
42
100
1 класс 67
2 класс 51
65
57
59
66
47
56
71
41
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 26
После 39
36
45
32
52
38
43
14
10
44
57
42
46
52
49
25
29
36
46
58
64
50
48
29
45
62
75
50
59
32
33
27
22
28
30
42
46
44
55
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
33
18
«3»
48
29
«4»
29
22
«5»
40
21
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 109 127 121
Дети 88 109 141
Родители 114 87 101 126 93
Дети 103 83 99 141 100
108
116 102 104 130 138 109
113 117 85 130 128 113
106 110 99 120 115
103 91 99 125 97
Вариант 26
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
5
2
5
5
5
5
3
5
5
4
4
3
5
2
3
5
5
3
2
2
4
2
3
5
2
5
5
3
4
2
4
5
5
3
4
3
2
4
4
5
2
2
4
4
5
5
2
3
2
2
5
3
5
4
2
2
4
5
5
4
5
3
2
5
4
2
5
3
4
2
2
4
2
5
2
4
3
2
2
2
4
5
5
3
4
4
4
2
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
49 56 21 70 60 61 45 98 82 52 66 46 56 59 49
63 56 42 22 45 40 65 43 24 50 59 66 55 74 67
49 47 61 72 64 57 51 54 37 50 84 64 51 74 69
62 53 47 80 57 59 52 38 59 69 35 66 49 43 64
79 49 71 82 77 44 40 67 69 46 54 61 54 47 37
47 85 75 56 39 75 40 45 49 27 51 70 57 61 25
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
2 класс
1 класс 84
2 класс 61
86
56
64
80
43
63
58
66
81
60
67
65
84
62
51
84
64
95
79
60
86
61
60
57
52
82
46
48
76
50
47
88
43
61
65
64
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
26
24
28
20
35
44
47
49
40
44
25
33
24
38
109
20
20
25
28
32
26
20
25
22
33
40
38
35
43
33
39
До 56
После 50
43
53
30
42
34
43
47
56
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
34
18
«3»
41
25
«4»
36
23
«5»
39
24
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 93 109 130 131 106
88 87 121 108
Дети 94 101 143 112 105 103 89 135 107
Родители 127 131
111 107 135 104 118 107 109 105
Дети 129 145
111 119 127 111 121 93 111 84
Вариант 27
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
4
5
5
2
2
4
5
3
3
3
3
3
2
3
4
3
5
4
5
3
3
4
3
4
3
4
3
5
2
5
2
5
2
3
3
5
3
4
4
5
3
5
3
2
5
3
3
5
5
5
2
4
3
5
4
5
3
2
4
5
2
5
4
3
5
5
2
3
2
2
5
3
4
4
3
2
4
4
3
5
4
5
5
3
5
3
2
5
2
4
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
110
62 55 49 55 70 98 60 64 74 60 77 78 48 74 65
76 63 80 78 56 76 64 59 55 84 59 70 81 69 70
64 70 68 67 77 47 63 80 57 55 78 55 63 86 77
56 62 68 55 69 53 62 72 61 76 82 53 54 94 60
50 52 55 59 53 57 70 71 73 65 65 64 54 65 67
67 71 76 81 95 62 77 66 61 57 46 62 81 85 57
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
2 класс
1 класс 84
2 класс 35
86
55
64
50
43
39
58
63
81
35
67
34
84
34
51
44
64
56
79
59
86
33
60
72
52
6
46
49
76
52
47
44
43
75
65
34
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 29
После 32
53
55
35
38
18
20
45
53
48
54
44
46
35
46
24
27
27
30
26
30
41
44
47
49
43
55
35
40
35
43
42
49
7
0
31
23
14
17
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
32
17
«3»
38
20
«4»
34
29
«5»
46
24
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
111
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 100 93 116
Дети 88 76 112
Родители 100 124 132 131 143
Дети 103 114 118 123 133
111 131 102 102 94 94
112 148 104 95 116 89
145 102 129 104 95
163 90 120 115 86
Вариант 28
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
2
3
3
5
5
2
3
3
2
2
5
4
5
2
4
3
4
3
4
4
5
4
2
4
5
3
5
5
3
2
5
3
2
2
4
3
2
5
3
5
5
5
5
4
5
2
3
3
2
2
2
3
3
4
3
5
4
2
3
4
2
3
3
2
4
4
2
5
3
4
4
4
5
5
3
2
3
5
4
4
5
3
3
5
3
4
2
2
3
4
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
60
58
47
47
58
32
73
41
62
51
47
28
36
26
71
52
64
38
52
60
71
43
66
44
48
42
51
56
58
51
52
63
47
70
60
69
24
48
58
47
44
46
45
45
46
62
70
53
39
59
61
64
45
52
57
57
47
53
54
37
22
75
50
35
49
53
68
20
43
59
79
32
54
63
47
72
53
73
56
25
79
72
41
44
46
50
70
85
63
68
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс
78
2 класс
55
1 кл 59 55 51
2 кл 48 57 70
Задача 4
26
55
41
56
25
62
58
54
83
67
58
70
67
75
112
61
79
59
66
46
84
57
62
52
66
70
72
55
78
62
65
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до 26 37 25 56 36 42 14 35 25 27 37 41 41 27 25
после 30 42 35 56 46 38 23 49 15 28 42 49 52 17 31
До 33
40 32 54 46
После 27 51 35 56 44
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
33
22
«3»
35
25
«4»
39
19
«5»
43
24
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 121 134 129 128 148 87 120 96 129
Дети 115 123 130 129 133 87 118 86 133
Родители 131 130 96 115 112 139 93 123 104 109
Дети 124 143 97 104 107 158 91 118 93 120
Вариант 29
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
5
3
4
3
5
5
2
4
4
2
2
4
5
4
5
2
3
3
4
4
4
5
4
4
4
4
4
5
3
4
5
2
113
5
5
5
4
2
3
3
2
3
4
2
4
4
4
3
2
5
2
3
2
2
2
3
5
3
4
3
3
5
3
3
2
3
2
2
2
5
4
4
5
4
5
4
4
2
2
4
5
5
5
2
3
4
4
4
5
5
5
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
50
85
61
46
100
54
68
77
82
67
57
70
69
71
77
70
89
62
69
63
76
73
43
81
72
78
58
82
61
91
89
80
81
66
65
70
61
86
74
74
62
49
61
76
82
67
83
65
59
42
54
64
77
52
58
63
92
61
63
78
77
54
67
79
69
66
59
70
55
82
80
68
67
63
56
72
63
69
74
82
64
66
71
81
80
84
84
81
75
87
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
б) критерий Стьюдента.
1 класс 53 53 41 62 38 54 55 57 48 46 49 44 55 69
2 класс 50 59 59 75 59 66 67 77 74 79 79 75 59 77
1 класс 94 29 83 52 42
2 класс 62 62 56 74 50
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до 24 57 13 29 32 43 38 58 37 39 35 25 24 35 37
после 32 73 19 30 43 42 44 65 49 48 40 25 31 37 51
До 25
36 33 25 42
После 34 45 30 23 46
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
27
19
«3»
41
20
Задача 6.
114
«4»
47
25
«5»
35
26
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители
Дети
Родители 115 118
Дети 115 113
115 111 138 125 127
131 134 138 129 132
121 88 115 117 134
117 92 113 113 122
106
117
121
112
133
140
131
123
90 130
93 127
80
75
Вариант 30
Задача 1
На основании данных по успеваемости учащихся:
а) построить таблицу частот и таблицу относительных частот;
б) изобразить полигон частот;
в) вычислить среднее арифметическое и стандартное отклонение;
г) вычислить процент успеваемости и процент качества.
3
4
2
2
5
3
4
5
5
2
5
5
4
2
2
3
2
5
4
5
3
4
2
4
2
5
2
4
2
4
4
2
4
3
5
3
3
2
2
5
5
3
4
2
3
2
4
5
4
2
2
4
2
3
2
4
2
5
2
5
2
4
4
2
2
3
4
5
4
3
2
2
3
3
4
2
2
2
2
5
5
5
3
4
4
5
5
4
5
3
Задача 2
На основании данных по результатам ЕГЭ:
а) построить интервальную таблицу частот и интервальную таблицу относительных
частот;
б) изобразить гистограмму частот;
в) вычислить среднее арифметическое и стандартное отклонение.
31
19
31
37
40
86
45
63
48
34
22
68
62
59
48
45
21
39
50
23
7
35
69
65
54
54
47
64
55
46
33
82
42
67
62
32
48
51
46
50
17
40
49
64
60
70
39
52
28
23
68
25
67
76
60
33
44
76
56
45
73
31
64
38
45
48
72
54
61
37
49
52
53
46
63
8
55
43
83
61
34
47
31
61
17
28
76
40
53
35
Задача 3
На основании результатов ЕГЭ по математике в двух классах определить,
различаются ли статистически значимо классы по уровню знаний по математике?
Применить:
а) критерий Манна-Уитни;
115
б) критерий Стьюдента.
1 класс 59 54 71 65 43 59 48 71 29 78 69 31 50 40
2 класс 77 55 74 79 66 52 69 73 75 75 79 70 64 57
1 класс 46 51 40 49 67
2 класс 85 61 74 54 85
Задача 4
Для группы учащихся собрали данные по количеству баллов тестирования в форме
ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли
проведенный курс статистически значимо улучшению уровня знаний по математике?
Применить:
а) критерий Вилкоксона;
б) критерий Стьюдента.
до
после
До 35
После 49
30
38
16
18
26
21
30
24
54
51
36
44
38
40
37
48
21
26
40
36
37
33
24
26
23
31
42
47
23
23
40
43
30
34
32
33
21
24
Задача 5.
На основании данных по результатам ОГЭ по математике в двух школах определить,
имеются ли достоверные отличия в распределении результатов (дифференцированности)
среди этих школ?
1 школа
2 школа
«2»
30
17
«3»
35
26
«4»
48
22
«5»
37
25
Задача 6.
а) На основании анализа результатов Задачи 1 установить, имеют ли данные
равномерное распределение?
б) На основании анализа результатов Задачи 2 установить, имеют ли данные
нормальное распределение?
Задача 7.
Установить, существует ли статистически достоверная корреляционная связь между
показателями уровня интеллекта IQ среди группы родителей и их детей? Применить:
а) метод ранговой корреляции Спирмена;
б) метод линейной корреляции Пирсона.
Родители 116 113 114 122 131 104 70 117 124
Дети 99 116 111 125 116 111 79 122 118
Родители 5 108 108 131 94 121 132 129 119 106
Дети 86 107 100 127 81 143 142 139 124 100
116
Приложения
Функция стандартного нормального распределения.
Таблица №1
117
Критические значения критерия U-Манна-Уитни
Таблица №2
118
Критические значения критерия U-Манна-Уитни
Таблица №2 (продолжение).
119
Критические значения критерия U-Манна-Уитни
Таблица №2 (продолжение).
120
Критические значения критерия U-Манна-Уитни
Таблица №2 (продолжение).
121
Критические значения критерия U-Манна-Уитни
Таблица №2 (продолжение).
122
Критические значения критерия U-Манна-Уитни
Таблица №2 (окончание).
123
Критические значения критерия t-Стьюдента
Таблица №3.
Критические значения критерия Т-Вилкоксона
Таблица №4
124
Критические значения критерия 𝜒 2 -Пирсона
Таблица №5
125
Критические значения критерия 𝜒 2 -Пирсона
Таблица №5 (окончание)
Критические значения коээфициента ранговой корреляции Спирмера
Таблица №6
126
Критические значения коээфициента линенйой корреляции Пирсона
Таблица №7
127
1.
2.
3.
4.
5.
6.
7.
Литература.
Афанасьева В.В., Сивов М.А. Математическая статистика в педагогике. Учебное
пособие/ под науч. ред. д.и.н., проф. М.В. Новикова. – Ярославль: Изд-во ЯГПУ, 2010.
– 76с.
Чиркина А.А. Использование статистических методов в педагогическом
исследовании: методические рекомендации/ А.А. Чиркина, Н.В.Булгакова. – Витебск:
ВГУ имени П.М.Машерова, 2015. – 48с.
Просветов Г.И. Статистика: задачи и решения: Учебно-практическое пособие. – М.:
Издательство «Альфа-Пресс», 2008. – 496с.
Глотова М.Ю., Самохвалова Е.А. Математическая обработка информации: учебник и
практикум для бакалавров. – М.: Изд-во Юрайт, 2015. – 344с.
Остапенко Р.И. Математические основы психологии. Учебно-методическое пособие.
– Воронеж: ВГПУ, 2010. – 76с.
Сидоренко Е.В. Методы математической обработки в психологии. – СПб.: ООО
«Речь», 2003. – 350с.
Ермолаев О.Ю. Математическая статистика для психологов. Учебник./О.Ю. Ермолаев
– 2-е изд. испр. – М. Московский психолого-социальный институт. Изд-во Флинта,
2003. – 336с.
128
Научное издание
Ивирсина Нина Борисовна Танзы Менги Васильевна
Бичи-оол Елена Карловна Хомушку Аяна Мергеновна
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ
Учебно-методическое пособие
Редактор Е.К. Сенди
Дизайн обложки К.К. Сарыглар
Сдано в набор: 21.01.2021. Подписано в печать: 27.01.2021.
Формат бумаги 60×84 1/8. Бумага офсетная.
Физ. печ. л 16,2. Усл. печ. л. 15,1. Заказ № 1675. Тираж 50 экз.
667000, Республика Тыва, г. Кызыл, ул. Ленина, 36
Тувинский государственный университет
Издательство ТувГУ
129
Скачать