ФГБОУ ВО ТУВИНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Кафедра математики и методики преподавания математики Ивирсина Н.Б., Танзы М.В., Бичи-оол Е.К., Хомушку А.М. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ Учебно-методическое пособие для студентов бакалавров педагогического направления Кызыл – 2021 г . УДК 51 ББК И1я73 И 25 Печатается по решению учебно-методического Совета ТувГУ Ивирсина Н.Б. Математические методы обработки данных: учебно-методическое пособие для студентов бакалавров физико-математического факультета / Н.Б. Ивирсина, М.В. Танзы, Е.К. Бичи-оол, А.М. Хомушку.: Тувинский государственный университет. – Кызыл : Издательство ТувГУ, 2021. – 129 с. – Текст : непосредственный. Пособие предназначено для студентов бакалавров физико-математического факультета. Содержит краткие теоретические сведения, примеры решения типовых задач, упражнения для практических занятий, задачи для индивидуальной работы. Может быть рекомендовано студентам всех педагогических направлений подготовки. Рецензенты: Сотников А.И., к.ф.-м.н., старший преподаватель кафедры математики и методики преподавания математики Монгуш С.К. – к.п.н. заведующий кафедрой физико-математического и дистанционного образования ТИРО и ПК © Ивирсина Н.Б., Танзы М.В., Бичи-оол Е.К., Хомушку А.М. 2021 г. © Тувинский государственный университет, 2021 г. 2 Оглавление Введение ....................................................................................................................................4 Глава 1. Первоначальные понятия ..........................................................................................5 Глава 2. Выборочный метод ..................................................................................................13 Глава 3. Группировка..............................................................................................................18 Глава 4. Числовые характеристики выборки .......................................................................23 Глава 5. Общие принципы проверки статистических гипотез ...........................................30 Глава 6. Выявление различий в уровне признака ................................................................35 Глава 7. Оценка сдвига значений признака ..........................................................................43 Глава 8. Выявление различий в распределении признака ..................................................50 Глава 9. Выявление степени согласованности изменений..................................................59 Индивидуальная работа ..........................................................................................................69 Приложения ...........................................................................................................................117 Литература .............................................................................................................................128 3 ВВЕДЕНИЕ Математические методы давно и успешно использовались в таких точных науках как механика, физика, астрономия, находили широкое применение в технике. В последнее время существенно расширилось приложение математики к экономике, химии и другим областям знаний. В процессе изучения дисциплины «Основы математической обработки информации» студент должен осознать ее прикладной характер, уметь использовать математический аппарат при изучении и описании практических задач. Дисциплина призвана прежде всего ознакомить студентов с математическими методами, которые могут применяться в дальнейшей профессиональной деятельности. В данном пособии каждой теме предшествуют теоретические пояснения, включающие важнейшие определения. Затем идут блоки задач, состоящие из решения основных типовых задач и задач для самостоятельного решения. В конце пособия представлена индивидуальная работа на 30 вариантов. Большинство рассматриваемых методов обработки информации являются традиционными параметрическими методами, например, t-критерий Стьюдента и метод линейной корреляции Пирсона. Принцип каждого метода иллюстрируется графически, чтобы знать какого рода преобразования совершаются. Авторы признательны рецензентам за плодотворное обсуждение и ценные замечания. 4 Глава 1. Первоначальные понятия Информация, данные. Информация (от лат. informatio) - означает «сведения, разъяснения». Сведения должны быть новыми, полезным для потребителя. Если в полученных сведениях ничего нового нет, то количество полученной информации будет равно нулю. Более общим является понятие данные. Данные - любые сведения без оценки их значимости для потребителя. Под понятием «информация» в выражении: «математическая обработка информации» будем понимать любые сведения (данные), являющиеся объектом преобразования. Под «математической обработкой» будем понимать определенные алгоритмы действий при выполнении обработки информации с применением математического аппарата. Одной из важнейших наук, занимающихся сбором, систематизацией и обработкой различных данных, является статистика. Статистика (от лат.status - «статус») – положение, состояние явлений. Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых явлений для выявления закономерностей. Измерение данных, шкалы. Измерение – это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном и получает выражение в определенном масштабе или шкале. Виды шкал: 1.номинальная (шкала наименований); 2.порядковая (ранговая шкала); 3.интервальная (шкала равных интервалов); 4.шкала отношений (абсолютная шкала). Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, а осуществляемые с помощью двух последних шкал – количественными. Методы обработки данных зависят от того, в какой шкале измерены собранные статистические данные. Номинальная шкала. Измерение в номинальной шкале состоит в присваивании измеряемому объекту определенного наименования или символа (числового, буквенного). Эта шкала используется для классификации объектов по принципу: «объекты аналогичные по измеряемому признаку попадают в один класс», а «объекты, различающие по этому признаку, попадают в другие классы». Примеры данных, измеренных в номинальной шкале: 1.пол человека: мужской и женский; 2.тип темперамента: сангвиник, меланхолик, холерик, флегматик; 3.обозначение класса: «7а», «7б», «7в» и т.д. Порядковая шкала. Измеренные по этой шкале объекты делятся на множества, которые связаны между собой отношением типа «больше – меньше». Но при этом нельзя сказать, на сколько больше? Примеры данных, измеренных в порядковой шкале: 1.военные звания: майор, лейтенант, капитан и др.; 2.категории работников образования: ассистент, преподаватель, доцент и др. 5 В порядковой шкале все объекты располагаются по рангу (месту) – от самого большого до самого маленького или наоборот. Для кодирования данных, измеренных в порядковой шкале, применяется процедура ранжирования. Ранг – это порядковый номер наблюдения в упорядоченном ряду. Ранжирование – это процесс присвоения наблюдениям их рангов. Проверка правильности ранжирования. Для проверки правильности ранжирования применяется правило. Сумма рангов для 𝑛 ранжируемых величин равна: 𝑛(𝑛 + 1) 1+2+⋯+𝑛 = 2 Замечание. Ранжировать можно величины, измеренные не только в ранговой шкале, но также в интервальной и абсолютной шкале. Пример. Результаты олимпиады по математике указаны в таблице Учащийся 1 2 3 4 5 6 7 8 9 10 Баллы 2 24 10 14 28 8 6 0 5 16 Чтобы определить места, которые заняли учащиеся проранжируем учащихся по количеству набранных баллов. Минимальный ранг - 1 (место) запишем учащемуся, набравшему максимальное количество баллов; остальные ранги запишем в порядке убывания набранных баллов. Учащийся Баллы 1 2 2 24 3 10 4 14 5 28 6 8 7 6 8 0 9 5 10 16 сумма Ранг 9 2 5 4 1 6 7 10 8 3 55 Проверка ранжирования. Количество ранжируемых величин: 𝑛 = 10. 10(10 + 1) = 55 2 Замечание. В зависимости от поставленной задачи можно проставлять ранги и в противоположном порядке. 6 Пример. Необходимо проранжировать учащихся, принявших участие в забеге на 100 метров. В этом случае учащийся, финишировавший с минимальным временем, займет первое место (первый ранг). Случай одинаковых рангов. Одинаковые ранги можно присваивать любому числу ранжируемых одинаковых величин. Если несколько значений оказались равными, то им приписывается ранг, равный средней величине тех рангов, которые эти величины получили бы, если бы они стояли по порядку друг за другом и не были бы равными. Пример. Результаты ЕГЭ по математике учащихся представлены в таблице. Учащийся Баллы 1 26 2 35 3 35 4 46 5 48 6 52 7 52 8 52 9 68 10 82 Проранжируем учащихся по количеству набранных баллов. В примере есть учащиеся, набравшие одинаковое количество баллов. Вначале расставим условные ранги в порядке возрастания баллов (можно выбрать порядок убывания). При этом для одинаковых величин запишем «условно» разные ранги, как будто эти величины стоят друг за другом и различаются (выделим для них условные ранги в скобках). На следующем этапе для одинаковых величин необходимо сложить условные ранги для каждой группы одинаковых величин и поделить на их количество. В результате одинаковые величины будут иметь одинаковые средние ранги, а ранги остальных величин совпадут с условными рангами. Учащийся Баллы 1 2 3 4 5 6 7 8 9 10 26 35 35 46 48 52 52 52 68 82 сумма Условные Ранги 1 (2) (3) 4 5 (6) (7) (8) 9 10 2+3 6+7+8 = 2,5; =7 2 3 7 Ранги 1 2,5 2,5 4 5 7 7 7 9 10 55 Интервальная шкала. В интервальной шкале объекты классифицируются по принципу «больше (меньше) на определенное количество единиц». В шкале интервалов каждое из возможных значений измеренных величин отстоит от ближайшего на равном расстоянии. Особенность шкалы является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства). Примеры данных, измеренных в интервальной шкале: 1.температура по Цельсию (ноль не означает отсутствие температуры); 2.коээфициент интеллекта IQ (ноль не означает отсутствие интеллекта); 3.тестовые шкалы и т.д. Шкала отношений. В шкале отношений объекты классифицируются по принципу «больше (меньше) в определенное количество раз». Особенность этой шкалы является наличие твердо фиксированного нуля, который означает полное отсутствие какого-либо свойства исследуемого объекта. Примеры данных, измеренных в шкале отношений: 1.рост человека; 2.вес человека; 3.количество решенных задач и т.д. Формы представления информации. 1.Таблицы; 2.Графики; 3.Диаграммы. Любая таблица представляет собой прямоугольник, разбитый на горизонтальные строки и вертикальные столбцы (колонки, графы). На пересечении строк и столбцов образуются ячейки, куда и записываются элементы данных. Чаще всего каждый столбец имеет название, которое указывается в первой строке таблицы. Примеры статистических данных в форме таблиц: 1.расписание уроков, 2.страница школьного журнала, 4.прайс-лист с ценами на товары и услуги и др. График (от греч. graphikos - начертанный) - чертеж, применяемый для наглядного изображения зависимости одной величины от другой в виде кривой, прямой, ломаной линии, построенной в той или иной системе координат. Графики могут определять последовательность выполнения действий, протекания событий во времени. Примеры статистических данных в форме графика: 1.график движения поездов, 2.график дежурств, 3.график изменения цен на товары с течением времени и др. Пример. Были собраны статистические данные о изменении роста учащегося с течением времени. Необходимо изобразить данные изменения роста на графике. В 9 лет Коля имел вес 30кг, в 10 лет— 35кг, в 11 лет— 38кг, в 12 лет— 42 кг, в 13 лет— 45 кг, в 14 лет— 51 кг, в 15 лет— 55 кг. Для удобства построения графика, оформим данные сначала в виде таблицы: 8 возраст, лет Вес Коли 9 10 11 12 13 14 15 вес, кг 30 45 51 55 35 38 42 Построим систему координат, где по горизонтальной оси отложим значения возраста мальчика (в годах), а по вертикальной оси соответствующие значения веса (в кг). Замечания. Для наглядности графика для статистических данных масштаб по осям можно выбирать разный; Так как собранные статистические данные принимают только положительные значения, то и изобразить можно только первую четверть для выбранной системы координат; Если минимальные значения собранных данных принимают значение достаточно превышающие ноль, то пустое место между началом координат и минимальные значениями можно не оставлять. Вес, кг Вес Коли 60 55 50 45 40 35 30 25 20 8 9 10 11 12 13 14 15 16 Возраст, лет Диаграмма (греч. Diagramma – изображение, рисунок, чертеж) – графическое представление данных, позволяющее быстро оценить соотношение нескольких величин, выполненное при помощи линий, плоскостей, геометрических фигур, рисунков и т.д. Виды диаграмм. 1) столбиковые; 2) круговые; 3) диаграмма рассеивания и др. На столбчатой (столбиковой) диаграмме по горизонтали откладывают различные значения одного признака, а над каждым таким значением рисуют столбик, высота которого равна соответствующему значению другого признака. На столбчатой диаграмме особенно наглядно видны количественные соотношения величин друг с другом. Пример. Для данных по результатам 1 сессии 1 курса на факультете постройте столбиковую диаграмму. Оценки за экзамены Отлично Хорошо Удовлетворительно Неудовлетворительно Количество оценок 78 192 105 150 9 Количество оценок Результаты 1 сессии 250 192 200 150 150 100 105 78 50 0 Оценки за экзамены Круговая диаграмма представляет собой круг, разрезанный на части, величина которых пропорциональна значениям изучаемого признака. При этом под величиной может пониматься угол, длина дуги, площадь - это не меняет вида диаграммы. Чтобы построить круговую диаграмму, нужно поделить всю окружность на дуги так, чтобы их длины (или соответствующие им центральные углы) оказались в том же отношении, что и представленные на диаграмме величины. Пример. Для представленных выше результатов сессии постройте круговую диаграмму. Оценки за экзамены Количество оценок Отлично 78 Хорошо 192 Удовлетворительно 105 Неудовлетворительно 150 Всего 525 Вычислим долю в % от общего количества полученных оценок: Отлично 78 : 525 = 0,15 ·100 = 15% Хорошо 192 : 525 = 0,36 ·100 = 36% Удовлетворительно 105 : 525 = 0,20 ·100 = 20% Неудовлетворительно 105 : 525 = 0,20 ·100 = 20% Вычислим значения градусной меры углов для круговой диаграммы: Отлично 360°·0,15 = 54° Хорошо 360°·0,36 = 130° Удовлетворительно 360°·0,2 = 72° Неудовлетворительно 360°·0,29 = 104° Оценки за экзамены Отлично Хорошо Удовлетворительно Неудовлетворительно Всего Количество оценок 78 192 105 150 525 Доля в % от общего количества оценок 15 % 36 % 20 % 29 % 100 % 10 Угол 540 1300 720 1040 3600 78 15% 150 29% Отлично Хорошо Удовлетворительно Неудовлетворительно 192 36% 105 20% Диаграмма рассеивания используется для изучения связи между величинами. Эта диаграмма представляет собой конечный набор точек, абсциссы которых равны одному из изучаемых признаков, а ординаты - другому. Если при построении диаграммы рассеивания все ее точки ложатся в окрестности некоторой воображаемой прямой (или гладкой кривой), то связь между изучаемыми величинами существует (тем больше, чем больше «видна» эта прямая). Если эти точки образуют бесформенное облако, которое одинаково плохо приближается к любой прямой (или гладкой кривой), то связи между величинами нет. Построим две диаграммы рассеивания: зависимости цены от площади и площади от этажа: Пример. Имеются данные о площади и стоимости квартир, полученные из газетных объявлений: Площадь квартиры 30 26 18,8 44,2 34 34,6 45 19 17,4 36,6 (в кв. м.) 3 5 7 10 3 5 1 12 7 6 Этаж 32 29 30 36 18 14 28 Цена (в тыс. дол.) 24 22 17 Построим две диаграммы рассеивания: зависимости цены от площади и площади от этажа: Зависимость этажа от площади 40 14 35 12 30 10 25 Этаж Цена (тыс. дол.) Зависимость цены от площади 20 15 8 6 10 4 5 2 0 0 0 10 20 30 40 50 0 Площадь ( кв.м.) 20 40 Площадь (кв. м. ) Выводы: 1) Между площадью и ценой наблюдается связь. 2) Между площадью и этажом нет связи. 11 60 Упражнения. 1. В таблице даны денежные вклады граждан России в Сбербанке РФ в каждом месяце 2010г. 1 2 3 4 5 6 7 8 9 10 Месяц Вклад, млрд. 550 560 560 640 640 1100 1100 1100 1630 1610 руб. Постройте столбиковую диаграмму, отражающую данные таблицы. 11 1610 12 2500 2. В таблице приведена приблизительная численность учителей общеобразовательных школ и интернатов в России по годам (тыс.чел. к началу учебного года). 1940/ 1950/ 1960/ 1970/ 1980/ 1990/ 2000/ 1941 1951 1961 1971 1981 1991 2001 700 800 1010 1230 1070 1440 1710 Учителя Постройте столбиковую диаграмму, отражающую данные таблицы. Годы 2005/ 2006 1540 2006/ 2007 1480 3. В таблице представлен объём поставок российского газа в три страны в 2001 году, в млрд. куб. м: Страны Экспорт газа из России в 2001 г., млрд. куб. м Болгария 3,32 Швейцария 0,34 Турция 11,12 Постройте круговую диаграмму, отражающую распределение долей. 4. В таблице приведено количество уроков в третьей четверти по категориям: ЕстественноМатематические Другие научные 143 91 75 51 Постройте круговую диаграмму, отражающую распределение долей. Гуманитарные Всего 5. Имеются данные о площади и стоимости квартир, полученные из газетных объявлений: 30 26 18,8 44,2 34 34,6 45 19 17,4 36,6 Площадь, кв. м. 24 22 17 32 29 30 36 18 14 28 Цена, тыс. долл. США Построить диаграмму рассеивания и сделайте вывод о наличии зависимости цены за квартиру от ее площади. 12 Глава 2. Выборочный метод Статистические совокупности. Статистическое исследование начинают с выделения совокупности объектов наблюдения. Виды совокупностей. 1.генеральная совокупность; 2.выборочная совокупность (выборка). Генеральная совокупность это совокупность всех объектов наблюдения и для ее изучения применяется сплошное исследование. Выборочной совокупностью (выборкой) называют совокупность объектов наблюдения, выбранных случайным образом из генеральной совокупности. Для ее изучения применяется выборочное исследование (выборочный метод). Основная идея выборочного метода состоит в том, чтобы по выборке сделать заключения о свойствах всей генеральной совокупности. Пример. При изучении брака продукции не требуется изучать всю произведенную продукцию, а можно случайным образом отобрать определенное количество товара и его проверить. Выводы по выборке будут распространяться на весь произведенный товар. Для достоверности таких заключений необходимо строить выборку с учетом определенных требований: случайный отбор, достаточный объем, однородность, репрезентативность (представительность). Объемом совокупности называют количество объектов этой совокупности. Объем генеральной совокупности обозначим – 𝑁. Объем выборочной совокупности (выборки) – 𝑛. Пример. Нужно изучить 1000 деталей, изготовленных заводом за смену на долю брака. На практике выбирают случайным образом для проверки 100 деталей. Объем генеральной совокупности: 𝑁 = 1000. Объем выборки: 𝑛 = 100. По объему выборки разделяют: малая выборка, если n<30; средняя выборка, если 30<n<100; большая выборка, если n>100. Выделяют независимые и зависимые выборки. Выборки называются независимыми (несвязными), если полученные наблюдения в одной выборке не оказывают влияние на наблюдения в другой выборке. Выборки называются зависимыми (связными), если полученные наблюдения в одной выборке оказывают влияние на наблюдения в другой выборке. Пример. Результаты одинаковой контрольной работы по одной теме в двух разных классах представляют собой независимые выборки. Результаты одинакового теста по одной теме в одном классе в разное время представляют собой зависимые выборки. Через определенное время проверяются остаточные знания. Выбрав совокупность объектов наблюдения, дальше ее требуется изучить относительно некоторого признака 𝑿. Пример. При изучении рождаемости собирают данные по количеству детей в семье. Изучаемый признак 𝑋 – количество детей в семье. Вариантами называются значения признака. Обозначим 𝑥𝑖 (𝑖 – «индекс», номер). 13 Пример. Признак 𝑋 – количество детей в семье может принимать значения 0, 1, 2, … и т.д. Варианты 𝑥1 = 0, … Виды значений вариант. 1.Дискретные; 2.Непрерывные. Дискретными значениями вариант называются такие варианты, которые отличаются на некоторую конечную величину (как правило, целое число). Пример. При изучении количества детей в семьях варианты могут принимать значения два или три, но не могут принимать значение два с половиной. Значения вариант называются непрерывными, если они могут отличаться на сколь угодно малую величину. Пример. При изучении времени забега на определенную дистанцию варианты могут отличаться на доли секунды. Дальнейшая обработка собранных данных зависит от вида значений вариант. Если исследуемый признак принимает дискретные значения, то в выборке варианты, как правило, повторяются. Частотой варианты называется количество повторений данной варианты во всей выборке. Обозначим 𝑛𝑖 . Свойство: Сумма частот всех вариант выборки равна объему этой выборки: 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛. Относительной частотой варианты называется величина равная доле частоты этой варианты относительно объема выборки. Обозначим 𝑤𝑖 . 𝑛 Найдем по формуле: 𝑤𝑖 = 𝑛𝑖. Замечание. Если 𝑤𝑖 умножить на 100, то получим долю варианты в процентах. Свойство: Сумма относительных частот всех вариант выборки равна единице. 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑘 = 1 Пример. В 6 «а» классе учащиеся писали контрольную работу по математике и получили следующие оценки: 2, 3, 4, 4, 5, 2, 3, 3, 4, 4, 4, 5, 4, 4, 5, 2, 3, 4, 3, 4. Определим объем выборки, варианты и их частоты. Объем выборки: 𝑛 = 20 (количество собранных данных). Выпишем варианты (оценки) и соответствующие частоты (повторы): 𝑥1 = 2, 𝑛1 = 3 (количество повторений «двоек»); 𝑥2 = 3, 𝑛2 = 5 (количество повторений «троек»); 𝑥3 = 4, 𝑛3 = 9 (количество повторений «четверок»); 𝑥4 = 5, 𝑛4 = 3 (количество повторений «пятерок»); Проверим: 𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 = 3 + 5 + 9 + 3 = 20 = 𝑛 (верно). 𝑛 Относительные частоты рассчитаем по формуле: 𝑤𝑖 = 𝑛𝑖 . 𝑛 3 𝑛 5 𝑛 9 𝑛 3 𝑤1 = 𝑛1 = 20 = 0,15 (15%); 𝑤2 = 𝑛2 = 20 = 0,25 (25%); 𝑤3 = 𝑛3 = 20 = 0,45 (45%); 𝑤4 = 𝑛4 = 20 = 0,15 (15%). Проверим: 𝑤1 + 𝑤2 + 𝑤3 + 𝑤4 = 0,15 + 0,25 + 0,45 + 0,15 = 1 (верно). 14 В педагогике используют такие понятия, как процент успеваемости и процент качества. Процент успеваемости – это доля количества оценок: 3,4,5 в общем количестве оценок. Сумму повторений (частоты) оценок 3,4,5 делим на общее количество оценок (объем выборки) и умножаем на 100. Процент качества – это доля количества оценок: 4,5 в общем количестве оценок. Сумму повторений (частоты) оценок 4,5 делим на общее количество оценок (объем выборки) и умножаем на 100. В примере с оценками 6 «а» класса за контрольную работу посчитаем процент успеваемости и процент качества: 5+9+3 Процент успеваемости: 20 ∙ 100 = 0,85 ∙ 100 = 85%, 9+3 Процент качества: 20 ∙ 100 = 0,6 ∙ 100 = 60%. Для более удобного и наглядного представления статистические данные оформляются в виде таблиц и графиков. Таблица частот представляет собой таблицу, в которой в первую строку записывают значения вариант, а во вторую соответствующие им частоты. Варианты 𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑘 Частоты 𝑛𝑖 𝑛1 𝑛2 … 𝑛𝑘 Таблица относительных частот представляет собой таблицу, в которой в первую строку записывают значения вариант, а во вторую соответствующие им относительные частоты. Варианты 𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑘 Относительные частоты 𝑤𝑖 𝑤1 𝑤2 … 𝑤𝑘 Полигон частот – это ломаная линия на координатной плоскости, построенная из точек с координатами: (𝑥1 ; 𝑛1 ), (𝑥2 ; 𝑛2 ), …, (𝑥𝑘 ; 𝑛𝑘 ), соединенных последовательно отрезками. Полигон относительных частот – это ломаная линия на координатной плоскости, построенная из точек с координатами: (𝑥1 ; 𝑤1 ), (𝑥2 ; 𝑤2 ), …, (𝑥𝑘 ; 𝑤𝑘 ), соединенных последовательно отрезками. В примере с оценками 6 «а» класса за контрольную работу построим таблицы частот и полигоны частот. Частоты были посчитаны выше, осталось оформить их в таблицы. Чтобы построить полигоны, необходимо на плоскости построить точки, координаты которых возьмём из таблиц частот, а затем соединим отрезками, получившиеся точки. Таблица частот 𝑥𝑖 𝑛𝑖 2 3 3 5 15 4 9 5 3 Частоты Полигон частот 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 Варианты Таблица относительных частот 3 4 5 𝑥𝑖 2 𝑤𝑖 0,15 0,25 0,45 0,15 Полигон относительных частот Относительные частоты 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 Варианты Упражнения 1.На основании данных размера одежды учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот и полигон относительных частот. 36 46 36 36 38 40 42 42 44 36 42 44 42 42 42 44 42 40 36 38 38 44 46 36 40 38 38 38 50 46 44 42 40 44 42 42 46 40 44 38 46 44 40 42 38 2. На основании данных температуры: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот. -3 -5 2 1 -1 -3 -1 2 -1 1 -1 -2 0 -3 2 0 -3 -2 -1 -4 0 -2 -1 -4 0 -5 -4 -1 1 -3 2 0 -2 1 -5 1 -3 1 1 -1 0 1 1 1 2 -5 -4 1 -4 2 -3 -5 16 36 42 44 48 36 0 -2 -1 -3 1 -1 0 1 3. По результатам тестирования группы студентов: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот. 3 2 4 4 6 6 4 9 2 2 6 8 6 4 9 1 5 8 4 10 7 10 2 7 10 2 3 10 9 8 1 6 2 4 2 4 7 3 4 6 10 3 6 2 6 8 4 4 10 8 4. На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот и полигон относительных частот. в) вычислить процент успеваемости и качества. 2 5 4 2 2 3 3 3 4 5 4 2 5 4 3 3 5 3 5 2 4 4 2 3 3 2 5 2 3 3 2 5 4 2 3 3 2 5 2 4 3 3 3 4 3 5 5 5 4 3 3 3 5 5 5 5 2 3 2 2 5 2 2 2 3 4 4 5 2 4 2 3 3 3 4 4 3 2 4 2 3 4 4 3 2 5 2 4 3 4 5. Для отрывка из поэмы А.С. Пушкина «Медный всадник» составьте таблицы частот и относительных частот букв «а», «и», «о», «е», «у», «я». На берегу пустынных волн Стоял он, дум великих полн, И вдаль глядел. Пред ним широко Река неслася; бедный чёлн По ней стремился одиноко. По мшистым, топким берегам Чернели избы здесь и там, Приют убогого чухонца; И лес, неведомый лучам В тумане спрятанного солнца, Кругом шумел. И думал он: Отсель грозить мы будем шведу, Здесь будет город заложен На зло надменному соседу. Природой здесь нам суждено В Европу прорубить окно, Ногою твердой стать при море. Сюда по новым им волнам Все флаги в гости будут к нам, И запируем на просторе. 17 Глава 3. Группировка Если варианты принимают непрерывные значения или дискретные, но имеющие большой разброс значений, то для обработки таких данных, как правило, выполняют группировку. Процесс группировки состоит в том, что весь диапазон вариант разбивают на небольшое количество групп (интервалов). Пример. Собирая демографические данные о возрасте населения, исследователи получают большой разброс значений. В дальнейшем данные разбивают на возрастные группы, например: от 0 до 14 лет, … Чтобы произвести группировку необходимо: 1.определить количество интервалов; 2.определить длину каждого интервала; 3.составить интервалы; 4.посчитать интервальные частоты. Количество интервалов. Количество интервалов определяется спецификой собранных данных. Пример. Собирая данные по возрастам, социолог может выделить одно количество интервалов, психолог другое, педагог третье. Количество интервалов обозначим – 𝑘. Нужно учесть, что малое количество интервалов может сильно исказить результаты дальнейших расчетов, а большое количество может затруднить дальнейшие расчеты. Рекомендуемое оптимальное количество интервалов можно рассчитать по формуле Стерджесса: 𝑘 = 1 + 3,3 ∙ lg 𝑛, где 𝑛 - объем выборки, lg 𝑛- десятичный логарифм. Длина интервалов. Длина интервалов также определяется спецификой собранных данных. Пример. Психолог может разбить данные о возрасте на группы, связанные с возрастными кризисами, а педагог связанные с уровнем образования. Длину интервалов обозначим - ℎ𝑖 . Одинаковую для всех интервалов длину обозначим - ℎ и найдем, как: 𝑅 ℎ= , 𝑘 где 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 (размах выборки). Замечание. В процессе группировки необходимо следить, чтобы ни одна из вариант не оказалась за пределами созданных интервалов. Это может возникнуть, например, когда величину ℎ округляют. Рекомендуется округлять в большую сторону, независимо от математических правил округления. Интервалы. Существует следующий вариант построения интервалов. Вид интервалов: [𝑎𝑖 ; 𝑎𝑖+1 ); последний интервал вида: [𝑎𝑘 ; 𝑎𝑘+1 ]. Начнем составлять интервалы с 𝑎1 = 𝑥𝑚𝑖𝑛 , и последовательно каждый раз будем прибавлять длину интервала 𝑎2 = 𝑎1 + ℎ, 𝑎3 = 𝑎2 + ℎ, …. Замечание. В качестве начальной границы 𝑎1 можно взять величину меньше, чем 𝑥𝑚𝑖𝑛 . При этом границу подбирать нужно так, чтобы ни одна из вариант не оказалась за пределами созданных интервалов. 18 Интервальные частоты. Под интервальной частотой будем понимать количество вариант, «попавших» в соответствующий интервал. Варианта 𝑥 «попадает» в интервал [𝑎𝑖 ; 𝑎𝑖+1 ), если для нее выполняется неравенство 𝑎𝑖 ≤ 𝑥 < 𝑎𝑖+1 ; «попадает» в интервал [𝑎𝑘 ; 𝑎𝑘+1 ], если выполняется неравенство 𝑎𝑘 ≤ 𝑥 ≤ 𝑎𝑘+1. Замечание. «круглая» скобка - граница «не принадлежит», неравенство строгое; «квадратная» скобка - граница «принадлежит», неравенство нестрогое. Обозначим интервальные частоты - 𝑛𝑖 . Для найденных интервальных частот можно рассчитать интервальные относительные частоты. 𝑛 Обозначим их 𝑤𝑖 и найдем по формуле: 𝑤𝑖 = 𝑛𝑖 . Пример. Результаты ЕГЭ по математике учащихся 11 «а» имеют большой разброс значений. Необходимо выполнить группировку с интервалами одинаковой длины. 71 49 50 46 49 51 70 59 53 44 75 57 44 50 47 52 46 38 61 36 23 41 66 63 34 41 30 55 84 71 1 шаг. Количество интервалов. Объем выборки n = 30. Количество интервалов найдем по формуле Стерджесса: k = 1 + 3,3 ∙ lg30 = 1 + 3,3 ∙ 1,5 ≈ 6. 2 шаг. Длина интервалов. Разброс значений: xmin = 23, xmax = 84, R = 84 − 23 = 61. 𝑅 Длину интервалов найдем по формуле h = 𝑘 : 61 ℎ= = 10,17 ≈ 11 6 (округление в большую сторону). 3 шаг. Интервалы. Первый интервал начнем составлять с 𝑎1 = 𝑥𝑚𝑖𝑛 = 23 и затем каждый раз будем прибавлять ℎ = 11. 1) [23; 34); 2) [34; 45); 2) [45; 56); 2) [56; 67); 2) [67; 78); 6) [78; 89]. 4 шаг. Интервальные частоты. Определим, сколько вариант «попадет» в каждый интервал, проверяя выполнение неравенства для каждой варианты: Интервал Неравенство Варианты [23; 34) 23 ≤ 𝑥 < 34 23;30. [34; 45) 34 ≤ 𝑥 < 45 44;44;38;36;41;34;41. [45; 56) 45 ≤ 𝑥 < 56 49;50;46;49;51;53;50;47;52;46;55. [56; 67) 56 ≤ 𝑥 < 67 59;57;61;66;63. [67; 78) 67 ≤ 𝑥 < 78 71;70;75;71. [78; 89] 78 ≤ 𝑥 ≤ 89 84. Проверка: 2 + 7 + 11 + 5 + 4 + 1 = 30 (верно). 𝑛 Интервальные относительные частоты найдем по формуле: 𝑤𝑖 = 𝑛𝑖 . [23; 34): n1 = 2, 𝑤1 = [34; 45): n2 = 7, 𝑤2 = 2 30 7 30 = 0,07; = 0,23; 19 𝒏𝒊 2 7 11 5 4 1 [45; 56): n3 = 11, 𝑤3 = [56; 67): n4 = 5, 𝑤4 = [67; 78): n5 = 4, 𝑤5 = 11 30 5 30 4 30 1 = 0,37; = 0,17; = 0,13; [78; 89]: n6 = 1, 𝑤8 = = 0,03. 30 Проверка: 0,07 + 0,23 + 0,37 + 0,17 + 0,13 + 0,03 = 1 (верно). Для более удобного и наглядного представления оформляют в виде интервальных таблиц и гистограмм. сгруппированные данные Интервальная таблица частот Интервалы [𝑎1 ; 𝑎2 ) [𝑎2 ; 𝑎3 ) … [𝑎𝑘 ; 𝑎𝑘+1 ] … Интервальные частоты 𝑛𝑖 𝑛1 𝑛2 𝑛𝑘 Интервальная таблица относительных частот Интервалы [𝑎1 ; 𝑎2 ) [𝑎2 ; 𝑎3 ) … [𝑎𝑘 ; 𝑎𝑘+1 ] … Интервальные относительные частоты 𝑤𝑖 𝑤1 𝑤2 𝑤𝑘 Плотностями частот называются величины равные отношению интервальных частот 𝑛 на длины соответствующих интервалов:ℎ𝑖 (или на ℎ). 𝑖 Гистограмма частот - это фигура, составленная из прямоугольников, в основании которых лежат интервалы, а высотами являются плотности частот. Свойство: Площадь гистограммы частот равна объему выборки. Площадь гистограммы рассчитаем, как сумму площадей всех прямоугольников, из которых она состоит: 𝑛1 𝑛2 𝑛𝑘 𝑆 = ℎ1 ∙ + ℎ2 ∙ + ⋯ . +ℎ𝑘 ∙ = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛 ℎ1 ℎ2 ℎ𝑘 Плотностями относительных частот называются величины равные отношению 𝑤 относительных интервальных частот на длины соответствующих интервалов: ℎ 𝑖 (или на ℎ). 𝑖 Гистограмма относительных частот – это фигура, составленная из прямоугольников, в основании которых лежат интервалы, а высотами являются плотности относительных частот. Свойство: Площадь гистограммы относительных частот равна единице. 𝑤1 𝑤2 𝑤𝑘 𝑆 = ℎ1 ∙ + ℎ2 ∙ + ⋯ . +ℎ𝑘 ∙ = 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑘 = 1 ℎ1 ℎ2 ℎ𝑘 В примере с баллами ЕГЭ по математике 11 «а» класса построим интервальные таблицы частот и гистограмму частот. Составленные интервалы, посчитанные интервальные частоты и интервальные относительные частоты занесем в таблицы: 20 Интервальная таблица частот Интер- [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89] валы 2 7 11 5 4 1 𝑛𝑖 Интервалы 𝑤𝑖 Интервальная таблица относительных частот [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89] 0,07 0,23 0,37 0,17 0,13 0,03 Рассчитаем плотности частот: 𝑛1 2 𝑛2 7 𝑛3 11 = = 0,18; = = 0,64; = = 1; ℎ 11 ℎ 11 ℎ 11 𝑛4 5 𝑛5 4 𝑛6 1 = = 0,45; = = 0,36; = = 0,09. ℎ 11 ℎ 11 ℎ 11 На плоскости построим гистограмму частот, отложив по горизонтальной оси интервалы, а на вертикальной оси – плотности частот. Диаграмма 1,2 1 0,8 0,6 0,4 0,2 0 23 34 45 56 67 78 89 Упражнения 1. На основании данных по оплате труда работников одного предприятия (в усл.ед.): а) построить интервальную таблицу частот; б) построить интервальную таблицу относительных частот; в) изобразить гистограмму частот. 214 204 212 201 190 222 226 216 228 240 224 220 260 204 240 190 218 232 254 224 204 221 256 260 228 232 204 182 230 214 242 222 260 198 216 198 232 242 216 226 208 221 202 204 222 196 222 238 224 223 2. Группу студентов протестировали на уровень интеллекта IQ. На основании результатов: а) построить интервальную таблицу частот; б) построить интервальную таблицу относительных частот; в) изобразить гистограмму частот. 95 123 100 130 74 115 69 70 114 80 61 116 21 88 126 104 110 112 84 73 74 135 99 105 118 89 95 101 96 88 102 77 69 101 119 76 69 100 100 102 81 113 112 109 87 102 109 114 87 82 119 128 108 102 99 107 101 124 129 98 127 3. На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот; б) построить интервальную таблицу относительных частот; в) изобразить гистограмму частот. 62 44 48 53 73 65 67 56 49 43 57 69 62 15 59 96 78 47 78 48 33 41 69 38 35 75 70 65 48 54 96 49 59 69 64 37 39 66 75 93 28 91 64 60 74 78 54 53 47 64 87 73 61 49 97 48 60 41 71 60 65 43 55 76 40 81 65 67 47 61 88 64 46 38 51 89 61 63 48 58 64 73 63 64 76 78 61 60 36 66 4. В школе одного из районов провели опрос учащихся: сколько минут тратят они на дорогу в школу? На основании результатов: а) построить интервальную таблицу частот; б) построить интервальную таблицу относительных частот; в) изобразить гистограмму частот. 17 42 33 28 37 8 11 30 22 43 35 44 25 18 30 8 21 35 14 20 27 5 29 24 38 15 20 7 22 3 16 25 6 19 25 42 31 22 11 29 45 15 19 8 26 34 16 45 24 9 32 44 17 10 35 10 21 40 8 9 31 4 28 30 13 39 23 5 14 36 26 18 22 27 41 10 19 37 23 17 31 12 29 30 16 14 35 6 33 18 7 31 33 35 40 38 21 34 10 32 22 Глава 4. Числовые характеристики выборки Построение таблиц и графиков является первым шагом в обработке статистических данных. Для дальнейшего исследования необходимы обобщающие показатели, выявляющие общие свойства данных. Эти показатели показывают тенденцию развития изучаемого признака, сглаживая случайные индивидуальные отклонения, позволяют сравнивать выборки, а также используются при более полном математическом анализе статистических данных. Рассмотрим некоторые основные числовые характеристики выборки. Среднее арифметическое. Среднее арифметическое равно сумме всех вариант деленной на объем выборки. Обозначим 𝑥̅ . Особенности вычисления среднего арифметического: 1. При малом объеме выборки удобно применить формулу: 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 𝑥̅ = ; 𝑛 2. При достаточном объеме выборки удобно вначале построить таблицу частот, а затем применить формулу: 𝑥1 ∙ 𝑛1 + 𝑥2 ∙ 𝑛2 + ⋯ + 𝑥𝑘 ∙ 𝑛𝑘 𝑥̅ = ; 𝑛 3. При выполненной группировке данных удобно применить вторую формулу, где 𝑥𝑖 это середины соответствующих интервалов. Пример. Учащийся получил по математике за четверть оценки: 5, 2, 3, 3, 4, 4, 4, 5, 4, 4. Найдем среднюю оценку, как среднее арифметическое. Объем выборки 𝑛 = 10. При малом объеме выборки применим первую формулу: 5 + 2 + 3 + 3 + 4 + 4 + 4 + 5 + 4 + 4 38 𝑥̅ = = = 3,8 ≈ 4. 10 10 Пример. Учащиеся писали контрольную работу по математике. По результатам построили таблицу частот. 𝑥𝑖 2 3 4 5 𝑛𝑖 3 5 9 3 Найдем среднюю оценку, как среднее арифметическое. Объем выборки 𝑛 = 20. При посчитанных частотах применим вторую формулу: 2 ∙ 3 + 3 ∙ 5 + 4 ∙ 9 + 5 ∙ 3 72 𝑥̅ = = = 3,6 ≈ 4. 20 20 Пример. Учащиеся 11 «а» класса писали ЕГЭ по математике. По результатам была построена интервальная таблица частот. Интер- [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89] валы 2 7 11 5 4 1 𝑛𝑖 Найдем средний балл. Посчитаем 𝑥𝑖 - середины соответствующих интервалов. Например, можно сложить концы интервалов и поделить пополам. 23 Интервалы [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89] 𝑛𝑖 Середины интервалов 𝑥𝑖 2 23 + 34 2 =28,5 7 34 + 45 2 =39,5 11 45 + 56 2 =50,5 5 56 + 67 2 =61,5 4 67 + 78 2 =72,5 1 78 + 89 2 =83,5 При посчитанных частотах применим вторую формулу: 28,5 ∙ 2 + 39,5 ∙ 7 + 50,5 ∙ 11 + 61,5 ∙ 5 + 72,5 ∙ 4 + 83,5 ∙ 1 𝑥̅ = = 30 1570 = = 52,3 ≈ 52. 30 Замечание. Данные взяты из примера Главы 3. Если без группировки применить первую формулу, то: 1556 𝑥̅ = = 51,87 ≈ 52. 30 (погрешность небольшая). Дисперсия. Дисперсия – это среднее арифметическое квадратов отклонений вариант от их среднего арифметического. Обозначим 𝐷. Особенности вычисления дисперсии: 1. При малом объеме выборки и больших значениях вариант удобно применить формулу: (𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 𝐷= 𝑛 2. При малом объеме выборки и малых значениях вариант удобно применить формулу: 𝑥1 2 + 𝑥2 2 + ⋯ + 𝑥𝑛 2 𝐷= − 𝑥̅ 2 𝑛 3. При достаточном объеме выборки и больших значениях вариант удобно применить формулу: (𝑥1 − 𝑥̅ )2 ∙ 𝑛1 + (𝑥2 − 𝑥̅ )2 ∙ 𝑛2 + ⋯ + (𝑥𝑘 − 𝑥̅ )2 ∙ 𝑛𝑘 𝐷= 𝑛 4. При достаточном объеме выборки и малых значениях вариант удобно применить формулу: 𝑥1 2 ∙ 𝑛1 + 𝑥2 2 ∙ 𝑛2 + ⋯ + 𝑥𝑛 2 ∙ 𝑛𝑘 𝐷= − 𝑥̅ 2 𝑛 5. При выполненной группировке данных удобно применить третью или четверную формулу, где 𝑥𝑖 - это середины соответствующих интервалов. Замечания: 1) В формулы входит величина среднего арифметического, которую можно округлить. Подставив в формулы для дисперсии округленную величину, разные формулы дадут результаты с разной погрешностью. 2) Погрешность вычисления, при которой дисперсия получится отрицательной величиной, является недопустимой. Дисперсия должна быть неотрицательной величиной. 3) Применяя выборочный метод при исследовании, различают дисперсию для генеральной совокупности и дисперсию для выборки. Если требуется оценить величину дисперсии генеральной совокупности, то дисперсию выборки вычисляют по аналогичным формулам с «поправкой»: 24 Такую дисперсию также называют «выборочная», «исправленная» дисперсия и обозначают - 𝑠 2 . (𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 2 𝑠 = 𝑛−1 Если объем выборки малый 𝑛 < 30, то в расчетах рекомендуется использовать величину «исправленной» дисперсии. При больших объемах выборки 𝑛 → ∞ значение «исправленной» дисперсии все меньше будет отличаться от значения «просто» дисперсии. Среднее квадратическое (стандартное) отклонение. Предположим, что в эксперименте измерялся рост в сантиметрах, тогда дисперсия будет измеряться в сантиметрах в квадрате. Чтобы средняя величина отклонения переменной выражалась в тех же единицах измерения, нужно применить операцию извлечения квадратного корня. Стандартное отклонение – это величина равная квадратному корню, извлеченному из дисперсии. Обозначим 𝜎. 𝜎 = √𝐷 Замечание: Стандартное отклонение равное квадратному корню, извлеченному из «исправленной» дисперсии обозначается: 𝑠 = √𝑠 2 Пример. Учащиеся писали контрольную работу по математике. По результатам построили таблицу частот: 𝑥𝑖 2 3 4 5 𝑛𝑖 3 5 9 3 Найдем дисперсию и стандартное отклонение. Ранее было посчитано среднее арифметическое: 𝑥̅ = 3,6 ≈ 4. 𝑥̅ = 3,6 – точное значение, а 𝑥̅ = 4 – округленное значение. Рассчитаем дисперсию, применив третью формулу: (2 − 3,6)2 ∙ 3 + (3 − 3,6)2 ∙ 5 + (4 − 3,6)2 ∙ 9 + (5 − 3,6)2 ∙ 3 𝐷= 20 16,8 = = 0,84 20 (точное значение) (2 − 4)2 ∙ 3 + (3 − 4)2 ∙ 5 + (4 − 4)2 ∙ 9 + (5 − 4)2 ∙ 3 20 𝐷= = =1 20 20 (допустимая погрешность) Применим четвертую формулу: 22 ∙ 3 + 32 ∙ 5 + 42 ∙ 9 + 52 ∙ 3 𝐷= − 3,62 = 0,84 20 (точное значение) 22 ∙ 3 + 32 ∙ 5 + 42 ∙ 9 + 52 ∙ 3 276 𝐷= − 42 = − 16 = −2,2 20 20 (недопустимая погрешность, дисперсия не может быть отрицательной). Рассчитаем стандартное отклонение: 𝜎 = √𝐷 = √0,84 = 0,92 Пример. Учащиеся 11 «а» класса писали ЕГЭ по математике. По результатам была построена интервальная таблица частот. 25 Интер- [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89] валы 2 7 11 5 4 1 𝑛𝑖 Найдем дисперсию и стандартное отклонение. Ранее было рассчитаны середины интервалов и среднее арифметическое: 𝑥̅ = 52,3 ≈ 52. Интервалы [23; 34) [34; 45) [45; 56) [56; 67) [67; 78) [78; 89] 𝑛𝑖 Середины интервалов 𝑥𝑖 2 28,5 7 39,5 11 50,5 5 61,5 4 72,5 1 83,5 Применим третью формулу: (28,5 − 52,3)2 ∙ 2 + (39,5 − 52,3)2 ∙ 7 + (50,5 − 52,3)2 ∙ 11 + 𝐷= 30 +(61,5 − 52,3)2 ∙ 5 + (72,5 − 52,3)2 ∙ 4 + (83,5 − 52,3)2 ∙ 1 = 5344,2 = = 178,14. 30 𝜎 = √𝐷 = √178,14 = 13,35. Число степеней свободы. Число степеней свободы – это число свободно варьирующих единиц в составе выборки. Если выборка состоит из 𝑛 элементов и характеризуется средним арифметическим 𝑥̅ , то любой элемент выборки можно получить как разность между 𝑛 ∙ 𝑥̅ и суммой всех остальных элементов, кроме самого этого элемента. Пример. Рассмотрим ряд чисел: 4, 7, 15, 19, 25; 𝑥̅ = 14; 𝑛 = 5. Выразим, например, первый элемент через другие элементы и среднее арифметическое: 4 = 14 ∙ 5 − (7 + 15 + 19 + 25) Аналогично можно выразить любой элемент выборки. Таким образом, один элемент выборки не имеет свободы вариации и всегда может быть выражен через другие элементы и среднее арифметическое. В рассмотренном примере число степеней свободы 𝑘 будет определяться как 𝑘 = 𝑛 − 1. При наличии нескольких ограничений свободы вариации, число степеней свободы обозначается как 𝜈 («ню») и будет равно: 𝜈 = 𝑛 − 𝑘, где 𝑘 – число ограничений свободы вариации. В общем случае для таблицы экспериментальных данных число степеней свободы определяется по формуле: 𝜈 = (𝑐 − 1) ∙ (𝑛 − 1), где с – число столбцов, а 𝑛 – число строк. Нахождение числа степеней свободы для каждого метода имеет свои специфические особенности. Нормальное распределение. Пример. Измерим рост, вес, интеллект или какие-либо свойства личности. Затем построим график частоты встречаемости показателей любой из этих величин. В результате 26 мы можем получить распределение, у которого крайние значения встречаются редко, а от крайних значений к середине частота повышается. Форма и положение графика нормального распределения определяется двумя параметрами: средним арифметическим 𝑥̅ и стандартным отклонением 𝜎. График нормального распределения имеет вид симметричной, колоколообразной кривой. Среднее арифметическое задает положение кривой на числовой оси, а стандартное отклонение задает ширину этой кривой. Любое нормальное распределение может быть сведено к одной кривой, если применить, так называемое, 𝒛 – преобразование (нормирование) ко всем измерениям по формуле: 𝑥𝑖 − 𝑥̅ 𝑧𝑖 = 𝜎 В результате нормальное распределение будет иметь среднее арифметическое равное нулю, а стандартное отклонение равное единице. Такое распределение называется стандартным нормальным распределением. Функция данного распределения задается формулой: 𝑧2 1 − 𝑓(𝑧) = ∙𝑒 2 √2𝜋 Для вычисления значений данной функции в любой конкретной точке можно воспользоваться Таблицей №1 (см. Приложение). Свойство функции: 𝑓(−𝑧) = 𝑓(𝑧). 27 Нормальное распределение имеет большое значение в статистических исследованиях. Некоторые статистические методы можно применять только при условии, что данные имеют нормальное распределение. Упражнения 1. Проводя осмотр среди мальчиков-десятиклассников, получили данные об их росте: 168, 159, 181, 172, 161, 163, 164, 170, 169, 154, 168, 175 см. На основании данных: а) вычислить средний рост; б) вычислить стандартное отклонение роста. 2. Проведен анализ оценок восьмиклассника по математике во 2 четверти: 5, 3, 4, 2, 5, 5, 4, 3, 3, 5. На основании данных: а) вычислить среднюю оценку; б) вычислить стандартное отклонение оценок. 3. Собраны данные о тарифных разрядах рабочих одного из цехов завода. На основании данных: а) вычислить средний тарифный разряд; б) вычислить стандартное отклонение разрядов. 𝒙𝒊 𝒏𝒊 2 10 3 26 4 32 5 20 6 12 4. При проверке деталей ОТК получили данные взвешивания в граммах. На основании данных: а) вычислить средний вес; б) вычислить стандартное отклонение веса. 𝒙𝒊 𝒏𝒊 246 20 247 40 248 110 249 180 250 305 251 215 252 100 253 20 254 10 5. Для анализа деятельности заводов в районе собрали информацию о стоимости их основных фондов (млн.руб.). На основании данных: а) вычислить среднюю стоимость основных фондов; б) вычислить стандартное отклонение стоимости фондов. Интервалы 𝒏𝒊 [𝟓; 𝟕) 9 [𝟕; 𝟗) 16 [𝟗; 𝟏𝟏) 11 [𝟏𝟏; 𝟏𝟑) 8 [𝟏𝟑; 𝟏𝟓) 6 6. Собрали данные о заработной плате рабочих в цеху в руб. На основании данных: а) вычислить среднюю заработную плату; б) вычислить стандартное отклонение заработной платы. Интервалы [𝟕𝟐𝟎𝟎; 𝟖𝟎𝟎𝟎) [𝟖𝟎𝟎𝟎; 𝟖𝟖𝟎𝟎) [𝟖𝟖𝟎𝟎; 𝟗𝟔𝟎𝟎) [𝟗𝟔𝟎𝟎; 𝟏𝟎𝟒𝟎𝟎) [𝟏𝟎𝟒𝟎𝟎; 𝟏𝟏𝟐𝟎𝟎) [𝟏𝟏𝟐𝟎𝟎; 𝟏𝟐𝟎𝟎𝟎) 28 𝒏𝒊 8 12 20 32 40 56 [𝟏𝟐𝟎𝟎𝟎; 𝟏𝟐𝟖𝟎𝟎) [𝟏𝟐𝟖𝟎𝟎; 𝟏𝟑𝟔𝟎𝟎) 30 15 7. Собраны данные о результатах экзамена студентов 1 курса по математике. На основании данных: а) вычислить среднюю оценку; б) вычислить стандартное отклонение оценок. 3 3 2 3 3 4 4 4 4 5 2 3 2 3 3 4 3 5 4 5 4 2 2 4 3 3 4 3 5 3 3 3 3 4 3 5 5 3 2 3 3 2 3 4 3 2 2 2 2 4 3 2 3 4 3 4 2 3 5 4 8. Собраны данные о результатах ЕГЭ (баллы) учащихся школы по математике. На основании данных: а) вычислить средний балл; б) вычислить стандартное отклонение баллов. 60 58 44 64 38 38 44 65 55 54 64 53 35 52 42 51 65 67 42 50 53 66 48 57 52 48 58 50 37 28 51 26 67 57 26 57 42 22 56 61 67 64 26 55 59 40 45 52 37 39 48 41 4 78 56 62 83 41 60 41 29 Глава 5. Общие принципы проверки статистических гипотез Статистическая гипотеза – это научная гипотеза (предположение), допускающая статистическую проверку. Пример. Проводится исследование интеллекта у подростков из полных и неполных семей. Можно ли утверждать, что неполная семья ведет к снижению интеллекта у подростков? Чтобы ответить на поставленный вопрос, необходимо провести статистическое исследование. При этом выводы будут носить вероятностный характер. Связано это с тем, что результаты наблюдений носят случайный характер, так как исследователь не может учесть всех факторов. На уровень интеллекта у подростка, например, может влиять не только состав семьи, но и здоровье, и другие факторы. Задача исследователя определить, является ли исследуемый фактор статистически значимым. Нулевая и альтернативная гипотезы. При проверке статистических гипотез используются два понятия: нулевая (основная) гипотеза: обозначение Н0 . альтернативная гипотеза: обозначение Н1 . В психолого-педагогических исследованиях чаще всего: нулевая гипотеза – гипотеза о сходстве (об отсутствии различий или отсутствии связи); альтернативная гипотеза – гипотеза о различии (о наличии различий или наличии связи). В примере с исследованием связи интеллекта подростков и наличием полной семьи можно сформулировать гипотезы: Н0: между интеллектом подростков и наличием полной семьи отсутствует статистически значимая связь. Н1: между интеллектом подростков и наличием полной семьи существует статистически значимая связь. При проверке гипотезы экспериментальные данные могут противоречить гипотезе Н0 , тогда эта гипотеза отклоняется. При этом альтернативная гипотеза Н1 принимается. Если же экспериментальные данные согласуются с гипотезой Н0 , она не отклоняется (в таких случаях, как правило, говорят, что гипотеза Н0 принимается). При этом альтернативная гипотеза Н1 отклоняется. Замечание. Заострим внимание на корректности статистических выводов. Вместо выражения «гипотеза не отклоняется» часто говорят «гипотеза принимается». В целом, это выражение также приемлемо, если его понимать правильно, т.е. если считать, что принимается именно гипотеза (одно из возможных объяснений!), а не конкретное утверждение. Но понимают его часто неправильно, подразумевая, что в случае не отклонения гипотезы принимается сама идея гипотезы. Например, если гипотеза о равенстве вероятностей в двух выборках не отклоняется, то делают заключение, что, мол, вероятности действительно равны. Такое заключение ошибочно. На самом деле принятие гипотезы означает, что она не противоречит данным и может рассматриваться до тех пор, пока не будет доказано обратное. Принятие гипотезы не может доказать ее правильность, для этого есть лишь один способ: исследовать все анализируемое явление в целом, собрав генеральную совокупность. По выборке можно только опровергнуть маловероятные или невозможные предположения, противоречащие фактическим данным, сузив тем самым круг для поиска истины. 30 Ошибки первого и второго рода. Статистическая проверка гипотез, основанная на экспериментальных данных, связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу Н0 , хотя в действительности она оказывается верной. Ошибка второго рода произойдет, когда будет принято решение не отклонять гипотезу Н0 , хотя в действительности она будет неверна. Результаты проверки На самом деле гипотезы Н0 Верна гипотеза Н0 Верна гипотеза Н1 Ошибка первого рода Правильное решение Гипотеза Н0 отклоняется Правильное решение Ошибка второго рода Гипотеза Н0 не отклоняется Абсолютно исключить ошибки при принятии статистических гипотез невозможно и поэтому необходимо минимизировать возможные последствия. В большинстве случаев это можно сделать, увеличив объем выборки. Уровень статистической значимости В результате статистического исследования одна из двух выдвинутых гипотез отклоняется, а другая принимается. Для разделения областей принятия гипотез нужно провести между ними границу. Но, так как в эксперименте всегда присутствуют случайные неучтенные факторы, то эта граница не может быть проведена абсолютно точно. Она связана с понятием уровня значимости. Уровень значимости – это вероятность ошибочного отклонения верной нулевой гипотезы, т.е. вероятность ошибки первого рода. Обозначается или 𝛼, или 𝑝. Выделяют стандартные значения уровня значимости: р=0,05 – достаточный уровень значимости; р=0,01 – высокий уровень значимости; р=0,001 – очень высокий уровень значимости. С уменьшением вероятности допустить ошибку повышается значимость принятого решения. С другой стороны, не всегда целесообразно выбирать очень высокий уровень значимости. Если исследователь заинтересован в принятии гипотезы Н1, то при очень высоком уровне значимости он будет чаще отклонять гипотезу Н1 в пользу гипотезы Н0. Если же он выберет более низкий допустимый уровень значимости он сможет чаще принимать интересующую его гипотезу Н1 (за счет увеличения вероятности допустить ошибку). Замечание: В разной литературе для уровня значимости используется обозначения как 𝛼, так и 𝑝. При этом можно встретить сразу оба этих символа, обозначающих разные понятия. Например, уровень значимости 𝛼, а 𝑝 = 1 − 𝛼, так называемая доверительная вероятность. Ориентируемся на значение величин: -уровень значимости это величина ≤ 0,05; -доверительна вероятность это величина ≥ 0,95. Правило принятия статистического решения. На основании полученных экспериментальных данных исследователь рассчитывает так называемое эмпирическое значение (полученное опытным путем). Эмпирическое значение Чэм – это величина, которая рассчитывается по экспериментальным данным и выбранному статистическому методу. 31 Для каждого метода существует своя формула или правило, по которым рассчитывается данная величина. Эмпирическое значение сравнивается с так называемым критическим значением. Критическое значение Чкр – это величина, которая находится в соответствии с выбранным уровнем значимости и выбранным статистическим методом по соответствующей таблице. Эти таблицы приводятся в Приложениях к литературе по данной тематике. Также можно вычислять критические значения с помощью компьютерных программ. Замечание. На величину критического значения также может влиять: объем выборки, число степеней свободы. Сравнивать эмпирическое и критическое значения можно как числовые значения. Например, Чэм ≤ Чкр (или Чэм ≥ Чкр ). Результат проверки статистической гипотезы зависит от конкретного статистического метода. Для наглядности значения можно изобразить на числовой прямой. Критическое значение разбивает числовую прямую на две граничащие области: критическую и доверительную. Эмпирическое значение однозначно попадает в одну из областей. 1 случай: эмпирическое значение попало в доверительную область. Вывод: основная гипотеза Н0 не отклоняется (принимается) на выбранном уровне значимости. 2 случай: эмпирическое значение попало в критическую область. Вывод: основная гипотеза Н0 отклоняется и принимается альтернативная гипотеза Н1 на выбранном уровне значимости. Замечание. В литературе, посвященной психолого-педагогическим исследованиям принято находить сразу два критических значения для стандартных уровней значимости р = 0,05 и р = 0,01 соответсвенно. Тогда на числовой прямой появляется две граничные точки, и три области, которые обозначают зонами: зона значимости, зона незначимости и зона неопределенности. 1.Зоне значимости соответствует критическая область для р ≥ 0,01. 2.Зоне незначимости соответствует доверительная область для уровня значимости р ≤ 0,05. 3.Зоне неопределенности соответствует критическая область для уровня значимости р = 0,05 и одновременно доверительная область для уровня значимости р = 0,01. Неопределенность появляется, т.к. одновременно принимаются обе гипотезы, но на разных уровнях значимости. Рекомендуется в таких случаях провести дополнительное исследование, увеличив при этом объем выборки или применить другой статистический метод. Этапы принятия статистического решения. Принятие статистического решения разбивается на этапы или шаги: 1.Формулировка нулевой и альтернативной гипотез. 2.Выбор статистического метода 3.Вычисление эмпирического значения. 4. Выбор уровня значимости и нахождение критического значения (если требуется нахождение числа степеней свободы). 5.Сравнение критического и эмпирического значений. 6.Формулировка принятия решения (выбор принимаемой гипотезы Н0 или Н1 на выбранном уровне значимости). 32 Статистические критерии. Статистический критерий означает метод (правило) расчета эмпирического значения и само это число. Критерии имеют свою специфику и различаются между собой по различным основаниям: 1.тип измерительной шкалы; 2.зависимость или независимость выборок; 3.количество сравниваемых выборок; 4.равность сравниваемых выборок по численности; 5.максимальный объем выборки; 6.мощности критерия и др. Мощность критерия. Мощность критерия – это его способность отклонить нулевую гипотезу, если она неверна. Если вероятность ошибки второго рода обозначить как 𝛽, то мощность критерия – это его способность не допустить ошибку второго рода, поэтому: Мощность = 1 − 𝛽. Мощность критерия определяется опытным путем. Одна и та же задача может быть решена с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют отклонить неверную нулевую гипотезу там, где другие оказываются неспособными это сделать. При этом основанием для выбора критерия является не только мощность, но и другие характеристики критерия: -простота (более мощные критерии более трудоемки для расчета); -более широкий диапазон использования (более мощные критерии нельзя применять, например, для данных измеренных в номинальной или ранговой шкалах); - применимость по отношению к неравным по объему выборкам и др. Виды критериев: 1.параметрические; 2.непараметрические. Параметрические критерии основаны на конкретном типе распределения (например, нормальном и др.) или используют параметры исследуемой совокупности, т.е. числовые характеристики (например, среднее, дисперсия и др.). Непараметрические критерии не основаны на типе распределения и не используют параметры исследуемой совокупности. При нормальном распределении генеральной совокупности параметрические критерии являются более мощными по сравнению с непараметрическими. Однако если данные не распределены нормально, то применять параметрические критерии становится недопустимым и непараметрические критерии становятся более мощными. Задачи 1.Выявление различий в уровне исследуемого признака. 2.Оценка сдвига Классификация задач и методов их решения Условия Методы 2 выборки испытуемых Q-критерий Розенбаума U-критерий Манна-Уитни φ-критерий (угловое преобразование Фишера) t-критерий Стьюдента 3 и более выборок S-критерий Джонкира испытуемых H-критерий Крускала-Уоллиса 2 замера на одной и той G-критерий знаков 33 значений исследуемого признака. 3.Выявление различий в распределении признака. 4.Выявление степени согласованности изменений. же выборке испытуемых 3 и более замеров на одной и той же выборке испытуемых при сопоставлении эмпирического распределения с теоретическим при сопоставлении двух эмпирических распределений двух признаков, (иерархий) трех и более признаков 5. Анализ изменений под влиянием одного признака под фактора влиянием контролируемых условий под влиянием двух факторов 34 T-критерий Вилкоксона φ-критерий (угловое преобразование Фишера) t-критерий Стьюдента 𝜒 2 - критерий Фридмана L-критерий тенденций Пейджа 𝜒 2 -критерий Пирсона 𝜆-критерий Колмогорова-Смирнова биномиальный критерий 𝜒 2 -критерий Пирсона 𝜆-критерий Колмогорова-Смирнова φ-критерий (угловое преобразование Фишера) Коэффициент ранговой корреляции Спирмера Коэффициент линейной корреляции Пирсона Коэффициент корреляции Кендалла Бисериальный коэффициент корреляции Линейная, криволинейная регрессия Множественная и частная корреляция Множественная регрессия Факторный и кластерный анализы S-критерий Джонкира L-критерий тенденций Пейджа однофакторный дисперсионный анализ Фишера двухфакторный дисперсионный анализ Фишера Глава 6. Выявление различий в уровне признака В психолого-педагогических исследованиях может возникнуть задача: выявить различия между двумя, тремя и более выборками испытуемых. Сравнивать выборки можно по-разному. Например, выборки могут различаться по уровню исследуемого признака. От того, что брать за уровни для сравнения, будет зависеть, какие критерии можно применять при исследовании. Пример. За уровни для сравнения можно взять значения среднего арифметического исследуемого признака выборок. Сравнив эти значения, можно будет сделать вывод, что выборки статистически значимо различаются или не различаются по уровню исследуемого признака. Такую задачу можно решить с помощью параметрического критерия. При применении непараметрических критериев уровень может быть определен условно (например, «низкий», «средний», «высокий»). При этом, при сравнении в другой выборке он может быть просто «выше». Это позволяет сравнивать выборки, для которых исследуемый признак выражен даже в порядковой шкале, т.е. для качественных данных. Критерий U-Манна-Уитни. 1.Назначение критерия. Критерий U-Манна-Уитни является непараметрическим и применяется для независимых (несвязных) выборок. Он предназначен для установления различий между двумя выборками по уровню исследуемого признака. 2.Гипотезы. Н0: уровень признака в выборке 1 статистически значимо не превышает уровень признака в выборке 2. Н1: уровень признака в выборке 1 статистически значимо превышает уровень признака в выборке 2. 3.Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1. Обозначаем наблюдения каждой из выборок отдельным способом (символом, цветом). 2. Объединяем выборки в одну и ранжируем. 3. Варианты с соответствующими им рангами делим опять на две первоначальные выборки и считаем сумму рангов для каждой выборки отдельно. Рекомендуется проверять правильность расчетов: сумма рангов для объединенной выборки должна совпадать с суммой рангов для выборок отдельно. 4. Определяем большую их двух ранговую сумму. Обозначим 𝑅𝑚𝑎𝑥 . 5. Эмпирическое значение находим по формуле: 𝑛𝑥 ∙ (𝑛𝑥 + 1) 𝑈эмп = (𝑛1 ∙ 𝑛2 ) + − 𝑅𝑚𝑎𝑥 , 2 где 𝑛1 - объемы первой выборки; 𝑛2 - объем второй выборки; 𝑛𝑥 - объем выборки с наибольшей ранговой суммой. Определение критического значения. Критическое значение зависит от выбранного уровня значимости и объемов выборок: 𝑛1 и 𝑛2 . Таблица критических значений для критерия Манна-Уитни представлена в Таблице №2 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. Н0 принимается, если 𝑈эмп > 𝑈кр . Н0 отклоняется, если 𝑈эмп ≤ 𝑈кр . Критическая область располагается слева, а доверительная область справа. 35 5.Ограничения критерия. Критерий применяется в тех случаях, когда данные представлены, по крайней мере, в порядковой шкале. Допускается неравное количество элементов в сравниваемых выборках. Объем каждой выборки должен быть не менее 3 и не более 60. Допускается, чтобы объем одной выборки был равен 2, но тогда объем второй должен быть не менее 5. Пример. Проведение срезовой контрольной работы по математике (алгебра и геометрия) в средней общеобразовательной школе дало следующие результаты по 10балльной шкале для класса, обучающегося по программе «Развивающее обучение» (7 «Б»), и класса, обучающего по традиционной системе (7 «А»). Определите, превосходит ли учащиеся 7 «Б» учащихся 7 «А» по уровню знаний по математике? № испытуемого 1 2 3 4 5 6 7 8 9 10 11 12 7 «А» 7 «Б» 9 7 7 8 6 4 4 8 6 6 5 5 10 7 8 8 4 6 8 8 9 7 10 Решение. Исследуется признак – результаты контрольной работы в двух разных классах. Полученные данные представляют собой две независимые (несвязные) выборки. Требуется установить различия между двумя выборками по уровню исследуемого признака. Предварительное сравнение результатов показывает, что баллы, полученные за контрольную работу в 7 «Б» классе несколько выше. Требуется определить, можно ли считать имеющуюся разницу между баллами статистически значимой. Если можно, то это будет означать, что класс, обучающийся по системе развивающего обучения, имеет более качественные знания по математике. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: уровень результатов контрольной работы в 7 «Б» классе статистически значимо не превышает уровень в 7 «А» классе. Н1: уровень результатов контрольной работы в 7 «Б» классе статистически значимо превышает уровень в 7 «А» классе. 2.Выбор статистического метода. Для установления различий между двумя независимыми выборками выберем критерий Манна-Уитни. 3.Вычисление эмпирического значения. 1. Обозначим наблюдения первой выборки за A, второй за Б. 2. Объединим выборки в одну и ее проранжируем. символ баллы 36 ранг 9 20,5 А 7 11,5 А 7 11,5 А 8 16,5 А 6 7,5 А 4 2 А 4 2 А 8 16,5 А 6 7,5 А 6 7,5 А 5 4,5 А 5 4,5 Б 10 22,5 Б 7 11,5 Б 8 16,5 Б 8 16,5 Б 4 2 Б 6 7,5 Б 8 16,5 Б 8 16,5 Б 9 20,5 Б 7 11,5 Б 10 22,5 Б 276 сумма Проверка ранжирования: 𝑛1 = 11, 𝑛2 = 12, 𝑛1 + 𝑛2 = 23 (общее количество ранжируемых данных), 23∙(23+1) = 276 (верно) 2 3. Варианты с соответствующими им рангами разделим опять на две первоначальные выборки и посчитаем сумму рангов для каждой выборки отдельно. 7 «А» ранги 7 «Б» ранги баллы баллы 9 20,5 5 4,5 7 11,5 10 22,5 7 11,5 7 11,5 8 16,5 8 16,5 6 7,5 8 16,5 4 2 4 2 4 2 6 7,5 8 16,5 8 16,5 6 7,5 8 16,5 6 7,5 9 20,5 5 4,5 7 11,5 10 22,5 сумма 𝑅1 =107,5 𝑅2 = 168,5 Проверка: 𝑅1 + 𝑅2 = 107,5 + 168,5 = 276 (верно) 4. Определим большую их двух ранговую сумму: 𝑅𝑚𝑎𝑥 = 168,5. 5. Найдем эмпирическое значение: 𝑛1 = 11, 𝑛2 = 12, 𝑛𝑥 = 12 (наибольшая ранговая сумма у второй выборки) 37 12 ∙ (12 + 1) − 168,5 = 41,5 2 4.Нахождение критического значения. Объем 1 выборки 𝑛1 = 11, объем 2 выборки 𝑛2 = 12. По Таблице №2 (см. Приложения): 𝑈кр1 = 38 для уровня значимости 𝑝 = 0,05; 𝑈кр2 = 28 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. при 𝑝 = 0,05, 𝑈эмп = 41,5 > 𝑈кр1 = 38; при 𝑝 = 0,01, 𝑈эмп = 41,5 > 𝑈кр2 = 28; 6.Формулировка принятия решения. Гипотеза Н0 принимается, а гипотеза Н1 отклоняется на уровне значимости 𝑝 = 0,01. Статистически значимые различия результатов контрольной работы по математике не выявлены. Различия в уровне знаний по математике среди учащихся двух классов несущественны. 𝑈эмп = (11 ∙ 12) + t-критерий Стьюдента (для независимых выборок). 1.Назначение критерия. Критерий t-Стьюдента является параметрическим и может применяться для независимых (несвязных) выборок. Он предназначен для установления различий между двумя выборками. Различие между выборками устанавливается по такому параметру, как среднее арифметическое исследуемого признака. 𝑥̅ – среднее арифметическое признака для 1 выборки. 𝑦̅ – среднее арифметическое признака для 2 выборки. 2.Гипотезы. Н0: 𝑥̅ = 𝑦̅ (средние арифметические исследуемых признаков двух выборок статистически значимо не различаются). Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические исследуемых признаков двух выборок статистически значимо различаются). 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1. Обозначаем исследуемые признаки 1 выборки – 𝑋, 2 выборки – 𝑌. 2. Находим среднее арифметическое для признаков: 𝑥̅ , 𝑦̅. 3. Находим эмпирическое значение по формуле: |𝑥̅ − 𝑦̅| 𝑡эмп = , 𝑆𝑑 𝑆𝑑 = √ ∑(𝑥𝑖 − 𝑥̅ )2 + ∑(𝑦𝑖 − 𝑦̅)2 (𝑛1 + 𝑛2 ) ∙ (𝑛1 + 𝑛2 − 2) (𝑛1 ∙ 𝑛2 ) где 𝑛1 - объемы первой выборки; 𝑛2 - объем второй выборки. Определение критического значения. Критическое значение зависит от выбранного уровня значимости и числа степеней свободы: 𝑘 = 𝑛1 + 𝑛2 − 2. Таблица критических значений для критерия t-Стьюдента представлена в Таблице №3 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. Н0 принимается, если 𝑡эмп < 𝑡кр . 38 Н0 отклоняется, если 𝑡эмп ≥ 𝑡кр . Критическая область располагается справа, а доверительная область слева. 5.Ограничения критерия. Критерий применяется в тех случаях, когда данные представлены в шкале интервалов или отношений. Допускается неравное количество элементов в сравниваемых выборках. Сравниваемые выборки должны иметь нормальное распределение. Пример. Для определения стрессоустойчивости было проведено тестирование испытуемых двух профессий: учителей и менеджеров по продажам. Требуется определить, отличаются ли две группы статистически значимо по уровню стрессоустойчивости? Устойчивость к Устойчивость к Устойчивость к Устойчивость к стрессу (баллы) стрессу (баллы) стрессу (баллы) стрессу (баллы) учителей менеджеров учителей менеджеров 23 25 16 26 17 24 17 21 18 17 21 24 19 23 25 23 22 24 20 25 18 22 15 22 19 24 16 23 17 20 18 20 20 21 21 22 21 22 20 24 24 23 19 21 19 19 17 20 21 23 18 25 20 21 19 24 22 20 16 22 23 19 22 18 25 Решение. Исследуется признак – результаты тестирования стрессоустойчивости (в баллах) в двух группах. Полученные данные представляют собой две независимые (несвязные) выборки. Требуется установить различия между двумя выборками по уровню исследуемого признака. В качестве уровня исследуемого признака выберем среднее арифметическое исследуемого признака. 𝑥̅ – среднее арифметическое показателя стрессоустойчивости учителей. 𝑦̅ – среднее арифметическое показателя стрессоустойчивости менеджеров. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: 𝑥̅ = 𝑦̅ (средние арифметические показателей стрессоустойчивости учителей и менеджеров статистически значимо не различаются). Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические показателей стрессоустойчивости учителей и менеджеров по продажам статистически значимо различаются). 2.Выбор статистического метода. Для установления различий между двумя независимыми выборками выберем критерий Стьюдента. 3.Вычисление эмпирического значения. 39 1. Обозначим исследуемые признаки 1 выборки – 𝑋, 2 выборки – 𝑌. 2. Найдем среднее арифметическое для признаков: 𝑥̅ , 𝑦̅. Расчеты приведем в таблице: ̅ (𝒙𝒊 − 𝒙 ̅ 𝒀 𝒙𝒊 − 𝒙 ̅ ) 𝟐 𝒚𝒊 − 𝒚 25 3,7 2,7 13,69 24 -2,3 1,7 5,29 17 -1,3 -5,3 1,69 23 -0,3 0,7 0,09 24 2,7 1,7 7,29 22 -1,3 -0,3 1,69 24 -0,3 1,7 0,09 20 -2,3 -2,3 5,29 21 0,7 -1,3 0,49 22 1,7 -0,3 2,89 23 4,7 0,7 22,09 19 -0,3 -3,3 0,09 23 1,7 0,7 2,89 21 0,7 -1,3 0,49 20 2,7 -2,3 7,29 19 3,7 -3,3 13,69 25 -1,3 2,7 1,69 26 -3,3 3,7 10,89 21 -2,3 -1,3 5,29 24 1,7 1,7 2,89 23 5,7 0,7 32,49 25 0,7 2,7 0,49 22 -4,3 -0,3 18,49 23 -3,3 0,7 10,89 20 -1,3 -2,3 1,69 22 1,7 -0,3 2,89 24 0,7 1,7 0,49 21 -0,3 -1,3 0,09 20 -2,3 -2,3 5,29 25 -1,3 2,7 1,69 24 -0,3 1,7 0,09 22 -3,3 -0,3 10,89 22 -0,3 сумма 619 736 191,28 619 736 𝑥̅ = = 19,3; 𝑦̅ = = 22,3 32 33 3. Найдем эмпирическое значение: 𝑿 23 17 18 19 22 18 19 17 20 21 24 19 21 20 22 23 18 16 17 21 25 20 15 16 18 21 20 19 17 18 19 16 (𝒚𝒊 − 𝒚 ̅ )𝟐 7,29 2,89 28,09 0,49 2,89 0,09 2,89 5,29 1,69 0,09 0,49 10,89 0,49 1,69 5,29 10,89 7,29 13,69 1,69 2,89 0,49 7,29 0,09 0,49 5,29 0,09 2,89 1,69 5,29 7,29 2,89 0,09 0,09 140,97 191,28 + 140,97 (32 + 33) 𝑆𝑑 = √ ∙ = √0,32 = 0,57 (32 + 33 − 2) (32 ∙ 33) |19,3 − 22,3| 𝑡эмп = = 5,26. 0,57 4.Нахождение критического значения. Объем 1 выборки 𝑛1 = 32, объем 2 выборки 𝑛2 = 33. Число степеней свободы: 𝑘 = 32 + 33 − 2 = 63. По Таблице №3 (см. Приложения): 40 𝑡кр1 = 3,46 для уровня значимости 𝑝 = 0,05; 𝑡кр2 = 2,66 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. при 𝑝 = 0,05, 𝑡эмп = 5,26 ≥ 𝑡кр1 = 3,46; при 𝑝 = 0,01, 𝑡эмп = 5,26 ≥ 𝑡кр1 = 2,66; 6.Формулировка принятия решения. Гипотеза Н1 принимается, а гипотеза Н0 отклоняется на уровне значимости 𝑝 = 0,01. Между уровнем стрессоустойчивости учителей и менеджеров по продажам выявлены статистически значимые различия. У менеджеров по продажам в отличие от учителей средний уровень стрессоустойчивости выше. Замечание. Ограничением применения данного критерия является необходимость, чтобы данные имели нормальное распределение. Как доказать, что данные имеют нормальное распределение, рассмотрим ниже. Приближенно оценим распределения по диаграммам частот. Диаграмма Диаграмма для переменной Х для переменной Y Перемен.: Пер2, Рас пред.:Нормальное Перемен.: Пер1, Рас пред.:Нормальное Хи-квадрат: ------ , cc = 0 , p = --- 14 12 12 10 10 Число наблюдений Число наблюдений Хи-квадрат: ------ , cc = 0 , p = --- 14 8 6 8 6 4 4 2 2 0 0 13,0 15,6 18,2 20,8 23,4 15,4 26,0 17,6 19,8 22,0 24,2 26,4 Визуально нельзя точно сказать, что данные имеют нормальное распределение. Статистические выводы носят приближенный характер. Группа (верхние границы) Группа (верхние границы) Упражнения. 1. Имеются данные об итоговой успеваемости (по 10-бальной системе) студентов, посещавших факультативные занятия по данному предмету и не посещавших. Определить, имеются ли различия между этими двумя группами студентов? Посещавшие 8 8 7 9 8 6 7 8 6 5 8 10 6 8 9 Не 5 6 7 6 8 7 7 5 8 6 5 9 6 7 5 посещавшие 2. Две группы выпускников двух высших заведений получили оценки своих административных способностей (в баллах), приведенные ниже в таблице. Можно ли утверждать, что не существует различия в уровне подготовки выпускников вузов? 1 26 22 19 21 14 18 29 17 11 34 ВУЗ 2 16 10 8 13 19 11 7 13 9 21 ВУЗ 3. Имеются показатели уровня интеллекта IQ среди группы детей и их родителей. Определить, имеются ли различия между родителями и детьми по уровню интеллекта? Родители 117 108 121 106 117 105 118 128 116 122 Дети 109 119 110 123 109 122 102 90 111 92 Родители 98 128 99 126 103 41 Дети 111 111 116 98 121 4. Можно ли утверждать, что у девочек наблюдается более высокий уровень готовности к профессиональному самоопределению, чем у мальчиков? Девочки 10,5 7,5 10,5 9,5 10 9,5 10 10 10,5 10 10,5 9 8,5 Мальчики 3 10,5 6,5 10 7,5 9 5,5 9,5 7 7 6 5. Изучались психологические особенности школьников 9-а и 9-в классов. Оцените, различаются ли оценки интеллекта у учеников обоих классов? Учащиеся 9-а класса 16 16 20 14 18 20 23 19 18 21 19 21 18 Учащиеся 9-в класса 19 19 10 13 18 13 11 16 16 16 11 13 11 6. При переходе из младшего звена школы в пятый класс у учащихся городской и сельской школ проведен тест на общую осведомленность. Будут ли обнаружены статистически значимые различия по общей осведомленности между учащимися городской и сельской школ? Городские школьники 8 9 8 9 8 9 10 8 9 9 7 7 8 9 Сельские школьники 6 6 8 8 4 5 7 9 8 9 5 7 7 4 7. У студенток химического и гуманитарного факультетов был измерен уровень вербального интеллекта. Можно ли утверждать, что «студентки-гуманитарии» имеют более высокий уровень вербального интеллекта? Студентки химического 14 12 14 11 8 5 12 17 22 факультета Студенки гуманитарного 9 12 15 27 16 5 7 6 15 факультета. 42 Глава 7. Оценка сдвига значений признака В психолого-педагогических исследованиях бывает необходимо доказать, что в результате действий каких-либо факторов произошли достоверные изменения (сдвиги) в измеряемых показателях. Сдвиг – это разность между вторым и первым замерами. Выделяют: 1. Временной сдвиг, когда сравнивают данные, полученные на одной и той же выборке, но в разное время. 2. Ситуационный сдвиг, когда сравнивают данные, полученные на одной и той же выборке, но в разных условиях измерения (например, «покоя» и «стресса») 3. Сдвиг под влиянием контролируемых или не контролируемых воздействий, когда сравнивают данные, полученные на одной и той же выборке, но замеры произведены до и после экспериментального воздействия (например, мы можем проверить, способствовал ли проведенный тренинг увеличению мотивации в обучении или нет?) В данном случае необходимо обязательно ввести контрольную группу, которая не испытывала на себе воздействия данного экспериментального фактора. Если нет контрольной группы, то сдвиг в экспериментальной группе может объясняться действием самых разных причин, например, временем суток в которое производились замеры и т.д. Мы никогда не сможем исключить той возможности, что изменения, достигнутые, как нам кажется, в результате наших воздействий, на самом деле объясняются неучтенными причинами. Если в экспериментальной группе сдвиги окажутся достоверными, а в контрольной группе – недостоверными, то это, действительно, может свидетельствовать об эффективности воздействий. При отсутствии контрольной группы мы констатируем лишь, что сдвиг произошел, но не имеем права приписывать его именно изучаемым нами факторам воздействия. Критерий Т-Вилкоксона 1.Назначение критерия. Критерий Т-Вилкоксона является непараметрическим и применяется только для зависимых (связных) выборок. Он предназначен для установления выраженности (интенсивности) сдвига исследуемого признака. 2.Гипотезы. Н0:интенсивность сдвигов в типичном направлении статистически значимо не превосходит интенсивность сдвигов в нетипичном направлении. Н1:интенсивность сдвигов в типичном направлении статистически значимо превышает интенсивность сдвигов в нетипичном направлении. 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1.Подсчитываем сдвиги. Определяем, какие сдвиги типичные, а какие нетипичные. Сдвиги, количество которых получилось наибольшим, называются типичными сдвигами. Сдвиги, количество которых получилось наименьшим, называются нетипичные сдвиги. Замечание: нулевые сдвиги в расчетах не учитываются. 2.Вычисяем абсолютную величину сдвигов и их ранжируем. 3. Находим эмпирическое значение как сумму нетипичных сдвигов. Обозначим 𝑇эм . Определение критического значения. Критическое значение зависит от выбранного уровня значимости и объема выборки 𝑛 (𝑛1 = 𝑛2 = 𝑛.) 43 Таблица критических значений для критерия T-Вилкоксона представлена в Таблице №4 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. Н0 принимается, если 𝑇эмп > 𝑇кр . Н0 отклоняется, если 𝑇эмп ≤ 𝑇кр . Критическая область располагается слева, а доверительная область справа. 5.Ограничения критерия. Этот критерий применим в тех случаях, когда признаки измерены, по крайней мере, в шкале порядка. Не допускается неравное количество элементов в сравниваемых выборках. Замеры производятся на одной группе испытуемых. Минимальный объем выборки – 5, максимальный – 50. Пример. Способствовал ли проведенный тренинг улучшению вербальной памяти учащихся, измеренной в баллах? № испытуемого 1 2 3 4 5 6 7 8 9 10 до после 6 5 4 3 7 6 4 4 5 6 8 5 6 4 7 7 5 3 8 7 Решение. Исследуется признак – вербальная память в баллах в одной и той же группе испытуемых «до» и «после» проведения тренинга. Следовательно, полученные наблюдения представляют собой две связные выборки. Преобладает положительное направление сдвига показателя вербальной памяти (в сторону повышения). Требуется определить, можно ли считать имеющийся положительный сдвиг выраженным (интенсивным) статистически значимо. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: интенсивность положительного сдвига показателя вербальной памяти после тренинга не является статистически значимой. Н1: интенсивность положительного сдвига показателя вербальной памяти после тренинга является статистически значимой. 2.Выбор статистического метода. Для установления интенсивности сдвига для двух связных выборок выберем критерий Вилкоксона. 3.Вычисление эмпирического значения. 1.Посчитаем сдвиги и определим, какие сдвиги типичные, а какие нетипичные. № испытуемого 1 до после сдвиг 6 8 +2 44 2 3 4 5 6 7 8 9 10 5 4 3 7 6 4 4 5 6 5 6 4 7 7 5 3 8 7 0 +2 +1 0 +1 +1 -1 +3 +1 Отрицательные сдвиги – «нетипичные» сдвиги (их меньше – 1шт). Положительные сдвиги – «типичные» сдвиги (их больше – 7шт). Нулевые сдвиги не учитываются (их – 2шт). 2.Вычислим абсолютную величину сдвигов и их проранжируем. Добавим два дополнительных столбца для дальнейших расчетов: -в столбец «абсолютный сдвиг» запишем значения сдвигов без знаков; -в столбце «ранг абсолютного сдвига» проранжируем значения из столбца «абсолютный сдвиг». № сдвиг испытуемого 1 2 3 4 5 6 7 8 9 10 сумма Проверка ранжирования: +2 0 +2 +1 0 +1 +1 -1 +3 +1 10∙(10+1) 2 абсолютный ранг сдвиг абсолютного сдвига 2 8,5 0 1,5 2 8,5 1 5 0 1,5 1 5 1 5 1 (5) 3 10 1 5 55 = 55 (верно) 3. Найдем эмпирическое значение. Запишем ранги нетипичных сдвигов в скобках (в примере это лишь одно число). Тэм = 5. 4.Нахождение критического значения. Объем выборки 𝑛 = 𝑛1 = 𝑛2 = 10. По Таблице №4 (см. Приложения): Ткр1 = 10 для уровня значимости 𝑝 = 0,05; Ткр2 = 5 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. при 𝑝 = 0,05, 𝑇эмп = 5 ≤ 𝑇кр1 = 10; при 𝑝 = 0,01, 𝑇эмп = 5 ≤ 𝑇кр2 = 5; 6.Формулировка принятия решения. Гипотеза Н0 отклоняется и принимается гипотеза Н1 на ровне значимости р = 0,01. 45 Выявлена статистически значимая интенсивность положительного сдвига показателя вербальной памяти учащихся. На высоком уровне значимости можно утверждать, что тренинг способствовал повышению вербальной памяти. t-критерий Стьюдента (для зависимых выборок) 1.Назначение критерия. Критерий t-Стьюдента является параметрическим и может применяться для зависимых (связных) выборок. Критерий предназначен для исследования сдвига между показателями двух замеров изучаемого признака. Сравниваются средние арифметические показателей замеров. 𝑥̅ – среднее арифметического признака для 1 замера (выборки). 𝑦̅ – среднее арифметического признака для 2 замера (выборки). 2.Гипотезы. Н0: 𝑥̅ = 𝑦̅ (средние арифметические двух замеров статистически значимо не различаются). Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические двух замеров статистически значимо различаются). 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1. Обозначаем исследуемые признаки 1 замера – 𝑋, 2 замера – 𝑌. 2. Находим среднее арифметическое для замеров: 𝑥̅ , 𝑦̅. 3. Эмпирическое значение находим по формуле: |𝑑̅ | 𝑡эмп = , 𝑆𝑑 𝑆𝑑 = √(∑ 𝑑𝑖2 − (∑ 𝑑𝑖 )2 ) /(𝑛2 − 𝑛) 𝑛 где 𝑑𝑖 = 𝑥𝑖 − 𝑦𝑖 – сдвиги исследуемого признака; 𝑑̅ – среднее арифметическое сдвигов; 𝑛 = 𝑛1 = 𝑛2 - объем выборок. Определение критического значения. Критическое значение зависит от выбранного уровня значимости и числа степеней свободы: 𝑘 = 𝑛 − 1. Таблица критических значений для критерия t-Стьюдента представлена в Таблице №3 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. Н0 принимается, если 𝑡эмп < 𝑡кр . Н0 отклоняется, если 𝑡эмп ≥ 𝑡кр . Критическая область располагается справа, а доверительная область слева. 5.Ограничения критерия. Критерий применяется в тех случаях, когда данные представлены в шкале интервалов или отношений. Не допускается неравное количество элементов в сравниваемых выборках. Замеры производятся на одной группе испытуемых. Сравниваемые выборки (замеры) должны иметь нормальное распределение. Пример. Способствует ли научение значимому уменьшению времени решения эквивалентных задач, т.е. имеющихся один и тот же алгоритм решения? Время решения измерено в минутах. № 1 задача 3 задача испытуемого 46 1 2 3 4 5 6 7 8 4,0 3,5 4,1 5,5 4,6 6,0 5,1 4,3 3,0 3,0 3,8 2,1 4,9 5,3 3,1 2,7 Решение. Исследуется признак – время решения эквивалентных задач в одной и той же группе испытуемых в процессе научения. Следовательно, полученные наблюдения представляют собой две связные выборки. Преобладает отрицательное направление сдвига времени решения задач (в сторону уменьшения). Требуется определить, можно ли считать имеющийся отрицательный сдвиг выраженным статистически значимым. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: 𝑥̅ = 𝑦̅ (средние арифметические времени решения 1 и 3 задачи статистически значимо не отличаются). Н1: 𝑥̅ ≠ 𝑦̅ (средние арифметические времени решения 1 и 3 задачи статистически значимо отличаются). 2.Выбор статистического метода. Для сравнения средних арифметических сдвигов для двух связных выборок выберем критерий t-Стьюдента. 3.Вычисление эмпирического значения. 1. Обозначим исследуемые признаки 1 замера – 𝑋, 2 замера – 𝑌. № сдвиг сдвиг в квадрате 𝑋 𝑌 испытуемого 𝒅𝒊 𝒅𝟐𝒊 1 4 3 -1 1 2 3,5 3 -0,5 0,25 3 4,1 3,8 -0,3 0,09 4 5,5 2,1 -3,4 11,56 5 4,6 4,9 0,3 0,09 6 6 5,3 -0,7 0,49 7 5,1 3,1 -2 4 8 4,3 2,7 -1,6 2,56 37,1 27,9 -9,2 20,04 сумма 2. Найдем среднее арифметическое для замеров: 𝑥̅ , 𝑦̅. 37,1 27,9 𝑥̅ = = 4,64; 𝑦̅ = = 3,49. 8 8 3. Найдем эмпирическое значение: −9,2 𝑑̅ = = −1,15 8 (−9,2)2 𝑆𝑑 = √(20,04 − ) /(82 − 8) = 0,41 8 |−1,15| 𝑡эмп = = 2,8, 0,41 4.Нахождение критического значения. Объем выборки 𝑛 = 𝑛1 = 𝑛2 = 8. 47 Число степеней свободы: 𝑘 = 8 − 1 = 7. По Таблице №3 (см. Приложения): 𝑡кр1 = 2,37 для уровня значимости 𝑝 = 0,05; 𝑡кр2 = 3,5 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. при 𝑝 = 0,05, 𝑡эмп = 2,8 ≥ 𝑡кр1 = 2,37; при 𝑝 = 0,01, 𝑡эмп = 2,8 < 𝑡кр2 = 3,5; 6.Формулировка принятия решения. Гипотеза Н0 отклоняется и принимается гипотеза Н1 на уровне значимости р = 0,05 и, одновременно, гипотеза Н0 принимается на уровне значимости р = 0,01. Только на уровне значимости р = 0,05 установлено, что среднее время решения третье задачи существенно меньше среднего времени решения первой задачи. Научение способствовало уменьшению времени решения задач. Если провести исследование на выборке большего объема, возможно, удастся установить такой же результат на более высоком уровне значимости. Замечание. Ограничением применения данного критерия является необходимость, чтобы данные имели нормальное распределение. Приближенно оценим распределение по диаграмме частот. Диаграмма Диаграмма для переменной Х для переменной Y Перемен.: Пер3, Рас пред.:Нормальное Перемен.: Пер4, Рас пред.:Нормальное Хи-квадрат: ------ , cc = 0 , p = --- Хи-квадрат: ------ , cc = 0 , p = --- 3,5 4,5 4,0 3,0 3,5 Число наблюдений Число наблюдений 2,5 2,0 1,5 3,0 2,5 2,0 1,5 1,0 1,0 0,5 0,5 0,0 0,0 3,2 4,0 4,8 5,6 6,4 2,10 3,15 4,20 5,25 6,30 Группа (верхние границы) Группа (верхние границы) Визуально видно, что распределения переменных не имеют нормальное распределение. Применять данный метод для данного примера некорректно. Статистические выводы нельзя считать обоснованными. Также не рекомендуется применять параметрические критерии при малом объеме выборки. Необходимо увеличить объем выборки или применить другой критерий для решения данной задачи. Упражнения 1. Имеются данные о результатах группы учащихся по скоростному чтению до и после специального курса по быстрому чтению. Определить, произошли ли статистически значимые изменения скорости чтения у учащихся? До 86 83 86 70 66 90 70 85 77 86 После 82 79 91 77 68 86 81 90 85 94 2. Имеются данные о физической подготовке спортсменов при поступлении на факультет физической культуры и после первого семестра. Определить, произошли ли статистически значимые изменения физической подготовки у спортсменов? «при 75 72 55 60 68 28 65 58 71 48 поступлении» 48 «после 1 семестра» 80 85 51 60 62 35 83 61 87 52 3. Для определения «остаточных» знаний у студентов по математике им было предложено 10 задач: после изучения дисциплины в конце второго курса, а затем через три года – на пятом курсе. Можно ли утверждать, что количество решенных задач после трех лет значимо не различается? На 2 курсе 6 7 4 5 8 4 7 4 9 7 На 5 курсе 5 6 4 5 3 5 6 6 4 6 4. Перед началом учебного первого учебного года был измерен уровень интеллекта у группы студентов. В начале второго учебного года при помощи параллельной методики вновь был измерен уровень интеллекта. Можно ли сказать, что за год обучения интеллектуальный уровень студентов значимо изменился? Начальный 100 102 105 120 110 106 109 115 114 111 120 125 срез Конечный 116 102 114 119 119 116 100 121 118 119 122 121 срез 5. Представлены результаты по количеству правильно выполненных заданий. Сравнить эффективность до и после применения методики обучения на одной группе студентов. «до» 12 9 11 10 9 12 7 16 25 22 14 24 9 15 15 «после» 13 9 10 15 8 16 9 16 23 22 20 26 8 15 15 19 10 24 11 11 21 10 25 11 10 6. Будет ли разработанная программа способствовать снижению эмоциональных барьеров в общении у старшеклассников? «до» 9 9 7 10 5 5 11 6 10 10 3 10 8 10 «после» 8 9 9 6 5 7 11 7 15 10 5 6 9 8 13 8 10 12 9 12 8 8 14 9 49 Глава 8. Выявление различий в распределении признака Еще одним способом установить различия между выборками является способ сравнить распределения исследуемого признака. Распределение признака в выборке можно представить в виде соответствия вариант (интервалов) и их частот (таблица частот или интервальная таблица частот). Это позволит сравнить выборки, для которых признак измерен даже в номинальной шкале. Также выборки могут иметь одинаковый уровень исследуемого признака, но при этом разное распределение признака, т.е. выборки по уровню признака могут не различаться, а по распределению признака различаться. Пример. Средняя оценка за одинаковую контрольную в разных классах может совпадать, но при этом в классах будет разная вариативность оценок. В одном классе большинство оценок близко к среднему значению, а в другом классе много оценок как выше, так и ниже среднего значения. Классы будут различать по дифференцированности знаний. Критерий 𝝌𝟐 -Пирсона («хи-квадрат») (сравнение эмпирических распределений). 1.Назначение критерия. Критерий предназначен для сравнения эмпирических распределений одного и того же признака. 2.Гипотезы. Н0: Эмпирические распределения выборок статистически значимо не различаются. Н1: Эмпирические распределения выборок статистически значимо различаются. 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1. Для эмпирических частот - 𝑛𝑖_э считаем суммы по строкам и столбцам. 2. Для каждой эмпирической частоты вычисляем соответствующие теоретические частоты - 𝑛𝑖_т . При сравнении двух независимых выборок: сумма частот сумма частот ( по строке ) ∙ ( по столбцу ) 𝑛𝑖_т = общее количество данных 3. Находим эмпирическое значение по формуле: 𝑘 (𝑛𝑖_э − 𝑛𝑖_т ) 𝜒2 = ∑ 𝑛𝑖_т 𝑖=1 2 𝑘- количество вариант (или интервалов). Определение критического значения. Критическое значение зависит от выбранного уровня значимости и числа степеней свободы: 𝜈 = (𝑟 − 1) ∙ (𝑐 − 1), где r – число строк, а 𝑐 – число столбцов. Таблица критических значений для критерия 𝜒 2 -Пирсона представлена в Таблице №5 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. 2 2 Н0 принимается, если 𝜒эмп < 𝜒кр . 2 2 Н0 отклоняется, если 𝜒эмп ≥ 𝜒кр . Критическая область располагается справа, а доверительная область слева. 5.Ограничения критерия. При 𝑛 < 30 критерий дает приближенные значения. Точность критерия повышается при больших объемах выборки. Для большей точности критерия требуется, чтобы теоретическая частота для каждого разряда была больше пяти 𝑛𝑖_т ≥ 5. Если условие не выполняется, то рекомендуют соседние разряды объединить так, чтобы суммарная частота оказалась не менее пяти. 50 Если в задаче число степеней свободы равно единице 𝜈 = 1, то при вычислении эмпирического значения необходимо делать «поправку на непрерывность». В этом случае эмпирическое значение находим по формуле: 𝑘 (|𝑛𝑖_э − 𝑛𝑖_т | − 0,5) 𝜒 =∑ 𝑛𝑖_т 2 2 𝑖=1 Пример. В ходе социологического опроса среди взрослых сотрудников, на вопрос о перенесенном в детстве заболевании ответы распределились следующим образом: Да Нет Не помню Мужчины 58 11 10 Женщины 35 25 23 Определить, имеются ли достоверные отличия в ответах женщин и мужчин? Решение. Исследуется признак – результаты социологического опроса в двух разных группах (мужичины и женщины). Полученные данные представляют собой две независимые (несвязные) выборки. Требуется установить различия между двумя выборками по распределению исследуемого признака. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: Эмпирические распределения выборок статистически значимо не различаются. Н1: Эмпирические распределения выборок статистически значимо различаются. 2.Выбор статистического метода. Для установления различий между выборками по распределению исследуемого признака выберем критерий 𝜒 2 -Пирсона («хи-квадрат»). 3.Вычисление эмпирического значения. 1. Для эмпирических частот посчитаем суммы по строкам и столбцам. Да Нет Не помню сумма Мужчины 58 11 10 79 Женщины 35 25 23 83 сумма 93 36 33 162 2. Для каждой эмпирической частоты вычислим соответствующие теоретические частоты. Да Нет Не помню сумма Мужчины (79 ∙ 93)/162 (79 ∙ 36)/162 (79 ∙ 33)/162 79 Женщины (83∙ 93)/162 83 (83∙ 36)/162 (83 ∙ 33)/162 сумма 93 36 33 162 Да Нет Мужчины 45,35 17,56 Женщины 47,65 18,44 сумма 93 36 3. Найдем эмпирическое значение. Расчеты оформим в таблице: 𝑛𝑖_э 𝑛𝑖_т (𝑛𝑖_э − 𝑛𝑖_т ) 58 11 10 35 45,35 17,56 16,09 47,65 12,65 -6,56 -6,09 -12,65 51 Не помню 16,09 16,91 33 (𝑛𝑖_э − 𝑛𝑖_т ) 160,02 43,03 37,09 160,02 сумма 79 83 162 2 (𝑛𝑖_э − 𝑛𝑖_т ) 𝑛𝑖_т 3,53 2,45 2,31 3,36 2 25 18,44 6,56 43,03 2,33 23 16,91 6,09 37,09 2,19 сумма 162 162 0 16,17 ∑(𝑛 Выполним проверку расчетов: 𝑖_э − 𝑛𝑖_т ) = 0 (верно). 𝜒 2 = 16,17 4.Нахождение критического значения. Число степеней свободы: 𝜈 = (2 − 1) ∙ (3 − 1) = 2. По Таблице №5 (см. Приложения): 𝜒 2 = 5,991 для уровня значимости 𝑝 = 0,05; 𝜒 2 = 9,210 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. 2 2 при 𝑝 = 0,05, 𝜒эмп = 16,17 ≥ 𝜒кр = 5,991; 2 2 при 𝑝 = 0,01, 𝜒эмп = 16,17 ≥ 𝜒кр = 9,210; 6.Формулировка принятия решения. Гипотеза Н1 принимается, а гипотеза Н0 отклоняется на уровне значимости 𝑝 = 0,01. Выявлены статистически значимые различия результатов социологического опроса между мужичинами и женщинами. Пример. Имеются данные о результатах оценки студентами условий проживания в общежитиях. Определить, зависит ли оценка от общежития? Оценка Отрицательная Положительная Общежитие №1 №2 15 18 34 38 Решение. Исследуется признак – результаты оценки студентами условий проживания в зависимости от общежития (общежитие №1 и №2). Полученные данные представляют собой две независимые (несвязные) выборки. Требуется установить различия между двумя выборками по распределению исследуемого признака. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: Эмпирические распределения выборок статистически значимо не различаются. Н1: Эмпирические распределения выборок статистически значимо различаются. 2.Выбор статистического метода. Для установления различий между выборками по распределению исследуемого признака выберем критерий 𝜒 2 -Пирсона («хи-квадрат»). 3.Вычисление эмпирического значения. 1. Для эмпирических частот посчитаем суммы по строкам и столбцам. №1 №2 сумма Отрицательная 15 18 33 Положительная 34 38 72 сумма 49 56 105 2. Для каждой эмпирической частоты вычислим соответствующие теоретические частоты. №1 №2 сумма Отрицательная (33 ∙ 49)/105 (33 ∙ 56)/105 33 Положительная (72 ∙ 49)/105 (72 ∙ 56)/105 72 сумма 49 56 105 52 №1 15,4 33,6 49 №2 17,6 38,4 56 сумма 33 72 105 Отрицательная Положительная сумма 3. Найдем эмпирическое значение. Замечание. Число степеней свободы: 𝜈 = (2 − 1) ∙ (2 − 1) = 1. При вычислении эмпирического значения необходимо выполнить «поправку на непрерывность». Расчеты оформим в таблице: 𝑛𝑖_э 𝑛𝑖_т (𝑛𝑖_э − 𝑛𝑖_т ) |𝑛𝑖_э − 𝑛𝑖_т | |𝑛𝑖_э − 𝑛𝑖_т | − 0,5 15 15,4 -0,4 0,4 -0,1 18 17,6 0,4 0,4 -0,1 34 33,6 0,4 0,4 -0,1 38 38,4 -0,4 0,4 -0,1 сумма 105 105 0 2 2 (|𝑛𝑖_э − 𝑛𝑖_т | − 0,5) 𝑛𝑖_т 0,01 0,0006 0,01 0,0006 0,01 0,0003 0,01 0,0003 сумма 0,0018 Выполним проверку расчетов: ∑(𝑛𝑖_э − 𝑛𝑖_т ) = 0 (верно). 𝜒 2 = 0,0018 4.Нахождение критического значения. Число степеней свободы: 𝜈 = 1. По Таблице №5 (см. Приложения): 𝜒 2 = 3,841 для уровня значимости 𝑝 = 0,05; 𝜒 2 = 6,635 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. 2 2 при 𝑝 = 0,05, 𝜒эмп = 0,0018 < 𝜒кр = 3,841; 2 2 при 𝑝 = 0,01, 𝜒эмп = 0,0018 < 𝜒кр = 6,635; 6.Формулировка принятия решения. Гипотеза Н1 отклоняется, а гипотеза Н0 принимается на уровне значимости 𝑝 = 0,01. Между оценками студентами условий проживания в зависимости от общежития не выявлены статистически значимые различия. (|𝑛𝑖_э − 𝑛𝑖_т | − 0,5) Критерий 𝝌𝟐 -Пирсона («хи-квадрат») (сравнение эмпирического и теоретического распределений). 1.Назначение критерия. Критерий предназначен для сравнения эмпирического распределения признака с теоретическим – равномерным, нормальным или каким-то иным. 2.Гипотезы. Н0: Эмпирическое распределение выборки статистически значимо не отличается от теоретического распределения. Н1: Эмпирическое распределение выборки статистически значимо отличается от теоретического распределения. 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 53 1. Вычисляем теоретические частоты -𝑛𝑖_т . а) если теоретическое распределение равномерное, то: 𝑛 𝑛𝑖_т = , 𝑘 где 𝑛- объем выборки, 𝑘 – количество вариант (или интервалов). б) если теоретическое распределение нормальное, то необходимо: 1) вычислить среднее арифметическое выборки - 𝑥̅ ; 2) вычислить стандартное отклонение выборки - 𝜎; 3) выполнить нормирование для каждого интервала по формуле: 𝑥𝑖 − 𝑥̅ 𝑧𝑖 = , 𝜎 где 𝑥𝑖 – середины интервалов. 4) вычислить значения функции стандартного нормального распределения 𝜑(𝑧𝑖 ) по Таблице №1 (см. Приложение). 5) вычислить теоретические частоты по формуле: 𝑛ℎ𝑖 𝑛𝑖_т = ∙ 𝜑(𝑧𝑖 ), 𝜎 где 𝑛- объем выборки, ℎ𝑖 – длины интервалов. 2. Находим эмпирическое значение по формуле: 𝑘 (𝑛𝑖_э − 𝑛𝑖_т ) 𝜒 =∑ 𝑛𝑖_т 2 2 𝑖=1 𝑘- количество интервалов. Определение критического значения. Критическое значение зависит от выбранного уровня значимости и числа степеней свободы. а) для равномерного распределения: 𝜈 = 𝑘 − 1, где 𝑘- количество вариант (или интервалов). б) для нормального распределения: 𝜈 = 𝑘 − 3, где 𝑘- количество интервалов. Таблица критических значений для критерия 𝜒 2 -Пирсона представлена в Таблице №5 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. 2 2 Н0 принимается, если 𝜒эмп < 𝜒кр . 2 2 Н0 отклоняется, если 𝜒эмп ≥ 𝜒кр . Критическая область располагается справа, а доверительная область слева. 5.Ограничения критерия. Ограничения аналогичные случаю сравнения двух эмпирических распределений. Объем выборки должен быть достаточно большим. Не рекомендуется сравнивать эмпирическое и теоретическое распределения при 𝑛 < 30. Теоретическая частота для каждого разряда (интервала) должна быть больше пяти 𝑛𝑖_т ≥ 5, иначе требуется соседние разряды объединять. Аналогично при числе степеней свободы 𝜈 = 1 необходимо делать «поправку на непрерывность». Пример. В эксперименте подбрасывают игральный кубик с цифрами на гранях от 1 до 6. В результате эксперимента получены следующие результаты подбрасывания кубика: Грани кубика 1 2 3 4 5 6 эмпирические частоты 12 9 11 14 8 6 54 Игральный кубик будет считаться «идеальным», если при достаточно большом числе подбрасываний каждая его грань выпала примерно равное число раз. Необходимо выяснить, можно ли считать подбрасываемый кубик «идеальным»? Решение. Исследуется признак – результаты выпадения игрального кубика на определенную грань. Полученные данные представляют собой распределение частот исследуемого признака (эмпирическое распределение). Требуется сравнить эмпирическое распределение исследуемого признака с равномерным распределением. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: Эмпирическое распределение выборки статистически значимо не отличается от равномерного распределения. Н1: Эмпирическое распределение выборки статистически значимо отличается от равномерного распределения. 2.Выбор статистического метода. Для сравнения распределения исследуемого признака выборки с равномерным распределением выберем критерий 𝜒 2 -Пирсона («хи-квадрат»). 3.Вычисление эмпирического значения. 1. Вычислим теоретические частоты. Для каждой варианты (грани): 60 𝑛𝑖_т = 6 = 10, 𝑛 = 60, 𝑘 = 6. 2. Найдем эмпирическое значение. Расчеты оформим в таблице: 𝟐 𝟐 Грани 𝒏𝒊_э 𝒏𝒊_т (𝒏𝒊_э − 𝒏𝒊_т ) (𝒏𝒊_э − 𝒏𝒊_т ) (𝒏𝒊_э − 𝒏𝒊_т ) кубика 𝒏𝒊_т 1 12 10 2 4 0,4 2 9 10 -1 1 0,1 3 11 10 1 1 0,1 4 14 10 4 16 1,6 5 8 10 -2 4 0,4 6 6 10 -4 16 1,6 сумма 60 60 0 4,2 Выполним проверку расчетов: ∑(𝑛𝑖_э − 𝑛𝑖_т ) = 0. 𝜒 2 = 4,2 4.Нахождение критического значения. для равномерного распределения: 𝜈 = 6 − 1 = 5, где 𝑘 = 6 - количество вариант. По Таблице №5 (см. Приложения): 𝜒 2 = 11,070 для уровня значимости 𝑝 = 0,05; 𝜒 2 = 15,086 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. 2 2 при 𝑝 = 0,05, 𝜒эмп = 4,2 < 𝜒кр = 11,070; 2 2 при 𝑝 = 0,01, 𝜒эмп = 4,2 < 𝜒кр = 15,086; 6.Формулировка принятия решения. Гипотеза Н0 принимается, а гипотеза Н1 отклоняется на уровне значимости 𝑝 = 0,01. Между эмпирическим и равномерным распределением не выявлены статистически значимые различия. Подбрасываемый кубик можно считать «идеальным». Пример. В результате выборочного обследования стажа работы профессорскопреподавательского состава получены следующие данные: 55 Стаж работы (лет) 0-4 4-8 8-12 12-16 16-20 20-24 24-28 28-32 Число преподавателей 3 8 25 40 46 31 6 2 Выяснить, является ли распределение стажа работы нормальным? Решение. Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: Эмпирическое распределение выборки статистически значимо не отличается от нормального распределения. Н1: Эмпирическое распределение выборки статистически значимо отличается от нормального распределения. 2.Выбор статистического метода. Для сравнения распределения исследуемого признака выборки с нормальным распределением выберем критерий 𝜒 2 -Пирсона («хи-квадрат»). 3.Вычисление эмпирического значения. 1. Вычислим теоретические частоты. Промежуточные вычисления оформим в таблице. Интервалы Частота Середина 𝒙𝒊 ∙ 𝒏𝒊_э 𝒙𝒊 𝟐 ∙ 𝒏𝒊_э 𝒙𝒊 𝟐 𝒏𝒊_э 𝒙𝒊 [0; 4) 3 2 6 4 12 [4; 8) 8 6 48 36 288 [8; 12) 25 10 250 100 2500 [12; 16) 40 14 560 196 7840 [16; 20) 46 18 828 324 14904 [20; 24) 31 22 682 484 15004 [24; 28) 6 26 156 676 4056 [28; 32) 2 30 60 900 1800 сумма 161 2590 46404 1) среднее арифметическое выборки: 2590 𝑥̅ = ≈ 16,09 161 2) стандартное отклонение выборки: 46404 𝐷= − 16,092 ≈ 29,33 161 𝜎 = √29,33 ≈ 5,42 ̅ 𝝋(𝒛𝒊 ) 𝒙𝒊 − 𝒙 𝒏𝒉𝒊 Середина 𝒙𝒊 − 𝒙 ̅ 𝒛𝒊 = 𝒏𝒊_т = ∙ 𝝋(𝒛𝒊 ), 𝒙𝒊 𝝈 𝝈 2 -14,09 -2,60 0,0136 1,62 6 -10,09 -1,86 0,0707 8,40 10 -6,09 -1,12 0,2131 25,32 14 -2,09 -0,39 0,3697 43,93 18 1,91 0,35 0,3752 44,58 22 5,91 1,09 0,2203 26,18 26 9,91 1,83 0,0748 8,89 30 13,91 2,57 0,0147 1,75 3) нормирование для каждого интервала 𝑧𝑖 . 4) значения функции стандартного нормального распределения 𝜑(𝑧𝑖 ). 5) теоретические частоты 𝑛𝑖_т . 2. Найдем эмпирическое значение. 56 Интервалы 𝒏𝒊_э 𝒏𝒊_т [0; 4) 3 1,62 [4; 8) 8 8,4 [8; 12) 25 25,32 [12; 16) 40 43,93 [16; 20) 46 44,58 [20; 24) 31 26,18 [24; 28) 6 8,89 [28; 32) 2 1,75 Замечание. Для двух интервалов получились теоретические частоты меньше пяти 𝑛𝑖_т < 5. Объединим соседние интервалы, чтобы частоты стали не менее пяти. 𝟐 𝟐 Интервалы 𝒏𝒊_э 𝒏𝒊_т (𝒏𝒊_э − 𝒏𝒊_т ) (𝒏𝒊_э − 𝒏𝒊_т ) (𝒏𝒊_э − 𝒏𝒊_т ) 𝒏𝒊_т 0,096 0,004 0,352 0,045 0,887 0,655 2,039 [0; 8) 11 10,02 0,98 0,96 [8; 12) 25 25,32 -0,32 0,10 [12; 16) 40 43,93 -3,93 15,44 [16; 20) 46 44,58 1,42 2,02 [20; 24) 31 26,18 4,82 23,23 [24; 32) 8 10,64 -2,64 6,97 сумма 161 160,67 0,33 Выполним проверку расчетов: ∑(𝑛𝑖_э − 𝑛𝑖_т ) = 0 , 33 (погрешность). 𝜒 2 = 2,039 4.Нахождение критического значения. для нормального распределения: 𝜈 = 6 − 3 = 3, где 𝑘 = 6 - количество интервалов после объединения. По Таблице №5 (см. Приложения): 𝜒 2 = 7,815 для уровня значимости 𝑝 = 0,05; 𝜒 2 = 11,345 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. 2 2 при 𝑝 = 0,05, 𝜒эмп = 2,039 < 𝜒кр = 7,815; 2 2 при 𝑝 = 0,01, 𝜒эмп = 2,039 < 𝜒кр = 11,345; 6.Формулировка принятия решения. Гипотеза Н0 принимается, а гипотеза Н1 отклоняется на уровне значимости 𝑝 = 0,01. Между эмпирическим и нормальным распределением не выявлены статистически значимые различия. Упражнения 1. Имеются данные о результатах оценки слушателями курсов метода подачи теоретического материала. Определить, зависит ли оценка от метода подами материала? Оценка Метод подачи нового материала I II Отрицательная 12 18 Положительная 21 25 2. Имеется распределение студентов по количеству пропусков за семестр. Определить, зависит ли количество пропусков от пола? Пол Количество пропусков Меньше 10 От 10 до 30 Более 30 Юноши 120 40 10 57 Девушки 100 35 5 3. Имеются данные об отношении школьников к проведенному мероприятию. Есть ли отличия в отношении мальчиков и девочек к мероприятию? Пол Количество школьников, высказавших свое мнение о проведенном мероприятии Положительное Безразличное Отрицательное Мальчики 15 25 6 Девочки 30 35 30 4. В школе были проведены некоторые мероприятия, предположительно влияющие на успеваемость. Влияет ли вид мероприятия на успеваемость? Вид мероприятия Успеваемость Увеличилась Не изменилась Уменьшилась Мероприятие А 14 22 20 Мероприятие В 47 37 25 5. Проводился опрос работников одного предприятия об удовлетворенности их работой. В качестве ответов предлагались следующие альтернативы: 1 – работой вполне доволен; 2 – скорее доволен, чем не доволен; 3 – трудно сказать, не знаю, безразлично; 4 – скорее недоволен, чем доволен; 5 – совершенно недоволен работой. Полученные ответы (эмпирические частоты) представлены в таблице Альтернативы 1 2 3 4 5 эмпирические частоты 8 22 14 9 12 Требуется определить, будет ли удовлетворенность работой на данном предприятии распределена равномерно? 6. В эксперименте испытуемый должен произвести выбор левого или правого стола с заданиями. В инструкции исследователь подчеркивает, что задания на обоих столах одинаковы. Из 150 испытуемых правый стол выбрали 98 человек, а левый 52. Можно ли утверждать, что подобный выбор левого или правого стола равновероятен или он обусловлен какой-либо неизвестной причиной? 7. Дано следующее распределение абонентов по потребляемой мощности электроэнергии (в кВт.ч) Интервалы 5–10 10–15 15–20 20–25 25–30 30–35 35–40 40–45 45–50 мощности Число 3 13 70 190 290 абонентов Выяснить, является ли распределение нормальным? 230 130 62 12 8. В таблице приведены сгруппированные данные измерений роста у случайно отобранных студентов. Рост студентов, см 162–166 166–170 170–174 174–178 178–182 182–186 Число студентов 3 7 15 Выяснить, является ли распределение нормальным? 58 13 11 1 Глава 9. Выявление степени согласованности изменений Понятие корреляции Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах? Например, связан ли уровень тревожности учащихся с их показателями успеваемости? Корреляция – это согласованное изменение признаков. Если при изменении одной величины изменяется другая, то между показателями этих явлений будет наблюдаться корреляция. Наличие корреляции между двумя переменными ничего не говорит о причинноследственных зависимостях между ними. Оно свидетельствует лишь о том, что изменениям одного признака сопутствуют определенные изменения другого. При этом является ли исследуемый признак причиной изменения другого исследуемого признака, или причиной является какой-то не учтенный третий признак, не известно. Направление корреляции: 1.положительная (прямая); 2.отрицательная (обратная); 3.нулевая. Корреляция является положительной (прямой), если увеличение одной переменной связано с увеличением другой переменной. Например, чем выше тревожность, тем выше риск заболеть язвой желудка. Корреляция является отрицательной (обратной), если увеличение одной переменной связано с уменьшением другой. Например, чем выше уровень страха, тем меньше шансов занять доминирующее положение в группе. Корреляция является нулевой, если отсутствует связь между переменными. Например, связь между ростом учеников и их успеваемостью отсутствует. Форма корреляции: 1.линейная; 2.нелинейная. Связь линейная, если с увеличением или уменьшением одной переменной вторая переменная в среднем также либо растет, либо убывает. Например, связь между количеством тренировок на учебном тренажере и количеством правильно решаемых задач в контрольной сессии является линейной. Связь нелинейна, если при увеличении одной величины характер изменения другой величины нелинеен, а описывается другими законами. Например, связь между уровнем мотивации и эффективностью выполнения задачи не является линейной. При повышении мотивации эффективность выполнения задачи сначала растет, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности. 59 Корреляцию можно количественно измерить. Сила или теснота корреляционной связи между признаками выражается величиной, называющейся коэффициентом корреляции. Обозначается 𝑟. Значения данного коэффициента могут находиться в диапазоне: от -1 до +1. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Классификация корреляционных связей по их силе: 1) сильная, или тесная |𝑟| ≥ 0,7 2) средняя 0,5 ≤ |𝑟| < 0,7 3) умеренная 0,3 ≤ |𝑟| < 0,5 4) слабая 0,2 ≤ |𝑟| < 0,3 5) очень слабая |𝑟| ≤ 0,2 Возможные варианты связей, соответствующие им коэффициенты корреляции и их интерпретации изобразим на диаграммах рассеивания: Коэффициенты корреляции характеризуются не только силой, но и значимостью. Чтобы установить значимость корреляционной связи необходимо дополнительно выполнить проверку статистических гипотез с указанием уровня значимости. Н0: корреляционная связь незначимая; Н1: корреляционная связь значимая. Сильная корреляция может оказаться случайной при малом объеме выборки, а слабая корреляция может оказаться высокозначимой при большом объеме выборки. Коэффициенты корреляции. Если необходимо установить, существует ли корреляционная связь между двумя исследуемыми признаками, то нужно вначале выбрать меру связи, затем рассчитать ее величину и сделать выводы. Выбор меры связи зависит от шкалы измерения исследуемых признаков. Первый исследуемый признак (переменную) обозначим за Х. Второй исследуемый признак (переменную) обозначим за У. Соотношения между типами шкал и мерами связи: 60 Тип шкалы переменная Х переменная У дихотомическая дихотомическая (номинальная) (номинальная) ранговая, ранговая, интервальная интервальная или отношений или отношений ранговая ранговая интервальная или отношений интервальная или отношений Мера связи коэффициент 𝜑 коэффициент Спирмена коэффициент Кенделла коэффициент Пирсона Метод ранговой корреляции Спирмена. Если исследователь хочет установить, есть ли связь между исследуемыми признаками, то можно начать с расчета коэффициента ранговой корреляции Спирмена. Основанием для выбора этого коэффициента служат его особенности: -универсальность, -простота, -широкие возможности в решении разного типа задач. Универсальность проявляется в том, что он применим к любым количественно измеренным или ранжируемым данным (в том числе и качественным данным, измеренным в ранговой шкале). Простота выражается в простоте вычисления коэффициента. Уникальность метода состоит в том, что он позволяет сопоставлять не только индивидуальные показатели (наблюдения), но и индивидуальные иерархии, что недоступно ни одному из других статистических методов. Например, испытуемые могут сами проставить иерархии своих предпочтений (ценностей) и можно исследовать между ними связь. Коэффициент ранговой корреляции рекомендуется применять в тех случаях, когда необходимо проверить, согласованно ли изменяются разные признаки у одного и того же испытуемого, насколько совпадают индивидуальные ранговые показатели у двух отдельных испытуемых или у испытуемого и группы? 1.Назначение критерия. Метод ранговой корреляции Спирмена позволяет определить силу и направление корреляционной связи между двумя признаками или двумя иерархиями признаков. Коэффициент ранговой корреляции Спирмена относится к непараметрическим показателям связи между переменными, измеренными, по крайней мере, в ранговой шкале. 2.Гипотезы. Н0: между переменными (иерархиями) не наблюдается статистически значимая связь Н1: между переменными (иерархиями) наблюдается статистически значимая связь 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1. Показатели ранжируем отдельно по каждому из признаков, выбрав одинаковый порядок ранжирования. 2. Коэффициент ранговой корреляции Спирмена вычисляем по формуле: 6 ∙ ∑ 𝑑2 𝑟 =1− , 𝑛 ∙ (𝑛2 − 1) где 𝑑 – это разность рангов, символ Σ - означает сумму, а 𝑛 - число пар наблюдений или иерархий. Случай одинаковых рангов. 61 Коэффициент ранговой корреляции Спирмена при большом количестве одинаковых рангов по одной или обеим переменным дает завышенное значение. Если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги. В этом случае коэффициент корреляции Спирмена вычисляем по формуле: 6 ∙ ∑ 𝑑 2 + 𝑑1 + 𝑑2 + 𝑑3 𝑟 =1− , 𝑛 ∙ (𝑛2 − 1) 𝑡 3 −𝑡 𝑘 3 −𝑘 𝑑1 = 12 , 𝑑2 = 12 , t - число одинаковых рангов для первого признака; 𝑘 – число одинаковых рангов для второго признака; если имеется две группы одинаковых рангов для какого-либо признака: (𝑙 3 − 𝑙) + (𝑚3 − 𝑚) 𝑑3 = 12 𝑙 – число одинаковых рангов в первой группе ранжируемого признака, 𝑚 – число одинаковых рангов во второй группе ранжируемого признака. 3. Выполняем предварительные выводы: Наблюдается ли корреляционная связь между признаками или нет? Какова сила (теснота) этой связи: сильная, умеренная или слабая? Какая это связь: положительная, отрицательная или нулевая? 4. Эмпирическое значение обозначаем, как модуль вычисленного коэффициента ранговой корреляции: 𝑟эм = |𝑟|. Определение критического значения. Критическое значение зависит от выбранного уровня значимости и числа пар экспериментальных данных 𝑛. Таблица критических значений для метода ранговой корреляции Спирмена представлена в Таблице №6 (см. Приложение). 4. Правило сравнения эмпирического и критического значений. Н0 принимается, если 𝑟эмп < 𝑟кр . Н0 отклоняется, если 𝑟эмп ≥ 𝑟кр . Критическая область располагается справа, а доверительная область слева. 5.Ограничения критерия. Должно быть не менее 5 и не более 40 пар наблюдений (такие значения доступны для Таблицы №6). Пример. Определить, наблюдается ли статистически значимая связь между ранговыми оценками качеств личности, входящими в представление испытуемого о своем «Я реальном» и «Я идеальном»? Качества «Я реальное» «Я идеальное» личности 7 ответственность 1 1 общительность 5 3 настойчивость 7 2 энергичность 6 5 жизнерадостность 4 4 терпеливость 3 6 решительность 2 Выполним исследование по этапам: 1.Формулировка статистических гипотез. Н0: между ранговыми оценками качеств личности испытуемого не наблюдается статистически значимая связь. 62 Н1: между ранговыми оценками качеств личности испытуемого наблюдается статистически значимая связь. 2.Выбор статистического метода. Для установления статистически значимой связи между двумя рангами качеств личности выберем метод ранговой корреляции Спирмера. 3.Вычисление эмпирического значения. 1. Показатели качеств личности уже проранжированны. 2. Расчеты запишем в таблице и вычислим коэффициент корреляции Спирмена. «Я «Я Разность Квадрат реальное» идеальное» рангов разности Ранг X Ранг Y 𝒅 рангов 𝒅𝟐 7 1 6 36 1 5 -4 16 3 7 -4 16 2 6 -4 16 5 4 1 1 4 3 1 1 6 2 4 16 сумма 0 102 6 ∙ ∑ 𝑑2 6 ∙ 102 𝑟 =1− = 1− = −0,82, 2 𝑛 ∙ (𝑛 − 1) 7 ∙ (72 − 1) 3. Сделаем предварительные выводы: Между оценками качеств личности наблюдается корреляционная связь. Сила (теснота) этой связи сильная. Связь отрицательная. 4. Вычислим эмпирическое значение 𝑟эм = |𝑟| = |−0,82| = 0,82. 4.Нахождение критического значения. Число пар экспериментальных данных 𝑛 = 7. По Таблице №6 (см. Приложения): 𝑟кр1 = 0,78 для уровня значимости 𝑝 = 0,05; 𝑟кр2 = 0,94 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. при 𝑝 = 0,05, 𝑟эмп = 0,82 ≥ 𝑟кр1 = 0,78; при 𝑝 = 0,01, 𝑟эмп = 0,82 < 𝑟кр2 = 0,94; 6.Формулировка принятия решения. Гипотеза Н0 отклоняется и принимается гипотеза Н1 на уровне значимости р = 0,05 и, одновременно, гипотеза Н0 принимается на уровне значимости р = 0,01. Только на уровне значимости р = 0,05 установлено, что между оценками качеств личности испытуемого наблюдается статистически значимая тесная отрицательная связь. Можно предположить, что у испытуемого низкая самооценка, поскольку большей величине «Я реального» соответствует меньшая величина «Я идеального». Пример. Психолог, используя тест умственного развития (ШТУР), проводит исследование интеллекта у группы учащихся 9 класса, одновременно с этим он просит учителей литературы и математики провести ранжирование этих же учащихся по показателям умственного развития. Требуется определить, как связаны между собой объективные показатели умственного развития (данные ШТУРа) и экспертные оценки учителей? Ранги тестирования Экспериментальные Экспериментальные с помощью ШТУРа оценки учителей по оценки учителей по 63 6 7 4 5 9 12 2,5 2,5 10 8 11 1 математике литературе 5 10 8 4 6 8 2 3 8 11 12 1 5 8 7 11 3 6 11 11 1 3 3 9 Выполним исследование по этапам: 1.Формулировка статистических гипотез. А) Н0:между объективными показателями умственного развития и экспертными оценками учителя по математике не наблюдается статистически значимая связь. Н1:между объективными показателями умственного развития и экспертными оценками учителя по математике наблюдается статистически значимая связь. Б) Н0:между объективными показателями умственного развития и экспертными оценками учителя по литературе не наблюдается статистически значимая связь. Н1:между объективными показателями умственного развития и экспертными оценками учителя по литературе наблюдается статистически значимая связь. 2.Выбор статистического метода. Для установления статистически значимой связи между рангами умственного развития и экспертных оценок учителей выберем метод ранговой корреляции Спирмера. 3.Вычисление эмпирического значения. 1. Показатели умственного развития и экспертные оценки учителей уже проранжированны. 2. Расчеты запишем в таблице и вычислим коэффициент корреляции Спирмена. Введем обозначения: 𝑋 – показатели тестирования с помощью ШТУРа; 𝑌 – экспериментальные оценки учителя по математике; 𝑍 - экспериментальные оценки учителя по литературе. Ранг X Ранг Y Ранг Z 6 7 4 5 9 12 2,5 2,5 10 8 11 5 10 8 4 6 8 2 3 8 11 12 5 8 7 11 3 6 11 11 1 3 3 𝒅 (между X и Y) 1 -3 -4 1 3 4 0,5 -0,5 2 -3 -1 64 𝒅 (между X и Z) 1 -1 -3 -6 6 6 -8,5 -8,5 9 5 8 𝒅𝟐 (между X и Y) 1 9 16 1 9 16 0,25 0,25 4 9 1 𝒅𝟐 (между X и Z) 1 1 9 36 36 36 77,25 77,25 81 25 64 1 1 сумма 9 0 0 -8 0 0 66,5 64 471,5 При ранжировании переменных X,Y,Z встречаются одинаковые ранги. При расчете коэффициента Спирмена введем поправку. Для переменной X два одинаковых ранга 𝑡 = 2: 𝑡 3 − 𝑡 23 − 2 𝑑1 = = = 0,5. 12 12 Для переменной Y три одинаковых ранга 𝑘 = 3: 𝑘 3 − 𝑘 33 − 3 𝑑2 = = = 2. 12 12 Для переменной Z две группы по три одинаковых ранга 𝑙 = 3, 𝑚 = 3: (𝑙 3 − 𝑙) + (𝑚3 − 𝑚) (33 − 3) + (33 − 3) 𝑑3 = = = 4. 12 12 А) рассчитаем коэффициент корреляции Спирмена между X и Y: 6 ∙ ∑ 𝑑2 + 𝑑1 + 𝑑2 + 𝑑3 6 ∙ 66,5 + 0,5 + 2 𝑟 =1− =1− = 0,767, 2 𝑛 ∙ (𝑛 − 1) 12 ∙ (122 − 1) Замечание. Коэффициент корреляции Спирмена без поправки: 6 ∙ ∑ 𝑑2 6 ∙ 66,5 𝑟 =1− =1− = 0,768. 2 𝑛 ∙ (𝑛 − 1) 12 ∙ (122 − 1) При небольшом количестве одинаковых рангов величины коэффициентов с поправкой и без поправки отличаются незначительно и можно поправку не вводить. Б) рассчитаем коэффициент корреляции Спирмена между X и Z: 6 ∙ ∑ 𝑑 2 + 𝑑1 + 𝑑2 + 𝑑3 6 ∙ 471,5 + 0,5 + 4 𝑟 =1− =1− = −0,651, 2 𝑛 ∙ (𝑛 − 1) 12 ∙ (122 − 1) 3. Сделаем предварительные выводы: А) Между рангами умственного развития и экспертных оценок учителя по математике наблюдается корреляционная связь. Сила (теснота) этой связи сильная. Связь положительная. Б) Между рангами умственного развития и экспертных оценок учителя по литературе наблюдается корреляционная связь. Сила (теснота) этой связи средняя. Связь отрицательная. 4. Вычислим эмпирическое значение: А) 𝑟эм = |𝑟| = |0,767| = 0,767. Б) 𝑟эм = |𝑟| = |−0,651| = 0,651. 4.Нахождение критического значения. Число пар экспериментальных данных 𝑛 = 12. По Таблице №6 (см. Приложения): 𝑟кр1 = 0,58 для уровня значимости 𝑝 = 0,05; 𝑟кр2 = 0,73 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. А) при 𝑝 = 0,05, 𝑟эмп = 0,767 ≥ 𝑟кр1 = 0,58; при 𝑝 = 0,01, 𝑟эмп = 0,767 ≥ 𝑟кр2 = 0,73; Б) при 𝑝 = 0,05, 𝑟эмп = 0,651 ≥ 𝑟кр1 = 0,58; при 𝑝 = 0,01, 𝑟эмп = 0,651 < 𝑟кр2 = 0,73; 6.Формулировка принятия решения. А) Гипотеза Н1 принимается на уровне значимости р = 0,01. 65 Между объективными показателями умственного развития (данные ШТУРа) и экспертными оценками учителя по математике наблюдается статистически значимая тесная положительная связь. Чем выше экспертные оценки учащихся по тесту ШТУР, тем выше их экспертные оценки учителем по математике. Б) Гипотеза Н1 принимается только на уровне значимости р = 0,05. Между объективными показателями умственного развития (данные ШТУРа) и экспертными оценками учителя по литературе наблюдается статистически значимая средняя отрицательная связь. Чем выше экспертные оценки учащихся по тесту ШТУР, тем ниже их экспертные оценки учителем по литературе. Метод линейной корреляции Пирсона Еще одним методом для выявления связи между признаками является метод линейной корреляции Пирсона. Он является параметрическим и для количественных данных может оказаться более мощным для обоснования статистически значимой связи. Мерой связи между признаками также будет являться коэффициент корреляции. Перед вычислением коэффициента корреляции рекомендуется для собранных данных изобразить диаграмму рассеивания. Визуально по диаграмме можно определить, наблюдается ли между признаками связь или нет? При этом, связь между разными признаками может наблюдаться как линейная, так и нелинейная. Метод линейной корреляции Пирсона эффективен при линейной связи, но становится неэффективен при нелинейной связи. 1.Назначение критерия. Метод линейной корреляции Пирсона позволяет определить силу и направление линейной корреляционной связи между двумя признаками. Коэффициент линейной корреляции Пирсона относится к параметрическим показателям связи между переменными, измеренными в интервальной шкале или шкале отношений. 2.Гипотезы. Н0: между переменными не наблюдается статистически значимая линейная связь Н1: между переменными наблюдается статистически значимая линейная связь 3. Подсчет эмпирического и критического значений. Подсчет эмпирического значения. 1. Коэффициент линейной корреляции Пирсона вычисляем по формуле: 𝑥 ∙ 𝑦 − 𝑥̅ ∙ 𝑦̅ ̅̅̅̅̅̅ 𝑟= , 𝜎𝑥 ∙ 𝜎𝑦 где 𝑥̅ – среднее арифметическое первой переменной X; 𝑦̅ – среднее арифметическое второй переменной Y; 𝜎𝑥 - стандартное отклонение первой переменной X; 𝜎𝑦 - стандартное отклонение второй переменной Y. Также можно вычислять по преобразованной формуле: 𝑛 ∙ ∑ 𝑥𝑦 − ∑ 𝑥 ∙ ∑ 𝑦 𝑟= , √(𝑛 ∙ ∑ 𝑥 2 − (∑ 𝑥)2 ) ∙ (𝑛 ∙ ∑ 𝑦 2 − (∑ 𝑦)2 ) 2. Выполняем предварительные выводы: Наблюдается ли корреляционная связь между признаками или нет? Какова сила (теснота) этой связи: сильная, умеренная или слабая? Какая это связь: положительная, отрицательная или нулевая? Выводы выполняются аналогично, как для метода ранговой корреляции Спирмена. 3. Эмпирическое значение обозначаем, как модуль вычисленного коэффициента линейной корреляции: 𝑟эм = |𝑟|. 66 Определение критического значения. Критическое значение зависит от выбранного уровня значимости и числа степеней свободы: 𝑘 = 𝑛 − 2. Сила (теснота) этой связи средняя. Связь положительная. 3. Вычислим эмпирическое значение: 𝑟эм = |𝑟| = |0,669| = 0,669. 4.Нахождение критического значения. Число пар экспериментальных данных 𝑛 = 20. Число степеней свободы: 𝑘 = 20 − 2 = 18 По Таблице №6 (см. Приложения): 𝑟кр1 = 0,44 для уровня значимости 𝑝 = 0,05; 𝑟кр2 = 0,56 для уровня значимости 𝑝 = 0,01. 5.Сравнение критического и эмпирического значений. при 𝑝 = 0,05, 𝑟эмп = 0,669 ≥ 𝑟кр1 = 0,44; при 𝑝 = 0,01, 𝑟эмп = 0,669 ≥ 𝑟кр2 = 0,56; 6.Формулировка принятия решения. Гипотеза Н1 принимается на уровне значимости р = 0,01. Между средним временем решения наглядно-образных заданий и вербальных заданий тестов наблюдается средняя положительная корреляционная связь. Чем выше время решения наглядно-образных задач, тем выше время решения вербальных задач, и наоборот. Упражнения 1. Применив метод ранговой корреляции Спирмера определить, имеется ли статистически значимая связь между результатами ЕГЭ по математике и физике для группы учащихся? Количество баллов ЕГЭ по физике – 𝑋 Количество баллов ЕГЭ по математике – 𝑌 95 90 86 82 75 75 64 60 57 50 𝑿 92 94 83 80 55 60 45 72 61 70 𝒀 2. Применив метод ранговой корреляции Спирмера определить, имеется ли статистически значимая связь между показателями сфорсированности отношения к здоровью между старшеклассниками и их родителями? Показатели (баллы) учащегося – 𝑋 Показатели (баллы) родителей учащегося – 𝑌 𝑿 14 11 18 17 15 24 18 18 18 17 13 22 15 17 14 27 19 𝒀 23 27 23 21 27 19 28 19 21 19 19 19 28 14 19 21 23 3. Применив метод ранговой корреляции Спирмера определить, существует ли статистически достоверная связь между самооценкой работников и их межличностными отношениями в педагогическом коллективе? Балл по самооценке работником – 𝑋 Балл по оценке работником психологического климата – 𝑌 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 𝑿 0, 1 2 2 2 2 3 3 3 3 3 3 4 4 4 4 5 5 5 3 4 1 9 1 6 1 5 2 1 2 -6 2 2 -2 6 -6 𝒀 1 8 4 2 0 6 6 1 1 3 1 0 1 67 4. Имеются результаты ежемесячных наблюдений за состоянием погоды и посещаемостью кинотеатра, парка и бассейна. Применив метод линейной корреляции Пирсона определить, имеется ли статистически значимая связь: а) между состоянием погоды и посещаемостью кинотеатра? б) между состоянием погоды и посещаемостью парка? в) между состоянием погоды и посещаемостью бассейна? Число ясных дней 8 14 20 25 20 15 Число посетителей кинотеатров 495 503 380 305 348 465 Число посетителей парка 132 348 643 865 743 541 Число посетителей бассейна 164 182 153 203 169 199 5. Имеются следующие результаты группы студентов: средний балл сессии студента (по 10-бальшой шкале), количество пропусков студентом в месяц, балл уровня интеллекта IQ студента и время, проведенное студентом в социальных сетях (часов в день). Определить, имеется ли статистически значимая связь: а) между средним баллом сессии и количеством пропусков в месяц? б) между средним баллом сессии и количеством баллов IQ? в) между средним баллом сессии и количеством времени, проведенном в социальных сетях? Метод корреляции выбрать самостоятельно. Средний Количество балл пропусков сессии в месяц 7,4 3 6,7 11 5,2 4 4,8 0 8,6 1 8,3 0 8,6 0 7 3 9,5 0 5,3 0 7,5 3 8,7 0 6,2 2 5,5 2 4,9 3 5,2 7 5 0 5,9 0 5,1 2 5,6 3 IQ 104 110 105 148 160 125 143 111 134 101 117 164 94 99 86 103 105 85 100 88 68 Время проведенное в соц.сетях, часов в день 2,1 1,4 1,8 1,7 1,5 1,4 1,1 1,4 1,2 1,8 1,7 1,8 2,1 1,7 2,1 1,8 1,8 2,1 2,1 2 Индивидуальная работа Вариант 1 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 2 2 2 3 4 2 5 3 2 3 3 5 5 2 2 3 4 5 4 3 3 5 2 3 5 5 5 5 4 5 3 3 3 2 5 2 4 5 2 2 2 2 4 3 4 2 2 5 5 3 5 4 3 2 3 2 3 4 5 2 2 3 5 2 5 4 2 4 3 4 5 3 4 4 5 4 4 5 4 3 4 2 2 5 3 2 4 5 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 49 79 45 55 66 60 66 64 50 80 82 80 38 54 67 34 80 74 53 79 53 52 56 68 77 45 64 53 52 51 58 85 57 47 49 28 66 31 59 100 93 38 46 52 69 70 70 58 54 41 73 59 64 55 56 61 48 53 59 55 64 60 67 75 59 50 65 71 50 69 30 52 54 61 71 71 69 66 80 64 56 61 48 79 53 78 84 56 72 51 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 39 28 64 42 70 73 58 42 58 67 64 89 77 63 62 2 класс 42 49 53 54 81 60 53 66 69 28 88 36 42 22 30 1 класс 56 46 64 60 54 2 класс 52 58 43 53 62 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 62 66 27 30 59 65 35 35 57 62 26 28 29 28 69 36 44 53 46 49 59 42 47 49 54 28 34 31 30 18 18 До 8 После 48 49 51 50 35 40 51 50 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 20 «3» 31 22 «4» 44 26 «5» 41 22 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 124 116 116 116 Дети 128 104 128 110 Родители 88 137 102 108 141 133 Дети 91 126 85 114 147 121 105 114 122 118 120 103 101 122 104 123 100 104 119 95 111 114 122 129 94 125 Вариант 2 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 5 2 4 2 2 4 3 3 2 3 5 5 3 5 4 2 5 4 4 5 2 5 4 2 2 2 2 5 3 4 4 4 4 2 2 5 5 2 4 2 4 3 2 4 5 2 3 4 3 4 2 5 5 2 3 5 5 4 2 3 4 3 4 4 4 5 2 4 2 5 2 3 4 5 2 4 4 4 5 3 2 5 2 4 3 5 5 5 2 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 70 83 51 54 66 84 62 57 44 35 59 50 23 49 28 63 57 31 55 61 67 69 72 83 35 65 71 88 28 40 59 49 54 57 48 52 51 41 80 85 71 35 56 60 38 70 67 61 54 62 56 53 45 53 74 68 59 62 74 67 54 48 36 42 18 44 70 63 59 61 66 59 69 49 79 46 59 66 67 71 82 43 53 80 51 84 65 36 70 66 62 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 2 класс 1 кл 63 45 2 кл 36 72 60 66 64 81 33 56 59 66 74 49 32 60 84 70 55 74 48 52 74 73 66 67 43 51 42 70 69 63 81 66 61 51 61 82 50 33 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 25 После 23 40 46 41 49 42 41 52 51 47 53 52 48 42 48 62 62 24 28 37 41 37 40 20 26 32 37 33 36 36 43 36 32 31 34 41 44 41 37 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 29 18 «3» 37 23 «4» 37 23 «5» 47 26 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; 71 б) метод линейной корреляции Пирсона. Родители Дети Родители 92 116 Дети 68 114 106 104 119 97 111 137 111 115 132 102 116 120 78 122 147 93 135 121 105 96 138 102 125 86 116 126 117 100 143 102 107 84 113 116 Вариант 3 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 4 2 2 2 4 2 4 2 4 5 4 5 3 2 5 3 5 5 5 3 5 4 5 5 5 2 3 4 2 5 5 4 2 5 2 3 2 3 5 4 5 3 2 4 2 5 4 4 5 3 2 5 3 3 3 2 4 4 3 5 2 4 5 2 4 2 3 2 4 3 3 2 2 3 4 4 5 2 5 4 3 4 5 3 4 5 5 2 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 58 61 71 46 56 80 81 75 93 52 69 76 77 55 65 73 45 47 56 73 58 79 73 54 57 83 50 46 53 69 72 39 85 63 50 100 89 74 66 58 71 82 55 63 60 69 52 62 67 68 50 48 59 60 75 83 61 52 81 38 48 67 83 66 75 39 57 50 64 62 80 56 53 68 59 56 64 71 79 57 58 77 70 49 47 47 70 69 51 50 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 2 класс 1 класс 43 47 2 класс 47 51 55 62 68 49 51 45 64 51 68 68 59 46 51 41 47 66 43 24 57 33 75 75 45 60 64 66 91 87 42 79 42 53 63 52 62 43 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли 72 проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 16 29 43 54 47 48 55 48 31 43 41 48 22 20 15 26 49 48 29 31 30 44 53 51 50 51 39 34 37 48 23 31 51 59 29 32 63 66 64 78 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? «2» 32 23 1 школа 2 школа «3» 38 26 «4» 31 23 «5» 49 18 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 23 151 Дети 105 159 114 116 117 109 124 93 92 94 102 123 89 110 116 102 97 106 96 107 88 116 104 94 100 115 116 117 124 102 104 115 143 111 104 129 Вариант 4 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 3 5 4 2 4 2 2 5 4 4 5 3 3 2 2 4 4 4 3 5 3 5 4 3 2 5 3 2 2 2 4 4 5 2 3 3 5 5 3 5 2 2 2 2 4 3 5 73 3 5 5 5 3 3 3 4 4 3 5 5 2 3 3 3 3 3 4 3 2 4 5 4 2 4 3 4 3 4 4 5 4 3 5 4 4 5 4 3 3 2 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 45 31 52 45 37 46 45 65 32 58 64 53 49 46 58 57 76 47 37 48 55 76 49 55 67 18 43 88 68 30 55 66 29 45 60 62 36 38 73 60 67 44 36 61 58 56 63 63 54 77 50 52 54 47 56 32 65 37 45 49 41 64 83 68 86 53 75 64 50 68 72 72 65 26 64 48 75 60 68 70 37 70 59 34 53 70 53 65 54 52 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 37 50 55 53 33 56 90 60 59 61 63 40 67 69 74 2 класс 59 68 56 61 62 54 41 69 68 48 60 55 73 50 55 1 класс 4 63 48 48 100 2 класс 74 46 81 59 66 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до 67 после 74 44 53 47 45 66 59 43 47 33 35 46 52 56 63 35 33 32 28 43 51 22 29 37 43 34 47 44 48 29 41 63 60 69 79 33 46 62 63 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 29 24 «3» 39 18 «4» 43 27 «5» 39 21 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? 74 б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 138 118 Дети 121 111 114 105 111 112 110 127 147 152 130 90 120 101 100 130 132 164 133 102 112 107 111 99 128 118 110 120 109 120 102 120 106 115 121 114 Вариант 5 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 5 5 4 5 4 4 4 2 5 3 5 3 3 5 3 5 3 2 4 3 2 5 5 3 3 4 3 2 5 2 3 5 5 3 5 5 3 2 4 2 2 3 2 5 5 3 5 5 4 2 3 2 2 2 4 5 2 2 2 4 3 3 2 5 5 3 4 5 3 5 3 5 2 3 3 3 4 4 2 2 4 3 2 4 5 2 4 3 3 2 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 46 81 60 72 72 60 58 70 75 50 67 61 70 63 73 67 68 84 77 76 60 82 63 66 87 55 52 69 72 71 57 53 50 69 82 51 81 62 64 66 57 73 77 58 66 55 57 66 83 70 70 73 49 84 67 64 72 44 69 59 60 61 61 53 69 64 67 58 63 74 83 82 44 77 56 79 48 88 48 66 55 76 63 57 64 66 94 62 61 89 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: 75 а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 62 44 36 73 66 61 44 76 66 68 43 54 46 55 41 2 класс 77 45 68 55 67 78 55 43 11 52 27 64 40 39 71 1 класс 63 54 89 85 64 2 класс 27 68 65 48 46 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 12 После 2 45 50 14 31 19 30 25 22 15 18 47 43 44 53 45 49 35 42 38 45 32 40 30 31 7 13 40 53 22 28 36 36 33 35 22 30 49 57 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 31 19 «3» 38 25 «4» 41 26 «5» 40 20 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 126 110 Дети 123 98 126 122 112 118 122 124 114 109 107 111 118 116 76 118 120 116 125 126 111 119 125 129 144 117 119 108 112 132 147 109 108 111 113 117 107 Вариант 6 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 4 5 3 3 3 5 5 3 5 5 2 2 3 4 4 2 5 3 4 4 5 2 4 5 3 5 5 2 5 4 4 5 3 5 2 2 2 4 2 5 3 2 5 3 4 2 3 2 4 4 3 2 3 5 5 3 4 5 2 2 5 2 4 3 4 5 3 5 4 5 3 5 4 4 5 5 3 2 3 4 2 4 3 5 5 4 4 2 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 64 38 46 53 52 52 59 69 55 74 36 57 68 75 38 70 49 63 69 37 52 46 52 66 45 40 66 76 48 30 45 40 62 42 69 53 39 60 32 78 24 74 51 74 62 47 50 78 36 40 78 58 51 59 47 61 71 39 40 42 56 37 71 79 31 31 62 47 50 54 76 28 55 60 72 61 35 58 16 78 39 70 64 54 66 48 47 66 66 76 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 58 78 68 62 55 67 59 68 48 80 30 58 77 55 65 2 класс 58 56 72 95 62 68 57 76 52 90 70 75 59 49 91 1 класс 60 54 49 45 47 2 класс 58 72 85 54 65 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 13 6 37 44 41 39 36 27 26 20 47 47 53 66 77 28 32 50 54 44 44 37 33 27 32 29 44 27 38 25 40 До 50 После 41 32 35 37 44 56 62 18 31 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 33 22 «3» 40 26 «4» 42 20 «5» 35 22 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 109 118 Дети 118 111 114 135 107 129 100 122 101 107 116 124 122 114 136 89 100 90 115 110 135 98 103 99 122 144 85 89 164 90 99 94 118 148 93 87 Вариант 7 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 2 5 3 3 4 3 4 4 3 5 4 2 5 3 2 2 5 5 4 2 4 2 5 5 4 4 4 2 2 2 4 5 5 4 4 3 4 4 3 2 3 5 4 4 3 5 5 2 5 3 5 2 3 2 3 3 4 2 4 4 4 3 3 5 5 2 3 5 3 4 4 4 3 4 5 3 2 4 4 3 2 4 4 5 5 4 3 5 2 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; 78 в) вычислить среднее арифметическое и стандартное отклонение. 40 52 72 54 81 57 55 64 75 71 56 73 77 78 72 62 89 64 52 57 88 79 77 80 83 72 60 66 73 53 91 57 67 72 80 74 48 61 76 66 89 65 65 87 63 42 70 94 76 61 58 75 61 78 58 50 70 67 59 72 71 70 71 67 56 76 53 44 55 70 58 50 83 61 47 70 62 79 62 72 66 62 71 60 84 51 64 58 57 78 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 58 78 68 62 55 67 59 68 48 80 30 58 77 55 65 2 класс 58 56 72 95 62 68 57 76 52 90 70 75 59 49 91 1 класс 60 54 49 45 47 2 класс 58 72 85 54 65 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 34 После 39 31 35 45 45 14 25 50 49 42 48 41 41 37 32 39 36 35 38 44 54 13 13 38 24 58 54 48 57 26 33 51 47 36 49 25 32 40 56 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 26 22 «3» 45 16 «4» 43 25 «5» 36 27 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: 79 а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 135 111 104 98 Дети 117 113 99 105 Родители 120 113 80 106 121 99 Дети 119 122 80 102 134 110 132 119 124 113 115 132 128 130 132 136 112 111 155 118 154 130 111 112 Вариант 8 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 5 3 2 4 3 3 3 5 2 5 4 3 2 2 4 3 2 4 2 3 3 2 2 4 5 5 4 4 4 3 3 2 2 5 2 4 5 3 3 4 3 4 3 4 4 4 3 3 4 5 2 4 2 5 5 5 5 2 3 2 2 5 2 3 2 5 2 3 4 2 3 5 4 4 3 2 5 2 4 4 3 3 4 4 5 2 3 2 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 37 53 53 53 47 79 75 66 35 58 55 20 40 55 63 49 68 73 26 60 51 76 17 54 68 32 45 30 65 68 49 53 55 61 44 27 57 51 63 26 64 59 27 56 87 47 78 70 46 57 48 57 68 50 75 42 41 53 28 13 45 38 48 57 57 74 45 69 70 42 57 36 60 79 76 43 73 73 74 29 70 66 66 63 23 59 71 56 71 56 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 2 класс 1 класс 62 74 2 класс 50 57 Задача 4 51 69 53 48 43 85 39 26 62 69 44 64 58 65 65 65 51 61 80 56 74 70 64 58 60 61 66 53 64 67 46 53 66 58 75 86 53 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 17 После 28 28 29 41 43 37 42 30 39 25 20 29 33 44 43 38 41 33 36 25 32 28 25 32 44 26 25 30 41 25 41 33 52 29 29 28 36 29 32 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 35 19 «3» 35 20 «4» 42 24 «5» 38 27 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 112 116 Дети 113 129 124 121 116 142 111 112 91 93 93 117 131 115 147 127 110 97 97 100 108 93 120 105 102 148 115 137 103 93 120 100 93 142 111 140 Вариант 9 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 4 2 4 2 3 3 4 5 5 5 5 3 4 3 4 2 5 5 5 3 3 3 4 2 2 5 4 2 2 4 3 81 4 4 2 4 2 3 3 4 4 5 5 5 3 2 5 3 3 4 3 4 5 5 2 5 2 2 5 3 4 2 4 2 5 4 5 5 3 3 2 4 3 5 2 3 5 5 5 4 2 4 4 5 3 3 3 5 4 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 71 57 60 68 84 60 60 70 56 55 64 67 69 100 53 42 68 76 77 85 58 96 61 68 51 79 59 77 77 66 69 65 65 63 78 78 72 85 85 75 65 50 63 63 68 67 56 59 52 51 74 69 66 57 65 89 65 55 73 85 60 73 60 56 83 69 68 70 75 72 67 67 83 55 52 63 65 63 78 65 56 76 61 58 50 54 68 78 62 53 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 64 100 56 38 86 55 68 71 62 63 58 50 38 61 72 2 класс 42 49 70 58 32 50 61 64 28 90 38 61 79 18 46 1 кл 73 80 59 73 56 2 кл 39 30 56 57 68 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 15 23 27 30 30 19 32 30 31 36 39 39 48 44 30 29 24 36 23 23 44 39 29 30 39 44 38 50 32 38 11 19 46 53 18 28 40 41 19 25 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 20 «3» 39 26 82 «4» 42 23 «5» 35 21 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 123 120 Дети 115 111 126 137 109 108 124 116 118 106 118 112 134 133 130 100 105 79 126 133 109 98 97 88 128 135 171 146 108 125 122 166 150 118 128 122 Вариант 10 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 3 2 4 3 2 4 3 3 3 4 5 4 2 5 4 4 5 4 4 4 3 5 4 3 4 5 2 2 2 3 2 2 4 4 2 4 5 4 2 5 3 2 2 5 5 2 3 4 2 5 5 4 2 3 4 3 5 3 3 3 4 3 4 4 3 2 4 3 4 4 5 5 4 4 4 5 4 4 3 5 4 2 4 4 2 2 4 3 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 58 43 21 48 62 46 68 54 61 44 75 63 39 19 62 52 21 55 10 66 74 49 52 62 41 30 27 56 67 60 41 60 47 24 29 69 55 59 40 61 61 42 60 72 56 51 68 34 Задача 3 83 61 36 58 51 65 51 86 29 28 89 38 67 72 71 42 52 58 23 75 61 52 36 38 44 39 49 71 78 37 40 22 55 50 48 38 71 63 56 39 52 54 56 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 63 61 73 35 68 43 70 64 87 71 61 72 56 58 2 класс 60 52 70 29 35 54 62 51 73 92 75 59 65 62 1 кл 63 68 81 51 87 2 кл 58 47 80 52 76 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 48 49 31 39 17 18 43 44 22 28 46 62 53 58 37 40 53 62 24 41 21 32 7 10 43 51 28 29 35 34 28 31 52 59 20 23 47 48 43 41 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 22 «3» 36 19 «4» 38 27 «5» 42 22 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 125 118 Дети 129 128 107 115 122 110 130 121 122 136 124 109 131 137 84 109 110 110 106 109 132 93 112 107 127 143 85 102 107 101 103 135 135 114 97 127 149 Вариант 11 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 4 3 2 5 2 4 3 3 5 2 5 2 5 3 3 3 2 2 2 3 5 3 5 3 5 2 3 5 3 3 4 3 5 3 3 2 4 4 3 5 3 2 2 4 2 5 4 5 2 3 4 5 2 4 5 5 3 2 5 4 5 3 3 5 2 2 5 2 4 3 5 3 4 2 5 2 2 5 3 5 2 2 4 4 5 4 3 2 2 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 59 81 71 59 67 66 91 54 55 51 61 36 66 47 74 58 41 55 72 51 53 64 39 61 68 61 82 78 41 66 59 71 63 51 60 49 80 53 64 73 77 49 80 67 61 52 66 55 56 49 77 51 82 51 61 48 59 67 74 69 37 46 46 47 74 38 79 68 81 63 88 79 50 47 52 62 54 60 70 82 52 59 77 61 56 67 58 77 62 56 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 72 52 43 33 55 77 52 69 43 77 60 55 30 39 2 класс 63 69 47 74 84 54 99 48 84 56 60 65 55 65 1 кл 67 56 66 26 42 2 кл 57 53 59 66 67 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 47 43 33 39 50 49 46 54 23 25 32 40 39 32 85 23 26 39 48 54 61 40 39 49 62 44 52 32 30 42 56 35 42 43 56 45 41 42 56 17 28 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 36 17 «3» 40 24 «4» 45 25 «5» 29 24 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 98 109 77 126 120 121 121 121 115 Дети 107 117 95 123 106 121 126 119 96 Родители 102 114 132 117 105 125 123 125 115 109 Дети 81 118 132 114 98 109 124 136 111 122 Вариант 12 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 3 5 5 2 2 4 4 2 3 2 5 4 5 4 5 3 4 2 3 2 4 2 4 5 2 3 2 5 3 2 4 5 3 2 3 3 5 4 5 5 4 5 5 4 5 3 4 5 5 5 4 2 5 2 3 4 4 3 2 2 5 3 5 2 4 3 2 3 4 5 5 5 4 2 3 4 5 3 4 3 4 4 4 2 4 2 2 3 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 86 62 67 56 48 47 75 72 41 64 73 57 56 63 47 40 48 52 62 74 48 23 53 58 60 56 45 40 72 38 67 61 41 42 54 40 73 66 41 46 55 73 57 81 49 67 46 60 49 76 77 39 64 83 69 75 73 64 67 53 67 52 55 51 43 63 48 57 74 64 61 74 65 67 68 72 63 64 64 52 70 57 75 51 47 52 88 51 55 78 94 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 63 54 69 39 49 34 56 74 61 57 31 70 53 61 2 класс 61 44 48 75 63 30 68 45 75 67 47 47 31 41 1 кл 42 26 54 42 95 2 кл 76 66 44 31 54 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 35 32 43 52 46 48 36 40 37 37 51 62 42 52 28 36 43 54 6 18 15 27 22 28 11 27 40 47 46 52 43 52 13 11 59 62 41 42 22 24 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 20 «3» 43 20 «4» 43 23 «5» 30 27 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; 87 б) метод линейной корреляции Пирсона. Родители Дети Родители 132 121 Дети 149 134 125 143 103 103 113 109 116 151 141 101 104 120 103 122 109 102 137 89 103 121 130 102 94 131 87 102 125 143 111 104 128 107 105 118 Вариант 13 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 4 5 3 4 4 2 3 5 5 5 4 5 5 2 2 3 4 3 2 3 3 4 4 5 3 2 3 3 2 3 2 3 3 4 3 2 3 5 2 2 2 4 4 2 5 3 4 2 3 5 3 4 2 4 5 3 5 5 2 4 3 3 5 4 2 5 4 3 3 5 4 2 4 4 3 3 2 5 2 3 4 2 3 5 2 4 2 2 4 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 61 59 76 41 51 65 54 73 51 70 73 46 79 66 50 78 67 74 48 36 59 65 58 62 65 63 58 62 42 45 38 45 53 39 66 60 65 79 45 84 63 69 76 77 65 73 73 63 76 62 65 73 45 95 56 51 45 68 52 49 43 99 64 59 87 57 39 47 71 74 53 67 56 60 64 51 52 41 65 76 55 53 34 66 78 67 61 76 75 55 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 57 69 22 65 73 58 60 61 76 76 45 60 67 57 2 класс 64 67 93 44 76 84 79 57 40 55 71 60 56 67 1 кл 67 49 51 55 100 2 кл 65 63 47 90 54 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли 88 проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 54 После 67 37 38 26 26 30 32 42 46 16 12 39 44 24 36 46 56 34 44 30 37 31 43 29 39 1 4 47 59 31 37 40 43 38 44 43 43 24 30 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 32 22 «3» 40 26 «4» 35 24 «5» 43 18 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 128 136 Дети 122 135 135 99 93 122 140 120 95 123 139 118 86 133 153 130 78 131 132 130 139 147 93 94 95 95 77 120 121 86 112 111 91 82 87 91 Вариант 14 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 3 3 4 4 5 5 5 5 3 3 2 5 3 2 5 2 3 3 2 5 3 3 2 2 2 5 5 5 4 3 4 2 3 5 5 2 3 4 2 2 5 3 5 5 4 4 4 89 2 3 5 2 4 2 4 5 3 2 5 2 4 4 2 4 3 2 4 2 5 5 2 4 3 4 5 3 3 3 4 4 2 5 3 5 3 2 5 5 5 4 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 67 68 50 78 75 50 51 48 47 66 62 58 33 53 71 63 46 31 46 51 58 44 51 53 62 37 61 46 48 33 52 43 39 79 37 49 69 76 33 94 50 46 78 67 61 48 58 57 35 65 75 36 28 60 61 53 53 58 35 80 57 74 76 52 42 68 48 68 45 62 34 42 40 35 63 49 61 36 97 41 73 45 67 30 37 52 37 78 49 57 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 84 67 49 50 55 81 47 81 86 51 56 87 75 40 2 класс 68 58 69 63 85 65 74 70 52 77 57 61 59 79 1 кл 57 53 51 65 26 2 кл 80 59 56 92 42 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 30 После 9 27 33 34 46 23 18 40 37 49 54 56 64 47 54 46 51 38 44 44 54 10 12 19 34 42 53 35 28 21 35 30 41 38 41 31 39 49 56 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 32 17 «3» 49 27 «4» 37 24 «5» 32 22 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? 90 б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 126 117 Дети 118 124 129 140 125 115 125 135 115 122 115 111 104 104 114 122 118 112 144 135 132 124 113 112 135 152 121 125 119 111 110 103 111 104 132 106 Вариант 15 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 5 3 4 3 4 4 3 2 3 5 4 5 3 3 4 5 2 3 2 4 4 3 5 4 3 5 2 2 5 5 4 5 3 3 2 3 4 2 4 2 5 3 5 3 5 5 2 4 4 2 2 2 4 5 5 3 5 4 4 3 2 4 3 3 4 3 3 5 2 2 4 2 4 2 2 5 4 4 3 3 2 2 5 5 5 4 4 3 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 46 74 50 89 60 74 71 57 61 69 74 77 82 60 76 54 47 79 68 58 55 43 84 59 55 67 73 72 44 49 64 56 90 70 71 51 36 76 60 62 71 63 74 69 63 53 53 68 52 76 67 75 67 63 64 64 43 59 69 57 46 72 82 65 66 37 59 60 72 80 46 71 65 76 67 54 53 64 71 93 63 32 64 48 56 75 75 57 66 56 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 91 1 класс 35 63 80 56 54 73 83 61 63 49 56 59 55 49 2 класс 85 55 76 54 70 86 87 73 70 64 68 78 60 74 1 кл 43 64 63 45 57 2 кл 73 54 56 70 61 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 31 После 48 49 52 24 23 42 40 40 52 29 33 51 56 28 43 22 32 24 34 56 67 32 36 38 47 48 52 47 55 36 33 27 28 40 45 8 6 36 40 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 30 19 «3» 35 23 «4» 39 28 «5» 46 20 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 90 108 113 88 123 97 105 120 118 Дети 92 96 102 77 120 89 121 113 106 Родители 114 130 110 114 115 75 137 104 109 99 Дети 124 144 93 116 133 88 133 96 101 112 92 Вариант 16 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 4 5 5 2 5 3 5 2 2 5 3 2 4 5 5 2 4 3 3 2 3 4 2 2 3 2 3 4 5 2 2 5 2 5 4 5 5 2 4 2 2 2 2 4 4 3 4 3 5 2 5 2 2 3 4 3 3 4 2 4 2 4 2 2 5 5 4 3 5 4 4 4 2 5 3 2 5 2 4 4 3 2 2 3 2 3 5 4 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 51 53 56 21 81 54 63 74 73 32 65 62 68 57 42 62 61 59 28 50 40 33 70 51 38 35 39 53 23 44 34 77 59 72 43 72 41 34 59 50 71 69 56 50 71 54 54 64 51 62 43 54 31 48 61 17 58 69 63 52 57 73 40 64 2 38 61 62 57 71 60 63 43 27 64 32 62 78 69 32 47 69 51 45 43 27 87 10 56 61 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 67 67 53 73 52 71 47 59 56 40 50 79 75 60 2 класс 57 69 70 30 65 45 56 46 64 60 53 43 55 25 1 кл 43 50 58 47 66 2 кл 85 53 68 61 66 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 43 47 37 42 39 34 37 46 26 21 54 62 40 42 93 62 71 66 65 51 58 38 45 24 23 32 34 41 43 20 34 До 52 После 52 35 45 30 32 37 44 42 57 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? «2» 30 21 1 школа 2 школа «3» 44 23 «4» 44 24 «5» 32 22 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 111 102 Дети 119 119 111 121 139 144 109 95 143 122 83 132 141 131 117 130 144 131 138 113 137 130 97 143 115 152 136 97 118 93 127 112 108 89 134 116 Вариант 17 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 5 2 3 2 3 3 2 3 2 2 5 4 4 3 4 3 4 5 2 2 4 2 3 4 4 5 5 4 2 2 5 3 5 5 3 2 2 5 2 2 4 5 4 2 3 4 4 4 4 5 2 3 5 5 2 3 3 3 4 3 2 3 4 2 2 3 4 2 2 5 3 5 5 4 5 3 2 5 3 4 4 4 5 4 3 3 5 2 2 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 94 67 61 44 66 55 58 71 55 71 74 77 56 62 54 69 71 61 79 67 53 86 67 74 56 76 79 64 75 72 80 37 73 74 61 71 84 58 81 70 71 74 90 92 44 68 61 51 58 69 55 63 53 71 60 72 83 56 72 46 58 57 50 69 65 91 59 72 83 71 64 62 58 90 57 73 76 63 50 72 50 68 78 68 61 57 67 64 65 75 87 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 56 73 92 76 60 56 62 51 55 93 60 77 49 32 2 класс 94 69 62 70 77 66 57 71 92 70 62 66 52 69 1 кл 74 66 64 43 61 2 кл 63 84 65 65 76 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 38 После 57 43 42 29 34 46 42 53 60 20 26 37 49 41 43 40 48 33 37 36 46 43 47 52 67 43 48 39 41 37 43 31 42 37 42 27 29 25 32 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 20 «3» 39 15 «4» 47 25 «5» 30 30 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. 95 Родители Дети Родители 122 129 Дети 112 134 118 116 113 115 128 139 134 122 121 128 145 157 110 111 80 129 92 103 109 107 88 114 103 107 115 92 94 109 79 105 82 93 124 82 Вариант 18 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 4 4 2 4 5 4 4 3 3 4 4 5 4 3 5 2 5 2 3 3 5 4 5 4 5 5 4 4 5 5 2 2 4 4 4 3 3 2 2 3 3 5 3 5 2 2 3 5 5 2 5 3 4 3 4 2 2 2 5 5 4 3 2 3 4 5 5 5 3 5 2 5 4 5 3 4 2 2 5 5 5 3 4 4 2 5 2 5 4 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 38 36 52 24 10 92 56 53 43 68 43 41 45 57 55 68 47 29 45 71 74 29 41 45 38 49 52 39 75 68 30 16 67 50 71 55 32 56 42 54 29 85 62 68 73 33 38 69 41 84 41 70 47 48 61 36 47 45 60 77 46 53 56 54 64 87 59 40 42 58 34 80 45 84 61 49 22 72 77 53 43 63 15 53 26 65 45 71 61 30 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 68 59 41 50 65 65 50 69 64 71 61 74 61 25 2 класс 43 40 58 43 60 21 43 29 40 49 11 48 62 57 1 кл 43 43 56 48 70 2 кл 17 5 79 54 14 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли 96 проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 47 53 40 44 54 56 52 53 30 35 19 28 38 47 38 41 25 30 19 24 26 30 16 13 65 77 40 48 35 38 26 16 40 52 36 34 19 40 58 68 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 31 16 «3» 48 25 «4» 28 27 «5» 43 22 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 134 115 146 116 95 125 100 132 119 Дети 110 101 128 114 97 109 97 159 97 Родители 132 112 117 109 98 121 116 132 116 116 Дети 127 115 97 109 98 132 108 114 120 117 Вариант 19 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 5 2 4 3 2 2 5 5 4 4 4 5 5 4 2 2 3 5 4 4 2 3 4 3 2 2 5 5 5 2 5 3 5 2 2 3 4 3 2 4 5 2 4 3 2 2 3 4 97 3 2 4 2 2 3 5 5 3 4 4 5 5 3 2 2 2 2 2 3 2 3 5 2 5 3 3 5 4 3 5 5 4 2 5 2 4 3 5 2 5 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 65 75 53 69 85 64 89 68 47 71 59 76 72 61 72 60 75 66 53 61 68 56 88 67 61 71 83 64 61 63 64 91 58 66 59 72 59 76 67 69 49 70 61 64 82 49 68 82 90 66 73 82 66 70 51 66 74 90 72 83 73 51 79 73 61 68 82 64 61 62 52 63 76 53 53 62 61 74 61 76 67 70 63 78 55 92 72 63 59 70 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 38 65 75 67 75 77 80 74 65 63 59 39 63 69 2 класс 59 61 40 40 46 57 83 60 65 85 56 76 69 61 1 кл 49 80 81 87 81 2 кл 57 61 50 71 47 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 36 После 7 29 24 41 52 23 23 25 32 38 32 47 49 51 60 21 33 9 8 42 47 41 49 55 56 39 27 47 55 35 43 59 56 13 20 54 51 38 40 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 36 21 «3» 40 26 «4» 46 26 «5» 28 17 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? 98 б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 115 88 125 107 Дети 106 90 136 114 Родители 114 104 103 84 130 104 Дети 128 107 87 79 113 110 100 100 138 159 86 86 91 88 122 125 94 122 122 90 128 99 123 83 Вариант 20 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 4 2 5 2 3 3 2 3 5 2 4 2 4 4 3 4 3 5 5 5 5 5 3 2 3 4 4 5 4 2 3 3 2 4 4 3 2 4 3 3 2 3 2 4 2 4 4 4 5 2 5 4 3 5 5 5 4 5 3 4 2 4 5 5 2 4 4 2 4 2 2 2 2 4 3 3 3 4 4 2 3 5 3 2 5 5 3 3 4 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 61 58 32 57 64 30 44 6 38 65 54 52 61 33 67 53 54 16 44 55 33 52 35 52 38 49 28 57 75 50 39 67 26 71 58 27 34 68 30 62 44 48 45 25 75 14 40 55 49 42 76 22 52 40 64 59 27 82 49 93 47 53 52 52 77 39 64 50 70 44 49 57 65 56 68 35 36 34 80 85 67 65 47 71 56 53 48 45 42 34 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 99 1 класс 61 65 65 84 57 56 60 91 45 51 71 61 72 62 2 класс 59 61 65 26 87 45 52 53 38 44 60 62 78 66 1 кл 56 65 72 55 75 2 кл 41 52 59 19 42 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 30 После 19 23 26 39 38 36 35 56 57 31 45 51 60 33 40 44 59 47 56 40 46 35 39 26 32 20 25 29 45 29 34 37 47 40 44 37 34 50 49 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 32 15 «3» 37 18 «4» 34 28 «5» 47 29 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 133 97 Дети 114 119 124 123 137 142 87 86 92 85 128 107 142 110 132 107 127 161 113 123 102 144 101 134 127 99 127 114 108 120 113 95 117 94 99 108 100 Вариант 21 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 2 5 3 4 4 4 3 5 4 3 3 5 3 2 3 4 2 5 3 2 4 3 4 3 3 4 2 4 2 3 4 2 5 2 2 2 4 3 2 4 2 2 2 5 4 3 2 4 5 5 2 2 5 5 2 3 3 5 4 3 5 5 4 3 2 5 2 3 4 4 5 2 3 5 3 5 4 3 3 2 4 3 3 2 5 4 4 3 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 80 74 63 66 58 58 57 71 65 56 45 75 33 64 60 57 50 58 82 58 39 58 45 70 55 84 49 73 69 69 47 49 46 71 30 60 40 66 53 51 78 65 52 43 80 73 52 51 59 71 95 60 45 57 60 67 75 62 33 65 90 44 53 45 40 35 43 68 58 77 55 67 57 42 65 67 40 37 71 76 64 73 61 67 53 54 58 92 45 63 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 61 65 65 84 57 56 60 91 45 51 71 61 72 62 2 класс 45 60 62 74 75 57 22 53 57 55 72 70 64 39 1 кл 56 65 72 55 75 2 кл 40 72 64 68 61 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 30 39 35 32 45 57 41 58 46 48 25 21 27 33 101 36 39 48 50 38 38 38 45 38 45 60 66 37 52 6 8 До 33 После 40 41 35 44 50 12 17 30 41 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 35 19 «3» 42 20 «4» 35 30 «5» 38 21 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 97 109 110 103 122 106 129 120 128 Дети 107 121 123 111 120 99 137 111 125 Родители 113 113 115 125 114 99 140 103 88 132 Дети 115 113 117 116 84 97 133 111 100 154 Вариант 22 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 5 4 3 2 2 4 5 5 2 3 4 3 3 5 5 5 3 5 3 2 4 4 4 5 3 5 2 4 2 5 5 3 5 4 4 4 5 3 2 2 4 3 3 3 2 2 5 4 2 3 4 3 2 3 2 4 2 5 3 2 3 4 5 5 3 3 2 4 2 3 5 4 4 4 2 2 3 4 4 2 3 3 4 4 2 4 5 2 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 102 68 45 36 60 64 40 65 75 46 51 67 66 64 56 84 52 43 52 82 72 51 53 42 71 63 33 48 77 49 96 65 69 74 51 55 64 56 50 35 79 68 59 76 85 67 73 59 59 38 54 32 46 47 49 28 54 58 64 63 80 57 64 69 38 60 42 60 60 80 61 68 78 66 38 36 76 82 73 46 55 49 60 58 66 48 43 49 60 60 55 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 52 68 72 59 57 56 91 41 65 58 78 50 83 68 2 класс 65 59 67 63 77 68 61 59 60 82 68 63 92 54 1 кл 35 68 55 75 43 2 кл 72 44 66 71 84 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 38 После 42 38 47 45 51 50 44 34 44 32 39 23 26 34 36 46 53 10 17 29 37 22 21 27 28 15 18 18 29 42 45 22 26 54 61 26 21 46 58 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 30 20 «3» 38 21 «4» 47 24 «5» 35 25 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. 103 Родители 104 102 135 133 Дети 101 110 128 163 Родители 104 112 106 103 136 116 Дети 107 77 99 96 140 117 122 125 96 117 116 118 118 108 114 115 118 115 135 105 105 98 156 104 Вариант 23 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 3 3 3 4 3 5 5 4 5 3 2 4 2 4 5 2 4 4 5 2 3 2 3 3 2 3 3 3 2 4 4 4 2 3 4 2 3 4 3 3 5 3 3 5 2 2 4 5 2 2 5 2 5 5 4 5 4 5 2 2 4 2 2 5 3 5 3 3 5 2 3 5 2 5 2 2 5 4 4 5 2 4 5 2 2 2 5 4 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 67 56 84 60 60 75 56 71 83 68 72 66 73 56 61 69 65 71 76 57 66 87 71 60 46 42 64 64 68 54 78 70 60 66 62 60 62 32 62 39 64 48 80 51 48 73 65 52 65 25 55 51 63 72 80 51 73 43 84 71 68 59 54 47 52 65 78 52 41 56 53 66 81 66 50 77 42 53 39 57 74 72 62 45 71 55 65 84 85 72 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 52 67 48 66 70 55 73 45 49 66 78 48 71 61 2 класс 23 51 40 66 48 44 42 59 68 46 57 63 59 60 1 кл 75 54 75 47 45 2 кл 35 30 38 78 64 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли 104 проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 41 После 46 47 61 56 66 50 50 30 30 50 57 26 33 50 49 37 31 36 45 47 56 40 45 38 54 55 53 36 39 58 70 30 28 31 40 52 62 44 41 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 37 18 «3» 42 29 «4» 43 19 «5» 28 24 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 116 121 113 147 126 115 126 Дети 105 118 115 140 121 136 116 Родители 119 111 99 127 113 89 118 124 109 Дети 122 98 88 135 136 87 110 125 103 109 135 117 121 131 133 Вариант 24 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 3 5 3 2 4 2 3 5 4 3 2 3 3 3 5 4 4 2 5 2 3 4 4 2 5 2 4 5 3 2 3 2 4 4 2 5 4 2 5 3 3 4 4 3 3 2 2 105 5 4 3 2 3 5 4 4 5 4 2 4 2 4 5 4 2 4 4 5 3 2 4 2 4 3 4 5 3 4 2 4 4 5 5 3 5 5 3 2 4 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 66 58 74 64 85 65 78 46 37 55 71 84 64 81 52 67 85 68 55 29 49 26 67 74 25 70 45 46 47 76 60 92 58 61 45 53 53 63 44 62 36 53 44 70 60 54 44 35 76 40 61 57 63 50 47 77 66 61 72 58 67 48 18 40 58 65 45 50 54 48 41 62 60 70 78 82 18 51 29 50 78 69 27 65 46 19 47 71 72 67 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 39 72 67 43 83 69 62 35 54 63 62 41 64 75 2 класс 71 82 88 66 53 62 64 56 66 62 73 73 87 69 1 кл 78 84 48 77 63 2 кл 59 49 54 59 64 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 44 44 53 58 67 70 50 51 33 32 38 51 35 39 30 46 40 55 32 39 40 48 35 38 33 40 31 27 28 40 48 59 37 41 31 26 40 48 46 51 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 19 «3» 46 28 «4» 40 24 «5» 30 19 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? 106 б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 96 118 Дети 89 110 109 110 91 105 111 122 135 126 102 107 93 82 114 86 119 132 137 118 134 85 122 124 114 103 129 110 118 86 107 109 123 111 129 100 Вариант 25 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 4 5 5 3 3 4 2 3 3 2 5 5 5 2 2 2 5 3 4 5 4 5 5 5 3 4 3 5 3 3 5 2 2 4 5 2 2 4 2 4 3 3 2 3 5 3 4 4 5 5 2 3 5 5 3 5 2 3 2 4 2 4 4 3 4 3 2 5 5 5 2 3 3 3 2 4 4 3 5 4 3 3 4 2 2 5 4 5 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 63 79 57 52 61 87 67 53 56 41 65 53 46 61 76 74 70 63 79 42 58 61 73 61 72 84 60 71 63 62 72 61 56 64 66 67 87 42 69 83 76 51 64 55 55 48 83 66 64 64 48 53 61 90 74 80 73 43 56 75 66 76 71 73 64 52 65 49 74 75 68 74 65 43 67 72 76 62 71 61 61 62 71 48 55 48 55 63 82 69 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 2 класс 53 33 68 70 61 42 54 49 78 41 42 62 107 67 32 46 45 73 41 81 31 42 62 61 60 82 54 42 100 1 класс 67 2 класс 51 65 57 59 66 47 56 71 41 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 26 После 39 36 45 32 52 38 43 14 10 44 57 42 46 52 49 25 29 36 46 58 64 50 48 29 45 62 75 50 59 32 33 27 22 28 30 42 46 44 55 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 33 18 «3» 48 29 «4» 29 22 «5» 40 21 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 109 127 121 Дети 88 109 141 Родители 114 87 101 126 93 Дети 103 83 99 141 100 108 116 102 104 130 138 109 113 117 85 130 128 113 106 110 99 120 115 103 91 99 125 97 Вариант 26 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 5 2 5 5 5 5 3 5 5 4 4 3 5 2 3 5 5 3 2 2 4 2 3 5 2 5 5 3 4 2 4 5 5 3 4 3 2 4 4 5 2 2 4 4 5 5 2 3 2 2 5 3 5 4 2 2 4 5 5 4 5 3 2 5 4 2 5 3 4 2 2 4 2 5 2 4 3 2 2 2 4 5 5 3 4 4 4 2 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 49 56 21 70 60 61 45 98 82 52 66 46 56 59 49 63 56 42 22 45 40 65 43 24 50 59 66 55 74 67 49 47 61 72 64 57 51 54 37 50 84 64 51 74 69 62 53 47 80 57 59 52 38 59 69 35 66 49 43 64 79 49 71 82 77 44 40 67 69 46 54 61 54 47 37 47 85 75 56 39 75 40 45 49 27 51 70 57 61 25 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 2 класс 1 класс 84 2 класс 61 86 56 64 80 43 63 58 66 81 60 67 65 84 62 51 84 64 95 79 60 86 61 60 57 52 82 46 48 76 50 47 88 43 61 65 64 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после 26 24 28 20 35 44 47 49 40 44 25 33 24 38 109 20 20 25 28 32 26 20 25 22 33 40 38 35 43 33 39 До 56 После 50 43 53 30 42 34 43 47 56 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 34 18 «3» 41 25 «4» 36 23 «5» 39 24 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 93 109 130 131 106 88 87 121 108 Дети 94 101 143 112 105 103 89 135 107 Родители 127 131 111 107 135 104 118 107 109 105 Дети 129 145 111 119 127 111 121 93 111 84 Вариант 27 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 4 5 5 2 2 4 5 3 3 3 3 3 2 3 4 3 5 4 5 3 3 4 3 4 3 4 3 5 2 5 2 5 2 3 3 5 3 4 4 5 3 5 3 2 5 3 3 5 5 5 2 4 3 5 4 5 3 2 4 5 2 5 4 3 5 5 2 3 2 2 5 3 4 4 3 2 4 4 3 5 4 5 5 3 5 3 2 5 2 4 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 110 62 55 49 55 70 98 60 64 74 60 77 78 48 74 65 76 63 80 78 56 76 64 59 55 84 59 70 81 69 70 64 70 68 67 77 47 63 80 57 55 78 55 63 86 77 56 62 68 55 69 53 62 72 61 76 82 53 54 94 60 50 52 55 59 53 57 70 71 73 65 65 64 54 65 67 67 71 76 81 95 62 77 66 61 57 46 62 81 85 57 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 2 класс 1 класс 84 2 класс 35 86 55 64 50 43 39 58 63 81 35 67 34 84 34 51 44 64 56 79 59 86 33 60 72 52 6 46 49 76 52 47 44 43 75 65 34 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 29 После 32 53 55 35 38 18 20 45 53 48 54 44 46 35 46 24 27 27 30 26 30 41 44 47 49 43 55 35 40 35 43 42 49 7 0 31 23 14 17 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 32 17 «3» 38 20 «4» 34 29 «5» 46 24 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: 111 а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 100 93 116 Дети 88 76 112 Родители 100 124 132 131 143 Дети 103 114 118 123 133 111 131 102 102 94 94 112 148 104 95 116 89 145 102 129 104 95 163 90 120 115 86 Вариант 28 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 2 3 3 5 5 2 3 3 2 2 5 4 5 2 4 3 4 3 4 4 5 4 2 4 5 3 5 5 3 2 5 3 2 2 4 3 2 5 3 5 5 5 5 4 5 2 3 3 2 2 2 3 3 4 3 5 4 2 3 4 2 3 3 2 4 4 2 5 3 4 4 4 5 5 3 2 3 5 4 4 5 3 3 5 3 4 2 2 3 4 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 60 58 47 47 58 32 73 41 62 51 47 28 36 26 71 52 64 38 52 60 71 43 66 44 48 42 51 56 58 51 52 63 47 70 60 69 24 48 58 47 44 46 45 45 46 62 70 53 39 59 61 64 45 52 57 57 47 53 54 37 22 75 50 35 49 53 68 20 43 59 79 32 54 63 47 72 53 73 56 25 79 72 41 44 46 50 70 85 63 68 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 78 2 класс 55 1 кл 59 55 51 2 кл 48 57 70 Задача 4 26 55 41 56 25 62 58 54 83 67 58 70 67 75 112 61 79 59 66 46 84 57 62 52 66 70 72 55 78 62 65 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до 26 37 25 56 36 42 14 35 25 27 37 41 41 27 25 после 30 42 35 56 46 38 23 49 15 28 42 49 52 17 31 До 33 40 32 54 46 После 27 51 35 56 44 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 33 22 «3» 35 25 «4» 39 19 «5» 43 24 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 121 134 129 128 148 87 120 96 129 Дети 115 123 130 129 133 87 118 86 133 Родители 131 130 96 115 112 139 93 123 104 109 Дети 124 143 97 104 107 158 91 118 93 120 Вариант 29 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 5 3 4 3 5 5 2 4 4 2 2 4 5 4 5 2 3 3 4 4 4 5 4 4 4 4 4 5 3 4 5 2 113 5 5 5 4 2 3 3 2 3 4 2 4 4 4 3 2 5 2 3 2 2 2 3 5 3 4 3 3 5 3 3 2 3 2 2 2 5 4 4 5 4 5 4 4 2 2 4 5 5 5 2 3 4 4 4 5 5 5 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 50 85 61 46 100 54 68 77 82 67 57 70 69 71 77 70 89 62 69 63 76 73 43 81 72 78 58 82 61 91 89 80 81 66 65 70 61 86 74 74 62 49 61 76 82 67 83 65 59 42 54 64 77 52 58 63 92 61 63 78 77 54 67 79 69 66 59 70 55 82 80 68 67 63 56 72 63 69 74 82 64 66 71 81 80 84 84 81 75 87 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; б) критерий Стьюдента. 1 класс 53 53 41 62 38 54 55 57 48 46 49 44 55 69 2 класс 50 59 59 75 59 66 67 77 74 79 79 75 59 77 1 класс 94 29 83 52 42 2 класс 62 62 56 74 50 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до 24 57 13 29 32 43 38 58 37 39 35 25 24 35 37 после 32 73 19 30 43 42 44 65 49 48 40 25 31 37 51 До 25 36 33 25 42 После 34 45 30 23 46 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 27 19 «3» 41 20 Задача 6. 114 «4» 47 25 «5» 35 26 а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители Дети Родители 115 118 Дети 115 113 115 111 138 125 127 131 134 138 129 132 121 88 115 117 134 117 92 113 113 122 106 117 121 112 133 140 131 123 90 130 93 127 80 75 Вариант 30 Задача 1 На основании данных по успеваемости учащихся: а) построить таблицу частот и таблицу относительных частот; б) изобразить полигон частот; в) вычислить среднее арифметическое и стандартное отклонение; г) вычислить процент успеваемости и процент качества. 3 4 2 2 5 3 4 5 5 2 5 5 4 2 2 3 2 5 4 5 3 4 2 4 2 5 2 4 2 4 4 2 4 3 5 3 3 2 2 5 5 3 4 2 3 2 4 5 4 2 2 4 2 3 2 4 2 5 2 5 2 4 4 2 2 3 4 5 4 3 2 2 3 3 4 2 2 2 2 5 5 5 3 4 4 5 5 4 5 3 Задача 2 На основании данных по результатам ЕГЭ: а) построить интервальную таблицу частот и интервальную таблицу относительных частот; б) изобразить гистограмму частот; в) вычислить среднее арифметическое и стандартное отклонение. 31 19 31 37 40 86 45 63 48 34 22 68 62 59 48 45 21 39 50 23 7 35 69 65 54 54 47 64 55 46 33 82 42 67 62 32 48 51 46 50 17 40 49 64 60 70 39 52 28 23 68 25 67 76 60 33 44 76 56 45 73 31 64 38 45 48 72 54 61 37 49 52 53 46 63 8 55 43 83 61 34 47 31 61 17 28 76 40 53 35 Задача 3 На основании результатов ЕГЭ по математике в двух классах определить, различаются ли статистически значимо классы по уровню знаний по математике? Применить: а) критерий Манна-Уитни; 115 б) критерий Стьюдента. 1 класс 59 54 71 65 43 59 48 71 29 78 69 31 50 40 2 класс 77 55 74 79 66 52 69 73 75 75 79 70 64 57 1 класс 46 51 40 49 67 2 класс 85 61 74 54 85 Задача 4 Для группы учащихся собрали данные по количеству баллов тестирования в форме ЕГЭ до и после проведения курса по подготовке к ЕГЭ по математике. Способствовал ли проведенный курс статистически значимо улучшению уровня знаний по математике? Применить: а) критерий Вилкоксона; б) критерий Стьюдента. до после До 35 После 49 30 38 16 18 26 21 30 24 54 51 36 44 38 40 37 48 21 26 40 36 37 33 24 26 23 31 42 47 23 23 40 43 30 34 32 33 21 24 Задача 5. На основании данных по результатам ОГЭ по математике в двух школах определить, имеются ли достоверные отличия в распределении результатов (дифференцированности) среди этих школ? 1 школа 2 школа «2» 30 17 «3» 35 26 «4» 48 22 «5» 37 25 Задача 6. а) На основании анализа результатов Задачи 1 установить, имеют ли данные равномерное распределение? б) На основании анализа результатов Задачи 2 установить, имеют ли данные нормальное распределение? Задача 7. Установить, существует ли статистически достоверная корреляционная связь между показателями уровня интеллекта IQ среди группы родителей и их детей? Применить: а) метод ранговой корреляции Спирмена; б) метод линейной корреляции Пирсона. Родители 116 113 114 122 131 104 70 117 124 Дети 99 116 111 125 116 111 79 122 118 Родители 5 108 108 131 94 121 132 129 119 106 Дети 86 107 100 127 81 143 142 139 124 100 116 Приложения Функция стандартного нормального распределения. Таблица №1 117 Критические значения критерия U-Манна-Уитни Таблица №2 118 Критические значения критерия U-Манна-Уитни Таблица №2 (продолжение). 119 Критические значения критерия U-Манна-Уитни Таблица №2 (продолжение). 120 Критические значения критерия U-Манна-Уитни Таблица №2 (продолжение). 121 Критические значения критерия U-Манна-Уитни Таблица №2 (продолжение). 122 Критические значения критерия U-Манна-Уитни Таблица №2 (окончание). 123 Критические значения критерия t-Стьюдента Таблица №3. Критические значения критерия Т-Вилкоксона Таблица №4 124 Критические значения критерия 𝜒 2 -Пирсона Таблица №5 125 Критические значения критерия 𝜒 2 -Пирсона Таблица №5 (окончание) Критические значения коээфициента ранговой корреляции Спирмера Таблица №6 126 Критические значения коээфициента линенйой корреляции Пирсона Таблица №7 127 1. 2. 3. 4. 5. 6. 7. Литература. Афанасьева В.В., Сивов М.А. Математическая статистика в педагогике. Учебное пособие/ под науч. ред. д.и.н., проф. М.В. Новикова. – Ярославль: Изд-во ЯГПУ, 2010. – 76с. Чиркина А.А. Использование статистических методов в педагогическом исследовании: методические рекомендации/ А.А. Чиркина, Н.В.Булгакова. – Витебск: ВГУ имени П.М.Машерова, 2015. – 48с. Просветов Г.И. Статистика: задачи и решения: Учебно-практическое пособие. – М.: Издательство «Альфа-Пресс», 2008. – 496с. Глотова М.Ю., Самохвалова Е.А. Математическая обработка информации: учебник и практикум для бакалавров. – М.: Изд-во Юрайт, 2015. – 344с. Остапенко Р.И. Математические основы психологии. Учебно-методическое пособие. – Воронеж: ВГПУ, 2010. – 76с. Сидоренко Е.В. Методы математической обработки в психологии. – СПб.: ООО «Речь», 2003. – 350с. Ермолаев О.Ю. Математическая статистика для психологов. Учебник./О.Ю. Ермолаев – 2-е изд. испр. – М. Московский психолого-социальный институт. Изд-во Флинта, 2003. – 336с. 128 Научное издание Ивирсина Нина Борисовна Танзы Менги Васильевна Бичи-оол Елена Карловна Хомушку Аяна Мергеновна МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ Учебно-методическое пособие Редактор Е.К. Сенди Дизайн обложки К.К. Сарыглар Сдано в набор: 21.01.2021. Подписано в печать: 27.01.2021. Формат бумаги 60×84 1/8. Бумага офсетная. Физ. печ. л 16,2. Усл. печ. л. 15,1. Заказ № 1675. Тираж 50 экз. 667000, Республика Тыва, г. Кызыл, ул. Ленина, 36 Тувинский государственный университет Издательство ТувГУ 129