МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Технологический институт Федерального государственного образовательного учреждения высшего профессионального образования «Южный федеральный университет» Блинов Ю.Ф., Иванцов В.В., Серба П.В. МЕТОДЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ Часть 2 Электронное учебное пособие Таганрог 2012 УДК 518.5.001.57(07.07) Блинов Ю.Ф., Иванцов В.В., Серба П.В. Методы математического моделирования. Ч.2. Электронное учебное пособие. Таганрог, ТТИ ЮФУ, 2012. – 47 с. Электронное учебное пособие предназначено для самостоятельной работы по изучению курса «Специальные разделы математики (методы математического моделирования)». Для направлений подготовки бакалавров 210100, 211000, 222900. Во 2-й части учебного пособия изучаются основы математической статистики, необходимые для построения статистических моделей по данным эксперимента: выборочный метод, точечные и интервальные оценки параметров распределений и их свойства, основы статистической проверки гипотез. В конце учебного пособия приводится тест для самопроверки. Поставляется на 1 CD-ROMе и может использоваться в локальном или сетевом режиме. Минимальные системные требования: любой PC, RAM от 1 Mб, память на жестком диске от 1 Мб, операционная система от Windows XP и старше, Acrobat Reader или другой браузер PDF-файлов любой версии. © Ю.Ф. Блинов, В.В. Иванцов, П.В. Серба, 2012 2 Оглавление Введение ............................................................................................ 5 Модуль II. Выборочный анализ результатов натурного и вычислительного экспериментов ............................................... 7 Глоссарий........................................................................................... 7 2.1. Выборочный метод .................................................................... 8 2.2. Частота события. Закон больших чисел. ............................... 10 2.3. Свойства статистических оценок ........................................... 11 2.4. Статистические оценки законов распределения случайных величин ............................................................................................ 12 2.5. Числовые (точечные) оценки параметров законов распределения случайных величин ............................................... 15 2.6. Интервальные оценки параметров законов распределения случайных величин ......................................................................... 23 2.6.1. Доверительный интервал и доверительная вероятность 23 2.6.2. Повышение точности измерений ...................................... 24 2.6.3. Интервальная оценка математического ожидания нормально распределенной случайной величины .................... 25 2.6.4. Интервальная оценка вероятности по частоте ................ 26 2.6.5. Интервальная оценка коэффициента корреляции ........... 26 2.7. Статистическая проверка статистических гипотез ............ 27 2.7.1. Методология статистической проверки статистических гипотез ........................................................................................... 27 3 2.7.2. Проверка гипотезы о равенстве математического ожидания нормально распределенной случайной величины заданному значению..................................................................... 31 2.7.3. Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин ........................................................................................................ 32 2.7.4. Сравнение дисперсий двух нормально распределенных случайных величин ...................................................................... 34 2.7.5. Проверка гипотезы о равенстве дисперсий нескольких нормально распределенных случайных величин ...................... 36 2.7.6. Исключение аномальных наблюдений............................. 37 2.7.7. Проверка гипотезы об однородности двух независимых выборок.......................................................................................... 38 2.7.8. Оценка значимости корреляционной связи ..................... 40 2.7.9. Проверка гипотезы о законе распределения случайной величины ....................................................................................... 41 2.8. Тест для самопроверки ............................................................ 44 Литература ....................................................................................... 46 Сведения об авторах ....................................................................... 47 4 Введение Большинство задач инженерной деятельности человека связано с построением и использованием математических моделей. Теоретические основы, необходимые для изучения методов математического моделирования, закладываются при изучении дисциплины «Математика». Курс «Математическое моделирование» предполагает изучение специальных прикладных разделов математики, посвященных разработке математических моделей технических объектов и процессов. Курс состоит из пяти модулей. Модуль «Общеметодологические вопросы моделирования» посвящен изучению терминологии по дисциплине, классификации моделей, системного подхода к моделированию, свойств моделей и требований к ним, общих вопросов разработки и применения математических моделей. В модуле «Выборочный анализ результатов натурных и вычислительных экспериментов» изучаются основы математической статистики, при этом происходит частичное повторение под практическим углом материала, изучаемого в курсе математики. Модуль методам «Статистическое разработки статистической изучаются математических обработки основы моделирование» моделей экспериментальных планирования регрессионного и дисперсионного анализа. 5 посвящен на основе данных, экспериментов, В модуле «Методы оптимизации» рассматриваются основы классических и поисковых методов отыскания минимальных и максимальных значений целевой функции. В модуле «Имитационное моделирование и метод МонтеКарло» рассматриваются методы генерации и использования псевдослучайных чисел при решении задач инженерного проектирования. В настоящем учебном пособии рассматривается модуль «Общеметодологические вопросы моделирования». В конце пособия приведен краткий тест для самопроверки. В качестве навигационных инструментов для гиперссылок в учебном пособии использованы кнопки: – в начало; – глоссарий; – оглавление; – в конец. Для обеспечения правильной работы гиперссылок в PDFбраузере рекомендуется установить просмотра. 6 постраничный режим МОДУЛЬ II. ВЫБОРОЧНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ НАТУРНОГО И ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТОВ Цель модуля: изучение основ математической статистики, необходимых для построения статистических моделей по данным экспериментов. В результате изучения модуля студент должен: знать основы математической статистики в объеме, необходимом для построения статистических моделей по данным натурных и вычислительных экспериментов; уметь производить точечную и интервальную оценку параметров распределений случайных величин по экспериментальным данным; владеть методологией и математическим аппаратом статистической проверки статистических гипотез. Глоссарий Альтернативная гипотеза; варианта; вариационный ряд; выборка; выборочная выборочное отклонение; среднее; дисперсия; выборочное выборочный выборочная оценка; среднеквадратичное коэффициент асимметрии; выборочный коэффициент корреляции; выборочный метод; выборочный эксцесс; генеральная совокупность; гистограмма; диаграммы рассеяния; дисперсия; доверительная вероятность; доверительный интервал; исправленная 7 дисперсия; исправленное среднеквадратичное отклонение; исправленный коэффициент асимметрии; конкурирующая коэффициент исправленный гипотеза; корреляции; коэффициент критерии эксцесс; асимметрии; согласия; критерий проверки гипотезы; критическая область; критические значения критерия; математическое ожидание; мощность критерия; несмещенность; нулевая гипотеза; область принятия гипотезы; ошибка второго рода; ошибка первого рода; плотность вероятности; поле корреляции; полигон; репрезентативность; состоятельность; статистическая среднеквадратичное гипотеза; статистическое отклонение; распределение; уровень значимости; функция распределения; частота события; эксцесс; эмпирическая функция распределения; эффективность. 2.1. Выборочный метод При экспериментальных исследованиях множества стохастических объектов, обладающих сходными свойствами, часто возникает необходимость статистической оценки этих свойств по данным экспериментов. Количество объектов, входящих в это множество, может быть весьма велико, а исследования часто обладают высокой трудоемкостью и иногда связаны с необходимостью разрушения объекта. В связи с назваными причинами исследование всех объектов, входящих в множество, чаще всего затруднительно. Поэтому для статистических оценок обычно применяют выборочный метод, 8 заключающийся в следующем. Из всего множества объектов, называемого генеральной совокупностью, для исследований выбирается некоторое количество объектов (выборочная совокупность, или выборка). По результатам экспериментов над объектами, входящими в выборку, вычисляются статистические выборочные оценки, на основании которых затем оцениваются параметры генеральной совокупности. Количество объектов в генеральной совокупности называется объемом генеральной совокупности, количество объектов в выборке – объемом выборки. Для того, чтобы выборка могла использоваться для оценки параметров генеральной совокупности, необходимо, чтобы она обладала определенными свойствами, основным из которых является репрезентативность. Репрезентативностью выборки называется соответствие свойств выборки свойствам генеральной совокупности. Другими словами, репрезентативность – это возможность представлять с помощью выборки параметры генеральной совокупности, значимые с точки зрения задач исследования. Выборка является репрезентативной, если входящие в нее объекты случайно выбраны из генеральной совокупности. Примером репрезентативной выборки для оценки остаточных знаний по математики является выборка, включающая 25 человек, случайно выбранных из списка студентов факультета. Если эта же выборка будет использоваться для анализа прогнозирования результатов выборов в органы власти в целом по городу, то она 9 не будет репрезентативной, т.к. будет отражать политические предпочтения только одной социальной группы – студенчества. Предположим, что для изучения вероятностного распределения количественного стохастического признака х из генеральной совокупности извлечена выборка объемом n: x1, x2, …, xn. Наблюдавшиеся значения хi называются вариантами (в данном случае слово варианта – женского рода), а последовательность вариант, записанных в порядке возрастания, называется вариационным рядом. Статистическим распределением выборки называется перечень вариант (в виде чисел или интервалов), приведенных в порядке их возрастания, и соответствующих им частот. При задании вариант в виде интервалов частоты измеряются отношением количества вариант, попавших в интервал, к объему выборки. 2.2. Частота события. Закон больших чисел. Предположим, что производится n опытов, в результате каждого из которых может произойти или не произойти некоторое событие А. Отношение числа произошедших событий m к числу опытов n называется частотой, или статистической вероятностью события: . (2.1) Здесь и далее символ «*» означает, что имеется в виду статистическая оценка (в данном случае – вероятности события). При необходимости подчеркнуть, что значение 10 является теоретическим, будет использоваться символ « ^ » над обозначением переменной. Частота события является выборочной оценкой его вероятности, причем погрешность оценки тем меньше, чем больше объем выборки n. В соответствии с теоремой Бернулли /1/, при неограниченном увеличении n частота событий стремится (сходится по вероятности) к его вероятности: для любого сколь угодно малого ε справедливо соотношение: P( |p(a) < p*(a)| ) → 1 при n → ∞ . (2.2) Теорема Бернулли является одной из самых простых формулировок «Закона больших чисел», являющегося основой математической статистики. 2.3. Свойства статистических оценок Для того, чтобы выборочные статистические оценки могли использоваться для оценок параметров генеральной совокупности, к их свойствам предъявляются определенные требования, основные их которых – несмещенность, состоятельность и эффективность. Несмещенностью оценивать параметры систематической оценки называется генеральной ее способность совокупности без погрешности. Для этого математическое ожидание оценки должно равняться оцениваемой величине: M(χ*) = χ , 11 (2.3) где χ – оцениваемая величина, χ* – статистическая оценка. Оценка называется состоятельной, если она сходится по вероятности к оцениваемой величине при неограниченном возрастании объема выборки: P( |χ* < χ| ) → 1 при n → ∞ . (2.4) В частности, в соответствии с теоремой Бернулли (2.2), оценка вероятности по частоте является состоятельной. Эффективной называется оценка, имеющая наименьшую дисперсию (погрешность) из всех оценок данного параметра при заданном объеме выборки: σ( χ ) = min . (2.5) 2.4. Статистические оценки законов распределения случайных величин Для описания законов распределения случайных величин в теории вероятностей используются функции распределения: интегральная (или просто функция распределения) и дифференциальная (плотность вероятности), связанные друг с другом соотношениями (2.6) где F(x) – функция распределения случайной величины х, f(x) – плотность вероятности ее распределения. 12 Статистической оценкой плотности вероятности является статистическое распределение выборки (см. 2.1). Существует два способа графического изображения статистического распределения выборки: в виде гистограммы или полигона. Гистограммой называют ступенчатую фигуру, состоящую из прямоугольников. В основании прямоугольников лежат равные интервалы, на которые разбивается числовая ось, отображающая переменную х, а их высоты равны частотам попадания вариант в эти интервалы. Необходимое количество интервалов может быть определено по эмпирической формуле (с последующим округлением до целого) k (2.7) 1 + 3,2 lg n, где n – объем выборки. Полигон строится по тем же числовым данным, что и гистограмма, и соединяющую представляет точки, собой отображающие ломаную частоты линию, попадания вариант в интервалы. На рис. 2.1 изображены график плотности вероятности распределения (кривая красного цвета), полигон (ломаная линия синего цвета) и гистограмма (ступенчатая фигура, залитая синим цветом. 13 0. 15 0.15 f ( x) f ( x) P Xi 0.1 P Xi 0. 05 0.05 0 0. 1 0 0 5 10 0 5 10 x Xi x Xi Рис. 2.1. График плотности вероятности распределения (кривая красного цвета), полигон (ломаная линия) и гистограмма (ступенчатая фигура). Эмпирическая (выборочная) функция распределения является графиком интегральной функции распределения, построенным по данным статистического распределения выборки. Он строится по точкам, отображающим частоты вариант, не превышающих текущие значения Эмпирическая интегральная функция распределения статичтического распределения выборки рассчитывается из путем сложения текущих (j=i) и всех предыдущих (j<i) значений частот. Представляет собой функцию, монотонно возрастающую от 0 до 1. На рис. 2.2 изображены график функции распределения (кривая красного цвета) и эмпирическая функция распределения (ломаная линия). 14 1 F( x) Pi 0.5 0 0 5 10 x Xi Рис. 2.2. Графики интегральной функции распределения и эмпирической функции распределения. 2.5. Числовые (точечные) оценки параметров законов распределения случайных величин Числовые распределений статистические оценки параметров законов позволяют представить свойства законов распределений в виде ряда чисел (которые могут графически изображаться в виде точек на числовой оси, отсюда другое название – точечные оценки). Рассмотрим основные из них. Математическое ожидание случайной величины х с плотностью вероятности распределения f(x) (2.7) характеризует ее среднее (ожидаемое) значение (рис. 2.3). Выборочной оценкой математического ожидания является выборочное среднее (выборочная средняя) (2.8) 15 Рис. 2.3. Плотность вероятности f(x) случайной величины х и ее математическое ожидание Оценка математического ожидания с помощью выборочного среднего является несмещенной, состоятельной и эффективной. Дисперсия случайной величины (2.9) и ее среднеквадратичное отклонение (2.10) характеризуют разброс случайной величины относительно ее математического ожидания. Из них более наглядной величиной является среднеквадратичное отклонение, измеряемое в тех же единицах, что х и М(х). 16 Рис. 2.4. Плотность вероятности f(x) случайной величины х и ее среднеквадратичное отклонение σ(x) Выборочная оценка дисперсии (выборочная дисперсия) находится из выражения (2.11) где М(x) – теоретическое значение математического ожидания. При неизвестном M(x) его значение может быть заменено выборочным средним (2.12) но оценка дисперсии по формуле (2.12) является смещенной. Для получения несмещенной оценки дисперсии ее нужно скорректировать (исправить), умножив на n/(n-1). Такая несмещенная оценка дисперсии называется исправленной: (2.13) 17 Выборочное среднеквадратичное отклонение вычисляется как квадратный корень из выборочной дисперсии: (2.14) Исправленное среднеквадратичное отклонение вычисляется как квадратный корень из исправленной дисперсии: (2.15) Коэффициент асимметрии (2.16) является безразмерной несимметричность величиной графика плотности и измеряет вероятности распределения. На рис. 2.5 изображены графики плотности вероятности законов распределения случайных величин с различными значениями коэффициентов асимметрии. 18 Рис. 2.5. Графики плотности вероятности законов распределения с различными значениями коэффициентов асимметрии Выборочная оценка (выборочный коэффициент выражения: коэффициента асимметрии асимметрии) находится из (2.17) Исправленный коэффициент асимметрии (2.18) Эксцесс распределения (2.19) является безразмерной величиной и измеряет остроту вершины функции плотности вероятности случайной величины (по сравнению с нормальным законом). За ноль эксцесса условно 19 принят эксцесс нормального закона распределения. Эксцесс закона распределения равномерной плотности равен –1,2; эксцесс логистического распределения равен +1,2. На рис. 2.5 изображены графики плотности вероятности законов распределения с различными значениями эксцесса. Рис. 2.6. Графики плотности вероятности законов распределения с различными значениями эксцесса Выборочный эксцесс (2.20) Исправленный эксцесс (2.21) 20 Коэффициент (парной) корреляции rxy измеряет глубину линейной статистической связи между двумя случайными величинами и изменяется в пределах [-1 ; 1]. Коэффициент корреляции случайной положителен, величины если другая при в увеличении среднем одной увеличивается. Коэффициент корреляции отрицателен, если при увеличении одной случайной величины другая в среднем уменьшается. Коэффициент корреляции равен нулю, если при увеличении одной случайной величины другая в среднем не изменяется (или то увеличивается, то уменьшается). Модуль коэффициента корреляции тем ближе к единице, чем ближе точки, отображающие на графике экспериментальные данные, к аппроксимирующей прямой. Нелинейную статистическую связь коэффициент корреляции не измеряет. На рис. 2.7 показаны диаграммы рассеяния (поля корреляции), отображающие в декартовой системе координат пары переменных, соответствуют входящие различным в выборку. значениям Диаграммы коэффициентов корреляции. На диаграммы нанесены аппроксимирующие прямые (синего цвета). 21 Рис. 2.7. Диаграммы рассеяния Коэффициент парной корреляции случайных величин х и у вычисляется из выражения 22 (2.22) где f(x,y) – совместная плотность вероятности распределения случайных величин x и y. Выборочный коэффициент корреляции вычисляется из выражения (2.23) 2.6. Интервальные оценки распределения случайных величин 2.6.1. Доверительный параметров интервал и законов доверительная вероятность Числовые статистические оценки параметров случайных величин содержат в себе случайные погрешности, зависящие от объема выборки. При этом числовые оценки не включают в себя информацию о величине этих погрешностей. Для учета погрешностей используются интервальные оценки, говорящие о том, в каком интервале находится оцениваемая величина с учетом возможных погрешностей. При этом интервальная оценка делается с определенной вероятностью; чем выше вероятность, тем шире интервал оценивания. Доверительным интервалом называется интервал, в котором предположительно находится оцениваемая величина. Вероятность того, что оцениваемая величина находится внутри 23 доверительного интервала, называется доверительной вероятностью Рд (надежность оценки). Вероятность ошибки α = 1 – Рд при статистической проверке гипотез называют уровнем значимости (см. 2.7.1). Таким образом, доверительный интервал определяется как точечная оценка ± погрешность. Типовые значения Рд = 0,95 – средняя надежность, Рд = 0,99 – довольно высокая надежность, Рд = 0,999 – высокая надежность. Типовые значения α = 0,05 – средняя надежность, α = 0,01 – довольно высокая надежность, α =0,001 – высокая надежность. 2.6.2. Повышение точности измерений Предположим, что имеется измерительный прибор с известной случайной погрешностью измерений. Можно ли произвести с помощью него измерение с более высокой точностью, чем позволяет прибор? Для повышения точности измерения нужно произвести несколько (n) измерений и оценить математическое ожидание измеряемой величины, Среднеквадратичная вычислив погрешность выборочное оценки среднее. математического ожидания пропорциональна среднеквадратичному отклонению измеряемой величины и обратно пропорционально квадратному корню из объема выборки: (2.24) 24 Таким образом, погрешность измерения будет уменьшена в раз. 2.6.3. Интервальная оценка математического ожидания нормально распределенной случайной величины Ширина доверительного интервала для математического ожидания прямо пропорциональна погрешности его оценки. (2.25) Величина коэффициента t зависит от доверительной вероятности, вида распределения случайной величина и объема выборки. При нормальном распределении случайной величины оценка ее математического ожидания имеет распределение Стьюдента /1/ с = n-1 степенями свободы, а величина t является квантилем распределения Стьюдента, определяемым из выражения (2.26) где Стьюдента плотность вероятности распределения c нормированным значениями (нулевым математическим ожиданием и единичным среднеквадратичным отклонением). На практике величину t можно определить, исходя из известного числа степеней свободы и доверительной вероятности (или уровня значимости), из статистических таблиц /1/ или с помощью стандартных функций, встроенных в пакеты 25 прикладных программ (например, Microsoft Excel или MathCAD). Например, при n = 10 и α= 0,05: t = 2,228. 2.6.4. Интервальная оценка вероятности по частоте Точечной оценкой вероятности события является его частота (см. 2.2). Среднеквадратичная погрешность оценки вероятности по частоте (2.27) где q* = 1-p* .Если n достаточно велико и частота p* не очень близка к 0 и 1, можно приближенно считать, что погрешность оценки вероятности по частоте распределена по нормальному закону. Доверительный интервал для оценки вероятности /1/ (2.28) где t – квантиль нормального распределения. При больших n (более сотни) можно пользоваться приближенной формулой (2.29) 2.6.5. Интервальная оценка коэффициента корреляции Числовой оценкой коэффициента парной корреляции двух взаимосвязанных случайных величин является выборочный коэффициент корреляции r* (см. 2.22). Если значение r не очень 26 близко к 1 и –1, можно приближенно считать, что погрешность оценки коэффициента корреляции Стьюдента с числом степеней свободы имеет распределение = n – 2. Среднеквадратичная погрешность оценки коэффициента корреляции (2.30) Доверительный интервал для оценки коэффициента корреляции (2.31) где t – квантиль распределения Стьюдента с числом степеней свободы = n – 2. 2.7. Статистическая проверка статистических гипотез 2.7.1. Методология статистической проверки статистических гипотез Статистическими гипотезами называются гипотезы, основанные на предположении о виде и параметрах статистических распределений. Примеры статистических гипотез: Случайная величина распределена по нормальному закону. Коэффициент парной корреляции двух случайных величин равен нулю. 27 Из двух случайных величин первая имеет большую генеральную дисперсию. Математические ожидания двух случайных величин равны. Статистические гипотезы проверяются с использованием методов математической статистики. Гипотеза Н0, подлежащая проверке, называется нулевой гипотезой. Гипотеза Н1, противоречащая нулевой, называется конкурирующей (или альтернативной) гипотезой; она принимается, если отвергается нулевая гипотеза. Поскольку гипотезы проверяются на основании выборок конечного объема, при их проверке возможны ошибки. Ошибка первого рода заключается в том, что будет отклонена правильная нулевая гипотеза. Ошибка второго рода заключается в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки первого рода α называется уровнем значимости. Вероятность того, что будет отклонена неправильная нулевая гипотеза, называется мощностью критерия 1–β, где β – вероятность ошибки второго рода. Обычно при проверке гипотез задаются уровнем значимости, по возможности максимизируя мощность критерия. Критерием проверки гипотезы называют величину, для которой закон распределения ее статистической оценки известен при условии справедливости нулевой гипотезы. Наблюдаемым значением критерия называется его выборочная статистическая оценка. 28 Совокупность возможных значений критерия разделяется на две области: область принятия гипотезы и критическая область. Область принятия гипотезы представляет собой множество значений критерия, при которых гипотеза принимается, и включает в себя значение критерия при справедливой нулевой гипотезе. Критическая область представляет собой множество значений критерия, при которых гипотеза отвергается. Области формируются, исходя из следующего принципа: вероятность попадания статистической оценки критерия в критическую область должна быть равна уровню значимости, при этом мощность критерия должна быть максимальной. Значения критерия, расположенные на границах областей, называются критическими значениями. В зависимости от формулировки нулевой и конкурирующей гипотез, критические области могут располагаться с одной стороны или с двух сторон от области принятия гипотезы: односторонние двухсторонние (левосторонние, критические правосторонние) области). Критерии и с односторонними критическими областями являются более жесткими, т.е. при одинаковых уровнях значимости чаще приводят к отклонению нулевых гипотез. При вычислении критических значений для двухсторонних критических областей заданный уровень значимости α обычно делится на 2 (по каждой стороны, что в сумме дает α). 29 с Общий алгоритм проверки статистических гипотез следующий. 1. Формулируются нулевая и конкурирующая гипотезы. 2. Выбирается критерий проверки гипотезы. 3. Определяются границы области принятия гипотезы (критические значения критерия). 4. Вычисляется наблюдаемое значение критерия (его выборочная статистическая оценка). 5. Если наблюдаемое значение критерия попадает в область принятия гипотезы, нулевая гипотеза принимается; в противном случае – отклоняется. Следует отметить, что отклонение статистической гипотезы обычно носит категорический характер, тогда как ее принятие вовсе не означает того, что она верна. Обычно положительный результат проверки гипотезы говорит о том, что «статистические данные не противоречат гипотезе» (а в принципе могут быть получены другие данные, которые будут ей противоречить) или «нет основания для отклонения нулевой гипотезы» (но никто не гарантирует, что эти основания не появятся в дальнейшем). Правильность нулевой гипотезы может быть подтверждена только многократными экспериментами; для ее опровержения бывает достаточно одного эксперимента (например, эксперимента Майкельсона опровергнувшего гипотезу о неувлекаемом эфире). 30 – Морли, 2.7.2. Проверка гипотезы о равенстве математического ожидания нормально распределенной случайной величины заданному значению Типовая задача, решаемая с помощью проверки данной гипотезы. При производства анализе технологического резисторов сопротивления с номинальным процесса значением по выборке объемом n вычислено выборочное среднее Имеются ли основания для корректировки режимов технологического процесса с целью устранения систематической погрешности? Допустим, что случайная величина x распределена по нормальному закону, при этом имеются основания предполагать, сто ее математическое ожидание равно M0. Для проверки этого предположения вычисляют выборочное среднее и устанавливают, является ли статистически значимо отличие от M0. Нулевая и конкурирующая гипотезы могут быть записаны следующим образом: (2.32) В качестве критерия проверки гипотезы может быть использована случайная величина (2.33) 31 имеющая нормальное распределение с параметрами (0; 1). При данной конкурирующей гипотезе критическая область является двухсторонней (математическое ожидание может оказаться как больше, так и меньше заданного значения), и при заданном уровне значимости α условием принятия гипотезы является двустороннее неравенство (2.34) где tкр – критическое значение критерия, вычисляемое как квантиль нормального распределения при уровне значимости . Деление величины характером α критической на 2 обусловлено области: двухсторонним вероятность попадания наблюдаемого значения критерия в каждую из них равно , что в сумме дает α. 2.7.3. Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин Предположим, что имеются две нормально распределенные случайные величины и с выборочными оценками параметров их распределений , 32 при этом их выборочные средние несущественно отличаются друг от друга. Нулевая гипотеза состоит в том, что они имеют равные математические ожидания, конкурирующая гипотеза – в том, что они отличаются: (2.35) Для проверки гипотезы формируется критерий (2.36) имеющий при условии справедливости нулевой гипотезы распределение Стьюдента с параметрами (0; 1) и числом степеней свободы конкурирующей гипотезе критическая При данной область является двухсторонней (математическое ожидание первой случайной величины может оказаться как больше, так и меньше математического ожидания второй), и при заданном уровне значимости α условием принятия гипотезы является двустороннее неравенство (2.37) где tкр – критическое значение критерия, вычисляемое как квантиль распределения Стьюдента с числом степеней свободы при уровне значимости 33 Критическое значение критерия Стьюдента может быть вычислено с помощью стандартных функций, встроенных в пакеты программ, или определено из таблиц /1/. При формулу (2.36) можно упростить: (2.38) 2.7.4. Сравнение дисперсий двух нормально распределенных случайных величин На практике задача о сравнении дисперсий возникает при необходимости сравнить точность двух измерительных приборов, инструментов, методов измерения с целью выбрать наиболее точный. Предположим, что имеются две нормально распределенные случайные величины и с выборочными оценками параметров их распределений , при этом их выборочные исправленные дисперсии не существенно отличаются друг от друга. Без ограничения общности можно предположить, что (в противном случае можно изменить нумерацию переменных). Рассмотрим два возможных варианта сравнения дисперсий. 1 вариант. Критерий с двухсторонней критической областью. Нулевая гипотеза состоит в том, что переменные 34 имеют равные дисперсии, конкурирующая гипотеза – в том, что они отличаются: (2.39) Для проверки представляющий гипотезы собой формируется отношение большей критерий, выборочной дисперсии к меньшей: (2.40) Величина F при условии справедливости нулевой гипотезы имеет распределение Фишера с числом степеней свободы При данной конкурирующей гипотезе критическая область является двухсторонней (при неверной нулевой гипотезе дисперсия первой случайной величины может оказаться как больше, так и меньше дисперсии второй), и при заданном уровне значимости α условием принятия гипотезы является неравенство (2.41) где Fкр – критическое значение, вычисляемое как квантиль распределения Фишера с количеством степеней свободы при уровне значимости Критическое значение критерия Фишера может быть вычислено с помощью стандартных функций, встроенных в пакеты программ, или определено из таблиц /1/. Двусторонним 35 критерием следует пользоваться при сравнении точности измерительных приборов, инструментов, методов измерения с целью выбора наиболее точного. 2 вариант. Критерий с односторонней критической областью. Нулевая гипотеза состоит в том, что дисперсия первой случайной величины не превышает дисперсию второй, конкурирующая гипотеза – в том, что превышает: (2.42) В данном случае проверка гипотезы производится аналогично 1 варианту, но критическое значение вычисляется для уровня значимости α (а не использовать ). Односторонний критерий можно при принятии решения о целесообразности замены уже используемого оборудования на другое, более точное. 2.7.5. Проверка гипотезы о равенстве дисперсий нескольких нормально распределенных случайных величин Предположим, распределенных что имеются случайных несколько величин выборочными исправленными дисперсиями нормально , …, , с , … , вычисленными из выборок одинакового объема n. Нулевая гипотеза состоит в том, что дисперсии всех случайных величин равны, при конкурирующей гипотезе, заключающейся в том, что хотя бы одна из дисперсий отличается от других. Для проверки 36 гипотезы формируется критерий, равный отношению наибольшей из дисперсий к сумме всех дисперсий (2.43) . При справедливой нулевой гипотезе величина G имеет распределение Кохрена (в другом переводе – Кочрена) с числом степеней свободы (k, n-1). Критическое значение критерия Gкр определяется как квантиль распределения Кохрена для правосторонней критической области при заданном уровне значимости. При G Gкр нулевая гипотеза принимается, при G > Gкр – отвергается. 2.7.6. Исключение аномальных наблюдений При формировании вариационного ряда возможны грубые ошибки, которые могут привести к существенным искажениям результатов статистической обработки данных. Например, оператор при вводе данных в память компьютера может забыть поставить десятичную запятую или перепутать знак в показателе степени. Методы статистической проверки гипотез позволяют при необходимости выявить варианты, аномально отличающиеся от других, и исключить их из выборки. Для этого нужно иметь возможность проверять гипотезы о том, что данные являются аномальными и не принадлежат к выборке. Рассмотрим один из таких методов для двух случая, когда в выборке имеется одна варианта, существенно отличающаяся от 37 остальных. Случай, когда в выборке есть несколько аномальных вариант, рассмотрен в 2.7.7. Для оценки принадлежности аномальной варианты к выборке разобьем исходную выборку на две подвыборки, одна из которых x1 объемом n – 1 не содержит аномальных данных, а другая x2 – состоит из одной варианты, проверяемой на аномальность (рис. 2.8). x2 x1 Рис. 2.8. Исключение аномальной варианты Далее проверяется нулевая гипотеза о равенстве двух математических ожиданий, при этом выборочное среднее по второй подвыборке считается равным значению варианты, а выборочное среднеквадратичное отклонение – равным нулю. Варианта считается аномальной, если нулевая гипотеза отвергается. 2.7.7. Проверка гипотезы об однородности двух независимых выборок При проверке гипотезы об однородности двух независимых выборок нулевая гипотеза состоит в том, что они принадлежат к одной генеральной совокупности. Для проверки нулевой гипотезы можно использовать 38 критерий Вилкоксона /1/, который является непараметрическим и не требует, чтобы случайные величины были распределены по какому-то определенному закону распределения. Предположим, что имеются две выборки: x1 объемом n1 и x2 объемом n2, при этом n1 не больше чем n2 (если это не так, то нумерацию выборок нужно изменить). Для проверки гипотезы об однородности выборок их надо объединить в общий вариационный ряд (выборку объемом n = n1 + n2) и варианты расположить в порядке их возрастания. Каждой варианте присваивается ранг – порядковый номер в вариационном ряду объединенной выборки. Затем надо найти величину w, равную сумме рангов вариант первой выборки. Критерий Вилкоксона вычисляется из выражения (2.44) Величина W имеет асимптотически нормальное распределение. Для проверки нулевой гипотезы надо вычислить наблюдаемое значение критерия и сравнить его с критическим Wкр, вычисляемого как квантиль стандартного нормального распределения при заданном уровне значимости α для двухсторонней критической области (при вычислении квантиля надо использовать значение ). При 39 нулевая гипотеза принимается, при - отвергается. Критерий Вилкоксона дает хорошие результаты при объеме большей выборки, превышающем 25. Критерий может применяться для исключения аномальных наблюдений как при одной, так и при нескольких аномальных вариантах. 2.7.8. Оценка значимости корреляционной связи Иногда бывает необходимо проверить, существует ли линейная статистическая связь между двумя переменными х и y. Если связь отсутствует, то коэффициент парной корреляции между переменными должен равняться нулю. Однако, на практике выборочный коэффициент корреляции обычно отличается от нуля на величину погрешности выборочной оценки даже в том случае, если связь между переменными отсутствует. В этом случае говорят, что выборочный коэффициент корреляции статистически не значим. Оценить значимость линейной статистической связи можно с помощью проверки нулевой гипотезы о равенстве коэффициента корреляции нулю при конкурирующей гипотезе, утверждающей, что он не равен нулю. Для проверки нулевой гипотезы вычисляется выборочный коэффициент корреляции rxy, и формируется критерий (2.45) 40 имеющий при справедливой нулевой гипотезе распределение Стьюдента с n-2 степенями свободы, где n – объем выборки. Критические значения критерия вычисляются, исходя из уровня значимости α и двухсторонней критической области (т.е. при вычислении квантиля распределения Стьюдента нужно использовать значение . Если наблюдаемое значение критерия не превосходит критическое ( ,) то нулевая гипотеза принимается, в противном случае она отклоняется, т.е. между переменными обнаружена линейная статистическая связь. Следует отметить, что принятие нулевой гипотезы еще не означает, что связь отсутствует. Ее либо нет, либо она слишком слабая и не может быть обнаружена из выборки данного объема. Для обнаружения слабой связи нужно увеличить объем выборки; если связь при этом опять не будет обнаружена, это будет являться дополнительным аргументом за то, что она отсутствует. 2.7.9. Проверка гипотезы о законе распределения случайной величины При решении задач статистического анализа часто бывает необходимо знать закон распределения случайной величины, составляющей вариационный ряд. Построив гистограмму распределения случайной величины, можно сравнить ее с графиками плотности вероятностей известных распределений /1/ 41 и на основании результатов сравнения выдвинуть гипотезу о том, что случайная величина распределена по определенному теоретическому закону (нормальному, экспоненциальному, равномерной плотности и пр.). Критерии проверки гипотез о предполагаемом законе неизвестного распределения носят название критериев согласия. Рассмотрим один из наиболее часто применяемых критериев согласия – критерий Пирсона (критерий «хи квадрат»). Предположим, что числовая ось x вариационного ряда разбита на k интервалов, определена частота попадания случайной величины x в каждый интервал и построена гистограмма распределения величины х (рис. 2.9). Допустим, есть основания предполагать, существует функция f(x) является плотностью вероятности случайной величины х, при этом параметры функции могут быть известны заранее, а могут оцениваться из той же выборки, из которой вычислялись частоты. Вероятности попадания случайной величины в заданные интервалы при известной функции плотности вероятности могут быть найдены из выражения (2.45) 42 где i – номер интервала, – частота попадания случайной величины в i-й интервал, xi и xi-1 – границы i-го интервала. 0. 15 f ( x) 0. 1 P Xi 0. 05 0 0 5 10 x Xi Рис. 2.9. Гистограмма и плотность вероятности распределения случайной величины Нулевая гипотеза состоит в том, что функция f(x) является плотностью вероятности случайной величины x. Для проверки гипотезы используется величина (2.46) имеющая при условии справедливости нулевой гипотезы распределение значение χ 2 кр Пирсона (распределение χ2). Критическое вычисляется как квантиль распределения χ2 при правосторонней критической области, исходя из заданного уровня значимости и числа степеней свободы s– количество параметров = k – s – 1, где теоретической плотности вероятности, оцениваемых из этой же выборки. Например, если 43 все параметры плотности вероятности заранее известны, то s = 0; если параметры неизвестны и теоретический закон распределения – нормальный, то s = 2. При χ2 χ2кр нулевая гипотеза принимается, при χ2 > χ2кр – отклоняется. Критерий Пирсона хорошо работает при больших объемах выборки (более 50), при этом каждый интервал должен содержать не менее 5 вариант. Малочисленные соседние интервалы следует объединять в один, суммируя частоты (интервалы могут быть неравной длины). 2.8. Тест для самопроверки 1. Соответствие свойств выборки свойствам генеральной совокупности называется а) несмещенностью; б) репрезентативностью; в) точностью; г) состоятельностью; д) эффективностью. 2) Частота события является выборочной оценкой его а) достоверности; б) вероятности; в) точности; г) устойчивости; д) непротиворечивости. 44 3) Выборочное среднее является выборочной оценкой … случайной величины: а) математического ожидания; б) дисперсии; в) коэффициента асимметрии; г) коэффициента корреляции; д) эксцесса. 4. Коэффициент корреляции двух случайных величин равен –0,8. С увеличением одной из них, другая в среднем а) увеличивается; б) уменьшается; в) не изменяется; г) сначала увеличивается, потом уменьшается; д) сначала уменьшается, потом увеличивается. 5. Вероятность того, что правильная нулевая гипотеза будет отклонена, называется а) мощностью критерия; б) доверительной вероятностью; в) критическим значением; г) статистической надежностью; д) уровнем значимости. 45 Правильные ответы: Литература 1. Гмурман В.Е. Теория вероятностей и математическая статистика. М, Высшая школа, 2003. 2. Блинов Ю.Ф., Иванцов В.В., Серба П.В. Методические указания к изучению курса «Математическое моделирование физико-химических и социально-экономических процессов». Ч.2. № 307. Таганрог, ТРТИ им. В.Д. Калмыкова, 1989. – 31 с. 46 Сведения об авторах Блинов Юрий Федорович к.т.н., доцент кафедры Технологии микро- и наноэлектронной аппаратуры Технологического института Южного федерального университета в городе Таганроге. Иванцов Виктор Викторович к.т.н., доцент кафедры Технологии микро- и наноэлектронной аппаратуры Технологического института Южного федерального университета в городе Таганроге. Серба Павел Викторович д.ф.-м.н., профессор кафедры Технологии микрои наноэлектронной аппаратуры Технологического института Южного федерального университета в городе Таганроге. 47