Лабораторная работа №6 Обработка результатов эксперимента в MathCad 1. Законы распределения случайных чисел • Распределение случайной величины – это функция, позволяющая определить вероятность появления заданного значения случайной величины. • В теории вероятностей сформулировано несколько законов распределения как для дискретных, так и для непрерывных случайных величин. • Наблюдаемые на практике случайные величины часто не вполне соответствуют теоретическим распределениям, но с некоторой точностью могут быть приближенно ими представлены. Законы распределения случайных чисел Для непрерывных случайных величин рассмотрим следующие законы: • Равномерное распределение • Нормальное распределение • Экспоненциальное распределение • Гамма-распределение Равномерное распределение Плотность вероятности 2 параметра: 0.8 a, b – границы отрезка dunif ( x5 15)0.6 dunif ( x7 12)0.4 0.2 0 a = min(Xi) 0 5 10 Интегральная функция распределения 15 20 b = max(Xi) x 0.8 punif ( x5 15)0.6 punif ( x7 12)0.4 0.2 0 0 5 10 x 15 20 Равномерное распределение t 0 1000 Y1 runif ( 1 5 15) t Y2 runif ( 1 5 15) 0 t 0 20 15 Y2 10 5 0 0 5 10 Y1 15 20 Нормальное распределение 2 параметра: dnorm( x10 2)0.8 μ – мат. ожидание 0.6 dnorm( x10 1) 0.4 dnorm( x10 5) 0.2 0 σ – стандартное, или среднеквадратическое, отклонение 0 5 10 15 20 x 1 n X Xi n i 1 pnorm( x10 2)0.8 0.6 pnorm( x10 1) 0.4 pnorm( x10 5) 0.2 0 0 5 10 x 15 20 X 2 1 n X i 2 n i 1 Нормальное распределение 20 16.24 15 rnorm( 1000 10 2.2) 10 5 3.277 0 t 0 1000 0 3.086 5 10 rnorm( 1000 10 2.2) 15 20 17.847 Экспоненциальное распределение 1 параметр масштаба λ dexp ( x0.5)0.8 dexp ( x1) 0.6 dexp ( x2) 0.4 λ=1/μ 0.2 0 0 5 10 15 20 15 20 x pexp ( x0.5)0.8 pexp ( x1) 0.6 pexp ( x2) 0.4 0.2 0 0 5 10 x Экспоненциальное распределение 15 13.65 10 rexp ( 1000 0.5) 5 3 2.02910 0 0 t 0 10002.17510 3 5 10 rexp ( 1000 0.5) 15 20 15.395 Гамма-распределение 1 2 1 2 2 параметра: k – параметр формы θ – параметр масштаба x 4 0.8 2 dgamma x 1.50.6 2 dgamma k 2 0.4 1 1 x 4 1 0.2 dgamma 0 0 5 10 15 20 x При k = 1 получается экспоненциальное распределение, где λ = 1 / θ x pgamma 4 0.8 2 x 1.50.6 2 pgamma 0.4 x pgamma 4 1 0.2 0 0 5 10 x 15 20 При k → ∞ получается нормальное распределение с параметрами k∙θ и k∙θ2 Гамма-распределение t 0 1000 Y1 rgamma( 3 5) t Y2 rgamma( 3 5) 0 t 0 15 20 20 15 Y2 10 5 0 0 5 10 Y1 2. Построение гистограмм плотности вероятности и интегральной функции распределения Исходный вектор значений случайной величины: i 0 99 X rnd ( 1) rnorm( 1 1 0.7) i 0 3 2 Xi 1 0 1 0 20 40 60 i 80 100 Построение гистограмм плотности вероятности и интегральной функции распределения Построение гистограммы плотности вероятности: 0.4 1 histogram( 5 X) 1 0.3 100 1 1 histogram( 10 X) 100 1 0.2 1 histogram( 20 X) 100 0.1 0 1 0 histogram( 5 X) 1 0 histogram( 10 X) 2 0 0 histogram( 20 X) 3 Построение гистограмм плотности вероятности и интегральной функции распределения Для выбора числа интервалов (бинов) у гистограммы рекомендуется использовать формулу Стерджесса Ширина каждого из интервалов Ширину интервалов рекомендуется округлять. Функция histogram выбирает ширину автоматически. Построение гистограмм плотности вероятности и интегральной функции распределения Построение гистограммы интегральной функции распределения: 0 j 0 length histogram( 15 X ) 1 1 0.8 1 100 j k 0 1 histogram( 15 X) k 0.6 0.4 0.2 0 1 0 1 histogram( 15 X) 0 j 2 3 4. Вычисление математического ожидания, стандартного отклонения, дисперсии • Математическое ожидание случайной величины вычисляется как её среднее значение, в mathCad вычисляется функцией mean • Среднеквадратическое (стандартное) отклонение – корень из дисперсии, в mathCad вычисляется функцией stdev Обозначается σ • Дисперсия – среднее значение квадрата отклонений от среднего значения (σ2), в mathCad вычисляется функцией var mean ( X ) 0.486 var( X ) 0.225 stdev ( X ) 0.475 5. Критерии достоверности гипотез Гипотеза – предположение о виде или параметрах неизвестного распределения. Например: гипотеза «случайная величина X подчиняется нормальному закону распределения» Для каждой гипотезы есть вероятность p, что она верна, и вероятность 1 – p, что гипотеза ошибочна. При проверке гипотез заранее задают уровень значимости α = 1 – p, то есть вероятность недостоверности гипотезы. Критерии достоверности гипотез Для проверки гипотез вычисляют значение критерия, зависящее от значений проверяемой случайной величины, и проверяют его на нахождение в области значений, соответствующей достоверности гипотезы при заданном уровне значимости. Наиболее часто используют критерий Колмогорова и критерий Пирсона (критерий «хи-квадрат» - χ2 ). Использование критерия Колмогорова • Упорядочить случайные числа по возрастанию. • Вычислить значения Di и выбрать максимальное из них D Значение критерия λ = D √n • Найти вероятность совпадения законов распределения P(λ). Использование критерия Колмогорова при заданном уровне значимости • Задавшись α и зная n, выбрать критическое значение критерия Dкр. • Упорядочить случайные числа по возрастанию. • Вычислить значения критерия Di и выбрать максимальное из них D • Гипотезу о принадлежности случайной величины распределению можно принять, если D < Dкр Поиск критической точки для критерия Колмогорова Для нахождения критической величины критерия Dкр надо знать уровень значимости α и число опытов n Для заданного α выбираем λкр: 0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005 кр 0.89 0.97 1.07 1.22 1.36 1.48 1.63 1.73 При больших n Dкр (n > 35) кр n 1 1.95 2.03 Для малых n пользоваться табличными значениями Dкр Критерий Колмогорова: пример Пассажир, приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фиксировал своё время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 мин. Проверить гипотезу о том, что время ожидания автобуса равномерно распределено на отрезке [0; 10] на уровне значимости 0,05. Решение Решение задачи в MathCAD Использование критерия Пирсона Критерий используется для дискретных величин, либо непрерывных величин, разбитых на интервалы. Например, он может быть использован, если построена гистограмма результатов эксперимента. Использование критерия Пирсона • Определить число степеней свободы k = l – r – 1, где l – число интервалов гистограммы r – число параметров предполагаемого распределения, оцениваемых по выборке (2 для нормального, 1 для экспоненциального…) • Найти критическое значение критерия: χ2кр = qchisq(1 – α, k) • Вычислить критерий χ2 по экспериментальным данным. Гипотеза верна, если χ2 < χ2кр Использование критерия Пирсона Вычисление χ2: 2 ( n np ) i 2 i npi i 1 l где • ni – эмпирические частоты (фактическое количество попаданий случайной величины в заданный интервал гистограммы) • npi – теоретические частоты (количество попаданий случайной величины в заданный интервал гистограммы, вычисленное по предполагаемому закону её распределения) Пример Измерены интервалы в минутах между 100 поездами метро, прибывшими на станцию. Результаты измерений представлены статистическим рядом: На уровне значимости 0,05 проверить гипотезу о том, что интервалы можно описать нормальным распределением. Неравенство χ2 < χ2кр выполнено, гипотезу можно принять. 6. Коэффициент линейной корреляции Коэффициент линейной корреляции – величина, показывающая наличие линейной связи между значениями двух случайных величин. Для линейно зависящих величин он равен 1 или -1, для независимых величин – 0. В MathCad вычисляется как функция от двух векторов случайных чисел. X rgamma( 100 2) X1 rgamma( 100 2) corr( X 2X 5) 1 corr X X 2 0.948 corr X1 X1 2 0.948 corr X X 3 0.868 corr X1 X1 0.863 3 corr( X exp ( X ) ) 0.686 corr( X1 X1 ) 1 corr( X1 exp ( X1 ) ) 0.661 corr( X sin ( X ) ) 0.468 corr( X X1 ) 0.151 corr( X1 sin ( X1 ) ) 0.547 Задание к работе 6 1. 2. 3. 4. 5. 6. Сгенерировать случайные числа по своему варианту два раза, векторы по 50 и 500 шт. Найти мат. ожидание, стандартное отклонение, дисперсию для обоих наборов случайных чисел Определить параметры распределения случайной величины, предполагая, что она распределена по известному закону распределения, для каждого из рассмотренных законов. Построить гистограммы плотности вероятности и интегральной функции распределения. Построить функции плотности вероятности и интегральных функций распределения с найденными параметрами на тех же графиках. Найти вероятности достоверности гипотез о принадлежности случайной величины к каждому из 4 распределений из п. 4 по критерию Колмогорова. Проверить те же гипотезы по критерию Пирсона для уровня значимости 0,1. Найти коэффициент корреляции между 1 вектором и первыми 50 числами второго вектора.