Лабораторная работа №6 Обработка результатов эксперимента в MathCad

реклама
Лабораторная работа №6
Обработка результатов
эксперимента в MathCad
1. Законы распределения
случайных чисел
• Распределение случайной величины – это
функция, позволяющая определить
вероятность появления заданного значения
случайной величины.
• В теории вероятностей сформулировано
несколько законов распределения как для
дискретных, так и для непрерывных
случайных величин.
• Наблюдаемые на практике случайные
величины часто не вполне соответствуют
теоретическим распределениям, но с
некоторой точностью могут быть
приближенно ими представлены.
Законы распределения
случайных чисел
Для непрерывных случайных величин
рассмотрим следующие законы:
• Равномерное распределение
• Нормальное распределение
• Экспоненциальное распределение
• Гамма-распределение
Равномерное распределение
Плотность вероятности
2 параметра:
0.8
a, b – границы
отрезка
dunif ( x5 15)0.6
dunif ( x7 12)0.4
0.2
0
a = min(Xi)
0
5
10
Интегральная функция распределения
15
20
b = max(Xi)
x
0.8
punif ( x5 15)0.6
punif ( x7 12)0.4
0.2
0
0
5
10
x
15
20
Равномерное распределение
t  0  1000
Y1  runif ( 1 5 15)
t
Y2  runif ( 1 5 15)
0
t
0
20
15
Y2 10
5
0
0
5
10
Y1
15
20
Нормальное распределение
2 параметра:
dnorm( x10 2)0.8
μ – мат. ожидание
0.6
dnorm( x10 1)
0.4
dnorm( x10 5)
0.2
0
σ – стандартное, или
среднеквадратическое,
отклонение
0
5
10
15
20
x
1 n
  X   Xi
n i 1
pnorm( x10 2)0.8
0.6
pnorm( x10 1)
0.4
pnorm( x10 5)
0.2
0

0
5
10
x
15
20
X 
2
1 n
 X i 2


n i 1
Нормальное распределение
20
16.24
15
rnorm( 1000 10 2.2) 10
5
3.277
0
t  0  1000
0
3.086
5
10
rnorm( 1000 10 2.2)
15
20
17.847
Экспоненциальное
распределение
1 параметр масштаба λ
dexp ( x0.5)0.8
dexp ( x1)
0.6
dexp ( x2)
0.4
λ=1/μ
0.2
0
0
5
10
15
20
15
20
x
pexp ( x0.5)0.8
pexp ( x1) 0.6
pexp ( x2)
0.4
0.2
0
0
5
10
x
Экспоненциальное
распределение
15
13.65
10
rexp ( 1000 0.5)
5
3
2.02910
0
0
t  0  10002.17510 3
5
10
rexp ( 1000 0.5)
15
20
15.395
Гамма-распределение
1
2
1
2
2 параметра:
k – параметр формы
θ – параметр масштаба
 x 4 0.8

2 
 dgamma
 x 1.50.6

2

 dgamma

k 2

0.4
1
1
 x 4

 1  0.2
 dgamma
0
0
5
10
15
20
 
x
При k = 1 получается
экспоненциальное
распределение,
где λ = 1 / θ
x 
pgamma 4 0.8
2 
 x 1.50.6

2

pgamma
0.4
x 
pgamma 4
 1  0.2
0
0
5
10
x
15
20
При k → ∞ получается
нормальное распределение
с параметрами k∙θ и k∙θ2
Гамма-распределение
t  0  1000
Y1  rgamma( 3 5)
t
Y2  rgamma( 3 5)
0
t
0
15
20
20
15
Y2 10
5
0
0
5
10
Y1
2. Построение гистограмм
плотности вероятности
и интегральной функции распределения
Исходный вектор значений случайной величины:
i  0  99
X  rnd ( 1)  rnorm( 1 1 0.7)
i
0
3
2
Xi
1
0
1
0
20
40
60
i
80
100
Построение гистограмм
плотности вероятности
и интегральной функции распределения
Построение гистограммы плотности вероятности:
0.4
1
 histogram( 5 X)
 1 0.3
100
1
 1
 histogram( 10 X)
100
1
0.2
 1
 histogram( 20 X)
100
0.1
0
1
0
histogram( 5 X)
1
 0
histogram( 10 X)
2
 0
 0
histogram( 20 X)
3
Построение гистограмм
плотности вероятности
и интегральной функции распределения
Для выбора числа интервалов (бинов) у гистограммы
рекомендуется использовать формулу Стерджесса
Ширина каждого из интервалов
Ширину интервалов рекомендуется округлять.
Функция histogram выбирает ширину автоматически.
Построение гистограмм
плотности вероятности
и интегральной функции распределения
Построение гистограммы интегральной функции распределения:


 0
j  0  length histogram( 15 X )
1
1
0.8
1
100

j

k 0
 1
histogram( 15 X)
k
0.6
0.4
0.2
0
1
0
1
 histogram( 15 X) 0  j
2
3
4. Вычисление математического
ожидания, стандартного отклонения,
дисперсии
• Математическое ожидание случайной
величины вычисляется как её среднее
значение, в mathCad вычисляется
функцией mean
• Среднеквадратическое (стандартное)
отклонение – корень из дисперсии, в
mathCad вычисляется функцией stdev
Обозначается σ
• Дисперсия – среднее значение
квадрата отклонений от среднего
значения (σ2), в mathCad вычисляется
функцией var
mean ( X )  0.486
var( X )  0.225
stdev ( X )  0.475
5. Критерии достоверности
гипотез
Гипотеза – предположение о виде или
параметрах неизвестного распределения.
Например: гипотеза «случайная величина X
подчиняется нормальному закону
распределения»
Для каждой гипотезы есть вероятность p, что
она верна, и вероятность 1 – p, что гипотеза
ошибочна.
При проверке гипотез заранее задают уровень
значимости α = 1 – p, то есть вероятность
недостоверности гипотезы.
Критерии достоверности гипотез
Для проверки гипотез вычисляют значение
критерия, зависящее от значений
проверяемой случайной величины, и
проверяют его на нахождение в области
значений, соответствующей достоверности
гипотезы при заданном уровне значимости.
Наиболее часто используют критерий
Колмогорова и критерий Пирсона (критерий
«хи-квадрат» - χ2 ).
Использование критерия
Колмогорова
• Упорядочить случайные числа по
возрастанию.
• Вычислить значения Di и выбрать
максимальное из них D
Значение критерия λ = D √n
• Найти вероятность совпадения законов
распределения P(λ).
Использование критерия Колмогорова
при заданном уровне значимости
• Задавшись α и зная n, выбрать
критическое значение критерия Dкр.
• Упорядочить случайные числа по
возрастанию.
• Вычислить значения критерия Di и
выбрать максимальное из них D
• Гипотезу о принадлежности случайной
величины распределению можно
принять, если D < Dкр
Поиск критической точки для
критерия Колмогорова
Для нахождения критической величины
критерия Dкр надо знать уровень значимости α
и число опытов n
Для заданного α выбираем λкр:

0.4
0.3
0.2
0.1 0.05 0.025 0.01 0.005 0.001 0.0005
кр 0.89 0.97 1.07 1.22 1.36 1.48 1.63 1.73
При больших n
Dкр 
(n > 35)
кр
n 1
1.95
2.03
Для малых n
пользоваться табличными
значениями Dкр
Критерий Колмогорова: пример
Пассажир, приходящий в случайные
моменты времени на автобусную
остановку, в течение пяти поездок
фиксировал своё время ожидания
автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 мин.
Проверить гипотезу о том, что время
ожидания автобуса равномерно
распределено на отрезке [0; 10] на
уровне значимости 0,05.
Решение
Решение задачи в MathCAD
Использование критерия
Пирсона
Критерий используется для дискретных
величин, либо непрерывных величин,
разбитых на интервалы.
Например, он может быть использован,
если построена гистограмма
результатов эксперимента.
Использование критерия
Пирсона
• Определить число степеней свободы
k = l – r – 1, где
l – число интервалов гистограммы
r – число параметров предполагаемого
распределения, оцениваемых по выборке
(2 для нормального, 1 для экспоненциального…)
• Найти критическое значение критерия:
χ2кр = qchisq(1 – α, k)
• Вычислить критерий χ2 по экспериментальным
данным. Гипотеза верна, если
χ2 < χ2кр
Использование критерия
Пирсона
Вычисление χ2:
2
(
n

np
)
i
2   i
npi
i 1
l
где
• ni – эмпирические частоты (фактическое
количество попаданий случайной величины в
заданный интервал гистограммы)
• npi – теоретические частоты (количество
попаданий случайной величины в заданный
интервал гистограммы, вычисленное по
предполагаемому закону её распределения)
Пример
Измерены интервалы в минутах между 100
поездами метро, прибывшими на станцию.
Результаты измерений представлены
статистическим рядом:
На уровне значимости   0,05 проверить
гипотезу о том, что интервалы можно описать
нормальным распределением.
Неравенство χ2 < χ2кр выполнено, гипотезу можно принять.
6. Коэффициент
линейной корреляции
Коэффициент линейной корреляции – величина, показывающая наличие
линейной связи между значениями двух случайных величин.
Для линейно зависящих величин он равен 1 или -1, для независимых
величин – 0.
В MathCad вычисляется как функция от двух векторов случайных чисел.
X  rgamma( 100 2)
X1  rgamma( 100 2)
corr( X 2X  5)  1

corr X X

2
  0.948
corr X1 X1
2
  0.948

corr X X

3
  0.868
corr X1 X1
  0.863
3
corr( X exp ( X ) )  0.686
corr( X1 X1 )  1
corr( X1 exp ( X1 ) )  0.661
corr( X sin ( X ) )  0.468
corr( X X1 )  0.151
corr( X1 sin ( X1 ) )  0.547
Задание к работе 6
1.
2.
3.
4.
5.
6.
Сгенерировать случайные числа по своему варианту два раза,
векторы по 50 и 500 шт.
Найти мат. ожидание, стандартное отклонение, дисперсию для
обоих наборов случайных чисел
Определить параметры распределения случайной величины,
предполагая, что она распределена по известному закону
распределения, для каждого из рассмотренных законов.
Построить гистограммы плотности вероятности и интегральной
функции распределения.
Построить функции плотности вероятности и интегральных
функций распределения с найденными параметрами на тех же
графиках.
Найти вероятности достоверности гипотез о принадлежности
случайной величины к каждому из 4 распределений из п. 4 по
критерию Колмогорова. Проверить те же гипотезы по критерию
Пирсона для уровня значимости 0,1.
Найти коэффициент корреляции между 1 вектором и первыми 50
числами второго вектора.
Скачать