Система случайных величин

реклама
СИСТЕМА СЛУЧАЙНЫХ ВЕЛИЧИН
В практических применениях теории вероятностей часто
приходится сталкиваться с задачами, в которых результат опыта
описывается не одной, а двумя или более случайными
величинами. Эти величины образуют систему случайных
величин. Например, параметры-показатели, результаты анализов
пациента. Случайными величинами в таком исследовании будут:
рост, вес, возраст, температура, давление, содержание химических элементов в крови. Условимся систему нескольких
случайных величин обозначать (Χ1, X2, …, Xn).
Многомерная случайная величина
Функция распределения многомерной
случайной величины
Cистему случайных величин также называют многомерной
случайной величиной.
Как и в одномерном случае, для того, чтобы полностью
описать многомерную случайную величину существует функция
распределения, n – мерной случайной величины, которая
определяется формулой:
F(x1, x2,…, .xn) = P(X1 < x1; X2 < x2, …,Xn < xn).
Многомерная
функция
распределения
обладает
следующими свойствами:
1. F(x1,x2,…,xn) не убывает по каждому аргументу.
2. Непрерывна слева по каждому аргументу.
3. Стремится к 0, если хотя бы один аргумент стремится к –  .
lim F( x1, x2 ,..., xn ) 0 ,
xi  
(1
i n).
4. Cтремится к 1, если все аргументы одновременно стремятся
к +
limF(x1, x2 ,..., xn ) 1,
x1  + ;…., xn  + .
104
5. Если часть аргументов функции стремится к +
получается функция остальных аргументов
,
то
lim F( x1 , x2 ,..., xk , xk 1 ,..., xn ) F( x1 , x2 ,..., xk ) ,
если xk+1 +;….,xn +.
Распределение непрерывной многомерной случайной
величины можно охарактеризовать плотностью вероятностей:
n
 F
f ( x1,..., xn ) 
.
x1 xn
Это – n-я смешанная частная производная от функции
распределения.
При зтом функция распределения выражается через
плотность вероятности формулой
x1 x 2 xn
F ( x 1 ,..., x n )   ...  ...  f ( t1 ,..., t n )dt 1 ,..., dt n .
  
д йуоцчйуКыщтпюннКфручтуцчн
Неотрицательная для любых х1, х2,…, xn
  
 ...  ...  f ( t1 ,..., t n )dt1 ,..., dt n 1 .
  
Двумерные случайные величины
Функцией распределения системы двух случайных величин
(X,Y) называется вероятность совместного выполнения двух
неравенств X < x, Y < y
F(x, y) = P[(X < x)(Y < y)].
Для понимания удобно воспользоваться геометрической
интерпретацией системы. Систему двух случайных величин
можно изобразить случайной точкой на плоскости с
координатами (Х, Y). Тогда функция распределения F(x, y) есть не
что иное, как вероятность попадания случайной точки (x, y) в
бесконечный квадрант с вершиной в точке (x, y), лежащий левее и
ниже ее.
105
Рис. 33. бесконечный квадрант с вершиной в точке (x,y)
Сформулируем основные свойства для функции двумерной
случайной величины:
1. Функция распределения F(x) есть неубывающая функция
обоих своих аргументов, т.е.
F(x2, y) F(x1, y) при х2 > x1,
F(x, y2) F(x, y1) при y2 > y1.
2. Если хотя бы один аргумент стремиться к –  , то F(x,y)
стремится к 0
F(x,–) = F(–, y) = F(–, –) = 0.
3. При одном из аргументов, равном +, функция распределения системы превращается в функцию распределения
случайной величины, соответствующей другому аргументу
F(x, +) = F2(x),
F(+, y) = F2(y),
где F1(x) и F2(y) – соответственно функции распределения
случайной величины X и Y.
106
4. Если оба аргумента равны +, функция распределения
системы равна единице
F(+, +) = 1.
5. Из определения функции и ее свойств можно заключить
следующее:
0  F(x, y)  1.
Как и одномерную, двумерную случайную величину можно
задать различными способами: табличным, графическим,
аналитическим. Как и одномерные, многомерные случайные
величины делятся на дискретные, непрерывные и смешанные.
Для начала рассмотрим дискретную двумерную случайную
величину.
Законом распределения дискретной двумерной случайной
величины называют перечень возможных значений этой
величины, т.е. пар чисел (x,y) и их вероятностей p(xi,yi) (i =1,…,n;
j = 1, 2,…,m).
Обычно закон распределения дискретной двумерной
случайной величины задают в виде таблицы с двойным входом:
Y
X
x1
x2
…
xi
…
xn
y1
p(x1,y1)
p(x2,y1)
…
p(xi,y1)
…
p(xn,y1)
…
yj
…
p(x1,yj)
…
p(x2,yj)
…
…
…
p(xi,yj)
…
…
…
p(xn,yj)
…
ym
…
p(x1,ym)
…
p(x2,ym)
…
…
…
p(xi,ym)
…
…
…
p(xn,ym)
p
p
F1(x)
1
F2(y)
…
2
p
…
p
i
p 1
…
p j
…
p m
1
n
где F1(x), F2(y) – одномерные функции распределения случайных величин X и Y соответственно, а p
n
 p( xi y j ) .
i 1
107
m
=  p ( x i y i ) и p j =
i  j 1
Так как события (Х=хi), (Y=yj) i = 1,2, ,n), j = 1, 2, , m)
образуют полную группу, то сумма вероятностей p(xi, yj) = 1, т.е.
n

i 1
m
 p ( x i y j ) 1 .
j 1
Зная закон распределения двумерной дискретной
случайной величины, можно найти законы распределения каждой
из составляющих. Для этого надо сложить вероятности по
строкам или по столбцам соответственно.
и р м еП
Найти законы распределения составляющих двумерной
случайной величины, заданной законом распределения.
Y
X
x1
x2
x3
y1
0,1
0,3
0,2
y2
0,06
0,18
0,16
Решение: Найдем закон распределения случайной величины
Х:
p(x1) = 0,1 + 0,06 = 0,16
p(x2) = 0,3 + 0,18 = 0,48
p(x3) = 0,2 + 0,16 = 0,36
Проверим: p(x1)+p(x2)+p(x3)= 0,16+0,48+0,36 = 1.
Теперь найдем закон распределения случайной величины Y:
p(y1) = 0,1+0,3+0,2=0,6,
p(y2) = 0,06+0,18+0,16=0,4;
проверим p(y1)+p(y2) = 0,6+0,4 = 1
Итак, мы нашли законы распределения составляющих
двумерной случайной величины
X
p(x)
x1
0,16
x2
0,48
x3
0,32
Y
p(y)
y1
0,6
y2
0,4
Непрерывную двумерную случайную величину можно
задать, используя плотность распределения.
108
Плотностью совместного распределения вероятностей f(x,y)
двумерной непрерывной случайной величины (X,Y) называют
вторую смешанную частную производную от функции
распределения.
2
f(x,y) =
 F(x, y)
x y
''
= Fx
y.
Соответственно, если известна плотность распределения,
то можно найти функцию
y x
F ( x , y )    f ( u, v )dudv .
  
и р м еП
Найти плотность совместного распределения f(x,y)
системы случайных величин (X,Y) по известной функции
распределения
π
π
и 0 y  ).
2
2
производную по х от функции
F(x, y) sin x sin y ( 0 x 
Найдем частную
распределения:
F
= Fx' = cosxsiny.
x
Найдем от полученного результата частную производную
по y. В итоге получаем искомую плотность:
π
π
2F
= cosxcosy; (0  x 
; 0y
).
xy
2
2
Зная плотность совместного распределения f(x,y), можно
найти функцию распределения F(x, y).
и р м еП
Найти функцию распределения двумерной случайной
величины по данной плотности совместного распределения.
f(x, y) =
Решение:
109
1
.
π (1 x 2 )(1 y 2 )
2
y x
F(x,y)=
 π


=
=
1
π2
1
π2
y
2
1
dx dy =
(1 x 2 )(1 y 2 )
y
1

1y2

1

1y
2
x

=
)
dxdy =
1
π
π
)dy= 2 (arctgx+
)
2
2
π
1
(1 y

2

(arctgx+
y
1
(1x
2
)
dy =
1
π
π
1
1 1
(arctg x+
)(arctg y+
)=(
arctg x+ )(
arctg
2
2
2
π
2 π
π
1
).
2
д йуоцчйиКфручтуцчнО
1. Двумерная плотность вероятности неотрицательная
f(x, y) 0.
2. Двойной несобственный интеграл с бесконечными пределами
от двумерной плотности равен 1
y+

 f(x, y) dxdy = 1.

в ч цпитнмКфручтуцчмоКймху чтуцчнКцуцчийр
нэК
тмфхмх йтуоКлйщс мхтуоКцрщяиотуоКймрнянт
Пусть известна плотность совместного распределения
вероятностей системы 2-х случайных величин. Найдем плотности
распределения каждой из составляющих.
Плотность распределения составляющей Х:

f1(x) =
f(x, y)dy .

Плотность распределения составляющей Y:

f2(y) =
f(x, y)dx .

110
Итак, плотность распределения одной из составляющих
равна несобственному интегралу с бесконечными пределами от
плотности совместного распределения системы, причем
переменная интегрирования соответствует другой составляющей.
Числовые характеристики случайных
величин, входящих в двумерную величину
Числовая
характеристика
МатематиМХ
ческое
ожидание:
МY
Дисперсия
DX
Для дискретных
n
m
 
Для непрерывных
 
  xf(x, y)dxdy
xipij
i 1
j 1
 
n
m
 
i 1
j 1
n
m
 
 
i 1
  yf(x, y)dxdy
yj pij
 
 
(xi–MX)2pij
j 1
  (x–
 
MX)2f(x,y)dxdy
DY
n
m
 
i 1
 
(yi–MY)2pij
j 1
  (y–
 
MY)2f(x,y)dxdy
Среднее
квадратическое
отклонение
σx = DX
σy = DY
Точка (MX, MY) называется
двумерной случайной величины (X, Y).
центром
рассеивания
Условные законы распределения
Для того, чтобы исчерпывающим образом охарактеризовать систему, недостаточно знать распределение каждой из
величин, входящих в систему. Нужно еще знать зависимость
111
между величинами, входящими в систему. Эта зависимость
может быть охарактеризована с помощью условных законов
распределения.
Условным законом распределения величины Х, входящей в
систему (X,Y), называется ее закон распределения, вычисленный
при условии, что другая случайная величина Y приняла
определенное значение y.
Зная закон распределения двумерной случайной величины,
можно вычислить условные законы распределения составляющих.
Для дискретных случайных величин:
n
p(xi yj )
p(xi│yj) =
,
p(yj )
где p(yj) =
 p(x
i
,yj),
i 1
m
p(xi yj )
,
где p(xi) =  p(x i , y j ) .
p(xi )
j 1
Сумма условных вероятностей распределения равна 1.
p(yj│xi) =
и р ме
Дискретная двумерная случайная величина задана таблицей
Y
X
x1
0,1
0,06
y1
y2
x2
0,3
0,18
x3
0,2
0,16
Найти условный закон распределения составляющей Х, при
условии, что составляющая Y = y1.
Решение:
P(xi|y1) =
p(xi y1)
.
p( y1)
Найдем р(у1):
3
р(у1) =
 p(x y ) =0,1+0,3+0,2=0,6,
i
1
i
1
p(x1│y1) =
0,1
1
 ,
0,6 6
112
p(x2│y1) =
p(x3│y1) =
p( x 2y1)
p( y1)
p( x3 y1)
p( y1)


0,3
3
 ,
0,6 6
0,2
0,6

2
6
.
Проверка:
1
6

1
3

2
6

6
6
1 .
Условный закон распределения.
(x1|y1)
P(X│y1)
(x2|y1)
(x3|y1)
1
3
2
6
6
6
Для непрерывных случайных величин условный закон
распределения можно задавать как функцией распределения, так
и плотностью. Условная функция распределения обозначается
F(x|y), условная плотность f(x|y).
Если известна плотность совместного распределения f(x, y),
то условные плотности составляющих могут быть найдены по
формулам:
f ( x y )  
f ( x, y )

f (x, y )
f2 ( y ) ,

f ( x, y )
f1 ( x ) ,
f (x, y )dx

f ( y x ) 
f (x, y )
f (x, y )dy

где f1(x) и f2(y)-функции плотностей составляющих.
Если мы запишем формулы в виде:
f(x1y) = f2(y)f(x|y)
113
f(x1y) = f1(x)f(y|x),
то можно заключить, что умножая закон распределения
одной из составляющих на условный закон распределения другой
составляющей, найдем закон распределения системы случайной
величины.
д йуоцчйиКщцруйтуоКфручтуцчнО
1. f(x|y)  0 и f(y|x)  0.




2.
f (x | y )dx 1 и
f ( y | x )dy 1.
Условное математическое ожидание
Условным математическим ожиданием дискретной случайной величины Y при X=x (x–определенное возможное значение Х)
называют произведение возможных значений Y на их условные
вероятности:
m
M(Y|X = x)=
y
j
p( y j | x ) .
j 1
Для непрерывных величин

M(Y|X = x) =
yf ( y | x )dy ,

X=x.
где f(y|x) – условная плотность случайной величины Y при
Условное математическое ожидание М(Y|x) есть функция от
х, которую называют функцией регрессии Y на Х.
Аналогично определяются условное математическое
ожидание случайной величины Х и функция регрессии М(Х│y) X
на Y.
и р ме
Дискретная двумерная случайная величина задана таблицей:
Y
X
114
x1 = 1
0,15
0,3
y1 = 3
y2 =6
x2 = 3
0,06
0,1
x3 = 4
0,20
0,08
x4 = 8
0,09
0,02
Найти условное математическое ожидание при Х = х1 =1.
Построить линию регрессии.
Решение:
2
1) найдем p(x1) =
p(x y
1
j
) = 0,15+0,3 = 0,45.
j
1
2) найдем условное распределение вероятности:
p( x1y1 ) 0,15 1

 ,
p( x1 )
0,45 3
p( x1y2 )
0,3 2

 .
p(y2│x1) =
p( x1 )
0,45 3
p(y1│x1) =
3) условное математическое ожидание:
2
M(Y|x1)=

j 1
1
2
y j p( y j | x 1 ) 3   6  5 .
3
3
Аналогично находятся условные математические ожидания
для всех значений случайной величины X.
Для построения линии регрессии составим таблицу
значений случайной величины X и соответствующие им
условные математические ожидания (УМО):
X
УМО
1
5
3
4,8
4
3,8
8
3,5
Рис. 34. Линия регрессии Y на X
Зависимые и независимые случайные
величины
Необходимые и достаточные условия:
е мухмс иКРО
К
115
Для того, чтобы случайные величины Х и Y были
независимыми, необходимо и достаточно, чтобы функция
распределения системы (X,Y) была равна произведению
функций распределения составляющих:
F(x,y)=F1(x)F2(ш).
е мухмс иКСО
К
Для того, чтобы непрерывные случайные величины Х и Y
были независимыми, необходимо и достаточно, чтобы
плотность совместного распределения системы (X,Y) была
равна произведению плотностей распределения составляющих:
f(x,y)=f1(x)f2(y).
Если же случайные величины зависимы, то нам надо
каким-то образом охарактеризовать эту зависимость. Такими
характеристиками являются ковариация и корреляция.
Коэффициенты ковариации и корреляции.
Ковариацией случайной величины X и Y называют число
σxy= cov(X,Y), равное математическому ожиданию произведения
отклонений этих величин от своих математических ожиданий.
σxy = cov(X,Y) = M[(X–M[X])(Y–M[Y])].
Для дискретных случайных величин X:(x1,…,xn), Y:(y1,…,ym)
n m
сov(X,Y)=   ( x i  M [ X ])( y j  M [Y ]) p ij .
i 1 j 1
Для непрерывных случайных величин:
сov(X,Y)=
 
 ( x  M [ X ]) ( y  M [Y ])  f ( x , y ) dxdy

,
где f(x,y) – плотность распределения двумерной случайной
величины.
Ковариация может быть также найдена по формуле:
сov(X,Y)=M(X,Y) – M[X]M[Y].
Если X и Y независимы, то cov(x,y) = 0. Обратное, однако,
не верно.
116
д йуоцчйиКпуйихниюннО
1) cov(X,Y) = cov(Y,X);
2) cov(X,X) = D[X];
3) cov(X+c, Y+c)=cov(X,Y);
4) cov(c1X+c2Y,Z) = c1cov(X,Z)+c2cov(Y,Z), где c1 и с2 – константы.
Коэффициент ковариации cov(X,Y) линейно зависит от
выбранного масштаба измерения исходных параметров. Нам,
однако, нужна характеристика, которая не связана с масштабом
измерения исходных параметров. Для получения такой
характеристики переходим от исходных случайных величин к
нормированным:
Zx =
X  M[X ]
D[X ]
.
В качестве безразмерной характеристики зависимости
случайных величин X,Y используют коэффициент корреляции ρxy,
равный ковариации нормированных случайных величин:
Z1 =
X M[X ]
ρxy 
D[X ]
; Z2 =
Y  M[Y ]
D[Y ]
;
cov( X,Y )
cov( X ,Y )

.
σ
[X ]σ[Y ]
D[X ]  D[Y ]
Другими словами коэффициент корреляции – это
отношение коэффициента
ковариации
к произведению
среднеквадратических отклонений случайных величин.
д йуоцчйуКпу ыынюнмтчиКпуххмр юннТ
–1  ρxy  1.
Для независимой случайной величины ρxy = 0 (обратное не
верно).
и р ме
Для предыдущего примера
ковариации и корреляции.
Y
117
X
x1 = 1
посчитаем
коэффициенты
F(y)
x2 = 3
x3 = 3
x4 = 8
y1 = 3
y2 = 6
F(x)
0,25
0,15
0,4
0,2
0,1
0,3
0,13
0,05
0,18
0,1
0,02
0,12
0,68
0,32
1
M[X] = 10,4+30,3+40,18+80,12=2,98; D[X] = 4,8; σx = 2,18;
M[Y] = 30,68=60,32=3,96; D[Y] = 1,95; σy = 1,4;
4
cov(X,Y) =
2
( x –M[X])(y –M[Y])p =(x –M[X])(y –M[Y])p
i
j
ij
1
1
+
11
i
1 j
1
(x1–
–M[X])(y2 – M[Y]) p12+(x2–M[X])(y1–M[Y]) p21+
+(x2–M[X])(y2 –M[Y]) p22 +…
cov(X,Y)= – 0,43.
ρxy =
cov( x, y)
σ yσx
 0,43

 0,14 .
1,4 2,18
Если ρxy < 0, то говорят, что корреляция отрицательная или
обратная.
Если ρxy > 0, то корреляция положительная или прямая.
Ковариационная и корреляционная
матрицы
Ковариационной матрицей случайных величин х1 ,х2 ,…..,хn
называется матрица Σ, элементами которой являются ковариации
σ ij cov( x i x j )
⎛ σ 11 σ 12 ... σ 1n ⎞
⎜
⎟
σ
σ
...
σ
22
2 n ⎟ .
Σ  ⎜ 21
... ... ... ⎟
⎜ ...
⎜ σ
⎟
⎝ n1 σ n 2 ... σ nn ⎠
Из свойств cov следует, что ковариационная матрица
является симметричной σij = σji, а ее диагональные элементы
равны дисперсиям.
118
⎛ D [ X 1 ] σ 12
⎜
σ
D[X 2 ]
Σ  ⎜ 21
...
⎜ ...
⎜ σ
σ n2
⎝ n1
...
σ 1n ⎞
⎟
... σ 2 n
⎟ .
...
... ⎟
... D [ X n ]⎟⎠
Если случайные величины не зависимы, то
0
⎛ D [ X 1 ]
⎜
0
D[X 2 ]
Σ  ⎜
...
⎜ ...
⎜ 0
0
⎝
...
0 ⎞
⎟
...
0
⎟ .
...
... ⎟
... D [ X n ]⎟⎠
Корреляционной матрицей случайной величины х1,…,xn
называется
матрица R, элементами которой является
коэффициент корреляции ρij
⎛ 1 ρ 12 ... ρ 1n ⎞
⎜
⎟
ρ 21 1 ... ρ 2 n
⎜
⎟ .
R 
⎜ ... ... ... ... ⎟
⎜ ρ ρ
⎟
⎝ n1 n 2 ... 1 ⎠
Корреляционная матрица является симметричной ρij = ρji.
Диагональные элементы корреляционной матрицы равны
единице.
119
Задачи
д нцчмс и Кцрщяиот э КймрнянтОКг мкхмццн ОКа уйихниюн КнК
пуххмр юн О
229. Задано распределение вероятностей дискретной двумерной
случайной величины:
X
Y
3
10
12
4
0,17
0,13
0,25
5
0,10
0,30
0,05
Найти законы распределения составляющих X и Y.
230. Задана функция распределения двумерной случайной
величины:
⎧⎪ 1  2  x  3  y  3  x  y x  ,0 y  0
F ( x , y )  ⎨
⎪⎩ 0 x  ,0 y  0
.
Найти двумерную плотность вероятности системы.
231. Задана функция распределения двумерной случайной
величины:
120
⎧ ( 1  e  4 x ) ( 1  e  2 y ) x  ,0 y  0
⎪
F ( x , y )  ⎨
⎪⎩ 0 x  ,0 y  0
.
Найти двумерную плотность вероятности системы.
232. Задана дискретная двумерная случайная величина (X,Y):
X
Y
3
6
10
0,25
0,10
14
0,15
0,05
18
0,32
0,13
Найти: а) условный закон распределения составляющей X
при условии, что составляющая Y приняла значение у = 10;
б) условный закон распределения составляющей Y при
условии, что составляющая X приняла значение x = 6.
233. Задана дискретная двумерная случайная величина (X,Y):
X
121
Y
2
5
8
0,4
0,15
0,3
0,35
0,8
0,05
0,12
0,03
Найти: а) безусловные законы распределения составляющих; б) условный закон распределения составляющей
X при условии, что составляющая Y приняла значение у =
0,4;
в) условный закон распределения составляющей Y при
условии, что составляющая X приняла значение x = 5;
г) найти условные математические ожидания M(X|y = 0,4) и
M(Y|x = 5); д) построить регрессию случайной величины Y
на X; е) найти коэффициенты ковариации и корреляции.
234. Задано распределение вероятностей дискретной двумерной
случайной величины:
Y
X
26
30
41
50
2,3
0,05
0,12
0,08
0,04
2,7
0,09
0,3
0,11
0,21
Найти: а) безусловные законы распределения составляющих; б) условный закон распределения составляющей
X при условии, что составляющая Y приняла значение
у=2,3;
в) условный закон распределения составляющей Y при
условии, что составляющая X приняла значение x = 41;
г) найти условные математические ожидания M(X|y = 2,3) и
M(Y|x= 41); д) построить регрессию случайной величины Y
на X; е) найти коэффициенты ковариации и корреляции.
122
123
Скачать