СИСТЕМА СЛУЧАЙНЫХ ВЕЛИЧИН В практических применениях теории вероятностей часто приходится сталкиваться с задачами, в которых результат опыта описывается не одной, а двумя или более случайными величинами. Эти величины образуют систему случайных величин. Например, параметры-показатели, результаты анализов пациента. Случайными величинами в таком исследовании будут: рост, вес, возраст, температура, давление, содержание химических элементов в крови. Условимся систему нескольких случайных величин обозначать (Χ1, X2, …, Xn). Многомерная случайная величина Функция распределения многомерной случайной величины Cистему случайных величин также называют многомерной случайной величиной. Как и в одномерном случае, для того, чтобы полностью описать многомерную случайную величину существует функция распределения, n – мерной случайной величины, которая определяется формулой: F(x1, x2,…, .xn) = P(X1 < x1; X2 < x2, …,Xn < xn). Многомерная функция распределения обладает следующими свойствами: 1. F(x1,x2,…,xn) не убывает по каждому аргументу. 2. Непрерывна слева по каждому аргументу. 3. Стремится к 0, если хотя бы один аргумент стремится к – . lim F( x1, x2 ,..., xn ) 0 , xi (1 i n). 4. Cтремится к 1, если все аргументы одновременно стремятся к + limF(x1, x2 ,..., xn ) 1, x1 + ;…., xn + . 104 5. Если часть аргументов функции стремится к + получается функция остальных аргументов , то lim F( x1 , x2 ,..., xk , xk 1 ,..., xn ) F( x1 , x2 ,..., xk ) , если xk+1 +;….,xn +. Распределение непрерывной многомерной случайной величины можно охарактеризовать плотностью вероятностей: n F f ( x1,..., xn ) . x1 xn Это – n-я смешанная частная производная от функции распределения. При зтом функция распределения выражается через плотность вероятности формулой x1 x 2 xn F ( x 1 ,..., x n ) ... ... f ( t1 ,..., t n )dt 1 ,..., dt n . д йуоцчйуКыщтпюннКфручтуцчн Неотрицательная для любых х1, х2,…, xn ... ... f ( t1 ,..., t n )dt1 ,..., dt n 1 . Двумерные случайные величины Функцией распределения системы двух случайных величин (X,Y) называется вероятность совместного выполнения двух неравенств X < x, Y < y F(x, y) = P[(X < x)(Y < y)]. Для понимания удобно воспользоваться геометрической интерпретацией системы. Систему двух случайных величин можно изобразить случайной точкой на плоскости с координатами (Х, Y). Тогда функция распределения F(x, y) есть не что иное, как вероятность попадания случайной точки (x, y) в бесконечный квадрант с вершиной в точке (x, y), лежащий левее и ниже ее. 105 Рис. 33. бесконечный квадрант с вершиной в точке (x,y) Сформулируем основные свойства для функции двумерной случайной величины: 1. Функция распределения F(x) есть неубывающая функция обоих своих аргументов, т.е. F(x2, y) F(x1, y) при х2 > x1, F(x, y2) F(x, y1) при y2 > y1. 2. Если хотя бы один аргумент стремиться к – , то F(x,y) стремится к 0 F(x,–) = F(–, y) = F(–, –) = 0. 3. При одном из аргументов, равном +, функция распределения системы превращается в функцию распределения случайной величины, соответствующей другому аргументу F(x, +) = F2(x), F(+, y) = F2(y), где F1(x) и F2(y) – соответственно функции распределения случайной величины X и Y. 106 4. Если оба аргумента равны +, функция распределения системы равна единице F(+, +) = 1. 5. Из определения функции и ее свойств можно заключить следующее: 0 F(x, y) 1. Как и одномерную, двумерную случайную величину можно задать различными способами: табличным, графическим, аналитическим. Как и одномерные, многомерные случайные величины делятся на дискретные, непрерывные и смешанные. Для начала рассмотрим дискретную двумерную случайную величину. Законом распределения дискретной двумерной случайной величины называют перечень возможных значений этой величины, т.е. пар чисел (x,y) и их вероятностей p(xi,yi) (i =1,…,n; j = 1, 2,…,m). Обычно закон распределения дискретной двумерной случайной величины задают в виде таблицы с двойным входом: Y X x1 x2 … xi … xn y1 p(x1,y1) p(x2,y1) … p(xi,y1) … p(xn,y1) … yj … p(x1,yj) … p(x2,yj) … … … p(xi,yj) … … … p(xn,yj) … ym … p(x1,ym) … p(x2,ym) … … … p(xi,ym) … … … p(xn,ym) p p F1(x) 1 F2(y) … 2 p … p i p 1 … p j … p m 1 n где F1(x), F2(y) – одномерные функции распределения случайных величин X и Y соответственно, а p n p( xi y j ) . i 1 107 m = p ( x i y i ) и p j = i j 1 Так как события (Х=хi), (Y=yj) i = 1,2, ,n), j = 1, 2, , m) образуют полную группу, то сумма вероятностей p(xi, yj) = 1, т.е. n i 1 m p ( x i y j ) 1 . j 1 Зная закон распределения двумерной дискретной случайной величины, можно найти законы распределения каждой из составляющих. Для этого надо сложить вероятности по строкам или по столбцам соответственно. и р м еП Найти законы распределения составляющих двумерной случайной величины, заданной законом распределения. Y X x1 x2 x3 y1 0,1 0,3 0,2 y2 0,06 0,18 0,16 Решение: Найдем закон распределения случайной величины Х: p(x1) = 0,1 + 0,06 = 0,16 p(x2) = 0,3 + 0,18 = 0,48 p(x3) = 0,2 + 0,16 = 0,36 Проверим: p(x1)+p(x2)+p(x3)= 0,16+0,48+0,36 = 1. Теперь найдем закон распределения случайной величины Y: p(y1) = 0,1+0,3+0,2=0,6, p(y2) = 0,06+0,18+0,16=0,4; проверим p(y1)+p(y2) = 0,6+0,4 = 1 Итак, мы нашли законы распределения составляющих двумерной случайной величины X p(x) x1 0,16 x2 0,48 x3 0,32 Y p(y) y1 0,6 y2 0,4 Непрерывную двумерную случайную величину можно задать, используя плотность распределения. 108 Плотностью совместного распределения вероятностей f(x,y) двумерной непрерывной случайной величины (X,Y) называют вторую смешанную частную производную от функции распределения. 2 f(x,y) = F(x, y) x y '' = Fx y. Соответственно, если известна плотность распределения, то можно найти функцию y x F ( x , y ) f ( u, v )dudv . и р м еП Найти плотность совместного распределения f(x,y) системы случайных величин (X,Y) по известной функции распределения π π и 0 y ). 2 2 производную по х от функции F(x, y) sin x sin y ( 0 x Найдем частную распределения: F = Fx' = cosxsiny. x Найдем от полученного результата частную производную по y. В итоге получаем искомую плотность: π π 2F = cosxcosy; (0 x ; 0y ). xy 2 2 Зная плотность совместного распределения f(x,y), можно найти функцию распределения F(x, y). и р м еП Найти функцию распределения двумерной случайной величины по данной плотности совместного распределения. f(x, y) = Решение: 109 1 . π (1 x 2 )(1 y 2 ) 2 y x F(x,y)= π = = 1 π2 1 π2 y 2 1 dx dy = (1 x 2 )(1 y 2 ) y 1 1y2 1 1y 2 x = ) dxdy = 1 π π )dy= 2 (arctgx+ ) 2 2 π 1 (1 y 2 (arctgx+ y 1 (1x 2 ) dy = 1 π π 1 1 1 (arctg x+ )(arctg y+ )=( arctg x+ )( arctg 2 2 2 π 2 π π 1 ). 2 д йуоцчйиКфручтуцчнО 1. Двумерная плотность вероятности неотрицательная f(x, y) 0. 2. Двойной несобственный интеграл с бесконечными пределами от двумерной плотности равен 1 y+ f(x, y) dxdy = 1. в ч цпитнмКфручтуцчмоКймху чтуцчнКцуцчийр нэК тмфхмх йтуоКлйщс мхтуоКцрщяиотуоКймрнянт Пусть известна плотность совместного распределения вероятностей системы 2-х случайных величин. Найдем плотности распределения каждой из составляющих. Плотность распределения составляющей Х: f1(x) = f(x, y)dy . Плотность распределения составляющей Y: f2(y) = f(x, y)dx . 110 Итак, плотность распределения одной из составляющих равна несобственному интегралу с бесконечными пределами от плотности совместного распределения системы, причем переменная интегрирования соответствует другой составляющей. Числовые характеристики случайных величин, входящих в двумерную величину Числовая характеристика МатематиМХ ческое ожидание: МY Дисперсия DX Для дискретных n m Для непрерывных xf(x, y)dxdy xipij i 1 j 1 n m i 1 j 1 n m i 1 yf(x, y)dxdy yj pij (xi–MX)2pij j 1 (x– MX)2f(x,y)dxdy DY n m i 1 (yi–MY)2pij j 1 (y– MY)2f(x,y)dxdy Среднее квадратическое отклонение σx = DX σy = DY Точка (MX, MY) называется двумерной случайной величины (X, Y). центром рассеивания Условные законы распределения Для того, чтобы исчерпывающим образом охарактеризовать систему, недостаточно знать распределение каждой из величин, входящих в систему. Нужно еще знать зависимость 111 между величинами, входящими в систему. Эта зависимость может быть охарактеризована с помощью условных законов распределения. Условным законом распределения величины Х, входящей в систему (X,Y), называется ее закон распределения, вычисленный при условии, что другая случайная величина Y приняла определенное значение y. Зная закон распределения двумерной случайной величины, можно вычислить условные законы распределения составляющих. Для дискретных случайных величин: n p(xi yj ) p(xi│yj) = , p(yj ) где p(yj) = p(x i ,yj), i 1 m p(xi yj ) , где p(xi) = p(x i , y j ) . p(xi ) j 1 Сумма условных вероятностей распределения равна 1. p(yj│xi) = и р ме Дискретная двумерная случайная величина задана таблицей Y X x1 0,1 0,06 y1 y2 x2 0,3 0,18 x3 0,2 0,16 Найти условный закон распределения составляющей Х, при условии, что составляющая Y = y1. Решение: P(xi|y1) = p(xi y1) . p( y1) Найдем р(у1): 3 р(у1) = p(x y ) =0,1+0,3+0,2=0,6, i 1 i 1 p(x1│y1) = 0,1 1 , 0,6 6 112 p(x2│y1) = p(x3│y1) = p( x 2y1) p( y1) p( x3 y1) p( y1) 0,3 3 , 0,6 6 0,2 0,6 2 6 . Проверка: 1 6 1 3 2 6 6 6 1 . Условный закон распределения. (x1|y1) P(X│y1) (x2|y1) (x3|y1) 1 3 2 6 6 6 Для непрерывных случайных величин условный закон распределения можно задавать как функцией распределения, так и плотностью. Условная функция распределения обозначается F(x|y), условная плотность f(x|y). Если известна плотность совместного распределения f(x, y), то условные плотности составляющих могут быть найдены по формулам: f ( x y ) f ( x, y ) f (x, y ) f2 ( y ) , f ( x, y ) f1 ( x ) , f (x, y )dx f ( y x ) f (x, y ) f (x, y )dy где f1(x) и f2(y)-функции плотностей составляющих. Если мы запишем формулы в виде: f(x1y) = f2(y)f(x|y) 113 f(x1y) = f1(x)f(y|x), то можно заключить, что умножая закон распределения одной из составляющих на условный закон распределения другой составляющей, найдем закон распределения системы случайной величины. д йуоцчйиКщцруйтуоКфручтуцчнО 1. f(x|y) 0 и f(y|x) 0. 2. f (x | y )dx 1 и f ( y | x )dy 1. Условное математическое ожидание Условным математическим ожиданием дискретной случайной величины Y при X=x (x–определенное возможное значение Х) называют произведение возможных значений Y на их условные вероятности: m M(Y|X = x)= y j p( y j | x ) . j 1 Для непрерывных величин M(Y|X = x) = yf ( y | x )dy , X=x. где f(y|x) – условная плотность случайной величины Y при Условное математическое ожидание М(Y|x) есть функция от х, которую называют функцией регрессии Y на Х. Аналогично определяются условное математическое ожидание случайной величины Х и функция регрессии М(Х│y) X на Y. и р ме Дискретная двумерная случайная величина задана таблицей: Y X 114 x1 = 1 0,15 0,3 y1 = 3 y2 =6 x2 = 3 0,06 0,1 x3 = 4 0,20 0,08 x4 = 8 0,09 0,02 Найти условное математическое ожидание при Х = х1 =1. Построить линию регрессии. Решение: 2 1) найдем p(x1) = p(x y 1 j ) = 0,15+0,3 = 0,45. j 1 2) найдем условное распределение вероятности: p( x1y1 ) 0,15 1 , p( x1 ) 0,45 3 p( x1y2 ) 0,3 2 . p(y2│x1) = p( x1 ) 0,45 3 p(y1│x1) = 3) условное математическое ожидание: 2 M(Y|x1)= j 1 1 2 y j p( y j | x 1 ) 3 6 5 . 3 3 Аналогично находятся условные математические ожидания для всех значений случайной величины X. Для построения линии регрессии составим таблицу значений случайной величины X и соответствующие им условные математические ожидания (УМО): X УМО 1 5 3 4,8 4 3,8 8 3,5 Рис. 34. Линия регрессии Y на X Зависимые и независимые случайные величины Необходимые и достаточные условия: е мухмс иКРО К 115 Для того, чтобы случайные величины Х и Y были независимыми, необходимо и достаточно, чтобы функция распределения системы (X,Y) была равна произведению функций распределения составляющих: F(x,y)=F1(x)F2(ш). е мухмс иКСО К Для того, чтобы непрерывные случайные величины Х и Y были независимыми, необходимо и достаточно, чтобы плотность совместного распределения системы (X,Y) была равна произведению плотностей распределения составляющих: f(x,y)=f1(x)f2(y). Если же случайные величины зависимы, то нам надо каким-то образом охарактеризовать эту зависимость. Такими характеристиками являются ковариация и корреляция. Коэффициенты ковариации и корреляции. Ковариацией случайной величины X и Y называют число σxy= cov(X,Y), равное математическому ожиданию произведения отклонений этих величин от своих математических ожиданий. σxy = cov(X,Y) = M[(X–M[X])(Y–M[Y])]. Для дискретных случайных величин X:(x1,…,xn), Y:(y1,…,ym) n m сov(X,Y)= ( x i M [ X ])( y j M [Y ]) p ij . i 1 j 1 Для непрерывных случайных величин: сov(X,Y)= ( x M [ X ]) ( y M [Y ]) f ( x , y ) dxdy , где f(x,y) – плотность распределения двумерной случайной величины. Ковариация может быть также найдена по формуле: сov(X,Y)=M(X,Y) – M[X]M[Y]. Если X и Y независимы, то cov(x,y) = 0. Обратное, однако, не верно. 116 д йуоцчйиКпуйихниюннО 1) cov(X,Y) = cov(Y,X); 2) cov(X,X) = D[X]; 3) cov(X+c, Y+c)=cov(X,Y); 4) cov(c1X+c2Y,Z) = c1cov(X,Z)+c2cov(Y,Z), где c1 и с2 – константы. Коэффициент ковариации cov(X,Y) линейно зависит от выбранного масштаба измерения исходных параметров. Нам, однако, нужна характеристика, которая не связана с масштабом измерения исходных параметров. Для получения такой характеристики переходим от исходных случайных величин к нормированным: Zx = X M[X ] D[X ] . В качестве безразмерной характеристики зависимости случайных величин X,Y используют коэффициент корреляции ρxy, равный ковариации нормированных случайных величин: Z1 = X M[X ] ρxy D[X ] ; Z2 = Y M[Y ] D[Y ] ; cov( X,Y ) cov( X ,Y ) . σ [X ]σ[Y ] D[X ] D[Y ] Другими словами коэффициент корреляции – это отношение коэффициента ковариации к произведению среднеквадратических отклонений случайных величин. д йуоцчйуКпу ыынюнмтчиКпуххмр юннТ –1 ρxy 1. Для независимой случайной величины ρxy = 0 (обратное не верно). и р ме Для предыдущего примера ковариации и корреляции. Y 117 X x1 = 1 посчитаем коэффициенты F(y) x2 = 3 x3 = 3 x4 = 8 y1 = 3 y2 = 6 F(x) 0,25 0,15 0,4 0,2 0,1 0,3 0,13 0,05 0,18 0,1 0,02 0,12 0,68 0,32 1 M[X] = 10,4+30,3+40,18+80,12=2,98; D[X] = 4,8; σx = 2,18; M[Y] = 30,68=60,32=3,96; D[Y] = 1,95; σy = 1,4; 4 cov(X,Y) = 2 ( x –M[X])(y –M[Y])p =(x –M[X])(y –M[Y])p i j ij 1 1 + 11 i 1 j 1 (x1– –M[X])(y2 – M[Y]) p12+(x2–M[X])(y1–M[Y]) p21+ +(x2–M[X])(y2 –M[Y]) p22 +… cov(X,Y)= – 0,43. ρxy = cov( x, y) σ yσx 0,43 0,14 . 1,4 2,18 Если ρxy < 0, то говорят, что корреляция отрицательная или обратная. Если ρxy > 0, то корреляция положительная или прямая. Ковариационная и корреляционная матрицы Ковариационной матрицей случайных величин х1 ,х2 ,…..,хn называется матрица Σ, элементами которой являются ковариации σ ij cov( x i x j ) ⎛ σ 11 σ 12 ... σ 1n ⎞ ⎜ ⎟ σ σ ... σ 22 2 n ⎟ . Σ ⎜ 21 ... ... ... ⎟ ⎜ ... ⎜ σ ⎟ ⎝ n1 σ n 2 ... σ nn ⎠ Из свойств cov следует, что ковариационная матрица является симметричной σij = σji, а ее диагональные элементы равны дисперсиям. 118 ⎛ D [ X 1 ] σ 12 ⎜ σ D[X 2 ] Σ ⎜ 21 ... ⎜ ... ⎜ σ σ n2 ⎝ n1 ... σ 1n ⎞ ⎟ ... σ 2 n ⎟ . ... ... ⎟ ... D [ X n ]⎟⎠ Если случайные величины не зависимы, то 0 ⎛ D [ X 1 ] ⎜ 0 D[X 2 ] Σ ⎜ ... ⎜ ... ⎜ 0 0 ⎝ ... 0 ⎞ ⎟ ... 0 ⎟ . ... ... ⎟ ... D [ X n ]⎟⎠ Корреляционной матрицей случайной величины х1,…,xn называется матрица R, элементами которой является коэффициент корреляции ρij ⎛ 1 ρ 12 ... ρ 1n ⎞ ⎜ ⎟ ρ 21 1 ... ρ 2 n ⎜ ⎟ . R ⎜ ... ... ... ... ⎟ ⎜ ρ ρ ⎟ ⎝ n1 n 2 ... 1 ⎠ Корреляционная матрица является симметричной ρij = ρji. Диагональные элементы корреляционной матрицы равны единице. 119 Задачи д нцчмс и Кцрщяиот э КймрнянтОКг мкхмццн ОКа уйихниюн КнК пуххмр юн О 229. Задано распределение вероятностей дискретной двумерной случайной величины: X Y 3 10 12 4 0,17 0,13 0,25 5 0,10 0,30 0,05 Найти законы распределения составляющих X и Y. 230. Задана функция распределения двумерной случайной величины: ⎧⎪ 1 2 x 3 y 3 x y x ,0 y 0 F ( x , y ) ⎨ ⎪⎩ 0 x ,0 y 0 . Найти двумерную плотность вероятности системы. 231. Задана функция распределения двумерной случайной величины: 120 ⎧ ( 1 e 4 x ) ( 1 e 2 y ) x ,0 y 0 ⎪ F ( x , y ) ⎨ ⎪⎩ 0 x ,0 y 0 . Найти двумерную плотность вероятности системы. 232. Задана дискретная двумерная случайная величина (X,Y): X Y 3 6 10 0,25 0,10 14 0,15 0,05 18 0,32 0,13 Найти: а) условный закон распределения составляющей X при условии, что составляющая Y приняла значение у = 10; б) условный закон распределения составляющей Y при условии, что составляющая X приняла значение x = 6. 233. Задана дискретная двумерная случайная величина (X,Y): X 121 Y 2 5 8 0,4 0,15 0,3 0,35 0,8 0,05 0,12 0,03 Найти: а) безусловные законы распределения составляющих; б) условный закон распределения составляющей X при условии, что составляющая Y приняла значение у = 0,4; в) условный закон распределения составляющей Y при условии, что составляющая X приняла значение x = 5; г) найти условные математические ожидания M(X|y = 0,4) и M(Y|x = 5); д) построить регрессию случайной величины Y на X; е) найти коэффициенты ковариации и корреляции. 234. Задано распределение вероятностей дискретной двумерной случайной величины: Y X 26 30 41 50 2,3 0,05 0,12 0,08 0,04 2,7 0,09 0,3 0,11 0,21 Найти: а) безусловные законы распределения составляющих; б) условный закон распределения составляющей X при условии, что составляющая Y приняла значение у=2,3; в) условный закон распределения составляющей Y при условии, что составляющая X приняла значение x = 41; г) найти условные математические ожидания M(X|y = 2,3) и M(Y|x= 41); д) построить регрессию случайной величины Y на X; е) найти коэффициенты ковариации и корреляции. 122 123