Лекция 4 1.6 Формула полной вероятности. Формула Байеса Теорема 1 (формула полной вероятности). Пусть события H1 , H 2 ,, H n образуют полную группу несовместных событий. Будем эти события называть гипотезами. Тогда вероятность любого события А того же поля событий равна: n P A P H i P A / H i (1.17) i 1 Доказательство. Так как события H1 , H 2 ,, H n образуют полную группу событий, то событие A можно представить в виде: A A AH1 AH 2 AH n (это означает, что собы- тие может произойти А только вместе с одним из событий H1 H n ). Так как события H1 , H 2 ,, H n несовместны то: n n i 1 i 1 P A P AH1 P AH 2 P AH n PH i A PH i P A / H i Пример 1. Детали поступают на конвейер с трех станков. Первый станок производит 25% всех деталей, второй 35% и третий 40% деталей. Первый станок выпускает 1% бракованных деталей, второй 3% , третий 5%. Определить вероятность того, что случайно выбранная с конвейера деталь окажется бракованной. Решение. Введем обозначения событий: A - деталь окажется бракованной; события H1 , H 2 , H 3 - деталь изготовлена соответственно первым, вторым или третьим производителем. По условию задачи: P H1 0, 25 , P H 2 0,35 , P H3 0, 40 ; P A / H1 0,01 , P A / H 2 0,03 , P A / H3 0,05 . По формуле полной вероятности находим: P A P H1 P A / H1 P H 2 P A / H 2 P H3 P A / H3 0, 25 0, 01 0,35 0, 03 0, 40 0, 05 0, 033 Теорема 2 (формула Байеса). Пусть событие , которое могло произойти вместе с одним из событий H1 , H 2 ,, H n , образующих полную группу несовместных событий, наступило. Тогда условная вероятность того, что осуществилась гипотеза H i равна: PH i / PH i P / H i PH i P / H i n , i 1, n P PH i P / H i (1.18) i 1 21 Поскольку данная формула позволяет вычислить апостериорные вероятности по априорным, то ее также называют формулой переоценки гипотез. Доказательство. По определению условной вероятности: P Hi / P H i A P Hi P / Hi . n P P Hi P / Hi i 1 Пример 3. В условиях примера 1 определить вероятность того, что взятая деталь была изготовлена на первом станке, если она оказалась бракованной. Решение. Требуется переоценить вероятность гипотезы H1 . По формуле Байеса имеем: P H1 / P H1 P / H 3 0, 25 0, 01 0, 076 . P 0, 033 Вероятность стала меньше, поскольку если деталь оказалась бракованной, то более вероятно, что она произведена вторым, либо третьим станком. Пример 4. В корзине находится один шар - с равной вероятностью белый или черный. В корзину опускается белый шар, и после перемешивания извлекается один шар. Он оказался белым. Какова вероятность, что в корзине остался белый шар. Решение. Пусть гипотеза Н1 - в корзине исходно находится белый шар, гипотеза H 2 - в корзине находится черный шар. Так как с равной вероятностью в корзине может находиться как белый, так и черный шар, то: PH 1 PH 2 1 . После того, как в корзину был 2 опущен белый шар, вероятность вынуть белый шар (событие A ) в предположении гипотезы Н1 есть: P A / H1 1 . Аналогично, вероятность вынуть белый шар в предположении гипотезы Н 2 : P A / H 2 1 . Следовательно по формуле полной вероятности: 2 P A P H 1 P A / H 1 P H 2 P A / H 2 1 1 1 3 1 . 2 2 2 4 Тогда вероятность, что в корзине остался белый шар (то есть верна гипотеза H1 ): P H 1 / A PH 1 P A / H 1 1 3 2 . P A 2 4 3 Пример 5. Два стрелка стреляют по мишени, делая по одному выстрелу. Вероятность попадания для первого стрелка 0,8, для второго – 0,4. После стрельбы в мишени обнаружена только одна пробоина. Найти вероятность того, что попал первый стрелок. Решение. Некоторая сложность в данной задаче состоит в том, что мы уже решали аналогичную прямую задачу, не привлекая при этом формулу полной вероятности. 22 Введем обозначения: C - попал в цель только один стрелок, A первый стрелок попал в цель, B -второй стрелок попал в цель. Тогда: C AB A B . То есть, можно считать, что событие C может наступить в результате осуществления двух гипотез: H1 AB - попал в цель только первый стрелок, H 2 A B - попал в цель только второй стрелок. Имеем: PH1 0,8 0,6 0,48 , PH 2 0,2 0,4 0,08 , PC / H1 1 , PC / H 2 1 . PC 0,48 0,08 0,56 . PH1 / C PH1 PC / H1 0,48 1 6 . PC 0,56 7 1.7 Схема испытаний Бернулли. 1.7.1 Формула Бернулли Часто встречаются задачи, в которых одно и то же испытание повторяется многократно. В результате каждого испытания может появиться или не появиться некоторое событие A . Нас будет интересовать число наступлений события A в серии из n испытаний. Определение 1. Схемой Бернулли называется последовательность независимых испытаний, в каждом из которых возможны лишь два исхода – появление события A (“успех”) или не появление его (“неудача”), при этом “успех” в каждом испытании происходит с вероятностью p , а неудача с вероятностью q 1 p . Теорема (формула Бернулли). Вероятность того, что в n испытаниях по схеме Бернулли “успех” наступит ровно m раз: Pn m Cnm p m q nm (1.19) Доказательство. Все n испытаний можно рассматривать как одно сложное испытание, имеющее 2 n возможных исходов. (Например, при n 2 возможные исходы такого сложного испытания – ( A, A), ( A, A ), ( A , A), ( A , A ) ). 1) Число благоприятных исходов равно числу способов, которыми можно расположить m успехов на n различных местах, то есть равно C nm . 2) Вероятность каждого отдельного исхода можно подсчитать по формуле произведения вероятностей независимых событий. Например, вероятность появления комбинации: p p p q q q p m q n m . Очевидно, что вероятности A, A , A, A , A , A равна , m nm m nm остальных комбинаций равны также p m q nm . Поскольку все исходы являются несовместными событиями, то вероятность, что событие A в n испытаниях появится ровно m раз: Pn m p m q n m p m q n m p m q n m C nm p m q n m . 23 Определение 2. Числа Pn m C nm p m q n m , m 1, 2 ,, n называются биномиальными вероятностями. Пример 1. Для контроля качества из партии деталей отбирается 5 деталей. Партия бракуется, если в выборке хотя бы две бракованные детали. Найти вероятность того, что партия будет забракована, если каждая деталь может оказаться бракованной с вероятностью 0,01. Решение. Найдем вероятность того, что в выборке из 5 деталей будет не более одной бракованной детали: P5 (0 m 1) P5 (0) P5 (1) C50 (0,01) 0 (0,99) 5 C51 (0,01)1 (0,99) 4 0,99902 . Тогда вероятность того, что партия будет забракована: P 1 099902 0,00098 . Если каждое испытание имеет k исходов, вероятности которых p k p1 , p 2 ,, p k , 1 , то вероятность того, что в n испытаниях первый исход появится m1 раз, второй k исход появится m2 раз и т.д. определится по формуле: P n! m m m p1 1 p 2 2 p k k . m1!m2 ! mk (1.20) Доказательство формулы аналогично случаю двух исходов. 1.7.2 Наивероятнейшее число успехов. Определение 3. Число успехов m 0 , которому соответствует наибольшая вероятность в испытаниях по схеме Бернулли, называется наивероятнейшим числом успехов. Для нахождения m0 исследуем поведение биномиальных вероятностей Pn (m) с ростом m . Найдем отношение: Pn m C nm p m q nm n!m 1!n m 1! p n m 1 p m1 m1 nm1 Pn m 1 C n p q m!n m !n! q mq n m 1 p n m 1 p mq 1 n m 1 p m1 p 1 pn 1 m 1 1 1 mq mq mq mq Pn m будет больше Pn m 1 , если их отношение будет больше единицы, то есть когда pn 1 m 0 . Таким образом, с ростом m последовательность вероятностей Pn m будет возрастать до тех пор, пока m pn 1 . Kак только m станет больше, чем pn 1 последовательность Pn m начнет убывать. Если существует m такое, что m pn 1 , то в этом случае существуют два значения случайной величины обладающие наибольшей вероятностью m01 pn 1 и m02 pn 1 1 , так как при этом Pm 1 . Если нет такого значеPm 1 24 ния m pn 1 , то значением, обладающим наибольшей вероятностью, будет последнее значение, для которого pn 1 m 0 , то есть в этом случае наивероятнейшее число успехов m0 pn 1 . Наивероятнейшее число успехов может совпасть с первым значением m 0 , либо с последним m n , соответственно последовательность Pn (m) будет либо убывающей, либо возрастающей. 1.7.3 Локальная и интегральная формулы Муавра-Лапласа. Формула Пуассона. При больших значениях n и m вычисление вероятностей по формуле Бернулли (1.19) представляет значительные трудности. В этих случаях для подсчета биномиальных вероятностей используют приближенные формулы. 1. Локальная формула Муавра-Лапласа. Вероятность того, что в n испытаниях по схеме Бернулли “успех” наступит ровно m раз при n 1 приближенно равна: Pn (m) 1 npq ( x) , где ( x) 1 2 e x 2 /2 , x m np (1.21) npq 2. Интегральная формула Муавра-Лапласа. Вероятность того, что в n испытаниях по схеме Бернулли “успех” наступит не менее m1 раз и не более m2 раз, при n 1 приближенно равна: Pn (m1 m m2 ) ( x2 ) ( x1 ) , где ( x) 1 x e 2 t 2 / 2 (1.22) dt - функция Лапласа, x1 0 m1 np npq , x2 m 2 np npq . Функция Лапласа является табулированной функцией. При использовании таблиц следует учитывать, что ( x) ( x) , lim ( x) 0,5 . x Пример 2. Монета подбрасывается 1000 раз. Найти вероятность того, что орел появится не менее 480 раз и не более 520 раз. Решение. По условию n 1000 , p 0,5 , q 1 p 0,5 , m1 480 , m2 520 . Воспользуемся интегральной формулой Муавра-Лапласа. Вычислим x1 и x 2 : x1 480 1000 0,5 1000 0,5 0,5 1,265 , x2 580 1000 0,5 1000 0,5 0,5 1,265 . По таблице функции Лапласа находим (1,265) 0,397 и, учитывая нечетность функции Лапласа, находим искомую вероятность: P1000 (480 m 520) ( x2 ) ( x1 ) 0,794 . Если вероятность успеха в одном испытании мала ( p 1 ), лучше вместо формулы (1.21) использовать приближенную формулу Пуассона, дающую в этом случае меньшую погрешность. 25 3. Формула Пуассона. Вероятность того, что в n испытаниях по схеме Бернулли “успех” наступит ровно m раз при n 1 и p 1 приближенно равна: Pn (m) m e m! , где np (1.23) Формулу Пуассона можно применять также вместо формулы Бернулли, если число испытаний велико и точно неизвестно, но известно среднее число появлений события в этой серии испытаний. Пример 3. Наборщик делает, в среднем, по одной опечатке на страницу. Считая, что вероятность опечатки каждого символа постоянна и не зависит от других опечаток, найти вероятность того, что на наудачу выбранной странице не более двух опечаток. Решение. Очевидно, что вероятность того или иного числа опечаток на странице определяется по формуле Бернулли. Однако, мы не знаем ни точного числа символов на странице, ни вероятность одной опечатки, чтобы воспользоваться этой формулой. Но поскольку нам известно среднее число опечаток, причем n 1 и p 1 , то можно воспользоваться формулой Пуассона с параметром 1 . Вероятность того, что страница содержит не более двух опечаток P X 2 P X 0 P X 1 P X 2 10 e 1 11 e 1 12 e 1 5 e 1 1 1 1 2 0,92 . 0! 1! 2! 2e 26