Теория вероятностей и математическая статистика Доктор физ.-мат. наук профессор Михаил Павлович Харламов «Страница» с методическими материалами http://vlgr.ranepa.ru/pp/hmp Волгоградский филиал РАНХиГС (ФГОУ ВПО ВАГС) Направления Экономика, социология (бакалавриат) Лекция 1 Тема Комбинаторика. Перестановки, размещения, сочетания. Содержание темы Предмет комбинаторики. Факториал и его свойства. Определения и формулы для подсчета вариантов перестановок, размещений с повторениями и без повторений, сочетаний. Использование функций Excel для расчетов комбинаций. Основные категории I I I I I I предмет комбинаторики как науки, факториал, перестановка, размещение с повторениями, размещение без повторений, сочетание. Комбинаторика Комбинаторика — это раздел математики, изучающий методы подсчета вариантов перестановок, комбинаций объектов различного рода, выбора объектов из заданного множества. Основные понятия – перестановки, размещения, сочетания. Далее будем считать заданным некоторое множество из n объектов (цифр, букв, людей, предметов и т.п.). Факториал Для любого неотрицательного целого числа n определена функция, называемая «факториал числа». Она обозначается через n! (читается как «эн факториал») и равна произведению всех целых положительных чисел от 1 до n. В случае n = 0 считается по определению, что 0! = 1. Как ведет себя факториал? Приближенная формула Муавра – Стирлинга n n √ n! ≈ 2πn . e Для вычисления n! в Excel существует функция ФАКТР(n). Задание Составить в Excel таблицу вида n n! Формула МС Погрешность Заполнить ее для n = 1, . . . , 20. Построить сравнительные графики точного и приближенного значения для n = 1, . . . , 6. Перестановки Перестановкой называется расположение заданного количества различных предметов в определенном порядке. Пусть даны n различных предметов. Количество всевозможных их перестановок обозначается через Pn и вычисляется по формуле перестановок: Pn = n! = n×(n − 1)×(n − 2)× . . . ×2×1. Примеры I Первые числа перестановок P1 = 1, I P2 = 2, P3 = 6, P4 = 24, P5 = 120. Множество всех перестановок трех предметов A, B, C: {ABC, ACB, BAC, BCA, CAB, CBA}. Размещение с повторениями Размещением с повторениями n предметов по k местам (коротко «размещение из n по k с повторениями») называется слово, составленное из k букв алфавита, содержащего n букв. Иначе говоря, имеется n типов предметов и имеется k мест, на каждое из которых может быть поставлен предмет любого типа. Любой тип предмета может встретиться в полученной последовательности любое число раз, но порядок предметов в последовательности важен, то есть расстановки выбранных предметов в разном порядке считаются разными (как слова из одних тех же букв, но переставленных). Количество всевозможных размещений с повторениями из n по k k иногда обозначается через An и вычисляется по очевидной формуле: k An = nk . Примеры использования размещений с повторениями I Сколько существует четырехсимвольных кодов (шифров сейфа) с использованием только цифр? Решение: n = 10, k = 4, поэтому различных кодов будет 104 = 10000. I Сколько различных символов можно записать кодом размером в один байт? Решение: n = 2, k = 8, поэтому различных символов с кодом размером в один байт будет 28 = 256. Это и есть так называемая кодовая страница (таблица символов размером 16 × 16). Размещение (без повторений) Размещением n предметов по k местам (коротко «размещение из n по k») называется слово, составленное из k различных букв алфавита, содержащего n букв. Иначе говоря, имеется n различных предметов и имеется k мест, на каждое из которых может быть поставлен любой предмет, но использоваться каждый предмет может только один раз. Кроме того, порядок предметов в последовательности важен. Количество всевозможных размещений из n по k обозначается через Akn и вычисляется по формуле размещений: Akn = n × (n − 1) × . . . × (n − k + 1) = n! . (n − k)! В Excel для размещений существует функция ПЕРЕСТ(n;k). Пример I Сколько существует вариантов кода из четырех различных цифр? Решение: n = 10, k = 4, поэтому различных кодов будет A410 = 10 × 9 × 8 × 7 = 5040. Сочетание Сочетанием из n по k называется вариант выбора k предметов из n без учета порядка выбора. Количество всевозможных сочетаний из n по k обозначается через Cnk и вычисляется по формуле сочетаний: Cnk = n! n × (n − 1) × . . . × (n − k + 1) = . k × (k − 1) × . . . × 1 k!(n − k)! В Excel для сочетаний существует функция ЧИСЛКОМБ(n;k). Пример и задание I Сколько существует вариантов составить делегацию в количестве четырех человек из 10 кандидатов? Решение: n = 10, k = 4, поэтому различных делегаций 4 = 10×9×8×7 = 210. будет C10 4×3×2×1 I Найти количество вариантов заполнить карточку лотереи «6 из 49». Итоговая таблица Название Формула Функция Excel Перестановки Pn = n! ФАКТР(n) Размещения с повторениями An = n k Размещения Сочетания k n! (n − k)! n! Cnk = k!(n − k)! Akn = n∧k ПЕРЕСТ(n;k) ЧИСЛКОМБ(n;k) Задачи Имеется группа студентов, в которой 10 человек изучают английский язык и 12 человек — французский. (А) Сколькими способами можно составить группу из пяти человек, изучающих один и тот же язык? («ИЛИ» — варианты складывать!) (Б) Сколькими способами можно составить группу из пяти человек, в которой три изучают английский и два — французский? («И» — варианты перемножать!) В этих примерах неважен порядок фамилий — использовать сочетания! Правило сложения вариантов Сложение Если осуществляется выбор по двум несовместимым правилам, соединенным союзом «или», то количества возможных вариантов складываются. В задаче (А) составить группу из пяти человек, все из которых изучают один и тот же язык, означает «все изучают французский» или «все изучают английский». И то, и другое одновременно произойти не может. Поэтому ответ такой: 5 5 C10 + C12 . Правило умножения вариантов Умножение Если осуществляется одновременный выбор из двух разных множеств, то есть по двум независимым правилам, соединенным союзом «и», то количества возможных вариантов перемножаются. В задаче (Б) составить группу из пяти человек, в которой три изучают английский и два изучают французский, означает, что три человека выбираются из английской подгруппы, а два – из французский. Подгруппы – это разные множества, а два выбора осуществляются одновременно. Поэтому ответ такой: 3 2 C10 × C12 . Контрольные вопросы 1. Факториал числа. 2. Определение и формула перестановок. 3. Определение и формула размещений с повторениями. 4. Определение и формула размещений. 5. Определение и формула сочетаний. 6. Функции в Excel для вычисления факториала, количества размещений и сочетаний. 7. Правило сложения вариантов. Пример. 8. Правило умножения вариантов. Пример. Лекция 2 Тема Основные понятия теории вероятностей Содержание темы Предмет ТВ. Случайное событие. Вероятность события, классическое определение вероятности. Операции с событиями. Графическое представление в виде диаграмм Эйлера–Венна. Основные категории I I I I I I случайное событие, вероятность события, невозможное и достоверное события, совместные и несовместные события, полная группа событий, сложение и умножение событий, противоположное событие, диаграмма Эйлера–Венна. Теория вероятностей, ее предмет и задачи Теория вероятностей (ТВ) — раздел математики, изучающий закономерности, присущие массовым случайным явлениям. При этом изучаемые явления рассматриваются в абстрактной форме, независимо от их конкретной природы. Предмет ТВ — математические модели случайных явлений (случайных событий). Цель ТВ — осуществление прогноза в области случайных явлений, контроль их, ограничение сферы действия случайности. Событие Событием в теории вероятностей (случайным событием, возможным событием) называется любой факт, который в результате испытания, эксперимента, опыта может произойти или не произойти. Иногда подчеркивают, что случайное событие — это такое событие, наступление которого мы не можем в точности предвидеть из-за незнания причин, вызывающих его, или невозможности считаться со всеми причинами, или событие, которое не обязательно происходит (то есть не является детерминированным). Важно понять, что событие — это не происшествие, а теоретически возможный исход эксперимента (в широком смысле). События обозначаются обычно заглавными латинскими буквами A, B, C. . . . Вероятность события На уровне бытового восприятия вероятность события — это частота его появления, выраженная в долях единицы (на словах мы обычно оцениваем вероятность в процентах, то есть в долях сотни). Если некоторый эксперимент (синоним — испытание) проводится n раз, и в результате событие A произошло kn раз, то его частота в данной серии экспериментов равна kn . n При увеличении количества экспериментов частота будет измерена более точно, поэтому следует за вероятность события A, обозначаемую через P (A), принять предел kn P (A) = lim . n→∞ n Такой предел называют статистическим определением вероятности. К сожалению, по такому определению ничего нельзя вычислить! Классическое определение вероятности события Предположим, что мы можем явно указать все возможные исходы эксперимента, которые между собой несовместимы и равновозможны. Такие исходы называются элементарными. Если их количество равно n, то теоретическая частота каждого из них, принимаемая за вероятность элементарного исхода, равна n1 . Исход, при котором событие A происходит, называется благоприятным (событию A или для события A). Соответственно, исход, при котором событие A не происходит, называется неблагоприятным. Предположим, что количество благоприятных исходов равно m. Определение. Вероятностью события A называется отношение числа благоприятных этому событию элементарных исходов к общему числу элементарных исходов P (A) = m . n Виды событий Определение. Событие называется невозможным (обозначается символом ∅), если оно никогда не может произойти. Событие называется достоверным (обозначается символом Ω), если оно происходит при любом исходе эксперимента (происходит всегда). Определение. События называются несовместными, если они не могут произойти одновременно. События, которые могут происходить одновременно, называются совместными. Определение. Несколько событий называются единственно возможными, если хотя бы одно из них обязательно произойдет. Определение. Несколько событий образуют полную группу, если они являются единственно возможными и все попарно несовместны. Иными словами, события образуют полную группу, если в результате испытания заведомо происходит одно и только одно из них. Задание Привести примеры на все данные определения. Привести пример единственно возможных событий, не образующих полную группу. Свойства вероятности 1. Вероятность любого события заключена между нулем и единицей 0 6 P (A) 6 1. 2. Вероятность невозможного события равна нулю P (∅) = 0. 3. Вероятность P (Ω) = 1. достоверного события равна единице Доказательство. Число благоприятных исходов не может быть отрицательным (m > 0) и не может быть больше числа всех возможных исходов (m 6 n), поэтому 06 m 6 1. n Для невозможного события m = 0, для достоверного m = n. ВАЖНО! Если количество всех исходов бесконечно, то классическое определение не годится, но указанные свойства сохраняются! Операции на множестве событий Определение. Суммой двух событий A + B называется событие, состоящее в том, что произошло хотя бы одно из двух событий A или B. Определение. Разностью двух событий A − B называется событие, состоящее в том, что A произошло, но B не произошло. Определение. Произведением двух событий AB называется событие, состоящее в том, что произошли оба события A и B. Определение. Событием, противоположным к A, называется событие A, состоящее в том, что событие A не произошло. Графическое представление Представим эксперимент в виде бросания точки в некоторый прямоугольник. Тогда весь прямоугольник – это достоверное событие Ω. Любое событие A в этом случае является некоторым подмножеством прямоугольника. Принимая площадь всего прямоугольника за единицу, получим вероятность попадания в подмножество A равной площади этого подмножества: P (A) = SA . В диаграммах Эйлера–Венна события принято изображать овалами, причем, если ничего заранее не известно о событиях, эти овалы должны располагаться так, чтобы существовали все логически возможные их пересечения. Пример диаграммы Эйлера–Венна W A B Соответствие операций A + B ≡ A ∪ B; AB ≡ A ∩ B; A − B ≡ A\B; A ≡ Ω\A. Задание. Сколько различных непересекающихся областей (полная группа событий) определяют два овала A, B, а сколько – три овала A, B, C? Запишите их формулами операций. Контрольные вопросы 1. Что называется событием (случайным событием)? 2. Понятие о события. статистическом определении вероятности 3. Классическое определение вероятности (элементарные исходы, благоприятные исходы). события 4. Достоверное и невозможное событие, их обозначения. 5. Три основные свойства вероятности. Доказательство для классического определения. 6. Совместные и несовместные события, возможные события, полная группа. единственно 7. Дать определение суммы, разности и произведения двух событий, противоположного события. 8. Графическое представление диаграммах Эйлера–Венна. событий. События в Лекция 3 Тема Основные теоремы и формулы теории вероятностей Содержание темы Алгебра событий. Теоремы сложения вероятностей. Условная вероятность. Теоремы умножения вероятностей. Формула полной вероятности. Схема Бернулли. Формула Бернулли. Наивероятнейшее число. Основные категории I I I I I I алгебра множеств, алгебра событий, сложение вероятностей, условная вероятность, зависимые и независимые события, умножение вероятностей, схема Бернулли, наивероятнейшее число. Алгебра множеств Множество — совокупность объектов произвольной природы. Объект, входящий в состав рассматриваемого множества, называется элементом этого множества. Множества обозначаем заглавными (прописными) латинскими буквами, элементы множеств — строчными латинскими буквами. Задание. Дать определения следующих понятий, обозначений, операций: 1) a ∈ A, a ∈ / A (a принадлежит A, a не принадлежит A); 2) A ⊂ B (A есть подмножество B); 3) A ∪ B, A ∩ B, A\B (объединение, пересечение, разность множеств). Алгебра множеств — совокупность множеств с операциями объединения и пересечения. Алгебра событий — это математическая модель эксперимента Вначале задается множество Ω всех элементарных событий. Алгеброй событий называется система подмножеств множества Ω, которые называются событиями. Алгебра событий должна удовлетворять следующим требованиям: I I I I I все множество Ω является событием (называется достоверным событием); пустое множество ∅ является событием (называется невозможным событием); если A, B — события, то A ∩ B тоже событие (называется произведением событий AB); если A, B — события, то A ∪ B тоже событие (называется суммой событий A + B); сумма бесконечного, но счетного числа событий тоже является событием. Аксиоматическое определение вероятности В аксиоматическом подходе события A и B называются несовместными, если AB = ∅. Если задано конечное или счетное число событий A1 , A2 , . . . , An , . . ., то они называются попарно несовместными, если Ai Aj = ∅ для любых двух различных номеров i, j. Вероятность — это функция P на алгебре событий, которая удовлетворяет следующим требованиям: I I I 0 6 P (A) 6 1 для любого события A; P (∅) = 0, P (Ω) = 1; если A1 , A2 , . . . , An , . . . — конечный или счетный набор попарно несовместных событий, то X X P( Ai ) = P (Ai ). i i Теоремы сложения вероятностей Теорема 1. Вероятность суммы несовместных событий равна сумме вероятностей этих событий: P (A + B) = P (A) + P (B). Теорема 2. Вероятность суммы произвольных событий: P (A + B) = P (A) + P (B) − P (AB). Эти утверждения следуют из аксиоматического определения вероятности и хорошо видны на диаграмме: Следствия теорем сложения Следствие 1. Сумма вероятностей событий, образующих полную группу, равна единице: AB = BC = CA = ∅ ⇒ P (A) + P (B) + P (C) = P (Ω) = 1. A+B+C =Ω Следствие 2. Сумма вероятностей противоположных событий равна единице: P (A) + P (A) = 1. Следствие 3. Вероятность вычисляется по формуле: противоположного события P (A) = 1 − P (A). Пример: Вероятность не сдать зачет по предмету для некоторого студента равна 0,8. Какова вероятность сдать зачет? P (A) = 0, 8 ⇒ P (A) = 1 − P (A) = 0, 2 Условная вероятность Определение. Вероятность события B, найденная при условии, что событие A произошло, называется условной вероятностью события B (при условии A) и обозначается через PA (B) или P (A|B). Формулы условных вероятностей: если P (A) 6= 0 и P (B) 6= 0, то условные вероятности вычисляются по формулам P (B|A) = P (AB) , P (A) P (A|B) = P (AB) . P (B) Определение. Событие B называется независимым от события A, если P (B|A) = P (B); событие B называется зависимым от A, если P (B|A) 6= P (B). Определение. Два события называются независимыми, если появление одного из них не меняет вероятности наступления другого: P (B|A) = P (B), P (A|B) = P (A). Вероятность независимых событий Из данных определений вытекает, что A независимо от B тогда и только тогда, когда B независимо от A. И то, и другое равносильно тому, что A и B независимы, а из формул условной вероятности следует теорема умножения вероятностей. Теорема умножения вероятностей. Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, найденную в предположении, что первое событие произошло: P (AB) = P (A)P (B|A) = P (B)P (A|B). События A и B независимы тогда и только тогда, когда вероятность их произведения равна произведению их вероятностей P (AB) = P (A)P (B). Задание Бросают два игральных кубика. Выяснить, зависимы или нет события A = {сумма очков не более 9}, B = {сумма очков не менее 5}. Формула полной вероятности Задание Повторить определение полной группы событий. Теорема (формула полной вероятности). Пусть дана полная группа событий H1 , H2 , . . . , Hn и произвольное событие A. Тогда n X P (A) = P (A|Hi )P (Hi ). i=1 Пояснение на рисунке: A есть сумма несовместных событий AH1 , AH2 , . . . , AHn . Формула Байеса Пусть дана полная группа событий H1 , H2 , . . . , Hn . Такую группу часто называют (особенно в статистике) конкурирующими гипотезами, поскольку такие события описывают все возможные исходы, но что именно происходит — неизвестно. Если заранее имеются предположения о вероятностях гипотез, то есть как-то вычислены P (Hi ), то произведя некоторое испытание, в результате которого произошло событие A, можно уточнить вероятность гипотезы Hi . Теорема (формула Байеса). Пусть дана полная группа событий H1 , H2 , . . . , Hn и известно, что произошло событие A. Тогда P (A|Hi )P (Hi ) . P (Hi |A) = P (A) Примеры использования формул Допустим, что магазин получает товар от двух фирмпроизводителей Π1 и Π2 в соотношении — 30% от первого и 70% от второго. Известно, что фирма Π1 допускает 20% некондиционного товара, а фирма Π2 допускает 10% некондиционного товара. Задача 1. Какова вероятность, что взятая наугад единица товара окажется бракованной? Решение. Пусть событие A состоит в том, что взятая наугад единица товара оказалась бракованной (некондиционной), H1 , H2 — события, состоящие в том, что поставщиком служат фирмы Π1 и Π2 соответственно. Тогда P (H1 ) = 0.3, P (H2 ) = 0.7, P (A|H1 ) = 0.2, P (A|H2 ) = 0.1. По формуле полной вероятности находим P (A) = P (A|H1 )P (H1 )+P (A|H2 )P (H2 ) = 0.2×0.3+0.1×0.7 = 0.13. Задача 2. В условиях предыдущей задачи взятая наугад единица товара оказалась бракованной. Какова вероятность, что она поставлена первой фирмой? Решение. В первой задаче мы уже нашли P (H1 ) = 0.3, P (H2 ) = 0.7, P (A|H1 ) = 0.2, P (A|H2 ) = 0.1, P (A) = P (A|H1 )P (H1 ) + P (A|H2 )P (H2 ) = 0.13. По формуле Байеса P (H1 |A) = 0.2 × 0.3 6 P (A|H1 )P (H1 ) = = ≈ 0.46. P (A) 0.13 13 Схема Бернулли Схемой Бернулли называется следующий эксперимент. Имеется некоторое испытание (опыт), в результате которого определяется произошло некоторое событие (успех) или не произошло (неудача). Предполагается, что все испытания независимы и проводятся в совершенно одинаковых условиях. Обозначения: обычно общее количество испытаний обозначают через n, вероятность успеха в одном испытании (всегда одинаковая) обозначается через p. Тогда вероятность неудачи (которая обозначается через q) вычисляется как вероятность противоположного события: p+q =1 ⇒ q = 1 − p. Примеры: 1) неоднократное бросание монеты, успех – выпадение герба, p = 1/2; 2) неоднократное бросание кубика, успех – выпадение тройки, p = 1/6. Формула Бернулли Теорема (формула Бернулли) Пусть задана схема Бернулли из n испытаний с вероятностью успеха p. Обозначим через Pn (k) вероятность того, что в такой серии испытаний произойдет ровно k успехов. Эта вероятность вычисляется по формуле Бернулли Pn (k) = Cnk pk q n−k , где q = 1 − p. Пример. Какова вероятность, что при пяти бросаниях монеты герб выпадет четыре раза? Решение. Имеем схему Бернулли с n = 5, p = 1/2. Тогда P5 (4) = C54 (1/2)4 (1/2)5−4 = 5 × 5 1 1 = ≈ . 25 32 6 Наивероятнейшее число успехов Рассматривается схема Бернулли из n испытаний с вероятностью успеха p (с вероятностью неудачи q = 1 − p). Определение. Наивероятнейшим числом в схеме Бернулли называется число k0 наступлений успеха в n испытаниях, если Pn (k0 ) > Pn (k) ∀k = 0, 1, . . . , n. (вероятность появления k0 успехов больше либо равна вероятности появления любого другого числа успехов). Теорема. Наивероятнейшее число k0 определяется из неравенства np − q 6 k0 6 np + p, причем если np + p нецелое, то существует одно наивероятнейшее число k0 , если же np + p целое, то существует два наивероятнейших числа k0 = np + p и k0 = np − q. Задание. Вероятность опоздания на лекцию одного студента равна 0,3. Найти наивероятнейшее число опоздавших из 10 человек и вычислить вероятность этого числа. Контрольные вопросы 1. Определение алгебры событий. 2. Аксиоматическое определение вероятности. 3. Теорема сложения вероятностей. 4. Чему равна сумма вероятностей событий? полной группы событий? противоположных 5. Определение условной вероятности; события зависимые и независимые. 6. Теорема умножения вероятностей. 7. Формула полной вероятности. 8. Формула Байеса. 9. Определение схемы Бернулли. Формула Бернулли. 10. Определение и формула наивероятнейшего числа. Лекция 4 Тема Введение в случайные величины Содержание темы Случайная величина. Понятия дискретной и непрерывной случайной величины. Ряд распределения дискретной случайной величины. Функция распределения, ее вид для дискретной случайной величины. Характеристики дискретной случайной величины. Основные категории I I I I I I случайная величина, дискретная и непрерывная случайные величины, ряд распределения, функция распределения, математическое ожидание, дисперсия, среднее квадратичное отклонение, мода и полигон дискретной СВ. Понятие случайной величины При стремлении к достаточно точному анализу различных явлений, выявлении закономерностей, прогнозировании можно базироваться только на числовых характеристиках. В теории вероятностей и статистике и они оказываются зависящими от конкретного исхода эксперимента, то есть от события. Определение (нестрогое). Случайная величина — переменная величина, принимающая в зависимости от обстоятельств различные числовые значения при разных наблюдениях одного и того же опыта. Примеры I I I I Результаты бросания кубика (количество очков). Рост и вес каждого человека в некоторой группе людей. Остаток вклада по выбранному лицевому счету. Число уличных происшествий в течение суток в городе. Строгое определение случайной величины Предполагается, что задано пространство Ω элементарных событий и в нем алгебра событий (то есть система подмножеств, удовлетворяющих введенным ранее аксиомам). Напомним, что тогда событием называется любое подмножество, входящее в алгебру, и любое событие A имеет вероятность P (A). Определение. Случайная величина — это числовая функция X на множестве Ω элементарных событий, такая что для любого вещественного числа x ∈ R множество элементарных событий, в которых X меньше x, является событием (то есть входит в алгебру событий, а значит, имеет определенную вероятность). Виды случайных величин Случайные величины делятся на дискретные и непрерывные. Определение. Дискретная случайная величина (сокращенно, ДСВ) — это такая случайная величина, которая принимает лишь конечное или счетное число различных значений. Примеры ДСВ 1) Сумма очков при бросании двух кубиков. Может принимать ровно 11 разных значений. 2) Количество входящих звонков на данный номер за месяц. Это число целое неотрицательное, но заранее ограничить его каким-то конечным числом нельзя. Определение. Непрерывная случайная величина (сокращенно, НСВ) — это случайная величина, которая не является дискретной, то есть принимает несчетное множество различных значений, например, все вещественные значения из какого-нибудь промежутка. Примеры НСВ 1) Расстояние точки попадания выстрела от центра мишени. 2) Время безотказной работы какого-нибудь прибора. Закон и ряд распределения Определение. Законом распределения заданной случайной величины (или, короче, распределением) называется любое правило, сформулированное в виде таблицы, функции, формулы или графика, которое позволяет вычислять вероятности любого значения случайной величины и любого множества таких значений. Для дискретной случайной величины (ДСВ) все ее значения могут быть перечислены в последовательности x1 , x2 , . . . , xn , . . ., а значит, можно явно задать вероятности этих значений в виде формулы pi = P {X = xi }, i = 1, 2, . . . , n, . . . или таблицы X x1 . . . xn . . . P p1 . . . pn . . . Такую таблицу называют рядом распределения ДСВ. Основное свойство ряда распределения Теорема. Все числа pi в таблице X x1 . . . xn . . . P p1 . . . pn . . . неотрицательны и их сумма равна 1: X pi = p1 + p2 + . . . + pn + . . . = 1. i Доказательство Так как величина pi = P {X = xi } есть вероятность, то она неотрицательна. События Ai = {X = xi } попарно несовместны и единственно возможны (хоть какое-то значение величина X примет, а два разных значения одновременно невозможны), поэтому они образуют полную группу, а значит, сумма их вероятностей равна единице. Примеры Значения, которые случайная величина может принимать, называются возможными значениями. Пример 1. На одном и том же пространстве событий и даже при одних и тех же возможных значениях случайные величины могут отличаться вероятностями. Так, например, рассмотрим двух стрелков. Они делают по одному выстрелу по мишени, на которой обозначены 8, 9 и 10 очков. Стрелки разных спортивных разрядов, поэтому вероятности выбить одно и то же число очков у них различны. Соответственно, случайные величины X, Y — число очков в результате у первого и второго стрелков — имеют разные законы распределения, например, представленные в виде рядов: X P 8 0.5 9 0.2 10 0.3 Y P 8 0.1 9 0.4 10 0.5 Примеры Часто ряд распределения ДСВ можно найти с помощью формул комбинаторики. Пример 2. В урне находится 5 белых и 3 черных шара. Наугад вынимают три шара. Найти ряд распределения величины X – количество белых шаров в выборке. Решение. Возможные значения x1 = 0, x2 = 1, x3 = 2, x4 = 3. Вероятности C 0 ·C 3 C 1 ·C 2 p1 = P {X = 0} = 5C 3 3 = 1/56, p2 = P {X = 1} = 5C 3 3 = 15/56, p3 = P {X = 2} = C52 ·C31 C83 8 = 30/56, p4 = P {X = 3} = (ряд) распределения Проверка. X 0 1 2 3 P 1 56 15 56 30 56 10 56 1 15 30 10 + + + = 1. 56 56 56 56 C53 ·C30 C83 8 = 10/56. Закон Алгоритм построения ряда распределения 1. Определить все возможные различные значения ДСВ. 2. Расположить их в возрастающем порядке и записать в первую строку таблицы. 3. Вычислить вероятности каждого значения xi (при подсчете использовать классическое определение вероятности или другие формулы). 4. Занести найденные pi во вторую строку таблицы. 5. Выполнить проверку — сумма чисел во второй строке равна 1. Функция распределения СВ Определение. Функцией распределения дискретной или непрерывной случайной величины X называется функция F (x), определенная на множестве всех чисел x и задающая вероятность того, что СВ X примет значение меньшее, чем x: F (x) = P {X < x}, Свойства F (x): 1) 0 6 F (x) 6 1; 2) F (x) — неубывающая функция; 3) lim F (x) = 1, lim F (x) = 0; x→+∞ x→−∞ 4) P {a 6 X < b} = F (b) − F (a). x ∈ (−∞; +∞). Как строить функцию распределения? Задача. Дан ряд распределения X P 8 0.2 9 0.5 10 0.3 Построить функцию распределения и ее график. Решение. x68 0, 0.2, 8 < x 6 9 F (x) = 0.7, 9 < x 6 10 1, x > 10 График — ступенчатая фигура. Как правильно расставить стрелки? Математическое ожидание ДСВ Определение. Пусть задана ДСВ X с законом распределения pi = P {X = xi }. Ее математическим ожиданием называется сумма парных произведений всех возможных ее значений на их вероятности: X M (X) = p i xi . i Свойства M (X): 1) M (C) = C, C = const; 2) M (C · X) = C · M (X), C = const; 3) M (X + Y ) = M (X) + M (Y ); 4) если X, Y независимы, то есть независимы все события вида {X 6 x}, {Y 6 y}, то M (X · Y ) = M (X) · M (Y ). Математическое ожидание характеризует среднее значение случайной величины. Дисперсия ДСВ Определение. Пусть задана ДСВ X с законом распределения pi = P {X = xi }. Ее дисперсией называется математическое ожидание квадрата отклонения этой величины от ее математического ожидания: X X X D(X) = M ([X−M (X)]2 ) = pi [xi −M (X)]2 = pi x2i −( p i xi )2 . i i i Свойства D(X): 1) D(X) > 0; 2) D(C) = 0, C = const; 3) D(C · X) = C 2 · D(X), C = const; 4) D(X + C) = D(X), C = const; 5) если X, Y независимы, то D(X + Y ) = D(X) + D(Y ). Дисперсия характеризует рассеяние случайной величины вокруг своего среднего значения. Другие характеристики ДСВ Среднеквадратичное отклонение — корень квадратный из дисперсии. Для случайной величины X обозначается через σ(X). Это определение используется также и для непрерывных случайных величин. Мода дискретной случайной величины — значение, вероятность которого наибольшая. При совпадении вероятностей нескольких разных значений все они принимаются в качестве мод. Такое распределение называется полимодальным. Рассмотрим числовую плоскость, отложим по оси абсцисс значения ДСВ, а по оси ординат их вероятности. Получим точки вида (xi , pi ). Полигоном дискретной случайной величины называется ломаная, соединяющая точки (xi , pi ). X P −1 0.2 0 0.1 2 0.4 3 0.1 5 0.2 Контрольные вопросы 1. Понятие случайной величины. Примеры. 2. Виды случайных величин. Определения дискретной и непрерывной СВ. Примеры. 3. Закон распределения СВ. Ряд распределения ДСВ. 4. Основное свойство ряда распределения. 5. Алгоритм построения ряда распределения. 6. Функция распределения СВ и ее свойства. 7. Математическое ожидание ДСВ и его свойства. 8. Дисперсия СВ и ее свойства. 9. Среднеквадратичное отклонение, мода. 10. Полигон ДСВ. Лекция 5 Тема Непрерывные случайные величины (НСВ) Содержание темы Способы задания: интегральный закон распределения, плотность распределения. Связь между ними. Свойства плотности распределения. Применение формулы Ньютона–Лейбница для вычисления вероятностей. Мода и медиана непрерывной случайной величины. Характеристики непрерывной случайной величины. Основные категории I I I I функция распределения НСВ (интегральный закон), плотность распределения НСВ, мода и медиана НСВ, математическое ожидание, дисперсия, среднее квадратичное отклонение НСВ. Интегральный закон распределения Для непрерывных СВ записать таблицу ряда распределения невозможно (т.к. число значений бесконечно), поэтому для характеристики используют не вероятность отдельных значений P ({X = xi }), а функцию распределения F (x) = P ({X < x}), определенную для всех вещественных чисел x ∈ R. Определение. Интегральным законом распределения непрерывной случайной величины называется ее функция распределения F (x), x ∈ R. Договоренность. Будем рассматривать только такие (важные для приложений) непрерывные случайные величины, у которых функция распределения F (x) является непрерывной и дифференцируемой почти во всех точках (то есть имеет производную, за исключением, быть может, конечного числа точек). Свойства интегрального закона К общим свойствам функции распределения прибавляются требования непрерывности и существования производной: 1) 0 6 F (x) 6 1; 2) F (x) — дифференцируемая почти во всех точках функция и непрерывная во всех точках; 3) F (x) — неубывающая функция, значит, F 0 (x) > 0; 4) lim F (x) = 1, lim F (x) = 0 (горизонтальные асимптоты x→+∞ x→−∞ графика); 5) P {a 6 X < b} = F (b) − F (a). Важное замечание Из свойств (2) и (5) следует, что вероятность любого отдельно взятого значения равна нулю (докажите, исходя из определения непрерывной функции): P ({X = a}) = 0 ∀a ∈ R Поэтому неважно, какое неравенство (строгое или нестрогое) взять в определении функции F (x): F (x) = P ({X < x}) = P ({X 6 x}). Пример. Стрельба по круглой мишени Учитываемый результат X – расстояние от точки попадания до центра мишени. Очевидно, что любое расстояние неотрицательно по определению: X > 0. Если радиус мишени равен R, то попадание на границу и за нее очков не приносит, поэтому для попадания за пределы мишени считаем X = R. 1) Схематично построить график функции распределения. 2) Концентрическими окружностями мишень разбита на десять полос (центральная – просто круг, то есть «полоса» от r = 0 до r = R/10). Как вычислить вероятность попадания в полосу? Плотность распределения НСВ Определение. Плотностью распределения f (x) непрерывной случайной величины называется производная от ее функции распределения f (x) = F 0 (x). Иногда плотность распределения называют дифференциальной функцией распределения. Таким образом, связь между функцией распределения F (x) и плотностью распределения f (x) выражается формулами Rx f (x) = F 0 (x), F (x) = f (t)dt. −∞ Свойства плотности распределения: 1) f (x) > 0; +∞ R 2) f (t)dt = 1. −∞ Связь с формулой Ньютона–Лейбница Теорема. Вероятность того, что значение непрерывной случайной величины X попадет в интервал (a, b), вычисляется по формуле Rb P ({a < X < b}) = F (b) − F (a) = f (t)dt. a Геометрический смысл. Вероятность того, что значение непрерывной случайной величины X попадет в интервал (a, b), есть площадь фигуры, ограниченной графиком плотности распределения f (x) над отрезком [a, b]. Здесь необходимо вспомнить определение и свойства определенного интеграла! Мода и медиана Определение. Модой M o(X) непрерывной случайной величины X называется точка x, в которой плотность f (x) достигает своего максимума. Определение. Медианой M e(X) непрерывной случайной величины X называется такое значение случайной величины, что P ({X < M e(X)}) = P ({X > M e(X)}), то есть такое значение аргумента, которое делит площадь фигуры под графиком плотности пополам. Математическое ожидание НСВ Определение. Пусть задана HСВ X с плотностью распределения f (x). Ее математическим ожиданием называется число M (X), вычисляемое по формуле +∞ R xf (x)dx. M (X) = −∞ Свойства M (X): Математическое ожидание НСВ обладает теми же свойствами (1) — (4), которые перечислены для ДСВ: 1) M (C) = C, C = const; 2) M (C · X) = C · M (X), C = const; 3) M (X + Y ) = M (X) + M (Y ); 4) если X, Y независимы, то есть независимы все события вида {X 6 x}, {Y 6 y}, то M (X · Y ) = M (X) · M (Y ). Дисперсия и среднеквадратичное отклонение НСВ Определение. Пусть задана HСВ X с плотностью распределения f (x). Ее дисперсией называется число D(X), вычисляемое по формуле +∞ R D(X) = M (X − M (X))2 = (x − M (X))2 f (x)dx. −∞ Свойства D(X): Дисперсия НСВ обладает теми же свойствами (1) — (5), которые перечислены для ДСВ (запишите эти свойства самостоятельно). Определение. Пусть задана HСВ X с плотностью распределения f (x). Ее среднеквадратичным отклонением называется число σ(X), равное корню квадратному из дисперсии: p σ(X) = D(X). Контрольные вопросы 1. Что называется интегральным законом распределения непрерывной случайной величины? Какое свойство этого закона предполагается дополнительно? 2. Пять основных свойств функции распределения НСВ. 3. Почему вероятность одного отдельно взятого значения НСВ равна нулю? 4. Определение плотности распределения НСВ. 5. Связь между функцией распределения и плотностью распределения НСВ. Два свойства плотности. 6. Вероятность попадания в интервал. Связь с формулой Ньютона–Лейбница. Геометрический смысл. 7. Мода и медиана НСВ. 8. Математическое ожидание НСВ и его свойства. 9. Дисперсия НСВ и ее свойства. Среднеквадратичное отклонение. Тема Важнейшие законы распределения Содержание темы I Биномиальный закон распределения. Основные характеристики. I Пуассоновский закон распределения. Основные характеристики. I Равномерный закон распределения. Основные характеристики. I Нормальный (гауссовский) закон распределения. Основные характеристики. I Правило «трех сигм». Биномиальный закон Биномиальная ДСВ X выражает число успехов в n независимых испытаниях с вероятностью успеха в каждом, равной p (схема Бернулли). Для краткости обозначим вероятность неудачи через q = 1 − p. Ряд распределения биномиальной ДСВ и ее характеристики P ({X = k}) = Pn (k) = Cnk pk q n−k , k = 0, 1, ..., n; √ M (X) = np, D(X) = npq, σ(X) = npq. 0.12 p0.3, n40 0.10 0.08 0.06 График вероятностей для количества успехов в 40 испытаниях при p = 0.3 0.04 0.02 10 20 30 Закон Пуассона Распределение Пуассона моделирует случайную величину, представляющую собой число событий, произошедших за фиксированное время, при условии, что данные события происходят с некоторой фиксированной средней интенсивностью λ и независимо друг от друга. Количество возможных значений бесконечно, но счетно! Ряд распределения пуассоновской ДСВ X и ее характеристики k P ({X = k}) = e−λ λk! , k = 0, 1, ..., n; √ M (X) = λ, D(X) = λ, σ(X) = λ. Λ5, 10, 20 0.15 0.10 0.05 Графики вероятностей числа событий для различных значений λ 5 10 15 20 25 Равномерное распределение НСВ X принимает значения на заданном отрезке [a, b] таким образом, что вероятность попасть в любой интервал внутри отрезка пропорциональна длине интервала. Плотность распределения и функция распределения ( 0, x<a 1 x− a , x ∈ [a, b] , x ∈ [a, b] f (x) = ; F (x) = b−a b−a 0, x∈ / [a, b] 1, x>b M (X) = a+b , 2 D(X) = (a − b)2 , 12 σ(X) = a−b √ . 2 3 Нормальное распределение (распределение Гаусса) Наиболее важно в приложениях. Главная особенность нормального закона — он является предельным законом, к которому приближаются другие законы распределения при определенных условиях, часто встречающихся на практике. Плотность распределения нормальной случайной величины с параметрами µ, σ: (x − µ)2 − 1 2σ 2 . f (x) = √ e σ 2π M (X) = µ, D(X) = σ 2 , σ(X) = σ. Правило «трех сигм» 99,73% значений нормальной случайной величины попадают в интервал µ ± 3σ: P ({|X − µ| > 3σ} < 0.003. 95,45% значений нормальной случайной величины попадают в интервал µ ± 2σ: P ({|X − µ| > 2σ} < 0.05. 68,27% значений нормальной случайной величины попадают в интервал µ ± σ: P ({|X − µ| > σ} < 0.32. Контрольные вопросы 1. Определение биномиального закона распределения. Ряд распределения и основные характеристики. 2. Определение закона распределения Пуассона. распределения и основные характеристики. Ряд 3. Определение равномерного закона распределения. Формулы плотности и функции распределения, их графики. Основные характеристики. 4. Определение нормального закона распределения (закона Гаусса). Формула плотности распределения и ее график. Основные характеристики. 5. Правило «трех сигм».