Математическое ожидание случайной величины Тема: «Примеры применения математического ожидания (страхование, лотерея)» • Что такое математическое ожидание? Закон распределения содержит наиболее полную информацию о случайной величине. Однако во многих ситуациях эту информацию требуется сократить. Так уже было в статистике, когда мы использовали для описания полученных статистических данных среднее арифметическое, медиану, дисперсию и другие числовые характеристики. Теперь мы познакомимся с аналогичными характеристиками для случайных величин. Вы знаете, что результаты Всероссийских проверочных работ бывают достаточно непредсказуемы. Рассмотрим случайную величину X, равную оценке учеников на ВПР по математике. Предположим, что на основе проведённых статистических наблюдений для этой величины было получено следующее распределение вероятностей. Какой средний балл следует ожидать на очередной ВПР? Для ответа на этот вопрос вспомним, что частота любого случайного события при большом числе опытов приближается к его вероятности. Значит, если проверочную работу будут писать, скажем, 1000 учеников, то примерно 100 из них получат отметку 2, 400 учеников — отметку 3, 300 учеников — отметку 4 и 200 учеников — отметку 5. Поэтому средний балл, посчитанный по этим ученикам, составит: 2 · 100 + 3 · 400 + 4 · 300 + 5 · 200 = 2 · 0,1 + 3 · 0,4 + 4 · 0,3 + 5 · 0,2 = 3,6. 1000 Получается, что для прогнозирования среднего балла нам достаточно знать только закон распределения случайной величины: нужно умножить каждое значение случайной величины на его вероятность и затем сложить эти произведения. Полученное выражение называется математическим ожиданием случайной величины и является одной из важнейших его характеристик. Термин «математическое ожидание» объясняется тем, что в среднем именно такое значение X мы ожидаем получить, если будем проводить испытания с этой величиной. Обозначение E(X) происходит от первой буквы английского слова expectation — «ожидание». Математическое ожидание называют также средним значением случайной величины X. В электронной таблице математическое ожидание удобно вычислять с помощью функции СУММПРОИЗВ(Диапазон 1; Диапазон 2), где в качестве первого диапазона нужно указать диапазон значений x1 , x2 , … , xn, а в качестве второго — диапазон вероятностей p1 , p2 , … , pn. Представьте, что вы покупаете лотерейный билет стоимостью 50 р. При этом условия лотереи таковы, что вы можете выиграть призы от тысячи до миллиона рублей. Как рассчитать свои шансы и стоит ли участвовать в такой лотерее? Чтобы ответить на этот вопрос, нужно знать закон распределения для случайной величины X, равной выигрышу на один билет. Иногда эту информацию можно получить из условий проведения лотереи (мы ещё рассмотрим такие лотереи позже). Предположим, что закон распределения X нам известен и выглядит так Значения X даны в рублях. Вроде бы условия лотереи неплохие: выигрыш в 1 000 000 р. получает в среднем один человек на 100 000. Если лотерея массовая, то в большом городе один, а то и несколько его жителей в каждом тираже могут выиграть по миллиону. Но не будем торопиться с выводами Посчитаем математическое ожидание выигрыша E(X): E(X) = 0 ∙ 0,98889 + 1000 ∙ 0,01 + 10 000 ∙ 0,001 + 1 000 000 ∙ 0,00001 = 30. Получилось, что средний выигрыш на один билет составляет 30 р. при цене билета 50 р. Это значит, что организаторы лотереи получают в среднем по 20 р. с каждого билета. А вы в среднем эти 20 р. проигрываете Наверняка у вас готово возражение: но ведь кто-то же выигрывает по 1 000 р., по 10 000 р. и даже по 1 000 000 р.! Да, конечно — поэтому можно сыграть в лотерею один-два раза. Убытки будут небольшие, а шанс выиграть миллион (правда, очень мизерный) всё-таки будет. Но если вы начнёте играть регулярно, то начнёт действовать закон больших чисел, о котором мы поговорим подробнее чуть позже, и ваш средний выигрыш с учётом цены билета начнёт приближаться к (–20) р. Умножьте его на количество купленных билетов и получите ожидаемый убыток… Учтите, что так устроены все лотереи — средний выигрыш всегда меньше стоимости билета. Иначе лотерея была бы убыточной для её организаторов. Разница в 20 р., которая у нас получилась, ещё не самая плохая. В любом случае, покупая билет лотереи, сначала разберитесь в её правилах и, если это возможно, попробуйте оценить математическое ожидание своего выигрыша • Свойства математического ожидания Свойство 1. Математическое ожидание константы равно этой константе: E(a) = a. Заметим, что константу тоже можно рассматривать как некую «вырожденную» случайную величину, которая принимает всего одно значение, и вероятность этого значения 1 Свойство 2. Для любой константы a и случайной величины X: E(aX) = a ∙ E(X). Про это свойство говорят ещё, что постоянный множитель можно выносить за знак математического ожидания. Доказать его совсем не сложно. Рассмотрим произвольный закон распределения случайной величины X. Свойство 3. Для любых констант a, b и случайной величины X: E(aX + b) = a ∙ E(X) + b. Свойство 4. Для любых случайных величин X, Y: E(X + Y) = E(X) + E(Y), т. е. математическое ожидание суммы случайных величин равно сумме их математических ожиданий. Наконец, последнее, тоже очень важное свойство выполнено уже не для всех случайных величин, а только для независимых. Напомним, что случайные события A и B называются независимыми, если наступление одного из них не влияет на вероятность другого. Более точно независимость случайных событий выражается равенствами P(A | B) = P(A) или P(A ∩B) = P(A) ∙ P(B). Последнее равенство обычно и принимают за определение независимости. Независимость случайных величин определяется через независимость связанных с ними случайных событий. Обычно независимость случайных величин, как и независимость событий, следует из условий проведения опыта. Например, если бросают два кубика и X — число очков на первом кубике, а Y — число очков на втором, то эти величины будут независимыми. Свойство 5. Для независимых случайных величин X, Y: E(X ∙ Y) = E(X) ∙ E(Y), т. е. математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий. Пример 1. Подбрасывают два игральных кубика. Нужно найти математические ожидания следующих случайных величин: X — число, выпавшее на первом кубике; Y — число, выпавшее на втором кубике; S — сумма чисел, выпавших на кубиках; R — произведение чисел, выпавших на кубиках; W — наибольшее из чисел, выпавших на кубиках; V — наименьшее из чисел, выпавших на кубиках. Для величин X, Y мы уже решали эту задачу, используя определение математического ожидания: 1+2+3+4+5+6 = 3,5 6 E(X) = Теперь можно получить тот же результат из симметрии: распределения X и Y симметричны относительно точки 3,5. Для S математическое ожидание получится сразу из свойства 4: E(S) = E(X + Y) = E(X) + E(Y) = 3,5 + 3,5 = 7 Таким образом, у нас есть целых три способа вычисления E(S): по определению, через симметрию распределения и с использованием свойства математического ожидания. Поскольку величины X и Y независимые, то для вычисления E(R) можно воспользоваться свойством 5: E(R) = E(X ∙ Y) = E(X) ∙ E(Y) = 3,5 ∙ 3,5 = 12,25. Заметим, что мы получили этот результат, вообще не рассматривая закон распределения случайной величины R, который, кстати говоря, будет довольно сложным. К сожалению, для математического ожидания случайной величины W никакого подходящего свойства нет, но мы уже находили закон распределения W, поэтому посчитаем E(W) по определению: E(W) = 1 3 5 7 9 11 161 ∗1+ ∗2+ ∗3+ ∗4+ ∗5+ ∗6 = ≈4,47 36 36 36 36 36 36 36 Зато для случайной величины V теперь снова можем воспользоваться свойством 4. В самом деле, поскольку S = X + Y = W + V, то E(V) = E(S) – E(W) = 7 – 161 91 = ≈4,47 36 36 ■ Основные свойства математического ожидания: ■ математическое ожидание константы равно этой константе, Mc=c ; ■ математическое ожидание - линейный функционал на пространстве случайных величин, т.е. для любых двух случайных величин x , h и произвольных постоянных a и bсправедливо: M(ax + bh ) = a M(x )+ b M(h ); ■ математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий, т.е. M(x h ) = M(x )M(h ). Моменты В теории вероятностей и математической статистике, помимо математического ожидания и дисперсии, используются и другие числовые характеристики случайных величин. В первую очередь это начальные и центральные моменты. ■ Начальным моментом k-го порядка случайной величины x называется математическое ожидание k-й степени случайной величины x , т.е. a k = Mx k. ■ Центральным моментом k-го порядка случайной величины x называется величина m k, определяемая формулой m k = M(x - Mx )k. ■ Заметим, что математическое ожидание случайной величины - начальный момент первого порядка, a 1 = Mx , а дисперсия - центральный момент второго порядка, ■ a 2 = Mx 2 = M(x - Mx )2 = Dx . ■ Существуют формулы, позволяющие выразить центральные моменты случайной величины через ее начальные моменты, например: ■ m 2=a 2-a 12, m 3 = a 3 - 3a 2a 1 + 2a 13. ■ Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = Mx , то все ее центральные моменты нечетного порядка равны нулю. Асимметрия В теории вероятностей и в математической статистике в качестве меры асимметрии распределения является коэффициент асимметрии, который определяется формулой , ■ где m 3 - центральный момент третьего порядка, - среднеквадратичное отклонение. . Эксцесс Нормальное распределение наиболее часто используется в теории вероятностей и в математической статистике, поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие распределения случайной величины x , от нормального распределения, является эксцесс. ■ Эксцесс g случайной величины x определяется равенством . ■ У нормального распределения, естественно, g = 0. Если g (x ) > 0, то это означает, что график плотности вероятностей px (x) сильнее “заострен”, чем у нормального распределения, если же g (x ) < 0, то “заостренность” графика px (x) меньше, чем у нормального распределения. ■ Средним геометрическим случайной величины, принимающей положительные значения, называется величина ■ Название “среднее геометрическое” происходит от выражения среднего геометрического дискретной случайной величины, имеющей равномерное распределение x a1 a2 a3 ... an p 1/n 1/n 1/n ... 1/n Среднее геометрическое, вычисляется следующим образом: ■ т.е. получилось традиционное определение среднего геометрического чисел a1, a2, …, an. ■ Например, среднее геометрическое случайной величины, имеющей показательное распределение с параметром l , вычисляется следующим образом: Дисперсия ■ Дисперсией конечной случайной величины x называется число по определению математического ожидания, дисперсия вычисляется по следующей формуле Дисперсию иногда обозначают как s 2 (x) или называется среднеквадратичным отклонением или стандартным отклонением случайной величины Свойства дисперсии ■ 1.Дисперсия любой случайной величины неотрицательна D x>0 При этом D x=0 тогда и только тогда, когда случайная величина постоянна. ■ 2. Константа выносится из-под знака дисперсии с квадратом ■ 3. Сдвиг на константу не меняет дисперсии: ■ 4. Дисперсия суммы независимых случайных величин равна сумме их дисперсий: ( x и h независимы )