Министерство образования Российской Федерации Ярославский государственный университет имени П.Г. Демидова Е.И. Щукин МАТЕМАТИКА Теория вероятностей. Системы линейных алгебраических уравнений и линейное программирование Учебное пособие Ярославль 2001 1 ББК В171я73 Щ 95 Щукин Е.И. МАТЕМАТИКА. Теория вероятностей. Системы линейных алгебраических уравнений и линейное программирование: Учебное пособие; Яросл. гос. ун-т. Ярославль, 2001. 115 с. ISBN 5-8397-0176-9 Учебное пособие написано в соответствии с программой дисциплины “Математика” для экономических специальностей университетов и представляет собой продолжение предыдущей работы того же автора “МАТЕМАТИКА. Теория вероятностей.” (Ярославль, 2000), в которой были рассмотрены две первых главы теории вероятностей (случайные события; дискретные случайные величины и основные законы их распределения). В данном пособии рассматриваются непрерывные случайные величины и основные законы их распределения (равномерное непрерывное; экспоненциальное и нормальное), а также предельные теоремы теории вероятностей. Рассмотрены также системы линейных алгебраических уравнений, что способствует элементарному изучению основных вопросов линейного программирования (основная задача линейного программирования и ее геометрия; метод последовательного улучшения плана (симплекс-метод); взаимно двойственные задачи линейного программирования). Указаны экономические применения рассматриваемых теоретических положений. Пособие предназначено для студентов I курса экономических факультетов университетов и особенно полезным будет для тех из них, кто обучается по вечерней и заочной формам. Пособие соответствует требованиям государственного образовательного стандарта по дисциплине “Математика” для студентов экономических специальностей университетов. Рецензенты: кафедра теории и методики обучения математике Ярославского государственного педагогического университета имени К.Д. Ушинского; доцент кафедры математики Ярославского филиала военного финансово-экономического университета, канд. физ.-мат. наук Н.И. Коршунова. © ISBN 5-8397-0176-9 Ярославский государственный университет, 2001 © Щукин Е.И., 2001 2 Оглавление ГЛАВА I. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (НСВ). ДВЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ НСВ. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ НСВ............................................................................ 5 1. НЕПРЕРЫВНЫЕ СВ. ИНТЕГРАЛЬНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ; ЕЕ СВОЙСТВА И ГРАФИК ............................................................................................................ 5 2. ДИФФЕРЕНЦИАЛЬНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ (ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ); ЕЕ СВОЙСТВА И ГРАФИК .................................................... 9 ГЛАВА II. ОСНОВНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН.......................................................................... 18 1. РАВНОМЕРНОE НЕПРЕРЫВНОЕ РАСПРЕДЕЛЕНИЕ (ЗАКОН РАВНОМЕРНОЙ ПЛОТНОСТИ) .................................................................................................. 18 2. ЭКСПОНЕНЦИАЛЬНОЕ (ПОКАЗАТЕЛЬНОЕ) РАСПРЕДЕЛЕНИЕ ................................ 20 3. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ)....................................................... 21 ГЛАВА III. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ...... 27 1. НЕРАВЕНСТВО ЧЕБЫШЕВА .................................................................................. 28 2. ТЕОРЕМА ЧЕБЫШЕВА (ЗАКОН БОЛЬШИХ ЧИСЕЛ) ................................................ 30 3. ТЕОРЕМА ЛЯПУНОВА (ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА). ИНТЕГРАЛЬНАЯ ТЕОРЕМА ЛАПЛАСА (ТЕОРЕМА МУАВРА-ЛАПЛАСА).................................... 31 ГЛАВА IV. СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ. ПОНЯТИЕ О СТОХАСТИЧЕСКОМ ПРОГРАММИРОВАНИИ............................ 39 1. РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ ........................................................ 39 2. ОСНОВНАЯ ЗАДАЧА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ И ЕЕ ГЕОМЕТРИЯ .......... 43 3. МЕТОД ПОСЛЕДОВАТЕЛЬНОГО УЛУЧШЕНИЯ РЕШЕНИЯ (СИМПЛЕКС-МЕТОД) .... 50 4. ВЗАИМНО ДВОЙСТВЕННЫЕ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ............ 55 5. ПОНЯТИЕ О СТОХАСТИЧЕСКОМ ПРОГРАММИРОВАНИИ ....................................... 63 БИБЛИОГРАФИЧЕСКИЙ СПИСОК (ЛИТЕРАТУРА)................................ 65 ПРИЛОЖЕНИЕ I .................................................................................................... 67 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ ϕ(X) = EXP(-X2/2)/√2π .......................................... 67 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Ф(Х) = (0SXEXP(-Z2/2)DZ)/√2π .............................. 68 ПРИЛОЖЕНИЕ II. ВАРИАНТЫ КОНТРОЛЬНЫХ ЗАДАНИЙ.................. 70 ПРИЛОЖЕНИЕ III. СПРАВОЧНЫЙ МАТЕРИАЛ ........................................ 75 ПРИЛОЖЕНИЕ IV. КОМПЬЮТЕРНЫЕ МОДЕЛИ НЕКОТОРЫХ ЗАДАЧ ......................................................................................................................... 100 3 4 Глава I. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (НСВ). ДВЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ НСВ. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ НСВ 1. Непрерывные СВ. Интегральная функция распределения; ее свойства и график Определение 1. Случайная величина называется непрерывной, если ее возможные значения не могут быть перенумерованы (поставлены во взаимооднозначное соответствие с натуральным рядом чисел) и непрерывно заполняют один (или несколько) промежутков числовой оси. Как известно, дискретная случайная величина (ДСВ) может быть задана рядом (таблицей) распределения, то есть перечнем всех возможных ее значений и их вероятностей. Такой подход не является общим: он не применим для НСВ. Действительно, рассмотрим НСВ Х, которая принимает любые действительные значения некоторого промежутка действительных чисел. Между любыми двумя ее значениями имеется бесконечное множество действительных чисел, и записать все эти числа невозможно. Например, уровень осадков, выпавших за 1 год (в некоторой местности), есть случайная величина (очевидно, непрерывная), которая может принимать любое действительное значение (из некоторого достаточно большого промежутка действительных чисел). Вероятность того, что в некоторый момент этот уровень окажется в точности равным некоторому действительному числу, крайне мала (практически равна 0). Итак, если мы будем пытаться приписать ненулевую вероятность каждому возможному значению НСВ, мы вряд ли добьемся успеха. Существует, однако, более общий способ задания, применяемый и в случае ДСВ, и в случае НСВ. Пусть х - действительное число. Вместо события Х = х будем рассматривать событие Х < х, вероятность которого, очевидно, зависит от х; следовательно, является функцией х. Определение 2. Функция F(x), равная вероятности того, что СВХ в результате опыта приняла значение Х < х, называется интегральной функцией распределения СВХ. F(x) = P(X<x), ∀ x Интегральная функция распределения является универсальной характеристикой, которая применяется как для ДСВ, так и для НСВ. Можно дать ей следующее геометрическое истолкование: 5 , (.) . Свойства: 1. Вероятность попадания СВХ на промежуток [α;β) равна приращению интегральной функции распределения на этом промежутке: P(α≤ Х<β) = F(β) - F(α) 1 Доказательство: Обозначим: соб. А - “СВХ приняла значение Х <α“ соб. В - “СВХ приняла значение Х <β“ соб. С - “СВХ приняла значение α≤Χ<β А + С = В; А, С - несовместные; тогда Р(А+С) = Р(А) + Р (С) = Р(В) Р(С) = Р(В) - Р(А) Р(α ≤ Χ < β) < Ρ(Χ < β) - Ρ(Χ < α) = F(β) - F (α) Замечание: с учетом высказанного ранее для НСВ Х утверждения: Р(Х=х) ≈ 0 формулу (1) можно переписать так: Р (α < Χ < β) = F (β) − F (α) 1’ Именно в таком виде она обычно и используется. 2. F(х) - неубывающая функция. Доказательство: P (α < Χ < β) = F (β) − F (α) ≥ 0 ⇒ F (β) − F (α) ≥ 0 ⇒ F (β) ≥ F (α) ⇒ F (x) - неубывающая. 3. lim F (x) = F (+ ∞) = P (X < +∞)= 1 6 x → +∞ достоверное событие 4. lim F (x) = F (- ∞) = P (Χ <−∞) = 0 x → −∞ невозможное событие 5. Интегральная функция распределения НСВХ есть функция непрерывная. Доказательство: Р (Х = х) = 0 Р(Х = х) = lim Р (х ≤ Χ < х + ∆х) = lim [F (x + ∆x) - F (x)] = 0 ∆x → 0 ∆x → 0 Итак, lim ∆F (x) = 0, что в соответствии с одним из определений ∆х → 0 непрерывности и доказывает утверждение. График интегральной функции распределения - в соответствии с рассмотренными свойствами - имеет примерно следующий вид: Что касается графика интегральной функции распределения для дискретной случайной величины, то он является разрывным ступенчатым, при этом скачки имеют место в точках, соответствующих возможным значениям ДСВХ, а величины скачков равны вероятностям этих возможных значений. Пример. ДСВХ задана законом распределения Х 3 4 7 10 Р 0,2 0,1 0,4 0,3 Найти F(x) и построить ее график. Если х ≤ 3, то соб. (Х < х) - невозможное. F (х) = Р (Х < х) = 0 Если 3< х ≤ 4, то соб. (Х< х) есть (Х = 3) F(x) = P(X = 3) = 0,2 Если 4 < х ≤ 7, то соб. (Х < х) = (Х = 3) + (Х = 4) F(x) = P(X = 3) + P(X = 4) = 0,2 + 0,1 = 0,3 Если 7 < х ≤ 10, то соб. (Х < х) = Х = 3) + (Х = 4) + (Х = 7) 7 F(x) = P(X = 3) + P(X = 4) + P(X = 7) = 0,2 = 0,1 + 0,4 = 0,7 Если х >10, то (Х < х) - достоверное, т.к. все возможные значения Х < х; F(х) = 1 F(x) = 0; х ≤ 3 0,2; 3 < х ≤ 4; 0,3; 4 < х ≤ 7; 0,7; 7 < х ≤ 10; 1; х > 10 8 2. Дифференциальная функция распределения (плотность распределения); ее свойства и график Пусть имеется НСВ и ее интегральная функция распределения (не только непрерывная, но и дифференцируемая). Вычислим Р(х < Х < х + ∆х) = F (x + ∆x) - F (x) Рассмотрим отношение вычисленной вероятности к длине участка ∆х, т.е. среднюю плотность вероятности на этом участке. Если ∆x → 0, то имеем истинную плотность вероятности в точке x. Определение 1. lim (F(x + ∆x) - F(x)) / ∆x = F’(x) = f (x) ∆x → 0 дифференциальная функция распределения, характеризующая плотность распределения вероятности СВХ в данной точке х. Определение 2. График дифференциальной функции распределения называется кривой распределения. Замечание: плотность распределения является (как и интегральная функция распределения) одной из форм закона распределения, но - в отличие от интегральной функции распределения дифференциальная функция распределения не является универсальной, т.к. она существует лишь для НСВ. Свойства: 1. Р (α<Х<β)=F(β)−F(α)=Sβα f (x). (по теореме Ньютона-Лейбница) 2. F (x) = P (X < х) = Р (-∞ < Х < х) = Sxf (x) dx -∞ F (x) = Sxf (x) . dx −∞ 3. f (х) ≥ 0, ∀х, f (x) = F1 (x) ≥ 0, т.к. F (х) - неубывающая. С геометрической точки зрения это означает, что кривая распределения расположена не ниже оси абсцисс. +∞ 4. F (+∞) = P (X<+∞) = P (−∞ < X <+∞) = S f (x) . dx = 1 -∞ +∞ S f (x) . dx = 1 - условие нормировки; −∞ с геометрической точки зрения это означает, что вся площадь, ограниченная кривой распределения и осью ОХ, есть 1. 9 Пример 1. Задана плотность распределения НСВХ: f (x) = 0; x ≤ 0 cos x, 0 < x ≤ π/2 0; x > π/2 Найти F (x) F (x) =Sx f (x) . dx −∞ Если х ≤ 0, то f (x) = 0 ⇒ F (x) = SΧ≤0 0 . dx = 0 F (x) = 0; х ≤ 0 −∞ sin x; 0 < x ≤ π/2 1; х > π/2 0 x≤π/2 cos x . dx = sin x. Если 0 < х ≤ π/2, то F (x) = S dx + S -∞ 0 Если х>π/2, то F(x)=S00 . dx+Sπ/2cos x . dx+Sx>π/20 . dx=sin x |π/2=1 −∞ 0 π/2 |0 Построим графики f(x) и F(x). 10 Пример 2. Плотность распределения НСВХ f(x)=C . 1/√1-x2; х∈[-1; 1]; 0, х ∉ [-1; 1] S+∞−∞ f (x) . dx = 1 Sf+∞1−∞1C . 1/√1-x2 . dx = C . arc sin x 1 -1 = C [arc sin 1 - arc sin(-1) = C . [π/2 + π/2] = 1 C . π = 1 C = 1/π Замечание: формулы для вычисления числовых характеристик НСВХ имеют вид: М(Х) = mx = m = S+∞−∞ x . f(x).dx D(X) = dх = d = M(X2) - M2 (X) = S+∞−∞ x2 . f(x).dx - M2(X) σ (X) = σx = σ = √ D(X) Практическое занятие № 1 Две функции распределения непрерывных случайных величин Задача 1. Случайная величина Х задана на всей оси ОХ интегральной функцией распределения F(x) = 1/2 + (arctg x)/π. Найти вероятность того, что в результате опыта величина Х примет значение, заключенное в интервале (0; 1). Р( 0< х < 1) = F(1) - F(0) = 1/2 + (arctg 1)/π - (1/2 + (arctg 0)/π) = =1/2 + π/4/π - (1/2 + 0/π) = 1/4 Задача 2. Случайная величина Х задана интегральной функцией распределения F(x) = 0; х ≤ -2; 1/2 + (1/π) . arc sin (x/2); -2 < x ≤ 2; 1; x > 2 Найти Р (-1 < Х < 1). Р(-1< х < 1) = F(1) - F(-1) = 1/2 + (1/π) . arc sin (+1/2) - (1/2 + (1/π) . arc sin (-1/2)) = 1/2 + 1/π . π/6 - (1/2 + 1/π (-π/6) = 1/6 + 1/6 = 2/6 = 1/3 Задача 3. Интегральная функция распределения непрерывной случайной величины Х-времени безотказной работы некоторого устройства есть F(x) = 1 - e-x/T(x≥0). Найти вероятность безотказной работы устройства за время х ≥ Т. 11 Р(Х≥Т) = 1 - Р(Х < Т)=1 - Р(0 < Х < Т)=1 - [F(T) - F(0)]=1 - [1 - e-T/T - 1 + e-0/T] = 1 - [1 - e-1 - 1 + e0] = 1 + e-1 - 1 = e-1 - 1 = e-1 = 1/e. Задача 4. Случайная величина Х задана интегральной функцией распределения F(x) = 0; x ≤ 0; x2; 0 < x ≤ 1; 1; x > 1 Найти вероятность того, что в результате четырех независимых испытаний величина Х ровно три раза примет значение, принадлежащее интервалу (1/4; 3/4). P(1/4 < X < 3/4) = F (3/4) - F(1/4) = (3/4)2 - (1/4)2 = 9/16 - 1/16 = 8/16 = 1/2 P3;4 = C34 (1/2)3 . 1/2 = 4 . 1/3 . 1/2 = 1/4 = 0,25 Задача 5. Дана интегральная функция распределения непрерывной случайной величины Х F(x) = 0; x ≤ 0; sin 2x; 0 < x ≤ π/4; 1; x >π/4 Найти плотность распределения f(x) и построить график функций F(x) и f(x). Проверить выполнение условия нормировки. f(x) = 0; x ≤ 0; 2 cos 2x; 0 < x ≤ π/4; 0; x >π/4 Убедимся, что нормировки: S+∞−∞ f(x) dx = 1. полученная функция 12 f(x) удовлетворяет условно Здесь: S+∞−∞f(x).dx=S0−∞0.dx+Sπ/402 cos2x.dx+S∞π/40.dx=Sπ/402 cos 2x.dx = =0 =0 π/4 sin 2x | 0 = sin (π/2) - sin (0) = 1 Задача 6. Задана плотность распределения (дифференциальная функция распределения) непрерывной случайной величины Х: f(x) = 0; x ≤ 1 x - 1/2; 1 < x ≤ 2 0; x > 2 Найти интегральную функцию распределения F(x) и построить графики обеих функций распределения, т.е. f(x) и F(x). Воспользуемся функцией F(x) = Sx−∞f(x) . dx Если х ≤ 1, то f(x) = 0 ⇒ F(x) = S1x≤ 1−∞ 0 . dx = 0 Если 1 < х ≤ π 2, то F(x) = S1−∞0 dx + S1x ≤ 2(x - 1/2)dx = Sx ≤ 211/2.dx = x 2/2 |x≤0 - 1/2x |x ≤21= x2/2 1/2x=1/2(x2-x) Если х > 2, то F(x) = 1 Задача 7. Плотность распределения (дифференциальная функция распределения) непрерывной случайной величины Х задана на всей оси 0Х равенством f(x) = 2C/(1+x2). Найти значение параметра С. 13 Используем условие нормировки: S+∞−∞ f(x) . dx = 1 S+∞−∞ 2C/(1 + x2) . dx = 2C S+∞−∞ dx/(1+x2) = 2C arctg(x)|+∞−∞ = 2C [arctg(+∞) - arctg(−∞)] = 2C [π/2 + π/2] = 2C π = 1 C = 1/(2π) Задачи для самостоятельного решения 1. Случайная величина Х задана интегральной функцией распределения F(x) = 0; x ≤ -1 (3/4)x + 3/4; -1 < x ≤ 1/3 1; x > 1/3 Найти P(0 < Х < 1/3) Ответ: [1/4] 2. Случайная величина Х задана интегральной функцией распределения F(x) = 1/2 + (1/π) arctg (x/2) на всей оси ОХ. Найти возможное значение х1, удовлетворяющее условию: с вероятностью 1/4 случайная величина Х в результате опыта примет значение, большее х1. Ответ: [2]. 3. Задана плотность распределения (дифференциальная распределения) непрерывной случайной величины Х: f(x) = 0; x ≤ 0; sin x; 0 < x ≤ π/2; 0; x > π/2 Найти F(x). Ответ: F(x) = 0; x ≤ 0; 1 - cosx; 0 < x ≤ π/2 1; x > π/2 функция 4. Непрерывная случайная величина Х в интервале (0; π/3) задана плотностью распределения f(x) = (3/2)sin3x; вне указанного интервала f(x) = 0. Найти Р(π/6 < X < π/4). Ответ: [√ 2/4] 5. Убедитесь, что функция f(x) = 3sin3x, x ∈ [π/6 ;π/3], а вне этого интервала равная нулю, может быть дифференциальной функцией некоторого распределения. 6. Случайная величина Х распределена на интервале (0; 2) по закону Симпсона (а вне этого интервала равна нулю). Найти обе функции распределения Симпсона. 14 f(x) = 0; x ≤ 0; x; 0 < x ≤ 1; 2-x; 1 < x ≤ 2; 0; x > 2 F(x) = 0; x ≤ 0 (1/2) x2; 0 < x ≤ 1 -(1/2) (x-2)2 + 1; 1 < x ≤ 2 1; x > 2 7. В предыдущем примере найти Р(1/2 < X < 3/2). Ответ: [3/4] Практическое занятие № 2 Числовые характеристики непрерывных случайных величин Задача 1. Случайная величина Х задана плотностью распределения (дифференциальной функцией распределения) f(x) = (1/2)x в интервале (0; 2); вне этого интервала f (x) = 0. Найти математическое ожидание, дисперсию и стандартное (среднее квадратическое) отклонение СВХ. Используем формулы: М(Х) = S+∞−∞ х f(x) dx D(X) = S+∞−∞ x2f(x)dx - [M2(X)] σ(X) = √D(X), которые в данном случае (с учетом того, что вне интервала (0; 2) f(x) = 0) преобразуются так: M(X) = S20x (1/2) x dx D(X) = S20 x2(1/2)x dx - [M(X)]2 G(X) = √ D(X) Итак: М(Х) = (1/2) 0S2x2dx = 1/2 . x3/3|20 = 1/2 . 23/3 = 4/3 . D(X) = 1/2 0S2x3dx - (4/3)2 = 1/2 . x4/4|20 - 16/9 = 1/2 . 24/4 = 2 - 16/9= 2/9 G(X) = √ 2/9 = √2/3 Ответ: М(Х) = 4/3 D(X) = 2/9 G(X) = √2 /3 15 Задача 2. Случайная величина Х в интервале (-а;а) задана плотностью распределения f(a) = 1/(π√а2 - х2); вне этого интервала f(x) = 0. Найти математическое ожидание СВХ. М(Х) = -аSa x . 1/ (π√ (a2 - x2) . dx = 1/π -aSa x.dx / √(a2 - x2) = 0 (c учетом того, что подынтегральная функция нечетная и пределы интегрирования симметричны относительно начала координат). Замечание: этот результат можно указать сразу, если учесть, что кривая распределения симметрична относительно оси ОУ. Задача 3. Случайная величина Х задана плотностью вероятности f(x)=(1/2) . e-1x1 (распределение Лапласа). Найти математическое ожидание СВХ. Т.к. функция f(x) = (1/2) . е-1x1 - четная, т.е. график ее симметричен относительно оси ОУ, то М(Х) = 0. Задача 4. Случайная величина Х задана плотностью распределения f(x) = C(x2 + 2x) в интервале (0; 1); вне этого интервала f(x) = 0. Найти: а) параметр С; б) математическое ожидание величины Х. Напомним условие нормировки НСВ Х: (в общем виде): . +∞ −∞S f(x) dx = 1 В данном случае оно выглядит так: 1 2 0S c (x + 2x)dx = 1 C . [ 0S1x2dx + 0S12x . dx] = 1 C [x3/3 |10 + 2 . x2/2 |10] = 1 C . [ 1/3 + 1 ] = 1 C . 4/3 = 1 C = 3/4 1 2 M(x) = 0S x . 3/4 (x + 2x) dx M(X) = 3/4 [0S1x3dx + 2 0S1x2dx] = 3/4[x4/4 |10 + 2/3x3 |01] = 3/4 [1/4 + 2/3] = 3/4 ( 3+8)/12 = 1/4 . 11/4 = 11/16 M[X] = 11/16 Ответ: С = 3/4; M(X) = 11/16 Задача 5. Найти математическое ожидание, дисперсию и стандартное отклонение СВХ, заданной интегральной функцией распределения: F(x) = 0; x ≤ 0; x/4; 0 < x ≤ 4; 1; x > 4 найдем дифференциальную функцию распределения f(x) = F1(x): f(x) = 0; x ≤ 0 1/4; 0 < x ≤ 4; 16 0; x > 4 Тогда М(Х)=0S4x . (1/4) . dx = (1/4) . 0S4x . dx=(1/4) . x2/2 |40 = 2 D(X) = 0S4 . x2 . (1/4) . dx - 22 = (1/4) x3/3 |40 - 4 = 1/4 . 43/3 - 4 = 16/3 - 4 = 1 1/3 = 4/3 σ(X) = √ 4/3 = 2/√3 = 2√3/3 Ответ: М(Х) = 2; D(X) = 4/3; σ(X) = 2√3/3 Задача 6. Случайная величина Х в интервале (0; π) задана плотностью распределения f (х) = (1/2) sin x; вне этого интервала f (x) = 0. Найти математическое ожидание, дисперсное и стандартное отклонение СВХ. М(Х) = 0Sπх (1.2) sin x . dx = (1/2)0Sπx sinx dx u=x dU = dx π π π 0S x sinx dx = | dV = sinx dx V = S sinx dx + - cosx| = -x cos x | 0 + 0S cosx dx = -π . cosπ = -1 + 0 . cos 0 + sinx | π0 = π Окончательно: М(Х) = (1/2)π = π/2 (этого же результата можно достичь быстрее с учетом того, что кривая распределения симметрична относительно прямой х = π/2). D (X) = 1/2 0Sπ x2 sin x . dx - [π/2]2 Дважды интегрируя по частям, найдем 0Sπ x2 sin x . dx = π2 - 4 Используя полученный результат, имеем: σ (X) = √(π2-8)/2 D(X) = (π2 - 8)/4 Ответ: М(Х) = π/2; D(X) = π2 - 8 / 4; σ(X) = √(π2 - 8)/ 2 Задача 7. Случайная величина Х задана интегральной функцией распределения: F (x) = 0; x ≤ -2; x/4 + 1/2; -2 < x ≤ 2; 1; x > 2 Найти математическое ожидание, дисперсию и стандартное отклонение. f(x) = F1(x) = 0; x ≤ -2; 1/4; -2 < x ≤ 2 0; x > 2 2 M(X)=-2S 1/4 . x. dx = (1/4) . x2/2 |2-2 = D 1/4.1/2 [22 -(-2)2] = 0 D(X)=-2S2 x2 1/4 / dx=1/4 . x3/3 |2-2 = 1/12 . [23 -(-2)3]=16/12=4/3 σ(X) = √4/3 = 2√3 /3 Ответ: М(Х) = 0; D(Х) = 4/3; σ (Х) = 2√3/3 Задачи для самостоятельного решения 17 1. Случайная величина Х задана плотностью распределения (дифференциальной функцией распределения) f(x) = 2x в интервале (0; 1); вне этого интервала f(x) = 0. Найти математическое ожидание, дисперсию и стандартное отклонение СВХ. [2/3; 2/9; √2/3] 2. Случайная величина Х, возможные значения которой неотрицательны, задана интегральной функцией распределения F(x) = 1 - e−αx (α>0). Найти математическое ожидание, дисперсию и стандартное отклонение СВХ. [1/α; 1/α2; 1/α]. 3. Случайная величина Х в интервале (2; 4) задана плотностью распределения f(x) = 1/2; вне этого интервала f(x) = 0. Найти математическое ожидание, дисперсию и стандартное отклонение СВХ. [3; 1/3; √3/3]. 4. Случайная величина Х в интервале (2; 4) задана плотностью распределения f(x) = -(3/4)x2 + (9/2)x - 6; вне этого интервала f(x) = 0. Найти математическое ожидание СВХ. [3] 5. Доказать, что математическое ожидание непрерывной случайной величины заключено между наименьшим и наибольшим ее возможными значениями. 6. Случайная величина Х в интервале (-а; а) задана плотностью распределения f(x) = 1 /(π√(а2 - х2); вне этого интервала f(x) = 0. Найти дисперсию СВХ. [a2/2] 7. Случайная величина Х в интервале (-3; 3) задана плотностью распределения f(x) = 1/(π√(9-x2)); вне этого интервала f(x)=0. Найти дисперсию СВХ; что вероятнее: в результате испытания окажется Х < 1 или Х > 1? [4,5; P (-3 < X < 1) = 0,5 + (1/π) arc sin (1/3); P (1 < x < 3) = 0,5 - (1/π) . arc sin (1/3)] Глава II. ОСНОВНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН 1. Равномерноe непрерывное распределение (закон равномерной плотности) Определение 1. Непрерывная случайная величина Х распределена равномерно на [a; b], если на участке [a; b] плотность ее постоянна, а вне этого участка равна 0. f (x) = const; x ∈ [a; b] 0; x ∉ [a; b] 18 Исходя из условия нормировки, можем определить значение константы С: S =1 f (x) = C . (b - a) = 1 ⇒ C = 1/ b -a; 1/ b - a; x ∈ [a; b] 0; x ∉ [a; b] Найдем интегральную функцию распределения; построим ее график; вычислим вероятность попадания равномерно распределенной НСВ Х на любой промежуток, являющийся частью данного, а также числовые характеристики равномерно непрерывного распределения. F (x) = −∞Sx f (x) . dx 1) x < a; F (x) = −∞Sx< a 0 . dx = 0 2) a ≤ x ≤ b; F (x)=aSx≤ b 1/(b-a) . dx=1/(b-a) . x |x≤ ba=(x-a)/ (b-a) 3) x > b F (x) = aSb 1/b - a . dx + bSx > b0 . dx = 1 F (x) = 0; x < a (x - a)/(b - a); a ≤ x ≤ b 1; x > b [α; β] ⊂ [a; b] 19 P (α<X<β)=F(β)-F(α)=(β-α) / (b-a)-(α-a) / (b-a)=(β-α) / (b-a) M(X) = m = −∞S+∞x . f(x) . dx M(X)=m=aSbx.1/(b-a).dx=1/(b-a).x2/2|ba=1/(b-a) . (b2-a2)/2=(b+a)/2 D(X) = d = M(X2) - M2(X) M(X2) = −∞S+∞x2 . f(x) / dx M(X2)=aSbx2.1/(b-a).dx=1/(b-a).x3/3|ba1/(b-a)/(b3-a3)/3=(a2+ab+b2)/3 D(X) = d = (a2 + ab + b2)/3 - (b+a)2/4 = (b -a)2/12 σ(X) = σ = (b-a)/ √12 = (b-a)/2√3 σ = (b-a)/2√3 m = (b+a)/2 d = (b-a)2/12 Пример. Cлучайная величина Х в интервале (2; 4) задана плотностью распределения f(x) = 1/2; вне этого интервала f(x) = 0. Найти математическое ожидание, дисперсию и стандартное отклонение СВХ. m = (4+2)/2 = 3 d = (4-2)2/12 = 4/12 = 1/3 σ = 2/2√3 = 1/√3 = √3/3 2. Экспоненциальное (показательное) распределение Определение. Непрерывная случайная величина Х распределена экспоненциально (показательно), если ее дифференциальная функция распределения имеет вид: f (x) = 0; x < 0; µ = const > 0 (1) −µx µ.e ;x≥0 Убедимся, что условие нормировки в данном случае имеет место: +∞ −∞S f (x) . dx = 1 x<o 0 . dx + S+∞µ . e−µx . dx = - 0S+∞e−µx . d (-µx) = -e−µx|+∞0 = 1 −∞S Найдем интегральную функцию распределения F (x) и построим графики f (x) и F (x): F(x)=0Sx>0µ. e−µx . dx=-Sx > 00 e−µx . d(-µx)=-e−µx|x > 00=-e−µx+1=1-e−µx F (x) = 0; x < 0; (2) −µx 1-e ;x≥0 20 P (α < X <β) = F (β) - F (α) = 1 - e−µβ - 1 + e−µα = e−µα - e−µβ M(X) = m = −∞S+∞ f(x) dx dU = dx | = M(X) = m = 0S+∞x . µ . e−µx. dx = | U = x −µx V = -e−µx dV = µ . e . dx (3) -e−µx . x|+∞0 + 0S+∞e−µx . dx=- 1/µ 0S+∞ e−µx . d(-µx)=-1/µ . e−µ+ |0∞=1/µ m = 1/µ (4) 2 2 D(X) = d = M (X ) - M (X) M(X2) = 0S+∞ x2 µ . e−µx .dx = | U = x2 dU = 2x . dx | = ... = 2/µ2 dV = µ . e−µx. dx V = -e−µx d = 2/µ2 - 1/µ2 = 1/µ2 d = 1/µ2 σ = 1/µ (5) Таким образом, при экспоненциальном распределении стандартное (т.е. среднее квадратическое) отклонение и ожидаемое значение (математическое ожидание; среднее значение) равны. Справедливо и обратное: если есть некоторое распределение, где m и σ cовпадают (хотя бы приближенно), то это распределение можно считать экспоненциальным с параметром µ = 1/m = 1/σ. Пример.Написать дифференциальную и интегральную функции распределения для показательного закона, если параметр µ = 5. Подставляя µ = 5 в соотношения (1) и (2), имеем: f (x) = 0; x < 0; 5e-5x; x ≥ 0 F (x) = 0; x < 0; 1 - e-5x; x ≥ o 3. Нормальное распределение (нормальный закон распределения непрерывной случайной величины) Определение 1. НСВ Х распределена нормально, если ее дифференциальная функция распределения (плотность распределения) имеет вид f (x) = exp (-(x-m)2/2σ2) /σ√(2π); ∀x∈ (-∞; +∞). Этот закон характеризуется двумя параметрами: m ≥ 0; σ > 0. Покажем, что выполняется условие нормировки: −∞S+∞ f (x).dx=1 +∞ exp (-(x-m)2/2σ2)/σ√(2π). dx = | (x-m)/σ = z −∞S | x-m = σz | x = m + σz 21 | dx = σ . dz x z −∞ −∞ +∞ +∞ = −∞S+∞ exp(-z2/2) dz/√(2π). Заметим, что здесь получился т.н. интеграл Эйлера-Пуассона: −∞S+∞ exp(z2/2) . dz = √2π С учетом этого действительно в ответе: 1. Найдем числовые характеристики нормального распределения: М(Х) = −∞S+∞ x . f (x) / dx M(X) = −∞S+∞ x . exp(-(x-m)2/2σ2)/σ√(2π) . dx = | (x - m)/ σ = z | ................. | ................. . 2 . +∞ . =−∞S (σ z + m) exp(-z /2)/√2π dz = σ√2πS+∞−∞z . exp(-z2/2) . dz + m−∞S+∞ . exp (z2/2).dz/√2π = m Замечание: первый из интегралов указанной суммы равен 0 как интеграл от нечетной функции по симметричному промежутку; второй есть интеграл Эйлера-Пуассона. Аналогично можно показать, что D(X) = σ2. Таким образом, подтвержден - заложенный в обозначениях! вероятностный смысл параметров m и σ нормального закона распределения. Определение 2. График дифференциальной функции нормального распределения называется нормальной кривой (или кривой Гаусса). Укажем теперь влияние параметров m и σ на форму кривой распределения. 22 у = f(x) = exp(-(x-m)2/2σ2)/σ√(2π); m ≥ 0; σ > 0 Ymax = f(m) = 1/σ√2π Изменение параметра m означает смещение кривой Гаусса вправо или влево. σ = 3: вершина опустится; “крылышки” поднимутся: т.к. площадь, ограниченная кривой Гаусса, должна остаться равной 1 (условие нормировки). Замечание: если НСВ Х распределена нормально с математическим ожиданием m и стандартным отклонением σ, то это обычно обозначается так: X∼ N (m; σ) Например: распределение X∼N (0; 1) называется стандартным (единичным) нормальным распределением (m = 0; σ = 1). Вычислим вероятность попадания нормально распределенной СВ Х на [α; β]: P (α < x < β) = βSα f(x) . dx P (α < X < β) = αSβ exp(-(x-m)2/2σ2)σ√(2π) . dx = | x - m/σ = z | x - m = σz | x = m + σz | dx = σ . dz Χ α β z (β - m)/σ = z2 (α - m)/σ = z1 = z1Sz2 exp(-z2/2). dz/√(2π) Указанный интеграл в элементарных функциях не выражается, поэтому для вычисления указанной вероятности используют т.н. функцию Лапласа (интеграл вероятностей): Ф(z) = 0Szexp(-z2/2)dz/√2π; тогда 23 P (α < X <β) = Ф (z2) - Ф (z1) = Ф ((β - m)/σ) - Ф ((α - m)/σ) Замечание: для функции Лапласа можно указать представляющий ее степенной ряд, с помощью которого эта функция протабулирована (т.е. этой функции составлены таблицы значений - cмотрите приложение I. P (α < X < β) = Ф ((β - m)/σ) - Ф((α - m)/σ) ( *) Можно доказать, что функция Ф (z) обладает свойствами: 1. Ф (0) = 0 2. Ф (-z) = -Ф (z) (нечетность Ф (z)) 3. Ф (+∞) = 0,5 Используя свойство нечетности функции Ф(z), выведем формулу вычисления вероятности попадания нормально распределенной СВХ промежуток длиной 2l и симметричной относительно МО m. α=m-l β=m+l P (m - l < X < m + l) = Ф(l/σ) - Ф (-l/σ) = 2 Ф (1/σ) P (m - l < -X < m + l) = 2 . Ф(l/σ) m - l < X < m + l ↔ -l < X - m < l ↔ |X - m| < l P (|X - m| < l) = 2 . Ф (l/σ) Укажем т.н. “правило трех сигм”. l = σ P (|X - m | < σ) = 2 . Ф (1) = 0,683 l = 2σ P (|X - m| < 2σ) = 2 . Ф(2) = 0,954 l = 3σ P (|X - m| < 3σ = 2 . Ф (3) = 0,997 24 (**) (**) (***) т.н. для для на Таким образом, практически все значения нормально распределенной НСВ Х лежат на промежутке [m - 3σ; m + 3σ] Это и есть “правило трех сигм” (***) Практическое занятие № 1 Нормальное распределение Задача 1. Математическое ожидание нормально распределенной случайной величины Х m = 3 и стандартное (среднее квадратическое) отклонение σ = 2. Написать дифференциальную функцию распределения СВХ: f (x) = exp(-(x 3)2/8)/ 2√(2π) Задача 2. Написать дифференциальную распределения) СВХ X ∼ N (3; 4). f (x) = exp (-(x - 3)2/32))/4√(2π) функцию распределения (плотность Задача 3. Случайная величина Х имеет плотность распределения f (x) =exp (-(x 2 1) /50)/5√(2π).. Найти математическое ожидание, дисперсию и стандартное отклонение СВХ. Очевидно, что СВХ распределена нормально, следовательно, m = 1; d = 25; σ = 5. Задача 4. Написать плотность распределения стандартного нормального закона. Как известно, для стандартного нормального закона m = 0; σ = 1. Следовательно: f (x) = exp (-x2/2)/√(2π) ≈ 0,4 . exp (-x2/2) Задача 5. Известно, что Х ∼ N (10; 2). Найти P (12 < X < 14). 25 Воспользуемся формулой P (α < X < β) = Ф ((β - m)/σ) - Ф ((α - m)/σ) Т.к. α = 12; β = 14; m = 10; σ = 2, получим: P (12 < X < 14) = Ф (2) - Ф (1) = 0,4772 - 0,3413 = 0,1359 Задача 6. Производится измерение диаметра вала без систематических (одного знака) ошибок. Случайные ошибки измерения Х подчинены нормальному закону со стандартным отклонением σ = 10 (мм). Найти вероятность того, что измерение будет произведено с ошибкой, не превосходящей по абсолютной величине 15 мм. Математическое ожидание случайных ошибок очевидно, естественно считать равным нулю, поэтому можно воспользоваться формулой P (|X| < l) = 2 . Ф (l/σ) Т.к. д = 15; σ = 10, то P (|X| < 15) = 2 . Ф (1,5) Находим значение Ф (1,5) - как и все предыдущие значения Ф по соответствующей таблице (приложение I). Ф (1,5) = 0,4332. Искомая вероятность: P (|X| < 15) = 2 . 0,4332 = 0,8664 Задача 7. Автоматическое устройство штампует детали. Контролируется длина детали Х, которая распределена нормально, причем проектная длина детали 50 мм. Фактически длина изготовленных деталей не менее 32 и не более 68 мм. Найти вероятность того, что длина наудачу взятой детали: а) больше 55 мм; б) меньше 40 мм. Очевидно, здесь надо воспользоваться формулой: P (α < X <β) = Ф ((β - m)/σ) - Ф ((α - m)/σ) Действительно, в случае а) надо искать: Р (55 < X < 68); в случае б): Р (32 < X < 40). Поэтому надо знать m и σ. Относительно m ситуация ясна: m - математическое ожидание - это проектная длина (m = 50). Для отыскания σ заметим, что Р (32 < X < 68) = 1 P (32 < X < 68) = Ф ((68 - 50)/σ) - Ф((32 - 50)/σ) = 1 Ф (18/σ) - Ф (-18/σ) = 1 2 . Ф(18/σ) = 1 Ф (18/σ) = 1/2 = 0,5 18/σ = 5 σ = 3,6 Тогда: Р (55 < X < 68) = Ф ((68 - 50)/3,6) - Ф ((55 - 50)/3,6) = Ф (5) - Ф (1,39) = 0,5 - 0,4177 = 0,0823 Р (32 < X < 40) = Ф ((40 - 50)/3,6) - Ф ((32 - 50)/3,6) = Ф(-10/3,6) - Ф (18/3,6) = Ф (5) - Ф (2,78) = 0,5 - 0,4973 = 0,0027 26 Задачи для самостоятельного решения 1. СВ Х∼ N (20; 5). Найти Р (15 < X < 25). [0,6826] 2. Производится взвешивание некоторого вещества без математических ошибок. Случайные ошибки взвешивания подчинены нормальному закону со стандартным отклонением σ = 20 г. Найти вероятность того, что взвешивание будет произведено с ошибкой, не превосходящей по абсолютной величине 10 г. [P (|X| < 10) = 0,383] 3. Автоматическое устройство изготовляет шарики. Шарик считается годным, если отклонение Х диаметра шарика от проектного размера по абсолютной величине меньше 0,7 мм. Считая, что случайная величина Х распределена нормально со стандартным отклонением σ = 0,4 мм, найти, сколько в среднем будет годных шариков среди ста изготовленных. [P (|X| < 0,7 = 2 . Ф (0,7/0,4) = 0,92, т.е. примерно 92 шарика из 100 окажутся годными]. 4. Деталь, изготовленная автоматическим устройством, считается годной, если отклонение ее контролируемого размера от проектного не превышает 10 мм. Случайные отклонения контролируемого размера подчинены нормальному закону (m = 0; σ = 5 мм). Сколько процентов годных деталей изготавливает автоматическое устройство? [ ≈ 95%] 5. Случайная величина Х распределена нормально с математическим ожиданием m = 10. Вероятность попадания Х в интервал (10; 20) равна 0,3. Чему равна вероятность попадания Х в интервал (0; 10)? [0,3] 6. Станок-автомат изготавливает валики, причем контролируется их диаметр Х. Считая, что Х ∼ N (10; 0,1), найти интервал, симметричный относительно математического ожидания, в котором с вероятностью 0,9973 будут заключены диаметры изготовленных валиков. [9,7; 10,3] 7. Модой М0(Х) называют то возможное значение случайной величины Х, при котором плотность распределения имеет максимум; медианой Ме(Х) называют то возможное значение Х, при котором ордината f (x) делит пополам площадь, ограниченную кривой распределения. Случайная величина Х∼ N (m; σ). Найти моду и медиану СВХ. [M0(X) = Mе(Х) = m]. Глава III. ПРЕДЕЛЬНЫЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ ТЕОРЕМЫ В чем смысл названия главы? Как уже отмечалось, законы теории вероятностей получены в результате изучения реальных закономерностей, присущих массовым случайным событиям. Наличие указанных закономерностей связано именно с массовостью явлений (т.е. с большим 27 числом испытаний или с большим числом складывающихся случайных воздействий, порождающих некоторую случайную величину, подчиненную определенному закону). Свойство устойчивости массовых однородных случайных событий известно давно: конкретные особенности каждого отдельного случайного события почти не сказываются на среднем результате массы таких событий. Именно эта устойчивость средних и есть содержание “закона больших чисел” (ЗБЧ), понимаемого в широком смысле термина: при очень большом числе случайных событий средний их результат практически перестает быть случайным и может быть предсказан (с большой степенью достоверности). В узком смысле термина под “ЗБЧ” понимается ряд теорем, в каждой из которых при тех или иных условиях устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным. ЗБЧ играет существенную роль в практике применения теории вероятностей, т.к. позволяет предсказывать результаты массовых однородных случайных событий почти с полной определенностью. Возможности таких предсказаний еще больше расширяются наличием другой группы предельных теорем - т.н. предельных законов распределения. Здесь речь идет о группе теорем, известных под названием “центральной предельной теоремы” (ЦПТ). Доказано, что при суммировании достаточно большого числа случайных величин закон распределения их суммы неограниченно приближается к нормальному (при некоторых условиях, которые по существу сводятся к требованию, чтобы влияние на сумму отдельных слагаемых было равномерно малым). Различные формы ЗБЧ вместе с различными формами ЦПТ и образуют совокупность т.н. предельных теорем теории вероятностей, которые дают возможность не только осуществлять определенные - научно обоснованные! прогнозы в области случайных явлений, но и оценивать точность этих прогнозов. 1. Неравенство Чебышева Пусть имеется СВХ с МО mx = m и дисперсией D(X) = D. Тогда для ∀α > 0 имеет место: Р(|X - m| ≥ α) ≤ D/α2 Доказательство (для ДСВХ): пусть ДСВХ имеет распределение Х P х1 p1 х2 p2 ... ... Изобразим эту ДСВХ на числовой оси: 28 хn pn Возьмем ∀α > 0 и рассмотрим [m - α; m + α] P(|X - m| ≥ α) = ∑pi |xi - m) ≥ α| D = M{[X - m] } = i = 1∑n (xi - m)2 . pi = i = 1∑n |xi - m|2 . pi ≥ |xi - m| ≥α∑.α2.pi = α2 . ∑|xi - m| ≥α = α2 P(|X - m| ≥ α) 2 P(|X - m| ≥ α) ≤ D/α2 Замечание. Учитывая, что события: |X - m| ≥α и |X - m| < α противоположные, запишем другую форму неравенства Чебышева: P(|X - m| < α) ≥ 1 - D/α2 Пример. Имеется некоторая СВХ с m и D. Оценить вероятность следующего события: P(|X - m| ≥ 3σ) Решение. P(|X - m| ≥ 3σ) ≤ D/(3σ)2 = σ2/9σ2 = 1/9 Вывод: неравенство Чебышева дает верхнюю границу вероятности данного отклонения. Выше этой границы вероятность не может быть ни при каком законе распределения. На практике в большинстве случаев вероятность того, что СВХ выйдет за пределы участка m ± 3σ, значительно меньше 1/9. Например, для нормального закона эта вероятность ≈ 0,003. Если закон 29 распределения СВХ неизвестен, а известны m и σ, на практике обычно считают отрезок [m - 3σ; m + 3σ] участком практически возможных значений СВХ (т.н. обобщенное “правило трех сигм”). 2. Теорема Чебышева (закон больших чисел) Предварительно рассмотрим следующую вспомогательную задачу. Имеется СВХ с mx и Dx. Над этой величиной производится n независимых опытов и вычисляется среднее арифметическое (СА) всех наблюдавшихся значений Х. Требуется найти числовые характеристики этого СА - МО и дисперсию - и выяснить, как они изменяются с увеличением n. Обозначим: Х1 - значение величины Х в первом опыте; Х2 - значение величины во втором опыте etc. Естественно ожидать, что совокупность величин Х1; Х2; ...; Хn представляет собой n независимых СВ, каждая из которых распределена по тому же закону, что и сама величина Х. Рассмотрим СА этих величин: Y = i = 1∑nXi/n и найдем числовые характеристики этого СА: my=M(Y)=M(i=1∑Xi/n)=1/n M[i=1∑nXi]=1/n.n.M[Xi]=1/n.n.mx=mx dy=D(Y)=D (i=1∑nXi/n)=1/n2D(i=1∑Xi)=1/n2 . n . D(Xi)=1/n . Dx Итак, МО величины Y не зависит от числа опытов и равно МО наблюдаемой величины Х; дисперсия же Y неограниченно убывает с увеличением числа опытов и при достаточно большом n может быть сделана сколь угодно малой. Мы убедились, что СА есть СВ со сколь угодно малой дисперсией и при большом числе опытов ведет себя почти как не случайная. Теорема Чебышева и устанавливает в точной количественной форме это свойство устойчивости СА. Сформулируем эту теорему, предварительно указав следующее: Определение. Говорят, что СВ Хn cходится по вероятности к величине а, если при увеличении n вероятность того, что Хn и а будут сколько угодно близки, неограниченно приближается к 1, т.е. при достаточно большом n имеет место: Р(|Xn - а| < ε) > 1 -δ, где ε, δ- произвольно малые положительные числа. Теорема Чебышева При достаточно большом числе независимых опытов СА наблюдавшихся значений СВ сходится по вероятности к ее МО. 30 Другими словами: Р(|i=1∑nXi/n - mx| < ε) > 1-δ Замечание: для доказательства теоремы Чебышева достаточно применить неравенство Чебышева к СВ Y = i=1∑nXi/n Прямым следствием ЗБЧ является известная теорема Я. Бернулли, устанавливающая связь между частотой события и его вероятностью. Теорема Бернулли Пусть производится n независимых опытов , в каждом из которых может появиться или не появиться некоторое событие А; вероятность появления А в каждом опыте есть р. При неограниченном увеличении числа опытов n частота события А сходится по вероятности к его вероятности р. Обозначая частоту события А через W(A), имеем: P(|W(A) - p| < ε) > 1 -δ, где ε, δ - сколь угодно малые положительные числа W(A) = m/n; где m - число испытаний, в которых событие А появилось; n - общее число испытаний Можно доказать, что имеет место соотношение: P(|m/n - p|) < ε ) ≥ 1 - p(1 - p)/(n .ε 2), т.е.δ = p(1 - p) /( n .ε 2) Заметим, что если p + q = 1, то max [p . (1 - p)] = 1/4 Замечание: теорема Бернулли утверждает устойчивость частоты при постоянных условиях опыта; при изменяющихся условиях опыта аналогичная устойчивость также существует и выражается теоремой Пуассона. Если производится n независимых опытов и вероятность появления события А в i-опыте есть pi, то при неограниченном увеличении n частота события А сходится по вероятности к СА вероятностей pi. 3. Теорема Ляпунова (центральная предельная теорема). Интегральная теорема Лапласа (теорема Муавра-Лапласа) Рассмотрим вопрос, связанный с отысканием предельного закона распределения суммы СВХi Y = i=1∑nXi , когда число слагаемых СВ неограниченно возрастает. Теорема Ляпунова (ЦПТ) указывает условия, при которых рассматриваемый предельный закон является нормальным. Теорема Ляпунова. Если СВ Х1; Х2; ...; Хn независимы и имеют один и тот же закон распределения с МО М(Х) и дисперсией D(Х), то при неограниченном увеличении n-числа СВ закон распределения суммы приближается к нормальному (рассмотрим без доказательства). Из теоремы Ляпунова следует, что можно - в ее условиях - пользоваться формулами: P(α < Y < β) = Ф((β - M(Y))/σ(Y)) - Ф((α - M(Y))/σ(Y)) (*) 31 P(|Y - M(Y)| < l) = 2 Ф(l/σ(Y)) (**) Замечание: часто рассматривается СА нескольких СВ Хi; i = 1, 2, ..., n; распределенных одинаково с М(Х) и D(Х), т.е. Y = i=1∑nXi/n. Для этого случая в предыдущем пункте было доказано: M(Y) = M(X) D(Y) = 1/n D(X) D(Y) = σ2(Y); D(X) = σ2(X) σ(Y) = 1/√n .σ(X) Пример 1. Автоматическая линия производит детали, длина которых Х по номиналу должна быть 50 см; дисперсия σ2(Х) = 0,64 (σ = 0,8). Контролер, измерив длину ста случайно выбранных деталей, установил, что СА (Y = 1/100i=1∑nXi) длин этих деталей 50,8 см. Это случайность или линия стала выпускать детали длиннее номинала? Определим, в каких пределах может меняться СА длин сотни деталей по причине случайности, например, с вероятностью 0,95. Согласно теореме Ляпунова СА, т.е. Y =i=1∑nXi/100 распределено по закону, близкому к нормальному, т.е. P(|Y - M(Y)| < l) ≈ 2 Ф(l/σ(Y)) (**) D(Y) = 1/100 D(X) σ(Y) = 1/10 σ(X) = 0,8/10 M(Y) = M(X) = 50 P(|Y - 50| < l) = 2 Ф(l . 10/0,8) = 2 Ф(12,5 . ) = 0,95 Ф(12,5 . l) = 0,475 12,5 . l = 1,96 =1,96 l = 0,16 P(|Y - 50) < 0,16) = 0,95 -0,16 < Y - 50 < 0,16 50 - 0,16 < Y < 50 + 0,16 49,84 < Y < 50,16 У нас: 50,8 Вывод: автоматическая линия неисправна (с достоверностью 0,95) Замечание: соотношение P(|X - m| < l) = P(m - l < X < m + l) = γ можно перефразировать так: вероятность того, что Х не выйдет за пределы интервала (m - l, < m + l), равна γ. Принято называть этот интервал доверительным интервалом СВХ с уровнем достоверности γ. Если в условиях теоремы Ляпунова считать, что все СВХi одинаково распределены, дискретны и принимают только два возможных значения: 0 и 1, то приходят к интегральной теореме Лапласа (теореме Муавра-Лапласа), которая представляет, таким образом, частный случай теоремы Ляпунова и формулируется так: Если производится n независимых опытов, в каждом из которых событие А появляется с вероятностью р (биномиальный эксперимент!), то вероятность того, что это событие наступит не менее к1 раз и не более к2 раз, вычисляется по формуле (к1< к2; q = 1 - p): 32 Pn(k1; k2) = Ф ((k2 - np)/√npq) - Ф((k1 - np)/√npq) Пример 2. Вероятность появления события в каждом из 100 независимых испытаний одна и та же р = 0,8. Найти вероятность того, что событие появится не менее 60 и не более 90 раз. р = 0,8; q = 1 - 0,8 = 0,2; n = 100; k1 = 60; k2 = 90 P100(60; 90) = Ф((90-80)/√16) - Ф((60 - 80)/√16) = Ф(2,5) + Ф(3) = 0,4938 + 0,5 = 0,9938 ≈ 0,99 Пример 3. Вероятность появления события в каждом из независимых испытаний 0,8. Сколько нужно произвести испытаний, чтобы с вероятностью 0,9 можно было утверждать, что событие появится не менее 75 раз. p = 0,8; q = 0,2; p = 0,9; k1 = 75; k2 = n (?) 0,9=Pn (75; n)=Ф((n-0,8n)/√n . 0,8 . 0,2) - Ф((75 - 0,8n)/√0,16 . n) 0,9 = Ф(0,2n/0,4√n) - Ф((75 - 0,8n)/0,4√n) = 0,5 Так как n > 75, √n > √75; √n/2 > √75/2 = 4,33 Ф(√n/2) > Ф(4,33) = 0,5 0,4 = -Ф((75 - 0,8n)/0,4√n) 0,4 = Ф((0,8n - 75)/0,4√n) =1,28 (по таблице) (0,8n - 75)/0,4√n = 1,28 0,8n - 75 = 0,512√n; √n = t; 0,8t2 - 0,512t - 75 = 0 t1 = 10 t2 = -10 (не подходит) √т = 10 т = 100 Ответ: искомое число испытаний n = 100. Замечание: интегральную теорему Лапласа (теорему Муавра-Лапласа) не следует смешивать с локальной теоремой Лапласа, в которой утверждается следующее: Вероятность того, что в n независимых испытаниях, в каждом из которых вероятность появления события равна р(0 < p < 1), событие наступит ровно k раз, приближенно равна (и тем точнее, чем больше n) ϕ(x) = exp(-x2/2)/√(2π) Pn(k) = Pk;n = ϕ(x)/√npq; x = (k -np)/√npq [Функция ϕ(х) протабулирована; и т.к. эта функция четная, для отрицательных значений х пользуются той же таблицей - смотрите приложение I]. Таким образом, налицо ситуация формулы Бернулли: Pk;n=Cnk . Pk . qn-k, но локальная теорема Лапласа применяется в тех случаях, когда счет по формуле Бернулли озадачивает даже ЭВМ. Практическое занятие № 1 Неравенство Чебышева. Теорема Ляпунова 33 Задача 1. Устройство состоит из 10 независимо работающих элементов. Вероятность отказа каждого элемента за время Т равна 0,05. С помощью неравенства Чебышева оценить вероятность того, что абсолютная величина разности между числом отказавших элементов и средним числом (МО) отказов за время Т окажется: а) меньше двух; б) не меньше двух. Решение: Обозначим Х - дискретная случайная величина - число отказавших элементов (за время Т). Тогда M(X) = m = n . p M(X) = 10 . 0,05 = 0,5 D(X) = d = n . p . q D(X) = 10 . 0,05 . 0,95 = 0,475 В соответствии с неравенством Чебышева: P(|X - m| < α) ≥ 1 - D(X)/α2 получим: P(|X - 0,5| < 2) ≥ 1 - 0,475/4 = 0,88 Т.к. события |X - 0,5| < 2 и |X - 0,5| ≥ 2 - противоположные, то P(|X - 0,5| ≥ 2) ≤ 1 - 0,88 = 0,12 Задача 2. Вероятность появления события А в каждом испытании 1/2. Используя неравенство Чебышева, оценить вероятность того, что число появлений события А заключено в пределах от 40 до 60, если будет произведено 100 независимых испытаний. Решение: Заметим, что М(Х) и D(X), где Х - дискретная случайная величина - число появлений события А в 100 независимых испытаниях соответственно равны: M(X) = m = n . p M(X) = m = 100 . 0,5 = 50 D(X) = n . p . q D(X) = 100 . 0,5 . 0,5 = 25 Число 50 - середина промежутка (40; 60); так что в неравенстве Чебышева α = 10: Р(40 < X < 60) = P(|X - 50| < 10) ≥ 1 - 25/102 = 0,75 Задача 3. Дискретная случайная величина Х задана рядом распределения: Х 0,3 0,6 Р 0,2 0,8 Используя неравенство Чебышева, оценить P(|X - m| < 0,2) Решение: M(X) = m = 0,3 . 0,2 + 0,6 . 0,8 = 0,54 D(X) = M(X2) - M2(X) D(X) = 0,32 . 0,2 + 0,62 . 0,8 - 0,542 = 0,0144 P(|X - m| < α) ≥ 1 - D(X)/α2 34 P(|X - 0,54| < 0,2) ≥ 1 - 0,0144/4 = 0,64 Замечание: в предыдущих трех задачах оценивалась вероятность отклонения некоторой дискретной случайной величины Х от ее математического ожидания с помощью неравенства Чебышева, которое - как известно - дает нижнюю границу вероятности заданного отклонения. Другую границу вероятности заданного отклонения можно указать с помощью теоремы Ляпунова, из которой, в частности, следует, что этой границей является оценка, полученная с помощью приближения заданного распределения нормальным (распределением Гаусса): P(|X - m| < α) = 2 . Ф(α/σ) С этой точки зрения имеем: в задаче № 1: P(|X-0,5|<2) ≈ 2.Ф(2/√0,475) = 2.Ф(2/0,69) = 2.Ф(3,22) = 2.0,4993 = 0,9986 σ = √0,475 - 0,69 P(|X - 0,5| < 2) ≈ 0,999 0,88 ≤ P(|X - 0,5| < 2) < 0,999 В задаче 2: σ = √25 = 5 P(|X - 50| < 10) = 2 . Ф(10/5) = 2 . Ф(2)=2 . 0,4772 = 0,9544= 0,96 0,75 ≤ P(|X - 50| < 10) < 0,96 В задаче 3: σ = √0,0144 = 0,12 P(|X - 0,54| < 0,2) = 2 . Ф(0,2/0,12) = 2 . Ф(1,67)=2 . 0,4525=0,905 0,64 ≤ P(|X - 0,54| < 0,2) ≤ 0,905 Таким образом, совместное использование неравенства Чебышева и теоремы Ляпунова позволяет нам указать оценку, которая определяется двумя числами - концами интервала, покрывающего оцениваемый параметр - в данном случае это вероятность заданного отклонения случайной величины Х от ее математического ожидания (такие оценки называются интервальными). Задача 4. Непрерывная случайная величина Х имеет распределение Симпсона: f(x) = 0; x ≤0; x; 0 < x ≤ 1; 2 - x; 1 < x ≤ 2; 0; x > 2 Используя неравенство Чебышева и теорему Ляпунова, оценить: P(0,5<X<1,5). Решение: найдем числовые характеристики М(Х), Д(Х) и σ(Х): M(X) = m = −∞S+∞x . f(x) . dx M(X) = m = 0S1x . x . dx + 1S2(2 - x) . dx = 0S1x2 . dx + 1S2(2x - x2) . dx = x3/3(10 + 2 . x2/2|21 - x3/3|21 = ... = 1 D(X) = M(X2) - M2(X) M(X2) = −∞S+∞x2 . f(x) dx 35 M(X2) = 0S1x2 . x . dx + 1S2x2(2 - x) . dx = 0S1x3 . dx + 1S22x2 . dx - 1S2x3 . dx = x4/4|10 + 2 . x3/3|21 - x4/4|21 = ... = 7/6 = 1(1/6) D(X) = 1(1/6) - 1 = 1/6 σ(X) = √1/0 ≈ 0,4082 С учетом того, что m = 1, нам надо оценить: P(0,5 < X < 1,5) = P(|X - 1| < 1/2) Используя неравенства Чебышева, имеем: P(|X - 1| < 1/2) ≥ 1 - (1/6) : (1/2)2 = 1/3 ≈ 0,3333 Используя теорему Ляпунова (т.е. рассматривая нормальное приближение), получим: P(|X-1|<1/2)=2 . Ф(0,5/√1/6)=2 . Ф(√6/2)=2 . Ф(1,225)=2 . 0,3907 =0,7814 Ответ: 0,3333 ≤ P(|X - 1| < 0,5) ≤ 0,7814 или 0,33 < Р(|X - 1| < 0,5) < 0,79. Замечание: здесь можно указать и точную оценку: P(|X - 1| < 0,5) = 0,75 Задачи для самостоятельного решения 1. В осветительную сеть параллельно включено 20 ламп. Вероятность того, что за время Т лампа будет включена, равна 0,8. Оценить вероятность того, что абсолютная величина разности между числом включенных ламп и средним числом включенных ламп за время Т окажется меньше трех. 2. Вероятность появления события в каждом испытании равна 1/4. Оценить вероятность того, что число Х появлений события заключено в пределах от 150 до 250, если будет произведено 800 испытаний. 3. Дискретная случайная величина Х задана рядом распределения Х 0,1 0,4 0,6 Р 0,2 0,3 0,5 Оценить P(|X - m| < √0,4) Практическое занятие № 2 Отклонение относительной частоты от вероятности в независимых испытаниях Заметим, что оценка отклонения относительной частоты появления события от вероятности появления события вытекает из теоремы Ляпунова и соответствующее предложение формулируется так: Вероятность р1 того, что в n независимых испытаниях, в каждом из которых вероятность появления события равна р (0 < p < 1), абсолютная величина отклонения относительной частоты появления события от вероятности появления события не превышает ε > 0, приближенно равна удвоенной функции Лапласа при х = ε.√n/pq: P1 = P(|m/n - p| ≤ε) ≈ 2 . Ф(ε√n/pq) 36 Задача 1. Вероятность появления события в каждом из 625 независимых испытаний равна 0,8. Найти вероятность того, что относительная частота появления события отклонится от его вероятности по абсолютной величине не более чем на 0,04. Решение: n = 625; p = 0,8; q = 0,2; ε = 0,04 P(|m/625-0,8|≤0,04)≈2.Ф(0,04√625/0,8.0,2)=2.Ф(2,5)=2.0,4938=0,9876 Задача 2. Вероятность появления события в каждом из 900 независимых испытаний равна 0,5. Найти вероятность того, что относительная частота появления события отклонится от его вероятности по абсолютной величине не более чем на 0,02. Решение: n = 900; p = 0,5; q = 0,5; ε = 0,02 P(|m/900 - 0,5| ≤ 0,02) ≈ 2 . Ф(0,02 .√900/0,5 . 0,5) = 2 . Ф(1,2) = 2 . 0,3849 = 0,7698 Задача 3. Французский ученый Бюффон (XVIII век) бросил монету 4040 раз, причем “герб” появился 2048 раз. Найти вероятность того, что при повторении опыта Бюффона относительная частота появления “герба” отклонится от вероятности появления “герба” по абсолютной величине не более, чем в опыте Бюффона. Решение: узнаем относительную частоту появления “герба” в опыте Бюффона: W = 2048/4040 = 256/505; в то же время вероятность появления “герба” в любом опыте P = 1/2. Таким образом, ε (в опыте Бюффона) есть |W - p| = |256/505 - 1/2| = 7/1010 Тогда P(|m/4040 - 1/2| ≤ 7/1010) = 2 . Ф(7/1010 . √4040/0,5.0,5 = 2.Ф(0,88) = 2 . 0,3106 = 0,6212 Задача 4. Вероятность появления события в каждом из независимых испытаний равна 0,5. Найти число испытаний n, при котором с вероятностью 0,7698 можно ожидать, что относительная частота появления события отклонится от его вероятности по абсолютной величине не более, чем на 0,02. Решение: p = 0,5; q = 0,5; ε = 0,02 P(|m/n - pl < 0,02) = 2Ф(0,02 √ n/0,5.0,5) = 0,7698; Ф(0,04 . √ n) = 0,3849 = Ф(1,2) 0,04√n = 1,2 √n = 30 n = 900 37 Задача 5. Вероятность появления события в каждом из 400 независимых испытаний равна 0,8. Найти такое положительное число ε, чтобы с вероятностью 0,99 абсолютная величина отклонения относительной частоты появления события от его вероятности не превышала ε. Решение: n = 400; p = 0,8; q = 0,2 2 . Ф(ε√400/(0,8.0,2) = 0,99 Ф(50ε) = 0,495 = Ф(2,57) 50ε = 2,57 ε = 0,05 Задача 6. Отдел технического контроля проверяет на стандартность 900 деталей. Вероятность того, что деталь стандартна, равна 0,9. Найти с вероятностью 0,95 границы, в которых будет заключено число m стандартных деталей среди проверенных. Решение: n = 900; p = 0,9; q = 0,1 2 . Ф(ε√900/(0,9.0,1)) = 0,95 Ф(ε . 100) = 0,475 = Ф(1,96) 100 ε = 1,96 ε = 0,02 Таким образом, с вероятностью 0,95 отклонение относительной частоты числа стандартных деталей от вероятности 0,9 удовлетворяет неравенству | m/900 - 0,9 | ≤ 0,02 -0,02 ≤ m/900 - 0,9 ≤ 0,02 0,88 ≤ m/900 ≤ 0,92 792 ≤ m ≤ 828 Задача 7. Какое минимальное число опытов следует провести, чтобы с вероятностью 0,95 можно было утверждать, что относительная частота появлений события будет отличаться от его вероятности, равной 0,6, не более чем на 0,02 (по абсолютной величине)? Ответ дать с помощью неравенства Чебышева и теоремы Ляпунова. Объяснить различие результатов. Решение: возьмем даже не само неравенство Чебышева, а следствие из него (теорему Бернулли): P(|m/n - p| ≤ε) ≥ 1 - p . q/n .ε2 ε = 0,02 p = 0,6 q = 0,4 P(|m/n - 0,6| ≤ 0,02) ≥ 1 - 0,6.0,4/(n.0,022) = 0,95 1 - 0,6.0,4/(n.0,022) = 0,95 1 - 0,95 = 0,6.0,4/(n .0,022) = 0,05 n ≤ 12000 n = 0,6.0,4/(0,05 . 0,022) = 12000 По следствию из теоремы Ляпунова: P(|m/n - 0,6| ≤ε) = 2.Ф(ε√(n/(p.q)) 0,95 = 2.Ф(0,02 . √(n/(0,6.0,4)) 0,475 = Ф(1,96) 0,02 √(n/(0,6.0,4)) = 1,96 n = 220,496 ≈ 2205 точнее: n ≥ 2205 38 Таким образом, установлены границы для n: 2205 ≤ n ≤ 12000 Различие результатов объясняется тем, что неравенство Чебышева дает нижнюю границу для n (“грубая” оценка), а теорема Ляпунова - верхнюю границу для n (нормальная оценка или оценка Гаусса). Задачи для самостоятельного решения 1. Вероятность появления события в каждом из 10000 независимых испытаний равна 0,5. Найти вероятность того, что относительная частота появления события отклонится от его вероятности по абсолютной величине не более чем на 0,01 [0,979] 2. Вероятность появления события в каждом из независимых испытаний равна 0,2. Найти наименьшее число испытаний n, при котором с вероятностью 0,99 можно ожидать, что относительная частота появлений события отклонится от его вероятности по абсолютной величине не более чем на 0,04. [n = 661] 3. Вероятность появления события в каждом из 900 независимых испытаний равна 0,5. Найти такое число ε > 0, чтобы с вероятностью 0,77 абсолютная величина отклонения относительной частоты появления события от его вероятности 0,5 не превысила ε. [ε = 0,02] 4. Игральный кубик бросают 80 раз. Найти с вероятностью 0,99 границы, в которых будет заключено число m выпадений “шестерки”. 5. Как найти вероятность того, что наудачу выбранный студент собирает марки? Можно, например, опросить некоторое число студентов. Если среди n опрошенных студентов окажется m коллекционеров, то искомая вероятность р ≈ m/n (относительная частота). Сколько студентов надо опросить, чтобы погрешность вычисления вероятности не превосходила бы 0,005, если желаем получить правильный результат с вероятностью 0,95? (Задачу решить двумя способами; различие результатов объяснить). [40000; 200000]. Глава IV. СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ. ПОНЯТИЕ О СТОХАСТИЧЕСКОМ ПРОГРАММИРОВАНИИ 1. Решение систем линейных уравнений Предварительно напомним некоторые общие определения и понятия, связанные с системами линейных уравнений. Прежде всего заметим, что мы вводим иную - по сравнению со средней школой - систему обозначений коэффициентов при неизвестных (переменных), при которой элемент aij означает тот факт, что он (этот элемент) стоит в i-уравнении при j-неизвестном (переменной). В этом случае система m линейных уравнений (т.е. уравнений, в 39 которых неизвестные рассматриваются в первой степени) с n неизвестными выглядит так: а11х1 + а12х2 + ... + а1nxn = b1 a21x1 + a22x2 + ... + a2nxn = b2 ( 1) ............................................ am1x1 + am2x2 + ... + amnxn = bm Коэффициенты b1; b2; ...; bm, , стоящие в правых частях уравнений системы (1), носят название свободных членов. Решением системы линейных уравнений (1) называется такая совокупность n чисел (х1; x2; ...; xn), что каждое из уравнений системы (1) обращается в тождество (верное равенство) после замены неизвестных указанными числами. Подчеркнем, что указанные n чисел составляют одно решение системы (1). Если система линейных уравнений имеет хотя бы одно решение, то она называется совместной; если не имеет решений, то несовместной. Совместная система называется определенной, если она обладает одним (единственным) решением, и неопределенной, если решений больше, чем одно (заметим, что в этом случае решений бесконечное множество). Задача теории систем линейных уравнений состоит в разработке методов, позволяющих узнать, совместна ли данная система уравнений или нет; в случае совместности установить число решений, а также указать способы найти все эти решения. Среди методов исследования систем линейных уравнений особую роль (в частности, в линейном программировании) играют методы последовательного исключения неизвестных (метод Гаусса) и полного исключения неизвестных (метод Жордано-Гаусса). Эти методы основаны на элементарных преобразованиях системы уравнений, под которыми понимают или перестановку двух каких-нибудь уравнений системы, или умножение обеих частей уравнения на любое отличное от нуля число, или прибавление к обеим частям одного уравнения соответствующих частей другого уравнения, умноженных на любое число. Легко видеть, что при элементарных преобразованиях система линейных уравнений переходит в эквивалентную систему (т.е. систему, имеющую те же решения, что и исходная, или - как и исходная - не имеющая решений). Поясним сказанное примерами. Пример 1. х1 + х2 + х3 = 1 х1 + х2 = 1/2 + x3 = 3/4 x1 При решении этой системы способом Гаусса исключим первое неизвестное х1 из всех уравнений системы, кроме первого. Для этого достаточно, оставив первое уравнение без изменения, вычесть его из второго и третьего уравнений. 40 Получим: х1 + х2 + х3 = 1 - х3 = -1/2 = -1/4 -x2 (1’) Меняя местами второе и третье уравнения и умножая затем эти уравнения на (-1), имеем: x1 + x2 + x3 = 1 = 1/4 (1’’) x2 x3 = 1/2 Таким образом, оказалось, что уже все переменные последовательно исключены (в данном случае нам, конечно, “повезло” - пример оказался простым). В более сложных примерах нам придется: оставив во втором уравнении х2, исключать эту переменную из остальных уравнений; потом аналогично поступать с х3 и т.д. Но здесь уже все почти закончено. Дальнейшее выглядит так: из последнего уравнения находим х3 = 1/2; из предпоследнего х2 = 1/4; из первого уравнения: х1 = 1 - х2 - х3 С учетом того, что х2=1/4; x3=1/2 имеем х1=1=1/4 - 1/2=1/4 Делаем проверку: 1/4 + 1/4 + 1/2 = 1 (истинно) 1/4 + 1/4 = 1/2 (истинно) 1/4 + 1/2 = 3/4 (истинно) и убеждаемся, что решение системы найдено верно, после чего записываем ответ: x1 = 1/4; x2 = 1/4; x3 = 1/2 или (1/4; 1/4; 1/2). Замечание 1: решая исходную систему по способу Гаусса, мы приходим в данном случае - к т.н. треугольному виду, что гарантирует нам единственность решения. Таким образом, мы сразу видим и совместность системы уравнений, и ее определенность (т.е. единственность решения). Замечание 2: Начиная с момента (1’’), мы можем полностью исключить переменные из всех уравнений системы, оставляя в каждом из уравнений системы только по одной переменной (в данном конкретном случае). Для этого достаточно к первому уравнению системы добавить второе, умноженное на (1), а затем третье, умноженное также на (-1). Получим: = 1/4 x1 = 1/4 x2 x3 = 1/2 В этом и заключается метод полного исключения переменных (неизвестных), т.е. метод Жордано-Гаусса. 41 Замечание 3: Используя запись уравнений системы 1 в виде таблицы, где сами переменные отсутствуют, а оставлены лишь коэффициенты при переменных и свободные члены, мы можем условиться, что все перечисленные выше действия записываются коротко так: (1 1 1 | 1 ) → (1 1 1 | 1 ) → (1 (1 1 0 | 1/2) → (0 0 -1 | -1/2) → (0 (1 0 1 | 3/4) → (0 -1 0 | -1/4)→ (0 После проверки пишем ответ: х1 = 1/4 x2 = 1/4 x3 = 1/2 Пример 2. х1 + 2х2 - 3х3 = 10 х1 - х2 + 2х3 = 5 2х1 + 4х2 - 6х3 = 21 1 1 | 1 )→ (1 0 0 | 1/4) 1 0 | 1/4 ) → (0 1 0 | 1/4) 0 1 | 1/2)→ (0 0 1 | 1/2) или (1/4; 1/4; 1/2) (2) (1 2 -3 | 10 ) → (1 2 -3 | 10) (1 -1 2 | 5 ) → ( 0 -3 5|-5 ) (2 4 -6| 21 ) → ( 0 0 0| 1 ) Таблица, к которой мы пришли после того, как добавили к второму уравнению первое, умноженное на (-1), и к третьему уравнению - первое, умноженное на (-2), говорит о том, что исходная система уравнений решений не имеет (несовместна), ибо содержит противоречие: 0 . х1 + 0 . х2 + 0 . х3 = 1] Пример 3. x1 -x3 + 2x4 = 2 (3) x2 -x3 + x4 - 2x5 = 0 2x1 + x2 + 5x4 + x5 = 7 (1 0 -1 2 0| 2) → (1 0 -1 2 0| 2) → (1 0 -1 2 0| 2) → (0 1 -1 1 -2| 0) (0 1 -1 1 -2| 0) (0 1 -1 1 -2| 0) (2 1 0 5 1 | 7) (0 1 2 1 1| 3) (0 0 3 0 3| 3) (1 0 -1 2 0 | 2) → (1 0 0 2 1 | 3) (0 1 -1 1 -2 | 0) (0 1 0 1 -1 | 1) (0 0 1 0 1 | 1) (0 0 1 0 1 | 1) Мы пришли к т.н. усеченному треугольному виду, который обозначает, что исходная система уравнений имеет бесчисленное множество решений. Действительно, записывая последнюю таблицу в обычной форме системы линейных уравнений, имеем: + 2х4 + х5 = 3 (3) х1 = 3 - 2х4 - х5 х1 х2 + х4 - х5 = 1 х2 = 1 - х4 + х5 х3 + х5 = 1 х3 = 1 - х5 42 Придавая х4 и х5 любые действительные значения, будем получать для х1; х2; х3 соответствующие значения. В таких случаях будем говорить, что переменные х4 и х5 являются свободными, а переменные х1; х2; х3 - основными (образуют базис). Общее же решение исходной системы (3) условимся записывать в виде (3 - 2х4 - х5; 1 - х4 + х5; 1 - х5; х4; х5). Придавая х4 и х5 конкретные значения, будем получать т.н. частные решения: пусть х4 = х3 - = 0; тогда х1 = 3; х2 = 1; х3 = 1 и частное решение запишется так: (3; 1; 1; 0; 0) если х4 = х5 = 1, то (0; 1; 0; 1; 1;) если х4 = 1; х5 = -1; то (2; -1; 2; 1; -1) и т.д. 2. Основная задача линейного программирования и ее геометрия Предварительно заметим, что на практике постоянно приходится иметь дело с такими случаями, когда достичь некоторого результата возможно не одним, а несколькими способами. В этих ситуациях может оказаться и человек (когда он, например, решает вопрос о распределении своих доходов и расходов), и целое предприятие или - иногда - даже отрасль (если необходимо определить: как использовать имеющиеся ресурсы, чтобы добиться, например, максимального выхода продукции), и , наконец, народное хозяйство в целом. Ясно, что из большого числа решений должно выбираться наилучшее (оптимальное). В математическом плане это сводится к нахождению наибольшего (иногда - наименьшего) значения некоторой функции, что будем записывать так: f(x) → max(min) (1) x∈X (2) Определяемая таким образом задача называется задачей оптимизации. Множество Х называется допустимым множеством данной задачи; f(x) целевой функцией; под х понимается “точка”, которая задается набором нескольких действительных чисел: х = (х1; х2; ... ; хn) (другими словами, в качестве х обычно рассматривается точка n-мерного пространства). Допустимое множество Х чаще всего задается системой неравенств (в нашем случае линейных): а11х1 + а12х2 + ... + annxn ≤ b1 a21x1 + a22x2 + ... + a2nxn ≤ b2 (2') ....................... am1x1 + am2x2 + ... + amnxn ≤ bm 43 Целевая функция f(x) - опять-таки в нашем случае - является линейной, т.е. имеет вид: (1') f(x) = c1x1 + c2x2 + ... cnxn + c0 Как правило, в число ограничений входят т.н. тривиальные ограничения: (3) х1 ≥ 0 х2 ≥ 0 ... хn ≥ 0 В таких случаях мы говорим об общей задаче линейного программирования, формулируя ее следующим образом: Найти оптимальное значение (max или min) некоторой линейной функции (1') при линейных ограничениях (2') и (3) Замечание: Линейное программирование оформилось как отдельный раздел прикладной математики в 40-50 гг. ХХ века. В это время выяснилось, что ряд задач из сферы планирования и управления могут быть сформулированы как задачи линейного программирования. Для решения этих задач разработаны эффективные методы учеными разных стран, в частности, наш соотечественник Л.В. Канторович был удостоен за это Нобелевской премии (в 1975 г., хотя основные идеи он сформулировал уже в 1938 г., будучи молодым, 25-летним профессором Ленинградского университета). Перейдем к решению задач, причем именно в духе идей Л.В. Канторовича, напомнив еще раз, что в задаче линейного программирования множество Х называется допустимым; соответственно любое х ∈ Х называется допустимым решением, а допустимое решение, дающее max(min) f(x), называется оптимальным решением; неравенства (2') и (3) называются ограничениями (линейными). 1. Задача о банке (из книги Дж. Синки “Управление финансами в коммерческом банке”) Пусть собственные средства банка в сумме с депозитами составляют 100 млн у.е. Часть этих средств, но не менее 35 млн у.е., должна быть размещена в кредитах. Кредиты являются неликвидными активами банка, т.к. в случае непредвиденных потребностей в наличности обратить кредиты в деньги без существенных потерь невозможно. Иное дело - ценные бумаги (особенно государственные). Их можно практически в любой момент продать, получив некоторую прибыль (или, во всяком случае, без большого убытка). Поэтому существует правило, согласно которому коммерческие банки должны покупать в определенной пропорции ликвидные активы - ценные бумаги, чтобы компенсировать неликвидность кредитов. В нашем примере ликвидное ограничение выглядит так: ценные бумаги должны составлять не менее 30% средств, размещенных в кредитах и ценных бумагах. Обозначим: х1 - средства (млн. у.е.), размещенные в кредитах; х2 средства (млн. у.е.), размещенные в ценных бумагах. Имеем следующую систему линейных ограничений: х1 + х2 ≤ 100 - балансовое ограничение х1 ≥ 35 - кредитное ограничение х2 ≥ 0,3 (х1 + х2) - ликвидное ограничение 44 х1≥ 0; х2 ≥ 0 0 очевидные (тривиальные) ограничения. Цель банка состоит в том, чтобы получить максимальную прибыль от кредитов и ценных бумаг: f = c1x1 + c2x2 → max, где с1 - доходность кредитов; с2 - доходность ценных бумаг. Т.к. кредиты менее ликвидны, чем ценные бумаги, то обычно с1≥ с2. В нашем случае будем считать: с1 = 0,15; с2 = 0,10 Таким образом, мы пришли к основной задаче линейного программирования: (1) f(x0 = 0,15x1 + 0,1x2 → max x1 + x2 ≤ 100 x1 ≥ 35 (2) x2 ≥ 0,3 (x1 + 2) (3) x1 ≥ 0 x 2 ≥ 0 Укажем геометрическое решение этой задачи, для чего: рассмотрим прямоугольную декартову систему координат Х10Х2; выясним геометрический смысл указанных здесь линейных неравенств, предварительно заметив, что равенства (2) являются просто уравнениями некоторых прямых: х1 + х2 = 100 х1 = 35 (2) х2 = 0,3 х1 + 0,3 х2 ⇔ 0,3 х1 - 0,7 х2 = 0; ⇔ х2 = 3/7 х1 Указанные на чертеже прямые (АС): х2 = 3/7 х1; (АВ): х1=35; (ВС): х1+х2=100 построены так: (ВС): х1 + х2 = 100; х1 = 0; х2 = 100 (0; 100) х1 = 100; х2 = 0 (100; 0) (АС): х2 = 3/7 x1; x1 = 0; x2 = 0 (0; 0) x1 = 140; x2 = 60 (140; 60) (AB): x1 = 35 - это уравнение прямой || оси ОХ2 на расстоянии 35 (ед.) (вправо от оси ОХ2) Стрелками здесь показаны полуплоскости, определяемые неравенствами (2): х1 + х2 ≤ 100; х1 ≥ 35; х2 ≥ 3/7 x1 (берутся координаты любой точки из соответствующей полуплоскости и выясняется, удовлетворяют ли координаты этой точки уравнению соответствующей полуплоскости). С учетом тривиальных соотношений (3) получаем ∆ АВС (заштрихованная область), который в данном случае и есть допустимое множество Х. Теперь надо определить, в какой из точек этого множества функция f = 0,15x1 + 0,1x2 имеет наибольшее значение. Для этого рассмотрим выражение: 0,15х1+0,1х2=Const, Сonst=3 (например). Тогда 0,15х1+0,1х2=3 или 3х1+2х2=60. Это уравнение прямой, проходящей, например, через точки: (х1=0; х2=30) и (х1=20; х2=0). Строим соответствующую прямую и замечаем, что если Const увеличивать, то прямая будет перемещаться параллельно построенной и, следовательно, значение функции f = 0,15x1 + 0,1x2 будет увеличиваться до тех пор, пока 45 прямая не выйдет за пределы треугольника АВС (в данном случае точкой выхода является, очевидно, точка С (70; 30), которая, как и все остальные точки, получена после решения соответствующих систем линейных уравнений): С: х2 = 3/7 x1 x2 = 3/7x1 x2 = 30 С (70; 30) x1 + x2 = 100 x1 + 3/7x1 = 100 x1 = 70 B: x1 + x2 = 100 x2= 65 = 35 x1 = 35 В (35; 65) x1 x2 = 15 A: x2 = 3/7x1 x1 = 35 А (35; 15) x1 = 35 Находим f(c) = f(70; 30) = 0,15 . 70 + 0,1 30 = 13,5 = fmax Вывод: оптимальный портфель активов банка (кредиты; ценные бумаги) в данном случае есть 70 и 30. Замечание: рассмотренная геометрия решения основной задачи линейного программирования (для двух переменных) позволяет сформулировать следующий способ ее решения (“перебор вершин”): строим допустимое множество Х конкретной задачи и находим значения целевой 46 функции в вершинах (в общем случае - некоторого выпуклого многоугольника), наименьшее из этих значений есть min f (fmin); наибольшее - есть max f (fmax). В данном случае: f(A) = 0,15.35 + 0,1.15 = 6,75 = fmin f(B) = 0,15.35 + 0,1.65 = 11,75 f(C) = 0,15.70 + 0,1.30 = 13,5 = fmax Ответ: fmax = 13,5 Xоптим = (70; 30) Решим еще несколько задач. Задача 2. Изобразить множество точек Х, заданных следующими ограничениями: 2х1 + х2 ≥ 1 х1 + 2х2 ≥ 1 (2) х1 + х2 ≤ 3 (3) х1 ≥ 0; х2 ≥ 0 Действуем способом, предложенным в предыдущей задаче: 2х1 + х2 = 1 х1 = 0; х2 = 1 А(0; 1) (1/2; 0) х1 = 1/2 х2 = 0 х1 + 2х2 = 1 х1 = 0 х2 = 1/2 (0; 1/2) х1 = 1 х2 = 0 D(1; 0) х1 + х2 = 3 х1 = 0 х2 = 3 В(0; 3) х1 = 3 х2 = 0 С(3; 0) Получаем выпуклый пятиугольник АВСДЕ: х1 = 1/3 Е: 2х1 + х2 = 1 х2 = 1/3 х1 + 2х2 = 1 Е (1/3; 1/3) Это и есть - в данном случае - допустимое множество точек Х, заданное указанными ограничениями. Задача 3. Решить геометрически: f = 3x1 + 5x2 → max (min) (1) 2x1 + x2 ≥ 1 (2) x1 + 2x2 ≥ 1 x1 + x2 ≤ 3 (3) x1 ≥ 0 x 2 ≥ 0 C учетом решения предыдущей задачи нам надо просто перебрать вершины: f(A) = f(0; 1) = 3 . 0 + 5 . 1 = 5 f(B) = f(0; 3) = 3 . 0 + 5 . 3 = 15 f(C) = f(3; 0) = 3 . 3 + 5 . 0 = 9 f(D) = f(1; 0) = 3 . 1 + 5 . 0 =3 f(E) = f(1/3; 1/3) = 3 .1/3 + 5 . 1/3 = 2 и2/3 = fmin Задача 4. Решить геометрически: g = 2х1 + х2 → max (min) (1) 47 2x1 + x2 ≥ 1 (2) x1 + 2x2 ≥ 1 x1 + x2 ≤ 3 (3) x1 ≥ 0 x 2 ≥ 0 С учетом того, что было получено в задаче 2, снова осуществляем “перебор вершин”: g(A) = g(0; 1) = 2 . 0 + 1 . 1 = 1 = gmin g(B) = g(0; 3) = 2 . 0 + 1 . 3 = 3 g(C) = g(3; 0) = 2 . 3 + 1 . 0 = 6 = gmax g(D) = g(1; 0) = 2 . 1 + 1 . 0 = 2 g(E) = g(1/3; 1/3) = 2 . 1/3 + 1 . 1/3 = 1 = gmin Замечание: целевая функция g приняла наименьшее значение в двух точках - А и Е; следовательно, она примет это значение и в любой точке отрезка АЕ (в данном случае уравнение прямой АЕ “совпадает” с целевой функцией); в таких случаях говорят о “ребре решений” (по минимуму) исходной задачи (“отрезок решений”). Задача 5. Решить геометрически: ϕ = 2х1 + 2х2 → max (min) (1) 2x1 + x2 ≥ 1 (2) x1 + 2x2 ≥ 1 x1 + x2 ≤ 3 (3) x1 ≥ 0 x 2 ≥ 0 Опять осуществляем “перебор вершин”: ϕ(А) = 2 . 0 + 2 . 1 = 2 ϕ(B) = 2 . 0 + 2 . 3 = 6 = ϕmax ϕ(C) = 2 . 3 + 2 . 0 = 6 = ϕmax ϕ(D) = 2 . 1 + 2 . 0 = 2 ϕ(E) = 2 . 1/3 + 2 . 1/3 = 1 и 1/3 = ϕmin ϕmin = ϕ(1/3; 1/3) = 1 b 1/3 Вывод: отрезок ВС - “ребро решений” (по max); ϕmax = 6 Задача 6. Решить геометрически: g = 6x1 + 3,1x2 → max (1) 0,5x1 + 0,2x2 ≤ 1,5 (2) 0,6x1 + 0,1x2 ≤ 1 0,4x1 + 0,3x2 ≤ 2 (3) x1 ≥ 0; x2 ≥ 0 Используя обычную схему решения таких задач, приходим к следующему чертежу: 0,5x1 + 0,2x2 = 1,5 (I) x1 = 0 x2 = 7 и 1/2 (0; 7 и 1/2) (3; 0) х1 = 3 х2 = 0 48 0,6x1 + 0,1x2 = 1 (II) x1 = 0 x2 = 10 (0; 10) x1 = 1 2/3 x2 = 0 B(1 2/3; 0) 0,4x1 + 0,3x2 = 2 (III) x1 = 0 x2 = 20/3 = 6 2/3 C(0; 6 2/3) (5; 0) x1 = 5 x2 = 0 Интересно отметить, что в этом конкретном случае все три прямые пересеклись в одной точке А(5/7; 5 5/7): 1/2 . 5/7 + 2/10 . 5 5/7 = 1,5 (I) 6/10 . 5/7 + 1/10 . 5 5/7 = 1 (II) 4/10 . 5/7 + 3/10 . 5 5/7 = 2 (III) Допустимое множество Х - здесь четырехугольник АВОС; вычисляем g(A) = 6 . 5/7 + 3 1/10 . 5 5/7 = 22 = gmax g(B) = 6 . 1 2/3 + 3 1/10 . 0 = 10 g(O) = 6 . 0 + 3 1/10 . 0 = 0 g(C) = 6 . 0 + 3 1/10 . 6 2/3 = 20 2/3 Ответ: gmax = g(5/7; 5 5/7) = 22 Xоптим = (5/7; 5 5/7) Задача 7. Решить геометрически f = 3x1 + 2x2 → min (1) 5x1 + x2 ≥ 10 (2) 2x1 + 2x2 ≥ 12 x1 + 4x2 ≥ 12 (3) x1 ≥ 0 x 2 ≥ 0 Приводим решение задачи: (I): x1 + x2 = 10 x1 = 0 x2 = 10 (0; 10) x1 = 2 x2 = 0 (2; 0) (II): 2x1 + 2x2 = 12 x1 = 0 x2 = 6 (0; 6) x1 = 6 x2 = 0 (6; 0) (III): x1 + 4x2 = 12 x1 = 0 x2 = 3 (0; 3) x1 = 12 x2 = 0 (12; 0) Допустимое множество Х - заштрихованная (бесконечная!) область. Имеет смысл “пройтись” только по точкам А, В, С, Д, ибо fmin может быть только на одной из них (точке входа!): B (1; 5) B: 5x1 + x2 = 10 2x1 + 2x2 = 12 C: 2x1 + 2x2 = 12 x1 + 4x2 = 12 C (4; 2) 49 f(A) = f(0;10) = 3 . 0 + 2 . 10 = 20 f(B) = f(1; 5) = 3 . 1 + 2 . 5 = 13 = fmin f(C) = f(4; 2) = 3 . 4 + 2 . 2 = 16 f(D) = f(12; 0) = 3 . 12 + 2 . 0 = 36 Ответ: fmin = f(1; 5) = 13 Xоптим. = (1; 5) 3. Метод последовательного улучшения решения (симплекс-метод) Решение основной задачи линейного программирования достаточно наглядно в случае 2 и даже 3 переменных, но в пространстве большего числа измерений говорить о наглядности уже сложно и в этих случаях применяются аналитические методы, одним из которых и является метод последовательного улучшения решения (так называемый симплекс-метод). Замечание: термин “симплекс” здесь сути дела не объясняет, ибо перевод этого слова на русский язык есть “простой”. А суть дела здесь такова. Прежде всего отметим, что система определений (2) в симплекс-методе (как и в других вычислительных методах) задана системой линейных уравнений: a11x1 + a12x2 + ... + a1nxn = b1 a21x1 + a22x2 + ... + a2nxn = b2 ....................... (2) am1x1 + am2x2+ ... + amnxn= bm и среди неотрицательных решений этой системы мы ищем такие, что линейная форма (целевая функция) а = c1x1 + c2x2 + ... + cnxn + co → max (именно max, а не min) Решая систему (2) (например, способом Жордана-Гаусса), выразим переменные x1; x2; ...; хr (r ≤ m) через отдельные переменные, приведя эту систему к т.н. допустимому виду: x1 = a1,r+1 . xr+1 + ... + a1,nxn + b1 x2 = a2,r+1 . xr+1 + ... + a2,nxn + b2 .................................................. (2') xr = ar,r+1 . xr+1 + ... +ar,n . xn + br где b1; b2; ... br ≥ 0 ≥0 ≥0 Переменные xr+1; xr+2; ...;xn - называются свободными переменными х1; х2; ...; xr - базисными переменными; набор (x1; x2; ...; xr) называется базисом. 50 Подставляя в целевую функцию f вместо базисных переменных их выражения через свободные переменные из системы (2’), получим: f = ϒ0 +ϒ1xr+1 + ϒ2xr+2 + ... +ϒnxn Полагая теперь все свободные переменные равными нулю, получим значения базисных переменных: x1 = b1; x2 = b2; ...; xr = br и значение целевой функции f = ϒ0 Таким образом, мы имеем решение системы (b1; b2; ...; br; 0; 0; ...; 0) , (r+1) (r+2) (rn) где все значения переменных неотрицательны. Такое решение мы назовем опорным решением, при котором - еще раз напомним - значение целевой функции, т.е. f(b1; b2; ...; br; 0; 0; ... 0) = ϒ0. Указанное опорное решение мы постараемся улучшить, т.е. переходом к какому-то другому базису значение линейной функции увеличить (или хотя бы не уменьшить). Идею метода проследим на конкретных примерах. (1) Пример 1. f = -x1 - 3x2 - 2x3 - 4x4 + 2x5 → max x1 -x3 + 2x4 = 2 (2) x2 - x3 + x4 - 2x5 = 0 2x1 + x2 + 5x4 + x5 = 7 (3) x1 ≥ 0 x2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 x 5 ≥ 0 Решая систему линейных уравнений (2) методом Жордано-Гаусса (см. пункт 1, пр. 3), мы уже пришли к т.н. допустимому виду: x1 = 3 - 2x4 - x5 x2 = 1 - x 4 + x5 (2’) - x5 x3 = 1 Отсюда ясно, что x4; x5 - свободные переменные; x1; x2; x3 - базисные переменные. Полагая х4 = х5 = 0, получим х1 = 3; х2 = 1; х3 = 1. Тогда первое опорное решение системы (2) можем записать в виде: (3; 1; 1; 0; 0), а значение целевой функции на этом решении есть f(3; 1; 1; 0; 0) = -1 . 3 - 3 .1 - 2 . 1 - 4 . 0 + 2 . 0 = 8 Постараемся улучшить это решение (т.е. увеличить значение целевой функции, если это возможно), для чего - в соответствии с предложенной схемой - сначала подставим выражения базисных переменных через свободные в целевую функцию f = -(3 -2x4 - x5) -3(1 - x4 + x5) –2(1 - x5) - 4x4 + x5 = -3 + 2x4 + x5 - 3 + 3x4 3x5 - 2 + 2x5 - 4xx + x5 = -8 + x4 + 2x5 Еще раз замечаем, что если х4 = х5 = 0, то f(3; 1; 1; 0; 0) = -8 Анализируя структуру целевой функции: f = -8 + x4 + 2x5, видим, что если увеличивать значение х4 и х5, то значения целевой функции будут увеличиваться (правда, нам не следует забывать о том, что при этом увеличении х4 и х5 базисные переменные x1; x2; x3 должны остаться неотрицательными). 51 Так, например, x3 = 1 - x5 ≥ 0; ⇒ 1 ≥ x5; x5 ≤ 1 Следовательно, х5 можно увеличить только до 1. Тогда х5 = 1; х3 = 0; х2 = 2 - х4; х1 = 2 - 2х4 Т.к. х2 и х1 должны быть неорицательны, то 2 ≥ x4 x4 ≤ 2 ⇒ x2 = 2 - x4 ≥ 0 x1 = 2 = 2x4 ≥ 0 2 ≥ 2x4 x4 ≤ 1 x4 ≤ 1 Следовательно, х4 может быть увеличено только до 1. Итак: х4 = 1; х5 = 1 ⇒ х1 = 0; х2 = 1; х3 = 0 Решение: (0; 1; 0; 1; 1) является вторым опорным решением, которое улучшает ситуацию, ибо f(0; 1; 0; 1; 1) = -8 + 1 + 2 = -5, т.е. значение целевой функции на этом решении увеличилось (от -8 до -5). Посмотрим, нельзя ли и это решение улучшить, для чего объявляем свободными переменными х1 и х3 т.е. те переменные, которые во втором опорном решении равны нулю, - и через х1 и х3 выражаем х2 ;хч; х5, которые становятся основными (базисными): х2 = 1 + 1/2x1 - 3/2x3 x4 = 1 - 1/2x1 + 1/2x3 (2’’) x5 = 1 - x 3 Подставим полученные выражения в целевую функцию f = -8 + x4 + 2x5 = - 8 + (1 - 1/2x1 + 1/2x3) + 2(1 - x3) = -8 + 1 - 1/2x1 + 1/2x3 + 2 - 2x3 = -5 -1/2x1 3/2x3 Видим, что если свободные переменные х1 и х3 теперь увеличивать, то значение целевой функции начнет уменьшаться (ибо перед х1 и х3 отрицательные числа). Следовательно, последнее из опорных решений является оптимальным; окончательный ответ таков: Хоптим. = (0; 1; 0; 1; 1) f(0; 1; 0; 1; 1) = -5 = fmax Пример 2. f = 10x1 + 12x2 + 12x3 → max (1) 5x1 + 2x2 + x3 ≤ 3 (2) x1 + 2x2 + 4x3 ≤ 2 (3) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 Предварительно заметим, что - в отличие от примера 1, где система ограничений (2) была записана в канонической форме (т.е. в виде уравнений) здесь система ограничений (2) записана в стандартной форме (т.е. в виде неравенств). Следовательно, нам надо начать с приведения стандартной формы записи ограничений к канонической, для чего вводим т.н. балансовые (выравнивающие) переменные х4 и х5 (которые также должны быть неотрицательными). Тогда получаем задачу: f = 10x1 + 12x2 + 12x3 → max (1) 5x1 + 2x2 + x3 + x4 = 3 (2) x1 + 2x2 + 4x3 + x5 = 2 (3’) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 x 5 ≥ 0 52 Решим эту задачу симплекс-методом, для чего сначала систему ограничений (2’) приводим к допустимому виду: (5 2 1 1 0 | 2) (1 2 4 0 1 | 2) (1 2 4 0 1 | 2) (1 2 4 0 1 | 3) → (5 2 1 1 0 | 3) → (0 -8 -19 +1 -5|-7) → (1 2 4 0 1 | 2) (1 2 4 0 1 | 2) (1 0 -3/4 1/4 -1/4 | 1/4) (0 8 19 -1 5 | 7) → (0 1 19/8 -1/8 5/8 |7/8)→ (0 1 19/8 -1/8 5/8 | 7/8) x1 = 1/4 + 3/4x3 - 1/4x4 + 1/4x5 x2 = 7/8 - 15/8x3 + 1/8x4 -5/8x5 (2’’) а Следовательно, свободными переменными являются x3; x4; x5; переменные х1 и х2 образуют базис. Пусть х3=х4=х5=0; тогда х1=1/4; x2 = 7/8 и решение (1/4; 7/8; 0; 0; 0) является опорным, причем f(1/4; 7/8; 0; 0; 0) = 10 . 1/4 + 12 . 7/8 + 12 . 0 + 0 . 0 + 0 . 0 = 13 Подставим выражения базисных переменных через свободные в целевую функцию f: f = 10x1 + 12x2 + 12x3 = 10 (1/4 + 3/4x3 - 1/4x4 + 1/4x5) + 12(7/8 - 19/8x3 + 1/8x4 5/8x5) + 12 . x3 = ... = 13 - 9x3 - x4 - 5x5 Т.к. перед свободными переменными х3; х4; х5 в качестве коэффициентов стоят отрицательные числа, улучшить решение нельзя (при увеличении х3; х4; х5 значение целевой функции будет уменьшаться!). Следовательно, уже первое опорное решение (1/4; 7/8; 0; 0; 0) оказалось и оптимальным (нам повезло!). Ответ: Хоптим = (1/4; 7/8; 0; 0; 0) f(1/4; 7/8; 0; 0; 0) = 13 Замечание: последние два нуля перечеркнуты с учетом балансовости переменных х4 и х5. Пример 3. f = 5x1 - x3 → min (1) x1 + x2 + 2x3 - x4 = 3 + 2x4 = 1 (2) x2 x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 Рассмотрим g = -f = -5x1 + x3; откуда gmax = -fmin Тогда эта задача получит вид: g = -5x1 + x3 → max (1’) x1 + x2 + 2x3 - x4 = 3 x1 + x2 + 2x3 - x4 = 3 +2x4 = 1 (2) x2 (3) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 Решаем полученную задачу симплекс-методом: (1 1 2 -1 | 3) (1 0 2 -3 | 2) (0 1 0 2 | 1) → ( 0 1 0 2 | 1) x1 = 2 - 2x3 + 3x4 - допустимый вид 53 x2 = 1 - 2x4 (2’) x3; x4 - свободные переменные; х1; х2 - базис. Если x3 = x4 = 0, то х1 = 2; и решение (2; 1; 0; 0) - опорное, причем g(2; 1; 0; 0) = -5 . 2 + 1 . 0 = -10 Подставим выражение базисных переменных х1 и х2 через свободные переменные х3 и х4 в целевую функцию g: g = -5x1 + x3 = -5(2 -2x3 + 3x4) + x3 = 10 + 11x3 - 15x4 Видим, что при увеличении х4 значение целевой функции уменьшается, поэтому лучше х4 приравнять к нулю, а значение переменной х3 увеличивать (но так, чтобы х1 и х2 остались неотрицательными). х4 = 0 х1 = 2 - 2х3 ≥ 0 (2’’) 2 ≥ 2x3 x3 ≤ 1 x2 = 1 Другими словами, х3 можно увеличить до 1. Итак: х4 = 0; х3 = 1; ⇒ х1 = 0; х2 = 1 Решение: (0; 1; 1; 0) - опорное (второе) g(0; 1; 1; 0) = -10 + 11 . 1 - 15 . 0 = 1 Видим улучшение решения (значение целевой функции от -10 возросло до 1. Подставим выражение основных (базисных) переменных х2 и х3 через свободные х1 и х4: х2 = 1 - 2х4 х3 = 1 -1/2x1 + 3/2x4 в целевую функцию g, получим g = -10 + 11(1 - 1/2x1 + 3/2x4) - 15x4 = ... = 1 - 11/2x1 + 3/2x4 Ясно, что х1 = 0, а х4 попытаемся увеличить, но так, чтобы х2 и х3 остались неотрицательными: х2 = 1 - 2х4 ≥ 0 х4 ≤ 1/2, т.е. х4 можно увеличить до 1/2 Итак: х1 = 0; х4 = 1/2; ⇒ х3 = 7/4; x2 = 0 Решение (0; 0; 7/4; 1/2) является опорным; оно улучшает предыдущие два, т.к. f(0; 0; 7/4; 1/2)=1 - 11/2 . 0+3/2 . 1/2=1+3/4=1 3/4 Объявляем х1 и х2 новыми свободными переменными; выражаем новый базис х3 и х4 через х1 и х2: х3 = 7/4 - 1/2x1 - 3/4x2 x1 = 1/2 - 1/2x2 (2’’’) Подставляя (2’’’) в целевую функцию g, получим g = -10 + 11х3 - 15х4 = -10 + 11(7/4 - 1/2x1 - 3/4x2) - 15(1/2 - 1/2x2) = ... = 7/4 - 11/2x1 - 3/4x2 Отсюда видно, что третье опорное решение (0; 0; 7/4; 1/2) является оптимальным. Ответ: Хоптим = (0; 0; 7/4; 1/2) fmin = -gmax = -1 3/4 54 4. Взаимно двойственные задачи линейного программирования Определение. Взаимно двойственными задачами линейного программирования называются следующие две задачи: Задача 1. f = c1x1 + c2x2 + ... + cnxn → max (1) a11x1 + a12x2 + ... + a1nxn ≤ b1 a21x1 + a22x2 + ... + a2nxn ≤ b2 ....................... (2) am1x1 + am2x2 + ... + amnxn ≤ bm (3) x1 ≥ 0 x2 ≥ 0 ... xn ≥ 0 Задача 2. g = b1y1 + b2y2 + ... + bmym → min (1’) a11y1 + a21y2+ ... + am1ym ≥ c1 a12y1 + a22y2 + ... + am2ym ≥ c2 ........................ (2’) a1ny1 + a2ny2 + ... + ammym ≥ cn (3’) y1 ≥ 0 y2 ≥ 0 ... ym ≥ 0 Пример 1. f = 10x1 + 12x2 + 12x3 → max (1) 5x1 + 2x2 + x3 ≤ 3 (2) x1 + 2x2 + 4x3 ≤ 2 (3) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 Используя результат предыдущего пункта (пример 2), имеем: fmax = 13 = f(1/4; 7/8; 0; 0; 0) Xоптим = (1/4; 7/8; 0; 0; 0) (1’) g = 3y1 + 2y2 → 5y1 + y2 ≥ 10 2y1 + 2y2 ≥ 12 (2’) y1 + 4y2 ≥ 12 (3’) y1 ≥ 0 y 2 ≥ 0 Замечаем, что записанная здесь задача уже решена - с точностью до обозначений - в пункте 2 (задача 7). Отсюда следует: gmin = 13 = g(1; 5) Vоптим = (1; 5) Совместное рассмотрение этих двух взаимно двойственных задач наводит на мысль о том, что имеет место следующая замечательная теорема (она носит название первой теоремы двойственности; приводится нами без доказательства): 55 Если одна из взаимно двойственных задач имеет оптимальный план, то и другая также имеет оптимальный план, причем соответствующие им оптимальные значения целевых функций равны: fmax = f(Xоптим) = gmin = g(Vоптим) Имеет место еще одна - вторая теорема двойственности, которая позволяет найти оптимальное решение одной из взаимно двойственных задач, не решая саму эту задачу (правда, при этом должно быть известно оптимальное решение другой из взаимно двойственных задач). Покажем, как это делается, вернувшись к тем результатам, которые мы уже имели ранее (в рамках взаимно двойственных задач рассматриваемого здесь примера). (1) (I): f = 10x1 + 12x2 + 12x3 → max =3 5x1 + 2x2 + x3 + x4 =2 (2) x1 + 2x2 + 4x3 + x5 (3) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 x 5 ≥ 0 fmax = 13 = f(1/4; 7/3; 0; 0; 0) Назовем в этом примере переменные х1; х2; х3 заданными, а х4 и х5 вспомогательными. (1’) (II): g = 3y1 + 2y2 → min = 10 5y1 + y2 - y3 - y4 = 12 2y1 + 2y2 -y5 = 12 (2’’) y1 + 4y2 y1 ≥ 0 y2 ≥ 0 y3 ≥ 0 y4≥ 0 y5 ≥ 0 Замечание: система уравнений (2’’) появилась вместо системы неравенств (2’) (как если бы мы хотели решать двойственную задачу симплекс-методом, но мы этого решения делать не будем, хотя и укажем, что здесь основными переменными будут y1 и y2, а вспомогательными y3; y4; y5). С учетом того, что двойственная задача (1’) уже решена, gmin = g(1; 5) = 13; Yоптим = (1; 5) после подстановки значений переменных y1 = 1; y2 = 5 в систему уравнений (2’) имеем: y3 = 0; y4 = 0; y5 = 9. Cведем полученные результаты в следующую таблицу: Заданные х2 х1 1/4 7/8 0 0 y4 y3 Вспомогательные переменные х3 0 9 y5 переменные 56 Вспомогательные х4 х5 0 0 1 5 y1 y2 Заданные Внимательное рассмотрение этой таблицы позволяет сформулировать вторую теорему двойственности, которая нами принимается также без доказательства. Если в оптимальном плане одной из взаимно двойственных задач значение заданной переменной больше нуля, то соответствующая ей вспомогательная переменная другой задачи равна нулю. Из положительности вспомогательной переменной следует равенство нулю соответствующей ей заданной переменной в оптимальном плане взаимно двойственной задачи. Покажем, как, используя вторую теорему двойственности, можно найти оптимальный план двойственной задачи. Предположим, что нам известен оптимальный план (II) [точнее говоря, мы нашли (геометрически!) часть оптимального плана: y1 = 1; y2 = 5; а остальное: y3 = 0; y4 = 0; y5 = 9 - нашли после решения системы уравнений (2’’)]. Найдем, исходя из этого, оптимальный план для (I). Еще раз напомним, какие системы уравнений были получены при переходе от системы неравенств (к системе уравнений) =3 (I): 5x1 + 2x2 + x3 + x4 x5 = 2 x1 + 2x2 + 4x3 + = 10 (II): 5y1 + y2 - y3 - y4 = 12 2y1 + 2y2 - y5 = 12 y1 + 4y2 Подготовим таблицу перехода от оптимального плана одной из взаимно двойственных задач к оптимальному плану другой и начнем заполнять строку уi: y1 = 1; y2 = 5 заданные переменные Вспомогательные х2 х3 х4 х5 х1 ? ? 0 0 0 0 0 9 1 5 y4 y5 y1 y2 y3 Вспомогательные перемен. Заданные Из системы уравнений (II): у3 = 0; у4 = 0; у5 = 9 Следовательно, х3 = 0, т.к. у5 = 9 > 0; x4 = 0, т.к. у1 = 1 > 0 x5 = 0, т.к. у2 = 5 > 0 (по второй теореме двойственности). Тогда в системе уравнений (I) остается: 5х1 + 2х2 = 3 ⇒ х1 = 1/4; x2 = 7/8 х1 + 2х2 = 2 Следовательно, оптимальный план двойственной задачи: Хоптим = (1/4; 7/8; 0; 0; 0), f(Xоптим) = 13 = fmax 57 Замечание: таким образом, с помощью первой теоремы двойственности мы можем узнать оптимальное значение целевой функции одной из взаимно двойственных, если известно решение другой задачи; с помощью второй теоремы двойственности мы можем узнать и оптимальный план одной из взаимно двойственных задач, если известно решение другой задачи. (К сожалению, вторая теорема двойственности применима не всегда - подробнее об этом чуть позже). Тем не менее значение теорем двойственности очевидно: можно решение основной задачи линейного программирования свести к решению двойственной задачи с меньшим числом переменных (и решить эту задачу, например, геометрически), а затем, используя вторую теорему двойственности, выйти и на оптимальный план исходной задачи линейного программирования. Значение взаимно двойственных задач для решения проблем экономики раскрыто в классических работах [4-6, 8]. Приведем решения некоторых взаимно двойственных задач: Пример 2. Используя первую и вторую теоремы двойственности, решить: f = -12x1 + 10x2 - 12x3 → max (1) -3x1 + 5x2 + 4x3 ≤ 1 (2) -4x1 + 2x2 + 3x3 ≤ -1 x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 Составим задачу, двойственную к данной: (1’) g = y1 - y2 → min -3y1 - 4y2 ≥ -12 5y1 + 2y2 ≥ 10 (2’) -4y1 + 3y2 ≥ -12 (3’) y1 ≥ 0 y 2 ≥ 0 Решим эту задачу геометрически: -3y1 - 4y2 = -12 (I) 3y1 + 4y2 = 12 y1 = 0 y2 = 3 (0; 3) y1 = 4 y2 = 0 (4; 0) 5y1 + 2y2 = 10 (II) y1 = 0; y2 = 5 (0; 5) y1 = 2; y2 = 0 (2; 0) -4y1 + 3y2 = -12 (III) 4y1 - 3y2 = 12 58 y1 = 0 y2 = -4 (0; -4) y1 = 3 y2 = 0 (3; 0) Допустимое множество Х задачи на минимум в данном случае есть четырехугольник АВСД, где: С (3;0); Д (2;0); А: 3y1+4y2=12 А(1 1/7;2 1/7) 5y1+2y2=10 В: 3у1 + 4у2 = 12 4у1 - 3у2 = 12 ⇒ В(3 9/25; 12/25) Находим: g(A) = f(1 1/7; 2 1/7) = 1 1/7 - 2 1/7 = -1 = fmin g(B) = f(3 9/25; 12/25) = 84/25 - 12/25 = 72/25 = 2 12/25 g(C) = f(3; 0) = 3 - 0 = 3 f(D) = f(2; 0) = 2 - 0 = 2 Промежуточный ответ: fmin = -1; Yоптим = (1 1/7; 2 1/7) Теперь составим задачу, двойственную к только что решенной: (1) f = - 12x1 + 10x2 = -12x3 → max -3x1 + 5x2 + 4x3 ≤ 1; (2) -4x1 + 2x2 + 3x3 ≤ -1 (3) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 Уже известно - на основании первой теоремы двойственности - fmax = -1. Возникает вопрос: на каком оптимальном плане? Попытаемся ответить и на этот вопрос с помощью второй теоремы двойственности, для чего проведем следующие преобразования двух взаимно двойственных задач: (1) f = -12x1 + 10x2 - 12x3 → max -3x1 + 5x2 + 4x3 ≤ 1 (2) 4x1 -2x2 - 3x3 ≥ 1 (3) x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 (1) f = - 12x1 + 10x2 - 12x3 → max -3x1 + 5x2 + 4x3 + x4 = 1 -x5 = 1 (2’) 4x1 - 2x2 - 3x3 x 4 ≥ 0 x5 ≥ 0 x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 Заданные вспомогательные переменные g=y1-y2 → min (1) -3y1 - 4y2 ≥ -12 5y1 + 2y2 ≥ 10 (2’) -4y1 +3y2 ≥ -12 y1 ≥ 0 y2 ≥ 0 (3’) g=y1-y2 → min 3y1 + 4y2 ≤ 12 5y1 + 2y2 ≥ 10 4y1 -3y2 ≤ 12 y 1 ≥ 0 y2 ≥ 0 59 (1’) (2’) g = y1 - y2 → min (1’) = 12 3y1 + 4y2 +y3 = 10 5y1 + 2y2 -y4 +y5 = 12 4y1 - 3y2 y1 ≥ 0 y 2 ≥ 0 y 3 ≥ 0 y 4 ≥ 0 y 5 ≥ 0 Заданные вспомогательные переменные (2'') Если y1 =1 1/7; y2 =2 1/7 , то y3 = 0 y4 = 0 y5 =13 6/7. (Это следует из (2’’) Составим таблицу перехода от оптимального плана задачи на min к оптимальному плану задачи на max и на основе второй теоремы двойственности получим: Заданные y1 y2 1 1/7 2 1/7 0 0 x5 x4 Вспомогательные y3 0 ? x1 Вспомогательные y4 y5 0 13 6/7 ? 0 x2 x3 Заданные Определим x1 и x2: -3x1 + 5x2 = 1 ⇒ x1 = 1/2; x2 = 1/2 4x1 - 2x2 = 1 Оптимальный план задачи на max : Xоптим = (1/2 ; 1/2 ; 0 ; 0 ; 0) fmax = f (1/2 ; 1/2 ; 0 ; 0 ; 0) = 1 Пример 3 (Из книги Гроссман С., Тернер Дж. Математика для биологических наук.) В рекламе своей продукции фабрикант собачьих консервов гарантирует, что его продукт целиком состоит из мяса и одна банка консервов обеспечивает потребности в углеводах и белках средней собаки массой 20 фунтов. Консервы готовятся из говядины, конины и печени. Одна унция говядины стоит 1,5 цента и дает 0,5 унций углеводов и 0,2 унции белка. Унция конины стоит 1 цент и дает 0,6 унций углеводов и 0,1 унции белка. Унция печени стоит 2 цента и дает 0,4 унции углеводов и 0,3 унции белка. Минимальные потребности средней 20фунтовой собаки оцениваются как 6 унций углеводов и 3,1 унции белка в день. Какую комбинацию из трех сортов мяса должен выбрать фабрикант, чтобы удовлетворить эти потребности при минимальной стоимости продукции? Решение : пусть x1; x2; x3 соответственно количество унций говядины, конины и печени, содержащихся в одной банке консервов. Тогда получаем задачу : f = 1,5x1 + x2 + 2x3 → min 0,5x1 + 0,6x2 + 0,4x3 ≥ 6 60 0,2 x1 + 0,1 x2 + 0,3 x3 ≥ 3,1 (2’) (3) x1 ≥ 0 ; x 2 ≥ 0 ; x 3 ≥ 0 а вместо нее рассмотрим двойственную: (1’) g = 6y1 + 3,1y2 → max 0,5y1 + 0,2y2 ≤ 1,5 (2’) 0,6y1 + 0,1y2 ≤ 1 0,4y1 + 0,3y2 ≤ 2 (3’) y1 ≥ 0 y 2 ≥ 0 Последняя задача нами решена с точностью до обозначений в пункте 2 (задача 6) Воспользуемся полученными там результатом: gmax= 22 = g (5/7; 5 5/7) Yоптим = (5/7 ; 5 5/7 ) Тогда fmin = 22, т.е. минимальная стоимость продукции (одной банки консервов) равна 22 центам. Но на каком оптимальном плане? Можно ли его найти, используя, например, вторую теорему двойственности? Соответствующее рассуждение показывает, что применить в этом случае эту теорему нельзя. Действительно, имеем взаимно двойственные задачи: (II): f = 1,5x1 + x2 + 2x3 → min =6 0,5x1 + 0,6x2 + 0,4x3 - x4 (2’) 0,2 x1 + 0,1 x2 + 0,3 x3 - x5 = 3,1 x 4 ≥ 0 ; x5 ≥ 0 (3’) x1 ≥ 0 ; x 2 ≥ 0 ; x 3 ≥ 0 Заданные Вспомогательные (1) (I): g = 6y1 + 3,1y2 =1,5 0,5y1 + 0,2y2 + y3 =1 (2) 0,6y1 + 0,1y2 + y4 + y5 =2 0,4y1 + 0,3y2 y 3 ≥ 0 ; y4 ≥ 0 ; y5 ≥ 0 (3) y1 ≥ 0 ; y 2 ≥ 0 Заданные Вспомогательные Составляем таблицу перехода от оптимального плана одной из взаимно двойственных задач к оптимальному плану другой, заметив, что если y1 = 5/7; y2 = 5 5/7; то из (2) ⇒ y3 = 0 ; y4 = 0 ; y5 = 0 Заполняем yi (i = 1, 2, 3, 4, 5) Заданные переменные Вспомогательные y2 y3 y4 y5 y1 5/7 5 5/7 0 0 13 6/7 0 0 ? ? ? x5 x1 x2 x3 x4 Вспомогательные Заданные переменные Тогда из (2’) следует: 0,5x1 + 0,6x2 + 0,4x3 = 6 0,2 x1 + 0,1 x2 + 0,3 x3 = 3,1 61 Очевидно, что эта система двух линейных уравнений с тремя переменными имеет бесчисленное множество решений. Ибо хотя бы одно решение, которое минимизирует функцию f = 1,5x1 + x2 + 2x3 - имеется: именно то, при котором (как это следует из первой теоремы двойственности) fmin = 1,5x1 + x2 + 2x3 = 22. Это и будет третьим уравнением в системе - возможно лишним! (Даже наверное лишним). 0,5x1 + 0,6x2 + 0,4x3 = 6 0,2 x1 + 0,1 x2 + 0,3 x3 = 3,1 ( *) 1,5x1 + x2 + 2x3 = 22 Решим эту систему, предварительно преобразовав ее: 5x1 +6x2 + 4x3 = 60 2 x1 + 1 x2 + 3 x3 = 31 ( *) 15x1 +10 x2 +20x3 = 22 5 6 4 | 60 1 4 -2 | -2 1 4 -2 | -2 2 1 3 | 31 → 2 1 3 |31 → 0 -7 7 | 35 → 15 10 20 | 220 15 10 20 |220 0 -50 50 |250 1 4 -2 | -2 → 0 1 -1 | -5 0 1 -1 | -5 x1 + 4x2 - 2x3 = -2 x2 - x3 = -5 1 4 -2 | -2 → 0 1 -1 | -5 x2 = -5 + x3 ≥ 0 x3 ≥ 5 x1 = -2 + 2x3 - 4x2 = = -2 +2x3 - 4 (-5 + x3) = =18 - 2x3 ≥ 0 x3 ≤ 9 18 ≥ 2x3 Итак: 5 ≤ x3 ≤ 9; x1 = 18 - 2 x3; x2 = 5 - x3 Общее решение системы (*) имеет вид: Xоптим = (18 - 2 x3; -5 + x3; x3), где 5 ≤ x3 ≤ 9. Укажем некоторые частные решения: Xоптим(1) = (8;0;5 ) Xоптим (2) = (4;2;7) Xоптим (3) = (0;4;9) Экономический смысл найденных решений очевиден: фабрика может работать без говядины или без конины (но без печени не может!). Общий вывод интересен: задача на минимум целевой функции f имеет в данном случае бесчисленное множество оптимальных планов: (1) f = 1,5x1 + x2 + 2x3 → min 0,5x1 + 0,6x2 + 0,4x3 ≥ 6 (2’) 0,2 x1 + 0,1 x2 + 0,3 x3 ≥ 3,1 x1 ≥ 0 ; x 2 ≥ 0 ; x 3 ≥ 0 f min = 22 = f (Xоптим) X оптим = (18 - 2 x3 ; -5 + x3 ; x3), где 5 ≤ x3 ≤ 9 . 62 5. Понятие о стохастическом программировании Стохастическое программирование является тем разделом общей теории оптимальных решений, в котором рассматриваются вопросы выбора решений в ситуациях, характеризуемых случайными величинами. С формальной точки зрения стохастическое программирование это теория решения оптимизационных (экстремальных) задач стохастической (вероятностной) природы. Термин “стохастическое программирование” появился в начале 50-х гг. ХХ в., когда Данциг, Чарнс, Купер стали анализировать задачи линейного программирования со случайными коэффициентами, возникающие при планировании в ситуациях с неопределенностью и риском. Примерно в эти же годы начало развиваться нелинейное программирование, и этим, видимо, следует объяснить то, что в большинстве работ по стохастическому программированию авторы стремятся свести стохастические задачи к задачам нелинейного программирования (и применить известные численные методы). Однако методы нелинейного программирования можно применить для решения весьма узкого класса стохастических задач , т.к. стохастические задачи намного сложнее задач нелинейного программирования и требуют своих специфических методов. Основная трудность в стохастическом программировании связана - и это уже отмечалось - с отсутствием точной информации о целевой функции и ограничениях. Здесь невозможно обойтись детерминированными понятиями и представляется целесообразным применять стохастические процедуры. В частности, существует проблема выбора решений при определенности и риске и неопределенности. Говорят, что имеет место: 1) выбор решений при определенности, если каждое действие приводит всегда к однозначному результату; 2) выбор решений при риске, если каждое действие приводит к одному из множества возможных исходов, каждый из которых имеет вероятность появления, отличную от нуля; 3) выбор решений при неопределенности, если каждое действие приводит к одному из множества конкретных исходов, вероятности которых неизвестны (а, возможно, иногда и не имеют смысла). Выбор решения при определенности сводится к следующему: дано множество допустимых решений; требуется в этом множестве выбрать такое решение, которое дает минимум (или максимум) некоторого показателя, называемого функцией цели (целевой функцией). Примерами задач выбора решений при определенности являются задачи линейного программирования (более сложными примерами - задачи нелинейного программирования). Суть задач выбора действия (или решения) при риске и неопределенности можно пояснить следующим примером [3]. 63 Пусть имеется множество действий или решений i = 1,2, ..., m и возможных исходов, однозначно определяемых “состояниями природы” j = 1,2, ..., n. Пусть aij - затраты (потери, убыток), связанные с действием i при исходе (состоянии природы) j. В данном случае aij - функция цели. Числа aij можно представить в виде матрицы m x n. Истинное состояние природы j неизвестно. Требуется найти такое действие i (т.е. такую строку матрицы {aij}), которое в некотором смысле лучше других. Если известны вероятности p1; p2; ...; pn состояний j = 1, 2, ..., n; ∑npj = 1, то имеет место задача выбора решеj=1 ний при риске. При этом часто выбирается действие i = 1, 2, ..., m, которое минимизирует средние затраты ∑naijpj. Такова простейшая j=1 задача стохастического программирования. Более сложной, но и более типичной задачей выбора решений в условиях риска является задача планирования сельскохозяйственного производства. Продуктивность отраслей сельского хозяйства существенно зависит от климатических и погодных условий. Такие факторы, как количество осадков, температура, влажность почвы, заморозки, болезни растений и скота, серьезно влияют на урожайность сельскохозяйственных культур, продуктивность животноводства, качество продукции и затраты труда. В зависимости от конкретной задачи те или иные показатели следует считать детерминированными или случайными. Рассмотрим ситуации, в которых целесообразно использовать для решения сельскохозяйственных задач стохастические модели [9]. Пусть требуется выбрать интенсивности хj, j = 1,2, ..., n использования отраслей сельскохозяйственного производства, обеспечивающие максимальный чистый доход предприятия при соблюдении директивных и технологических ограничений. Введем следующие обозначения (все перечисленные характеристики каждой отрасли соответствуют ее использованию с единичной интенсивностью): сj - чистый доход j-отрасли; aij - затраты i-ресурса (угодий, труда, удобрений и т.д.) j-отраслью; bi - объем i-ресурса, которым располагает предприятие; Vij - объем производства i-продукта j-отраслью; Qi - директивные требования по производству i-продукта; G1 и G2(G1 ∪ G2 = {1; 2; ...; n} множества индексов j, отвечающих номерам отраслей растениеводства и животноводства соответственно); I1; I2; I3; I4 - множество индексов i, отвечающих номерам ресурсов, типам органических удобрений, видам кормовых культур и произведенным продуктам соответственно. Если бы значения всех параметров условий можно было бы заранее предсказать, было бы естественно сводить выбор структуры сельскохозяйственного производства (выбор интенсивностей хj использования отраслей) к решению следующей задачи линейного программирования 64 ∑nj=1cjxj → max (1) ∑nj=1aijxj ≤ bi; i∈I1; (2) ∑j∈I1 aijxj ≤ ∑j∈I2 vijxj; i∈I2 (3) ∑j∈I1 aijxj ≥ ∑j∈I2vijxj; i∈I3; (4) ∑nj=1vijxj ≥ Qi; i∈I4; (5) xj ≥ 0, j = 1,2, ..., n (6) Целевая функция (1) - величина чистого дохода предприятия. Условия (2) фиксируют ограничения по используемым ресурсам; условия (3) представляют собой ограничения отраслей растениеводства по органическим удобрениям; условия (4) - ограничение животноводческих отраслей по кормам. Неравенства (5) устанавливают директивные задания по выпуску продукции различного вида; неравенства (6) - очевидные тривиальные неравенства обычной задачи линейного программирования. В действительности, однако, параметры условий задачи - случайные величины. Прежде всего это относится к коэффициентам vij, отражающим урожайность отраслей растениеводства и продуктивность отраслей животноводства. Кроме того, не все составляющие aij затрат ресурсов заранее известны, а доход сj отраслей при фиксированной интенсивности их использования зависит от урожайности. Да и директивные планы поставок и возможности использования трудовых ресурсов также подвержены изменениям. Так что модель выбора структуры сельскохозяйственного производства безусловно является стохастической, что еще раз подчеркивает необходимость разработки методов решения задач стохастического программирования. Этому и посвящены многие работы по математическому программированию, приведенные в библиографическом списке (литературе) к данному учебному пособию. Библиографический список (литература) 1. Вентцель Е.С. Теория вероятностей. М.: Наука, 1969. 2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высшая школа, 1979. 3. Ермольев Ю.М. Методы стохастического программирования. М.: Наука, 1976. 4. Карандаев И.С. Решение двойственных задач в оптимальном планировании. М.: Статистика, 1976. 65 5. Канторович Л.В., Горстко А.Б. Оптимальные решения в экономике. М.: Наука, 1972. 6. Коршунова Н.И., Плясунов В.С. Математика в экономике. М.: Витапресс, 1996. 7. Лютикас В.С. Факультативный курс по математике (теория вероятностей). М.: Просвещение, 1990. 8. Солодовников А.С., Бабайцев В.А., Браилов А.В. Математика в экономике. Ч. I. М.: Финансы и статистика, 1999. 9. Юдин Я.Б. Задачи и методы стохастического программирования. М.: Советское радио, 1979. 66 ПРИЛОЖЕНИЕ I Таблица значений функции ϕ(x) = exp(-x2/2)/√2π 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0 0,3989 3970 3910 3814 3683 3521 3332 3123 2897 2661 1 3989 3965 3902 3802 3668 3503 3312 3101 2874 2637 2 3989 3961 3894 3790 3652 3485 3292 3079 2850 2613 3 3988 3956 3885 3778 3637 3467 3271 3056 2827 2589 4 3986 3951 3876 3765 3621 3448 3251 3034 2803 2565 5 3984 3945 3867 3752 3605 3429 3230 3011 2780 2541 6 3982 3939 3857 3739 3589 3410 3209 2989 2756 2516 7 3980 3932 3847 3726 3572 3391 3187 2966 2732 2492 8 3977 3925 3836 3712 3555 3372 3166 2943 2709 2468 9 3973 3918 3825 3697 3538 3352 3144 2920 2685 2444 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 0,2420 2179 1942 1714 1497 1295 1109 0940 0790 0656 2396 2155 1919 1691 1476 1276 1092 0925 0775 0644 2371 2131 1895 1669 1456 1257 1074 0909 0761 0632 2347 2107 1872 1647 1435 1238 1057 0893 0748 0620 2323 2083 1849 1626 1415 1219 1040 0878 0734 0608 2299 2059 1826 1604 1394 1200 1023 0863 0721 0596 2275 2036 1804 1582 1374 1182 1006 0848 0707 0584 2251 2012 1781 1561 1354 1163 0989 0833 0694 0573 2227 1989 1758 1539 1334 1145 0973 0818 0681 0562 2203 1965 1736 1518 1315 1127 0957 0804 0669 0551 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 0,0540 0440 0355 0283 0224 0175 0136 0104 0079 0060 0529 0431 0347 0277 0219 0171 0132 0101 0077 0058 0519 0422 0339 0270 0213 0167 0129 0099 0075 0056 0508 0413 0332 0264 0208 0163 0126 0096 0073 0055 0498 0404 0325 0258 0203 0158 0122 0093 0071 0053 0488 0396 0317 0252 0198 0154 0119 0091 0069 0051 0478 0387 0310 0246 0194 0151 0116 0088 0067 0050 0468 0379 0303 0241 0189 0147 0113 0086 0065 0048 0459 0371 0297 0235 0184 0143 0110 0084 0063 0047 0449 0363 0290 0229 0180 0139 0107 0081 0061 0046 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0,0044 0033 0024 0017 0012 0009 0006 0004 0003 0002 0043 0032 0023 0017 0012 0008 0006 0004 0003 0002 0042 0031 0022 0016 0012 0008 0006 0004 0003 0002 0040 0030 0022 0016 0011 0008 0005 0004 0003 0002 0039 0029 0021 0015 0011 0008 0005 0004 0003 0002 0038 0028 0020 0015 0010 0007 0005 0004 0002 0002 0037 0027 0020 0014 0010 0007 0005 0003 0002 0002 0036 0026 0019 0014 0010 0007 0005 0003 0002 0002 0035 0025 0018 0013 0009 0007 0005 0003 0002 0001 0034 0025 0018 0013 0009 0006 0004 0003 0002 0001 67 Таблица значений функции Ф(х) = (0Sxexp(-z2/2)dz)/√2π x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 Ф(х) 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,1179 0,1217 0,3962 0,3980 0,3997 0,4015 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 0,4192 х 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70 1,71 1,72 1,73 Ф(х) 0,1255 0,1293 9,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,2257 0,2291 0,2324 0,2357 0,4441 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 0,4554 0,4564 0,4573 0,4582 х 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00 2,02 2,04 2,06 2,08 2,10 2,12 68 Ф(х) 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 0,4772 0,4783 0,4793 0,4803 0,4812 0,4821 0,4830 х 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 Ф(х) 0,3315 0,3340 0,3365 0,3389 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 0,3849 0,3869 0,3883 0,3907 0,3925 0,3944 2,50 2,52 2,54 2,56 2,58 2,60 2,62 2,64 2,66 2,68 2,70 2,72 2,74 2,76 2,78 0,4938 0,4941 0,4945 0,4948 0,4951 0,4953 0,4956 0,4959 0,4961 0,4963 0,4965 0,4967 0,4969 0,4971 0,4973 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 0,4713 0,4719 2,14 2,16 2,18 2,20 2,22 2,24 2,26 2,28 2,30 2,32 2,34 2,36 2,38 2,40 2,42 2,44 2,46 2,48 69 0,4838 0,4846 0,4854 0,4861 0,4868 0,4875 0,4881 0,4887 0,4893 0,4898 0,4904 0,4909 0,4913 0,4918 0,4922 0,4927 0,4931 0,4934 2,80 2,82 2,84 2,86 2,88 2,90 2,92 2,94 2,96 2,98 3,00 3,20 3,40 3,60 3,80 4,00 4,50 5,00 0,4974 0,4976 0,4977 0,4979 0,4980 0,4981 0,4982 0,4984 0,4985 0,4986 0,49865 0,49931 0,49966 0,499841 0,499928 0,499968 0,499997 0,499997 ПРИЛОЖЕНИЕ II Варианты контрольных заданий Вариант I 1. Подброшены два игральных кубика. Случайная велчина Х произведение выпавших очков. Составить ряд распределения СВХ; найти m; d; σ. 2. Решить методами Гаусса и Жордано-Гаусса: 7х1 + 4х2 - х3 = 13 3х1 + 2х2 + 3х3 = 3 2х1 - 3х2 + х3 = -10 3. Решить геометрически: f = 6х1 + 2х2 → min 2х1 + 2х2 ≥ 1 3х1 - х2 ≥ 1 7х1 - х2 ≥1 х1 - 3х2 ≤ -1 х1 ≥ 0 х2 ≥ 0 4. Решить симплекс-методом: f = 2х1 + 3х2 + х3 → min 5х1 - х2 - 3х3 ≤ 3 х1 + х3 ≥ 2 х1 ≥ 0; х2 ≥ 0; х3 ≥ 0 5. Составить задачу, двойственную к задаче № 3 этого варианта, и решить ее (симплекс-методом или на основе теорем двойственности). 6. Исследовать функцию и построить ее график: y = f(x) = x . ex 7. Построить фигуру, ограниченную линиями: e=4x - x2; e=-x+6. Найти ее площадь. 70 Вариант II 1. В ящике находятся 4 шара с номерами от 1 до 4. Наугад извлечены 2 шара. Случайная величина Х - сумма номеров шаров. Составить ряд распределения СВХ; найти m; d; σ. 2. Решить методами Гаусса и Жордано-Гаусса: 3х1 + 4х2 - 2х3 = 11 2х1 - х2 - х3 = 4 3х1 - 2х2 + 4х3 = 11 3. Решить геометрически: f = 2x1 + 24x2 → min x1 + x2 ≥1 x1 + 14x2 ≥ 2 -x1 + 10x2 ≥ 3 x1 - 10x2 ≥ -4 x1 ≥ 0 x 2 ≥ 0 4. Решить симплекс-методом: f = x1 - x2 + x3 - x4 → max x1 - 2x2 - x3 - x4 = -9 2x1 - x2 - x3 = - 5 2x1 + x2 ≥ 2 x1 ≥ o; x2 ≥ 0; x3 ≥ 0; x4 ≥ 0 5. Составить задачу, двойственную к задаче № 3 этого варианта, и решить ее (симплекс-методом или на основе теории двойственности). 6. Исследовать функцию и построить ее график y = f(x) = x . e-x 7. Построить фигуру, ограниченную линиями: y = 2x - x2; y = x Найти ее площадь. 71 Вариант III 1. В ящике находятся 4 шара с номерами 1 до 4. Наудачу извлечены два шара. Случайная величина Х - произведение номеров шаров. Составить ряд распределения СВХ; найти m; d; σ. 2. Решить методами Гаусса и Жордано-Гаусса: x1 + 4x2 - x3 = -9 4x1 - x2 + 5x3 = -2 3x2 - 7x3 = -6 3. Решить геометрически: f = x1 - x2 → min x1 + x2 ≤ 6 x1- 2x2 ≤ 0 1 ≤ x1 ≤ 3 x2 ≥ 0 4. Решить симплекс-методом: f = 10х2 - 3х3 → max 2x1 + 2x2 + x3 ≤ 15 2x1 + 5x2 - 2x3 ≤ 0 3x1 + 2x2 - x3 = -3 x1 ≥ 0; x2 ≥ 0; x3 ≥ 0. 5. Составить задачу, двойственную к задаче № 3 этого варианта, и решить ее (симплекс-методом или на основе теорем двойственности). 6. Исследовать функцию и построить ее график y = f(x) = ex-1/(x-1) 7. Построить фигуру, ограниченную линиями: y = -x2 + 5x; y = x + 3. Найти ее площадь. 72 Вариант IV 1. Подброшены 3 монеты. Случайная величина Х - число выпавших гербов. Составить ряд распределения СВХ; найти m; d; σ. 2. Решить методами Гаусса и Жордано-Гаусса 4х1 - х2 = -6 3х1 +2х2 + 5х3 = -14 х1 - 3х2 + 4х3 = -19 3. Решить геометрически: f = x1 + 2x2 → max x1 + x2 ≥ 1 -x1 + x2 ≤ 1 x1 + x2 ≤ 3 x1 ≤ 2 x1 ≥ 0; x2 ≥ 0 4. Решить симплекс-методом: f = x1 + 2x2 - x3 → max x1 - 3x2 + x3 + x4 ≤ 7 4x2 - x3 - x4 = -3 x1 + 2x2 - x4 = 2 x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 5. Составить задачу, двойственную к задаче № 3 этого варианта, и решить ее (симплекс-методом или на основе теорем двойственности). 6. Исследовать функцию и построить ее график y = f(x) = x . lnx 7. Построить фигуру, ограниченную линиями: y = x2 - 4x; y = 4x - x2 Найти ее площадь. 73 Вариант V 1. Подброшены два игральных кубика. Случайная величина Х - сумма выпавших очков. Составит ряд распределения СВХ; найти m; d; σ. 2. Решить способами Гаусса и Жордано-Гаусса: х1 + 5х2 - 6х3 = -15 3х1 + х2 + 4х3 = 13 2х1 - 3х2 + х3 = 9 3. Решить геометрически: f = x1 + x2 → min x1 + 2x2 ≤ 4 2x1 + x2 ≤ 4 x1 + x2 ≥ 1 x1 ≥ 0; x2 ≥ 0 3. Решить симплекс-методом: f = x1 - x2 - x3 + x4 → max x1 + x2 + x3 - 3x4 ≤ 7 x1 + x2 - 4x4 = 3 x2 - x3 - 2x4 = -2 x1 ≥ 0 x 2 ≥ 0 x 3 ≥ 0 x 4 ≥ 0 5. Составить задачу, двойственную к задаче № 3 этого варианта, и решить ее (симплекс-методом или на основе теорем двойственности). 6. Исследовать функцию и построить ее график y = f(x) = x2 . e-x 7. Построить фигуру, ограниченную линиями: y = 3x - x2; y = -x. Найти ее площадь. 74 ПРИЛОЖЕНИЕ III СПРАВОЧНЫЙ МАТЕРИАЛ 1. Тождества сокращенного умножения, неравенство Бернулли и формула Ньютона ∀ a, b ∈ R верны следующие тождества: - разность квадратов а2 - b2 = (a - b) . (a + b) 3 3 2 2 - разность кубов a - b = (a - b) . (a + ab + b ) 3 3 2 2 - сумма кубов a + b = (a + b) . (a - ab + b ) 2 2 2 - квадрат двучлена (a ± b) = a ± 2ab + b 3 3 2 2 3 - куб двучлена (a ± b) = a ± 3a b ± 3ab ± b При h > -1; h ∈ R; ∀ n ∈ N (1 + h)n ≥ 1 + n . h - неравенство Бернулли При ∀ n ∈ N (a + b)n = C0n . an + C1n. an-1.b + ... + Cmn. an-m . Bm +...+Cnn. bn 2. Сравнение среднего арифметического и среднего геометрического ∀ a > 0, b > 0 Верно неравенство √ a . b ≤ (a + b)/2 3. Модуль (абсолютная величина) действительного числа. Арифметический корень Определение 1. |r| = {r; если r ≥ 0; {-r; если r < 0. Примеры: |1,5| = 1,5; |0| = 0; |-3| = -(-3) = 3 Свойства модуля: для ∀ a; b ∈ R 1. |a + b| ≤ |a| + |b| 2. |a - b| ≥ |a| - |b| 3. |a . b| = |a| . |b| 4.|a/b|=|a|/|b|;b≠0. 75 Определение 2. Арифметическим корнем n-степени из числа r (r ≥ 0) называется неотрицательное число, n-степень которого равна К. Обозначение: n√ r (r ≥ 0; n > 1) при n = 2 записывается √ r. Если r = a2, то из опр. 2 следует: √ a2 = {a; если a ≥ 0; ⇒ √a2 = |a| {-a; если a < 0 Примеры: √ 52 = |5| = 5; √(-3)2 = 3 √ (a - b)2 = |a - b| = { a - b, если а ≥ b; { b - a, если a < b. 4. Квадратные уравнения Корни приведенного квадратного уравнения x2 + p.x + q = 0 находятся так: x1,2 = -p/2 ± √p2/4 - q Корни неприведенного квадратного уравнения ax2 + bx + c = o; a ≠ 0; есть: x1,2 = (- b ± √b2 - 4ac)/2a b2 - 4ac = D - дискриминант Если D > 0, то уравнение имеет два вещественных различных корня. Если D = 0, то уравнение имеет два вещественных равных корня. Если D < 0, то уравнение вещественных корней не имеет. Теорема Виета Если х1 и х2 - корни уравнения x2 + px + q = 0, то x1 + x2 = -p; x1.x2 = q. Обратная теорема Если x1 + x2 = -p; x1.x2 = q, то х1 и х2 есть корни уравнения x2 + px + q = 0. 5. Показательная функция 76 Предварительно дадим следующие определения: an = a . a .a ... a , a ∈ R; n ∈ N. n a0 = 1 a1 = a; a-n = 1/an; a ≠ 0; n ∈ N. Пусть q = m/n; m ∈ Z; n ∈ N. aq = am/n = n√am Пусть х - иррациональное число (х ∈ R). Тогда степенью числа а > 1 с положительным иррациональным показателем х называется число, которое больше всех степеней числа a с показателями, равными десятичным приближениям числа х с недостатком, но меньше всех степеней числа а с показателями, равными десятичным приближениям числа х с избытком. Если 0 < a < 1, то степенью этого числа с положительным иррациональным показателем х называется число, которое больше всех степеней числа а с показателями, равными десятичным приближениям числа х с избытком, но меньше всех степеней числа х с показателями, равными десятичным приближениям числа х с недостатком. Пояснение к определениям: 24 = 2. 2.2.2 = 16; 2+1/2 = √ 21 = √ 2. 2-1/3 = 1/21/3 = 1/3√2 20 = 1; 21 = 2; 2-3 = 1/23 = 1/8; 2√3 ? √3 = 1,732 Выпишем десятичные приближения √3 с недостатком с избытком 1 2 1,7 1,8 1,73 1,74 ..... ..... 1 1,7 1,73 2 ; 2 ; 2 ; ..... - эта последовательность возрастает и ограничена сверху, поэтому она имеет предел t1. 22; 21,8; 21,74; ... - эта последовательность убывает и ограничена снизу, поэтому она имет предел t2. Можно доказать, что t1 = t2 = t. Вот это число t и есть 2√3. Наконец, если х - иррациональное отрицательное число, то а-х = 1/ax. Таким образом, выражение ах определено для ∀ a, x ∈ R; a > 0; a ≠ 1. 77 Определение. Функция вида f(x) = C . ax называется показательной функцией [x ∈ R; a > 0; a ≠ 1, C = const]. Отметим, что с помощью показательных функций могут быть описаны многие процессы в природе: распад радиоактивных веществ, рост численности микроорганизмов, движение тел в сопротивляющейся среде, изменение силы тока при размыкании цепи, рост народонаселения и т.п. 6. Логарифмы и логарифмическая функция Определение. Пусть а > 0; a ≠ 1; a ∈ R. Число х называется логарифмом числа N по основанию а, если ах = N. Можно доказать, что если число N имеет по основанию а логарифм, то этот логарифм единственный, он обозначается logaN. Таким образом, указанное выше определение можно переписать так: x = logaN, если ах = N (а > 0; a ≠ 1); N ∈ R+. Основное логарифмическое тождество: alog a N = N. Свойства логарифмов: 1. loga(M.N) = logaM + logaN; M > 0; N > 0. 2. loga M/N = logaM - logaN; M > 0; N > 0. 3. logaNα = α logaN; N > 0; α ∈ R. 4. logaβNα = α/β . loga N; N > 0; α = 0; β = 0. 5. logbN = logaN/logab; N > 0 6. logab . logba = 1 7. Если a > 1, то 0 < x1 < x.⇔ logax1 < logax2 8. Если 0 < a < 1, то 0 < x1 < x2 ⇔ logax1 > logax2. Рассмотрим показательную функцию y = ax и составим к ней обратную: x = logay; y = logax - логарифмическая функция; y = ax - показательная функция. Графики логарифмической и показательной функций (как и графики любых взаимно-обратных функций) симметричны относительно прямой y = x. 7. Прогрессии Определение. Арифметической прогрессией последовательность, которая задается формулой un = un-1 + d; n ≥ 2. d - разность арифметической прогрессии; u1 - первый член. 78 называется числовая Можно вывести следующие формулы общего члена и суммы членов арифметической прогрессии: un = u1 + d(n - 1); Sn = (u1 + un) /2 . n Пример 1. Вычислить сумму первых n чисел натурального ряда. 1; 2; 3; 4; ...; n Sn = (1 + n)/2 . n Пример 2. Вычислить сумму первых n чисел натуральных нечетных. 1; 3; 5; 7; ...; 2n - 1 Sn = 1 + (2n - 1)/2 . n S n = n2 1 + 3+ 5+ ... + (2n - 1) = n2 Определение. Геометрической прогрессией называется числова последовательность, которая задается формулой un = un-1 . q; n ≥ 2 q - знаменатель геометрической прогресс; u1 - первый член. Можно вывести следующие формулы общего члена и суммы членов геометрической прогрессии: un = u1 . qn-1; Sn = u1 . (1-qn)/(1-q). Рассмотрим бесконечную геометрическую прогрессию, для которой |q| < 1 (такую прогрессию в дальнейшем будем называть бесконечно убывающей геометрической прогрессией). Выпишем так называемые частичные суммы членов этой прогрессии, которые составляются следующим образом: S1 = u1 S2 = u1 + u2 S3 = u1 + u2 + u3 .......................... Sn = u1 + u2 + u3 + ... un Последовательность частичных сумм S1; S2; S3; ...; Sn; ... имеет предел, который называется суммой бесконечно убывающей геометрической прогрессии и обозначается S. S = u1/ (1-q). 8. Наиболее важные формулы из теории круговых (тригонометрических) функций 8.1. Соотношения между круговыми функциями одного аргумента α Sin2α + Cos2α = 1; ∀α∈R. tgα = Sinα/Cosα; ctgα = Cosα/Sinα; 1 + ctg2α = 1/Sin2α; 1 + tg2α = 1/Cos2α; secα = 1/Cosα; 79 cosecα = 1/Sinα; 8.2. Формулы приведения круговых функций произвольного аргумента к круговым функциям аргумента α: 0< α < π/2; -α sin(-α) = -sinα tg(-α) = -tgα cos(-α) = cosα ctg(-α) = -tgα 2π . z +α sin(2πz +α) = sinα tg(2πz +α) = tgα cos(2πz +α) = cosα ctg(2πz+α) = ctgα π/2 - α Sin(π/2-α) = Cosα tg(π/2 -α) = ctgα Cos(π/2 -α) = Sinα ctg(π/2 -α) = tgα π/2 + α Sin(π/2 +α) = Cosα Cos(π/2 +α) = -Sinα Sin(π -α) = Sinα Cos(π-α) = Sinα tg(π/2 +α) = -ctgα ctg(π/2 +α) = -tgα tg(π -α) = -tgα tg(π -α) = -tgα π+α Sin(π +α) = -Sinα Cos(π +α) = -Cosα tg(π +α) = tgα ctg(π +α) = ctgα 3/2π - α Sin(3/2π -α) = -cosα Cos(3/2π -α) = -sinα 3/2π + α Sin(3/2π +α) = -cosα tg(3/2π +α) = -ctgα Cos(3/2π + α) = Sinα ctg(3/2π +α) = -tgα 2π - α Sin(2π -α) = -Sinα Cos(2π -α) = Cosα π-α tg(3/2π -α) = ctgα ctg)3/2π -α) = tgα tg(2π -α) = -tgα ctg(2π -α) = -ctgα 8.3. Преобразования круговых функций Sin(α ± β) = Sinα . Cosβ ± Cosα . Sinβ α=β, + ⇒ Sin2α = 2sinα x cosα Cos(α ± β) = Cosα . Cosβ = Sinα . Sinβ α = β, + Cos2α = Cos2α - Sin2α ⇒ tg(α ± β) = (tgα ± tgβ) / (1- tgα .tgβ) α = β, + 80 ⇒ tg2α = 2tgα/(1 - tg2α) 2Sin2(α/2) = 1 - Cosα Sin (α/2) = ± √ (1 - Cosα)/2 2 2 Cos (α/2) = 1 + Cosα Cos (α/2) = ±√ (1 + Cosα)/2 tg (α/2) = ± √(1 - Cosα)/(1 + Cosα) (1 - Cosα) / Sinα = Sinα / (1 + Cosα) = tg (α/2) Sinα . Sinβ = [cos(α-β) - cos(α+β)]/2 Sinα . Cosβ = [Sin(α+β) + Sin(α-β)]/2 Cosα . Cosβ = [Cos(α + β) + Cos(α β)]/2 Sinα + Sinβ = 2Sin ((α+β)/2) . Cos ((α-β)/2) Sinα - Sinβ = 2 Cos ((α+β)/2) . sin ((α-β)/2) Cosα + Cosβ = 2Cos ((α+β)/2) . Cos ((α-β)/2) Cosα - Cosβ = -2 Sin ((α+β)/2) . Sin ((α-β)/2) tgα ± tgβ = Sin(α±β)/(cosα . cosβ) 8.4. Обратные круговые функции и решение простейших уравнений arc Sin m = α0, если 1) Sin α0 = m 2) -π/2 ≤ α0 ≤ π/2 Sin x = m x = (-1)z . arc Sin m + π∈Z arc Sin (-m) = -arc Sin m, ∀ m: |m| ≤ 1. arc cos m = α0, если 1) Cosα0 = m 2) 0 ≤ α0 ≤ π Cos x = m x = ± arc cos m + 2π . z; z ∈Z arc cos (-m) = π - arc cos m, ∀ m: |m| ≤ 1 arc tg m = α0, если 1) tgα0 = m 2) -π/2 < α0 < π/2 tg x = m x = arc tg m + π . z; z ∈Z arc tg (-m) = - arc tg m, ∀ m arc ctg m = α0, если 1) ctg α0 = m 2) 0 < α0 < π ctg x = m x = arc ctg m + π.z; z ∈Z arc ctg (-m) = π - arc ctg m, ∀ m arc Sin x + arc cos x = π/2; ∀x: |x| ≤ 1 arc tg x + arc ctg x = π/2; ∀x 8.5. Значения круговых функций некоторых аргументов 81 0(00) Sin Cos 0 1 tg 0 ctg ∃ (=∞) π/6(300) π/4(450) π/3(600) 1/2=0,500 √ 3/2 ≈ 0,866 1/√3 ≈ 0,577 √3≈ 1,7323 √2/2=0,707 √2/2 ≈0,707 √3/2 ≈ 0,866 1/2 ≈ 0,500 1 √3 ≈ 1,732 1 1/√3 ≈ 0,577 π/2(900) π(1800) 1 0 0 -1 ∃ (= ∞) 0 0 ∃ (= ∞) ctg 0 ∃ (= ∞), т.к. lim ctg x = +∞; lim ctg x = -∞ x → +0 x → -0 9. Формулы дифференцирования (Uα)1 =α . Uα-1 . U1 (U + V)1 = U1 + V1 (U . V)1 = U1 V + U .V1 (SinU)1 = Cos U . U1 (C . V)1 = C . V1 (Cos U)1 = -Sin U . U1 (U/V)1 = (U1.V - U.V1)/V2 (tg U)1 = 1/cos2U . U1 y = y(U) U = U(x) (ctg U)1 = -1/Sin2U . U1 Y1x = Y1u . U1x (au)1 = au . lna . U1 Y = y(x) x = x(y) (eu)1 = eu . u1 Y1x = 1/x1y (logaU)1 = 1/U.lna . U1 (C)1 = 0 (lnU)1 = U1/U (x)1 = 1 10. Первообразные f(x) x , α ≠ -1 Sin x cos x 1/cos2x 1/sin2x α F(x) x /(α+1) + C -cosx + C Sin x + C tgx + C -ctgx + C α.+1 f(x) 1/x, x>0 1/x, x<0 ex ax F(x) lnx + C ln(-x) + C ex + C ax/lna + C 11. Формулы геометрии 11.1. Треугольники Сумма внутренних углов: А1 + В1 + С1 = 180о Теорема Пифагора (для прямоугольного ∆ АВС, С1 = 900) с2 = a2 + b2 82 3/2π (2700) -1 0 ∃ (= ∞) 0 0 Соотношения между сторонами и углами прямоугольного ∆ ABC, C = 90 : a = c . Sin A; b = c . cos A; c = a/Sin a a = b . tg A Теорема косинусов: a2 = b2 + c2 - 2bc . cos A Теорема синусов: a/Sin A = b/Sin B = c/Sin C Площадь: S = a . h/2; S = bc . Sin A/2 S = √p(p-a)(p-b)(p-c), где p = (a + b + c)/2 (формула Герона) 11.2. Многоугольники Сумма внутренних углов n-угольника: 2d(n-2) Cредняя линия трапеции m = (a + b)/2 (a, b - основания) Площадь параллелограмма: S = a . h; S = a . b . Sin α Площадь трапеции: S = (a + b)/2 . h Стороны вписанного правильного n-угольника: an = 2R . Sin (1800/n) (R - радиус описанной окружности) Сторона вписанного правильного шестиугольника: а6 = R Сторона вписанного правильного четырехугольника (квадрата): а4 = R√2 Сторона вписанного правильного треугольника: а3 = R√3 Площадь правильного многогранника: S = 1/2P . r (P - периметр, r - апофема) 83 11.3. Окружность и круг Длина окружности : C = 2πR Длина дуги в n0: l = πRn/1800 Площадь круга S = πR2; S = πd2/4 Площадь кругового сектора в n0: S = πR2n/360 11.4. Векторы и координаты Правило треугольника → → → → → → → AB + BC = AC или AB + DC + CF = 0 Правило многоугольника: → → → → АAn = AA1 + A1A2 + ... + An-1An или → → → → → AA1 + A1A2 + ... + An-1An + AnA = 0 84 Формула вычитания векторов → → → OB - OA = AB → → вектора по двум неколлинеарным векторам а и b (на Разложение плоскости): → → → с = xa + yb → → → Разложение вектора по трем некомпланарным векторам a, b, c (в пространстве): → → → → d = x.a + y.b + z.c Скалярное произведение ненулевых векторов: →→ → → a. b = |a| . |b| . cos (a; b) Сложение и вычитание векторов в координатах: →→ a ± b = (x1±x2; y1±y2; z1±z2) Умножение вектора на число: → p . a = (px; py; pz) Скалярное произведение в координатах: →→ a . b = x1x2 + y1y2 + z1z2 Длина вектора: → |a| = √x2 + y2 + z2 Расстояние между точками A(x1; y1; z1) и B(x2; y2; z2): |AB| = √(x2-x1)2 + (y2-y1)2 + (z2-z1)2 Уравнение плоскости, проходящей через точку А (х1; y1; z1) и перпендикулярной вектору n = (a; b; c): a(x-x1) + b(y-y1) + c(z-z1) = 0 85 Уравнение сферы с центром S (0; 0; 0) и радиусом R: x2 + y2 + z2 = R2 11.5. Многогранники Площадь боковой поверхности призмы: Sбок. = P . l (P - периметр перпендикулярного сечения; l - боковое ребро) Площадь боковой поверхности правильной пирамиды: Sбок. = P . hбок./2 (P - периметр основания, hбок. - апофема) Sбок = Q/cos α (Q - площадь основания, α - угол между боковой гранью и плоскостью основания). Площадь боковой поверхности правильной усеченной пирамиды Sбок = (P + P1) hбок/2 (P и Р1 - периметры оснований, hбок - высота боковой грани) Площадь ортогональной проекции многоугольника: S1 = S . cos ϕ (ϕ - угол между плоскостями многоугольника и его проекции) Объем прямоугольного параллелепипеда: V = a . b. c (a, b, c - измерения параллелепипеда) Объем призмы: V=Q.H (Q - площадь основания, Н - высота) Объем пирамиды V = QH/3 (Q - площадь основания, Н - высота) 11.6. Фигуры вращения Площадь боковой поверхности цилиндра: Sбок = 2πRР 86 Площадь боковой поверхности конуса: Sбок = πRL (L - образующая) Объем цилиндра: V = πR2H Объем фигуры, полученной при вращении криволинейной трапеции: V = πSabf2(x) . dx Объем конуса: V = πR2H/3 Объем шара: V = 4πR3/3 Площадь сферы: S = 4πR2 87 ГРАФИКИ ОСНОВНЫХ ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ f(x) = sin x D(f) = [-π/2; π/2] E(f) = [-1; 1] g(x) = arcsinx D(g) = [-1; 1] E(g) = [-π/2; π/2] 88 ∀x, Sin x = x - x3/3! + x5/5! - ... + (-1)n-1 . x2n-1/(2n-1)! + ... f(x) = сos x D(f) = [0; π] E(f) = [-1; 1] g(x) = arc cos x D(g) = [-1; 1] E(g) = [0; π] ∀x, cosx = 1 - x2/2! + x4/4! - ... + (-1)n.x2n/(2n)! + ... 89 f(x) = tgx D(f) = (-π/2; π/2) E(f) = (-∞; +∞) g(x) = arctgx D(g) = (-∞; +∞) E(g) = (-π/2; π/2) arctgx = x - x3/3 + x5/5 - ... + (-1)n-1 . x2n-1/(2n-1) + ... f(x) = ctgx g(x) = arcctgx D(f) = ( 0; π) D(g) = (-∞; +∞) E(f) = (-∞; +∞) E(g) = (0; π) 10 см g(x) = lnx f(x) = еx = exp(x) D(f) = (-∞; +∞) D(g) = (0; +∞) E(f) = (0; +∞) E(g) = (-∞; +∞) 10 см ∀x, еx = 1 + x/1! + x2/2! + ... + xn/n! + ... ∀x, ln((1+x)/(1-x)) = 2(x + x3/3 + x5/5 + ... + x2n-1/(2n-1) + ...) 90 f(x) = 10x =exp10(x) D(f) = (-∞; +∞) E(f) = (0; +∞) g(x) = lg x D(g) = (0; +∞) E(g) = (-∞; +∞) 91 f(x) = x2 D(f) = (0; +∞) E(f) = (0; +∞) g(x) = √x D(g) = (0; +∞) E(g) = (0; +∞) 92 f(x) = x3 D(f) = (-∞; +∞) E(f) = (-∞; +∞) g(x) = 3√x D(g) = (-∞; +∞) E(g) = (-∞; +∞) 93 f(x) = x D(f) = (-∞; +∞) E(f) = (-∞; +∞) g(x) = x D(g) = (-∞; +∞) E(g) = (-∞; +∞) 94 f(x) = x-1= 1/x D(f) = (-∞; 0) U (0; +∞) E(f) = (-∞; 0) U (0; +∞) g(x) = x-1 = 1/x D(g) = (-∞; 0) U (0; +∞) E(g) = (-∞; 0) U (0; +∞) ТАБЛИЦА ПРОИЗВОДНЫХ Функция C(consl) x Un 1/U 1/Un √U eU aU ln U logaU Sin U Производная 0 1 n-1 nU . U1 -1/U2 . U1 -n/Un+1 . U1 1/2√U eU . U1 aUlna . U1 1/U . U1 1/U logae . U1 Cos U . U1 Функция Cos U tg U ctg U arcSin U arcCos U arctg U arcctg U sh U ch U th U cth U * U -функция от х 95 Производная -Sin U . U1 1/Cos2U . U1 1/-Sin2U . U1 1/√1-U2.U1 -1/√1 - U2 . U1 +1/(1 + U2) . U1 -1/(1+U2 ). U1 ch U . U1 sh U . U1 1/ch2U . U1 -1/sh2U . U1 ТАБЛИЦА ДИФФЕРЕНЦИАЛОВ dc = 0 d(Un) = nUn-1 . dU d(1/U) = -1/U2 . dU d(1/Un) = -n/Un+1 dU d(√U) = 1/2√U . dU d(eU) = eU . dU d(aU) = aUlna . dU d(lnU) = 1/U . dU d(logaU) = 1/U loga l/dU d(Sin U) = CosU . dU d(CosU) = -Sin U . dU d(tgU) = 1/Cos2U . dU d(ctgU) = -1/Sin2U . dU d(arcSinU) = 1/√1-U2 . dU d(arcCosU) = -1/√1-U2 . dU d(arctgU) = 1/(1+U2 ). dU d(arcctgU) = -1/(1+U2 ). dU d(sh U) = ch U . dU d(ch U) = sh U . dU d(th U) = 1/ch2U . dU d(dh U) = -1/sh2U . dU ТАБЛИЦА ИНТЕГРАЛОВ S undu = un+1/(n+1) + C(n=-1) S du/u = ln|u| + C Saudu = au/lna + C Seudu = eu + C S Sinudu = -Cosu + C S Cos udu = Sin u + C S du/Sin2u = -ctgu + C S du/Cos2u = tgu + C S du/√1-u2 = arc Sin u + C S du/√a2 - u2 = arc Sin u/a + C S du/(1+u2 )= arc tgu + C S du/(a2+u2 )= arctg (u/a) /a + C S du/√u2± a2 = ln|u +√u2±a2| + C S tgudu = -ln|Cos u| +C S ctgudu = ln|Sinu| + C S du/Sinu = ln |tg u/2| + C S du/Cosu = ln |tg(u/2 + π/2)| + C S du/(u2-a2 )= ln|(u-a)/(u+a)/2a| + C Общая схема исследования функции и построение ее графика (на примере функции Гаусса y = f(x) =0,4 . exp(-x2/2)) 1. Найти область существования функции; установить поведение функции на концах промежутков, составляющих область существования; определить вертикальные, наклонные, горизонтальные асимптоты (если они существуют). D(f) = (-∞; +∞) lim f(x) = +0 x→±∞ Точек разрыва нет; следовательно, нет вертикальных асимптот. 96 k = lim (f(x)/x) = 0 x →±∞ b = lim [f(x) - kx] = 0 x →±∞ k=0 b=0 y = 0 - ось 0Х - горизонтальная асимптота 2. Найти точки пересечения графика функции с осями координат: y=0 точек пересечения с осью ОХ нет. y = exp(-x2/2) = 0 x=0 x=0 (0; 0,4) - точка пересечения с осью ОХ. 2 y = 0,4 . exp(-x /2) y = 0,4 3. Исследовать функцию на четность (нечетность, общий вид) f(x) = 0,4 exp(-(-x)2/2) = 0,4 . exp(-x2/2) = f(x) ⇒ Функция четная, график ее симметричен относительно оси ординат. 4. C помощью первой производной найти критические точки первого рода, установить промежутки возрастания (↑) и убывания (↓) функции и ее экстремумы (если они существуют): y1 = 0,4 . exp(-x2/2) (-x) y1 = 0 x = 0 - критическая точка I рода x y1 y 0 0 max -∞; 0 + ↑ 0; +∞ ↑ ymax = y(0) = 0,4 5. С помощью второй производной найти критические точки II рода; установить промежутки выпуклости и вогнутости графика функции и точки перегиба. y11 = 0,4.exp(-x2/2).(x2 - 1) y11 = 0 x1 = -1 x2 = 1 x2-1 = 0 x2 = 1 - критические точки II рода 97 x y11 y -∞; -1 + вогнута -1 0 перегиб -1; 1 выпукла 1 0 перегиб 1; +∞ + вогнута y(±1) = 0,4 e-1/2 = 0,4/√e ≈ 6. На координатной плоскости построить характеристические точки графика функции (точки пересечения с осями координат, точки экстремумов и перегиба и т.д.), а затем - эскиз графика функции, по которому можно установить некоторые другие свойства функции (например, здесь легко усматривается непериодичность функции и ее множество значений E(f) = (0; 0,4]) 98 КРИВАЯ ГАУССА y = f(x) = 0,4 . exp(-x2/2) 99 ПРИЛОЖЕНИЕ IV Компьютерные модели некоторых задач В этом приложении приводятся программы, разработанные студентами II курса Ярославского государственного университета имени П.Г. Демидова Александром Шармановым (экономический факультет, программа ALEX1), Антоном Хрулевым (ANTONX1; математический факультет - МФ), Валентином Пепеловым (VALENT1; МФ), Дмитрием Козуновым (DIMIT1; МФ), Романом Сандаркиным (ROMAN1; МФ), Валерием Яковенко (VALERI1; МФ), Антоном Штерном (ANTONS1; МФ). Программы осуществляют написанные на различных языках (BASIC, TURBO PASCAL 7.0, VIGIAL BASIC 6.0; DELFI 4.0) компьютерные модели задач: “Игра в “крэпс” (2 игральных кубика); “Попытай счастья” (3 кубика); “Задача о блуждании точки (частицы) [ или о разорении игрока]”, “Вычисление определенных интегралов методом Монте-Карло”. Условия задач и их математические модели приводятся либо в первой части этого пособия, либо в комментариях к компьютерным моделям. ПРОГРАММА “ALEX1” Построение компьютерной модели задачи Найти вероятность выигрыша игрока и вероятность выигрыша казино при игре в “крэпс” (craps - американская азартная игра в кости). Математическая модель этой задачи рассмотрена в первой части этого пособия. Программная реализация 10 REM ИГРА В КРЭПС 20 INPUT “ВВЕДИТЕ ЧИСЛО ОПЫТОВ N= “, n 30 а = 0 40 b = 0 50 FOR i = 1 ТО n 60 GOSUB 210 70 IF s = 7 OR s = 11 THEN 140 80 IF s = 2 OR s = 3 OR s = 12 THEN 160 90 s2 = s 100 GOSUB 210 110 IF s = s2 THEN 140 120 IF s = 7 THEN 160 130 GOTO 100 140 a = a + 1 150 GOTO 170 160 b = b + 1 100 170 NEXT i 180 PRINT “ВЕРОЯТНОСТЬ ВЫИГРЫША ИГРОКА Р(А)=“; a / n 190 PRINT “ВЕРОЯТНОСТЬ ВЫИГРЫША КАЗИНО Р(B) =“; b / n 200 END 210 RANDOMIZE TIMER 220 x = INT (RND * 6) + 1 230 y = INT (RND * 6) + 1 240 s = x + y 250 RETURN В 20 строке вводится количество опытов (игр между Игроком и Казино). 30 и 40 строка заявляют переменные количества выигрышей Игрока и Казино соответственно. С 50 строки начинается цикл, каждая петля которого представляет собой отдельную игру. В 60 строке программа вызывает подпрограмму (с 210 строки) бросания двух кубиков и суммирования числа выпавших очков. В 70 и 60 строках проверяется условие победы или поражения с первого броска. Если этого не произошло (поинт) переходим к строке 90, где копируем сумму первого броска и уходим на подпрограмму для совершения повторного броска в строке 100. В 110 и 120 строках проверяем условия победы после поинта. При необходимости повторных бросаний возвращаемся в строку 100, то есть получилась петля, работающая до выигрыша Игрока, когда тот выбрасывает число, равное первому поинту, или до выигрыша Казино, когда сумма выброшенных очков равна 7. 140 и 160 строки регистрируют количество выигрышей Игрока и Казино в n опытах. После завершения цикла подсчитывается и выводится на экран вероятность выигрыша Игрока и Казино соответственно. На этом программа заканчивается. Практические результаты Число опытов Вероятность выигрыша Вероятность выигрыша Игрока Казино 100 0,43 0,57 1000 0,457 0,543 10000 0,4763 0,5237 100000 0,48008 0,51992 1000000 0,49735 0,50265 Выводы: математически вычисленная вероятность выигрыша Игрока составляет 0.49293, а полученная посредством компьютерного моделирования статистическая вероятность 0,49735 (из 1000000 опытов). Таким образом, результаты исполнения программы, составленной на основе компьютерного моделирования, соответствуют математическим вычислениям вероятностей выигрышей Игрока и Казино. ПРОГРАММА “ANTONX1” 101 Программа составлена на языке TURBO PASCAL 7.0 Program kreks; Uses crt; Label 1,2,3,4,5,6; {описание меток} Var s, s1, s2, point, i, w, p, n, k, h : longint; wer : real; BEGIN writeln(‘Введите количество партий:’); readln(n); for i:=1 to n do begin {моделирование “n” партий в крэкс} randomize;{инициализация генератора случайных чисел} 1:s1:=random(7);{генерирует целые числа от 0 до 6 случайным образом} if s 1=0 then goto 1;{yf rjcnb yt vj;tn dsgfcnm “0”} 4:s2:=random(7);if s2 = 0 then goto 4; s:=s1 + s2; if (s=7) or (s=11) then begin {проверка суммы на выигрыш} w:=w + 1;goto 2;end; if(s=2) or (s=3) or (s=12) then begin {проверка на выигрыш} p:=p + 1;goto 2;tnd; point:=s;{если ни одно из условий выше не подошло, то “пойнту” присваиваем значение s} repeat {бросаем кости, пока не выпадет “пойнт” или 7} 5:s1:=random(7); if s1=0 then goto 5; 6:s2:=random(7); if s2=0 then goto 6; s:=s1 + s2; until (s=point) or (s=7); if s=7 then p:=p + 1; if s= point then w:=w + 1; 2:writeln(‘Выигрыш = ‘,w,’ числу раз’); writeln(‘Проигрыш =’,p,’ числу раз’); delay(10000);{Задержка - нужна, чтобы генерируемые числа не повторялись} end;{конец моделирования “n” партий} wer:=(w/n);{Вероятность выигрыша равна отношению числа выигрышей к общему количеству партий в крэкс} writeln(‘Вероятность выигрыша равна =’,wer); readln; END. После запуска программы требуется ввести количество партий. В результате программа выдаст количество выигранных и проигранных партий, а также посчитает вероятность выигрыша. Количество Количество Количество Вероятность партий (n) выигрышей (В) проигрышей (П) выигрыша Р(В) 10 4 6 0.4 102 100 1000 10000 45 492 4926 55 508 5074 0.45 0.492 0.4926 “ПОПЫТАЙ СЧАСТЬЯ” “Попытай счастья” - игра в кости с несложными правилами. После того, как игрок сделает ставку на один из номеров 1, 2, 3, 4, 5, 6, подбрасываются три игральные кости. Если номер выпадает на одной, двух или трех костях, то за каждое появление этого номера выплачивается первоначальная ставка, при этом возвращается и первоначальная ставка. В противном случае игрок теряет ставку. Какой средний проигрыш игрока при единичной ставке? Решение Подсчитаем ущерб, возникающий в каждом из трех случаев: а) На трех костях выпали разные номера. б) На двух костях выпали одинаковые номера. в) На трех костях выпали одинаковые номера. Для простоты предположим, что на каждый номер поставлена единичная ставка. Тогда в первом случае игрок очевидно не проигрывает, но и не выигрывает. Предположим теперь, что выпало ровно два одинаковых номера, например, 1, 1 и 2. В этом случае игорный дом может использовать ставки, поставленные на 3 и 4, чтобы расплатиться с 1, а ставку с 5 уплатить номеру 2. Таким образом, игорному дому остаются ставка с номера 6 и проигрыш игрока 1/6. В третьем случае, при выпадении, например, трех единиц, игорный дом выплачивает ставки с номеров 2, 3 и 4 на покрытие выигрыша, а ставки с 5 и 6 оставляет себе и проигрыш игрока 2/6. Вероятность выпадания трех различных номеров равна 120/216 (всего возможных вариантов 6*6*6=216, а комбинаций с различными номерами 6*5*4=120). Вероятность выпадания трех одинаковых номеров очевидно равна 6/216, а двух одинаковых номеров 90/216. Средний же ущерб получается суммированием произведений вероятностей отдельных случаев на ущерб, им соответствующий: 120/216x0+90/219x1/6+6/216x2/6=17/216≈0.079 Итак, средний ущерб составляет около 8% Программа VALENT1 program pr; var i,t:longint; q:boolean; 103 j:real; n,k,r,c:integer; begin randomize; j:=0 readln(i); for i:=1 to i do begin t:=0; {“Броски костей”} r:=random(6)+1; randseed:=randsees+i; k:=random(6)+1; randseed:=randseed+i; n:=random(6)+1; randseed:=randseed+i; if r=1 then begin j:=j+1;t:=1;end; if k=1 then begin j:=j+1;t:=1;end; if n=1 then begin j:=j+1;t:=1;end; if t=0 then j:=j-1; end; writeln(j/i:1:10); readln; end. Таблица: Количество попыток 100 1000 10000 100000 1000000 10000000 Результат -0.05 -0.052 -0.0948 -0.0771 -0.07968 -0.0787651 104 ПРОГРАММА “DIMIT1” “Вычисление интеграла методом Монте-Карло” На отрезке, на котором интегрируется функция, произвольным образом выбираются n-случайных точек (n - вводится пользователем). Затем суммируются значения функции в этих точках и конечная сумма делится на число случайных точек и умножается на h (h - разность верхнего и нижнего пределов). Текст программы: Dim a! ‘коэффициент-переменная типа long Dim b! ‘коэффициент-переменная типа long Public Sub integral() Dim k! ‘нижний предел интегрирования Dim l! ‘верхний предел интегрирования Dim h! ‘разность между l и k Dim number As Long ‘число случайных точек Dim s! ‘сумма значений функции Dimf! ‘значение функции Dim j As Long Dim MyValue ‘случайная точка a = TextA b = TextB k = TextDown l = TextUp number = TextNumber h=l-k For j = 1 To number MyValue = (h * Rnd + k) x = MyValue: GoSub 3: s = s + f Next j s = s’h / number GoTo 4 3 f = a * x ^ 2 + b * x: Return 4 Textintegral = s End Sub Тестирование программы: (А,В - параметры функции; K,L - нижний и верхний пределы соответственно.) Для функции вида: F(x)=A*x^2+B*x 105 A B K L Число случайных точек 1 1 0 2 15 1 1 0 2 150 1 1 0 2 1500 1 1 0 2 15000 1 1 0 2 150000 1 1 0 2 1500000 Значение интеграла 2,952625 4,834923 4,644458 4,69775 4,6684 4,667233 A B K L Число случайных точек 3 4 3 4 15 3 4 3 4 150 3 4 3 4 1500 3 4 3 4 15000 3 4 3 4 150000 3 4 3 4 1500000 Значение интеграла 51,752 50,03263 50,97248 50,95887 51,0407 51,0092 A B K L Число случайных точек 2 0 0 4 15 2 0 0 4 150 2 0 0 4 1500 2 0 0 4 15000 2 0 0 4 150000 2 0 0 4 1500000 Значение интеграла 41,9929 42,55829 42,32603 42,81858 42,67402 42,67197 ПРОГРАММА “ROMAN1” “ЗАДАЧА О БЛУЖДАЮЩЕЙ ТОЧКЕ” Условие задачи, математическая модель ее решения описаны в I части этого учебного пособия, поэтому здесь рассмотрим лишь компьютерную модель, написанную на языке программирования TurboPascal 7.0. 10: program ver1; 20: uses crt, graph 30: var k, m, i, j, f, t, x, h:integer; 40: p, l:real; 50: n:longint; 60: a:array[1...50] of real; 70: GraphDriver,GraphMode:integer; 80: PathToDriver:string; 90: begin 100: for i:= 1 to 50 do 110: begin 120: p:=0.5+i/100; 130: m:=1; 140: x:=0; 106 150: f:=5000; 160: for j:=1 to f do 170: begin 180: n:=5000; 190: repeat 200: {randomize;} 210: l:=random(32001)/32000; 220: t:=random(3); 230: delay(t); 240: k:=random(1); 250: delay(k); 260: if 1>p then m:=m-1 else m:=m+1; 270: n:=n-1; 280: until (m=0) or (n=0); 290: if m=0 then x:=x+1; 300: m:=1; 310: end; 320: a[i] :=x/f; 330: end; 340: writeln (‘’); 350: readln; 360: clrscr; 370: GraphDriver:=3; 380: GraphMode:=2; 390: PathToDriver:=‘d:\tp\bgi’; 400: InitGraph (GraphDriver,DraphMode,PathToDriver); 410: line(320,0,320,480); 420: line(0,240,640,240); 430: for i: =0 to 64 do 440: line(10*i,235,10*i,245); 450: for i:=0 to 64 do 460: line(315,10*i,325,10*i); 470: line(320,140,370,140); 480: for i:=3 to 49 do 490: line(370+(i-1),240-(round((a[i-2]+a[i-1]+a[i]) /3*100)),370+i,240(round ((a[i-1]+a[i]+a[i+1]) /3*100))); 500: line(370,140,370+2,240- (round((a[1]+a[2]+a[3]) /3*100))); 510: line(370+(49), 240-(round((a[48]+a[49]+a[50]) /3*100)),420,240); 520: readln; 530: end. В программе принимаем следующие переменные за: р - вероятность сдвига точки в право 107 m - положение точки х - количество возвращений точки в 0 при фиксированной р f - количество опытов n - количество сдвигов точки Строка 90 - начало основного цикла. Строка 160 начинает цикл движения точки. Строки 200-240 - берем случайные числа. В строке 260 проверяем: если случайное число больше р, то точка сдвигается на 1 влево, в противном случае вправо. Строка 290 - если точка достигла 0, то х увеличивается на 1. Строка 320 - результаты заносим в массив. Строка 360 инициализирует графический режим. Строки 410, 420 строят координатные оси. Строки 470-510 показывают подсчитанные вероятности в виде графика зависимости р1(р). В результате выполнения программы мы увидим примерно такой график: С некоторыми допущениями можно сказать, что это похоже на график функции, описанной в математической модели этой задачи, что, в свою очередь, лишний раз подтверждает рациональность применения компьютерной модели при решении задач теории вероятностей. ПРОГРАММА “VALERI1” Задача о блуждании 108 Рассмотрим игрока с начальным капиталом х=1, играющего неограниченно долго против казино с бесконечным капиталом. Каждая ставка = 1. По заданной вероятности выигрыша партии найти общую вероятность выигрыша. Математическое обоснование решения данной задачи смотрите в первой части этого пособия. 1. var z,ni,n,l,k,i,j:integer; 2. p1,p:real; 3. begin 4. randomize; 5. p1:=strtofloat(edit1.text); 6. z:=strtoint(edit2.text); 7. ni:=strtoint(edit3.text); 8. n:=o; 9. for i:=1 to z do 10. begin 11. l:=0; k:=0; 12. for j:=1 to ni do 13. begin 14. if random<=p1 15. then l:=l+1 16. else k:=k+1; 17. if k>1 18. then break; 19. end; 20. lf l>=((ni+1)div(2)) 21. then n:=n+1; 22. end; 23. p:=n/z; 24.label1.caption:=‘вероятность выигрыша = ‘+floattostr(p); 25.tnd; Комментарии: Строка 1 - описание переменных: z - количество игр, ni - количество партий, n -количество выигранных игр, l - количество выигранных партий в одной игре, k -количество проигранных партий в одной игре. 2 - р1 - вероятность выигрыша одной партии, р - общая вероятность выигрыша. 9 - цикл процесса игры. 14 - проверка условия выигрыша партии. 17 - проверка на банкротство игрока. 20 - проверка на выигрыш одной игры. 23 - общая вероятность выигрыша. 109 Вероятность выигрыша партии 0,9 0,5 0,3 0,9 0,5 0,3 Кол-во игр Кол-во партий 1000 1000 1000 1000 1000 1000 100 100 100 10 10 10 Теор. значение выигрыша 8/9=0,(8) 0 0 8/9=0,(8) 0 0 Практическое значение выигрыша 0,884 0,069 0 0,882 0,232 0,032 ПРОГРАММА “ANTONS1” Задача о блуждании Частица движется из положения х=1 либо в точку х=2 с вероятностью р, либо в точку х=0 с вероятностью 1-р. Вообще: если частица находится в положении х=n, то она сдвигается либо в точку х=n+1 с вероятностью р, либо в точку х=n-1 с вероятностью 1-р. Если частица попадает в точку ч=0, то там она поглощается. Пусть р1 - вероятность того, что частица поглощается в точке х=0, после того как она выходит из точки х=1. Программа статистически подсчитывает вероятность р1, для 0.5<=p<=1 (р меняется с шагом 0ю01) и выводит на экран график функции р1(р). program ver1; uses crt,graph; var k,m,i,j,f,t,x,h:integer; p,l:real; n:longint; a:array[1...50] of real; GraphDriver,GraphMode:integer; PathToDriver:string; begin {начало основного цикла} for i:= 1 to 50 do begin {варьируем вероятность движения точки на 1 вправо от 0.5 до 1 с шагом 0.01} р:=0.5+i/100; {m- положение точки} m:=1; {x-число возвращений точки в 0 при фиксированной р} x:=0; {f-число опытов} f:=5000; {цикл движения точки} for j:=1 to f do begin {n-количество движений точки} n:=5000; repeat 110 {берем случайное число} randomize; l:=random(32001)/32000; randomize; t:=random(1); delay(t); randomize; k:=random(3); delay(k); {если сгенерированное число >р, то точка сдвигается на 1 влево, иначе на 1 вправо} if l>p then m:=m-1 else m:=m+1; n:=n-1; until (m=0) or (n=0); {если точка переместилась в 0 то увеличиваем х на 1} if m=0 then x:=x+1; m:=1; end; {результаты для каждого р вносим в массив и выводим на экран} a[i]:=x/f; writeln(‘a[‘,i,’]=‘,a[i]:1:5); end; writeln(“); readin; {инициализация граф.режима} clrscr; GraphDriver:=3; GraphMode:=2; PathToDriver:=‘d:\tp\bgi’; InitGraph(GraphDriver,GraphMode,PathToDriver); {изображаем координатные оси} line(320,0,320,480); line(0,240,640,240); for i:=0 to 64 do line(10*i,235,10*i,245); for i:=0 to 64 do line(315,10*i,325,10*i); {выводим подсчитанные вероятности в виде графика р1(р)} line(320,140,370,140); for i:=3 to 49 do line(370+(i-1),240-(round((a[i-2]+a[i-1]+a[i])/3*100)),370+i,240-(round((a[i1]+a[i]+a[i+1])/3*100))); line(370,140,370+2,240-(round((a[1]+a[2]+a[3])/3*100))); line(370+(49),240-(round((a[48]+a[49]+a[50])/3*100)),470,240); readin; end. После запуска программа выводит на экран следующий график зависимости р1 от р: 111 112 Щукин Евгений Иванович МАТЕМАТИКА Теория вероятностей. Системы линейных алгебраических уравнений Редактор, корректор А.А. Аладьева Компьютерная верстка И.Н. Ивановой Лицензия ЛР № 020319 от 30.12.96. Подписано в печать 10.11.2001. Формат 60х84/16. Бумага тип. Усл. печ. л. 6,7. Уч.-изд. л. 4,0. Тираж 100 экз. Заказ Оригинал-макет подготовлен в редакционно-издательском отделе ЯрГУ. Отпечатано на ризографе. Ярославский государственный университет. 150000 Ярославль, ул. Советская, 14. 113 114 Е.И. Щукин МАТЕМАТИКА Теория вероятностей. Системы линейных алгебраических уравнений и линейное программирование 115