7. Экстремумы функций нескольких переменных 7.1. Локальные экстремумы Пусть функция f (x1 , . . . , xn ) определена на некотором открытом множестве D ⊆ Rn . Точка M ∈ D называется точкой локального максимума (локального минимума) функции f, если значение f (M ) является наибольшим (наименьшим) среди всех значений этой функции в некоторой окрестности точки M (т.е. существует δ > 0 такое, что для всех точек (x1 , . . . , xn ) ∈ Oδ (M ) выполняется f (x1 , . . . , xn ) ≤ f (M ) (f (x1 , . . . , xn ) ≥ f (M ))). Точки локального максимума и локального минимума называются точками локального экстремума. Для локального экстремума дифференцируемой функции нескольких переменных можно обобщить необходимое и достаточные условия существования со случая одной переменной. Лемма 7.1. Если функция f (x1 , . . . , xn ) определена в некоторой окрестности точки M, являющейся точкой локального экстремума, и существует в точке M конечная частная производная функции f по какой-то переменной xi , то эта частная производная равна 0. Доказательство. Обозначим координаты точки M (x01 , . . . , x0n ) и рассмотрим функцию одной переменной xi : g(xi ) = f (x01 , . . . , x0i−1 , xi , x0i+1 , . . . , x0n ). Существование конечной частной производной функции f (x1 , . . . , xn ) по переменной xi в точке M эквивалентно дифференцируемости функции g(xi ) в точке x0i . Очевидно, что функция g(xi ) имеет в точке x0i локальный экстремум. А тогда g 0 (x0i ) = 0. Это означает, что fx0 i (M ) = 0. Лемма доказана. ¤ Теорема 7.1. (Необходимое условие локального экстремума). Пусть функция f (x1 , . . . , xn ) определена на некотором открытом множестве D и дифференцируема в точке M ∈ D, являющейся точкой локального экстремума функции f. Тогда df (M ) = 0. Доказательство непосредственно вытекает из леммы, если ее применить ко всем переменным xi (i ∈ {1, . . . , n}). Точки множества D, в которых у функции f существует и равен нулю дифференциал, будем называть стационарными. Из теоремы 7.1 следует, что точками локального экстремума могут быть только стационарные точки и точки, в которых функция не дифференцируема. Оказывается, не любая стационарная точка является точкой локального экстремума у дифференцируемой функции. Например, для функции f (x, y) = x2 + y 2 , D = R2 (см. рис. 7.1) точка (0; 0) является и стационарной, и точкой локального минимума (т.к. f (x, y) = x2 + y 2 ≥ 0 = f (0, 0)), а для функции f (x, y) = x2 − y 2 , D = R2 (см. рис. 7.2) точка (0; 0) является стационарной, но не является точкой локального экстремума (т.к. в любой окрестности точки (0; 0) функция принимает и положительные (f (ε, 0) = ε2 ), и отрицательные (f (0, ε) = −ε2 ) значения). Следовательно, для исследования локального экстремума нужны некоторые достаточные условия. Предварительно вспомним известное из алгебры понятие квадратичной формы. Квадратичной формой относительно переменных t1 , . . . , tn называется функция n X Φ(t1 , . . . , tn ) = aij ti tj , i,j=1 где при всех i, j ∈ {1, . . . , n} aij ∈ R, aij = aji . Квадратичная форма называется положительно определенной (отрицательно определенной), если при всех значениях t1 , . . . , tn ∈ R, одновременно не обращающихся в 0, функция Φ(t1 , . . . , tn ) принимает только строго положительные (строго отрицательные) значения. Квадратичная форма называется знакопеременной, если она принимает как строго положительные, так и строго отрицательные значения. Теорема 7.2. (Достаточные условия локального экстремума). Пусть функция f (x1 , . . . , xn ) определена и дважды дифференцируема в некоторой окрестности точки M (x01 , . . . , x0n ), причем в самой точке M все частные производные второго порядка непрерывны. Пусть, кроме того, M – стационарная точка. Тогда, если d2 f (M ) представляет собой знакоопределенную квадратичную форму относительно dx1 , . . . , dxn , то точка M является точкой локального экстремума (локального максимума, если отрицательно определенная, и локального минимума, если положительно определенная форма). Если d2 f (M ) представляет собой знакопеременную квадратичную форму, то в точке M локального экстремума нет. Доказательство. Распишем приращение функции f в точке M по формуле Тейлора с остаточным членом в форме Лагранжа 1 f (M1 ) − f (M ) = df (M ) + d2 f (M + θ(M1 − M )), 2 1 1 1 0 где r nM1 имеет координаты (x1 , . . . , xn ), dxi = ∆xi = xi −xi (i ∈ {1, . . . , n}), ρ = P 1 (xi − x0i )2 . По условию df (M ) = 0, значит, формулу можно перепиi=1 сать следующим образом: f (M1 ) − f (M ) = n 1 X 00 f (M + θ(M1 − M ))∆xi ∆xj . 2 i,j=1 xi xj Поскольку все fx00i xj непрерывны в точке M , то при всех i, j ∈ {1, . . . , n} выполняется fx00i xj (M + θ(M1 − M )) −→ fx00i xj (M ). ρ→0 Поэтому fx00i xj (M + θ(M1 − M )) = fx00i xj (M ) + αij (∆x1 , . . . , ∆xn ), где αij −→ 0. Таким образом, ρ→0 n 1 X 00 f (M1 ) − f (M ) = fxi xj (M )∆xi ∆xj + α(ρ)ρ2 , 2 i,j=1 где n 1X ∆xi ∆xj α(ρ) = αij (∆x1 , . . . , ∆xn ) · −→ 0. 2 i,j=1 ρ ρ ρ→0 Обозначим hi = ∆x , (i ∈ {1, . . . , n}). Тогда для M1 6= M ρ n 1 2 X 00 f (M1 ) − f (M ) = ρ fxi xj (M )hi hj + α(ρ)ρ2 = 2 i,j=1 = ρ2 (Φ(h1 , . . . , hn ) + α(ρ)), где n 1X Φ(h1 , . . . , hn ) = aij hi hj , 2 i,j=1 aij = fx00i xj (M ). Очевидно, что n X h2i = 1, т.е. функция Φ(h1 , . . . , hn ) определена в точках i=1 n-мерной сферы единичного радиуса. I. Рассмотрим сначала случай положительно определенной квадратичной формы d2 f (M ). В этом случае функция Φ(h1 , . . . , hn ), определенная на единичной сфере, принимает только положительные значения. Кроме того, очевидно, что Φ(h1 , . . . , hn ) непрерывна, а область ее определения – ограниченное замкнутое множество. Следовательно, по второй теореме Вейерштрасса Φ(h1 , . . . , hn ) достигает своего инфимума, т.е. inf Φ(h1 , . . . , hn ) = Φ(h01 , . . . , h0n ) = µ > 0. Так как функция α(ρ) является бесконечно малой, то для достаточно малых ρ выполняется |α(ρ)| < µ. Поэтому для таких ρ f (M1 ) − f (M ) = ρ2 (Φ(h1 , . . . , hn ) + α(ρ)) ≥ ρ2 (µ + α(ρ)) ≥ 0, т.е. точка M является точкой локального минимума. II. В случае отрицательно определенной квадратичной формы d2 f (M ) аналогично доказывается, что точка M – точка локального максимума. III. Пусть d2 f (M ) – знакопеременная квадратичная форма, т.е. существуют два набора (t01 , . . . , t0n ) и (t001 , . . . , t00n ) значений для dx1 , . . . , dxn таких, что в точках первого набора d2 f (M ) принимает положительное значение, а в точках второго набора – отрицательное значение. Это эквивалентно тому, что Φ(h01 , . . . , h0n ) > 0 и Φ(h001 , . . . , h00n ) < 0, где h0i = s t0i , n X (t0i )2 h00i = s i=1 t00i n X (t00i )2 (i ∈ {1, . . . , n}). i=1 Рассмотрим переменные точки M 0 с координатами x0i = x0i + ρh0i и M 00 с координатами x00i = x0i + ρh00i , где ρ > 0 и i ∈ {1, . . . , n}. Легко посчитать, что ρ(M 0 , M ) = ρ(M 00 , M ) = ρ. Кроме того, для приращения функции f (x1 , . . . , xn ) в точке M справедливы формулы f (M 0 ) − f (M ) = ρ2 (Φ(h01 , . . . , h0n ) + α0 (ρ)), f (M 00 ) − f (M ) = ρ2 (Φ(h001 , . . . , h00n ) + α00 (ρ)), где α0 (ρ)) и α00 (ρ)) – бесконечно малые при ρ → 0. Поэтому для достаточно маленьких ρ выполняется |α0 (ρ)| < Φ(h01 , . . . , h0n ), |α00 (ρ)| < Φ(h001 , . . . , h00n ). Итак, для сколь угодно малого ρ найдутся такие точки M 0 и M 00 , что ρ(M 0 , M ) = ρ(M 00 , M ) = ρ, f (M 0 ) > f (M ), f (M 00 ) < f (M ), т.е. точка M не является точкой локального экстремума. Теорема доказана. ¤ Для функций двух переменных f (x, y) достаточные условия экстремума могут быть сформулированы более удобно для проверки. Теорема 7.3. Пусть функция f (x, y) дважды дифференцируема в некоторой окрестности точки M и дважды непрерывно дифференцируема в самой точке M, которая является стационарной. Тогда, если 00 00 (M ), C = fy002 (M ), то AC − B 2 > 0, где A = fx002 (M ), B = fxy (M ) = fyx M является точкой локального экстремума (локального максимума при A < 0 и локального минимума при A > 0. Если AC − B 2 < 0, то M не является точкой локального экстремума. Замечание 7.1. В случае AC − B 2 = 0 для исследования на экстремум нужно привлекать дифференциалы более высокого порядка. Доказательство теоремы. Для функции двух переменных f (x, y) ее приращение в точке M можно записать более конкретно, чем в теореме 7.2: 1 f (M1 ) − f (M ) = (A(∆x)2 + 2B∆x∆y + C(∆y)2 ) + α(ρ)ρ2 , 2 p где точка M1 имеет координаты (x0 + ∆x, y0 + ∆y), ρ = (∆x)2 + (∆y)2 . ∆x ∆y Обозначим h1 = , h2 = , ρ ρ 1 Φ(h1 , h2 ) = (Ah21 + 2Bh1 h2 + Ch22 ). 2 Тогда для M1 6= M f (M1 ) − f (M ) = ρ2 (Φ(h1 , h2 ) + α(ρ)), где α(ρ) → 0 при ρ → 0. I. Рассмотрим случай AC − B 2 > 0, A > 0. В этом случае 1 (A2 h21 + 2ABh1 h2 + ACh22 ) = 2A 1 = ((Ah1 + Bh2 )2 + ACh22 − B 2 h22 ) = 2A 1 = ((Ah1 + Bh2 )2 + (AC − B 2 )h22 ). 2A Φ(h1 , h2 ) = (7.1) (0.1) Поскольку h1 и h2 не могут одновременно обратиться в ноль, то Φ(h1 , h2 ) принимает только положительные значения. Дальше рассуждения такие же, как в доказательстве теоремы 7.2. II. В случае AC − B 2 > 0, A < 0 формула 7.1) показывает, что функция Φ(h1 , h2 ) принимает только отрицательные значения, и мы приходим к случаю II доказательства теоремы 7.2. III. Пусть AC − B 2 < 0. а) Если A 6= 0, то, полагая в ( 7.1) h01 = 1, h02 = 0, получим Φ(h01 , h02 ) = A B A , а полагая h001 = √ , h002 = − √ , получим Φ(h001 , h002 ) = 2 A2 + B 2 A2 + B 2 1 (AC − B 2 )(h002 )2 . Так как AC − B 2 < 0, то Φ(h01 , h02 ) и Φ(h001 , h002 ) имеют 2A противоположные знаки, т.е. Φ(h1 , h2 ) является знакопеременной квадратичной формой. Доказательство завершает ссылка на соответствующий случай теоремы 7.2. б) Если A = 0, а C 6= 0, то можно повторить рассуждения случая а), поменяв ролями переменные x и y. в) Если A = C = 0, то B 6= 0, поскольку AC − B 2 < 0. В этом случае Φ(h1 , h2 ) = Bh1 h2 – тоже знакопеременная квадратичная форма. Пример 7.1. f (x, y) = x2 + y 2 . Единственная точка возможного экстремума – стационарная точка (0, 0). В ней A = 2 > 0, AC − B 2 = 4 > 0. Следовательно, точка (0, 0) – точка локального минимума. Пример 7.2. f (x, y) = x2 − y 2 . Точка (0, 0) тоже является единственной точкой возможного экстремума. Но AC − B 2 = −4 < 0, поэтому у функции нет локальных экстремумов. Пример 7.3. f (x, y) = x3 + 3xy 2 − 39x − 36y + 26. Найдем частные производные первого порядка fx0 = 3x2 + 3y 2 − 39, fy0 = 6xy − 36. Составляем систему уравнений для нахождения стационарных точек ½ 2 x + y 2 = 13 xy = 6. Выражая y из второго уравнения и подставляя в первое, получим биквадратное уравнение x4 − 13x2 + 36 = 0 или (x2 − 4)(x2 − 9) = 0. Таким образом, стационарными являются четыре точки (3, 2), (−3, −2), (2, 3), (−2, −3). Вычисляем частные производные второго порядка fx002 = 6x, 00 00 = 6y, = fyx fxy fy002 = 6x. Для точки (3, 2) A = 18 > 0, AC − B 2 = 182 − 122 > 0. Следовательно, в этой точке функция имеет локальный минимум f (3, 2) = −100. Для точки (−3, −2) A = −18 < 0, AC − B 2 = 182 − 122 > 0. Следовательно, в этой точке функция имеет локальный максимум f (−3, −2) = 152. Для точек (2, 3), (−2, −3) AC − B 2 = 122 − 182 < 0. Следовательно, в этих точках локального экстремума нет. 7.2. Условные экстремумы Часто на практике приходится искать экстремумы функции нескольких переменных при условии, что переменные как-то связаны между собой. А именно, помимо функции f (x1 , . . . , xn ), определенной на открытом множестве D, рассмотрим еще функции F1 (x1 , . . . , xn ), . . . , Fm (x1 , . . . , xn ) (m < n) с той же областью определения D. Обозначим E – множество решений системы F1 = 0 ....... (7.2) (0.2) Fm = 0. Будем говорить, что функция f имеет условный экстремум (условный максимум или условный минимум) в точке M ∈ D относительно уравнений связи (7.2), если значение f (M ) является экстремальным (наибольшим или наименьшим) среди всех значений, принимаемых функцией f на пересечении множества E с некоторой окрестностью точки M. Для нахождения точек условного экстремума иногда возможен следующий достаточно простой способ: решаем систему (7.2) относительно x1 , . . . , x m x1 = g1 (xm+1 , . . . , xn ), ....................... xm = gm (xm+1 , . . . , xn ), затем подставляем найденные значения в функцию f и исследуем полученную функцию n − m переменных f (g1 (xm+1 , . . . , xn ), . . . , gm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) на обычный локальный экстремум. Если точка (x0m+1 , . . . , x0n ) является точкой локального экстремума такой сложной функции, то точка (x01 , . . . , x0n ), где x01 = g1 (x0m+1 , . . . , x0n ), . . . , x0m = gm (x0m+1 , . . . , x0n ), является точкой условного экстремума функции f относительно уравнений связи (7.2). Пример 7.4. f (x, y) = x2 +y 2 , F (x, y) = x+y−1 (т.е. уравнение связи x+y−1 = 0). Выражаем y через x из уравнения связи и подставляем в f : 1 f (x, y(x)) = 2x2 −2x+1. Для этой функции точка x0 = является точкой 2µ ¶ 1 1 локального минимума. Следовательно, точка (x0 , y0 ) = , является 2 2 точкой условного минимума функции f (x, y) = x2 + y 2 относительно уравнения связи x + y = 1. Однако такой простой способ не всегда возможен, поскольку систему (7.2) не всегда удается разрешить. В этом случае можно воспользоваться методом неопределенных множителей (методом Лагранжа), который применяется для дважды дифференцируемых функций f, F1 , . . . , Fm и состоит в следующем (теоретическое обоснование метода из-за сложности опустим). Рассмотрим новую функцию n + m переменных Φ(x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) + +λ1 F1 (x1 , . . . , xn ) + . . . + λm Fm (x1 , . . . , xn ), которую называют функцией Лагранжа. I. На первом этапе находим точки возможного условного экстремума. Для этого нужно найти стационарные точки функции Φ, т.е. решить систему 0 0 fx1 + λ1 (F1 )0x1 + . . . + λm (Fm )0x1 = 0 Φx1 = 0 .................................... ........ 0 0 fxn + λ1 (F1 )0xn + . . . + λm (Fm )0xn = 0 Φxn = 0 или Φ0λ1 = 0 F1 = 0 ........ .................................... 0 Φ λm = 0 Fm = 0. Если (x01 , . . . , x0n , λ01 , . . . , λ0m ) – стационарная точка функции Φ, то (x01 , . . . , x0n ) – точка возможного условного экстремума функции f. II. На втором этапе для каждой точки (x01 , . . . , x0n ), найденной на первом этапе, рассматриваем свою функцию g(x1 , . . . , xn ) = Φ(x1 , . . . , xn , λ01 , . . . , λ0m ). Вычисляем d2 g(x01 , . . . , x0n ). Кроме того, дифференцируя уравнения связи в точке (x01 , . . . , x0n ), получаем систему верных равенств (F1 )0x1 dx1 + . . . + (F1 )0xn dxn = 0 ................................. (Fm )0x1 dx1 + . . . + (Fm )0xn dxn = 0. Если ранг матрицы Якоби для функций F1 , . . . , Fm в точке (x01 , . . . , x0n ) равен m, то из этой системы можно выразить некоторые m дифференциалов переменных x1 , . . . , xn через остальные дифференциалы. Подставим найденные значения в d2 g(x01 , . . . , x0n ). Получится некоторая квадратичная форма относительно (n − m) переменных. Если эта квадратичная форма положительно определенная, то в точке (x01 , . . . , x0n ) условный минимум, отрицательно определенная – условный максимум, знакопеременная – нет условного экстремума. Пример 7.5. f (x, y) = x2 − y 2 , F (x, y) = x + y − 1. Составляем функцию Φ(x, y, λ) = x2 − y 2 + λ(x + y − 1). Система для нахождения точек возможного условного экстремума 2x + λ = 0 −2y + λ = 0 x + y = 1. Вычитая из первого уравнения второе, получаем x + y = 0, что противоречит третьему уравнению. Следовательно, система несовместна, и функция не имеет условных экстремумов. Пример 7.6. f (x, y) = xy, F (x, y) = x + y − 1. Составляем функцию Φ(x, y, λ) = xy + λ(x + y − 1). Система для нахождения точек возможного условного экстремума y+λ=0 x+λ=0 x + y = 1. 1 Решением этой системы является единственный набор x0 = , y0 = 2 1 1 1 , λ0 = − . Рассматриваем функцию g(x, y) = Φ(x, y, λ0 ) = xy− (x+y− 2 2 ¶ ¶ ¶ µ µ µ µ 2¶ 1 1 1 1 1 1 1 1 00 00 1). Для нее gx002 , = 0, gxy , = gyx , = 1, gy002 , = 0. 2 2µ 2 2 2 2 2 2 ¶ 1 1 Следовательно, d2 g , = 2dxdy. Из уравнения связи находим зави2 2 симость между dx и dy : dx + dy = 0. Подставляя значение dy = −dx в µ ¶ 1 1 d2 g , , получаем отрицательно определенную квадратичную форму 2 2 µ ¶ 1 1 2 −2(dx) . Следовательно, точка , – это точка условного максимума 2 2 функции f (x, y) = xy относительно уравнения связи x + y = 1. Пример 7.7. На двух предприятиях отрасли необходимо изготовить 180 экземпляров некоторой продукции. Затраты, связанные с производством x изделий на I предприятии, равны 4x + x2 тысяч руб., а затраты, обусловленные изготовлением y изделий на II предприятии, составляют 8y + y 2 тысяч руб. Требуется определить, сколько изделий на каждом из предприятий следует произвести, чтобы общие затраты были минимальными. Решение. Математическая постановка задачи состоит в определении минимального значения функции f (x, y) = 4x + x2 + 8y + y 2 при условии x + y = 180 (и, конечно, x ≥ 0, y ≥ 0). Составим функцию Лагранжа Φ(x, y, λ) = 4x + x2 + 8y + y 2 + λ(x + y − 180). Приравняем нулю частные производные функции Φ 4 + 2x + λ = 0 8 + 2y + λ = 0 x + y = 180. Решением этой системы является набор x0 = 91, y0 = 89, λ0 = −186. Этот набор удовлетворяет условию x0 ≥ 0, y0 ≥ 0. Для функции g(x, y) = 4x+x2 +8y +y 2 −186(x+y −180) дифференциал второго порядка в точке (x0 , y0 ) равен d2 g(x0 , y0 ) = 2dx2 + 2dy 2 . Квадратичная форма положительно определенная, поэтому нет необходимости находить зависимость между dx и dy из уравнения связи. Итак, точка (91, 89) – точка условного минимума. Ответ. Оптимальный способ размещения заказа – 91 изделие на I предприятии и 89 – на II предприятии. При этом затраты будут минимальными и составят 17 278 000 руб. 7.3. Наибольшие и наименьшие значения функции До сих пор мы предполагали, что область определения рассматриваемой функции является открытым множеством. Для случая замкнутого ограниченного множества D и непрерывной функции f (x1 , . . . , xn ) благодаря теореме Вейерштрасса можно поставить вопрос о нахождении наибольшего и наименьшего значений функции. Если точка, в которой принимается одно из этих значений, является внутренней, то, очевидно, в этой точке функция имеет локальный экстремум. Но своего наибольшего (наименьшего) значения функция может достигать и на границе множества D. Таким образом, чтобы найти наибольшее (наименьшее) значение функции f (x1 , . . . , xn ) на множестве D, можно найти все внутренние стационарные точки, точки недифференцируемости функции f, вычислить значения функции в них и сравнить их между собой и со значениями функции f в граничных точках множества D : наибольшее (наименьшее) из всех этих значений и будет наибольшим (наименьшим) значением функции f на всем множестве D. Пример 7.8. Требуется найти наибольшее и наименьшее значения функции f (x, y) = x2 y на множестве точек (x, y), удовлетворяющих неравенству x2 + y 2 ≤ 1. Найдем сначала стационарные точки в открытом круге x2 + y 2 < 1 ½ 0 fx = 2xy = 0 fy0 = x2 = 0. Решением системы являются все точки открытого круга, у которых x = 0. Значения функции f в этих точках равны 0. Для нахождения экстремальных точек на границе круга можно исследовать функцию f на условный экстремум относительно уравнения связи x2 +y 2 = 1. Выразим из этого уравнения x2 = 1 − y 2 и подставим в f (x, y), получим функцию r 1 3 h(y) = y − y . Функция h(y) имеет две экстремальные точки y1 = − 3 r 1 и y2 = . Из уравнения x2 = 1 − y 2 найдем соответствующие значения 3 x. Вычислим значения функции f (x, y) в полученных четырех точках и сравним их со значениями функции f в точках ее возможного экстремума внутри круга x2 + y 2 = 1. Так как в нашем примере эти значения равны 0, то наибольшее значение функции f (x, y) на указанном множе2 2 стве равно √ , наименьшее равно − √ . 3 3 3 3