ГЛАВА 4. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 4.1. Основные понятия Реальные явления и процессы, как правило, зависят от нескольких переменных. Поэтому необходимо расширить известное понятие функциональной зависимости на случаи двух и большего числа переменных путём обобщения соответствующих определений и понятий для функции одной переменной. О п р е д е л е н и е 1. Пусть даны три переменные величины x, y, z. Если каждой упорядоченной паре (x, y) D по определённому правилу или закону f ставится в соответствие единственное значение переменной z, то говорят, что на множестве D задана функция f и пишут z = f (x, y). При этом x и y называются независимыми переменными (аргументами), z – зависимой переменной или значением функции f в точке (x, y); D называется областью определения функции. Ставя в соответствие каждой точке M (x, y) D аппликату z = f (x, y), мы получим множество точек (x, y, z = f (M)) трёхмерного пространства, изображаемое некоторой поверхностью. Поэтому равенство z = f (x, y) называют также уравнением поверхности, которая и является графиком функции двух переменных. Областью определения D функции двух переменных может быть вся плоскость Oxy или её часть. В последнем случае линию, ограничивающую область, называют границей области. Точки области, не лежащие на границе, называются внутренними. Область, состоящая только из своих внутренних точек, называется открытой или незамкнутой, а с присоединённой к ней границей называется замкнутой. Область D называется ограниченной, если существует круг конечного радиуса, внутри которого она расположена. В противном случае область D содержит бесконечно удалённую точку и называется неограниченной. О п р е д е л е н и е 2. Окрестностью точки M0 (x0, y0) радиуса δ называется множество точек M (x, y), для которых расстояние ρ (M0, M) до точки M0 (x0, y0) меньше δ: ρ (M0, M) = ( x x0 ) 2 ( y y 0 ) 2 δ . (4.1) Геометрически окрестность точки изображается внутренностью круга радиуса δ с центром в точке M0. О п р е д е л е н и е 3. Пусть функция z = f (x, y) определена в некоторой окрестности точки M0 (x0, y0), кроме, быть может, самой точки. Говорят, что число l есть предел функции при стремлении точки M (x, y) к точке M0 (x0, y0) по любому пути и пишут 73 lim f ( x, y ) l или lim f ( M ) l , x x 0 y y 0 M M 0 (4.2) если ε > 0 δ = δ(ε) > 0 такое, что из неравенства ρ (M0, M) < δ следует неравенство | f (x, y) – l | < ε. О п р е д е л е н и е 4. Функция z = f (x, y) называется бесконечно малой при M (x, y) M0 (x0, y0), если lim f (M) = 0, и называется бесконечно большой, если lim f (M) = ∞. О п р е д е л е н и е 5. Пусть функция z = f (x, y) определена в некоторой окрестности точки M0 (x0, y0) и в самой точке, и пусть M (x, y) – произвольная точка этой окрестности. Функция z = f (x, y) называется непрерывной в точке M0 (x0, y0), если бесконечно малым приращениям аргументов Δx = x – x0 и Δy = y – y0 соответствует бесконечно малое приращение Δz = f (M) – f (M0) функции: (4.3) lim z 0 . x0 y0 Если равенство (4.3) выполняется в каждой точке области D, то говорят, что функция непрерывна в области D. С помощью основных понятий предела в точке и непрерывности функции в точке и области доказываются основные теоремы о пределах функций двух переменных и формулируются свойства неперерывных в области D функций, аналогичные указанным в п.2.8 и п.2.11. Понятие функции трёх переменных, а также определения предела и непрерывности для неё вводятся аналогичным образом. В более общем случае упорядоченный набор n переменных величин (x1, x2, …, xn) называется точкой в n-мерном пространстве. Если при этом каждому набору (x1, x2, …, xn) из некоторого множества X по определённому правилу или закону f ставится в соответствие единственное значение переменной величины z, то говорят, что на множестве X задана функция n переменных и пишут z = f (x1, x2, …, xn). В случае числа переменных n > 3 основные понятия вводятся формально и аналогично случаю двух переменных. В дальнейшем основные факты теории будем излагать для функции двух переменных и, при необходимости, формулировать их для функций n переменных. 4.2. Частные производные и полный дифференциал функции двух переменных Пусть в области D задана непрерывная функция z = f (x, y). Так как x и y являются независимыми переменными, то одну из них можно изменять, сохраняя постоянное значение другой. Пусть сначала y сохраняет постоянное значение, а переменная x получает приращение Δx. 74 В этом случае функция z = f (x, y) получит приращение Δx z = f (x + Δx, y) – f (x, y) , (4.4) которое называется частным приращением по переменной x и является, по существу, функцией одной переменной Δx. О п р е д е л е н и е 1. Если существует конечный предел z f ( x x, y ) f ( x, y ) lim x lim , (4.5) x 0 x x 0 x то он называется частной производной функции z = f (x, y) по переменf z ной x и обозначается одним из символов z x , , f x , . x x Аналогично при постоянном значении x определяется частное приращение по переменной y: Δy z = f (x, y + Δy) – f (x, y) . (4.6) О п р е д е л е н и е 2. Если существует конечный предел yz f ( x, y y ) f ( x, y ) lim lim , (4.7) y 0 y y 0 y то он называется частной производной по переменной y и обозначается f z одним из символов z y , , f y , . y y Производную функции одной переменной y f (x) после введения частных производных принято называть обыкновенной производной. Частные производные находят по тем же формулам и правилам, по которым находятся обыкновенные производные, так как при нахождении частной производной z x ( x, y) величина y считается постоянной, а при вычислении частной производной zy ( x, y) постоянной считается величина x. Если величины x и y одновременно получают независимые приращения Δx и Δy, то функция z = f (x, y) получает полное приращение по обеим переменным, которое при наличии непрерывных частных производных выражается следующей формулой полного приращения: z f ( x x, y y ) f ( x, y ) z x x z y y 1 x 2 y , (4.8) где 1 (x, y) , 2 (x, y) – бесконечно малые функции, для которых lim ε1 = lim ε2 = 0 при Δx 0, Δy 0. В формуле (4.8) сумма двух первых слагаемых zx x zy y является линейной, т. е. 1-й степени, функцией относительно Δx и Δy. При |Δx| < 1 и |Δy| < 1 она представляет собой главную часть полного приращения по сравнению с нелинейной частью 1 x 2 y . 75 О п р е д е л е н и е 3. Главная линейная часть полного приращения функции z = f (x, y) называется её полным дифференциалом и обозначается символом dz: z z (4.9) dz dx dy , x y где приняты обозначения dx = Δx, dy = Δy. При малых значениях |Δx| < 1 и |Δy| < 1 неизвестное полное приращение Δz функции z = f (x, y) обычно приближённо заменяют её полным дифференциалом, т. е. пользуются приближённым равенством z z z f ( x x, y y ) f ( x, y ) dz dx y . (4.10) x y Частные приращения, частные производные, полное приращение и полный дифференциал функции трёх и более переменных определяют и обозначают аналогичным образом. 4.3. Производная по направлению и градиент Понятие частных производных по x и по y можно обобщить на случай любого направления изменения функции. Пусть функция z = f (x, y) определена в точке M (x, y) и в некоторой её окрестности. Проведём из точки M (x, y) вектор l l x i l y j , на котором возьмём вторую точку M1 (x + Δx, y + Δy) (рис. 54). При переходе из точки M (x, y) в точку M1 (x + Δx, y + Δy) вдоль вектора l функция получит полное приращение l z f (M1 ) f (M ) f ( x x, y y) f ( x, y) . О п р е д е л е н и е. Предел вида l z f ( x x, y y) f ( x, y) lim lim M 1 M | M M 1 | x0 (x) 2 (y) 2 (4.11) (4.12) y0 при стремлении M1 M вдоль вектора l называется производной по z направлению и обозначается символом . l Производная по направлению имеет физический смысл скорости изменения функции z = f (x, y) в направлении вектора l , в то время как частные производные z x ( x, y) и zy ( x, y) имеют физический смысл скорости изменения функции в направлениях координатных осей Ox и Oy соответственно. 76 Обозначим углы вектора l с осями координат Ox и Oy соответственно α и β. Тогда, l y y после перехода в равенстве (4.12) к пределу с y y M помощью формулы (4.8) полного приращения x функции z = f (x, y), получим формулу произx x x x водной по направлению в точке M (x, y) вида 0 Рис. 54 z z x ( x, y ) cos z y ( x, y ) cos . (4.13) l Правую часть формулы (4.13) можно записать иначе в виде скалярного произведения двух векторов. Для этого введём: единичный y M1 вектор l 1 l ly l l l1 x i j cos i cos j |l | |l | |l | и второй вектор grad z z x ( x, y ) i z y ( x, y ) j , (4.14) (4.15) который называется градиентом функции z = f (x, y). Используя определение скалярного произведения двух векторов, данное формулой (1.61), и определение единичного вектора, формулу (4.13) можно записать теперь в следующей форме: z grad z l 1 | grad z | | l 1 | cos | grad z | cos , (4.16) l grad z где φ – угол между векторами l и grad z (рис. 55). Если l M l1 угол φ = 0, т. е. направление векторов l и grad z совпадает, то cos φ = cos 0 = 1. Производная по направлению в этом случае принимает наибольшее значение, равное модулю (длине) вектора grad z: Рис. 55 z | grad z | ( z x ) 2 ( z y ) 2 . (4.17) l grad z Из формул (4.16) и (4.17) теперь следует, что градиент функции есть вектор, в направлении которого скорость изменения функции z = f (x, y) в точке M (x, y) имеет наибольшее значение. 4.4. Частные производные высших порядков Пусть функция z = f (x, y) имеет непрерывные частные производные zx и zy . Будем называть их частными производными первого порядка и рассматривать как новые функции независимых переменных x и y. Тогда каждая из них будет иметь две частные производные, которые 77 называются частными производными второго порядка. Они определяются следующими равенствами: z 2 z z 2 z ( zx )y zxy , 2 ( z x )x z x 2 , y x x y x x x z 2 z z 2 z ( zy )x zyx ( zy )y zy 2 . , x y y x y y y 2 Среди этих четырёх частных производных второго порядка две z xy и z yx называются смешанными частными производными второго порядка. Для них доказана следующая теорема. Т е о р е м а. Если смешанные частные производные второго по и z yx непрерывны в точке M (x, y), то они равны между собой: рядка z xy z xy z yx . (4.18) Рассматривая частные производные второго порядка как новые функции независимых переменных x и y, найдём аналогично частные производные третьего порядка. С помощью указанной теоремы доказывается, что смешанные частные производные третьего порядка, т. е. найденные по обеим переменным в различной последовательности, вновь равны между собой. В результате из восьми частных производных третьего порядка различными оказываются следующие четыре: 3 z 3 z 3) ( 3) ( 3) z x(32) y z (yx , z 2 z xyx , 3 x x 2 y x3 3 z 3 z ( 3) ( 3) z (y3)3 , z (y3)2 x z xy 2 z yxy . 3 y y 2 x Частные производные любого n-го порядка находятся аналогично и обозначаются символами n z z x(n) y , где α + β = n. (4.19) x y Частные производные при n 2 называются частными производными высших порядков. Аналогично можно определить также частные прозводные функций трёх и более независимых переменных. x zx zy 0 . П р и м е р. Дано: z e y . Доказать, что F y zxy Р е ш е н и е. По определению частной производной находим zx , считая y фиксированной постоянной величиной, тогда zx x z 1 1 (e y ) e y ( x) e y . x x y x y x x 78 Аналогично находим частную производную zy , считая x фиксированной постоянной величиной: x x z x x 1 z y (e y ) y e y x 2 e y . y y y y Находим смешанную частную производную 2-го порядка, используя правило дифференцирования произведения двух функций: x x x z 1 y 1 y 1 y z xy e e (e ) y y x y y y y y x x x x 1 1 x 1 x 2 ey ey 2 2 ey 3 ey . y y y y y Находим согласно условию функцию F: x x x x 1 x 1 x z x z y e y 2 e y e y 2 e y 0 , F y z xy y y y y что и требовалось доказать. 4.5. Экстремум функции двух переменных Пусть функция z = f (x, y) определена и непрерывна в точке M0 (x0, y0) D и в некоторой её окрестности. О п р е д е л е н и е. Точка M0 (x0, y0) называется точкой максимума функции z = f (x, y), если для каждой точки M (x, y), отличной от точки M0 (x0, y0), в указанной окрестности выполняется неравенство f (x, y) < f (x0, y0). Если же выполняется неравенство f (x, y) > f (x0, y0), то M0 (x0, y0) называется точкой минимума. Значение функции z0 = f (x0, y0) в точке максимума (или минимума) называется максимумом (минимумом) функции z = f (x, y). Максимум и минимум функции называют её экстремумом. В силу определения точка экстремума лежит всегда внутри области определения функции D. Максимум и минимум носят локальный (местный) характер, так как значение f (x0, y0) сравнивается со значениями f (x, y) лишь в некоторой сколь угодно малой окрестности точки M0 (x0, y0). В области определения D функция может иметь несколько экстремумов или может не иметь ни одного. Выясним необходимые условия существования экстремума функции. Предположим для этого, что в точке M0 (x0, y0) экстремум есть. Тогда он будет достигаться и по каждой переменной x и y в отдельности. 79 Будем считать, что функция z = f (x, y) непрерывна и имеет в точке M0 (x0, y0) и в её окрестности непрерывные частные производные. Тогда, согласно необходимому условию экстремума функции одной переменной, в точке M0 (x0, y0) должны быть равными нулю обе частные производные: z x ( x, y) 0 , zy ( x, y) 0 , (4.20) образующие систему двух уравнений с двумя неизвестными x и y. Точки, в которых выполнены необходимые условия экстремума (4.20), называются стационарными. Из равенства нулю частных производных в стационарной точке вытекает, что в ней равен нулю градиент функции, а также производная по любому направлению. Геометрически это означает, что в стационарной точке касательная плоскость к поверхности z = f (x, y) параллельна плоскости Oxy и имеет уравнение z = f (x0, y0). Для выяснения характера экстремума в стационарной точке, или его отсутствия, необходимо использовать достаточные условия. Т е о р е м а. (Достаточные условия экстремума). Пусть в стационарной точке M0 (x0, y0) и в некоторой её окрестности функция z = f (x, y) имеет непрерывные частные производные 2-го порядка. Вычислим в точке M0 (x0, y0) следующие значения: ( x0 , y0 ) , C f y2 ( x0 , y0 ) , Δ = AC – B2. (4.21) A f x2 ( x0 , y0 ) , B f xy Тогда: 1) Если Δ > 0, то в точке M0 (x0, y0) экстремум есть. При этом, если A > 0, то в точке M0 находится минимум; если A < 0, то в точке M0 находится максимум. 2) Если Δ < 0, то в точке M0 (x0, y0) экстремума нет. 3) Если Δ = 0, то этот случай называется сомнительным и необходимы дополнительные исследования. Исследование функции двух переменных на экстремум следует проводить по следующей схеме: 1. Найти частные производные z x ( x, y) , zy ( x, y) . 2. Используя необходимые условия экстремума, решить систему уравнений (4.20) и указать стационарные точки. 3. Найти частные производные 2-го порядка, вычислить их значения в каждой стационарной точке и с помощью теоремы о достаточных условиях сделать вывод о наличии экстремума в каждой из них. 4. Найти все экстремумы функции. З а м е ч а н и е. Основная трудность при исследовании на экстремум состоит в решении системы (4.20). По этой причине многие практические задачи указанным методом решить не удаётся. 80 4.6. Наибольшее и наименьшее значения функции двух переменных Пусть замкнутая ограниченная область D задаётся на плоскости Oxy системой неравенств: D: { a x b , y1 ( x) y y2 ( x) }, (4.22) где y = y1 (x) – уравнение нижней границы, а y = y2 (x) – уравнение верхней границы области D (рис. 56). Для нахождения наибольшего и наименьшего значений, которые достигаются y y y 2 ( x) функцией в точках, расположенных внутри области D, или в точках, лежащих на границе обB D A ласти, надо: 1. Из условий (4.20) найти все стационарy y1 ( x) ные точки функции z = f (x, y) , принадлежащие x 0 a b открытой области D, и вычислить в них значеРис. 56 ния функции. 2. Используя уравнения границ области D, ввести две функции одной переменной x: z = f1 (x, y1 (x)) и z = f2 (x, y2 (x)), a x b . (4.23) Из условий f1( x) 0 и f 2( x) 0 найти стационарные точки, принадлежащие интервалу (a, b), в которых затем вычислить соответствующие значения функций z = f1 (x) и z = f2 (x). 3. Найти два значения z = f (A) и z = f (B) в точках A и B, разделяющих границу области D на нижнюю и верхнюю части (рис. 56). 4. Из вычисленных значений функции z = f (x, y) во внутренних и граничных точках области D выбрать наибольшее M и наименьшее m. . . 4.7. Условный экстремум функции двух переменных. Метод множителей Лагранжа Пусть требуется найти экстремум функции z = f (x, y) лишь в точках линии g (x, y) = 0, расположенной в D (рис. 57). Уравнение g (x, y) = 0 называется уравнением связи переменных y grad f ( x0 , y0 ) x и y, а экстремум функции z = f (x, y) в M0 точках линии называется условным эксg ( x, y) 0 тремумом. Точка M0 (x0, y0) линии назыgrad g ( x0 , y0 ) вается точкой условного экстремума, если D для всех точек из её окрестности, удовлетx 0 воряющих уравнению связи g (x, y) = 0, выРис. 57 полняется одно из неравенств f (x, y) < f (x0, y0) или f (x, y) > f (x0, y0). (4.24) . 81 В тех случаях, когда уравнение связи g (x, y) = 0 удаётся разрешить относительно одной из переменных, например, выразить из него y через x в форме y = φ(x), тогда, подставив полученное выражение в функцию двух переменных, получим функцию одной переменной: z = f (x, y) = f (x, φ(x)). (4.25) Её экстремум и будет условным экстремумом функции z = f (x, y). В более сложных случаях сделать это не удаётся. Для отыскания условного экстремума в общем случае используется метод множителей Лагранжа. Для этого вводится функция трёх переменных L (x, y, λ) = f (x, y) + λ g (x, y), (4.26) называемая функцией Лагранжа, где число λ называется множителем Лагранжа. Далее используется следующая теорема. Т е о р е м а. Если точка M0 (x0, y0) есть точка условного экстремума функции z = f (x, y) при дополнительном условии g (x, y) = 0, то существует такое значение λ0, что точка (x0, y0, λ0) является точкой экстремума функции L (x, y, λ). Из теоремы следует, что в точке (x0, y0, λ0) должны выполняться необходимые условия экстремума вида: L ( x, y, ) 0, f x ( x, y ) g x ( x, y ) 0, x Ly ( x, y, ) 0, f y ( x, y ) g y ( x, y ) 0, L ( x, y, ) 0, g ( x, y ) 0. (4.27) Последнее уравнение системы (4.27) совпадает с уравнением связи, а два первых уравнения можно записать в виде одного векторного уравнения grad f ( x, y) grad g ( x, y) , (4.28) т. е. в точке условного экстремума M0 (x0, y0) градиенты функций f (x, y) и g (x, y) коллинеарны с коэффициентом пропорциональности λ и противоположно направлены (рис. 57). Достаточные условия условного экстремума имеют более сложную формулировку. Однако во многих экономических задачах стационарная точка функции Лагранжа оказывается единственной и соответствует наибольшему или наименьшему значению функции z = f (x, y) в точках линии, заданной уравнением связи g (x, y) = 0. Если рассматривается функция нескольких переменных z = f (x1, x2, …, xn), n > 2, то может быть и несколько уравнений связи gi (x1, x2, …, xn) = 0, i = 1, 2, …, k. Соответственно в этом случае будет и несколько множителей Лагранжа λi, i = 1, 2, …, k. 82