Math-Net.Ru Общероссийский математический портал А. В. Дмитрук, А. А. Милютин, Н. П. Осмоловский, Теорема Люстерника и теория экстремума, УМН, 1980, том 35, выпуск 6(216), 11–46 Использование Общероссийского математического портала Math-Net.Ru подразумевает, что вы прочитали и согласны с пользовательским соглашением http://www.mathnet.ru/rus/agreement Параметры загрузки: IP: 193.232.196.123 12 марта 2020 г., 18:37:52 1980 г. ноябрь—декабрь УСПЕХИ МАТЕМАТИЧЕСКИХ т. 35, вып. 6 (216) НАУК ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА А. В. Д м и т р у к , А. А. М и л ю т и н , Н. П. О с м о л о в с к и й СОДЕРЖАНИЕ Введение Г л а в а I. Обобщения теоремы Люстерника, основанные на люстерниковском итерационном процессе, и их применения § 1. Обзор основных обобщений § 2. Типичные приложения § 3. Вариационная схема Г л а в а П. Накрывание относительно конуса для липшицевых операторов . . . § 4. Производная Кларка § 5. Теоремы о накрывании § 6. Множители Лагранжа Литература i\ 14 14 21 27 30 31 34 42 45 Введение Статья посвящена одной из основных теорем аппарата теории экстрему­ ма — теореме Люстерника. Оговоримся сразу, что подчеркивая фундамен­ тальную роль теоремы Люстерника в теории экстремума, мы не понимаем под ней теорему о касательном многообразии к множеству нулей диффе­ ренцируемого оператора, полученную Л. А. Люстерником в 1934 году [1], а имеем в виду некий более общий вариант этой теоремы, родственный ей по методу доказательства. Ниже мы приведем его в двух эквивалентных формах: в форме теоремы о накрывании и в форме теоремы об оценке расстояния, а также напомним формулировку теоремы о касательном многообразии. Начнем с последней [1], [2]. Пусть оператор g, отображающий банахово пространство X в банахово пространство Y, непрерывно дифференцируем по Фреше в точке х0 6 ^г~1(0), и пусть g'(xo)X = Y. Тогда расстояние от произвольной точки х £ #о + + ker g'(xo) до множества ^г~1(0) есть величина более высокого порядка малости, чем || х — Хо ||, откуда вытекает, что касательное многообразие к множеству g'1^) в точке Хо совпадает с х0 + ker gr{x0). Условие ^'(.ro)^ = Y играет в этой теореме основную роль. Будем назы­ вать его условием Люстерника для оператора g в точке хо. Оказывается, что при тех же предположениях относительно g и х0 верно следующее утверждение: существуют константа а > 0 и окрестность U точки Хо такие, что для любого шара Б р(х) cz U имеет место включение g{B9{x)) ZD BaP(g(x)). Это и есть теорема о накрывании. Указанное в ней свойство будем называть а-накрыванием оператора g в окрестности U. Нетрудно убедиться, что свойство я-накрывания для оператора g в окре­ стности точки Хо эквивалентно наличию следующей оценки расстояния: d{x, g^(y))^\\g{x)-y\\ 12 А. В. Д М И Т Р У К , А. А. МИЛЮТИН, H. П. ОСМОЛОВСКИЙ для всех х из некоторой окрестности точки х0 и для всех у из некоторой окрестности нуля в Y. Таким образом, условия теоремы о касательном многообразии оказы­ ваются достаточны и для того, чтобы имела место указанная оценка расстоя­ ния. В этом состоит теорема об оценке расстояния. Именно две приведенные эквивалентные формулировки: теорема о накрывании и теорема об оценке расстояния — являются фундаментальными в теории экстремума. Теорема о касательном многообразии легко следует из теоремы об оценке расстояния, но не равносильна последней. Почему же тем не менее мы называем теорему об оценке расстояния, равно как и теорему о накрываыии, теоремой Люстерника? Дело в том, что Л . А. Люстерник, доказывая свою теорему о касатель­ ном многообразии, предложил некий итерационный процесс, который является решающим звеном доказательства этих двух эквивалентных теорем х ). Более того, любую из известных их модификаций можно доказывать, прибе­ гая к доказательству Л . А. Люстерника. По сути вся история обобщений теоремы Люстерника свелась к тому, что находились новые формулировки под известный процесс доказательства. В этом смысле мы можем сказать, что публикация теоремы Люстерника имела исключительное значение. Как первый вариант теоремы Люстерника, так и более поздние ее фор­ мулировки возникли в основном из потребностей теории экстремума и в дальнейшем использовались как аппарат этой теории 2 ). Этим и объясняется тот угол зрения, под которым мы рассматриваем теорему Люстерника в дан­ ной работе. С усложнением задач, исследуемых в теории экстремума, теорема Люстер­ ника претерпевала значительные изменения по формулировке и к настояще­ му времени различных ее вариантов имеется много. Однако до сих пор в лите­ ратуре отсутствует теорема, из которой все другие следуют. Задача найти общую теорему представляется нам актуальной по двум причинам. Во-пер­ вых, теорему Люстерника приходится часто применять в различных ситуа­ циях, возникающих в теории экстремума, и поэтому удобней вместо многих формулировок иметь одну общую. Во-вторых, самостоятельный интерес пред­ ставляет вопрос о возможных границах метода, предложенного Л. А. Лю­ стерником. В главе I мы предлагаем вариант общей теоремы, охватывающей извест­ ные формулировки теоремы Люстерника. Ее формулировка и доказательство приведены в § 1, причем доказательство основано на том же итерационном процессе, что и у Л . А. Люстерника. Здесь же помещен обзор других извест­ ных модификаций теоремы Люстерника. Далее, в § 2 перечислен ряд типич­ ных применений теорем из § 1. В § 3 мы предлагаем некую абстрактную вариа­ ционную схему, основанную на общей теореме. Остановимся коротко на причинах, обусловивших появление этой схемы. В теории экстремума можно выделить два пути получения необходимых условий, на каждом из которых теорема Люстерника используется в соотг ) Отметим также, что оценка расстояния от точки х, близкой к х0, до нулевого уровня оператора была фактически получена Л. А. Люстерником в его доказательстве теоремы о касательном многообразии, чем, по-видимому, и объясняется тот факт, что эта оценка была известна специалистам задолго до появления в литературе ее форму­ лировки и формальных доказательств. 2 ) Нам представляется, что теорема Люстерника является намного более мощным инструментом исследования в теории экстремума, чем, скажем, теорема Брауэра о непо­ движной точке, а также другие топологические теоремы, применявшиеся в первых рабо­ тах по оптимальному управлению для получения принципа максимума в простейших классах задач. ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 13 ветствующей форме. Первый путь состоит в том, что ищутся аппроксимации д л я функционала и для каждого из ограничений в отдельности, и условия экстремума выводятся как факт взаимоотношения аппроксимаций. Теорема Люстерника применяется здесь в форме теоремы об оценке расстояния (в частности, в форме теоремы о касательном многообразии) для обоснования «доверия» к соответствующей аппроксимации оператора равенства. Например, в задаче f(x) -> min, g(x) = О, где /: X -> К, g: X —>Y непре­ рывно дифференцируемы по Фреше в точке х0 £ £ _1 (0) и g удовлетворяет в этой точке условию Люстерника, первый путь получения правила множи­ телей Лагранжа состоит в следующем. По теореме Люстерника устанавли­ вается, что многообразие х0 + ker g'(x0) касательно к множеству ^ _1 (0) в точке хо, и отсюда выводится, что если х0 — точка экстремума, то функ­ ционал f'(x0) равен нулю на подпространстве ker g'(x0). Из последнего усло­ вия в силу сюръективности оператора g'(x0) вытекает существование у* 6 Y* такого, что f'(x0) + y*g'(tio) = 0 (именно так рассуждал Л . А. Люстерник в [1] и ради этого доказывал свою теорему). Для второго пути получения условий экстремума характерен отказ от рассмотрения аппроксимаций функционала и каждого из ограничений в от­ дельности. Среди методов, составляющих второй путь, выделим один, наибо­ лее интересный с нашей точки зрения. Он состоит в том, что все функционалы и оператор задачи рассматриваются как единая система, к которой приме­ няется соответствующий критерий накрывания х). Назовем его условно методом «совместного накрывания» и проиллюстрируем на уже рассмотрен­ ной задаче, сохранив те же предположения. Метод восходит к Грейвсу и опирается на его теорему [3], представляю­ щую собой ослабленный вариант теоремы о накрывании. Формулировка теоремы Грейвса такова: если непрерывно дифференцируемый по Фреше в точке х0 оператор удовлетворяет в этой точке условию Люстерника, то образ всякой окрестности точки х0 содержит окрестность образа этой точки. Указанное здесь свойство оператора назовем накрыванием в точке. С задачей f(x) -> min, g(x) =0 свяжем оператор Ф(х) = ( / ( # ) , g(x)), отображающий X в 01 X Y. Общий принцип состоит в том, что если х0 — точка локального минимума в этой задаче, то оператор Ф не должен накры­ вать в XQ. Отсюда по теореме Грейвса вытекает, что невыполнение условия Люстерника для оператора Ф в точке х0 есть необходимое условие локально­ го минимума в XQ. Но если Ф'(^о)^ ф R X Y ж g'(x0)X = Y, то существует у* £ У* такой, что f'(xo) + y*g'(xo) = 0. Мы снова приходим к правилу множителей Лагранжа, используя на этот раз теорему о накрывании. Здесь нам хотелось бы подчеркнуть два обстоятельства. Во-первых, как следует из вышесказанного, всякий достаточный критерий накрывания в точке является источником получения необходимых условий экстремума. Во-вторых, если пытаться применить тот же метод в задаче с ограничениями типа равенства и типа неравенства, то нам неминуемо потребуется рас­ сматривать свойство накрывания на конусе, а также иметь соответствующие теоремы о накрывании на конусе. Если сравнить два пути вывода необходимых условий экстремума, то окажется, что на первом пути теория экстремума продвинута гораздо даль­ ше. А именно, там завершена в целом теория условий первого порядка, построена теория условий высших порядков, причем последняя использует теорему Люстерника в полном объеме. Второй же путь сумел освоить лишь ослабленный вариант теоремы Люстерника (критерии для накрывания в точке) и имеет в своем активе, в основном, лишь условия первого порядка, *) Ко второму пути следует отнести также метод, основанный на использовании функции штрафа и принципа Экланда (подробнее об этом см. в § 6). 14 А. В. ДМИТРУК, А. А. МИЛЮТИН, H. П. ОСМОЛОВСКИЙ но зато оказался более подготовленным для использования в случае так называемых конусных классов вариаций. Конусные вариации стали вновь актуальны благодаря работам школь* В. А. Якубовича [13], [14]. К ним, в частности, относятся игольчатые вариа­ ции, с помощью которых был впервые доказан принцип максимума Понтрягина. В случае игольчатых вариаций дополнительными параметрами при варьировании выступают ширины иголок, и поскольку они неотрицательныf то оператор, отвечающий ограничениям равенства, оказывается определен на конусе. В свете вышесказанного представляет интерес распространение первого пути исследования экстремума на случай конусных вариаций. В § 3 мы приводим принципиальную схему такого распространения и надеемся, чта она окажется полезной в оптимальном управлении как для дальнейших продвижений в теории принципа максимума, так и для получения условий высших порядков. Дадим теперь общую характеристику результатов каждой из двух глав, составляющих данную работу. Теорему Люстерника можно обобщать с двух позиций. С одной стороны ясно, что накрывание для производной оператора можно трактовать как некое ослабленное накрывание для самого оператора и обобщать эту линию: от неполного накрывания к полному. Здесь не ищется критерий накрывания, а устанавливается эквивалентность накрывания некоторому формально более слабому свойству, имеющему характер накры­ вания. Именно этот путь анализируется в первой главе. Его удается пройти довольно далеко: отказаться от линейной структуры, метрики и даже топо­ логии пространства X и соответственно от требования гладкости оператора, сохранив за ним лишь некоторые минимальные свойства. Значение полу­ ченных в главе I критериев состоит в том, что они в принципе позволяют по накрыванию для одного класса операторов (например, линейных) судить о накрывании для другого, более широкого класса операторов (например, гладких). Однако причина накрывания для более узкого класса здесь не обсуждается, считается, что оно есть. С другой стороны, можно заниматься обобщением самого критерия накрывания. Этой линии посвящена вторая глава. В ней обобщается двой­ ственная форма условия Люстерника, состоящая в том, что при некотором а > О для любого г/* 6 ^*> II У* II = 1? функционал y*g'(xo)\ X -> 1R а-накрывает (т. е. образ единичного шара содержит а-окрестность нуля). При этом, оставаясь в нормированных пространствах, мы существенно снижаем тре­ бование гладкости, получая критерий накрывания для класса липшицевых операторов. В конце каждой главы мы помещаем общую вариационную схему, свя­ занную с идеями главы. Если вариационная схема первой главы, как уже было сказано, опирается на первый путь исследования экстремума, то вариа­ ционная схема второй главы, представляющая собой правило множителей Лагранжа в задаче с липшицевыми оператором и функционалами, опирается* на метод «совместного накрывания», относящийся ко второму пути. Г Л А[ВА Г ОБОБЩЕНИЯ ТЕОРЕМЫ ЛЮСТЕРНИКА, ОСНОВАННЫЕ НА ЛЮСТЕРНИКОВСКОМ*ИТЕРАЦИОННОМ ПРОЦЕССЕ, И ИХ ПРИМЕНЕНИЯ § 1. Обзор основных обобщений Известные в литературе модификации теоремы Люстерника различаются уже самой трактовкой этой теоремы. Это, по-видимому, и явилось одной из причин, по которой общая теорема до сих пор не была найдена. Здесь мьг 15 ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА даем обзор основных вариантов теоремы Люстерника (ранее существовавших и новых), в результате которого предлагаем трактовать ее как теорему о накрывании. В процессе обобщения расширялся класс пространств и отображений^ для которых применима теорема Люстерника. В настоящее время для непре­ рывных отображений метрических пространств общей является теорема 1.5. Хотя эта теорема допускает распространение и на более широкие классы пространств и отображений, оно носит скорее технический характер и не затрагивает сути самой теоремы; поэтому мы формулируем теорему 1.5 в разумных границах общности и предлагаем в качестве основной. Перейдем непосредственно к обзору. А. Д. Иоффе и В. М. Тихомиров [4] предложили следующее обобщение теоремы Люстерника. на Т е о р е м а 1.1. Пусть X, Y — банаховы пространства, Т:Х -> Y — линейный непрерывный оператор, Л(Г) — норма обратного оператора: Y -> Х/Ker Т, Р — отображение некоторой окрестности U точки х0 6 X в Y. Предположим, что существует число Ъ > 0 такое, что, во-первых, Ь*А(Т) < 1/2, и, во-вторых, || Р(х) - Р(х') - Т{х — х')\\^Ъ\\х — х || для всех х, х' 6 U. Тогда существуют окрестность V с: U точки х0, число L и отображение Ъ> (-> #(£) из U' в X такие, что Р(Ъ + х(1)) = Р(х0) || х(1) || < L || Р(1) - Р(х0) || для всех £ 6 U'. Основное преимущество этой теоремы по сравнению с классической х) (которая легко вытекает из нее) состоит в том, что здесь не требуется суще­ ствования строгой производной Р\хо), а если она есть, то разрешается в качестве Т брать любой близкий к ней оператор. Однако у этой теоремы есть два недостатка: в ней оценка расстояния дается лишь до основного уровня Р(х) = Р(х0), а не до всех близких уровней Р(х) = Р(х0) + бг/, и константа L явно не указывается. Позднее в [5] В. М. Тихомировым была получена оценка расстояния до произвольного уровня, близкого к основному. Иной характер носит теорема, принадлежащая К. Ш. Цискаридзе [15] и восходящая к Л. М. Грейвсу [3]. Мы формулируем ее в удобных для нас терминах. Через Вр(х) обозначаем замкнутый шар радиуса р с центром в точке х. Т е о р е м а 1.2. Пусть X — полное метрическое, Y — банахово про­ странства, Т: X - > У — отображение, имеющее замкнутый график. Пусть заданы точки х0 и у0 == Т(х0) и числа р 0 > 0, а >> 0 такие, что если х 6 £Бр (#о), У = Т(х) 6 Вр (г/о) и 0 < р ^ Ро, то образ шара Вр(х) при ото­ бражении Т плотен в шаре Вар(у). Пусть дано & <С а. Тогда существуют числа с > 0, pi > 0 такие, что для любого отображения S: X ->У, липшицевого с константой Ъ, и любого р 6 Ю, pi] образ шара В р(#0) при отображении Т + S содержит шар ВС9((Т + S)x0). Основным достоинством этой теоремы является отказ от линейной структуры в X (что является очень важным для теории экстремума) и замена накрывания Т плотностью в образе. Однако, как и теорема 1.1, теорема 1.2 по формулировке не завершена: накрывание оператора Р = Т + S уста­ навливается здесь лишь для окрестностей основной точки х0, поэтому из г ) Под классической мы понимаем теорему Люстерника о касательном многообразии. 16 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ теоремы 1.2 не вытекают оценка расстояния даже до основного уровня Р(х) = Р(х0), теорема 1.1, а также классическая теорема Люстерника. А. А. Милютин предложил явно вычислять константу накрывания результирующего оператора, и рассматривать операторы не в окрестности некоторой точки х0, а на введенной им полной системе замкнутых шаров (см. [8], [12]). Пусть X — полное метрическое пространство с метрикой d, К + — множество неотрицательных действительных чисел. О п р е д е л е н и е 1.1. Множество 2 cz X X (ft + \ { 0 } ) назовем пол­ ной системой (в пространстве X), если для любой пары (х, р) £ 2 из нера­ венств р ' > 0 и d(x, х) + р ' < ; р, где х £ X, следует, что (#', р') £ 2 . (Это определение несколько отличается от данного в [8], [12] — вместо последнего неравенства там требовалось лишь включение В p,(xf) cz В р(х).) Д л я любого множества М cz X будем обозначать через 2 (AT) полную систему, состоящую из всех пар (х, р), для которых *) Вр(х) cz M. Пусть теперь Y — линейное метрическое пространство (не обязательно полное) с метрикой, инвариантной относительно сдвига (будем обозначать ее той же буквой d). Определение 1.2. Оператор Т: X -+Y назовем накрывающим с коэффициентом а > 0 (или а-накрывающим) на полной системе 2 , если Т(Вр(х)) 1эВар(Тх) для всех («г, р) 6 2 . Определение 1.3. Оператор S: X -> Y назовем сжимающим с коэффициентом Ъ ^> О (или Ъ-сжимающим) на полной системе 2 , если S(Bp{x)) cz Bbp(Sx) для всех (х, р) g 2 . (Таким, например, будет любой S, липшицевый с константой Ъ на каж­ дом Вр{х).) Т е о р е м а 1.3 (А. А. Милютин [8], [12]). Пусть на полной системе 2 оператор Т накрывает с коэффициентом a, a S — сжимает с коэффициен­ том Ь, причем а > Ъ ^ 0. Пусть, кроме этого, Т и S непрерывны на Вр(х) для любой пары (х, р) £ 2 . Тогда оператор Р = Т + S является накрываю­ щим с коэффициентом с = а — Ь на той же полной системе 2 . Нам представляются важными следующие два отличия этой теоремы от вышеизложенных. Во-первых, в ней коэффициент накрывания результи­ рующего оператора Р вычисляется явно. Во-вторых, накрывание Р устанав­ ливается в ней там же, где выполняется условие теоремы, а не на более узком множестве. Об оценке расстояния формально в теореме 1.3 не говорится, но она легко следует из накрывания. Более того, теорема 1.3 позволяет давать раз­ личные равномерные оценки расстояния (см. ниже теоремы 2.3—2.5). Покажем, что из теоремы 1.3 следует теорема 1.1. Действительно, из условия последней вытекает, что Т накрывает на полной системе 2 = 2(£/) с коэффициентом а = 1/А(77), a S = Р — Т — сжимает на 2 с коэффициен­ том 6, причем Ъ < а/2. По теореме 1.3 Р накрывает на 2 с коэффициентом с = а — Ъ > 0. Положим r(x) = ±d(P(x), P(x0)), JT = {X: P(X)=P(X0)}. Пусть окрестность U точки х0 и е > 0 таковы, что Ух £ U В г{х)а U. В силу непрерывности Р в точке хо существует такая ее окрестность Ur cz U, что V£ 6 U' г(1) < ; 8, а значит, (£, г(£)) 6 2 . В этом случае, очевидно, d(l jr')^±\\P®-P(x0)\U что и требовалось доказать. х ) Обратим внимание, что множество 2 (М)^зависит от метрического пространства X, объемлющего М, поэтому, если потребуется, мы будем писать 2 ^ (М).| ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 17 Все вышеизложенные варианты теоремы Люстерника были теоремами теории возмущений, т. е. интересующий нас результирующий оператор Р имел вид суммы Т + S, где оператор Т — накрывающий, а « У - возмущаю­ щий его сжимающий добавок. Следующая теорема, предложенная Н. П. Осмо­ ловским, неожиданным образом выходит за рамки теории возмущений. Пусть, как и раньше, X — полное метрическое пространство, 2 — полная система в нем. Для каждого Я £ (0, 1] обозначим через Я2 образ 2 при отображении (х, р) н-> (х, Ар). Ясно, что Я2 содержится в 2 и также является полной системой. Пусть теперь Y — метрическое пространство. Т е о р е м а 1.4. Пусть даны отображение Ф: X X X - > У и числа а > Ъ ^ 0, удовлетворяющие свойствам: V(#, p) £ 2 : а) отображение Р{х') = Ф(х', х1) непрерывно на BQ(x), б) Ф(Вр(х), х) ZD Вар(Ф(х, х)) (а-накрывание на диагонали по первому аргументу), в) Ф(х, В9{х)) с: ВЪр(Ф(х, х)) (Ъ-сжимание на диагонали по второму аргументу). Тогда Р накрывает с коэффициентом а — Ъ на полной системе Я2, где -г—»{*.»(<-•£•)}• Отметим, что если а/2 ^ 6 ^ а, то А = 1, и тогда Р накрывает на 2 . Если же Ъ < а/2, то А < 1 и А2, вообще говоря, уже 2 . Применение этой теоремы к ситуации, описанной в теореме 1.3, приводит к отображению Ф(х1у х2) = Т(х1) + 5(^2), для которого теорема 1.4 дает, вообще говоря, более слабый результат, чем теорема 1.3. Это происходит потому, что для отображения Ф такого вида накрывание и сжимание имеются на самом деле в любой точке (хъ х2), а не только на диагонали. Однако усили­ вать таким образом условие теоремы 1.4 было бы неправильно, так как имеются важные примеры, в которых эти свойства выполняются именно на диагонали (см. ниже). Итак, мы видим, что среди перечисленных теорем общей пока нет. Появ­ ление теоремы 1.4 оказалось неким импульсом, возбудившим интерес авто­ ров к поискам наиболее общей формы теоремы Люстерника. Теперь уже было ясно, что она не должна иметь характер теории возмущений. А. В. Дмитрук предложил следующую теорему 1). Пусть опять X — полное метрическое, Y — метрическое пространство, 2 — полная система в X. Будем говорить, что множество % в пространстве Y является г-сетъю для множества Mcz Y, если для каждого у 6 М найдется у £ % такой, что 2) d {у, у) ^ 8. Т е о р е м а 1.5. Пусть для некоторого оператора Р: X -> Y имеются числа а > Ъ ^ 0 такие, что для любой пары (х, р) £ 2 : а) Р непрерывен на Вр(х), б) при г = (1 J p образ шара ВТ(х) является br-сетъю для шара Ват{Р(х)). Тогда Р накрывает на 2 с коэффициентом а — Ъ. Д о к а з а т е л ь с т в о . Без нарушения общности считаем, что а = 1, Ъ < 1. Пусть (х0, р)в 2 , у0 = Р(х0), у 6 Ва_Ъ)р(у0). Шы необходимо пока­ зать, что существует х 6 Вр(х0), для которого Р(х) = у. Точку Сбудем искать в виде предела последовательности {хп}, которую сейчас построим. Обозна­ чим г = (1 — &)р. г ) Ее линейный прототип применялся в [12]. ) В отличие от общепринятого определения нам удобно брать нестрогое неравенство. 2 2 Успехи матем. наук, т. 35. вып. 6 18 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Так как (х0, г) £ (1 — 6) 2 , то по условию теоремы имеется хх £ Вг(хо)г для которого d(P(x1), у) ^ 6г. Предположим теперь, что для некоторого п ^ 1 точка хп построена и обладает следующими свойствами: (1.1) d(*n-i,sn)< rb"-\ (1.2) ф 0 , * п ) < г(1 + Ъ + . . . + Ъ"-1) < г/(1 - 6) = р, (1.3) < № п ) , у) < гЪ\ (При п = 1 они очевидно выполнены.) Тогда из (1.2) вытекает, что d{x0l * n ) + ^ < r ( l + 6 + 62 + . . . ) = р, откуда (sn, -J^L) £2, т. е. (# п , г6п) £ (1 — 6)2. По условию образ шара ВгЪп(хп) является г6 п+1 ~ сетью для шара ВтЬп(Р(хп)). Точка у в силу (1.3) принадлежит последнему, поэтому найдется хп+1 £ Brbn(xn) такой, что d(P(xn+1), у) ^ r6 n + 1 . Так как для xnjrl свойства (1.1) — (1.3) по-прежнему выполнены, то по индукции считаем, что вся последовательность {хп} построена. Из (1.1) видно, что она фундаментальна, а тогда в силу полноты X и неравенства (1.2) она сходится к некоторому х £ Вр(хо). Из (1.3) в силу непрерывности Р на Вр(хо) получаем Р(х) = у. Теорема доказана. Процесс построения последовательности хп в приведенном доказатель­ стве мы называем люстерниковским итерационным процессом. Именно его мы имели в виду, когда говорили об одинаковости доказательств всех вари­ антов теоремы Люстерника, рассматриваемых в данной статье. Как нам кажется, теорема 1.5 наиболее ясно отражает существо этого процесса. Заметим кстати, что из теоремы 1.5 (или из теоремы 1.2) и теоремы Бэра о категориях вытекает теорема Банаха об открытом отображении. Этот факт указывает на родственность итерационных процессов в теоремах Банаха и Люстерника. Во всех предыдущих теоремах интересующий нас оператор Р представ­ лял собой результат «взаимодействия» некоторых накрывающих и некоторых сжимающих операторов, которое априори обеспечивало лишь «испорченное» накрывание Р. В то же время в теореме 1.5 оператор Р один, и о причине, по которой его накрывание априори нарушено, ничего не говорится. Теорема 1.5 может служить основой для дальнейшего распространения теоремы Люстерника на новые классы пространств и операторов, если того потребует практика (см., например, теорему 1.6). Покажем, что из теоремы 1.5 следуют теоремы 1.3 и 1.4. Доказательство теоремы 1.3. Из условия видно, что оператор Р = Т + S удовлетворяет на 2 всем условиям теоремы 1.5 с кон­ стантами а, 6. Доказательство теоремы 1.4. Покажем, что оператор Р(х) = Ф(х, х) на полной системе 2 ' = А,2 удовлетворяет всем условиям теоремы 1.5 с константами а, 6. Пусть (*0> Р)6 ( 1 — V ) 2 '' Уо = Р(Хо)1 У£ВарЫ- Нам надо найти такой х 6 В9(хо),что d(P(x), у) ^ 6р. Так как (я 0 , р) 6 2 , то из а-накрывания Ф на 2 по первому аргументу следует, что имеется х 6 Вр(хо)7 для которого Ф(х, хо) = У- Поскольку (w/(l_i)x)€J;, al/(l-±)x-m.,(l/(l-4-),2), то (х0, 2р) £ 2 . Отсюда и из неравенства d(xo, х) + р ^ 2р следует, что (х, р) £ 2 . Тогда, учитывая, что х0^В р(х), в силу 6-сжимания Ф на 2 по второ- ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 19 му аргументу получаем й(Ф{х, х), у) ^ Ьр, что и требовалось. По теореме 1.5 получаем (а — 6)-накрывание Р на 2 ' . М. Ф. Сухинин заметил, что в теореме 1.5 можно отказаться от симметрич­ ности метрики, и при этом ничего не изменится. Он предложил рассматривать «квазиметрическое» пространство, представляющее собой множество X, в котором задана функция q(xu х2), принимающая значения в множестве Ul+ U {+оо} и удовлетворяющая лишь неравенству треугольника д(хъ х3) < д(хъ х2) + q(x2, x3). (От связи равенств q(x1, х2) = 0 и хг = х2 также отказываемся.) Такая «квазиметрика» естественно порождает две структуры. Одна из них, которую условно назовем прямой, задается шарами вида Вр(х) = {х' еХ: ? ( * , * ' ) < p}, другая — контр-структура — шарами В9{х) = {*' еХ: ? ( * ' , * ) < p} 1 ). Последовательность хп £ X будем называть прямо фундаментальной, если Vs > 0 при больших т и п ^ т и d(xm, хп) <С е. Квазиметрическое пространство X назовем прямо полным, если для любой прямо фундаментальной последовательности хп £ X существует точ­ ка 2) х £ X, к которой она «сходится» в контр-структуре в том смысле, что q(xn, £)->0. Пусть X, Y — квазиметрические пространства, X — прямо полное. О п р е д е л е н и е 1.4. Оператор Р: X - * У назовем прямо замкну­ тым, если для любой прямо фундаментальной последовательности хп, схо­ дящейся в контр-структуре к некоторому х, для которой Р(хп) сходится к некоторому у в контр-структуре У, имеется равенство Р(х) = у. Множество 2 cz X X (IR + \{0}) будем называть полной системой, если оно удовлетворяет определению 1.1 с заменой функции d на q и сохранением порядка ее аргументов х, х , и дополнительному требованию: если (х, р) € 2 и р' 6 (0, р), то (я, р') 6 2 . Сохраняя определение е-сети в пространстве У (также с заменой d на q и сохранением порядка аргументов у, у) и условившись, что Р(0) = 0 , по аналогии с теоремой 1.5 получаем следующую теорему для квазиметриче­ ских пространств 3 ). Т е о р е м а 1.6. Пусть для оператора Р: X -> У имеются числа а 2> > Ъ ^ О такие, что для любой пары (х, р) £ 2 : а) Р тш В р(х) прямо замкнут 4 ), б) nj5w г — (1 — Ь/а)р образ шара ВТ{х) является br-сетъю для шара Ват{Рх). —>• г ) Оба эти шара могут не содержать саму точку х, поэтому открытые шары* указанных типов нельзя, вообще говоря, принять в качестве окрестностей точки х и построить соот­ ветствующие топологии. 2 ) Возможно, не единственная. ) Нетрудно сформулировать также аналоги теорем 1.3, 1.4 д л я к в а з и м е т р и ч е с к и х пространств. 3 4 ) Требование замкнутости Р вместо его непрерывности сделано нами под влиянием. теоремы 1.2. 2* 20 А. В. ДМИТРУК, А. А. МИЛЮТИН, H. П. ОСМОЛОВСКИЙ Тогда Р прямо накрывает на 2 с коэффициентом а — Ь, т. е. V (х, р) £ € 2 , Р(Вр(х)) zDBia_b)p(Px). Доказательство аналогично доказательству теоремы 1.5. Замечательно, что эта, на первый взгляд абстрактная теорема, как раз нашла применение в теории оптимального управления (см. ниже теорему 3.1). Теоремы 1.3—1.6 были получены независимо от теоремы 1.2, которая из них не вытекает (для Т, непрерывного в х0, она вытекает из теоремы 1.5). Стремление включить теорему 1.2 в общую привело нас к нижеследующей теореме 1.7. Однако отметим, что в приложениях мы пока не знаем случаев, когда нужна была бы именно она (а тем более ее аналог для квазиметриче­ ских пространств, которого мы не приводим). Пусть I , 7 те же, что в теореме 1.5, 2 — полная система в X, W — множество в У и задан Р: X ->• Y. Для с > 0 введем обозначение: Е(с) = {(*, p ) 6 2 : Bc(Px)czW}. Т е о р е м а 1.7. Пусть оператор Р и числа а > Ъ ^ 0 таковы, что а) V(.r, р) £ Е (р [ l — — ] (a + 26) J P замкнут на Вр(х), б) V (#, р) £ Е((а — Ь)р) и г = (1 — Ь/а)р образ шара Вг(х), является br-сетъю для шара Ваг(Рх). Тогда для любой пары (х, р)£Е(р (1 1 {а -\- 26) J имеется включение P(B9(x))zzBia-b)Q(Px). Доказательство то же, что и у теоремы 1.5 (которая получается из этой при W = У). Покажем, что отсюда следует теорема 1.2. Пусть Р = Т + S, z0 = Рхо и 8 > 0 таково, что а > Ъ + 8. Из условия теоремы 1.2 вытекает, что 3pi > 0 такое, что для любых р <1 рг и х £ BQl (x0), для которых Рх 6 BPl(a+2b)(zo), множество Р(Вр(х)) является (Ь + е)р-сетью для шара Вар(Рх). Пусть 2 есть минимальная полная система, содержащая пару (#0, Pi)» a W = 5Р1(а+2Ь)(2о). Мы видим, что Р удовлетворяет условиям теоремы 1.7 с коэффициентами а и Ъ + 8. Отсюда получаем, в частности, утверждение теоремы 1.2 е е =* а — Ъ — е. Наконец, упомянем еще теорему из учебника В. М. Алексеева, В. М. Ти­ хомирова и С. В. Фомина ([6], п. 2.3.1). В ней рассматривается уравнение х Р(х1 у) = z, и для него строится (не однозначным образом) функция у = = ср(#, z), для которой W(x, ф(#, z)) == z (точную формулировку см. в [6]). Хотя эта теорема названа авторами обобщением теоремы о неявной функции, на самом деле это есть еще один вариант теоремы Люстерника в духе накрывания. Эта теорема является некоторым усилением теоремы 1.1, но, как и последняя, вытекает из теоремы 1.3 и из теоремы 1.4. Называть же ее тео­ ремой о неявной функции на наш взгляд не совсем правильно, так как в отли­ чие от теоремы Люстерника, обеспечивающей (применительно к уравнению ^{х, у) = z) существование некоторой выборки у = ц(х, z), в теореме о не­ явной функции центр тяжести состоит не в существовании некоторой выборки у = у(х, z), а в ее единственности и той же степени гладкости, что и у исходной W. Уместно подчеркнуть, что вопреки довольно распространен­ ному мнению об эквивалентности теоремы Люстерника и теоремы о неяв­ ной функции, факт состоит в том, что эти теоремы не следуют одна из другой. В заключение обзора остановимся на связи люстерниковского итера­ ционного процесса с принципом сжимающих отображений. Как известно, классическая теорема Люстерника в случае, когда кег Р\х0) имеет допол­ нение, доказывается итерационным методом Ньютона, основанным на прин- ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 21 ципе сжимающих отображений. Поэтому некоторые авторы специально зани­ мались распространением этого приема и на случай, когда дополнения к ker Р'(х0) нет, т. е. нет подпространства, на котором Р'(хо) обратим, и сле­ довательно, метод Ньютона в чистом виде неприменим. Так, например, А. А. Милютин предложил рассматривать многозначные сжимающие отобра­ жения (см. [4], [5]). При этом оказывается, что для теорем 1.1, 1.3, 1.4, теоре­ мы из [6], п. 2.3.1, и, видимо, вообще для любых вариантов теоремы Люстерника, в условии которых указаны некоторые накрывающие и некоторые сжимающие операторы, можно придумать соответствующий принцип сжи­ мающих многозначных отображений (при этом получим соответствующий абстрактный вариант метода Ньютона), из которого доказательство будет следовать (теоремы 1.1 и [6], п. 2.3.1 именно так и доказывались авторами). Однако замечательно, что для теоремы 1.5 (а также для теорем 1.2, 1.6) соот­ ветствующего принципа сжимающих отображений придумать нельзя. Дело в том, что последовательность хп в ее доказательстве удовлетворяет оценке (1.1), но отнюдь не оценке d(xn, хп+1) < Ь - ф п _ ! , хп). (Еще прозрачнее это видно на примере теоремы Банаха, вытекающей из любой из теорем 1.2, 1.5, 1.6.) Таким образом, процесс Люстерника не сво­ дится к принципу сжимающих отображений. § 2. Типичные приложения Приведем теперь несколько следствий из теорем 1.3—1.6, полезных для приложений. Начнем с теоремы 1.3. Значение явного указания константы накрывания с в ней подчеркивается следующей теоремой, позволяющей от «локального» с-накрывания переходить к с-накрыванию «на множестве». Пусть X — прямо полное квазиметрическое пространство (в частности, полное метрическое), 2 — полная система в нем, Y — нормированное про­ странство. Т е о р е м а 2.1. Пусть для оператора Р: X -> Y существует число с > О такое, что V(a;, p) 6 2 : а) Р прямо замкнут на Вр(х), б) существует р(х) £ (0, р] такое, что Vp' 6 (0, р(х)] P(BP,(X))ZDBCP,(PX). Тогда Р прямо накрывает с коэффициентом с на всей 2 . Д о к а з а т е л ь с т в о . Пусть (х0, р) 6 2 , у0 = Р(х0)> ~У 6 Вср(у0). Нам надо найти х £ В р(х0), для которого Р(х) = у. Соединим точки у0 и у отрезком / и введем на нем параметризацию у% = Уо + ~^Г (У— ^о)» * € [О» *Р] (при этом у == г/ср). Точку у £ / назовем правильно накрытой, если для —>некоторого х £ Вр(х0) Р(х) = у и с ф 0 , * ) < II У — Уо ||. Из условия видно, что если yt £ / правильно накрыта, то либо yt = г/, либо имеется более далекая точка ys, s > t, также правильно накрытая, причем для соответствующих хи xs выполняется оценка cd{xu xs) < || yt — у8 ||. 22 А. В. Д М И Т Р У К , А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Начиная с точки у0, которая очевидно правильно накрыта, мы получаем последовательность правильно накрытых точек и их прообразов, связанных между собой указанной оценкой. Благодаря этой оценке и прямой замкну­ тости Р на Вр(х0), при переходе к пределу опять получаем правильно накры­ тую точку. Отсюда и из принципа трансфинитной индукции следует, что правильно накрытым является весь отрезок / и, в частности, точка у. Теоре­ ма доказана. З а м е ч а н и е 2.1. По сути доказательства теорема 2.1 близка к попу­ лярному сейчас принципу, предложенному И. Экландом [20], но представ­ ляется нам более удобной в применениях, связанных с накрыванием. В про­ стейшем случае, когда имеется гладкая / : [0, 1] -> ft и /(0) = 0, принцип Экланда соответствует свойству: если везде / ' > 1, то /(1) > 1; а теорема 2 . 1 : если везде / ' ;> 1, то Зх такой, что f(x) = 1 (т. е. /(1) ^ 1). Значение понятия полной системы поясняется следующим фактом, уже упоминавшимся во введении. Если рассматривать некоторую окрестность U фиксированной точки х0 ^ X, то накрывание Р на 2(U) обеспечивает оценку расстояния не только до основного уровня Р(х) = Р(х0), но и до всех близких уровней Р(х) = Р(х0) + бг/. Отсюда и из теоремы 1.3 вытекает следующая теорема, доказанная и использовавшаяся в исследовании по высшим поряд­ кам в работе [8]. Пусть пространства X, Y банаховы. Т е о р е м а 2.2. Пусть оператор Р: X -+Y строго дифференцируем в точке Хо, удовлетворяет условию Люстерника в этой точке и Р(х0) = 0. Тогда существуют & > 0, L такие, что для любых 8х £ X и 6у £Y таких, что \\ 8х || < е, || 8у || < 8, найдется х £ X, для которого Р(х0 + Ьх +~х) = Ьу и || х || < L || Р(х0 + 8х) — Ьу ||. (Если ограничиться рассмотрением оценки расстояния только до основ­ ного уровня, то с помощью люстерниковского процесса легко показать, что свойство иметь эту оценку, т а к ж е как и накрывание, сохраняется при малом возмущении оператора. Однако теорем специально такого типа мы не рас­ сматриваем, так как пока не знаем случаев, когда это свойство выполнялось бы без накрывания на некоторой полной системе.) К а к уже отмечалось выше, теорема 1.3 позволяет получать различные равномерные оценки расстояния (по «большому» множеству, при зависимо­ сти от параметра, и тому подобные). Следующая теорема 2.3, в которой мы ограничимся рассмотрением расстояния до основного уровня, а также теоре­ ма 2.4 представляют собой равномерные аналоги классической теоремы Люстерника. Пусть Q — некоторое множество в X. О п р е д е л е н и е 2.1 [12]. Будем говорить, что оператор Р: X ->Y удовлетворяет условию Люстерника равномерно на множестве Q, если суще­ ствуют окрестность нуля V в X и числа а > Ъ ;> 0 такие, что а) Р определен на Q + V и дифференцируем по Фреше в каждой точке из Q; _ б) У/ х £ Q оператор Тх: х »—* Р'(х)х а-накрывает, а оператор Sx: х ^ Р(х + х) — Р(х) — Р' (х) х 6-сжимает на полной системе 2 ( F ) . Числа а, Ъ и окрестность V будем называть параметрами равномер­ ности. Теорема 2.3 [12]. Пусть Р удовлетворяет условию Люстерника равномерно на Q с параметрами а >> Ъ ]> 0, V. Пусть JP есть множество ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 23 нулей Р на Q -{- V, а б > 0 таково, что В6(0) cz F. Тогда для всех х £ Q таких, что (2.1) || *>(*) || < (а - 6)6, имеется оценка d (*' - Л < ^ 11*4*) II- i?c./m Q ограничено ujf/' непусто, то при некотором L оценка d(x, ^/Г)^С ^ L || .Р(#) || #е/жа для всех х £ Q. Д о к а з а т е л ь с т в о . Пусть x ^ Q и для него выполнено (2.1). Из а-накрывания Г^. и fr-сжимания Sx на 2(F) и теоремы 1.3 следует, что оператор х ь-* Р(# + #) является (а — Ь)-накрывающим на 2(F). Отсюда и из (2.1) получаем, что образ шара Вир(х\и(0) содержит шар В^Р{х)ц(Рх) а — Ь и, в частности, точку 0. Тогда при некотором х имеем II * 11<г=ь Н^(«)Н и Р(х+~х) = 0. Первая часть теоремы доказана, а вторая при этом очевидна. Эта теорема применялась в [12] для доказательства корректности рас­ ширения общей задачи оптимального управления при введении скользящих режимов, а теоремы, подобные ей — в работе А. А. Милютина [9] для пере­ хода от абстрактной задачи, в которой условие Люстерника не выполнено, к задаче, в которой оно выполняется, и в работе Н. П. Осмоловского при по­ лучении квадратичных условий понтрягинского минимума в задаче опти­ мального управления (анонсированы в [8], § Д.2). Т е о р е м а 2.4. Пусть М — открытое множество в X, оператор Р: М -+Y строго дифференцируем во всех точках некоторого множества Q cz М, причем существует а > 0 такое, что Ух £ Q производная Р'(х) а-накрывает. Тогда для любого г > 0 существует открытое множество U ZDQ такое, что Р (а — г)-накрывает на 2 (£7). Д о к а з а т е л ь с т в о . Пусть 8 > 0. Возьмем любой х £ Й. Как было показано выше (см. доказательство теоремы 1.1), по теореме 1.3 суще­ ствует окрестность V(x) точки х такая, что Р (а — б)-накрывает на 2(F(#)). Положим U = U V(x), и покажем, что Р на 2 (£7) удовлетворяет условию теоремы 2.1. Действительно, пусть х £ U. Тогда 3 х0 £ Q такой, что х £ £ V(XQ), И 3 р(х) > 0 такое, что В^(х) cz V(x0). Поскольку Р (а — е)-накрывает на 2(F(# 0 )), то условие теоремы 2.1 выполнено. По этой теореме полу­ чаем (а — б)-накрывание Р на 2(С/). Обозначим через £{Х, Y) банахово пространство линейных операторов из X в Y. Т е о р е м а 2.5. Пусть в X задана еще одна топология — х, согласо­ ванная с линейной структурой, и более слабая, чем исходная. Пусть отображенив Р'(-): (X,x)-+X(X,Y) определено в некоторой х-окрестности нуля, непрерывно в нуле, и Р\0)Х = Y. Тогда для некоторой х-окрестности нуля Uх и некоторого а > 0 Р а-на­ крывает на %(UX). Д о к а з а т е л ь с т в о . Из условия теоремы следует, что для некото­ рых а > 0 и Uх оператор Р удовлетворяет условию теоремы 2.4 (с Q = U х), из которой вытекает утверждение теоремы 2.5. С л е д с т в и е . Пусть выполнены условия этой теоремы, Р(0) = 0 и jf^ = Р~г(0). Тогда существует х-окрестностъ нуля Ux такая, что V/? 24 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ 3LR такая, что Ух 6 U'x f] BR(0) имеется оценка d(x, JT) < LR || Р(х) ||. Это следствие применялось А. В. Дмитруком при получении квадратич­ ных условий понтрягинского минимума в задаче оптимального управления, линейной по управлению (анонсированы в [8], § Д.З). В последнее время появляются работы (см., например, [24]), в которых оператор задает не равенство Р(х) = 0, а включение Р(х) £ Q, где Q — выпуклое замкнутое множество в Y. Пусть Р(х0) = у о 6 Q, и в окрестности точки х0 мы интересуемся оценкой расстояния до множества^/' = Р~г(()). Эта ситуация, на первый взгляд требующая дальнейшего развития теоремы Люстерника, на самом деле полностью находится в рамках уже известной теоремы 1.3. Имеет место следующая Т е о р е м а 2.6. Пусть Р: X ->Y строго дифференцируем в х0 и Р'(хо)Х — (Q — г/о) содержит окрестность нуля. Тогда в некоторой окрестности точки х0 с некоторой константой L верна оценка d(x, JT) < Ld{P(x), Q). Для доказательства надо рассмотреть оператор G: X X Q -> Y\ (х, ?)»-> »-> Р{х) — q, для которого равенство G(x, q) = 0 эквивалентно включению Р(х) 6 Q, и далее воспользоваться следующей теоремой, принадлежащей М. Ф. Сухинину [16], [17] и Е. С. Левитину [18], [19]. Т е о р е м а 2.7. Пусть ЗС, Y — банаховы пространства, D — выпук­ лое замкнутое множество в ЗС, G: ЗС ~>Y — оператор, строго дифференци­ руемый в точке Хо (:D, и G'(xo)D содержит окрестность нуля. Тогда для некоторой окрестности U точки х0 и некоторого а > 0 оператор G: D -> Y а-накрывает на полной системе 2£)(Drfl D). Доказательство легко вытекает из теоремы 1.3. Отметим одно из применений теоремы 1.4, на которое впервые обратил внимание Е. С. Левитин. Пусть X, Y — банаховы пространства, оператор g: X - > У обладает в точке х0 следующим разложением: g(x0 + 8х + х) = G(8x, х) + г(8х9) х) \\х\\ где G(8x, 0) = g(x0 + 8х), а е -> 0 при 8х ->• 0, х ->• 0. В этом случае говорят, что оператор G является тонкой аппроксимацией оператора g в точке х0* (Имеется тривиальная тонкая аппроксимация G(8xt х) — g(x0 + 8х + х)7 но интерес представляют аппроксимации, имеющие более простую струк­ туру» ч е м исходный оператор g.) П р и м е р 2.1. Пусть заданы компакт Z и функция f(x, z): К X Z ->» Л, равномерно по z непрерывно дифференцируемая по х. Тогда для оператора g: С[0, 1]->С[0, 1], x(t)^m8ixf(x(t), z) zEZ имеется следующая тонкая аппроксимация: (2.2) G (&?, x)l(t) = max [/ (х0 (I) + 8х (*), z) + f (x0 (t), z) x(t)]. z£Z Нетрудно заметить, что при наличии тонкой аппроксимации отображе­ ние Ф(8#1, 8х2) = G(8x2, 8хг — 8х2) для любого е > 0 является 8-сжимающим на диагонали по второму аргумен­ ту (на соответствующей полной системе). Это следует из равенства Ф(8хж 8х + х) — Ф{8х, 8х) = = G(8x + ~хй -х) — G(6x, 0) = — фх + х, —я) || я ||„ ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 25 Если к тому же по какой-то причине оказалось, что для всех малых 8х ото­ бражение G(8x, x) равномерно накрывает по х, то тогда Ф накрывает на диагонали по первому аргументу и по теореме 1.4 накрывает и Ф(8х, 8х)г т. е. сам g. В связи с этим стоит подчеркнуть следующую мысль. Как известно из практики и видно из формулировок теорем 1.1 — 1.4, теорема Люстерника позволяет по накрыванию одного оператора («более простого») судить о накрывании другого («более сложного»), т. е. позволяет расширять класс на­ крывающих операторов. При этом изначальный критерий накрывания берет­ ся «со стороны». До сих пор в приложениях в качестве исходного всегда использовался класс линейных операторов, критерий накрывания в котором очень прост. По нашему мнению, важное значение имеет дальнейшее рас­ ширение сферы приложений теоремы Люстерника. А именно, надо находить такие классы операторов g, аппроксимации G которых относились бы к более простому классу, а для этого простого класса находить естественные крите­ рии накрывания. (Например, каковы необходимые и достаточные условия а-накрывания по х при всех малых 6х для оператора (2.2)?) Приведем одно полезное следствие из теоремы 1.6, предложенное А. А. Милютиным. Пусть X — прямо полное квазиметрическое, Y — метри­ ческое пространства. Т е о р е м а 2.8. Пусть имеется последовательность операторов Pni X -> Y (п = 1, 2, . . .), прямо накрывающих на общей полной системе 2 , заданной в X, с общим коэффициентом а > 0, и пусть оператор Р: X ->Y таков, что V (#, р) £ 2 Рп сходится к Р равномерно на Вр(х), и Р прямо замкнут на Вр(х). Тогда для любого 8 £ (0, а) оператор Р накрывает на 2 с коэффициентом а — е. Д о к а з а т е л ь с т в о . Покажем, что V e > 0 P удовлетворяет условию теоремы 1.6 с числами а— у- и "о". Грусть (х0, р) 6 2, у0 = Р (х0) и d (y0, у)^ а—2~1 Р- Возьмем такое п, что Ух £ Вр(х0) d(Pn(x), и пусть уп = Рп(хо)- Так как d(y0, г/ п )<-|-р, то у£Ва9{уп). вания d(P(xn), Рп следует, что Зхп£Вр(х0) г/)^-9~Р' что и такой, Р (х)) ^.-^-р,. Из а-накры- что Рп(хп) = у. Но тогда требовалось показать. Осталось применить тео­ рему 1.6. Укажем теперь способ построения важнейших примеров квазиметриче­ ских пространств. Пусть X — нормированное пространство, М — его подмножество. Тогда всякий выпуклый конус К си X порождает на М следующую квазиметрику: для хг, х2 6 М L — #2 11» если х2 — xt^K, если x2—Xi^K' Прямые шары в этой квазиметрике имеют вид ад = адп мг\ (х + к). С этой квазиметрикой связан ряд нужных нам понятий, которые, однако, удобнее формулировать, не прибегая к самому понятию квазиметрики. Пусть, задан функционал /: М -> Е. О п р е д е л е н и е 2.2. Будем говорить, что / Липшицев на М вдоль К, если существует константа L такая, что V#i, х2 6 М, для которых х2 — хг g 26 А. В. Д М И Т Р У К , А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ £ К, выполняется неравенство l/(*2)-/(*l) l < £ | | * . - * l l | . О п р е д е л е н и е 2.3. Множество М назовем полным вдоль конуса К, -если для любой фундаментальной последовательности хп £ М такой, что Vra хп+1 — хп £ К, существует предел х £ М. В банаховом пространстве X множество выпуклых конусов, полных вдоль себя х ), значительно шире множества замкнутых выпуклых конусов. Например, любой конечномерный выпуклый конус полон вдоль себя. Введем обозначение В 9(х, К) = Вр(х) f| (х + -&)• Будем говорить, что л £ Z есть if-внутренняя точка для множества М (и писать л; £ int K ЛО» если для некоторого р > О В р(х, К) cz M. (При этом х может не принадле­ жать М.) Пусть теперь даны нормированное пространство Y и оператор g: M -*Y. О п р е д е л е н и е 2.4. Назовем g замкнутым вдоль К на М (или К-замкнутым на М), если из того, что хп £ М, хп+1 — хп£К V п9 хп ->• х £ M и g(zn) -+У, следует, что g(x) = г/. О п р е д е л е н и е 2.5. Будем говорить, что g строго дифференцируем (по множеству М) в точке х0 £ int к М относительно К, если существует •оператор А: К -+Y, линейный 2 ) на К, обладающий свойством: для всех х 6 М и х £ К таких, что х + х 6 М, имеется разложение g(x + ~х) == #(ж) + Ля + в(ж, ж) || ж ||, где 8 ->0 при х ->х0 и х ->0, х £ К. Как обычно, обозначаем Л = g'(x0). Нетрудно показать, что если g удовлетворяет последним двум определе­ ниям, то А = g'(xo) является /^-замкнутым на К. (Легко заметить, что приведенные определения имеют также и квази­ метрическую трактовку: определение 2.2 соответствует липшицевости / на М относительно квазиметрики qK; 2.3 — прямой полноте квазиметрического пространства (М, qK); 2.4 — прямой замкнутости графика g относительно qK\ 2.5 — строгой дифференцируемости g относительно qK). Для любого множества М сг X через 2(М, К) будем обозначать полную систему, состоящую из всех пар (х, р) £М X (R,+\{0}), для которых В9{х, К) cz M. О п р е д е л е н и е 2.6. Будем говорить, что g а-накрывает на М отно­ сительно К, если V(#, p) 6 2(Af, К) g{Bp{x,K)) =>Bap{g{x)) (т. е. если g прямо а-накрывает на 2(М, iT)). Далее считаем, что К выпук­ лый и полный вдоль себя. Т е о р е м а 2.9. Пусть g К-замкнут на М, строго дифференцируем •в точке х0 6 int к М относительно К, g(x0) = 0 и g'(xo)B1(0, К) :э5 а (0), где а > 0. Тогда для любого а' £ (0, а) существует г > 0 такое, что: a) g а-на­ крывает на Вг(х0, К) относительно К, б) для любого х £ Вг/2(хо, ^Г), для кото­ рого || #•(#) || ^ а'г/2, существует х £ К такой, что g(x + х) = 0 и \\ х \\ ^ <jr\\g{x)\\. Д о к а з а т е л ь с т в о . Из условия теоремы и определений 2.4, 2.5 видим, что для любого 8 > 0 существует г > 0 такое, что g удовлетворяет г ) Как заметил В. А. Дубовицкий, в нижеследующих теоремах вместо требования замкнутости К можно ограничиться этим свойством. 2 ) Здесь и везде далее линейность операторов и функционалов не предполагает их непрерывности* ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 27 условию теоремы 1.6 на полной системе 2>(Вг(хо, К), К) с коэффициентами а и 8. По теореме 1.6 получаем утверждение (а), из которого легко вытекает (б). О п р е д е л е н и е 2.7. Линейный оператор А: К —> Y назовем регу­ лярным на К, если либо А К Ф Y, либо (2.3) АВ^О, К) ZD Ва(0) при некотором а > 0. Будем говорить, что оператор g: M ->Y регулярен относительно К в точке Хо £iniK M, если его производная g'(x0): К-+Y регулярна на К. Следующая лемма является конусным обобщением теоремы Банаха об открытом отображении и имеет непосредственное отношение к определе­ нию 2.7. Л е м м а 2.1. Пусть пространство Y банахово, оператор А: К -> У линеен и К-замкнут на К, А К = Y. Тогда выполняется включение (2.3). Доказательство легко вытекает из теоремы Бэра о категориях и теоре­ мы 1.6. Следующие два утверждения потребуются нам в главе П. Л е м м а 2.2. Пусть А: К -+Y и I: К —• Я1п —линейные операторы, из них А регулярен и К-замкнут на К, а I ограничен на i?i(0, К). Тогда опера­ тор А = (Z, А): К —>- Кп X Y также регулярен на К. Доказательство достаточно провести для п = 1. Случай А К Ф Y тривиален. Пусть выполняется (2.3). Покажем, что если множе­ ство А К всюду плотно в К X У, то оно совпадает с К X Y. Действительно, для точки (1, 0) существует сколь угодно близкая к ней точка (1 + \, у) = = Ах, х £ К. Согласно (2.3), имеется х £ К такой, что || х || <^ — II У II и Ах = —у. Тогда (Z, А)(х + х) = (1 + I + (Z, х), 0), где можно считать, ^что | £ + (Z, х) | < 1. Таким образом, при некотором а > 0 (а, 0) £ АК, т. е. (1, 0) £АК. Аналогично (—1, 0) £АК. Отсюда и из (2.3) вытекает, что при некотором с > 0 AB±(0,K) ZDBC(090). Т е о р е м а 2.10. Пусть дан оператор g: M ->Y, К-замкнутый на М и строго дифференцируемый относительно К во всех точках некоторого множества QczintKM, причем существует а > 0 такое, что Ух £ € Q ?'(*)Bi(0, Я) =>Ва(0). Тогда для любого а' £ (0, а) существует множество U cz M такое, что Q a intjj U и g а'-накрывает на U относительно К. Доказательство аналогично доказательству теоремы 2.4. § 3. Вариационная схема В этом параграфе мы приведем теорему, основанную на теореме 1.6, которую можно рассматривать как абстрактную схему для получения прин­ ципа максимума в задачах оптимального управления в произвольном конус­ ном классе вариаций. В этой схеме теорема Люстерника применяется первым из указанных во введении способом (используется оценка расстояния до множества нулей оператора равенств). До сих пор при реализации этого способа для конусных вариаций либо а) требовалось, чтобы оператор и все функционалы задачи были определены в целой окрестности исследуемой точки Хо, что приводило к трудоемкой работе по продолжению на всю окрест­ ность отображений, априори заданных лишь на конусе (см., например, в кни­ ге [6] теорему § 3.2 и ее применение в § 4.2), либо б) теорема Люстерника применялась не в точке Хо, а на некоторой последовательности точек хп ->• Хо, лежащих внутри конуса (при этом надо было иметь равномерную оценку 28 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ расстояния), что приводило к повышенным требованиям гладкости оператора равенств [13]. Предлагаемая схема позволяет избавиться от необходимости продолже­ ния с конуса на окрестность ограничений задачи, а также от повышенных требований гладкости. Пусть X, У — нормированные пространства, хо — точка в X, U — выпуклая ее окрестность, К — выпуклый полный вдоль себя конус в Хг содержащий ноль, и такой, что К — К = X. Пусть на множестве М = = U П (хо + К) заданы функционалы ft (i = О, . . ., т), липшицевые на нем* вдоль К. Нетрудно показать, что в этом случае верхние производные по» направлениюх) Лв(^о, х)'- К->\А липшицевы (по х) на К вдоль К. Мы будем предполагать, что кроме этого, функционалы /1в(^о, •) сублинейны на К. (Функционал ф: К ->К назовем сублинейным на К, если V#i, x2 6 К ш VA, > 0 ф(Я^!) = Яф^х) и ф(^х + х2) -< ф(аа) + ф(я2). В § 3 будет показано, что всякий ф, сублинейный на К и липшицевый на К вдоль К, продолжается [до некоторого сублинейного ф на X. Опорным к ф будем называть всякий линейный функционал I: X ->Е, удовлетворяю­ щий на X неравенству (Z, х) <; у(х). Пусть имеется также оператор g: М -> У", удовлетворяющий определе­ ниям 2.4, 2.5, регулярный относительно К в точке х0, причем g(x0) = CL Рассмотрим следующую экстремальную задачу: | /o(s)->min, Ы * ) < 0 (1 = 1, . . . , т); ( ' } \ g(x)-^0, хех0 + К. Без нарушения общности будем считать, что ft(xo) = 0 для всех i = О, . . ., т. Т е о р е м а 3.1. Пусть х0 есть точка локального минимума в этот задаче. Тогда имеет место следующее правило множителей Лагранжа: суще­ ствуют числа а,- ^> 0 (& = 0, . . ., т) и элемент г/* £ У* такие, что» S аг + II У* II > 0, и для любого х £ К (3.2) 2 а«/|в (х0, х) + (у*, gr (x0) х) > 0 г Более того, каковы бы ни были сублинейные продолжения /г'в(#съ ") **а все Хг в неравенстве (3.2) f[B можно заменить на некоторые / ь опорные к этим про­ должениям (что соответствует уравнению Эйлера). З а м е ч а н и е 3.1. На первый взгляд кажется неестественным, что» в предложенной схеме точка хо появляется раньше, чем ставится сама экстре­ мальная задача, и даже раньше задания областей определения функционалов и оператора. Однако это положение полностью согласуется с постановкой присоединенной задачи в оптимальном управлении, где сначала берется некоторая траектория исходной задачи, затем некоторый конус вариаций,, и только после этого ставится присоединенная задача, в которой на мини­ мум исследуется не произвольная траектория, а лишь данная. Таким обра­ зом, теорема 3.1 предназначается для применения именно к присоединенной задаче. Доказательству предпошлем две леммы. Л е м м а 3.1. Пусть функционалы фг-: К ->R (i = 0, . . ., т) сублиней­ ны на К и ограничены сверху на В^О, К), оператор А: К -+Y — линеен и К-замкнут на К и удовлетворяет (2.3) при а > 0. Предположим,, что 1) /;(*0, *-)= ш /(*o+s*>-/(*o). 29 ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА ме существует х £ Кл для которого Ах = 0 и <Pi (;r)<0 Vt = 0, . . . , г а . Тогда существуют ос^^О и г/*£У* такие, что 2 а г > 0 (з.з) и Чх£К 2 а д й + (^ ^)>о. Д о к а з а т е л ь с т в о . Рассмотрим отображение Rm+1xY, (ж, и)»-^(ф(ж) + 1;, Ас), где <р (х) = (ф0 (ж), . ..,<p m (z))Из выпуклости ф^ и К вытекает, что множество Im дт выпукло. Покажем, что оно не пересекается с некоторой окрестностью точки (со, 0), где со = = ( — 1 , . . . , 1) 6^ т + 1 >. Пусть V* 9«(fii(0, X ) ) < L , a 6 6(0, 1/2) таково, что £L/a < 1/4. Тогда (3.4) Imjxn 5 6 ((о, 0) = 0 . Действительно, пусть для некоторых х £ К ж v £ R™+1 n(x, v) = (со + £, rj), где | | | + || г\ || < ; б. В силу выбора б при этом Vi Ф*(#) <С —1/2. Согласно <2.3) имеем а; £ # такой, что || х || <; б/a ж Ах = —т). Тогда # + а: 6 #> •ф^(д: + #) <! ф^^) + ^ II х II ^ — 1 / 4 Vi и А(х + ж) = 0, что] противоречит условию леммы. Итак, (3.4) доказано. По теореме Хана — Банаха суще­ ствует ненулевой набор ос* >- 0 (i = 0, . . ., т), у* £ Y*, для которого V# £ 6 Z , Vz;>0, (а, Ф(а) + v) + (y*,Ax)>0 я: XxSlfU V(6, л) 6 S 6 (0, 0) (a, со) + (a, I) + (y\ л) < 0. Из последнего неравенства следует, что 2 ocf > 0, а тогда из первого выте­ кает (3.3). Лемма доказана. Л е м м а 3.2. Пусть Е — векторное пространство, if>: E ->R — суб­ линейный функционал, неотрицательный на выпуклом конусе Q cz E. Тогда существует I £ dty, также неотрицательный на Q. (Здесь дг|) cz E' есть множество линейных функционалов на Е, опорных к г|).) Д о к а з а т е л ь с т в о . Заметив, что в конечномерном случае лемма очевидно верна, возьмем произвольное конечномерное подпространство Н cz E и рассмотрим функционал г|эн (сужение ij) на # ) , неотрицательный на Q П Я . Тогда существует ZH £ ch|)H такой, что 1Н ^> 0 на Q [\ Н. По теореме Хана — Банаха / я продолжается до I 6 5г|э. Так как по теореме Тихонова множество dty £ Е' компактно в 2?-топологии (порожденной функционалами из Е), а множество всех I £ Зг|), неотрицательных на Q П Я , непусто и замк­ нуто, то лемма доказана. Д о к а з а т е л ь с т в о т е о р е м ы 3.1. Обозначим А = g'(x0). Слу­ чай АК Ф Y тривиален. Пусть теперь АВг(0, К) ZD Ba(0) jipn a > 0. Пока­ жем, что не существует х £ К, для которого Vi Лв(#о, х) < 0 и Л# = 0. Действительно, в противном случае рассмотрим луч х0 + гх, г > 0. Так как на нем g(#o + ex) = о(е) при 8 - > 0 + , то по теореме 2.9 (б) существует х(г) 6 К, для которого g (х0 + вх + х (г)) = 0 и ||х (е) \ | = о (г). Из неравенства flB(x0, х) -< —6 < 0 получаем / f (# 0 + 8#) <; —80/2 при малых 8, а в силу липшицевости ft вдоль К имеем /Д# 0 + еж + х(г)) < ; ^ —80/4, что противоречит наличию в х0 локального минимума. 30 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Таким образом, функционалы фг(-) = /|В(#о, •) и оператор А удовлетво­ ряют условию леммы 3.1, согласно которой получаем (3.3), т. е. первое^ утверждение теоремы. Далее, пусть срг- есть некоторые сублинейные продолжения фг- на X. Положимя|) = 2 агФг- Из (3.3) видно, что о|э удовлетворяет условию леммы 3.2 с Е = X nQ = {х 6 К: Ах = 0}. По лемме 3.2 существует I £ #ф, I ;> 0 на Q. Так как г|) ограничен сверху на Вг(0, К), то I тоже, поэтому, применяя к I лемму 3.1, получаем у* 6 5^*, для которого (/, ж) + (г/*, Л#) ;> 0 на i£\ Отсюда и из известной формулы #ф = 2 аг- $фг- получаем второе утвержде­ ние теоремы. З а м е ч а н и е 3.2. Как видно из доказательства теоремы 3.1, при условии АБхфу К) z^Ba(0)(a >> 0) неравенство (3.2), а также соответствую­ щее ему уравнение Эйлера эквивалентны стационарности точки х0, т. е. тому, что не существует х £ К, для которого /iB(#o, x) < 0 и g'(x0)x = CL ГЛАВА II НАКРЫВАНИЕ ОТНОСИТЕЛЬНО КОНУСА ДЛЯ ЛИПШИЦЕВЫХ ОПЕРАТОРОВ В этой главе мы обобщаем двойственную форму условия Люстерника, как достаточного признака накрывания, на случай липшицева оператора, отображающего выпуклый конус в нормированном пространстве в другое нормированное пространство. В последние годы задачи на экстремум, в кото­ рых функционалы и оператор — липшицевы, сделались весьма популярны. Для них доказаны различные варианты правила множителей Лагранжа, соот­ ветствующего аппроксимациям Кларка или аппроксимациям, близким к ним по смыслу. Мы приводим некоторые такие результаты, и на их примере даем представление о традиционных приемах доказательства. Однако в отличие от гладкого случая до сих пор не была отмечена связь между правилом множи­ телей для аппроксимаций Кларка и критерием накрывания для липшицевых операторов. Тем не менее она существует и представляет безусловный интерес для теории экстремума. Поэтому в § 6 мы даем еще одно доказательство правила множителей Лагранжа, позволяющее эту связь отчетливо просле­ дить. При этом мы не ограничиваемся доказательством старых результатов, а идем дальше, распространяя правило множителей Лагранжа на тот слу­ чай, когда функционалы и оператор, задающие экстремальную задачу, опре­ делены лишь на выпуклом конусе, а точкой, исследуемой на экстремум, является его вершина — случай, который нельзя игнорировать в современ­ ной теории экстремума. Ключевым понятием, с помощью которого формулируется обобщение условия Люстерника, является производная Кларка. Нам потребуется, однако, значительно обобщить это понятие (§ 4). Дело в том, что в перво­ начальном варианте оно не пригодно для получения критериев накрывания относительно выпуклого конуса, а также для упомянутого выше обобщения правила множителей Лагранжа. В заключение мы приводим обсуждение результатов, которое на наш взгляд необходимо, ибо правило множителей для аппроксимаций Кларка и классическое правило множителей, к которому по стилю доказательства следует отнести и теорему 3.1, имеют несравнимую информационную цен­ ность (в пользу последнего) в том случае, когда производная Кларка не сов­ падает с производной по направлению. ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 31 § 4. Производная Кларка Пусть X — нормированное пространство, 0 с 1 — открытое множе­ ство, / : О ->1R — локально липшицевый функционал. Производной Кларка функционала / в точке х £ 0 по направлению х £ X называется число ,, , —ч fci (х, х) = -р— hm ЗС'->Х, 8-»» + О / (х' + гх) — /(#') Ь '——. Д л я сокращения записи обозначим fci (х, х) = f(x, х). Функционал /*(#, x) принимает конечные значения на 0 х ! и облада­ ет следующими важнейшими свойствами. 1°. Д л я любого х£0 функционал /'(#, •): X ->iR является субли­ нейным. 2°. Пусть L — константа Липшица функционала / в окрестности точки х 6 0 . Тогда f(x, х) < L J х \\ Чх £ X. 3°. Функционал f(x, x) полунепрерывен сверху на 0 X X, причем для любых х£©, х£Х имеет место равенство: lim /" (х , #) = / ' (х, х). 4°. f(x, -x) = ( — fy(x1 ~x) (ж 6 0 , J e X ) . 5°. Пусть х 6 0 , Я" — подпространство в X, 0!г=(0-*)П#, / я : 0я->О1, * ' - > / ( * + *')• Тогда (?нУ(х, х) <С /'(#, #) V# £ # • Таким образом, производная Кларка сужения не превосходит сужения производной Кларка. 6°. f(xy x) мажорирует обычную верхнюю производную по направле­ нию. 7°. Пусть / : X -> К — сублинейный и ограниченный функционал (огра­ ниченность означает, что при некотором L j(x) ^ L \\ x\\ V^ 6 X). Тогда f ( 0 , *)=/(ж) Vx£X. 8°. Пусть / х : О -> [R и / 2 : 0 ->Я1 — локально^ липшицевы функционалы» Тогда (/i + / 2 ) * ( ^ * ) < / } (*,*) + / 5 (*> *) (*€©> * £ X ) . Каждое из этих свойств проверяется элементарно. Обобщим теперь понятие производной Кларка на случай функционала, заданного на произвольном выпуклом множестве 1 ). Пусть М cz X — не­ пустое выпуклое множество, М — его замыкание, Xм = Lin(M — М) — линейная оболочка 2 ) М — М. Очевидно, конус, натянутый на I — М и обозначаемый соп(М — М), совпадает с Хм. Нетрудно также убедиться, что для любых х 6 М, х £ Хм множество последовательностей {#', е} таких, что х ->• х, 8 ->• + 0 , х' £ М, х' + ех £ М,— непусто. Далее, пусть имеется функционал /: М ->01. Д л я произвольных х £ Му х £ Х м положим ,. , —ч -р— / (х'-\-гх)— f (х') f (х, я ) = lim ——•—-— v . X'-vX, 8-> + 0 8 х', х у +8х£М г ) Это обобщение предложено Н. П. Осмоловским. ) Поскольку не предполагается, что X полно, то, не ограничивая общности, можно считать, что X = Хм2 32 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Функционал /'(я, -)(х £ М) отображает Хм в расширенную прямую 01 = = К U {—оо, + о о } , очевидно, является положительно однородным и обла­ дает свойством: (4.1) -/•(*, i)<r(*,-«). Назовем/'(ж, х) обобщенной производной Кларка функционала /: М ->Я1 в точке х £ М по направлению х £ Хм. Подчеркнем, что функционал f'(x, •) оказывается определен на множестве, значительно более богатом 4 ), чем конус допустимых направлений к множеству М в точке х. Для дальнейшего важно, чтобы у производной Кларка в каждой точке множество опорных было (слабо-) компактно и полунепрерывно сверху зависело от точки. Принятое определение хорошо учитывает эти требования. При минимальных предположениях относительно /: М ->• К функционал f(x, •) оказывается выпуклым. П р е д л о ж е н и е 4.1. Пусть для любой точки х £ М и любого конеч­ номерного подпространства Н а X сужение f на множество М [\ (х + Н) есть непрерывный функционал. Тогда для любой точки х0 6 М функционал f(xo, •): XM-+R обладает свойством: f (х0, Si + ЯгХ/" (яо> xi)+f (*о» * 2 ), -если хи х2£Хм таковы, что f (х0, хг)> — оо (£ = 1, 2). Д о к а з а т е л ь с т в о . Пусть # 0 £ М , хи х2£Хм, f (x0, xt) > — 00 и {£ = 1, 2), Положим я ^ д ^ + Яз рассмотрим последовательность {(х, е)} такую, что х-+х0, е - > 0 + , х£М, х + ех^М и — (/ (х + гх)- f (x))-+f (x0, Ъ). При этом условие х + &хг £ М V(#, г) 6 {(#» в)} может не выполняться (если юно выполнено, то требуемое неравенство устанавливается легко). Покажем, что тем не менее найдется новая последовательность, для которой помимо лрочих выполнено и это условие. Поскольку Хм = con(M-— M), то найдутся Ях > О Д 2 > О И # 1 , # j , X2, #2 из М такие, что хг = ^(хх — х[), х2 = Я2(#2 — х'2)- Для каждого члена последовательности {(#, е)} обозначим через .Щя) аффинную оболочку пяти векторов: х, хи х[, х2, х'г Тогда множество Мх ='М[] Н(х) имеет в Н(х) непустую внутренность reint Мх. Так как V(#, г) £ {(х, г)} отрезок {х, х + гх] лежит в Мх и сужение / на Мх непрерывно, то последователь­ ность {(х, г)} можно заменить на другую последовательность {(#', г')}, у которой каждый отрезок [#', х' + г'х] лежит в reint Мх и при этом х' -> х0, 8-^0 + , (4.2) J r ( / ( ^ + e ^)-/(^))-^/-( a J o , x). Далее, для каждого члена последовательности {(#', 8^)} найдется столь малое е" £ (0, г'), что сдвиг отрезка [х', х + г'х] на 8 ^ i лежит в Мх (ибо #i 6 Н(х) — х), а также, как нетрудно видеть, найдется точка х" такая, что [х\ х + 8"я] cz [я', ж' + е'х] и • 1 - (/ (х" + г'х) - f (х")) > - ± - (/ (х' + е'*) - / (х')). !) Например, верхняя производная по направлению функционала /: М ->- R в точ­ ке х £ М определена лишь для ~х из конуса допустимых направлений к М в точке ;г. 33 ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА Отсюда и из (4.2) вытекает, что ^ ( / ( я ' + е'я)-/(*"))-*/'(*<>,*), так как х'-ь-Хо, б " - ^ 0 + , х" £М, х" + г"х^М. Учитывая также, что х"~\- f e ' ^ f M , получаем f (х0, х) = lim [-±- (/ {(хя + г*х±) + г"х2) - / (х" + в'х^) + поскольку предел суммы не превосходит суммы верхних пределов. С л е д с т в и е 4.1. Пусть xQ £ М", выполнено условие предложения 4.1 и пусть f(x, х) > —оо V# 6 Z M . Тогда функционал f(x0, •) является вы­ пуклым на Хм. Аналоги остальных приведенных выше свойств производной Кларка легко формулируются и доказываются для данного обобщения. Мы уста­ новим здесь лишь ацалоги свойств 2° и 7°. П р е д л о ж е н и е 4.2. Пусть функционал /: М ->• К является липшицевым с константой L вдоль выпуклого конуса К такого, что К — К = Хм. Тогда для любого х 6 М функционал f(x, •) принимает на Хм лишь конечные значения и является липшицевым на Хм вдоль К с той же константой L. Д о к а з а т е л ь с т в о . Фиксируем произвольную точку х ^ М. Из липшицевости /: М —>• К вдоль К (а значит, и вдоль —К) с константой L вытекает, что f(x,x)^L\\x\\ ЧхеКЦ (-К). Отсюда следует^ что /'(#, •) принимает на 1 м лишь конечные значения. Действительно, если х £ Xм, то х = х' — х", где х\ х" £ К& и согласно пред­ ложению 4.1, f{x, х) < Г(хш х') + Г(х9 ИГ) < +оо, после чего остается лишь воспользоваться свойством (4.1). Покажем теперь, что f(x, •) является липшицевым на Хм вдоль К с константой L. В самом деле, если х £ Хм% Ах £ К, то в силу сублинейно­ сти /"(ж, •) def _ _ __ # Д / - = f (а;, ж + Дж) —/' (х, a:)</ (я;, Д*)<£,|| Дя[|, — Д / ' = / ' ( * , ж + Дя — Дя) — / # (я, я + Дд-)</'(а:, — Д ж ) < £ | | Д 5 | | . Следовательно, | Д/" | «< L \\ Ах ||, что и требовалось доказать. П р е д л о ж е н и е 4.3. Пусть К — выпуклый конус в X, /: К ->• К — сублинейный функционал, липшицевый на К вдоль К с константой L. Тогда /'(0, х) является сублинейным продолжением f на X к = К — К, липшицевым вдоль К с константой L, причем любое другое сублинейное продолжение его мажорирует. Д о к а з а т е л ь с т в о . Действительно, если х, х £ К и е > 0, то в силу сублинейности / на К имеем _L ( / {X + E~x)-f (*))</ Й - 4 " (/ (BX + Bx)-f (вJ)), откуда вытекает,, что /*(0,; х) = f(x) Ух £ К, т. е. /* (0, •) есть продолжение /(•) на К— К. ' 3 Успехи матем. наук, т. 35, вып б 34 А. В. ДМИТРУК, А. А. МИЛЮТИН, Ы. П. ОСМОЛОВСКИЙ Сублинейность, конечность и липшицевость /*(0, х) на 1 к вдоль К с константой L были установлены в предложениях 4.1 и 4.2. Далее, пусть /: XK-*R — другое сублинейное продолжение /. Т а к ж е , как и выше, показываем, что У/х£Хк /"(О, x) — f(x). Тогда из условий КаХк и f\K=^j вытекает, что /" (0, • ) > / ' (0> ')•> а значит, и / ' ( • ) > • > / ' (0, •) на Хк. Предложение доказано. Ниже мы будем рассматривать f(x, x) лишь для случая, когда / задан на выпуклом конусе и называть f(x, х) просто производной Кларка, опуская слово «обобщенная». § 5. Теоремы о накрывании 1 ) Пусть X, Y — нормированные пространства, Y — конечномерно, К — выпуклый конус в X такой, что К — К = X, К0а К — выпуклый подконус, U = Bl (0) (ро > 0); UK = Я Р о (0, К) = U [\ К g: U K ^ Y липшицевый вдоль К оператор 2) с константой L. Пусть X' — пространство г алгебраически сопряженное к X, элементы которого мы обозначаем через х*.. Определим для произвольного х* £ X' константу накрывания относи­ тельно К0: р(х*, Ко) = sup {t | *, (-t) e <**, # i ( 0 , Ко))}, где 5 Х (0, Ко) = В* (0) П ^ о и s u p ( 0 ) = - о о . Очевидно, либо р(х*, К0) ^ 0, либо p(x*, Ко) = —оо, причем условие р(х*, Ко) ^ 0 равносильно тому, что либо #*, либо —х* является опор­ ным 3 ) к JK"0. Далее, пусть у* £ У* и y*g: UK -+R — функционал, определенный равенством (y*g)(x) = (у*, g(x)). Очевидно, всякий такой функционал являет­ ся липшицевым вдоль К (поскольку этим свойством обладает оператор g), а его производная Кларка в нуле (y*gY(0, x) есть сублинейный функционал на X, липшицевый вдоль К с константой \\ у* \\ L. Пусть % * £ ) ' ( 0 , 0 = {** 6 X' | <**,*>.< (y*gY(0, x) Vx е X} — множество опорных к функционалу (y*g)'(0, •). Очевидно, всякий функ­ ционал х* £ d(y*gY(0, •) является липшицевым на X вдоль К с той же кон­ стантой, что и (y*g)'(0, •). (В частности, если К — телесный конус в X, то функционал (z/*g)'(0, •) ограничен на всем X некоторой константой i ' > L и, следовательно, все его опорные ограничены той же константой.) Определим важнейшую для последующего изложения константу, с помо­ щью которой будет сформулирован критерий накрывания для g относитель­ но Ко- Положим 4) a(g, Ко) = inf {р(х*, Ко) | х* 6 d(y*g)'(0, • ) , » * € Y*, \\ у* || = 1}. Очевидно, либо a(g, К0)^> 0, либо a(g, К0) = —оо. При сделанных предположениях относительно X, Y, К, Ко, g: UK -+Y имеет место Т е о р е м а 5.1. Пусть a(g, K0) > 0. Тогда для любого положительного а' < a(g, К0) существует окрестность нуля TJ* cz U в X такая, что оператор g а9-накрывает относительно К0 на 5) U'K = Uf f| К. г ) Результаты этого параграфа получены А. А. Милютиным. 2 ) См. определение 2.2. ) Отметим, что к пустому конусу любой х* £ X' опорен по определению. 4 ) А. Д. Иоффе в [22] д л я К0 = X ввел к о н с т а н т у , к о т о р а я п р и определенных пред­ п о л о ж е н и я х совпадает с a {g, K0). 5 ) См. определение 2.6. 3 35 ТЕОРЕМА ЛЮ'СТЕРНЙКА И ТЕОРИЯ ЭКСТРЕМУМА Доказательство этой теоремы основывается на двух леммах, каждой из которых предшествует по вспомогательному предложению. Первая из лемм носит технический характер и позволяет свести вопрос о накрывании g относительно конуса к конечномерному случаю. Вторая же устанав­ ливает соответствующий критерий накрывания относительно конечномер­ ного телесного конуса и играет в доказательстве теоремы 5.1 основную роль. Перейдем к изложению предложений и лемм. Пусть /: Uk -> 01 — функционал, удовлетворяющий условию Лип­ шица вдоль К с константой L. Положим / Р (~) = sup хЕВр(0\ /' (х, х)(х£Х, 0<р<р0). К) Поскольку каждый функционал f'(x, •): X -> 01 (х £ В р (О, К)) является сублинейным и удовлетворяет на X условию Липшица вдоль К с констан­ той L, то этими же свойствами обладает и функционал /р: X ^ 0 1 ( О < р < р о ) . Предложение 5.1. lim /р (*) = / ' ( 0 , х) Р->+О V~x~eX. Доказательство. Требуемое}равенство эквивалентно следую­ щему: lim /' (х, х) =.f (0, х), х-+о, хек которое аналогично свойству 3° § 4 для обычной производной Кларка. Далее, пусть Ш — есть множество всевозможных конечномерных под­ пространств Я c z Z , . направленное отношением cz, а Т = St X (0, р 0 ) есть множество пар т = (Я, р), направленное следующим образом: (Я, р) < ( Я ' , р'), если Sf-.cz Н' и р > р ' . Д л я оператора g: Uк положим a(g, К0, Н, 9) ->• Y и конуса К0 при произвольных (Я, р) £ Т ! - = Ш{р(х*, K0(]H)\x*ed(y*g)'p, y*£Y*, ||j/*|| = l}, где (y*g)'p есть j'p при f = y*g. Ясно, что a(g, K0, Я , р ) < й ' ( £ , Щ) Кроме того, очевидно, что a(g,K0, V(tf, р)еТ. . Я, р ) < а ( £ , # 0 , Я ' , р ' ) , если (Я, р) -< (Я', р'). Следовательно, существует a (g, K0, Я , р) по направленному множеству Т, причем lima(g, т Лемма (5.1) предел величины K01\ iSVp-X-ate, K0). 5.1. Имеет место равенство lim at (g, К0, Я , р) = а + (^, К0)\ т где a + = max{a, 0}. Д о к а з а т е л ь с т в о. Очевидно, достаточно рассмотреть лишь случай a(g, К0)>0. Обозначим левую часть равенства (5.1) через а. Тогда для з* 36 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ любой пары т = ( # , р)£Т можно указать х*, у* такие, что y%£Y*, |[г/||| = 1 г xZed(y*g)mp и lim p (х*, K0f)H) = я. т При этом \{х%, х) | < L ||аг || VxeK(%e Т)х откуда в силу условия К — К = X вытекает ограниченность направленности {х*} в Х-топологии пространства X'. Направленность {у*} также ограничена](|| у% || = 1). Учитывая, что dim Y < +00, из направленности {х*, у*} можно выбрать поднаправленность {х* , г/* } v e N (где N — направленное множество) такую, что х% -*~х*£Х' в Х-топологии, а у* -+y*£Y* по норме. Положим у* =у* — у*. Поскольку производная Кларка от суммы не пре­ восходит суммы производных Кларка и верхняя грань суммы не превос­ ходит суммы верхних граней, то 0/?V£)PV< (y*g)hv + 6/?v£)pv. Следовательно, х* представим в виде суммы х* + х*,, где х* £ д (г/*#")р , х% £$(*/* g)p • Так как \\у* | | - ^ 0 , то константа Липшица вдоль К функцио­ нала х% стремится к нулю и, следовательно, х% —>-0 в Х-топологии. Далее, фиксируем Р6(0, р0). Тогда х* £d(y*g)$, начиная с некоторого v. Поскольку множество d(y*g)$ замкнуто в Х-топологии пространства Х\ то и lima:? = х*£ d\(y*g)$. В силу произвольности р > [ 0 отсюда и из предN v ложения 5.1 получаем, что х* £д (y*g)* (0, •). При этом ||z/*|| = l, так как ||»?vH = l (v€N). Значит, р(х*ч K0)^a(g, К0)>0. Для поднаправленности {#? }, как и для направленности {#?}, выпол­ нено условие lim р {х% . К0 П #v) = а, N V где (ffv, pv) = r v . Зафиксируем произвольное НаЗ£. IlmpOrS. N Поскольку Х>г зать, что (5.2) ^X Тогда, очевидно, K0(]H)^a. V В Х-топологии и р (х*ш Ко) > 0, то нетрудно пока­ р (а*, К0[\Н)^Ш1р « , К0 П Н). Следовательно, limp (я*, Ко[\Н)^а. Но, очевидно, что \imp(z*9K0(]H) = p(x*9K0). Таким образом, a (g, K0) <С р (а:*, К о) <С а. Учитывая также неравенство a (g, Ко) i> а, установленное до леммы, получаем, что a (g, К0) = р (а:*, К0) == а. Лемма доказана. ТЕОРЕМА Л Ю С Т Е Р Н И К А И ТЕОРИЯ ЭКСТРЕМУМА 37 З а м е ч а н и е 5.1. а) В доказательстве леммы 5.1 при a (g, Ко) > О установлено существование пары ж*, у* такой, что у* £ Y*, \\y* || = 1, х* 6 д (y*g)' (0, •) и р (х*, Ко) = a(g, Ко)- Если 0 £ Ко, то это свойство имеет место и при a (g, Ко) = О, так как в этом случае формула (5.2) по-преж­ нему верна, а в остальном доказательство не использует предположение a (g, Ко) > 0. б) Условие Ко cz К в доказательстве леммы 5.1 нигде не использова­ лось. Таким образом, лемма верна для произвольного выпуклого конуса K0czX. Следующее предложение устанавливает двойственный критерий для накрывания линейного оператора на конусе. П р е д л о ж е н и е 5.2. Пусть X, Z — нормированные пространства, Q — выпуклый и полный вдоль себя г) конус в X, A: Q -> Z — оператор, линейный и замкнутый на Q вдоль 2) Q. Пусть а > 0 такое, что для любого z*|£ Z*, || 2* || = 1, выполняется неравенство р (z*A, Q) ^> а. Тогда У а' £ 6 (0, а) оператор А а-накрывает на Q, т. е. А (Вг (0, О)) ZD Ва> (0). Доказательство. Положим N = А (В1 (0, Q)). Так как N выпукло и Vz* £ Z*, || z* || = 1 имеется включение (z*, N) =э (—а, а), то N всюду плотно в В% (0). Отсюда получаем (например, по теореме 1.6), что Va' < а А(В[ (0, Q)) ZD B% (0). Л е м м а 5.2. Пусть В£, $ — конечномерные нормированные простран­ ства, Q — выпуклый конус в Ж с непустой внутренностью, V9 — Вр (0, Q) (р > 0); fe: F p ->§) — липшицевый оператор. Пусть def a (й, Q, p) = inf {p (x*,Q)\x*ed (y*h)-p , */*€?)*, lltf*ll = l } = fl>0. Тогда для любого а такого, что 0 < a ' < a, оператор h а'-накрывает отно­ сительно Q на У р . Д о к а з а т е л ь с т в о . Пусть \i — регулярная неотрицательная мера на Ж, инвариантная относительно сдвига и положительная на Bf (0). Пусть 0: Ж -> 01 — неотрицательная непрерывно дифференцируемая функция, рав­ ная нулю вне Bf (0) и такая, что J е(з)[л(Аг) = 1. Поскольку оператор h; F p ->g) Липшицев на F p , то он [х-почти всюду диф­ ференцируем на V9. Пусть 0 <С S <С р. Положим й б(^)=б7Г J 9 ( ^ - ^ ) ^ ( ^ ) ^ ( ^ ' ) , где п = dim 36. Оператор /&б (ж) представляет собой осреднение оператора h. Очевидно, h& (x) определен и непрерывно дифференцируем во всякой точке х такой, что Вб (х) cz VQ. Множество таких точек обозначим через V9. Про­ изводная оператора h6; V9 -> §) в любой точке ж £ int V9 вычисляется по формуле hi (х) = ^ ( 0( - ^ ) А' (ж') ц (<**') и представляет собой оператор, определенный на 3L *) См. определение 2.3. 2 ) См. определение 2.4. 38 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Пусть у* 6 §)*, х £ X. Тогда <У*, К (*)й = ^ г f е ( - ^ Х ^ ) <У*> А ' (*')*> ^ № 0 ^ н р < г / * , А' (*')*>, где supremum берется по всем точкам х' £ V9, в которых производная h' (xr) имеет смысл. Далее, поскольку производная по направлению функционала не превосходит его производной Кларка, то sup(y*9h'(x,)'x)^(y*h)^(x). х' Таким образом, мы получили, что <y*,h'6(x)x)^(y*h)i(x) Vz£$, если х £ int Fp. Следовательно, уЩ (х) е д (y*hyp Ух 6 int Vl V#* £ 2)*. Отсюда по условию леммы вытекает, что для любого г/* 6 $*> II У* II = 1 имеет место неравенство Тогда согласно предложению 5.2 для любой точки х £ int Vp и любого а' £ 6 (0, а) оператор \h6 (x) а'-накрывает относительно Q (напомним, что всякий выпуклый конечномерный конус полон вдоль себя). По теореме 2.10 опера­ тор h6 а'-ыакрывает относительно й на int Fp. Поскольку при б ->0 h6 схо­ дится к h равномерно на каждом компакте, лежащем в int F p , то пользуясь теоремой 2.8, получаем утверждение леммы. Д о к а з а т е л ь с т в о т е о р е м ы 5.1. Пусть 0 < а' < a (g, Ко). Пользуясь леммой 5.1, выберем пару (Н, р) 6 Т так, что a <Ca(g, Ко, Н, р). При этом, не ограничивая общности, можно считать, что Н = Lin (К of] Н) (в противном случае, следует Н заменить на Lin (К0 П Щ)* Пусть U'K = В9 (0, К). Покажем, что оператор g: UK -+Y а'-накрывает на U'K относительно Ко. Другими словами, требуется показать, что если пара (х1ч рг) такова, что BQt (хъ Ко) а Вр(0, К), то g {В0х{х{, К0)) ID Ba>9l{g {Xi)). Рассмотрим оператор! gH: BPl (0, К0 f| H) - > F , определенный равенством gH(x) =g (Xi + x). H3JB^i04eHHH BPi (x{, K0) a Bp (0, К) и свойства 5° для обобщенной производной Кларка вытекает, что Vy*£Y*, Vx£K0 (y*gH)pl (0, l*X:(y*g)Z (xt, x), поэтому flfeH, K0f)H, pi)>a(g, K0l H, p ) > a ' . Тогда, согласно лемме 5.2, gH (В* (0, K0 Л Щ) =э BlPl (gH (0)), но, очевидно, g ( < (хи К0)) => gH ( < (0, К0 Г) Н)) и ёнФ) ~g (^i), откуда вытекает, что giBlix^K^^Bl^igix)). Теорема доказана. ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 39 Далее мы сформулируем и докажем теорему о накрывании на конусе для негладкого оператора с бесконечномерным образом, приспособленную для непосредственного использования в оптимальном управлении. Основой для ее доказательства служат теорема 5.1 и предложение 5.2. Сделаем следующие предположения. Пусть по-прежнему X, У — нор­ мированные пространства и У — конечномерно. Пусть К — выпуклый конус в X, полный вдоль себя и такой, что К — К = X. Пусть Uк = ВРо (О, К) (ро > 0), g: UK - > У — Липшицев вдоль К с константой L. Пусть помимо оператора g имеется также оператор Р: U K ->-Z, действующий в нормиро­ ванное пространство Z. Предположим, что Р строго дифференцируем в нуле относительно К и замкнут вдоль К на Uк (см. определения 2.4, 2.5). Тогда, как отмечалось в § 3, производная Р' (0): К -+Z также замкнута вдоль К. Положим W = Y X Z и зададим для определенности норму в W как сумму норм составляющих. Определим оператор G: U K -+W равенством G (х) = (g (х), Р (х)). Ниже будет дано достаточное условие накрывания для оператора G относительно Z на В р (0, К) при некотором р > 0. Отме­ тим, что в оптимальном управлении Р — оператор дифференциальной связи и локальных равенств, a g — оператор концевых ограничений. Положим a(g, Р9 K) = mf{p(x* + z*P' (0), К) \ x*ed[y*gy (0, .). г/*£У*, z*6Z*, max {|| у* ||, || z* ||} = 1 } . Т е о р е м а 5.2. Пусть a(g, Р, К) = а > 0. Тогда существуют с = = с (a, L) > 0 и окрестность нуля U' cz U в X такая, что оператор G с-накрывает относительно К на U'K = U' [\ К. Д о к а з а т е л ь с т в о . Пусть выполнено условие теоремы. Полагая у* = 0 в выражении для a (g, Р, К), получаем, что р (z*P* (0), К)^> а V z* £ Z, || z* || = 1. Тогда в силу предложения 5.2 оператор Р' (0): К -> Z а-накрывает относительно К при любом а £ (0, а). Далее, положим Ко •= {х £ К | Р' (0) х = 0}. Мы покажем, что a(g, Ко) ^ а, где a (g, К0) — та же константа, что и в теореме 5.1. Отсюда по этой теореме будет следовать накрывание относительно Ко для g: U к -> У на Вр (0, К) при некотором р > 0. Зная это и накрывание для Р'(0): if -> Z, мы докажем накрывание относительно К для оператора ^ ( я ) = = (g (х), P'(0) x): UK -> W на 5 р (0, Z). Отсюда с помощью теоремы 1.6 легко получим утверждение доказываемой теоремы. Таков план доказа­ тельства. Установим сначала одно вспомогательное утверждение. Пусть г/*|£ У*, у* Ф О^и #* 6 # (у*?)" (0, - ) - ' 1 Р а с с м о т Р и м линейный оператор 4 (х) = «ж*, я), Р ' (0) х): К -*R|X Z. Покажем,, что он й-накрывает при некотором а > 0. Так как Р' (0) а-накры­ вает на К, то Р ' (0) регулярен на К, а тогда по лемме 2.2 А также регулярен на К, т. е. либо он а-накрывает с а > 0 , либо А К Ф HI X Z. Если выполнено последнее, то найдется ненулевая пара (Я, z*) £ Dl X Z* такая, что <Яя* + z*i>' (0), Z> > 0, а это, как легко видеть, противоречит неравенству a(g, P, К) > 0. Таким образом, А является а-накрывающим при некотором а > 0. Докажем теперь неравенство a(g, K0) ^> а. Предположим противное: a (g, Ко) <. а' <. а. Тогда существуют у* £ У*, II у* II = 1 и #* 6 € в (*/*g)*(0, •) такие, что р (х*, К0) < а'. Рассмотрим оператор ^ : Z -*R X Z, Л (ж) = «я*, ж>, />' (0) х), 40 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ и положим оМ — А (Вг (0, К)) При этом, очевидно, выполняется по крайней мере одно из равенств: sup {t | (t, 0) 6 <d) = p (z*, K0), inf {t | (t9 0) 6 oS} = —P (**, Ко), пусть, например, второе. Тогда выпуклое с непустой внутренностью (ибо А накрывает) множество Л не пересекается с полупрямой П = {(*, 0) | * < -а'}. Следовательно, существуют X £К и z* £ Z* такие, что т а х { | Я | , ||«* ||} = 1 и inf((X, «*), а*> > sup <(Я, «*), П>. Из условия sup ((Я, z*), П) < + о о вытекает, что Я ^> 0, и тогда sup ((Я, z*), П) = —Ка'. Следовательно, тг<(Я, г*), < # » — Яа'. Но в таком случае ^(Яг* + я*РЩ, К) < Ал' < а'. Положим КХ* = х*, Ку* = z/J. Тогда < € d{y*lgy (0, •), max {|| у* ||, || г* || } = 1, откуда вытекает, что а = а(*, Р, К) < p(af + z*P'(0), К) < а'. Противоречие. Следовательно, a(g, К0) ;> а > 0. Отсюда, в частности, выте­ кает, что Ко непуст. Возьмем теперь любое а £(0, а) и выберем рг 6 (0, ро) так, что оператор g а-накрывает относительно К0 на BQi(0, К) (здесь мы пользуемся теоре­ мой 5.1). При этом, по условию теоремы, g Липшицев на ВPi (0, К) вдоль К с константой L. Покажем, что оператор Gt (х) - (g {х)ш Р (0) х): Вр% (0, К) -> W , накрывает относительно К с коэффициентом с = a2/(L + а). Действительно, пусть (#, р) таковы, что Вр (#, Z) с: В£ (0, ЛГ). Требуется показать, что Gt (BQ (х, К)) => Bcp (Gi (x)). Положим у = g (x), z = Р' (0) х, г = ф , и пусть (г/, z) £ W таковы, чта ll*/-z/IKr', ||z-z||<r", r'+r" = r. Покажем, что существует х£К, для которого | | # | | ^ р и Gt (х + х) = (г/, z). Действительно, в силу а-накрывания Р ' (0) существует z ^ / f такой, что WxiW^r''/а и Р ' (0) (x + Xi) = z. При этом в силу липшицевости g вдоль Z имеем g(z + Xi) = уи где ||г/± — y\\^L\\xi \\^L {r"/а). Отсюда \\У1-Н<Ь(^1а) + ^ ^ и поскольку r j ^ p , шар радиуса т) с центром в х содержится в 5 P t (0, К), a R силу а-накрывания # на i?Pl (0, /Г) относительно К0 существует х2 6 К0 такой, что^ ||^7||<r)/«» £ ( ? + £i + J^) = I/'и Р'(0)аГ2 = 0, т. е. Р ' (0) ( ж + 3 + 3 ) = = z. Так как Ц^ + ^ Н ^ Ь (г7« 2 )+г/а<!р, то требуемый x = xiJrx2 ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 41 найден, т. е. с-накрывание относительно К оператора Gt на BQl(0, К) установлено. Остается заметить, что при малом р > 0 оператор G близок к Gx на 5 р (О, К), поэтому для него выполнено условие теоремы 1.6, из которой вытекает утверждение теоремы 5.2. З а м е ч а н и е 5.2. Как видно из проведенного доказательства, в теореме 5.2 в качестве константы накрывания с для оператора G можно взять любое число, меньшее, чем a2/(L0 + я), где а = a(g, P, К), a L0 — предельная (по окрестностям нуля в К) константа Липшица вдоль К опе­ ратора g. Следующая лемма понадобится нам в § 6. Сохраним относительно К, g: U K ->Y\ P: U к -> Z прежние предположения. Л е м м а 5.3. Пусть a (g, Р, К) <С 0 и оператор Р регулярен относи­ тельно К в нуле г). Тогда существуют ж* ^ I 7 , у* ^ У*, z* £ Z* такие, что max {|| у* ||, || z* ||} > 0, х* 6 д (y*gy(0, •), <** + **Р' (0), #> > 0. Д о к а з а т е л ь с т в о . Поскольку при любом х* £ Х'р (#*, if) либо неотрицательно, либо равно (—оо), то случай a (g, P, К) = —оо является тривиальным. Далее, случай Р' (0) К = Z также тривиален. Поэтому пред­ положим, что a (g, Р, К) = 0 и при некотором а > 0 Р' (0) В, (0, К) => В\ (0). Из этого включения вытекает, что (5.3) p(z*P'(0), К) > а, если z* 6 Z*, || z* || = 1. Из равенства a (g, Р, К) = 0 вытекает существование последовательности {я*, г/*, £*} такой, что ^6^*; 46Z*; max{||y*||, ||z*||} = l; tied(y*gy(o, .); О<Р(Ж*+ЙР'(0), « ) < I M . Поскольку || i/n IK ll^nll равномерно ограничены, а все х% имеют общую константу Липшица вдоль К, то из последовательности троек {#£, Упч zn\ можно выбрать поднаправленность {х% , Уп , %* }VZN (N — направленное мно­ жество), сходящуюся к тройке (я*, г/*, 2*), причем я* стремится к ж* в Z-топологии пространства Z ' , z% стремится к z* слабо*, а г/* сходится к г/* по норме (поскольку dimY"<oo). Рассуждая как в соответствующем пункте доказательства леммы 5.1, отсюда легко получаем, что ** 6 д (y*gY(0, •), р (х* + z*P'(0), К) == 0. Остается лишь установить, что max {|| г/* ||, || z* ||} > 0. Мы покажем, что || у* || > 0. Действительно, если у* = 0, то || г/* || ->0, откуда выте­ кает, что а ) II z* || = 1, начиная с некоторого v £Nf б) константа Липшица вдоль К функционала #* стремится к нулю. Тогда, учитывая условие р (хп + zn P' (0), К)-*0, получаем, что p(znJP' (0), К)-*~0. Но это противоречит условию (5.3). Следовательноf 1|0*|]>О. Из условия р (х* + z*P (0), К) = 0 вытекает, что я* + z*P'(Q) опорен к К или к—К г поэтому заменив, если потребуется, #*, г/*, z* на —-#*, —у** —z*r мы получаем утверждение леммы. *) См определение 2,7. 42 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Отметим, что рассмотренное в этом параграфе достаточное условие накрывания является весьма грубым. Например, имеет место следующее несложно доказываемое утверждение. Т е о р е м а о б о б р а т н о й ф у н к ц и и [21]. Пусть dim X = = dim Y < оо, g: X ->Y — оператор, удовлетворяющий условию Липшица в некоторой окрестности нуля и a(g, X) > 0 — та же константа, что и в теореме 5.1 при Ко = К = X. Тогда существует окрестность нуля такая, что она отображается оператором g взаимно однозначно на окрест­ ность точки g (0) и обратное отображение также удовлетворяет условию Липшица. Следовательно, в случае dim X = dim Y < оо любой оператор g, накры­ вающий в окрестности нуля, но ни в какой меньшей окрестности не являю­ щийся гомеоморфизмом, имеет константу a (g, X), равную нулю. Проиллюстрируем это положение для случая X = Y = К2, причем 2 R рассмотрим здесь как комплексную плоскость. Пусть оператор g: К2 ->• К2 определен следующим образом: точка z = х + iy переходит в точку z2l\z |, если z Ф 0, и ноль переходит в ноль. Очевидно, этот оператор 1-накрывает на HI2. В то же время нетрудно убедиться, что a (g, К2) = 0 и , более того, для любого у* множество д (y*g)'(0, •) содержит нуль. Итак, даже в конечномерном случае полученный достаточный критерий накрывания весьма далек от необходимого, ибо пропускает много случаев хорошего (не экзотического) накрывания. В этом состоит его существенное отличие от условия Люстерника, которое в классе гладких операторов являет<ся]необходимым и достаточным для накрывания. S 6. Множители Лагранжа Ранее мы уже говорили о том, что критерий накрывания легко превра­ тить в необходимое условие экстремума. Сейчас мы проиллюстрируем это положение, воспользовавшись теоремами о накрывании из § 5 для получения правила множителей Лагранжа в задачах с липшицевыми функционалами. Опишем сначала класс задач, которые позволяет рассматривать тео­ рема 5.1. Пусть X — нормированное пространство, К0, К — выпуклые конусы в X, причем 0 6 Ко, Ко cz К, К — К = X. Пусть U = B* (0)(р0>0)ш UK = U[]K = BQo(0,K)a / . : K-+R(i = 0. . . . . го), gj: K-+R(j = l§...9n) — липшицевы вдоль К на Uк. Положим/ = (/0, . . ., / m ) , g = (gi, . - ., gn)% и пусть для простоты / (0) = 0, g (0) = 0. Рассматривается экстремальная задача А: /о (х) ->min, ft (х) < 0 (i = 1, . . ., т), g (x) = 0, х 6 К0. Мы скажем, что в точке ноль в этой задаче выполнена у-необходимость при у = || • ||, если ни при каком С > 0 не существует последовательности хп -> 0 такой, что U (х^ < —С || хп || (i = 0, . . ., т), g (хп) = 0В хп 6 Ко (Vn). Очевидно, это свойство необходимо для наличия локального минимума в нуле. Имеет место Т е о р е м а 6.1. Пусть для задачи А в нуле выполнена ^-необходимость при у = ||-1|. Тогда существует набор множителей Лагранжа (а, |3, х*) такой, что а 6 Rm+\ а > 0, р € ^ п , х* 6 д (а/ + р*)* (0. .). <**, Ко) > 0, | а | + | р | > 0. ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 43 Д о к а з а т е л ь с т в о . Определим вспомогательный оператор, сле­ дуя образцу, предложенному К. Ш. Цискаридзе. Положим X = Rm+i XX; У = [Ц™+1+"; g: K-+Y\ m+ К = К™+1 хК; x = (r, z)-+(f(x) +1 К0==ft™+1х К0, + r; g(x)) = y9 m+i где r=(r0, „ . , rm)£R *, R™ = {r £ K | r f > 0 Vi}. Нетрудно видеть, что для g, К, К0 выполнены все условия теоремы 5.1. Пусть в задаче А в точке нуль имеет место у-необходимость при у = ||-1|. Покажем, что тогда a (g, K0) = 0, где a(g, K0) — та же константа, что и в теореме 5.1 (отметим, что априори a(g, K0) ^> 0, поскольку 0 £ ^о)« Действительно, если a(g, ^ 0 ) > a > 0 , то, согласно теореме 5.1, опе­ ратор g: K-^Y а-накрывает относительно К0 на Вр (О, К) при некотором р > 0 . Следовательно, для любого достаточно малого е > 0 существуют з(е), г(е) такие, что х(г)£К0, г(г)еК+\ II* (е) || + \\г (е)||<е/я, Ы*(в)) + + rf (s) = —е (£ = 0, . . . , тга), g(x(e)) = 0. Так как rt ( e ) ^ 0 (г = 6, .. ., яг), то /f (х(г))^. — 8 ^ — а||з(е) ||. Отсюда видно, что 7_не°бходимость при 7 = ||-|| в нуле не имеет места. Итак, a(g, K0) = 0. Воспользуемся теперь замечанием 5.1(a) к тео­ реме 5.1, согласно которому существуют х* = (а, я*) 6 X1, у* = (Я, Р) £ У* такие, что || £* || = 1, i* € «(У*^Г (б, •), р ( £ * , £ 0 ) = 0. Последнее условие означает, что я* либо — х* опорен к /£0. Не ограни­ чивая общности можно считать, что (х*. К0)7>?0. Отсюда вытекает, что а ^ О и (я*, Z 0 )2^0, a из условия #*£3(y*g)' (0, •) следует, что а = 1 и ^ * ^ ( г / + Р«Г)'(0, ОТеорема доказана. Опишем теперь класс задач, который позволяет рассматривать тео­ рема 5.2. Пусть X, К, ft, gj, Uк те же, что и выше. Предположим допол­ нительно, что конус К является полным вдоль себя (и при этом 0 6 К). Пусть Z — нормированное пространство ж Р: К -> Z — оператор, замкнутый вдоль К на Uк, строго дифференцируемый относительно К в нуле и регулярный относительно К в нуле. Рассматривается задача В: fo(x ->min, ft(x) <; 0 (i = 1, . . . ? т), g(x) = 0, Р(х) = О, х £ К. Такая постановка задачи характерна для оптимального управления в случае конусных вариаций. Выполнение 7-необходимости при у = ||«|| в нуле для этой задачи означает, что ни при каком С > 0 не существует последователь­ ности хп ->0 такой, что fi(xn) < -С || хп || (г = 0, . . ., т), g(xn) = 0, Р(* п ) = 0, * п 6 К (Vrc). Т е о р е м а 6.2. Пусть в задаче В для точки\нулъ выполнена ||- ^необ­ ходимость. Тогда существует набор множителей Лагранжа (а, Р, ж*, z*) такой, что a6R w + 1 , a>0, p6^n, *ез(а/+Р*)!(о, z*£Z*, | а | + | Р | +11 z* | | > 0 , •)> <^*+Z*P'(0), л:)>о. 44 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ Доказательство проводится с помощью теоремы 5.2 и леммы 5.3 совер­ шенно аналогично доказательству теоремы 6.1. З а м е ч а н и е 6.1. Применительно к ситуации, описанной в тео­ реме 3.1, теорема 6.2 дает более слабый результат, чем теорема 3.1. Это видна из замечания 3.2 и того факта, что для функционала /: К -> 01, липшицевого вдоль К, для которого /в (0, •): К -> R, сублинейна на К, f (О, •) мажо­ рирует минимальное сублинейное продолжение функционала fB на X (кото­ рое, согласно предложению 4.3, совпадает с производной Кларка от fB (0, •)). Предложенный путь доказательства правила множителей не традиционен для этого направления в теории экстремума. Отметим, что во-первых, в тео­ реме 6.2 размерность Z не предполагается конечной (во всех работах по обоб­ щению множителей Лагранжа на липшицевы функционалы и оператор такое предположение делается), а во-вторых, оператор Р: К -+Z в этой теореме вообще не предполагается липшицевым. Если предположить, что Р отсут­ ствует и тем самым снять эти два обстоятельства (т. е. вернуться от задачи В к задаче А, в которой К = Ко и дополнительно требуется, чтобы К был полным вдоль себя), то правило множителей можно получить, не пользуясь теоремой о накрывании, э действуя в традиционном духе, т. е. используя функцию штрафа и принцип Экланда [20]. Чтобы дать представление об этом методе, приведем еще одно Д о к а з а т е л ь с т в о т е о р е м ы 6.1. Положим / т п £(г 0 ,..., гж, lu . . . U = 1/ 2 (4Г+ 2 Щ • Очевидно, £ — неотрицательный сублинейный функционал в Rm+n+1. В каж­ дой точке положительности он непрерывно дифференцируем, причем гра­ диент является вектором единичной длины, первые т + 1 компоненты кото­ рого неотрицательны. Для 8 > 0 рассмотрим функционал Рг{х) = С(/о (X) + 8 , . . . , fn(x) + Сразу отметим, что если Fe(x)>0, Fi(x, x)===(Yi^i(x)fi(.) 8, | gl(x) |, . . ., | gn(x) |). то + 2lh(x)gj(')y(x,x)1 где (<х0 (х), . . . , ат (х), Pi (х), . . . , р п (х)) = grad £ (/0 (х) + г, . . . , fm (x) + + е> gi(x), •••> gn{x))- Так как в задаче А в нуле имеется ||-||-необходимость, то существуют последовательности е ^ - ^ 0 + при N ->- оо и pN = =^NeN ->- О (далее индекс N у 8, р опускаем) такие, что Fe > 0 на Вр (О, К). то Поскольку Fe(0) = Vm+1'8» пользуясь очевидной модификацией прин­ ципа Экланда (здесь нужна полнота К вдоль себя), получаем xN£ 6 5 & y ^ ( 0 , К) такой, что функционал FB(x) + ,— \\x — xN\\ достигает ми­ нимума на Яр (0, K)fl(xN + K) в точке xN. Отсюда (так KaKe]/iV<p) вы­ текает, что Vx(zK (6.1) FQ(XN, X)^2 7=-||ж||, т. е. уN (2a*(^)/i + S P / ( ^ ) ? l ) e ( ^ 5>—j^-H^II- Пусть (а, Р) — предельная точка для (a (xN), P (xN)). Тогда | а | + I Р | > 0 . Так как xN£K и xN-*0, а / ь gj липшицевы вдоль К, то из (6.1) сле­ дует, что Ух£К ( 2 а г / г + 21 fijgjY (О? х)^0. Тем самым правило множи­ телей доказано. Это доказательство обобщает доказательства, данные Кларком [7J и Хириартом-Уррути [23], так как они доказали лишь ослабленные варианты ТЕОРЕМА ЛЮСТЕРНИКА И ТЕОРИЯ ЭКСТРЕМУМА 45 правила множителей. Кларк доказал, что неотрицательной будет не про­ изводная комбинации, а комбинация производных Кларка. Хириарт-Уррути существенно использовал конечномерность X. Кроме того, они рассматри­ вали функционалы не на конусе, а во всем пространстве. Надо сказать, что для липшицевых функционалов и операторов правило множителей Лагранжа является весьма не совершенным условием в теории экстремума, как и условие a(g, К) > О — не совершенным обобщением условия Люстерника. Действительно, можно построить пример липшицева отображения g: R,4 ->-3l3, для которого в нуле a(g, Ft4) > О, но в то же время для любого линейного функционала I: 314 ->• % система Z, g в нуле обладает множителями Лагранжа х ). Остается открытым вопрос, всегда ли к конечномерному липшицеву оператору g: W1 ->» Кт с условием в нуле a(g, X) > О можно добавить липшицевый функционал /: К71 - • К так, чтобы система/, g в нуле не обла­ дала множителями Лагранжа. Положительное решение этого вопроса позво­ лило бы доказать липшицеву структуру уровня липшицева оператора в окре­ стности нуля при условии, что в нуле a(g, X) >> 0. Далее, рассмотрим две задачи: (6.2) x = g(y), *eiR n , /(*)->min, yeRn, def (6.3) ф (») = / ( * (j,))->min t y ^ \ n эде g(0) = 0 и в нуле a(g, Hl )>0. Как известно, g в этом случае осуществляет взаимно липшицевый гомео­ морфизм окрестностей нуля в Яп. Таким образом, задачи (6.2) и (6.3) экви­ валентны с точностью до невырожденной переписки. Тем не менее они, вообще говоря, не эквивалентны по отношению к наличию или отсутствию мно­ жителей Лагранжа. Можно построить пример, когда у задачи (6.2) мно­ жители Лагранжа есть, а у задачи (6.3) их нет и обратный пример, когда у задачи (6.3) есть множители Лагранжа, а у задачи (6.2) их нет. Таким образом, наличие множителей Лагранжа не]инвариантно по отно­ шению к невырожденной переписке задачи. Это серьезный дефект обобщен­ ного на производные Кларка правила множителей Лагранжа (здесь уместно подчеркнуть, что множители Лагранжа есть продукт аппроксимации системы, а не самой системы, как об этом уже говорилось в [8], так что причина неин­ вариантности связана не с классом липшицевых отображений, а с производ­ ной Кларка). Инвариантность при невырожденной переписке играет важ­ ную роль в теории экстремума, ибо позволяет получать условия экстремума не отдельных задач, а классов задач путем выделения в каждом классе кано­ нической задачи, к которой все остальные сводятся с помощью невырожден­ ной переписки. Так, например, дело обстоит в теории оптимального управ­ ления [10], [11]. ЛИТЕРАТУРА [1] Л. А. Л ю с т е р н и к. Об условных экстремумах функционалов.— Матем. сб., 1934, 41:3, с. 390—401. [2] Л. А. Л ю с т в р н и к, В. И. С о б о л е в . Элементы функционального анализа.— М.: Наука, 1965. [3] L. M. G r a v e s . Some mapping theorems.— Duke Math. J., 1950, 17, p. 111—114. [4] А. Д. И о ф ф е, В. М. Т и х о м и р о в. Теория экстремальных задач.— М.: Наука, 1974. х ) То есть в задаче I -+• min, g = 0 в нуле есть множители Лагранжа в смысле тео­ ремы 5.1. 46 А. В. ДМИТРУК, А. А. МИЛЮТИН, Н. П. ОСМОЛОВСКИЙ [5] В. М. Т и х о м и р о в . Некоторые вопросы теории приближений.— М.: Йзд-в'о*МГУ, 1976. [6] В. М. А л е к с е е в, В. М. Т и х о м и р о в, С. В. Ф о м и н . Оптимальное управ­ ление.— М.: Наука, 1979. [7] F. Н. С 1 а г к е.ч Generalized gradients and applications.— Trans. Amer. Math. S o c , 1975, 205, p. 247—262. [8] E. С. Л е в и т и н, А. А. М и л ю т и н, Н. П. О с м о л о в с к и й. Условия высших порядков локального минимума в задачах с ограничениями.— УМН, 1978, 33:6, с. 85—148. [9] А. А. М и л ю т и н. О квадратичных условиях экстремума в гладких задачах с ко­ нечномерным образом. — В кн.: Методы теории экстремальных задач в экономике. — М.: Наука, 1980. [10] А. Я. Д у б о в и ц к и й , А. А. М и л ю т и н . Задачи на экстремум при наличии ограничений.— ЖВМ и МФ, 1965, 5:3, с. 395—453. [11] А. Я. Д у б о в и ц к и й , А. А. М и л ю т и н Необходимые условия слабого экстре­ мума в общей задаче оптимального управления.— М.: Наука, 1971. [12] А. В. Д м и т р у к . К обоснованию метода скользящих режимов для задач опти­ мального управления со смешанными ограничениями.— Функц. анализ, 1976, 10:3, с. 39—44. [13] В. А. Я к у б о в и ч . К абстрактной теории оптимального управления. I.— СМЖ,» 1977, 18:3; П.— СМЖ, 1978, 19:2; III.— СМЖ, 1979, 20:4; IV.— СМЖ, 1979, 20:5. [14] А. С. М а т в е е в. Необходимые условия экстремума в задачах оптимального управ­ ления с ограничениями общего вида.— Деп. ВИНИТИ, часть I — № 2318-79 от 26.VI.79, часть II — № 2641-79 от 18.VII.79, часть III— № 2642-79 от 18.VII.79. [15] К. III. Ц и с к а р и д з е. Экстремальные задачи в банаховых пространствах.— В кн.: Некоторые вопросы математической теории оптимального управления.— Тбилиси, ротапринт ИПМ ТГУ, 197^ [16] М. Ф. С у х и н и н. Об ослабленном варианте правила множителей Лагранжа в банаховом пространстве.— Матем. заметки, 1977, 21:2, с. 223—228. [17] М. Ф. С у х и н и н. Правило множителей Лагранжа как необходимое условие квазикритичности отображений банаховых пространств.— УМН, 1978, 33:2, с. 183— 184. [18] Е. С. Л е в и т и н. Об условиях локального минимума в экстремальных задачах с ограничениями.—ДАН, 1975, 221:5, с. 1031—1034. [19] Е. С. Л е в и т и н . К теории возмущений негладких экстремальных задач с огра­ ничениями.— ДАН, 1975, 224:6, с. 1260—1263. [20] И. Э к л а н д, Р. Т е м а м . Выпуклый анализ и вариационные проблемы.— М.: Мир, 1979. [21] Г. Г. М а г а р и л - И л ь я е в . Теорема о неявной функции для липшицевых отображений.—УМН, 1978, 33:1, с. 221—222. [22] A. D. I o f fe. Differentiells[generalisees d'application localement Lipschitziennes d'un espace de Banach dans un autre.—G. R. Acad. Sci. (Paris), 1979, 289:13, p. 637—640. [23] J. B. H i r i a r t - U r r u t y . Refinements of necessary optimality conditions in nondifferentiable programming I.— Appl. Math, and Optimization, 1979, 5:1, p. 63— 82. [24] H. M a u r e r , J. Z о w e . First and second order necessary and sufficient optimality conditions for infinite-dimensional programming problems.— Mathem. programming, 1979, 16:1, p. 98—110. . Поступила в редакцию 23 июня- 1980 г.