РОССИЙСКАЯ ФЕДЕРАЦИЯ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФАКУЛЬТЕТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК КАФЕДРА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ Вариационное исчисление и методы оптимизации Часть 1 Вариационные методы математической физики. Методические указания для студентов Факультета математики и компьютерных наук ИЗДАТЕЛЬСТВО ТЮМЕНСКОГО ГОСУДАРСТВЕННОГО НИВЕРСИТЕТА 2004 Методические указания утверждены на заседании кафедры математического моделирования Печатается по решению учебно-методического Совета университета Методические указания содержат лекционный материал по дополнительным главам вариационного исчисления. В основу положены вариационные методы математической физики, интерес к которым в последнее время возрастает, в том числе, в проектных и научноисследовательских организациях нефтегазовой отрасли Тюменской области. Составитель: Кутрунов В.Н.- д.ф.-м.н. профессор кафедры математического моделирования ТюмГУ. Ответственный за выпуск: Баринов В.А.- к.ф.-м.н., доцент кафедры математического моделирования ТюмГУ. @ Тюменский государственный университет, 2004 @Кутрунов В.Н. 2 Лекция 1. Элементы функционального анализа. Теорема о минимуме квадратичного функционала. Определение. Некоторое множество M называется линеалом, если a1 , a2 M выполняется равенство a1 a2 M , , R . Определение. Линеал нормой M со скалярным произведением ( , ) и 2 a =(a,a), введенной на основе скалярного произведения, называется предгильбертовым пространством S1 . Определение. Фундаментальной называется последовательность u n , если lim u m u n 0 . n , m Определение. Если всякая фундаментальная последовательность в S1 сходится к некоторому элементу из S1 , то S1 называется плотным пространством. Такое пространство называется гильбертовым и обозначается буквой H . Определение. Линеал M называется плотным в H , если u H u n , что lim u n u 0 . n Везде уравнения далее будет рассматриваться решение операторного Au f , f H , u Г 0, где Г граница области задания оператора A и последнее условие называется граничным условием. В некоторых случаях оператор может быть нелинейным, а граничное условие другим. Так как в дальнейшем будут разыскиваться обобщённые решения операторного уравнения, то имеет смысл понять, что является его классическим решением. Это понятие 3 зависит от оператора и обычно предполагается тождественное удовлетворение уравнения и граничных условий. Например, надо решить уравнение предполагается, что функция u f , u 0 . В классической ситуации Пуассона f непрерывная функция, тогда естественно, что u ищется в классе дважды непрерывно дифференцируемых функций, обращающихся в нуль на границе области. Множество этих функций, очевидно, является линеалом и в литературе обозначается как DA . В общем случае элементы множества DA должны образовывать линеал и если существует классическое решение, то оно тождественно удовлетворяет операторное уравнение и принадлежит этому линеалу. Определение. оператор A , если Симметричным в DA D называется симметричный оператор, обладающий двумя свойствами: 1. Au, u 0 u 0. Теорема. линейный u, v D выполняется равенство: Au, v u, Av . Определение. Положительным в если называется Если Au, u 0, u D , 2. A положительный оператор, то уравнение Au f , где f H , u D имеет не более одного решения. Доказательство. Пусть разность u1 и u 2 - два решения. Рассмотрим u1 - u 2 , так как Au1 f и Au2 f , то Au1 u2 0 . По этой причине оператора Au1 u2 , u1 u2 0 . Вследствие положительности A отсюда получается u1 - u 2 =0,.то есть u1 = u 2 . Что и требовалось доказать. Теорема. (о минимуме квадратичного функционала). Пусть A положительный оператор в D и пусть уравнение Au f имеет 4 u 0 D , решение тогда квадратичный функционал F u Au, u 2 f , u принимает на u 0 минимальное в D значение, то есть F u F u 0 , u D , причем F u F u 0 , только если u u 0 . Наоборот, пусть F u принимает свое минимальное значение в D на некотором элементе u 0 D , тогда u 0 - решение уравнения Au f в H . Доказательство. уравнения, т.е. u 0 D решение Пусть операторного Au0 f , f H . Покажем, что именно это решение минимизирует квадратичный функционал. Рассмотрим тождественное преобразование F u Au, u 2 f , u Au, u 2 Au0 , u Au u0 , u u0 Au0 , u0 . Так как второе слагаемое константа, то видно, что функционал может быть минимизирован только за счёт первого слагаемого Au 0 u , u0 u . Причём, из-за положительности оператора A это слагаемое Au 0 выбором можно u уменьшить только до нуля, т.е. u , u0 u 0. Тогда из-за положительности A следует, что u- u0 =0 и найден минимизирующий элемент u=u0 Покажем обратное, пусть функционала, то есть u 0 D обеспечивает минимум квадратичного F u0 Au0 , u0 2 f , u0 min F (u) , тогда этот элемент решение операторного уравнения. Для произвольного v из D и произвольного параметра t рассмотрим элемент w= u0 tv . Так как w u0 , то элемент w - не минимизирует функционал, т.е. 5 F u0 tv Au0 , u0 2t Au0 , v t 2 Au, v 2t f , v 2 f , u0 F (t ) F u0 Так как u 0 D обеспечивает минимум квадратичного функционала, то функция F t t 0 , тогда имеет минимум при dF dt производную, после элементарных выкладок получаем Так как 0 . Вычисляя t 0 Au0 f , v 0 . v - произвольный элемент из D и D плотно в H , то элемент Au0 f ортогонален всем элементам из D , следовательно, и всем элементам из Н. Таким свойством может обладать только нулевой элемент, поэтому Au0 f =0, или Au0 f , что и требовалось доказать. Пример. Рассмотрим дифференциальное уравнение, описывающее прогиб балки под действием нагрузки Ju q , где J 0 , q(x) H J характеризует жесткость балки на изгиб, u x - прогиб балки. Оператор A распределённая нагрузка, действующая на балку. Коэффициент действует по пространство правилу Au EJu . Возьмем за гильбертово H пространство всех квадратично- суммируемых функций L2 (0, l ) . Построим некоторое множество из всех функций u, имеющих четыре производные с краевыми условиями: u (0) u (l ) 0, u (0) u (l ) 0 . Это множество функций является линеалом DA. Действительно, для линейных комбинаций w u v выполняются условия дифференцируемости и записанные граничные условия, если эти условия выполняются для элементов, из которых составлена комбинация. Кроме того, из функционального анализа известно, 6 что это множество функций является всюду плотным в L2 (0,l), то есть в H . Покажем, что A - положительный в DA оператор. Для этого докажем, что оператор A положительный и симметричный. 1. Симметрия: Надо показать, что для любых элементов u,v из DA выполняется равенство Au, v u, Av . l Au, v EJu vdl , Вычислим скалярное произведение так как 0 v D , то можно дважды выполнить интегрирование по частям. Из-за принятых граничных условий для функций из DA внеинтегральные слагаемые будут обращаться в нуль. Окончательный результат имеет вид: l Au, v EJuvdl . 0 Аналогично доказывается равенство l u, Av EJvudl . 0 l Следовательно, доказана симметрия u, Av Au, v EJvudl 0 2. Положительность. Надо показать, что Au, u 0, u D 2) Au, u 0 u 0 1) Из найденного вида скалярного произведения и того, что следует, что для любого элемента u D 7 EJ 0 l Au, u EJ (u) 2 dl 0 0 Далее, пусть Au, u 0 , произведения тогда из предыдущей записи скалярного следует цепочка Au, u 0 (u) 2 0 u 0 u x . утверждений Тождественное равенство нулю второй производной следует из того, что под интегралом находится непрерывная неотрицательная функция. Кроме того, так как u D , то она обязана на границах интервала обращаться в функция нуль, следовательно, Запишем 0 u 0 . Положительность доказана. F u Au, u 2 f , u функционал через найденное скалярное произведение: l l 0 0 F (u) EJ (u) 2 dl 2 fudl . Этот функционал ставит в соответствие произвольной функции u D число F(u). Из технического курса сопротивления материалов известно, что это число равно удвоенной потенциальной энергии, которую накапливает упругая балка, если её прогиб задаётся функцией u (x) . Важное замечание: В данном тексте этот функционал найден как следствие краевой задачи об изгибе балки, записанной в форме дифференциального уравнения. Инженеры, специалисты по теории прочности, умеют вычислять накопленную потенциальную энергию деформации балок и значительно более сложных объектов из прямых “энергетических” соображений. В некотором смысле с инженерной точки зрения энергетический функционал первичен, а соответствующее ему дифференциальное уравнение вторично. Нестрого говоря, этот факт аргументирован и с математической точки зрения: Непосредственно из 8 вида функционала усматриваем, что от функции потребовать существования только двух дифференциальное уравнение требует u (x) достаточно производных, тогда как существования четырёх производных. Дифференциальное уравнение накладывает на функцию u (x) , быть может, чрезмерно ограничительные условия, которые не требуются с технической точки зрения. По этой причине вместо решения операторных (дифференциальных) уравнений целесообразно искать минимум некоторого функционала в более широком, чем линеал, классе функций. Функции, найденные из минимизации функционала, могут и не удовлетворять операторному уравнению, так как будут найдены при менее обременительных условиях. Например, у этих решений может существовать меньшее количество производных, чем требуется для подстановки в операторное уравнение. Тем не менее, такие решения также будем называть решениями операторного уравнения u f , добавив отличительный признак “обобщённое решение”. Естественно ожидать, что если существует классическое решение операторного уравнения, то найденное “обобщённое решение” будет совпадать с ним. При первом знакомстве кажется парадоксальным, что за решение принимается нечто, что не удовлетворяет уравнению в классическом смысле. Но если заметить, что уравнения получаются вследствие внесённого математиком предположения, которое звучит так: «пусть функции обладают всеми свойствами, нужными для проведения выкладок» и понять, что это предположение чаще всего не совпадает с реальностью, то становится ясно, что «обобщённые решения» могут оказаться «лучше» классических. Лекция №2 Расширение линеала Линеал DA на некоторое пространство H. DA достаточно узкое множество. На элементы множества наложены излишние ограничения, которые не вытекают из существа 9 рассматриваемой задачи, не вытекают из вида функционала. Линеал в общем случае не является пространством, по этой причине задача приближения точного решения с любой наперёд заданной точностью с помощью последовательности приближённых решений из линеала общем случае обречена на провал, так как в линеале DA в DA может отсутствовать элемент, являющийся точным решением задачи о минимуме квадратичного функционала. По этой причине возникает задача о расширении линеала DA до гильбертова пространства, называемого H A . В таком пространстве квадратичный функционал всегда будет иметь минимум, следовательно, всегда будет существовать обобщённое решение операторного уравнения. Вопрос о том, когда это обобщённое решение будет также и классическим, это отдельная теоретическая проблема. Эту проблему можно расширить и поставить задачу о том, какими конкретными свойствами будет обладать обобщённое решение. Например, если решается некоторое дифференциальное уравнение математической физики и вопрос сведён к поиску обобщённого решения, то можно попробовать выяснить вопрос о дифференцируемости обобщённого решения в области, о его поведении на границе и.т.д. Определение. определенным в из линеала Оператор A называется положительно DA , если: 1) он симметричен в DA ; 2) для любого u DA выполняется неравенство: ( Au, u ) C 2 u Здесь константа 2 C определяется оператором A и не зависит от элемента u , а норма элемента понимается в смысле гильбертова пространства H . Определение. Определим на D A новое скалярное произведение u, v A по формуле u, v A ( Au, v) 10 Чтобы убедится в том, что это действительно скалярное произведение, нужно проверить аксиомы скалярного произведения: 1) (U ,V ) A (V , U ) A 2) (U1 U 2 ,V ) A (U1 ,V ) A (U 2 ,V ) A 3) (U ,U ) A 0 и (U ,U ) A 0 U 0 . Легко видеть, что аксиомы (1)-(3) действительно выполняются и являются следствием симметрии, линейности и положительной определенности оператора А. На основе введённого скалярного произведения обычным образом вводится понятие нормы и расстояния межу элементами: u A Линеал u, u A , A (u, v) DA с введённым uv A скалярным произведением, нормой и расстоянием является предгильбертовым пространством обозначаемым SA . Замечание: Учитывая новые введённые понятия нормы и скалярного произведения, а также понятие положительной определённости, можно записать следующую цепочку равенств: Au, u (u, u) A Отсюда, после u 2 A C2 u извлечения 2 корня квадратного, получается важное неравенство, показывающее связь норм, определённых на основе разных скалярных произведений: u 1 u C A Оно позволяет строить различные оценки, делать заключения о сходимости. Пусть последовательность un DA сходится к элементу u0 D A в смысле сходимости пространства S A , то есть un u0 11 A 0 Так как un u0 DA , то, используя неравенство, выражающее связь норм, получим: u n u0 1 u n u0 C A Неравенство показывает, что из сходимости последовательности в SA следует сходимость в H , обратное утверждение может не иметь места, по крайней мере, оно не следует из неравенства связей норм. Из указанной связи норм вытекает, что если некоторая последовательность в S A фундаментальна, то она фундаментальна и в H . Действительно, пусть un DA n, m имеем фундаментальная un um A последовательность, тогда для 0 . Так как un um D A , то из неравенства связей норм следует, un um 1 un um C A Из стремления к нулю правой части неравенства, вытекает, что для n, m имеем последовательности un um 0 , следовательно, фундаментальность un DA в пространстве H доказана. Вернёмся к вопросу о дополнении линеала DA до полного пространства. Один этап этой процедуры уже выполнен, а именно, на линеале введено новое скалярное произведение превратился в предгильбертово пространство SA . Рассмотрим фундаментальные последовательности в предгильбертова пространства надо добавить к которых в и теперь линеал S A . Для пополнения S A особые элементы, S A пока не существует и таких, чтобы всякая фундаментальная 12 последовательность в расширенном пространстве имела предел. Кроме того, надо будет доопределить понятия скалярного произведения, нормы и расстояния так, чтобы эти понятия имели место и для новых элементов, не нарушая при этом старые определения. Полученное расширенное пространство станет гильбертовым. Пространства, построенные по такой схеме, иногда называют энергетическими, так как скалярные произведения введённого типа используются при вычислениях потенциальной энергии, например, в механике деформируемого твёрдого тела. Для пополнения предгильбертова пространства S A воспользуемся понятием классов эквивалентности. Разобьем все фундаментальные последовательности на 2 группы: 1) M 1 -все последовательности, для которых есть пределы в S A . 2) M 2 - все последовательности, для которых не существует пределов в SA . un , vn Определение. Две последовательности эквивалентными, если lim un vn n A называются 0. Покажем, что если две последовательности сходятся к одному и тому же пределу, то они эквивалентны. Возьмем некоторое u0 S A и две последовательности un u0 , vn u0 , тогда по неравенству треугольника следует: un vn при A un u0 u0 vn A un u0 A vn u0 A , так как n правая часть неравенства стремится к нулю, то стремится к нулю и левая часть. Следовательно, последовательности эквивалентны. С практической точки зрения, un , vn любую из последовательностей можно использовать для получения приближения к 13 элементу u0 S A , так как они сходятся к нему, отличаясь, быть может, скоростью сходимости. В этом и заключается смысл эквивалентности. Если нас не интересует скорость сходимости, то последовательности теоретически не различимы, так как представляют один и тот же элемент. Чтобы узаконить отсутствие различия вводятся классы эквивалентности. Определение. Классом эквивалентности называются эквивалентные между собой функциональные последовательности. все Теорема (о фундаментальных последовательностях, имеющих предел в S A ). Каждому классу эквивалентности соответствует один и только один элемент u из S A , а именно тот, к которому сходится любая из последовательностей класса, и наоборот, каждому элементу из SA соответствует один и только один класс эквивалентности. Теорема устанавливает взаимно-однозначное соответствие между элементами DA и всеми классами эквивалентности, составленными из сходящихся в множество S A последовательностей. Напомним, что линеал DA и S A поэлементно совпадают, но в множестве S A введено скалярное произведение. Теорема. (О фундаментальных последовательностях, не имеющих предела в S A ). Каждому из классов эквивалентности соответствует единственный элемент u , а именно тот, к которому сходится любая последовательность из класса эквивалентности в пространстве H . Объединим все такие элементы и обозначим их через DI . Можно показать, что между элементами составленными имеющих в из всех DI и классами эквивалентности, фундаментальных последовательностей, не S A предела, существует взаимно однозначное соответствие. 14 Отметим ещё раз, что элементами DI являются элементы из H , которых не было в множестве D A . Пополним множество обозначим т.е. DA элементами DI и D DA DI . Между полученное множество элементами D и всеми классами эквивалентности множества S A D, установлено взаимно однозначное соответствие. Элементы u0 , v0 D и две сходящиеся линеал. Действительно, возьмем любые последовательности, состоящие D образуют только из элементов DA un u0 , vn v0 , что по построению всегда можно сделать. Надо показать, что u0 v0 D при любых , R . Так как un , vn D A , то un vn DA D . Переходя в этом вложении к пределу, получаем требуемое утверждение u0 v0 D . Полученный линеал D еще не является гильбертовым пространством. Нужно доказать что в D можно ввести скалярное произведение, норму и расстояние и доказать полноту этого пространства. Для любых u, v D введём новое определение скалярного произведения через последовательности из соответствующих классов эквивалентности: Определение (u, v ) A lim (un , v n ) A . n Для нового определения надо показать, что 1) предел существует и конечен. 2) предел не зависит от выбора последовательностей из классов эквивалентности, соответствующих выбранным элементам 3) введённое скалярное произведение скалярного произведения. 15 обладает u, v . всеми свойствами 4) Новое скалярное произведение не противоречит введённому ранее скалярному произведению на линеале DA . Доказательства этих фактов в данном тексте опускаются. После введения скалярного произведения вводится норма и расстояние: u A u, u A , A (u, v) uv A Определение. Предгильбертово пространство D с введённым скалярным произведением, гильбертовым пространством нормой и называется HA Теорема. Гильбертово пространство является полным, а линеал расстоянием H A в указанной метрике DA плотен в H A . Чтобы показать характер трудностей, возникающих здесь, представим наброски возможного доказательства. Так как пространство HA построено из элементов, последовательностям линеала плотность соответствующих фундаментальным DA , то по построению почти очевидна DA в H A . Доказательство полноты H A менее очевидно. Надо доказать, что любая фундаментальная последовательность в H A имеет в этом пространстве предел. Трудность заключается в том, что некоторые из таких фундаментальных последовательностей могут быть частично или полностью построенными из элементов пополнения DI и о пределах таких последовательностей ничего не известно. Эта трудность обходится с помощью замены указанной фундаментальной близкой к ней последовательностью из элементов построению любой элемент из последовательности из последовательности DA . Так как по DI является пределом некоторой DA , то такая замена может быть выполнена с любой наперёд заданной точностью. Остаётся показать, что новая 16 последовательность, составленная из элементов значит, имеет в DA фундаментальна, а, H A предел и этот же предел имеет и исходная фундаментальная последовательность из элементов DI . Эти доказательства опускаются. Легко показать переходом к пределу, что если на линеале DA задан положительно определённый оператор, то он будет положительно определённым и в H A , то есть для любого u из DA имеет место неравенство: ( Au, u ) C 2 u 2 Как следствие положительной определённости, введённого скалярного произведения и неравенства Шварца на его основе возникает и неравенство, характеризующее связи норм пространств H и u 1 u C HA . A Пространство H A оказывается достаточно широким, чтобы в нем можно было не предполагать, а доказать существование минимума квадратичного функционала. Найденный в H A минимум является обобщенным решением уравнения Au f . Это решение не будет классическим, если оно принадлежит H A , но не принадлежит DA , при этом, если у уравнения существует классическое решение, то оно и будет давать минимум функционала. Подчеркнём ещё раз, что поиск обобщённого решения уравнение могло быть условиях. представляется более правильным, так как получено при чрезмерно обременительных 17 Лекция№3. Существование минимума квадратичного функционала в HA . Теорема о минимуме квадратичного функционала на множестве DA предполагала существование такого минимума на этом линеале. Утверждение. Введенное выше энергетическое пространство u HA достаточно широкое, такое, что в нем можно не предполагать, а доказать существование минимума квадратичного функционала F(u). Определение. Найденный минимум функционала в гильбертовом пространстве u H A называется обобщенным решением операторного уравнения Au = f. В общем случае это решение не является классическим, но если у уравнения существует классическое решение, то оно и будет минимумом этого функционала (теорема о минимуме квадратичного функционала на линеале DA ). Причина, по которой обобщённое решение может не быть классическим решением, может быть усмотрена из следующего примера Пример. Простейшее дифференциальное уравнение второго порядка. u f , u(0) = u(l) = 0, Уравнение будем рассматривать в гильбертовом пространстве L2 0, l со скалярным произведением l L2 0, l ux v x dx 0 Введем в предгильбертовом пространстве S A скалярное произведение по формуле l S A Au, v u, v A u '' ( x )v( x )dx , 0 18 Интегрирование по частям и учёт граничных условий позволяют рассматривать это скалярное произведение в следующем виде: l S A ux v x dx , 0 С учётом этой формы скалярного произведения квадратичный функционал F(u) = (Au, u) - 2(f, u), может быть записан в виде: l l 0 0 2 F u ux dx 2 f u dx . Если теперь рассматривать этот функционал в пространстве HA , полученном пополнением предгильбертова пространства S A , то из записи функционала видно, что среди элементов u(x) могут рассматриваться, например, функции, имеющие только первую производную. Из вида функционала существование второй производной не требуется, её может и не существовать. Но такую функцию, найденную из минимума квадратичного функционала, нельзя подставить в исходное дифференциальное уравнение и получить классическое тождество. С технической точки зрения поиск обобщённого решения может быть оправдан тем, что функционал во многих случаях можно считать первичным, а дифференциальное уравнение получено из него наложением дополнительных требований, постановки задачи. которые не вытекают из исходной Вывод. Решения, получающиеся в результате минимизации F(u) в HA , получаются при менее обременительных условиях, чем в операторной формулировке. Рассмотрим задачу поиска обобщённого решения операторного уравнения с положительно определенным оператором А f H , 19 u HA . Для этого нам необходимо найти минимум квадратичного функционала F u u, u A 2u, f , u H A , Теорема. (О минимуме квадратичного функционала в на линеале DA задан положительно определенный оператор A. DA плотен в гильбертовом пространстве минимум H A . Тогда функционал F (u ) имеет u0 H A , и этот минимум однозначно определяется функцией f. Доказательство. 1) Дан функционал 2) H A ) Пусть Рассмотрим F u Au, u 2u, f . скалярное произведение ( f , u) . При f H фиксированном это скалярное произведение есть линейный и ограниченный функционал в гильбертовом пространстве H. Линейность очевидна, f , u а ограниченность f u , или следует f , u k u из неравенства , где коэффициент Шварца k f не зависит от u. 3) Этот функционал линеен и ограничен и в гильбертовом пространстве u HA . Действительно, функционала u пользуясь f , u k u доказанной ограниченностью и связью норм пространств H и HA : 1 u , можно записать цепочку неравенств C A f , u k u Откуда следует f u C A k1 u A . ограниченность f , u k1 u A , где k1 функционала f c не зависит от u. 20 в H A , то есть, По теореме Рисса линейный ограниченный функционал, заданный в гильбертовом пространстве, всегда можно представить через скалярное произведение, определённое в этом пространстве. В данном случае функционал ( f , u ) линеен и ограничен в H A , следовательно, он может быть представлен через соответствующее скалярное произведение. Это значит, что u0 H A : f , u u0 , u A . Из теоремы Рисса Фишера следует также, что элемент u0 единственный, и он однозначно определяется элементом f. Произведём соответствующую замену в квадратичном функционале F(u) и с учётом симметрии оператора А выполним некоторые тождественные преобразования: F u u, u A 2u0 , u A , F u u u0 , u u0 A 2u0 , u0 A u u0 F u u u0 2 A 2 A u0 , 2 то есть u0 . 2 Из последнего выражения видно, этот функционал можно минимизировать выбором элемента u только за счёт обращения в нуль нормы u u0 2 A . Тогда из представленной цепочки равенств и свойств нормы определяется и элемент u, минимизирующий квадратичный функционал и величина минимума этого функционала: u u0 2 A 0, u u0 0, u u0 0, u u0 , F u0 u0 . 2 A Замечание. Равенство, связывающее представление функционала в двух пространствах u0 , u A f , u , позволяет доказать важное неравенство, применяющееся для различных оценок. Учитывая неравенство Шварца и оператора А, выполним оценку: 21 положительную определённость ( u0 , u ) A f , u f u f u A, c откуда следует важное неравенство: f u c u0 , u A A Эта формула применяется во многих случаях. Некоторые важные примеры приведены ниже: 1) Пусть u0 2 A u u0 , тогда f u0 c Неравенство A u0 u0 A обобщённого решения мала, то мала и A f c f , c отражает непрерывную зависимость u u0 от правой части, то есть, если величина f u A. Au1 f , Au2 g , тогда u1, u A f , u и u2 , u A g , u , 2) Пусть вычитая эти равенства, найдём, что u1 u2 , u A f g , u и выполняя оценки, аналогичные предыдущим, получим: u1 u2 A f g . c То есть, малое изменение правой части операторного уравнения приводит к малому (по норме в H A ) изменению обобщённого решения. 3) Последнее неравенство позволяет найти погрешность приближенного решения в метрике H A . Пусть 22 un u0 , последовательность приближённых Au0 f , u n u0 A решений и Aun f , пусть тогда Aun Aun , и по неравенству имеем: Aun f c Aun f n , n -невязка. Если невязка мала по норме в пространстве H, то и приближённое решение мало отличается от точного решения в HA . Заметим, что указанная оценка возможна, если имеет место сходимость un u0 , Au f , что для обобщённого решения может не иметь места. Определение. Минимизирующей называется последовательность u n , обладающая свойством lim F un u0 . n Фактически, решения задач, которые могут быть сформулированы в виде проблемы поиска минимума квадратичного функционала, сводятся к поиску минимизирующей последовательности и выбору некоторого элемента un в качестве приближённого решения. Предел этой минимизирующей последовательности будет обобщённым решением некоторого операторного уравнения. Если функционал в постановке задачи был первичным, то об этом операторном уравнении можно и не вспоминать. Лекция №4 Метод ортогональных рядов минимизации квадратичного функционала. В предыдущей лекции было показано, минимизирующий квадратичный функционал пространстве что элемент u0 , F u u, u 2 f , u в H A , однозначно определяется представлением линейного 23 ограниченного функционала (f,u) в пространстве H A , то есть, равенством ( f , u ) (u0 , u ) A . Здесь u произвольный элемент из пространства H A . Идея метода заключается в приближённом представлении конкретной функциональной зависимостью u0 некоторой u N , содержащей несколько (например, N) неопределённых числовых параметров. Неопределённые параметры подобрать из условия, чтобы предыдущее равенство подстановки после u N было верно, по крайней мере, для N различных элементов ui H A i 1,2,... N . То есть, подставляя в равенство последовательно вместо u элементы ui , получим N уравнений (возможно нелинейных, что зависит от выбранного вида приближённого решения), откуда и определим неизвестные коэффициенты. Если бы это равенство оказалось верным для всех u, u H A , то тогда выбранное приближённое решение оказалось бы точным минимумом квадратичного функционала, в противном случае получается «хорошее или плохое» приближённое решение. Для реализации этой идеи необходимо указать условия, при которых можно выстроить минимизирующую последовательность un . Прежде всего, хотелось бы избавиться от перебора всех элементов u из H A . Введём дополнительное предположение, пусть H A сепарабельное гильбертово пространство, тогда, как известно, в нём существует счетное всюду плотное множество. Из этого множества можно выбрать базис i , i 1,2,... , то есть такую линейно независимую систему элементов, с помощью которой можно приблизить произвольный элемент из например, HA , u0 H A , с любой наперёд заданной точностью. Иначе говоря, по любому наперёд заданному 0 , найдётся такой номер N, что 24 n ( u0 , a k k ) , n N . k 1 Это означает, что за приближённое решение можно взять конечную сумму n un a k k k 1 и по указанной выше схеме определить коэффициенты ak . Для реализации этой цели требуется знать, сепарабельно ли пространство H A , как выбрать базис, и нельзя ли избежать решения системы алгебраических уравнений для определения коэффициентов ak . Для ответа на эти вопросы можно использовать следующие утверждения, доказательства которых опущены: А). Из сепарабельности пространства H следует сепарабельность пространства HA . Б). Если в например H A существует какое либо всюду плотное множество, DA , то базис в H A можно построить целиком из его элементов. В). Выбранный базис можно считать ортонормированным, так как с помощью процесса ортогонализации Шмидта всегда можно перейти к ортонормированному базису. Условие ортонормированности записывается с помощью символа Кронекера i, j в виде: 0, i j ( i , j ) i , j 1, i j Пусть u0 элемент, минимизирующий квадратичный функционал F u u, u 2 f , u в пространстве. Так как существование этого 25 элемента доказано, то, как и любой элемент в пространстве H A , он представим через базис этого пространства, то есть: u0 a k k k 1 Подставим это представление в основное равенство ( f , u ) (u0 , u ) A , получим: ( f , u ) ( a k k , u ) A k 1 Не нарушая общности, в качестве элементов u выберем множество элементов базиса i , i 1,2,... . Подставляя в предыдущее равенство вместо u базисную функцию с номером i, и учитывая ортонормированность базиса, получим цепочку преобразований: k 1 k 1 k 1 ( f , i ) ( a k k , i ) A a k ( k , i ) A a k k ,i ai , i 1,2,... .То есть без решения системы уравнений определились коэффициенты разложения минимизирующей функции u0 : ai ( f , i ), i 1,2,... и получилось точное решение задачи минимизации квадратичного функционала: u0 ( f , k ) k k 1 Полученное решение действительно удовлетворяет исходному равенству ( f , u ) (u0 , u ) A для любого для конкретного элемента 26 u H A , так как это равенство u bi i i 1 можно сконструировать из равенств, имеющих место для базисных функций: ( f , i ) ( a k k , i ) A i 1,2,.... k 1 В самом деле, умножением этих равенств на числа bi и их суммированием легко организовать равенство: m m k 1 i 1 ( f , bi i ) ( ak k , bi i ) A i 1 i из которого предельным переходом получается требуемое утверждение. Так как в общем случае в решении выражающиеся приближённо интегралы), скалярным (например, в решении произведением в пространстве необходимо u0 коэффициенты, ( f , i ) , вычисляются L2 придётся вычислять ограничиваются вычислением конечного числа слагаемых и получается приближённое решение: n un ( f , k ) k k 1 Если предположить ещё, что оператор A положительно определённый, то из сходимости по норме этого приближенного решения в H A (которая следует из построения), вытекает сходимость этого решения и в Н. Утверждение опирается на связь норм этих пространств, полученную ранее: u0 u n 1 u0 u n c A 27 Окончательный результат формулируются в виде теоремы: Теорема (метод ортогональных рядов). Пусть А линейный положительно определённый оператор на линеале DA , плотном в сепарабельном и гильбертовом ортонормированный базис в решение HA пусть k DA (а значит и в H A ). Тогда обобщённое Au f уравнения u0 функционала F пространстве (минимум квадратичного u u, u 2 f , u ) даётся рядом u0 a k k , где ak k 1 ( f , k ), k 1,2,... Проблема построения указанного решения сводится к построению в H A ортонормированного базиса k . Пример (решение вариационной задачи в пакете Maple V): Решить уравнение Пуассона в прямоугольнике G, заданном неравенствами 0 x a, 0 y b . Уравнение имеет вид u u f , f L2 (G) , где ( x1 , x2 , x3 ) - символический вектор, дифференциальный оператор Гамильтона. Обозначим Au u. На контуре Г функция удовлетворяет нулевым граничным условиям, то есть: u Г 0. В этой задаче за гильбертово пространство L2 (G) . 28 пространство H взято Для применения метода ортогональных рядов необходимо проверить условия теоремы. Покажем, что оператор А положительно определён. 1.1. Симметрия имеет место, (u, Av ) ( Au, v ) для любых если u, v M . Доказательство этого равенства выполняется интегрированием по частям с использованием известной формулы g1 x g dG g g dГ g 2 G где 1 Г i i 2 i 1 G g 2 dG, xi направляющий косинус нормали в точке x поверхности Г с осью xi . Используя эту формулу, получим: ( Au, v ) ( u, v ) ( u )vdG G v(u n )dГ u vdG Г G Так как функция v M , то она на границе обращается в нуль и интеграл по контуру Г исчезает. Окончательно получается ( Au, v ) u vdG (u, Av ). G То есть симметрия оператора А доказана. 1.2. Положительная определённость. Из предыдущего равенства следует положительность оператора А. Действительно, 2 u ( Au, u ) u udG i dG 0 xi G G i 1 3 29 Положительная определённость доказывается несколько сложнее и будет показана в следующих лекциях. . За линеал DA можно взять множество дифференцируемых функций в области дважды непрерывно G , обращающихся на границе области в нуль. Известно, что это множество функций является всюду плотным множеством в L2 G . Следующее множество функций с одной стороны принадлежит DA , а с другой стороны, как известно, является базисом в L2 G mn sin mx ny sin , m, n 1,2,.. a b Можно показать, что эта же система функций является полной и в H A . Не строго говоря, причина этого заключается в том, что оператор А сохраняет эту систему функций. Учитывая ортогональность тригонометрических функций, можно вычислить скалярное произведение этих базисных функций в HA : 0, i j jx ix sin sin dx 0 a a a , i j, 2 a A mn , ij mn , ij A m 2 n 2 0, m i, n j , ab a b 4 , m i, n j Из этих выкладок видно, что построенный базис ортогонален, но не ортонормирован. Для нормировки достаточно поделить его элементы на квадратный корень из записанного выше скалярного произведения. В результате получится следующий ортонормированный в (обозначен той же буквой) 30 H A базис 1 mn 2 2 ab m 4 2 n a b sin mx ny sin , m, n 1,2,.. a b Приближённое решение по методу ортогональных рядов (несколько слагаемых) в указанном базисе имеет вид: l r ul ,r a mn mn m 1 n 1 Коэффициенты этого ряда вычисляются по формуле: amn f , mn f G mx ny sin sin dG 2 2 2 a b ab m n 4 a b 1 Введём функцию: mx ny Smn f x, y sin sin dxdy, a b 0 0 a b тогда приближённое решение можно записать в виде: l r ul ,r m 1 n 1 Записанное mx ny sin sin a b ab 2 m n 4 a b S mn 2 решение легко 2 запрограммировать в Maple V, поэкспериментировать. Посмотреть, в чём особенность обобщённого решения, исследовать поведение приближённой правой части уравнения. Лекция №5 Метод Ритца Пусть A - положительно-определенный оператор на линеале DA в сепарабельном гильбертовом пространстве H и f H . Пусть на основе 31 пространства H и оператора A построено гильбертово пространство H A . Рассмотрим в H A базис i , не требуя его ортогональности. Метод Ритца основан на следующей идее. По определению обобщенное решение рассматриваемого уравнения Au f минимизирует в это элемент u0 H A , который H A функционал F (u) (u, u) A 2( f , u) т.е. решением является элемент u0 H A , для которого F (u0 ) min F (u) . Выберем целое положительное число n , и будем uH A искать аппроксимацию u n э лемента u0 H A в усечённом виде n un a k k k 1 где k базис, а a k неизвестные пока вещественные постоянные. Эти постоянные определяются из условия достижения точного минимума функционала F (u ) на элементах типа минимум функционала ищется не в подпространстве, предположению порождаемом u n . Таким образом, точный H A , а в усечённом n - мерном элементами i образует базис в базиса 1 ... n . По H A , так что обобщенное решение u0 H A можно с произвольной точностью аппроксимировать соответствующей линейной комбинацией его элементов. Поэтому можно ожидать (и это будет доказано), что найденное из минимизации функционала конечномерное приближение отличаться от искомого решения u n будет достаточно мало u0 H A , если n будет достаточно велико. 32 Получим систему алгебраических уравнений метода Ритца. Для этого подставим в функционал конечномерное приближение решения u n ,: F ( u n ) ( u n , u n ) A 2( f , u n ) n n n ( a k k , a k k ) A 2( f , a k k ) k 1 n k 1 k 1 n n a k a m k , m A 2 a k ( f , k ) ( a1 , a 2 ,...a n ) k 1 m 1 k 1 Чтобы минимизировать функционал функцию F (un ) , достаточно минимизировать (a1 ,...an ) . Как известно, коэффициенты ai необходимо найти из системы уравнений 0, i 1,2,..., n ai Для автоматизма вычисления производных введём символ Кронекера i, j ai 0, i j a j 1, i j С учётом этого выкладки по вычислению производных имеют вид: n n k ,i am k , m A ai k 1 m1 n n n m ,i ak k , m A 2 k ,i ( f , k ) k 1 m 1 k 1 n n m 1 k 1 am i , m A ak k , i A 2( f , i ) 0 Учитывая симметрию скалярного произведения и возможность замены индекса суммирования на любой другой индекс, устанавливаем, 33 что две суммы в этом выражении идентичны. Объединяя их и сокращая на двойку, получим окончательный вид алгебраической системы уравнений Ритца для определения коэффициентов n a , m i m 1 m A am : ( f , i ) 0, i 1,2,..., n 1) Единственность решения системы. Так как по предположению функции пространстве 1 ... n линейно независимы в H A , то определитель системы Ритца, который является их определителем Грамма, отличен от нуля. (A , ) (A , ) 1 1 2 1 (A , ) (A , ) 1 2 2 2 .............. .............. (A , ) (A , ) 1 n 2 n ... (A , ) n 1 ... (A , ) n 2 0 ... ............... ... (A , ) n n Следовательно, алгебраическая система имеет единственное решение. Последовательность называется решений un последовательностью алгебраической Ритца. Надо системы показать, Ритца что эта последовательность сходится к элементу u0 H A , минимизирующему квадратичный функционал F (u ) , то есть к обобщённому решению операторного уравнения Au f . 2) О сходимости последовательности Ритца. Рассмотрим один частный случай решения задачи по методу Ритца, когда сходимость последовательности Ритца к обобщённому решению очевидна. Пусть для решения задачи был выбран ортонормированный в ~i . Учитывая условие ортонормированности 34 H A базис 0, m i ~m , ~i 1, m i из системы Ритца получаем коэффициенты разложения обобщённого решения в явном виде: ai f , ~i , i 1,2,..., n и решение принимает вид: n un a k ~k k 1 Нетрудно видеть, что решение и способ вычисления коэффициентов в этом частном случае тождественно совпадают с методом ортогональных рядов, в котором последовательность конечных сумм сходится в этом H A к обобщённому решению. Следовательно, метод Ритца в случае дает сходящуюся последовательность Ритца к обобщённому решению un . Этот частный случай легко использовать для доказательства того, что и в общем случае последовательность Ритца сходится в также в H ) к обобщенному решению H A (и тем самым u0 H A . Теорема (о сходимости метода Ритца) Пусть A положительно определённый оператор на линеале гильбертовом пространстве образуют базис последовательность (не H A , и пусть f H . Далее, пусть i , обязательно Ритца DA , плотном в сепарабельном { un } ортогональный) с постоянными в H A . Тогда коэффициентами a1 , a2 ,.., an , однозначно определяемыми для каждого фиксированного n 35 из системы Ритца, сходится в обобщенному решению H A (и тем самым также в H ) к u0 уравнения Au f . Доказательство Для доказательства сравним между собой метод Ритца и метод ортогональных рядов в предположении, что в последнем был использован отонормированный базис, полученный из базиса i метода Ритца с помощью процедуры ортонормирования Шмидта. Проведём сравнение в табличной форме. Метод Ритца Метод ортогональных рядов Не ортонормированный базис- Ортонормированный i базис- i ~i . Применена ортогонализация Шмидта к базису i . Вид решения u n Вычисление n ak k Вид решения wn k 1 коэффициентов разложения из ak - алгебраической n a~ ~ k 1 k k Вычисление ~ коэффициентов a k ( f , ~k ) системы уравнений Ритца Сходимость Имеется последовательности un обобщённому решению к последовательности обобщённому решению u0 H A пока не доказана. Легко показать, что 36 сходимость wn u0 H A к n n k 1 k 1 un a k k wn a~k ~k Действительно, 1) два базиса k , ~k составлены из одних и тех же элементов, так как второй получен из первого ортогонализацией Шмидта. Следовательно, они образуют тождественно совпадающие линеалы. 2) На этом линеале оба метода минимизируют один и тот же функционал F (u ) . Из-за единственности решения той и другой задачи минимум достигается на одном и том же элементе, то есть un wn . 3) Так как wn сходится к обобщённому решению u0 H A , то и последовательность Ритца un сходится к тому же элементу. последовательность Замечание 1 Метод Ритца приводит к тем же результатам, что и метод ортонормированных рядов. Он исключает трудоемкий процесс ортонормирования базиса, но требует построения и решения системы линейных уравнений для этой системы можно n n неизвестных постоянных ai . Для решения применять обычные численные методы, использующие симметрию матрицы этой системы, и т.д.. Замечание 2 Последовательность решению что Ритца un сходится к обобщённому u0 H A . Как уже говорилось, в общем случае нельзя ожидать, Aun f в H , поэтому, по невязке Aun f , нельзя судить о скорости сходимости метода. В то же время, можно показать, что с ростом n погрешность решения уменьшается. Действительно, из сопоставления методов Ритца и метода ортогональных рядов следует 37 n n un ak k a~k~k . k 1 k 1 n Поэтому u n u0 n a~k~k a~k~k k 1 a~k~k k 1 k n 1 a~ k n 1 2 k Последнее равенство в цепочке получено с учётом ортогональности базиса. Последняя сумма, погрешность, является конечным положительным числом и из неё видно, что увеличение числа слагаемых в приближенном решении уменьшает эту погрешность. Заметим, что с увеличением система только расширяется, но n первоначально построенная ранее вычисленные скалярные произведения в левой и правой части рассматриваемых уравнений остаются неизменными; таким образом, к матрице этой системы присоединятся лишь дополнительные строки и столбцы вместе с дополнительными скалярными произведениями в правой части. Аналогично, если по какой-либо причине нам достаточно аппроксимации более низкого порядка, то достаточно опустить из системы соответствующие уравнения и неизвестные. Это другое свойство метода Ритца, важное с вычислительной точки зрения. Замечание 3. (Неоднородные граничные условия) На данном этапе ограничимся неоднородной задачей: Au f u F . К этой задаче нельзя напрямую применять разработанные методы, так как множества функций, удовлетворяющих указанному граничному условию, не образуют линеал. Подберём функцию w , удовлетворяющую граничному условию и произвольную во всём остальном. То есть, пусть 38 найдена некоторая w , такая, что w F . Произведём замену искомой u v w . Так как функции u и w удовлетворяют граничному условию, то для новой искомой функции v имеем граничное функции по формуле v 0 . Выполняя замену, получим следующую задачу для условие определения новой искомой функции: v 0. Av f Aw f * , Множество функций v , удовлетворяющих нулевому граничному условию, уже образует линеал и метод Ритца может быть применён. Как и ранее решение ищется в виде: n vn a k k k 1 Алгебраическая система Ритца имеет вид n a , m i m A m 1 ( f * , i ) 0, i 1,2,..., n , или n a , m i m A m 1 ( f * , i ) ( f , i ) ( Aw, i ), i 1,2,..., n Следовательно, система Ритца только правой частью отличается от стандартной ситуации. После её решения окончательный ответ запишется в виде: n un w a k k k 1 Замечание 4. В рассматриваемом методе полнота базиса i в пространстве H A не является необходимой. Действительно, если про решение заранее 39 известно, что оно принадлежит некоторому подпространству пространства H A , то в силу линейности задачи и базис целесообразно брать из этого же подпространства. Пример. Рассмотрим дифференциальное уравнение u u f x , f L 1, 1. 2 u 1 0, u1 0, Из теории обыкновенных дифференциальных уравнений известно, что это уравнение имеет единственное решение. Предположим, что функция f (x ) симметрична относительно начала координат. Очевидно, что и решение будет симметричной функцией. Действительно, симметричная функция u(x ) может удовлетворить симметричные краевые условия этой задачи, кроме того, при подстановке решения в уравнение, изза чётности производных, свойство симметрии не нарушится. Введём в рассмотрение оператор A , действующий по правилу Au u"u . Записав скалярное произведение в форме H A и с учётом краевых условий, проинтегрировав по частям, получим: 1 1 1 1 1 1 Au, u (u, u) A (u"u)udx (u' ) 2 dx u 2 dx Отсюда видна симметрия и положительность скалярного произведения и эти свойства соответствуют понятию положительного оператора. Положительная определённость, то есть неравенство ( Au, u ) k u , k 0 доказывается сложнее и будет выполнено позже. 2 Линеал DA состоит из дважды непрерывно дифференцируемых функций на отрезке (-1,1) и они являются плотным множеством в пространстве H L2 (1,1) . В пространстве H A линеал DA также является всюду 40 плотным множеством. Таким образом, к данной задаче применим метод Ритца. В качестве базиса можно взять базис в DA , например, полиномиальный базис: i (1 x 2 ) x i 1 , i 1,2,... Видно, что функции этого базиса обращаются в нуль на краях отрезка интегрирования. Здесь чётные функции получаются при нечётных номерах. Теперь можно поэкспериментировать с методом Ритца в пакете Maple V и убедиться, что чётные коэффициенты разложения будут получаться нулевыми, что можно показать и непосредственно. Следовательно, метод Ритца сам заботится о том, чтобы решение было чётной функцией. Но если мы заранее знали об этом, то вместо записанного базиса можно было взять базис, соответствующий симметричным функциям пространства H A , а именно i (1 x 2 ) x 2(i 1) , i 1,2,... В этом случае расчёты существенно сокращаются, а результат достигается тот же. Для закрепления материала здесь следует выполнить множество численных экспериментов. Замечание 5 Неортогональность базиса, используемого в методе Ритца, приводит и к некоторым неудобствам, которые разберём без строгих обоснований, опираясь на аналогию с n - мерным векторным пространством. Назовём максимально неортогональным элементом базиса элемент, который параллелен какому либо другому элементу базиса. Это значит, что два параллельных элемента линейно зависимы между собой. Следовательно, и весь базис не является базисом, так как его элементы оказываются линейно зависимыми. В этом случае определитель Грамма равен нулю, алгебраическая система Ритца либо не имеет решений, либо её 41 решение не единственное. Если линейная зависимость фактически имеет место, но не установлена теоретически, то она будет обнаружена численно в различных эффектах неустойчивости решения, появлении деления на нуль, сильной зависимости от малых изменений правой части и.т.д.. На самом деле, все эти эффекты начнут проявляться и при «почти линейно зависимом базисе», что является наиболее неприятным моментом. Неустойчивость проявляется тогда, когда её не ожидаешь. Подобные аспекты детально рассматривались в исследованиях учёных. Можно привести книги С.Г. Михлина. 1. Численная реализация вариационных методов. М.: Наука. 1966. 432с. 2. Проблема минимума квадратичного функционала, М.-Л. Гостехиздат.1952. Лекция 6. Метод Бубнова - Галёркина. В современном изложении метод Бубнова - Галёркина можно построить, опираясь на одно свойство сепарабельных гильбертовых пространств. Пусть дано сепарабельное гильбертово пространство плотное H и в нём подмножество M . Известно, что если для некоторого фиксированного u H и любого v M выполняется равенство (u, v ) 0 , то тогда u 0 , то есть u нулевой элемент в пространстве H . Другими словами, ортогональным подмножеству, единственный элемент, который может быть всему пространству, или всюду плотному в нём суть нулевой элемент этого пространства. Если пространство сепарабельно, то это утверждение усиливается, а именно, если элемент ортогонален какому либо базису этого пространства, то этот элемент нулевой. Ортогональность базису эквивалентна ортогональности всем элементам пространства, так как любой элемент пространства представим линейной комбинацией элементов базиса. Пусть требуется решить уравнение 42 Au f , f H . Будем искать такой элемент u0 DA , чтобы выполнялись равенства ( Au0 f , k ) 0, k 1,2,... где k некоторый базис в предыдущему H . Если такой элемент удалось найти, то по Au0 f 0, Au0 f . Следовательно, u0 решение данного уравнения. Это и есть основная идея метода Бубнова - Галёркина. Метод требует обеспечения ортогональности невязки элементам некоторого базиса k пространства Au0 f всем H . В изложенном подходе не указывалось, в какой форме ищется решение, не указывается и метод подбора функции u0 . Требуется выполнение бесконечного числа условий ортогональности, что практически невозможно достигнуть. В изложенном подходе не указываются и ограничения на оператор A. Он может быть, например, нелинейным, дифференциальным, интегральным и.т.д. Конкретизация всего этого будет приводить к различным модификациям метода и в этом одно из его достоинств. Сделаем некоторые допущения: пусть оператор A является линейным оператором и решение будем искать в виде ряда по тому же базису, по которому производилась ортогонализация, то есть u0 a k k k 1 Редко когда удаётся найти бесконечное число коэффициентов поэтому обычно ограничиваются коэффициентов усечённого ряда 43 приближённым ak , вычислением n un a k k k 1 Подстановка этой конечной суммы в условия ортогональности и учёт линейности оператора A приводит к следующей системе алгебраических уравнений Бубнова - Галёркина для определения ak n a m n первых коэффициентов ( A m , k ) ( f , k ), k 1,2,..., n m 1 Заметим, что мы получили бы другую систему, если бы, например, разложили решение по другой системе базисных функций, или вообще выбрали бы другую форму представления решения. В данном случае мы хотим выйти на известные результаты, чтобы можно было бы воспользоваться уже доказанными утверждениями. Более точно, хотим, чтобы в этом частном случае метода прийти к методу Ритца. Добавим ещё одно предположение. Пусть оператор A положительно определённый. Прежде всего, это означает, что он симметричный и скалярное произведение ( A k , m ) можно записать в симметричной форме ( A k , m ) ( k , m ) A . Это не формальное утверждение. В случае дифференциальных уравнений интегрированием по частям оно действительно и по записи приводится к симметричной форме. Система Бубнова - Галёркина переписывается в виде n a m ( m , k ) A ( f , k ), k 1,2,..., n m 1 и в точности совпадает с системой метода Ритца. Если теперь все условия сходимости метода Ритца имеют место, то и приближенное решение по методу Бубнова - Галёркина будет сходиться. Перефразируя теорему о сходимости метода Ритца, получим следующую теорему: 44 Теорема. Пусть A положительно определённый оператор на линеале D A , который плотен в сепарабельном гильбертовом пространстве H и пусть i базис в H A , тогда последовательность Галёркина un сходится в H A , а значит и в H к обобщённому решению уравнения Au f . Коэффициенты a k находятся из системы Бубнова - Галёркина. Теорема говорит о том, что хотя бы в одном случае метод Бубнова Галёркина приводит к решению. Эта ситуация обеспечивается совпадением с методом Ритца, поэтому здесь метод не даёт ничего нового. Смысл теоремы в том, чтобы возникла уверенность, что и в других ситуациях, уже не совпадающих с методом Ритца, можно надеяться, что метод Бубнова Галёркина будет сходиться. Это действительно так, но в данном тексте доказательств этих трудных теорем для других случаев не будет. Метод применяется для операторов, не обладающих свойствами положительной определённости, симметрии, линейности. Он используется для базисов, удовлетворяющих не всем граничным условиям. Можно использовать два базиса, один для ортогонализации, а другой для разложения решения и.т.д.. Его возможности распространяются не только на численное решение уравнений, но и на доказательства теорем существования и единственности нелинейных операторных уравнений. Это очень мощный инструмент численных и теоретических исследований. Изза широких возможностей модифицирования метод очень популярен, зачастую применяется без должного обоснования, из интуитивных соображений. Именно так он был применён впервые Бубновым И.Г.. В приложениях такой подход может быть оправданным, если нет возможности его обоснования, исследователь осознаёт, что поступает не корректно и чтобы хотя бы частично компенсировать это, имеет другие, не строгие способы косвенной проверки правильности численных результатов. Историческая справка: Метод впервые применил И.Г. 45 Бубнов для решения задач теории упругости. Черты математической теории метод приобрёл в работе Галёркина В.Г.: Вестник инженеров, Т.1, №19, 1915г. С. 897-908 Лекция 7. Метод наименьших квадратов решения операторных уравнений. F (u ) u u0 u0 , положительно Рассмотрим оператор 2 2 определенный на линеале D A , плотном в сепарабельном гильбертовом пространстве H , и уравнение Определение: gk , Последовательность k 1,2,..., gk DA последовательность Au f , f H образует (возможно, A- базис конечную, конечномерное пространство), такую что элементы если элементов в H , т.е. рассматривается Agk образует базис в H. Отсюда следует, любой элемент f H может быть приближен в H с любой наперёд заданной точностью с помощью линейной комбинации элементов базиса, то есть по заданному числу 0 найдётся такой номер N , что для номеров n N выполняется неравенство n c Ag k 1 k k f Метод наименьших квадратов состоит в нахождении приближенного решения u n (т.е. аппроксимации обобщенного решения) уравнения Au f , f H в виде 46 n un a k g k k 1 где постоянные a k определяются из условия минимизации квадрата нормы невязки: Au f 2 min Если в этот функционал вместо u подставить его приближённое представление в виде отрезка ряда, то это выражение станет квадратичной функцией переменных a k . Необходимым условием экстремума этой функции будет равенство нулю производных Au f ak 2 0, k 1,2,..., n . Расписывая квадрат нормы и вычисляя производные, получим систему алгебраических уравнений метода наименьших квадратов для определения коэффициентов n a m ak : ( Ag m Ag k ) ( f , Ag k ), k 1,2,..., n m 1 Эта система имеет единственное решение, поскольку ее определитель представляет собой определитель Грамма, соответствующий первым n - элементам последовательности Agk , а эти элементы по предположению образуют базис в H . Вследствие его линейной независимости определитель Грамма отличен от нуля. Замечание 1. Метод наименьших квадратов, применяемый при наложенных выше ограничениях на оператор, на базис, на вид выбранного приближённого решения, является некоторой модификацией метода Галеркина. Решение разыскивается 47 в одном базисе gk , k 1,2,..., gk DA , а ортогонализация невязки выполняется по другому базису Agk . Эта модификация метода Бубнова - Галёркина называется методом Галеркина-Петрова. Ниже будет доказана теорема о сходимости метода наименьших квадратов в такой интерпретации. На эту теорему можно смотреть как на теорему сходимости для одного из многочисленных вариантов метода Бубнова - Галёркина. Можно указать и то обстоятельство, что по поводу элементов gk , k 1,2,..., gk DA не утверждалось, что они составляют базис. Замечание 2. На самом деле идея метода наименьших квадратов заключается всего лишь в нахождении такого элемента u0 , который бы минимизировал квадрат нормы невязки. Если бы этот минимум оказался равным нулю, то тогда по свойству нормы следовало бы, что невязка равна нулю и элемент u0 был бы точным решением задачи. Если минимум не будет равняться нулю, то это будет означать, что в рассматриваемом пространстве отсутствует точное решение задачи, то есть такое решение, которое бы обратило в нуль невязку в пространстве случае элементу H . Однако и в этом u0 можно придать смысл «решения», если определить за решение элемент, который обеспечивает наименьшую возможную разницу между левой и правой частями уравнения. Такая постановка возможна, например, в случае, когда уравнение строилось на основании экспериментов, то есть с погрешностью и эта погрешность привела к уравнению, которое не имеет решения. Постановки такого рода рассматриваются в теории некорректных задач и могут звучать парадоксально « можно ли решить задачу, которая не имеет решения?», ответ: можно, если изменить смысл понятия решения. Следует заметить, что это не будет противоречить практике. Замечание 2 существенно расширяет области применения метода наименьших квадратов. Как и в 48 случае метода Бубнова - Галёркина, его применяют и без строгих обоснований, используя нестрогие косвенные методы проверки правильности решения и для уравнений, не обладающих многими свойствами, указанными в теоремах о сходимости. Если понимаешь, что делаешь, то для практических нужд часто бывает достаточно не строгого подхода. Ниже приводится строгая теорема о сходимости, естественно, что для её доказательства пришлось наложить целый ряд дополнительных условий. Теорема. Пусть A - положительно определенный оператор на линеале D A , плотном в сепарабельном гильбертовом пространстве H , и f H . Пусть последовательность Agk образует базис в H . Тогда последовательность элементов постоянными un , задаваемая рядом n un a k g k с k 1 a k , однозначно определяемыми из системы уравнений метода наименьших квадратов, сходится в H A и, следовательно, также в H к обобщенному решению u0 уравнения Au f , кроме того, lim Aun f в H . n Доказательство. Т.к. оператор положительно определенный, то имеет место условие положительной определённости: это неравенство имеет место и, кроме того, u A C u . Если Aun f 0 то un u0 и имеет место оценка un u0 A Aun f C Из последнего неравенства следует, что если невязка в H сходится к 0, тогда приближенное решение сходится к точному в метрике H A . 49 Покажем, что невязка стремится к нулю. Невязка после подстановки приближённого решения имеет вид n Aun f A ak g k f min k 1 Вследствие линейности оператора A это равенство можно записать в виде n a k 1 k Agk f min Минимизация последнего представление функции выражения f H Agk . Поскольку это элементов означает приближённое с помощью линейной комбинации множество является базисом в H , то f H может быть приближен с любой наперёд заданной элемент точностью. Следовательно, выбором числа слагаемых в сумме невязка может быть сделана меньше любого наперёд заданного числа. Отсюда по неравенству un u0 A Aun f C уже следует сходимость последовательности решений решению un к обобщённому u0 . Замечание 3. Так как последовательность методу наименьших квадратов, сходится в un , полученная по H A к обобщённому решению u0 , а последовательность Ритца имеет то же вид и сходится к тому же обобщённому решению, то следует установить разницу между этими процессами. С вычислительной точки зрения коэффициенты разложений определяются из разных алгебраических систем, следовательно, они 50 различны и отличие должно заключаться в скорости сходимости. При доказательстве существования минимума квадратичного функционала в пространстве H A было показано, что этот функционал в этом пространстве представим в виде F ( u ) u u0 u0 2 2 Отсюда видно, что, во-первых, точный минимум функционала достигается именно на обобщённом решении u u0 , во-вторых, что важно для сопоставления методов Ритца и метода наименьших квадратов, если искать его приближённый минимум vn в конечномерном пространстве, то он достигается на минимуме первого слагаемого функционала Следовательно, для любого другого решения F ( vn ) . u n , в частности, полученного по методу наименьших квадратов, будет выполняться неравенство vn u0 A un u0 A Отсюда вытекает, что в энергетической метрике решение по методу Ритца сходится к обобщённому решению u0 быстрее, чем решение по любому другому методу, в частности быстрее метода наименьших квадратов. С другой стороны, метод наименьших квадратов обеспечивает стремление невязки к нулю, а метод Ритца об этом не заботится совсем. Нестрого говоря, в методе наименьших квадратов ресурс на сходимость, которым обладает отрезок ряда, расходуется на сходимость к решению и на сходимость невязки к нулю, а в методе Ритца только на сходимость к решению, отсюда получается разница в скорости сходимости. Учитывая, что в методе наименьших квадратов невязка стремится к нулю, удаётся легко оценить погрешность решения в 51 H A (в энергетической метрике): Aun f C где константа C определяется условием положительной определённости оператора A . un u0 A Метод Куранта. Функционалы можно строить многими разными способами. В предыдущих параграфах было предложено три варианта. Вопросы в том, какое отношение имеют новые функционалы к решаемой задаче, удастся ли показать на их основе возможность получения приближённых решений с заданной точностью, дают ли функционалы какие-то преимущества по сравнению с имеющимися методами решений. Во всяком случае, исследователь должен фантазировать в этом направлении, особенно в тех предметных областях, где математический аппарат решения задач находится ещё в зачаточном состоянии. Один вариант такого конструирования представляет метод Куранта. Метод Куранта сочетает два метода: Ритца и метод наименьших квадратов, пытаясь объединить преимущества каждого. Естественно, что он опирается на допущения этих методов, что совсем не обязательно при другом конструировании функционалов. Пусть заранее известно, что обобщенное решение u u0 уравнения Au f , f H принадлежит D A . Построим функционал, являющийся суммой функционалов метода Ритца и метода наименьших квадратов: F * (u ) F (u ) Au f 2 F * достигает экстремума на множестве D A в точности на элементе u u0 . Действительно, функционал F (u ) на Легко показать, что функционал этом элементе минимален, а второй функционал равен нулю, так как 52 Au0 f . Можно сказать, что и второй функционал минимален, так как он не может быть отрицательным. Таким образом, нахождение решения эквивалентно нахождению элемента u u0 уравнения Au f u0 DA , минимизирующего в D A функционал Куранта. Из вида этого функционала следует, что его минимизация существенно труднее, чем минимизация функционала метода Ритца или функционала метода наименьших квадратов. Считается, что метод Куранта сочетает преимущества метода Ритца и метода наименьших квадратов, и это положительно влияет на скорость сходимости или, возможно, на ее тип. Возможно, что в некоторых случаях удается проще исследовать сходимость метода и показать свойства сходимости, которые для каждого из составляющих методов нельзя или трудно показать отдельно. В методе Куранта также возможно большое количество различных модификаций, что должно определяться целью исследований. Можно отказаться, например, от требования u0 DA , тем более что, как правило, это не известно. При этом необходимо более сложное доказательство того, что минимум этого функционала является решением задачи. Другая модификация заключается в том, что функционалы могут , определяемыми какими либо условиями входить с различными весами целесообразности: F * (u ) F (u ) Au f 2 Наконец, при построении функционалов можно вообще отказаться от строгих формулировок математических задач, например, так: известно, что уравнение Au f строилось экспериментально, содержит погрешности, поэтому не должно удовлетворяться точно. Достаточно обеспечить близость левой и правой частей уравнения в какой либо метрике, то есть минимизировать невязку Au f 53 2 min . Было бы желательно поправить погрешности, для этого надо добавить к задаче ещё какие либо сведения, которые можно получить из других источников. Пусть, например, известно, что описываемый процесс является физическим, протекающим так, что накапливаемая потенциальная энергия F u минимальна, но эта энергия также вычисляется с погрешностью. Строим функционал F * (u ) F (u ) Au f 2 . Его минимизация будет одновременно означать минимизацию невязки и минимизацию энергии, что и требуется. Два использованных типа сведений будут влиять на решение, взаимно сглаживая ошибки, содержащиеся в каждом из них. Коэффициент будет определять меру доверия данным. В зависимости от его величины существенную роль в решении может играть либо уравнение, либо функционал энергии, либо и то и другое. Этот подход оказывается очень расплывчатым, очень неудовлетворительным с точки зрения математики, но очень характерным в условиях неопределённости знаний. Принцип тут в том, что кое-что не очень строгое лучше, чем ничего, так как с этим можно проводить численные эксперименты, задуматься о подходах к построению более корректных теорий и, может быть, построить их. С практической точки зрения в этом может и не возникать необходимости, так как решение будет вызывать доверие на основании множества косвенных соображений. Вариант, обобщающий схему Куранта построения функционала, заключается в конструкции: r F (u ) F (u ) * k 0 k ( Au f ) x1m x2p ...xnq1 2 В этом функционале минимизируется не только квадрат нормы невязки, но и квадраты норм всех производных невязки до порядка r . В конструкции заключено усиленное требование к поведению невязки, желательно, чтобы в процессе минимизации к нулю стремилась не только невязка, но и 54 несколько её производных. При конкретном решении задачи надо, чтобы это усиление имело како-то смысл, кроме того, требуются теоремы о сходимости и её типе. Пример (метод наименьших квадратов и его модификации, метод Куранта и его модификации) применительно к задаче Au 4 x u""600 x 5000( x x 2 ) u(0) u(1) 0 u" (0) u" (1) 0 В качестве базиса возьмем j sin( jx) j 2 , j 1,2,... Эксперименты: Задав решение, конструируем правую часть и получаем тестовую задачу. После её правильного решения решаем основную задачу. При изменении n точность решения будет меняться: при уменьшении n решение менее точное, при увеличении n решение близко к точному. При изменении правой части дифференциального уравнения будем получать решения других уравнений с измененной правой частью. Для решения данного примера используем и метод Ритца. Выбранный базис полон в H A и оператор положительно определенный, поэтому метод сходиться. Применение метода наименьших квадратов не приводит к сходимости, т.к. построенный на базисе метода Ритца А-базис, не является базисом в HA . Лекция 8. Метод наискорейшего спуска Метод применяется для линейных ограниченных операторов. 55 Определение. Оператор A ограниченным, если найдется число линеала на линеале DA называется k 0 такое, что для всех u из D A выполнено неравенство Au k u Наименьшее число из всех возможных k называется нормой оператора A (обозначается A ). Пусть A - положительно определенный ограниченный оператор. Рассмотрим решение уравнения Au f , f H , Пусть u0 - решение, которое принадлежит H , тогда оно минимизирует функционал F (u ) ( Au, u ) 2( f , u ) Разработаем итерационный метод минимизации функционала. Зададим произвольно в H элемент u1 . Если Au1 f , то элемент u1 решение задачи, в противном случае первое приближение. Второе приближение будем искать в виде u2 u1 tv1 . Здесь v1 нормированный элемент, а t число, меняющее норму элемента tv1 . Они подлежат такому заданию, чтобы наилучшим образом приблизиться к решению u0 . Функционал F (u2 ) F (u1 tv1 ) F (u1 ) 2t ( Au1 f , v1 ) t 2 ( Av1 , v1 ) зависит от этих элементов. Подберём элемент изменения функционала в точке v1 так, чтобы скорость t 0 была максимальной, то есть dF (u2 ) 2( Au1 f , v1 ) max dt t 0 56 Так как по условию норма элемента v1 фиксирована, то скалярное произведение достигает максимума в случае коллинеарности векторов, то v1 ( Au1 f ) , где число нормирующий множитель. Не нарушая общности, полагаем 1 , что приводит к есть необходимо, определению элемента v1 Au1 f . Можно сказать, что этот элемент задаёт направление, в котором надо двигаться из точки u1 , чтобы обеспечить максимальную скорость изменения функционала. Остался неопределённым числовой множитель экстремума функционала t . Найдём его из условия F (u2 ) по переменной t . Записывая условия экстремума, получим: dF (u2 ) 2( Au1 f , v1 ) 2t ( Av1 , v1 ) 0 dt Отсюда определяется значение переменной t : t Au1 f , v1 v1 , v1 Av1 , v1 Av1 , v1 Таким образом, для определения второго приближения всё определилось: u2 u1 tv1 , где v1 Au1 f , t Au1 f , v1 v1 , v1 Av1 , v1 Av1 , v1 Теперь, по аналогии, легко записать общие формулы итерационного процесса: un1 un tvn , 57 где t vn Aun f , Aun f , vn vn , vn Avn , vn Avn1 , vn Оценка погрешности Из свойств ограниченности и положительной определенности оператора A можно получить двойное неравенство: mu u где A M u m, M две положительные константы, не зависящие от элемента u . Действительно, Au, u u 2 A u 2 A из условия C2 u , 2 положительной а из определённости условия имеем, ограниченности Au, u Au u k u . Объединяя эти неравенства и извлекая 2 корни квадратные, получим требуемое двойное неравенство, причём m C , M k . Первое (левое) неравенство означает положительную определенность оператора A , второе его ограниченность. Числа m, M называются также границами оператора. Неравенство иногда называют эквивалентностью норм в данном случае пространств можно подставить, m un u0 un u0 пространств например A M un u0 . u n u0 , Если H и H A . Вместо u тогда в получим каком-нибудь из H или H A известна оценка погрешности приближенного решения, тогда из неравенства вычисляется и оценка погрешности в другом пространстве. Подстановка в неравенство приближённого решения, полученного каким-либо методом, позволяет оценить это решение. В частности, подставляя решение, полученное по методу наискорейшего спуска, получим оценку: 58 un u0 A M m u1 u0 M m Так как дробь n h M m M m 1 , то при увеличении числа итераций правая часть стремится к нулю, поэтому итерационный процесс сходится. В случае оценок указанного вида говорят, что итерационный процесс сходится как геометрическая прогрессия со знаменателем h . Существуют и другие итерационные методы решения положительно определённых ограниченных операторов, сходящиеся с тем же знаменателем h , например, метод минимальной невязки, метод минимальной ошибки. Подробнее об этих методах можно прочесть в книге Красносельский М.А. Приближенное решение операторных уравнений. М.: Наука. 1969 г., 455 с. Пример (решение интегрального уравнения) Рассмотрим решение интегрального уравнения Фредгольма II рода в пространстве L2(0, ). u( x ) 0.1 u( s) sin( x s )ds f 0 Оператор A действует по правилу левой части этого уравнения: Au u( x ) 0.1 u( s) sin( x s)ds 0 Для применения метода наискорейшего спуска необходимо показать, что A положительно определённый ограниченный оператор. 1. Симметрия оператора A (равенство ( Au, v ) (u, Av) ) легко проверяется перестановкой порядка интегрирования в интеграле 59 0 0 ( Au, v ) (u( x ) 0.1 u( s ) sin( x s )ds )v ( x )dx u( x )v ( x )dx 0 0 0 0 0 0 0.1 (u( s ) sin( x s )ds )v ( x )dx u( s )v ( s )dx 0.1 ( v ( x ) sin( x s )dx )u( s )d s ( Av, u ) (u, Av ) 0 0 2. Проверим положительную определенность оператора A . Должно выполняться неравенство Au, u C 2 u 2 ( Au, u ) (u( x ) 0.1 u( s ) sin( x s )ds )u( x )dx 0 0 u 2 ( x )dx 0.1 (u( s ) sin( x s )ds )u( x )dx 0 0 0 0 0 0 u 2 ( x )dx 0.1 (u( s ) sin( x s )ds ) u( x )dx Возведём повторный интеграл в квадрат и применим неравенство Шварца дважды: 2 (u( s ) sin( x s )ds ) u( x )dx 0 0 0 0 0 2 2 ( (u( s) sin( x s)ds) dx u x dx, 60 ( (u( s ) sin( x s )ds ) 2 0 2( x s ) sin( 2( x s )) u ( s )ds sin ( x s )ds u 2 ( s )ds 4 0 0 0 0 2 2 u 2 2 ( s )ds 0 Отсюда получается оценка 2 (u( s ) sin( x s )ds ) u( x )dx ( u 2 ( s )ds )dx u 2 x dx 20 0 0 0 0 2 u x dx 2 0 2 2 Извлекая корень квадратный, найдём (u( s) sin( x s)ds) u( x )dx 0 0 2 u x dx 2 0 Используя эту оценку получим: ( Au, u ) (u( x ) 0.1 u( s ) sin( x s )ds )u( x )dx 0 0 0 0 0 u 2 ( x )dx 0.1 (u( s ) sin( x s )ds )u( x )dx 0,1 u 2 ( x )dx 0.1 (u( s ) sin( x s )ds ) u( x )dx 1 u 2 0 0 0 61 2 Для модуля этого скалярного произведения можно найти ещё оценку снизу, если выполнить замену sin( x s ) sin( x ) cos( s ) cos( x ) sin( s ) ( Au, u ) (u( x ) 0.1 u( s ) sin( x s )ds )u( x )dx 0 0 0 0 (u( x ) 2 dx 0.1 u( s )(sin( x ) cos( s ) cos( x ) sin( s )) ds )u( x )dx 0,1 1 u 2 2 Объединяя оценки, получим условие ограниченности и положительной определённости оператора А: 0,1 2 0,1 2 1 u ( Au, u ) 1 u , 2 2 следовательно, поставленная задача может быть решена методом наискорейшего спуска. Лекция 9 Средства проверки положительной определённости операторов Одной из проблем, возникающих при использовании вариационных методов, является проверка условий, записанных в теоремах, гарантирующих получение решений. Математику это важно, чтобы быть уверенным в адекватном применении численных методов. Практику проверка условий тоже важна, однако часто у него нет ни опыта ни возможностей для выполнения такого рода проверок. По этой причине практик может пытаться обходиться без этих теорем, изобретая разные косвенные критерии правильности полученных результатов. Не отрицая 62 такого пути, укажем некоторые инструменты, используемые для проверки одного из характерных условий, указываемых в этих теоремах, а именно, условия положительной определённости. Неравенство Фридрихса Теорема. Пусть и пусть M G n - мерная область с липшицевой границей линеал функций, непрерывных со своими частными производными первого порядка в G , тогда существуют неотрицательные константы C1 и C2 , зависящие только от области G и не зависящие от M , такие, что выполняется неравенство u u ( x ) dG C 1 G k 1 G xk n 2 2 dG C2 u 2 d . Доказательство теоремы опускается (см. К.Ректорис. Вариационные методы в математической физике и технике. М.:Мир.1985. C.590) Очень сложное понятие липшицевой границы области в этом тексте не поясняется. Достаточно отметить, что это понятие включает достаточно широкий класс областей, например, областей с кусочногладкой границей без точек или линий возврата. Для случая b n 1 G a, b запишем три частных случая неравенства: b A). u ( x )dx C1 (u) 2 dx C2u 2 (a ) 2 a a b b a a B ). u 2 ( x )dx C1 (u) 2 dx C2u 2 (b) 63 b b a a C ). u 2 ( x )dx C1 (u) 2 dx C2 [u 2 (a ) u 2 (b)] В случаях А), В) константы C1 16(b a ) 2 2 , C2 C1 ,C2 одинаковы 4(b a ) В случае С) они могут быть получены из первых двух случаев, но могут быть найдены более точно: C1 4(b a ) 2 2 , C2 2(b a ) . На самом деле, правые части неравенств состоят из суммы положительных величин и возникает возможность управления константами. Нестрого говоря, можно уменьшать одно из слагаемых с одновременным увеличением другого слагаемого. Один из вариантов такого управления константами третьего случая даётся формулами: C1 Число (b a 2 )2 2 0 a, b a, b , , C2 должно b a 2 ctg b a 2 удовлетворять a a , b b . . условию Такое вложенности управление может понадобиться для более точного определения константы в условии положительной определённости исследуемого оператора. С другой стороны, в общем случае сложной границы не удаётся найти эти константы, но это и не важно для применения метода. Достаточно знать, что они существуют, чтобы сказать, что оператор обладает свойством положительной определённости. Придётся обойтись без знания константы, 64 входящей в это условие. В этом случае оценки погрешностей приближённых решений будут известны с точностью до некоторого множителя. Неравенство Пуанкаре Теорема. Пусть G область с липшицевой границей и пусть M линеал функций непрерывных со своими частными производными первого порядка в G , тогда существуют неотрицательные константы и C4 , зависящие только от области C3 G такие, что для всех u M выполняется неравенство Пуанкаре: 2 u k dG C4 u( x )dG G u ( x)dG C3 k 1 G x G n 2 2 Доказательство теоремы опускается (см. К.Ректорис. Вариационные методы в математической физике и технике. М.:Мир.1985. C.590) Частные случаи: n=1. Пусть G - одномерная область, отрезок a, b, dG dx . В этом случае C3 b a 2 , 2 C4 1 ba Тест: Проверить неравенство численно в пакете Maple V. n=2. Пусть G - двумерная область, прямоугольник со сторонами l1 , l2 . В этом случае C3 max( l1 , l 2 ), C 4 1 l1l2 Тест: Проверить неравенство численно в пакете Maple V. 65 Используют неравенство для доказательства положительной определённости дифференциальных операторов. Другие неравенства, используемые для тех же целей можно найти, например, в книге С.Г.Михлин. Численная реализация вариационных методов. М.: Наука. 1966. 432 с. Лекция 10. Краевые задачи для обыкновенного дифференциального уравнения II порядка. Покажем применение теорем Фридрихса и Пуанкаре на примере обыкновенных дифференциальных уравнений. Этот случай интересен и тем, что представляет схему исследования дифференциальных уравнений более высокого порядка, а также уравнений, заданных в пространствах большей размерности. Конечно, для этих случаев схема в отдельных деталях должна быть модифицирована. Рассмотрим обыкновенное дифференциальное уравнение 2-го порядка ( pu) ru f где f L2 a, b , p, p , r -непрерывны и нужное количество раз дифференцируемы на a, b . Пусть дополнительно выполняются условия r 0, p( x) p0 0 p0 const . Специфическая форма записи второй производной приводит к специальному названию такой формы записи уравнения. Это уравнение записано в дивергентной форме, причина такого названия более понятна при изучении дифференциальных уравнений в частных производных. Ограничения на функции p, r на самом деле вытекают из требования положительной определённости соответствующего дифференциального оператора Au ( pu) ru и 66 будут использованы при доказательстве соответствующих теорем. Конечно, в реальных задачах эти условия могут не выполняться и придётся изобретать доказательства теорем, при каких- то других ограничениях. Рассмотрим общий вид изучаемых здесь граничных условий: u( a ) u ( a ) 0 , u(b) u (b) 0 где , , , представляют собой неотрицательные числа, такие что 0, 0 , нуль одновременно. то есть, каждая пара констант не обращается в Знаки и положительность снова нужны для доказательства теорем положительной определённости дифференциального оператора. Из общего вида граничных условий выделяются четыре частных случая: 1. u a 0, u b 0, 2. ua 0, ub 0, 3. ua u a 0, ub u b 0, 0, 0, 4. u a 0, ub 0 Приступим теперь к исследованию рассматриваемых задач. 1. Граничные условия ua 0, ub 0 . Обозначим через M 1 линеал всех функций, непрерывных вместе со своими первыми и вторыми производными на замкнутом интервале a, b и удовлетворяющих граничным условиям ua 0, ub 0 . Пусть оператор, определённый на указанном множестве, действует по правилу A1u ( pu) ru . 67 Докажем, что оператор A1 положительно определён на множестве M1 . Используя интегрирование по частям и граничные условия, запишем сначала скалярное произведение b A1u, v в симметричной форме: b b a a A1u, v pu ru vdx ruvdx pu vdx a b b a a ruvdx pu v dx Отсюда очевидна симметрия оператора A1 , то есть A1u, v u, A1v . Положительная определённость получается из предыдущего равенства заменой v u с учётом условий на коэффициенты p, r из следующей оценки: b b b b a a a a A1u, u ru 2dx pu2 dx pu2 dx p0 u2 dx . Для оценки последнего интеграла применяется неравенство Фридрихса b b b a a a 2 2 2 2 2 u ( x)dx C1 (u) dx C2 [u (a) u (b)] C1 (u) dx , откуда b 2 u ( x)dx a После b 1 u 2 ( x )dx . C1 a подстановки получается неравенство положительной определённости b b A1u, u p0 u dx p0 u 2 dx C 2 u 2 A1u, u C 2 u C1 a a 2 68 2 где C2 p0 2 p0 C1 b a Таким образом, все необходимые условия для использования, например, метода Ритца выполнены. 2. Граничные условия ua 0, ub 0 . По сравнению с остальными этот случай в определённой степени более сложен. Обозначим через M 2 линеал всех функций, непрерывных вместе со своими первыми и вторыми производными на замкнутом интервале ua 0, a, b ub 0 . и удовлетворяющих граничным условиям Пусть оператор, определённый на указанном множестве, действует по правилу A2u ( pu) ru . Точно таким же образом как и в первом случае доказывается, что оператор симметричен на A2 M 2 , но при интегрировании по частям обращение в нуль внеинтегральных слагаемых обеспечивается теперь граничными условиями ua 0, ub 0 . Положительную определённость по аналогии с предыдущим случаем уже доказать нельзя так как на границе ua 0, ub 0 . Изменим ограничения на функции p, r . Пусть p 0, r r0 const 0 тогда b b a a b b a a A2u, u ru 2 dx pu2 dx ru 2 dx r0 u 2 dx . r0 u A2 u, u C 2 u , C 2 r0 2 2 Следовательно, при новом предположении положительная определённость оператора доказывается легко. В других случаях придётся изобретать новые способы доказательства наличия или отсутствия этого свойства. 69 Отметим, что эта задача отягощена ещё одним обстоятельством. Оказывается, это дифференциальное уравнение имеет решение не при любой правой части. Действительно, вычисляя интеграл от левой и правой частей дифференциального условия, получим: b b ( pu) ru dx f dx, a b a a b a a b a b b pu a ru dx f dx, ru dx f dx Последнее соотношение является необходимым условием существования решения дифференциального уравнения. В частности, если условие принимает вид ограничения только на r 0 это правую часть дифференциального уравнения b fdx 0 . Как правило, такого рода осложнения возникают, когда a накладываются граничные условия на производные от искомых функций. r 0 подробнее. Дифференциальное Рассмотрим частный случай уравнение и краевые условия примут вид ( pu) f , ua 0, ub 0 . Непосредственно из постановки задачи видно, что решение определяется с точностью до константы. Вместе с решением u будет решением и u K , где K произвольная константа. Уже из этого можно ожидать неприятностей. Проверим положительную определённость. В данном случае b A2u, u pu2 dx . a 70 Отсюда видно, что этот оператор даже не положительный. Действительно, из условия b A2u, u pu2 dx 0 a вследствие положительности подынтегрального выражения следует u 0 u 0 , что противоречит условию положительности оператора. Вывод, к поставленной задаче нельзя применять построенную теорию о минимуме квадратичного функционала. Чтобы выйти из положения, дополнительное условие наложим на искомую функцию b u( x)dx 0 . a Заметим, что если бы решение было единственным, то на него нельзя было бы наложить никакого дополнительного условия. Кроме того, стоит задуматься над тем, что это условие не вытекает из каких либо условий реальной (физической) задачи. В реальной ситуации, быть может можно наложить какие либо другие условия, вытекающие из существа проблемы. Покажем, что введённое условие приводит к положительной определённости дифференциального оператора. Действительно, b b a a A2u, u pu2 dx p0 u2 dx Для оценки последнего интеграла воспользуемся неравенством Пуанкаре 2 b 2 u ( x ) dx C u dx C u ( x ) dx C 3 4 3 u dx a a a ab b b 2 2 Отсюда и предыдущего неравенства определённость 71 вытекает положительная b A2 u, u p0 u 2 dx a b p0 u 2 dx C3 a . 2 p0 2 p0 2 2 u C2 u , C 2 (b a ) b a Следовательно, при указанном дополнительном условии может быть применён метод Ритца, если, кроме того, выполнено необходимое условие b существования решения fdx 0 . Смысл этих двух условий заключается a в том, что от пространства L2 a, b переходим к зауженному пространству, в котором нет элемента константы. И решение, и правую часть уравнения рассматриваем в этом зауженном пространстве. В нём обеспечивается как существование, так и единственность решения задачи. В этом пространстве оператор оказывается положительно определённым. Общий случай ( pu) ru f u( a ) u ( a ) 0 0, 0 u(b) u (b) 0 где f L2 a, b , p, p , r -непрерывны и нужное количество раз дифференцируемы на a, b . Пусть дополнительно выполняются условия r 0, p( x) p0 0 p0 const . Для доказательства симметрии и положительной определённости сначала записывается скалярное произведение частям приводится к виду 72 Au, v и интегрированием по b b a a Au, v p(b)u(b)v(b) p(a)u(a )v(a ) puvdx ruvdx Симметрия оператора, то есть равенство Au, v (u, Av) доказывается сразу для общего случая. Для этого из общих граничных условий вычисляются производные u(a ), u(b) и подставляются во вне интегральные слагаемые предыдущего равенства. В результате правая часть равенства станет симметричной относительно перестановки функций u, v . Значит, этим свойством будет обладать и левая часть, что и доказывает симметрию оператора A . Положительная определённость ( Au, u ) C 2 u 2 доказывается по предыдущей схеме с использованием неравенств Фридрихса и Пуанкаре для всевозможных частных случаев присутствия в граничных условиях первой производной искомой функции u. Эти частные случаи задаются следующей таблицей: 1. 0, 0 2. 0, 0 3. 0, 0 4 0, 0 и определяются соответствующие константы C Случай 1. C2 p0 2 b a 2 Случаи 2. и 3. C 2 2 p0 b a 2 73 2 p p C 2 min 0 , 0 где C1 C2 Случай 4. b a 2 b a 2 C1 ctg , C2 b a 2 2 Следовательно, к общей задаче можно применить теорию квадратичного функционала, причём нетрудно найти его вид в каждом конкретном случае. b b b F1 (u ) p(u) dx r (u ) dx 2 fudx 2 2 a a a b b b F2 (u ) p(u) 2 dx r (u ) 2 dx 2 fudx a a a b b b a a a b b b a a a F3 (u ) p(u) 2 dx r (u ) 2 dx 2 fudx F4 (u ) p(u) 2 dx r (u ) 2 dx 2 fudx p ( b )u 2 ( b ) p ( a )u 2 ( a ) p ( a )u 2 ( a ) p ( b ) u 2 ( b ) Предположим, что решается задача о минимуме одного из квадратичных функционалов, приведённых выше. Так как все условия теоремы о минимуме квадратичного функционала выполнены, то гарантируется, что будет найдено обобщённое решение. Исследователя обычно интересует вопрос о гладкости решения. При введённых предположениях на функции p, r, f можно показать, что последовательность Ритца un непрерывных функций сходится равномерно к u0 , следовательно, u0 непрерывная функция. Она почти везде имеет производные (т.е. производные сходятся только в среднем). Лучшие свойства решения можно получить, усилив утверждения о гладкости функций p, r , f . Но гладкость этих величин 74 определяется реальными задачами, а не желанием математика. Дифференциальные уравнения высших порядков Рассмотрим линейные дифференциальные уравнения старшая производная которых чётна, записанные в дивергентной форме: ( 1) p u k i i k i f i 0 x [a, b], pi ( x ) 0, i 0,1,2,..., k 1, pk x p0 const 0, u( a ) u( a ) u( a ) u( a ) ... u k 1 ( a ) 0, u(b) u(b) u(b) u(b) ... u k 1 (b) 0, f L2 a, b Линеалом M для данного уравнения будет множество функций непрерывных вместе с k производными и удовлетворяющих указанным граничным условиям. Предполагается, что линеал плотен в Пусть оператор A действует по правилу Au H L2 [a, b] . ( 1) p u . k i k i i i 0 Снова представляет интерес симметрия и положительная определённость этого оператора. Для доказательства симметрии скалярное произведение ( Au, v ) с помощью многократного интегрирования по частям и учёта граничных условий записывается в симметричной форме k b ( Au, v ) pi ( x )u i x v i ( x )dx (u, Av) . i 0 a Для вычисления положительной определённости неотрицательных слагаемых устанавливается неравенство: ( Au, u) pi ( x )u k b i 0 a i x dx p0 u k 2dx . b 2 a 75 отбрасыванием Далее многократным применением неравенства Фридрихса оценивается последний интеграл: u dx C u dx C u dx C u dx ... C u dx b b b 2 2 1 a b 2 2 1 a b 2 3 1 a k 1 a k 2 a Следовательно u b a k 2 1 dx k C1 b u dx 2 и условие положительной определённости a доказано: p ( Au, u) p0 u dx 0k C1 a b k 2 ba a u dx C u , где C1 b 2 2 2 2 Квадратичный функционал в данном случае имеет вид F (u) pi ( x )u k b i 0 a i x dx 2 fudx 2 b a и по доказанному можно искать обобщённое решение задачи как минимум этого функционала. Другие краевые условия для рассматриваемого дифференциального уравнения высокого порядка не рассматриваются из-за сложности исследования. Лекция 11. Проблема выбора базиса. Для применения метода Ритца, или других вариационных методов, мы должны, прежде всего, построить некоторую последовательность функций 1, 2, 3, ..., n , ... из которой последовательность приближённых решений 76 позже un по правилу: образуется n un ai i . i 1 Коэффициенты ai определятся из соответствующего метода, например, метода Ритца. В этом случае совокупность элементов последовательностью 1, 2, 3, ..., n , ... Ритца. un Последовательность называется функций должна обладать следующими свойствами: a) она должна быть полной в H A , т.е. с её помощью можно было бы приблизить любой элемент этого пространства. Это свойство в состоянии обеспечить сходимость последовательности приближённых решений к любому решению u0 . b) её элементы должны бать линейно независимыми в обеспечивает единственность определения коэффициентов n a ( , i i k un решения алгебраических H A , что систем для ai из системы уравнений ) A ( f , k ), k 1,2,..., n i 1 Однако, если система функций i не ортогональна, то она может оказаться «почти линейно зависимой» и определитель системы уравнений будет определителем Грамма почти равным нулю, то есть i , k 0 Этот определитель является знаменателем в формулах Крамера решения системы линейных алгебраических уравнений и возникает деление на число, близкое к нулю. Использование других численных методов будет вуалировать этот факт и, вообще говоря, не будет приводить к успеху. Возникший дефект будет проявляться в численной неустойчивости 77 решений, зависимости от малых изменений матрицы или правой части системы уравнений, больших погрешностях. Эта причина приводит к дополнительному требованию к базису i . Он должен обеспечивать устойчивость вычислительных процессов. Введём понятие устойчивости решения. Для этого запишем систему уравнений для определения вектора a1, a2 ,...an a~n в матричной форме: An a~n f n Соответствующее решение задачи будет иметь вид: n un ai i i 1 Пусть матрица и правая часть определены с погрешностями новое приближённое решение An Qn b~n Qn , g n , тогда ~ bn определится из системы: f n gn В этом случае решение записывается через другой набор коэффициентов n vn bi i i 1 Определение. Говорят, что численный процесс Ритца устойчив, если найдутся числа p, q, r, не зависящие от n , что если Qn r , то un vn p Qn q gn . То есть, если погрешности определения матрицы и правой части системы уравнений малы, то мала и погрешность определения решения. Это определение является одним из требований корректной постановки задачи. Второй особенностью решения систем уравнений является возможное накопление погрешности за счёт округления при выполнении 78 арифметических операций в компьютере. Обычно это характеризуется числом обусловленности системы, равным отношению норм An An1 или для симметричных матриц отношению максимального и минимального собственных чисел max n min n . Если данное число «большое», то говорят, что система плохо обусловлена и в этом случае велико влияние погрешностей округления. Слова «большое» или «малое» число обусловленности нуждаются в конкретном уточнении при решении конкретной задачи, зависят от используемой разрядной сетки и конкретного персонального компьютера. Кроме того, поскольку приходится решать систему многократно для каждого конкретного n и n , то необходимо, чтобы числа обусловленности были ограниченными одновременно для всех n . изучается сходимость при Таким образом, выбранный базис должен обеспечивать два свойства, важных с точки зрения вычислений: 1. Устойчивость решения системы к внесённым в неё на начальном этапе погрешностям Равномерная ограниченность чисел обусловленности 2. матриц An . К базису можно предъявить и множество других желательных требований, например, желательно, чтобы имела место сходимость в метрике пространства H : Aun f . Если это удаётся обеспечить, то возможна оценка погрешности по формуле un u0 A Aun f C где С константа из условия положительной определённости оператора, то есть из условия Au, u C 2 u 2 . Условие 79 Aun f не всегда можно выполнить, например, в методе Ритца. Однако возможны ситуации, когда это условие не выполняется не из-за внутренних свойств задачи и численного метода, а исключительно по причине плохого выбора базиса. В этом случае выбор другого базиса может существенно улучшить свойства приближённого решения. Детальное изучение свойств базисов в вариационных методах дано в неоднократно цитировавшейся работе С.Г. Михлина. Примеры базисов Одна из проблем при построении базисов заключается в том, что про некоторые наборы функций известно, что они являются полными системами в хорошо изученных пространствах пространствах H , но нам нужны базисы в H A , индивидуальных для каждого оператора A . Рассмотрим пока некоторые известные полные системы функций. 1. Система функций 1, x, x 2 ,..., x n ,... является полной в L2 a, b, но она не может использоваться в изученных выше методах, так как не удовлетворяет однородным краевым условиям. 2. Система функций где G 1, x, y, x 2 , xy, y 2 ,..., x m y n ,... полна в L2 G , произвольная двумерная область. Она не может использоваться в качестве базиса по тем же причинам. 3. Система n sin n x a полна в L2 a, b, удовлетворяет ba нулевым граничным условиям. Не ясно, будет ли она полна в HA , где A некоторый линейный дифференциальный оператор второго порядка, для которого выполнены условия применимости методов решения. 80 4. Система где G n ,m sin n x a m y c sin полна в L2 G , ba d c прямоугольная область a x b, c y d , удовлетворяет нулевым граничным условиям на границе. Её применимость для решения дифференциальных уравнений в частных производных приводит к вопросам предыдущего случая. Для ответов на поставленные вопросы разработаны различные подходы, один из них даёт следующая теорема: Теорема. Пусть линеале A положительно определённый оператор на D A плотном в H . Если последовательность A n полна в H , то последовательность n полна в H A . Пример. Покажем, что все приведённые выше базисы полны в H A , если A линейный дифференциальный оператор второго порядка с постоянными коэффициентами, содержащий только удовлетворяющий условиям теоремы. чётные производные и Действительно, применяя к такому базису дифференциальный оператор A , получаем с точностью до постоянных множителей тот же базис. Так как по условию он является базисом в теоремы он же является базисом и в H , то на основании H A . Однако однородным граничным условиям будут удовлетворять только базисы третьего и четвёртого примеров и их можно напрямую применять, например, в методе Ритца. Наконец, из базисов, не удовлетворяющих граничным условиям можно конструировать базисы, удовлетворяющие граничным условиям с помощью умножения элементов базиса на один и тот же множитель. Пример. Дан базис в 1, x, x 2 ,..., x n ,... полный в L2 a, b и в H A . Трансформируем его с помощью множителя 81 x a x b . Этот множитель обращается в нуль на концах интервала a, b , поэтому, новая система функций 1x a x b, xx a x b, ,..., x x a x b, ... n обладает тем же свойством. Пример. Пусть требуется решить уравнение Пуассона для кругового кольца. u f u r r 0, u r r 0 0 1 В качестве базиса возьмём набор функций 1, x, y, x 2 , xy, y 2 ,..., x m y n ,... . Для удовлетворения граничным условиям трансформируем его с помощью множителя g ( x, y ) x 2 y 2 r02 x 2 y 2 r12 . Этот множитель обращается в нуль на граничных окружностях, следовательно, таким свойством будет обладать и исправленный базис. Недостаток так построенных систем в том, что они не ортогональны и при большом числе слагаемых в решении могут приводить к системам, которые решаются с большими погрешностями. Для решения подобных проблем разработаны ортогональные полиномы, в частности, для решения уравнения Пуассона могут быть применены полиномы Лежандра. Другой вариант построения базиса связан с нахождением собственных функций дифференциальных операторов и использованием их в качестве базиса. Собственными функциями n n и собственными числами называются функции и числа, удовлетворяющие уравнению Aun n un Можно считать доказанным утверждение: 82 Положительно количество определённый собственных ортонормированными в оператор векторов n . имеет A Их можно счётное считать H A и они образуют полную в этом пространстве систему функций. Эти функции наилучшим образом пригодны для решения задачи, однако в большинстве случаев, из-за сложности исходного оператора, их трудно определить. Для устранения этой проблемы иногда используют собственные функции близких операторов. И в том и в другом случае не только пространство H A , но и базис n порождены исходным A или близким к нему оператором и можно ожидать некоторого положительного эффекта при численном решении задачи. Примеры. Решить численно задачи в Maple V построить для них базисы. Поэкспериментировать, брать плохие базисы, не удовлетворяющие каким либо условиям Лекция12. Краевые задачи для уравнений в частных производных. Пусть дана N -мерная область G с липшицевой границей. Запишем дифференциальное уравнение в этой области: N aij i , j 1 N 2u u bi Cu f xi x j i 1 xi Зададимся следующими ограничениями, пусть непрерывные функции в G и f L2 G . Определение. Уравнение эллиптическим, если существует зависящее от aij , bi , c – называется однородно- p 0 , зависящее только от области и не x G , такое, что для любого вектора 1 , 2 ,3 ,..., N выполняется неравенство: 83 N a ij i . j 1 i N j p i2 j p i2 N a ij i . j 1 i i 1 N i 1 Покажем, что уравнение Пуассона является однородноэллиптическим. Действительно, выписывая уравнение и коэффициенты при старших производных, можно записать квадратичную форму из определения и убедиться, что она знакопостоянна: 2u x 21 aij 1, i j 0, i j a ij i 2u x22 j ... 2u x N2 f 2 i Рассмотрим пример уравнения с переменными коэффициентами, в котором, как и в предыдущем случае, можно составить квадратичную форму из коэффициентов при старших производных. 2u 2u f x 2 y 2 x a11 x, a22 1, a12 0, a21 0 a ij i j x12 22 p 12 22 Так как один из коэффициентов квадратичной формы равен x , а другой 1, то чтобы уравнение было однородно-эллиптическим необходимо потребовать, чтобы выполнялось неравенство x 0 , затем выбрать сначала константу k из условия k inf x , а затем число p из xG 84 условия p min k ,1 . Однородной эллиптичности не будет, если x знакопеременная величина. Если исходное уравнение можно записать в следующей форме i, j u aij Cu xi x j f , то говорят, что задача представлена в дивергентном виде. Далее рассматриваем только такие однородноположительно-определённой квадратичной эллиптические задачи с формой. Сформулируем ограничения на коэффициенты: Коэффициенты 1. a ij дивергентной формы записи имеют непрерывные первые производные. Коэффициенты при старших вычисления производных в 2. производных (после уравнении) образуют положительно-определённую квадратичную форму. Коэффициент 3. C x 0 Второе и третье ограничения вводятся для того, чтобы получить положительную определённость оператора Au i, j u aij Cu , xi x j первое требование следует из необходимости выполнения операций дифференцирования в дивергентной записи уравнения. Пусть S граница области G . Запишем три типа краевых условий. 1. Задача Дирихле: uS 0. 2. Задача Неймана: Nu S 0 . 3. Задача Ньютона: Nu S u S 0 85 Смешанная задача (на различных частях границы заданы разные, 4. любые из трёх предыдущих, граничные условия). Здесь оператор N производная по конормали, вычисленная в точках поверхности. Пусть i направляющий косинус нормали с осью xi в точках поверхности, тогда эта производная по определению имеет вид: n Nu S aij ij1 Функция u i . x j нигде на границе не обращается в нуль: S 0 const 0 . Пример. Представить уравнение Пуассона u f в дивергентной форме и записать производную по конормали. Решение. можно представить через дифференциальный оператор Гамильтона divgrad , тогда, вводя символ Оператор Лапласа Кронекера ij , получим разные формы записи уравнения Пуассона: u u div gradu u 3 2u f ij x 2 i , j 1 xi i 1 xi j 3 Производная по конормали имеет вид Nu 3 ij i , j 1 3 u u u i i x j i 1 xi Эти две формулы поясняют происхождение терминов «дивергентная форма уравнения» и «производная по конормали». В этом простом случае в уравнении напрямую появляется дивергенция, а производная по конормали совпадает с производной по нормали. 86 Записанные краевые условия однородны и все дважды дифференцируемые функции, удовлетворяющие указанным условиям, образуют соответствующие линеалы, которые назовём M1 , M 2 , M 3 по номерам задач Дирихле, Неймана и Ньютона. Покажем симметрию дифференциальных операторов Am u i, j Am этих трёх задач u aij Cu xi x j Для доказательства симметрии как обычно используется интегрирование по частям, но в N -мерном пространстве. Пусть в области G имеются две один раз дифференцируемые функции g1 , g2 . Имеет место следующий аналог интегрирования по частям: g1 x G g 2 dG k g g dS 1 2 k S g 1 G g 2 dG xk Сделаем в этой формуле следующую замену g1 akj u , g2 v x j Суммируя по k результат подстановки, найдём: u a kj vdG x j u u v a kj v i dS a kj dG x j x j x k S kj 1 G kj x k G kj 1 N Nu vdS S G kj u v dG x j x k 87 Заменяя в левой части под интегралом сумму производных из дивергентной формы дифференциального уравнения, это равенство можно преобразовать: Amu, v CuvdG NuvdS u G Если G kj S теперь брать функции v dG, m 1,2,3 x j xk u, v из линеалов M m , m 1,2, соответствующих краевых задач, то, в зависимости от рассматриваемой краевой задачи, поверхностный интеграл будет обращаться в нуль либо за счёт функции v S 0 , либо за счет производной по конормали Nu S 0 . Результат одинаков для задач Дирихле и Неймана, имеет вид Amu, v CuvdG u G kj G v dG u, Am v , m 1,2 x j xk и обозначает симметрию соответствующих дифференциальных операторов. В случае задачи Ньютона в поверхностном интеграле можно заменить производную по конормали из граничного условия. При этом поверхностный интеграл не исчезает, но обнаруживается симметрия оператора A3 A3u, v uvdS CuvdG u S G kj G v dG u, A3v x j xk Покажем положительную определенность наших операторов, для этого рассмотрим сначала задачу Дирихле. Для любого доказать существование константы 1u, u T такой, что выполняется неравенство T2 u , где 1u, u 2 a G i, j i, j u M1 надо u u dG xi x j 88 Cu dG 2 G Оценка выполняется сначала отбрасыванием второго положительного слагаемого в выражении скалярного произведения, затем применением условия однородной эллиптичности и, наконец, применением неравенства Фридрихса: 1u, u a i, j G i, j ai , j G i, j u u dG xi x j Cu dG 2 G 2 u u u dG p xi x j i 1 xi G p dG u C1 2 Положительная определённость оператора первой краевой задачи с константой C1 из неравенства Фридрихса доказана. Следовательно, задача Дирихле для дифференциального уравнения может быть заменена на задачу минимизации функционала F u ( A1u, u ) 2 f , u u u dG xi x j ai , j G i, j Cu dG 2 fudG 2 G G Рассмотрим третью краевую задачу (задачу Ньютона). Её граничное условие имеет вид Nu S u S 0 , а скалярное произведение для доказательства положительной определённости A3u, u u 2dS Cu2dG u S G kj G u dG x j xk Преобразуем здесь правую часть к форме, пригодной для применения неравенства Фридрихса, которое имеет вид u C2 u 2 dS C1 2 S G kj u u dG x j xk Для этого выполним оценку 89 A3u, u u 2 dS Cu 2 dG u S G kj G u dG x j xk 2 u u u dG u dS dG 0 u 2 dS p x x j x k j S G kj S G j 2 p T 02 u 2 dS 2 T T S 2 2 u 2 dG G j x j T u 2 В предпоследнем выражении этой формулы было найдено наименьшее из двух чисел 0 T 2 , p T 2 . Пусть, для примера, этим числом оказалось 0 T 2 . Из сравнения с неравенством Фридрихса, подбором T2 , положим C2 0 T 2 . Уменьшим также наибольшее из двух чисел, то есть выражение p T 2 , до величины C1 . В результате получаем возможность применения неравенства Фридрихса и последнее выражение в цепочке неравенств. Следовательно, получено доказательство положительной определённости оператора наименьшим числом A3 . В этом случае имеем T 0 C2 . Если 2 p T 2 , то аналогично получится окажется T 2 p C1 . Таким образом доказана положительная определённость и соответствующий квадратичный функционал имеет вид: F3 u u 2 dS Cu2 dG S G G kj u u dG 2 fudG x j xk G Используя какой-либо базис, можно построить алгебраическую систему метода Ритца, соответствующую этому функционалу. Отметим ещё, что при выводе вида оператора A3 для упрощения использовалось краевое 90 условие Ньютона. То есть, оно уже введено непосредственно в функционал и заботиться о его удовлетворении на уровне базисных функций не требуется. Оно будет приближённо выполняться и тем точнее, чем больше базисных функций будет использовано для решения задачи. Условия такого типа называются неустойчивыми, или естественными. Те условия, которые необходимо выполнять на уровне базисных функций, называются главными. Приведённое утверждение не строгое. Существует способ, по которому можно по функционалу соответствующее ему дифференциальное уравнение. восстановить Оказывается, естественные краевые условия также восстанавливаются непосредственно по функционалу. Для главных условий такое свойство не выполняется. Этот способ известен как метод получения уравнения Эйлера для заданного функционала. Рассмотрим задачу Неймана (вторая задача). Её краевое условие имеет вид Nu S 0 . Пусть в данном случае выполняется дополнительное C C0 const 0 . С учётом этого предположения предположение легко доказывается положительная определённость оператора A2 . Действительно 2 A2u, u Cu dG u dG Cu2 dG C0 u 2 dG C0 u x j G G j G G 2 2 Соответствующий функционал имеет вид 2 u dG 2 fudG F u Cu 2 dG x j G G j G О выполнении граничного условия Nu S 0 на уровне базисных функций заботиться не надо, так как это условие является естественным. 91 Следовательно, на базисные функции не наложено никаких условий на границе. По этому поводу следует провести эксперименты в Maple V. Наконец, исследуем особый случай задачи Неймана ( Nu S 0 ) для C 0. Уравнение в общем случае имеет вид A2u i, j u aij Cu f xi x j Проинтегрируем уравнение по области A udG x a 2 G i, j G i ij G u 1dG x j CudG f dG G G Интегрируя по частям первый интеграл, получим только интеграл по контуру от производной по конормали, которая по условию равна нулю на границе. aij S i, j u i dS x j NudS S CudG f dG G G CudG f dG G G CudG f dG G G Последнее равенство является условием связи решения и правой части в задаче Неймана и при C 0 принимает вид ограничения на выбор правой части в рассматриваемом особом случае: fdG 0 G Если это условие не будет выполняться, то решение в особом случае не существует. Соответствующее уравнение и краевое условие имеют вид 92 A2u i, j u aij f xi x j Nu S 0 Дефект системы заключается и в том, что эта система имеет неединственное решение. Так как граничное условие есть производная по конормали, то видно, что если к решению прибавить произвольную константу, то снова получится решение. Другая формулировка этого же утверждения: однородное дифференциальное уравнение при в качестве решения произвольную константу. Чтобы f 0 имеет обеспечить единственность решения, можно наложить одно условие на искомую функцию. Это условие может иметь некоторый «физический» смысл. Но можно наложить и математическое условие. Например, можно заузить пространство ~ L2 G до L2 G следующим образом: рассматривать только такие функции, которые удовлетворяют условию udG 0 G В этом случае можно показать, что оператор A2 будет положительно определённым, решение единственным, а соответствующий функционал будет иметь вид 2 u dG 2 fudG F u x j G G j ~ где u, f L2 G При минимизации этого функционала нет необходимости удовлетворять краевому условию Неймана, так как оно является естественным, хотя если выбрать базис, удовлетворяющий этому условию, то хуже не будет. Как 93 видно, изучение первых трёх задач имеет много общего с изучением обыкновенных дифференциальных уравнение второго порядка. Рассмотрим четвёртую (смешанную задачу). Пример. Пусть поверхность S разбита на две части S S1 S2 с граничными условиями u S 0, N u S 0 1 2 Дифференциальное уравнение имеет тот же вид: A4u i, j u aij Cu f xi x j Для доказательства симметрии оператора скалярное произведение принимает такой же вид, как и для задач Дирихле и Неймана. Действительно, вычисляя скалярное произведение A4u, v , получим: A4u, v CuvdG NuvdS u G На каждой из границ G kj S v dG, x j xk S1 , S2 , поверхностный интеграл обращается в нуль за счет одного из сомножителей Nu, v , что следует из граничных условий. Следовательно, имеет место симметрия оператора A4u, v CuvdG u G G kj v dG u, A4 v . x j xk Положительную определённость доказать можно, но сложнее, чем в предыдущих случаях. Из-за смены типа граничных условий приходится оперировать в специальных пространствах обобщённых функций. Эта выкладка опускается. Квадратичный функционал имеет такой же вид, как и в задаче Дирихле. При этом граничное условие N u S 0 можно 2 опустить, не удовлетворять на уровне базисных функций. 94 Лекция 13. Дифференциальные уравнения в частных производных. Неоднородные граничные условия. Рассмотрим дифференциальное уравнение в частных производных в дивергентной форме Au i, j u aij Cu xi x j f в случае неоднородных граничных условий. Рассмотрим три типа граничных условий: 1. 2. u=g(S) на S, (главное условие). Nu=h(S) на S, (естественное условие). 3. Nu+u=k(S) на S (естественное условие) Квадратичный функционал для этих задач нельзя записать в стандартном виде F (u) Au, u 2 f , u . Причина этого заключается в том, что теория квадратичного функционала разработана на множествах функций, образующих линеалы. Неоднородные краевые условия нарушают это свойство. Следовательно, для указанных задач надо разработать функционалы другого типа. Для этого попытаемся свести поставленные задачи к задачам с однородными краевыми условиями и воспользоваться Выполним замену искомой функции u готовым функционалом. на новую функцию w по правилу u u0 w . Пусть функция u0 выбрана так, что удовлетворяет граничным условиям какой-либо краевой задачи, тогда, из-за линейности, функция w будет удовлетворять нулевым краевым условиям того же типа. Выполняя замену в дифференциальном уравнении, получим: A(u) Au0 w f , или для новой искомой функции w 95 Aw f Au0 f * . Так как функция w удовлетворяет одному из трёх однородных краевых условий, то можно записать квадратичный функционал в стандартной форме F ( w) Aw, w 2 f * , w Выполним здесь обратную замену и некоторые упрощения F (u) Au u0 , u u0 2 f Au0 , u u0 Раскрывая скобки, найдём F u ( Au, u ) ( Au, u0 ) ( Au0 , u ) ( Au0 , u0 ) 2 f , u 2 f , u0 2( Au0 , u ) 2( Au0 , u0 ) Для нахождения функции . u , минимизирующей функционал, не существенны слагаемые функционала, которые не зависят от этой функции и их можно отбросить. Выполняя эту операцию, а также приводя подобные, получим: F (u) Au, u 2 f , u Au, u0 Au0 , u Так как оператор A теперь не является симметричным, то последние два слагаемых не сокращаются и для дальнейшего упрощения необходимо учесть дивергентную форму дифференциального уравнения, выполнить интегрирование по частям и упростить получающиеся поверхностные интегралы с учётом конкретных краевых условий той или иной задачи. Будут получаться функционалы для конкретных ситуаций. Выполним эту программу и, прежде всего, учтём результат интегрирования по частям Au, v CuvdG NuvdS u G S G kj v dG x j xk Все скалярные произведения функционала преобразуем с помощью этой формулы: 96 F (u ) Cu 2 dG Nu udS G G kj S Cuu0 dG Nu u0 dS G G kj S Cu0 udG Nu0 udS G G kj S u u dG 2 f , u x j xk u u0 dG x j xk u0 u dG x j xk Здесь снова можно отбросить те слагаемые, которые не зависят от минимизирующей функции u , а также привести подобные члены. Получится следующий результат: u u dG x j xk F (u ) Cu 2 dG Nu udS G G kj S 2 f , u Nu u0 dS Nu0 udS S S Полученная формула является основой для получения функционалов всех задач. u S g (S ) . Задача № 1. (Дирихле) Краевое условие По построению функционала функция условию, то поверхностные равенству u0 должна удовлетворять этому же u0 S g ( S ) . Подстановка этих значений в есть интегралы функционала F (u ) Cu 2 dG Nu gdS G G kj S 2 f , u Nu gdS Nu0 gdS S S 97 приводит u u dG x j xk к следующему Здесь два поверхностных интеграла сокращаются, а последний не зависит от функции u , поэтому может быть отброшен. В результате получается функционал первой краевой задачи, не отличающийся от стандартного. F (u) Cu 2 dG G kj G u u dG 2 f , u x j xk В этот функционал не входит граничное значение. Оно является главным и о нём надо заботиться заранее, то есть, минимимизировать функционал в классе функций уже удовлетворяющих этому условию. Задача № 2. (Неймана) Краевое условие Nu S hS (естественное условие) По построению функционала функция условию, то поверхностные u0 должна удовлетворять этому же Nu0 S h( S ) . Подстановка этих значений в есть интегралы функционала приводит к следующему равенству F (u ) Cu 2 dG hudS G G kj S u u dG x j xk 2 f , u hu0 dS hudS S S В этом функционале ничего не сокращается, но можно отбросить интеграл, не зависящий от функции u . В результате получается функционал второй краевой задачи: F2 (u) Cu2 dG G G kj u u dG 2 f , u 2 hudS . x j xk S Этот функционал непосредственно содержит краевое условие (функцию h ). Краевое условие естественное, нет необходимости заботиться о его 98 предварительном выполнении. Удовлетворение условия произойдёт непосредственно при минимизации функционала. Задача № 2. (Ньютона) Краевое условие Nu S u S k S (естественное условие) По построению функционала функция условию, то есть u0 должна удовлетворять этому же Nu0 S u0 S k S . Из граничных условий найдём производные по конормали и подставим в функционал. Подстановка этих значений в поверхностные интегралы функционала приводит к следующему равенству F (u ) Cu 2 dG kudS u 2 dS G S G kj S u u dG 2 f , u x j xk ku0 dS uu0 dS kudS u0udS S S S S Здесь можно привести подобные, а также отбросить интеграл ku dS 0 S не зависящий от минимизируемой функции. В результате получится функционал, соответствующий третьей задаче: F (u) Cu2 dG 2 kudS u 2 dS G S G kj S u u dG 2 f , u x j xk Этот функционал непосредственно содержит краевое условие (функции , h ). Краевое условие естественное, нет необходимости заботиться о его предварительном выполнении. Удовлетворение непосредственно при минимизации функционала. 99 условия произойдёт В случае однородных краевых условий ( k 0, h 0 ) интегралы по поверхности S обращаются в нуль и функционалы для перечисленных задач примут уже изученный вид N F1u aij G i , j 1 N F2u aij G i , j 1 N F3u aij G i , j 1 u u dx cu 2 dx 2 fudx (Задача 1) xi x j G G u u dx cu 2 dx 2 fudx (Задача 2) xi x j G G u u dx cu 2 dx u 2 dS 2 fudx xi x j G G (Задача 3) Новые функционалы должны быть минимизированы на классе достаточно гладких функций (функций из пространства W2(1) (G ) ), которые удовлетворяют заданным устойчивым (главным) граничным условиям. То есть, только в первом функционале необходимо выполнение краевых условий. В двух других функционалах краевые условия будут удовлетворяться в процессе минимизации. Если заданы граничные условия Неймана, то в случае, когда с(х)0, мы минимизируем функционал на множестве функций, которые удовлетворяют условию udx 0 . G Заметим, что в этом случае задача имеет решение тогда и только тогда, когда выполняется условие fdx hdS 0 G S При приближённой минимизации указанных функционалов придётся задуматься о виде используемых базисных функций и индивидуально выводить соответствующие системы алгебраических уравнений. Для закрепления материала целесообразно поэкспериментировать численно с главными и естественными краевыми условиями в Maple V. 100 Лекция 14 Дифференциальные уравнения высших порядков. В качестве примера дифференциального уравнения более высокого порядка рассмотрим бигармонический оператор в двумерном пространстве. Дана плоская конечная область S , ограниченная кривой . В области задано дифференциальное уравнение. Его запись с помощью оператора Лапласа имеет вид Au 2 u u = 4u 4u 4u 2 f x 4 x 2y 2 y 4 Варианты однородных граничных условий (варианты задач) Задача 1. Задача 3. а u 0, u 0 .Задача 2. u 0, Mu 0 . Nu 0, Mu 0 . N, M граничные дифференциальные операторы: Mu u (1 ) 2u 2 2u 2u 2u 2 2 u 2 1 2 Nu 1 2 2 1 2 s x1 x1x2 x2 Здесь 1 , 2 константа; нормаль в точках граничной кривой ; некоторая s элемент длины дуги кривой . Так как прямое вычисление всех производных на границе невозможно, то граничные условия, записанные с помощью дифференциальных операторов получаются их вычислением в точках внутри области M, N , S с последующим предельным переходом на границу области. Записанные варианты задач широко распространены в приложениях, 101 например, в механике деформируемого тела. Этим уравнением описывается прогиб плоской пластинки. Варианты граничных условий соответствуют различным типам опирания пластины по контуру. Так как граничные условия всех трёх задач однородны, то функции, имеющие четыре производные и удовлетворяющие граничным условиям соответствующей задачи, образуют линеал, плотный в L2 G . Следовательно, если бы оператор A конкретной задачи был положительно определённым, то можно было бы воспользоваться построенной теорией квадратичного функционала. Для доказательства положительной определённости надо сначала доказать симметрию оператора. Запишем скалярное произведение для функций u, v , принадлежащих линеалу Au, v u, v ( 4 u 4 G x1 4u 4u )vdG x12 x22 4 x2 Чтобы записать этот интеграл в симметричной форме относительно u, v , необходимо дважды воспользоваться интегрированием по частям. В результате получится некоторая комбинация из интегралов по области и по кривой G . Опуская выкладки, запишем результат: u 2v 2u 2v 2u 2v dG 2 x12 x12 x12 x 22 x 22 x 22 G Au, v 2 2u 2u 2u v u 2 1 2 12 22 2 1 2 d s x1 x1x 2 x 2 v u d 2 Из этого выражения становится очевидной симметрия оператора каждой из задач. Задача 1. 102 u 0, u 0 Так как функции u, v принадлежат линеалу, то они удовлетворяют указанным граничным условиям, поэтому криволинейные интегралы в скалярном произведении исчезают и оно становится симметричным u 2v 2u 2 v 2u 2 v 2 2 2 dG u, A1v 2 2 2 2 x x x x x2 x2 1 1 1 2 G A1u, v 2 Докажем неравенство положительной определённости Используя выражение A1 , v , A1u, u K 2 u 2 . запишем соответствующее скалярное произведение 2 2 2 2 2 2 2 2 A1u, u u2 u2 u2 u2 u2 u2 dG x1 x x2 x1 x2 x2 G 1 Запишем неравенство Фридрихса для производных u x1 , u x2 . С учётом граничных условий имеем: 2 2 u 2 2 u 2 u x1 dG C1 G x12 x1x2 dG G 2 2 u 2 2 u 2 u G x2 dG C1 G x1x2 x2 dG С учётом этих неопределённости неравенств получается 103 оценка положительной 2 2 2 2 2 2 2 2 A1u, u u2 u2 u2 u2 u2 u2 dG x1 x x 2 x1 x 2 x 2 G 1 2 2 1 u u 1 dG 2 u 2 dG C1 G x1 x 2 C G Последнее неравенство получено применением неравенства Фридрихса для функции u . Константа K положительной определённости находится: K 1 C. Подготовительная работа для записи квадратичного функционала бигармонического оператора задачи 1 выполнена, и он имеет вид: 2 2 2 2 2 2 2 2 u u u u u u F (u ) 2 2 2 2 2 2 dG 2 fudG x1 x x2 x1 x2 x2 G G 1 В этой задаче краевые условия являются главными и при минимизации указанного функционала, их приходится предварительно удовлетворить. Задача 2. Краевые условия имеют вид u 0, Mu 0 . Для них бигармонический оператор оказывается положительно определённым, опуская выкладки, запишем соответствующий функционал 2 2 u 2 2 u 2 u 2 u 2 2 2 2 2 x1 x1 x2 x2 F2 u dG 2 fudG 2 G G 2u 21 x x 1 2 104 В этой задаче условие u 0 является главным, его надо удовлетворять заранее, а втрое условие Mu 0 непосредственно входит в функционал, оно является естественным и автоматически удовлетворяется в процессе решения. Третья задача не разбирается. Заключение. В данных лекциях изложено начало хорошо разработанной теории применения вариационных методов в задачах математической физики. Быть может этого достаточно для начала работы с приложениями, в частности, для моделирования геофизических параметров нефтяного или газового пласта, что сейчас активно развивается в Тюменской области. Для получения дополнительных канонических сведений по этим вопросам можно рекомендовать уже цитированную литературу. Новейшие исследования следует искать в научных журналах фундаментального математического направления, а также в широком спектре журналов прикладной направленности. 1. Литература Ректорис К. Вариационные методы в математической физике и технике. М.:Мир.1985. C.590 с. 2. Михлин С.Г. Численная реализация вариационных методов. М.: Наука. 1966. 432 с. 3. Михлин С.Г. Вариационные методы в математической физике. М.: Наука. 1970. 511 с. 4. Вулих Б.З. Введение в функциональный анализ. М.: Наука. 1967. 5. 415 с. Канторович Л.В., Акилов Г.П. Функциональный анализ. М.: 1977. 6. 741 с. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука.1989. 623 с. 105 ОГЛАВЛЕНИЕ Лекция 1 Элементы функционального анализа. Теорема о минимуме квадратичного функционала 3 Лекция 2 Расширение линеала 9 пространство Лекция 3 D A на некоторое HA Существование минимума квадратичного функционала в пространстве 18 HA Лекция 4 Метод ортогональных рядов минимизации 23 Лекция 5 квадратичного функционала Метод Ритца 31 Лекция 6 Лекция 7 Метод Бубнова - Галёркина Метод наименьших квадратов решения 42 46 операторных уравнений Лекция 8 Лекция 9 Метод наискорейшего спуска Средства проверки положительной определённости 55 62 Лекция 10 операторов Краевые задачи для обыкновенного 66 дифференциального уравнения II порядка Лекция 11 Лекция 12 Проблема выбора базиса Краевые задачи для уравнений в частных 76 83 Лекция 13 производных Дифференциальные уравнения в частных 95 Лекция 14 производных. Неоднородные граничные условия Дифференциальные уравнения высших порядков 101 Литература 105 106 Подписано в печать Заказ Тираж № Объём Формат 6084/16 Печать офсетная. Бумага писчая. 107