А. Е. Умнов АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ И ЛИНЕЙНАЯ АЛГЕБРА ( ) . . 3- , « » 2011 514.12(075) 22.151.59 73 54 : ( . ) . , . . , ) . . , . . 54 : . / . . . – 3.: , 2011. – 544 . ISBN 978-5-7417-0378-6 ., . , .– - ), - , . . 514.12(075) 22.151.59 73 ISBN 978- 5-7417-0378-6 © © . ., 2011 « ( )», 2011 3 Оглавление ОГЛАВЛЕНИЕ Введение ....................................................................................... От автора ..................................................................................... Глава 1. Векторы и линейные операции с ними ........... § 1.1. Матричные объекты .............................................. § 1.2. Направленные отрезки .......................................... § 1.3. Определение множества векторов ....................... § 1.4. Линейная зависимость векторов .......................... § 1.5. Базис. Координаты вектора в базисе ................... § 1.6. Действия с векторами в координатном представлении ................................................................ § 1.7. Декартова система координат .............................. § 1.8. Изменение координат при замене базиса и начала координат ....................................................... Глава 2. Произведения векторов ...................................... § 2.1. Ортогональное проектирование ........................... § 2.2. Скалярное произведение векторов и его свойства ............................................................................. § 2.3. Выражение скалярного произведения в координатах ....................................................................... § 2.4. Векторное произведение векторов и его свойства ............................................................................. § 2.5. Выражение векторного произведения в координатах ....................................................................... § 2.6. Смешанное произведение ..................................... § 2.7. Выражение смешанного произведения в координатах ................................................................... § 2.8. Двойное векторное произведение ........................ § 2.9. Замечания об инвариантности произведений векторов .................................................................. 8 10 12 12 21 24 28 34 38 44 47 54 54 57 59 61 65 68 70 72 75 4 Аналитическая геометрия и линейная алгебра Глава 3. § 3.1. § 3.2. § 3.3. § 3.4. § 3.5. Глава 4. § 4.1. § 4.2. § 4.3. § 4.4. § 4.5. § 4.6. Глава 5. § 5.1. § 5.2. § 5.3. § 5.4. § 5.5. § 5.6. Глава 6. § 6.1 § 6.2 § 6.3. § 6.4. § 6.5. § 6.6. § 6.7. § 6.8. Прямая и плоскость ............................................ Прямая на плоскости ............................................. Способы задания прямой на плоскости ............... Плоскость в пространстве ..................................... Способы задания прямой в пространстве ............ Решение геометрических задач методами векторной алгебры ...................................................... Нелинейные объекты на плоскости и в пространстве .................................................. Линии на плоскости и в пространстве ................. Поверхности в пространстве ................................ Цилиндрические и конические поверхности ...... Линии второго порядка на плоскости .................. Поверхности второго порядка в пространстве .... Альтернативные системы координат ................... Преобразования плоскости ............................... Умножение матриц ................................................ Операторы и функционалы. Отображения и преобразования плоскости .................................... Линейные операторы на плоскости ..................... Аффинные преобразования и их свойства .......... Ортогональные преобразования плоскости ........ Понятие группы ..................................................... Системы линейных уравнений ......................... Определители ......................................................... Свойства определителей ....................................... Разложение определителей ................................... Правило Крамера ................................................... Ранг матрицы ......................................................... Системы m линейных уравнений с n неизвестными ................................................................ Фундаментальная система решений .................... Элементарные преобразования. Метод Гаусса ... 79 79 84 93 103 107 119 119 124 127 130 138 141 147 147 158 161 169 184 189 191 191 192 199 205 208 213 216 227 5 Оглавление Глава 7. Линейное пространство ..................................... § 7.1. Определение линейного пространства ................ § 7.2. Линейная зависимость, размерность и базис в линейном пространстве ........................................ § 7.3. Подмножества линейного пространства ............. § 7.4. Операции с элементами линейного пространства в координатном представлении ....................... § 7.5. Изоморфизм линейных пространств ................... Глава 8 Линейные зависимости в линейном пространстве ........................................................ § 8.1. Линейные операторы ............................................. § 8.2. Действия с линейными операторами ................... § 8.3. Координатное представление линейных операторов ....................................................................... § 8.4. Область значений и ядро линейного оператора .. § 8.5. Инвариантные подпространства и собственные векторы ................................................................... § 8.6. Свойства собственных векторов и собственных значений ................................................................. § 8.7. Линейные функционалы ....................................... Глава 9. Нелинейные зависимости в линейном пространстве .................................. § 9.1. Билинейные функционалы .................................... § 9.2. Квадратичные функционалы ................................ § 9.3. Исследование знака квадратичного функционала ............................................................................. § 9.4. Инварианты линий второго порядка на плоскости ........................................................................... § 9.5. Экстремальные свойства квадратичных функционалов ................................................................. § 9.6. Полилинейные функционалы ............................... Глава 10. Евклидово пространство ................................... § 10.1. Определение и основные свойства .................... § 10.2. Ортонормированный базис. Ортогонализация базиса ................................................................... 235 235 239 244 251 254 267 267 269 275 283 296 303 317 325 325 329 339 348 353 354 356 356 360 6 Аналитическая геометрия и линейная алгебра § 10.3. Координатное представление скалярного произведения ............................................................. § 10.4. Ортогональные матрицы в евклидовом пространстве .............................................................. § 10.5. Ортогональные дополнения и ортогональные проекции в евклидовом пространстве ….…...... § 10.6. Сопряженные операторы в евклидовом пространстве .............................................................. § 10.7. Самосопряженные операторы ........................... § 10.8. Ортогональные операторы ................................. Глава 11. Унитарное пространство ................................... § 11.1. Определение унитарного пространства ............ § 11.2. Линейные операторы в унитарном пространстве ....................................................................... § 11.3. Эрмитовы операторы ......................................... § 11.4. Эрмитовы функционалы. Среднее значение и дисперсия эрмитова оператора .......................... § 11.5. Соотношение неопределенностей ..................... Глава 12. Прикладные задачи линейной алгебры .......... § 12.1. Приведение квадратичных функционалов к диагональному виду ........................................... § 12.2. Классификация поверхностей второго порядка § 12.3. Аппроксимация функций многочленами .......... Приложение 1. Свойства линий второго порядка на плоскости ................................................... Прил. 1.1 Вырожденные линии второго порядка …. Прил. 1.2 Эллипс и его свойства ................................ Прил. 1.3. Гипербола и ее свойства ............................ Прил. 1.4. Парабола и ее свойства .............................. Приложение 2. Свойства поверхностей второго порядка ....................................... Прил. 2.1. Вырожденные поверхности второго порядка ............................................................ Прил. 2.2. Эллипсоид ................................................... Прил. 2.3. Эллиптический параболоид ....................... 362 368 372 378 383 391 400 400 403 405 410 413 415 415 431 435 443 443 445 452 459 465 465 466 467 7 Оглавление Прил. 2.4. Прил. 2.5. Прил. 2.6. Прил. 2.7. Приложение 3. Приложение 4. Прил. 4.1. Прил. 4.2. Прил. 4.3. Прил. 4.4. Прил. 4.5. Гиперболический параболоид ................... Однополостный гиперболоид .................... Двуполостный гиперболоид ..................... Поверхности вращения ............................. Комплексные числа ................................. Элементы тензорного исчисления ........ Замечания об определении объектов в линейном пространстве ............................. Определение и обозначение тензоров ...... Операции с тензорами ............................... Тензоры в евклидовом пространстве ....... Тензоры в ортонормированном базисе..... Литература .................................................................................. Предметный указатель ............................................................. 469 472 474 475 478 488 488 496 504 515 520 528 529 8 Аналитическая геометрия и линейная алгебра ВВЕДЕНИЕ Отличительной чертой подготовки специалистов в Московском физико-техническом институте − системы "Физтеха", является сочетание интенсивности обучения с высоким уровнем детализации и глубины изучаемых предметов, в первую очередь естественных наук. Кафедра высшей математики МФТИ как важный элемент этой системы с момента образования института продолжает вносить существенный вклад в ее формирование и совершенствование. В активе кафедры колоссальный опыт в виде учебных курсов, оригинальных лекций по многим разделам современной математики, системы заданий, методических разработок, приемов, внутрикафедральных материалов, наконец, педагогического фольклора. На кафедре сформировался коллектив преподавателей, педагогически одаренных и обладающих педагогическим мастерством. Поэтому вполне естественно стремление сделать этот опыт всеобщим достоянием. Многое уже отражено в известных учебниках, задачниках, созданных выдающимися математиками и педагогами, среди которых В. С. Владимиров, С. М. Никольский, Л. Д. Кудрявцев, М. В. Федорюк и многие другие. Без сомнения, эти ставшие уже классическими учебные пособия оказали и оказывают существенное влияние на математическое образование как в России, так и за ее пределами. Вместе с тем есть еще немало того, что, несомненно, будет существенно полезным для улучшения подготовки специалистов. Естественным путем для выявления этого опыта, как нам представляется, могла бы быть серия "Лекции кафедры высшей математики МФТИ", и мы будем благодарны всем, кто окажет поддержку и посильную помощь в осуществлении данного проекта. Введение 9 В настоящем издании читателю предлагается одна из книг задуманной серии – расширенный курс лекций, который профессор А. Е. Умнов ряд лет читает студентам первого курса Московского физико-технического института. Подготовка первого издания осуществлена при поддержке ООО "Промфинэнерго". По содержанию и стилю изложения материала данная книга рассчитана на студентов физико-математических и технических специальностей высших учебных заведений с углубленной подготовкой по математике. В ней представлены как традиционные разделы аналитической геометрии, теории матриц, теории линейных систем и конечномерных векторных пространств, так и некоторые дополнительные разделы линейной алгебры, важные для студентов физических специальностей. На кафедре высшей математики МФТИ лекции по аналитической геометрии и линейной алгебре в разное время читали многие выдающиеся ученые и педагоги, такие, как Ф. Р. Гантмахер, В. Б. Лидский, А. А. Абрамов, Д. В. Беклемишев, В. А. Треногин и другие. Сам автор, будучи последовательно студентом, аспирантом, преподавателем и профессором этой кафедры, не мог не испытать влияния своих учителей. Структура и дух его лекций вполне традиционны для кафедры высшей математики МФТИ. В изложении материала автор успешно сочетает, не злоупотребляя абстракциями, достаточно высокий уровень строгости с простотой и ясностью. Предлагаемый читателям курс лекций А. Е. Умнова "Аналитическая геометрия и линейная алгебра" рекомендован кафедрой высшей математики Московского физико-технического института в качестве учебного пособия для студентов МФТИ. Эта книга также может быть использована в качестве учебного пособия и в других учебных заведениях с расширенной подготовкой по высшей математике. Г. Н. Яковлев Член-корреспондент РАО, профессор. Август, 1997 год 10 Аналитическая геометрия и линейная алгебра От автора Данное пособие предназначено для студентов физических и технических специальностей высших учебных заведений с расширенной подготовкой по высшей математике. Его основной целью является введение в теорию линейных пространств – математический аппарат, используемый в разнообразных прикладных дисциплинах: от квантовой механики до методов оптимального управления. Имея в виду особую терминологическую специфику этой теории, ее описание предваряется изложением основ евклидовой геометрии, выполненным при помощи понятий, характерных для теории линейных пространств. Включенный в пособие материал в основном соответствует программе курса “Аналитическая геометрия и линейная алгебра”, читаемого для студентов первого курса Московского физико-технического института. Также рассматриваются некоторые дополнительные вопросы, облегчающие изучение студентами математического аппарата теоретической физики и в первую очередь квантовой механики. Задачи, небольшое число которых включено в состав пособия, по мнению автора, существенны для понимания курса в целом. Предполагается, что читатель владеет основными понятиями курса элементарной геометрии, а также знаком в минимальном объеме с дифференциальным и интегральным исчислением. Используемая система обозначений единообразна для всех разделов пособия, что привело к небольшим отличиям от традиционной системы обозначений, в частности: - действительные числа, как правило, обозначаются строчными греческими буквами (исключение сделано лишь для декартовых координат x, y и z, целочисленных индексов и некоторых других стандартных обозначений); - строчные латинские буквы в основном использованы для обозначения более сложных, чем действительные числа, объектов: векторов, комплексных чисел, элементов линейных пространств, функций, функционалов, операторов, а также различных геометрических объектов; 11 Введение - матрицы обозначаются прописными латинскими буквами с двойными вертикальными ограничителями: например, - A ; во избежание конфликтов, для обозначений длин, абсолютных величин, модулей и норм используются одинарные вертикаль→ ные ограничители: например, a , в то время как для обозна- чения определителей матриц этот вид ограничителей не применяется, а используется обозначение функционального вида: например, det A . Автор выражает глубокую признательность преподавателям и сотрудникам кафедры высшей математики МФТИ, советы и замечания которых в большой степени способствовали улучшению пособия, и в первую очередь И. А. Чубарову, В. И. Чехлову, С. В. Ивановой и В. Б. Трушину. Предисловие ко второму изданию Со времени выхода в свет в 1997 году первого издания были учтены многочисленные рекомендации, позволившие улучшить структуризацию материала, включенного в пособие, исправлены замеченные опечатки и неточности. Автор особо благодарен посетителям интернет-сайта www.umnov.ru за доброжелательную критику и конструктивные замечания по версии текста, доступной на этом сайте. 12 Аналитическая геометрия и линейная алгебра Глава 1 ВЕКТОРЫ И ЛИНЕЙНЫЕ ОПЕРАЦИИ С НИМИ § 1.1. Матричные объекты Аналитическое описание геометрических фигур и тел, равно как и операций с ними, может быть в большом числе случаев упрощено за счет использования специального математического объекта, называемого матрицей. Определение Матрицей размера m × n называется упорядоченная прямоугольная таблица (или массив) чисел, содер1.1.1. жащая m строк и n столбцов. Числа, входящие в описание матрицы, называемые ее элементами (или компонентами), характеризуются как своим значением, так и номерами строк и столбцов, в которых они расположены. Условимся обозначать элемент матрицы, расположенный в i -й строке и j -м столбце, как α i j 1. Определение 1.1.2. Числа цы. m , n и m × n называются размерами матри- Матрицы обозначаются и записываются перечислением их элементов. Например, матрица с элементами α i j ; i = [1, m] ; j = [1, n] или же в развернутой форме: 1 Следует читать “альфа i − j“. 13 Г л а в а 1 . Векторы и линейные операции с ними α 11 α 21 α 31 ... α m1 α 12 α 22 α 32 ... α m2 α 13 α 23 α 33 ... α m3 ... ... ... ... ... α 11 α 21 α 31 ... α m1 α 1n α 2n α 3n ; ... α mn α 12 α 22 α 32 ... α m2 α 11 α 21 α 31 ... α m1 α 13 α 23 α 33 ... α m3 ... ... ... ... ... α 12 α 22 α 32 ... α m2 α 13 α 23 α 33 ... α m3 ... ... ... ... ... α 1n α 2 n α 3n ; ... α mn α 1n α 2n α 3n , ... α mn из которых будем использовать последнюю. Если же потребуется неразвернутое представление матрицы, то мы запишем ее в виде или просто αi j A . Матрицы принято классифицировать по количеству их строк и столбцов. Определение 1.1.3. Если m = n , то матрица называется квадратной, порядка n . Матрица размера m × 1 называется m -мерным (или m -компонентным) столбцом. Матрица размера 1 × n называется n -мерной (или n -компонентной) строкой. Отметим, что, хотя формально для обозначения строк или столбцов следует использовать двухиндексные записи α 1 j или β i1 , неменяющиеся индексы принято опускать, в результате чего обозначения строк или столбцов имеют вид α j или соответственно β i . 14 Аналитическая геометрия и линейная алгебра В этих случаях, разумеется, необходимо явно указывать, о чем идет речь: о строке или о столбце. Некоторые часто используемые матрицы с особыми значениями элементов имеют специальные названия и обозначения. Определение 1.1.4. Квадратная матрица, для которой α ij = α ji ∀i, j = [1, n] , называется симметрической. Матрица, все элементы которой равны нулю, называется нулевой. Нулевую матрицу обозначают как Квадратная матрица порядка O . n вида 1 0 0 ... 0 0 1 0 ... 0 0 0 1 ... 0 ... ... ... ... ... 0 0 0 ... 1 называется единичной. Единичную матрицу принято обозначать E . Операции с матрицами Определение 1.1.5. Две матрицы A (обозначается: A = B ), если они одинаковых и B называются равными размеров и если их соответствующие компоненты равны, то есть α i j = β i j ∀i = [1, m] и ∀j = [1, n] . 15 Г л а в а 1 . Векторы и линейные операции с ними Определение 1.1.6. Матрица C A и называется суммой матриц B (обозначается: C = A + B ), если матрицы A , B , C одинаковых размеров и γ i j = α i j + β i j ∀i = [1, m] , ∀j = [1, n] , γ i j ∀i = [1, m] , ∀j = [1, n] являются где числа соответствующими компонентами матрицы Определение 1.1.7. Матрица C называется произведением числа λ на матрицу матрицы C . A (обозначается: C = λ A ), если A и C одинаковых размеров и γ i j = λα i j ∀i = [1, m] , ∀j = [1, n] . Отметим, что умножать на число можно матрицу любого размера. в качестве всех (или некоторых) элементов матрицы Замечание: возможно использование не только чисел, но и других математических объектов, для которых подходящим образом определены операции сравнения, сложения и умножения на число, например, векторов, функций или тех же матриц. Определение 1.1.8. Транспонированием матрицы называется операция, в результате которой образуется новая матрица, где строками служат столбцы исходной, записанные с сохранением порядка их следования (рис. 1.1.1). Матрица, получающаяся в результате транспонирования матрицы T A , обозначается A . 16 Аналитическая геометрия и линейная алгебра Рис. 1.1.1 При транспонировании α11 α 21 α12 α 22 ... ... α m1 α m 2 α13 α 23 ... α1n ... α 2 n ... ... ... α m3 ... α mn T α11 α12 = α13 ... α1n α 21 ... α m1 α 22 ... α m 2 α 23 ... α m3 , ... ... ... α 2 n ... α mn то есть для элементов транспонированной матрицы A венство α iTj = α ji T верно ра- ∀i = [1, m] , ∀j = [1, n] . Операция транспонирования, например, не изменяет симметрическую матрицу, но переводит строку размера 1 × m в столбец размера m × 1 и наоборот. Детерминанты (определители) квадратных матриц 2-го и 3-го порядков Для квадратных матриц существует специальная числовая характеристика, называемая детерминантом (или определителем) и обозна- 17 Г л а в а 1 . Векторы и линейные операции с ними чаемая как 2 det A . Описание свойств определителей квадратных матриц n -го порядка будет приведено в главе 6, здесь же мы ограничимся рассмотрением случаев n = 2 и n = 3 . Определение 1.1.9. Детерминантом (определителем) квадратной матриα11 α12 цы 2-го порядка называется число α 21 α 22 det Определение 1.1.10. α 11 α 12 α 21 α 22 = α11α 22 − α12 α 21 . Детерминантом (определителем) квадратной матрицы 3-го порядка α 11 α 12 α 13 α 21 α 31 α 22 α 32 α 23 α 33 называется чис- ло α11 det α 21 α 31 α12 α 22 α 32 α13 α 23 = α11α 22 α 33 + α13 α 21α 32 + α 33 + α 12 α 23 α 31 − α 13 α 22 α 31 − α 12 α 21 α 33 − α 11 α 23 α 32 . Для определителей квадратных матриц справедливы следующие теоремы: Теорема 1.1.1. 2 Определитель матрицы 3-го порядка может быть выражен через определители 2-го порядка формулой следующего вида: Детерминант квадратной матрицы также часто обозначают при помощи одинарных вертикальных ограничителей K . Мы не будем использовать эту форму, чтобы избежать конфликта с представлением абсолютных величин, модулей, длин и норм. 18 Аналитическая геометрия и линейная алгебра α 11 α 12 α 13 det α 21 α 31 α 22 α 32 α 23 = α 33 = α 11 det + α 13 det α 22 α 23 α 32 α 33 α 21 α 22 α 31 α 32 − α 12 det α 21 α 23 α 31 α 33 + , называемой разложением определителя по первой строке. Доказательство. Данная формула проверяется непосредственно при помощи определений 1.1.9 и 1.1.10. Замечания. 1°. Формулы, аналогичные приведенной в формулировке теоремы 1.1.1, могут быть получены как для каждой из остальных строк матрицы, так и для любого из ее столбцов. Рис. 1.1.2 2°. Иногда подсчет значения определителя матрицы 3-го порядка удобнее выполнить по следующему правилу: Г л а в а 1 . Векторы и линейные операции с ними 19 каждое слагаемое в определении 1.1.10 есть произведение некоторой тройки элементов матрицы, причем элементы, входящие в произведения, берущиеся со знаком «плюс», соединены в левой части рис. 1.1.2 сплошными линиями, а элементы, входящие в произведения, которые берутся со знаком «минус», – в правой. Непосредственная проверка показывает, что из определений 1.1.9 и 1.1.10 вытекает При транспонировании квадратных матриц 2-го Следствие или 3-го порядков их определители не меняются. 1.1.1. В терминах определителей матриц второго порядка достаточно удобно формулируется условие однозначной разрешимости системы двух линейных уравнений с двумя неизвестными. Теорема 1.1.2 (Крамера). Для того чтобы система линейных уравнений α11ξ1 + α12 ξ 2 = β1 , α 21ξ1 + α 22 ξ 2 = β 2 имела единственное решение, необходимо и достаточно, чтобы det α11 α 21 α12 ≠ 0. α 22 Доказательство. Докажем необходимость. Пусть данная система линейных уравнений имеет единственное решение – упорядоченную пару чисел {ξ1 , ξ 2 } , тогда должны быть справедливыми следующие из ее уравнений соотношения 20 Аналитическая геометрия и линейная алгебра ξ1 (α11α 22 − α12 α 21 ) = (β1α 22 − β 2 α12 ) ; ξ 2 (α 11α 22 − α12 α 21 ) = (β 2 α11 − β1α 21 ) или ξ1 ∆ = ∆ 1 ; ξ 2 ∆ = ∆ 2 , где и ∆ = det ∆ 2 = det α11 α 21 α12 β , ∆ 1 = det 1 α 22 β2 α12 α 22 α11 β1 . α 21 β 2 ∆ = 0, ξ1 ∆ = ∆ 1 ; ξ 2 ∆ = ∆ 2 не верны при ∆1 ≠ 0 ∆ = 0, или при ∆ 2 ≠ 0. Равенства В то же время (проверьте это самостоятельно) при ∆ = ∆1 = ∆ 2 = 0 коэффициенты уравнений исходной системы обязаны быть пропорциональными, и тогда у нее имеется бесчисленное множество решений – пар чисел {ξ1 , ξ 2 } , таких, α11ξ1 + α12 ξ 2 = β1 . Поэтому из условия существования и единственности решения следует, что ∆ ≠ 0. что ∆ ≠ 0 , то исходная система линейных уравнений имеет решение { ξ1 , ξ 2 } , однозначно определяется значениями параметров α 11 , α 12 , α 21 , α 22 , β1 , β 2 и Докажем достаточность. Если формулами ξ1 = Теорема доказана. ∆1 ∆ и ξ2 = ∆2 ∆ . Г л а в а 1 . Векторы и линейные операции с ними 21 § 1.2. Направленные отрезки Определение 1.2.1. Отрезок прямой, концами которого служат точки A и B, называется направленным отрезком, если указано, какая из этих двух точек является началом и какая – концом отрезка. Направленный отрезок, начало и конец которого совпадают, называется нулевым направленным отрезком. Будем обозначать направленный отрезок в виде AB, полагая, что точка A является началом отрезка, а точка B – его концом. Иногда направленный отрезок представляется просто как a . Длина отрезка обозначается как AB или a соответственно. Действия с направленными отрезками Определение 1.2.2. Два ненулевых направленных отрезка AB и CD называются равными, если их начала и их концы могут быть совмещены параллельным переносом одного из этих отрезков. Заметим, что в силу определения 1.2.2 параллельный перенос направленных отрезков не меняет. Пусть даны два направленных отрезка Определение 1.2.3. a иb. b с концом a (то есть построим направленный отрезок b′ , равный b , начало которого совпадает с концом отрезка a ), тогда Совместим начало отрезка 22 Аналитическая геометрия и линейная алгебра c , начало которого совпадает с началом a и конец с концом b′ , называется суммой направленных отрезков a и b 3. направленный отрезок Это определение иногда называют правилом треугольника (рис. 1.2.1). Рис. 1.2.1 Отметим, что для операции сложения направленных отрезков: 1) 2) 3) 4) 3 обобщение правила треугольника на любое число слагаемых носит название правила замыкающей, смысл которого ясен из рис. 1.2.2; операция сложения направленных отрезков может быть выполнена по правилу параллелограмма, равносильному определению 1.2.3 (см. рис. 1.2.3); a − b направленных отрезков a и b называется направленный отрезок c , удовлетворяющий равенству a =b+c; разностью любой направленный отрезок при сложении с нулевым не изменяется. Для операции замены направленного отрезка на равный, но не совпадающий с ним направленный отрезок будем употреблять термин параллельный перенос направленного отрезка. Г л а в а 1 . Векторы и линейные операции с ними 23 Рис. 1.2.2 Рис. 1.2.3 Определение 1.2.4. Под произведением число λ a направленного отрезка a на λ понимают: при λ = 0 нулевой направленный отрезок, 24 Аналитическая геометрия и линейная алгебра при λ торого ≠ 0 направленный отрезок, для ко- длина равна λ a; направление совпадает с направлением a , если λ > 0 , направление противоположно направлению a , если λ < 0 . § 1.3. Определение множества векторов Определение 1.3.1. Совокупность всех направленных отрезков, для которых введены описанные в § 1.2 операции: - сравнения (опр. 1.2.2); - сложения (опр. 1.2.3); - умножения на вещественное число (опр. 1.2.4), называется множеством векторов. Конкретный элемент этого множества будем называть вектором и обозначать символом с верхней → стрелкой, например, a. → Нулевой вектор обозначается символом Теорема 1.3.1. o. Операции сложения и умножения на вещественное число на множестве векторов обладают свойствами: → 1º. Коммутативности → → → a+b = b+a. 25 Г л а в а 1 . Векторы и линейные операции с ними 2º. Ассоциативности → → → → → → a + (b + c ) = (a + b ) + c ; → → λ(µ a ) = (λµ) a . 3º. Дистрибутивности → → → → → → λ( a + b ) = λ a + λ b ; → (λ + µ ) a = λ a + µ a → для любых векторов ных чисел λ и µ . → → a , b и c и любых веществен- Данные свойства следуют из определения множества векторов и нуждаются в доказательстве. В качестве примера приведем Доказательство свойства коммутативности. → → Пусть даны два вектора a и b . Совместим начала этих векторов и построим на них параллелограмм ABCD (рис. 1.3.1). Рис. 1.3.1 26 Аналитическая геометрия и линейная алгебра Поскольку у параллелограмма противолежащие стороны па→ → → → CD = a ; BD = b , но тогда, по правилу треугольника, из треугольников ACD и раллельны и имеют равные длины, то → → → → → → ABD следует, что AD = b + CD; AD = a + BD , то есть → → → → a+b = b+a. Теорема доказана. Замечания об определении векторов 1°. Иногда вектор определяют просто как объект, характеризуемый числовой величиной и направлением. Хотя формально такой подход и допустим, он может оказаться причиной некоторых проблем, суть которых иллюстрируется следующим примером. Рис. 1.3.2 Поток автомобилей (то есть количество автомобилей, проезжающих мимо наблюдателя за единицу времени) на конкретной дороге является объектом, для характеристики которого нужно указать как его величину (число проходящих за единицу времени автомашин), так и его направление. 27 Г л а в а 1 . Векторы и линейные операции с ними Предположим, что этот объект векторный (в смысле определения 1.3.1), и рассмотрим перекресток трех дорог, показанный на рис. 1.3.2, на котором сливаются два потока автомобилей по 500 автомашин в час каждый. Если суммировать потоки как векторы, то вместо очевидного результата 1000 а-м/ч мы получим (по правилу параллелограмма) заведомо бессмысленное значение 2°. 3°. 500 2 ≈ 700 а-м/ч. Отсюда следует, что хотя поток автомашин характеризуется числовым значением и направлением, но тем не менее вектором (в смысле определения 1.3.1) не является. С другой стороны, необходимо иметь в виду, что определение множества векторов 1.3.1 допускает их дальнейшую, более тонкую дифференциацию. Например, в некоторых физических и технических приложениях различают векторы полярные и аксиальные. К первым относятся, например, векторы скорости, силы, напряженности электрического поля; ко вторым – векторы момента силы, напряженности магнитного поля. Кроме того, в механике векторы подразделяются на свободные, скользящие и закрепленные, в зависимости от той роли, которую играет точка их приложения. К заключению о векторной природе тех или иных физических характеристик можно прийти путем рассуждений, основанных на определении 1.3.1 и экспериментальных данных. Например, пусть некоторая материальная точка A , имеющая электрический заряд, перемещается в пространстве под действием электрического поля. Положение этой точки в пространстве в момент времени τ 0 можно задать исходящим из точки наблюдения и направленным в → тором → A век- r (τ 0 ) , а в момент времени τ – вектором r (τ). 28 Аналитическая геометрия и линейная алгебра → Поскольку перемещение → r (τ) − r (τ 0 ) (как разность двух векторов) является вектором, то и скорость движения материальной точки будет вектором в силу определения 1.3.1. Рассуждая аналогично, можно прийти к заключению, что вектором является также и ускорение. С другой стороны, согласно второму закону Ньютона, ускорение материальной точки пропорционально действующей на нее силе, и, следовательно, сила тоже есть вектор. Наконец, принимая во внимание пропорциональность силы, действующей на заряженное тело, и напряженности электрического поля, заключаем, что последняя характеристика также векторная. § 1.4. Линейная зависимость векторов Вначале введем часто используемые в приложениях понятия коллинеарности и компланарности векторов. Определение 1.4.1. Два вектора, параллельные одной и той же прямой, называются коллинеарными. Три вектора, параллельные одной и той же плоскости, называются компланарными. Нулевой вектор считается коллинеарным любому другому вектору. Нулевой вектор считается компланарным любой паре векторов. → Определение 1.4.2. Выражение вида → → λ 1 a1 + λ 2 a 2 + ... + λ n a n , где λ i ; i = [1, n] – некоторые числа, называется линей→ ной комбинацией векторов → → a1 , a 2 , ... , a n . 29 Г л а в а 1 . Векторы и линейные операции с ними Если все числа но λ 1 , λ 2 , ... , λ n равны нулю одновремен- (что равносильно условию λ1 + λ 2 + ... + λ n = 0) , то такая линейная комбинация называется тривиальной. Если хотя бы одно из чисел нуля (то есть λ 1 , λ 2 , ... , λ n отлично от λ1 + λ 2 + ... + λ n > 0 ), то данная ли- нейная комбинация называется нетривиальной. Соглашение о суммировании В тех случаях, когда явная запись суммы некоторого числа слагаемых нецелесообразна или невозможна, но известно, как зависит значение каждого из слагаемых от его номера, то допускается использование специальной формы записи операции суммирования: n F (k ) + F (k + 1) + ... + F (n) = ∑ F (i ) , i=k F (i ) по i от k до n ), где i – индекс суммирования, k – минимальное значение индекса суммирования, n – максимальное значение индекса суммирования и, наконец, F (i ) – общий (читается: сумма вид слагаемого. Пример 1.4.1. По соглашению о суммировании будут справедливы следующие равенства: 12 + 2 2 + ... + (n − 1) 2 + n 2 = n ∑ i2 i =1 = n(n + 1)(2n + 1) , 6 = 30 Аналитическая геометрия и линейная алгебра 13 + 2 3 + ... + (n − 1) 3 + n 3 n = ∑i = 3 i =1 n 2 (n + 1) 2 4 = n 2 (∑ i) , = i =1 1 1 1 + + ... + 1⋅ 2 2 ⋅ 3 (n − 1)n = n −1 1 ∑ i(i + 1) i −1 . i = i =1 Используя данное соглашение о суммировании, линейную комби→ нацию → → λ 1 a1 + λ 2 a 2 + ... + λ n a n можно записать в виде → n ∑ λ i ai . i =1 Приведем теперь определение важного понятия линейной зависимости системы векторов. → Определение 1.4.3. Векторы → → a1 , a 2 , ..., a n называются линейно зависи- мыми, если существует их нетривиальная линейная n комбинация → ∑ λ i ai , такая, что i =1 → Определение 1.4.4. Векторы → → n → ∑ λ i ai = o . i =1 → a1 , a 2 , ..., a n называются линейно незавиn симыми, если из условия → → ∑ λ i ai = o следует триi =1 n виальность линейной комбинации i =1 что λ 1 = λ 2 = ... = λ n = 0 . → ∑ λ i ai , то есть 31 Г л а в а 1 . Векторы и линейные операции с ними → Иначе говоря, если векторы то для любого набора чисел → λ 1 , λ 2 , ..., λ n , не равных нулю одновре→ n менно, линейная комбинация → a1 , a 2 , ..., a n линейно независимы, ∑λ k =1 k a k не нулевой вектор. → → → a1 , a 2 , ..., a n Для линейной зависимости векторов Лемма 1.4.1. необходимо и достаточно, чтобы один из них был линейной комбинацией остальных. Доказательство. → → λ 1 , λ 2 , ..., λ n , од- нейно зависимы, тогда существуют числа → n новременно не равные нулю, такие, что → a1 , a 2 , ..., a n ли- Докажем необходимость. Пусть векторы → ∑ λ k ak = o . Для k =1 определенности можно считать, что → n a1 = ∑ (− k =2 λ1 ≠ 0 , но тогда λk → ) ak , λ1 что и доказывает необходимость. Докажем теперь достаточность. Пусть для определенности → n → → n → → a1 = ∑ λ k a k , тогда (−1 ) a1 + ∑ λ k a k = o , причем k =2 k =2 | − 1 | + | λ 2 | + ... + | λ n | > 0 . → То есть линейная комбинация векторов ная нулевому вектору, нетривиальная. Лемма доказана. → → a1 , a 2 , ..., a n , рав- 32 Аналитическая геометрия и линейная алгебра Справедливы следующие утверждения. Один вектор линейно зависим тогда и только тогда, Теорема когда он нулевой. 1.4.1. Теорема 1.4.2. Два вектора линейно зависимы тогда и только тогда, когда они коллинеарны. Теорема 1.4.3. Три вектора линейно зависимы тогда и только тогда, когда они компланарны. Теоремы 1.4.1 и 1.4.2 предлагаются для самостоятельного доказательства. Здесь же мы рассмотрим подробно теорему 1.4.3. Доказательство. → Докажем необходимость. Пусть три вектора → → a1 , a 2 , a3 линейно зависимы, то есть существуют три, одновременно не равных нулю, числа λ 1 , λ 2 , λ 3 , таких, что → → → → λ 1 a1 + λ 2 a 2 + λ 3 a3 = o . Тогда по лемме 1.4.1 один из векторов есть линейная комбинация двух остальных, и, значит, данные три вектора компланарны. → → Докажем достаточность в предположении, что векторы a1 и a 2 неколлинеарны. Пусть даны три компланарных вектора → → → a1 , a 2 , a3 . Перенесем эти векторы таким образом, чтобы их начала попали в одну точку. → Через конец вектора → → рам a3 проведем прямые, параллельные векто→ → a1 и a 2 . При этом получим пару векторов b1 и b2 , та→ ких, что → → a3 = b1 + b2 (рис. 1.4.1). 33 Г л а в а 1 . Векторы и линейные операции с ними → Поскольку вектор b1 колли- → неарен вектору a1 , а вектор → → b2 коллинеарен вектору a2 , по лемме 1.4.1 и теореме 1.4.2 получаем, что → → → → b1 = λ 1 a1 ; b2 = λ 2 a 2 , но тогда Рис. 1.4.1 → → → a3 = λ 1 a1 + λ 2 a 2 , → и векторы → → a1 , a 2 , a3 по лемме 1.4.1 линейно зависимы. Случай → коллинеарных → a1 и a2 рассмотрите самостоятельно. Теорема доказана. Свойства линейно независимых векторов 1°. 2°. 3°. Один вектор линейно независим тогда и только тогда, когда он ненулевой. Два вектора линейно независимы тогда и только тогда, когда они неколлинеарны. Три вектора линейно независимы тогда и только тогда, когда они некомпланарны. → Теорема 1.4.4. Если среди векторов → → {a1 , a 2 , ..., a n } имеется подмно- жество линейно зависимых, то и все векторы → → → {a1 , a 2 , ..., a n } линейно зависимы. 34 Аналитическая геометрия и линейная алгебра Доказательство. Без ограничения общности можно считать, что линейно зависимы первые k < n векторов (иначе просто перенумеруем эти векторы), то есть существуют не равные нулю одновременно числа λ 1 , λ 2 , ..., λ k , такие, что → k → ∑ λ i ai = o . i =1 Построим нетривиальную линейную комбинацию векторов → → → {a1 , a 2 , ..., a n } , взяв в качестве первых k коэффициентов числа λ i , i = [1, k ] и нули в качестве остальных. Тогда получим, что n → k → ∑ λ i ai = ∑ λ i ai + i =1 i =1 n → → ∑ 0 ⋅ ai = o . i = k +1 Теорема доказана. → Следствие 1.4.1. Если среди векторов → → {a1 , a 2 , ..., a n } имеется хотя → бы один нулевой, то векторы → → {a1 , a 2 , ..., a n } ли- нейно зависимы. § 1.5. Базис. Координаты вектора в базисе Определение 1.5.1. Базисом на прямой называется любой ненулевой вектор, принадлежащий этой прямой. Базисом на плоскости называется любая упорядоченная пара линейно независимых векторов, принадлежащих этой плоскости. 35 Г л а в а 1 . Векторы и линейные операции с ними Базисом в пространстве называется любая упорядоченная тройка линейно независимых векторов. Определение 1.5.2. Базис называется ортогональным, если образующие его векторы попарно ортогональны (взаимно перпендикулярны). Определение 1.5.3. Ортогональный базис называется ортонормированным, если образующие его векторы имеют единичную длину. Пространственный базис, составленный из линейно независимых → векторов → → → → → g1 , g 2 , g 3 , будем обозначать {g1 , g 2 , g 3 } . Ортогональ- ный или ортонормированный базис условимся обозначать как → → → {e1 , e2 , e3 } . → Теорема 1.5.1. Пусть дан базис → → → {g1 , g 2 , g 3 } , тогда любой вектор x в пространстве может быть представлен и притом единственным образом в виде → → → → x = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 , где ξ1 , ξ 2 , ξ 3 – некоторые числа. Доказательство. 1°. Докажем вначале существование таких чисел. → Совместим начала всех векторов → → → g1 , g 2 , g 3 и x в точке O и → проведем через конец вектора → плоскости → O, g1 , g 2 (рис. 1.5.1). x плоскость, параллельную 36 Аналитическая геометрия и линейная алгебра → Построим новые векторы → → → y и → → z так, чтобы x = z + y , а z → g 3 были коллинеарны, тогда и в силу коллинеарности векто→ ров → z и g 3 имеем → → z = ξ3 g 3 . Перенеся затем начало вектора → y в точку O и рассуждая как при доказательстве теоремы 1.4.3, получим → → → y = ξ1 g1 + ξ 2 g 2 и, следовательно, → Рис. 1.5.1 → → → x = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 , что доказывает существование разложения. 2°. Докажем единственность разложения по базису. Пусть мы → → → → x = ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 и допустим, что существует другая тройка чисел ξ1′ , ξ′2 , ξ ′3 , таких, что имеем → → → → x = ξ1′ g1 + ξ′2 g 2 + ξ′3 g 3 . Вычитая почленно эти равенства, получаем → → → → (ξ1 − ξ1′ ) g1 + (ξ 2 − ξ′2 ) g 2 + (ξ 3 − ξ′3 ) g 3 = o , 37 Г л а в а 1 . Векторы и линейные операции с ними где в силу сделанного предположения о неединственности разложения ξ1 − ξ1′ + ξ 2 − ξ′2 + ξ 3 − ξ′3 > 0 . Но полученное неравенство означает, что линейная комбинация → → → (ξ1 − ξ1′ ) g1 + (ξ 2 − ξ′2 ) g 2 + (ξ 3 − ξ′3 ) g 3 → нетривиальна, векторы → → {g1 , g 2 , g 3 } линейно зависимы и, следовательно, не могут быть базисом в силу определения 1.5.1. Полученное противоречие доказывает единственность разложения. Теорема доказана. Определение 1.5.4. ξ1 , ξ 2 , ξ 3 – коэффициенты в разложении Числа → → → → x = ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 – называются координа→ тами (или компонентами) вектора → → x в базисе → {g1 , g 2 , g 3 } . Для сокращенной записи координатного разложения вектора → → → → x = ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 используются формы: → 1°. x( ξ1 , ξ 2 , ξ 3 ), ξ1 4°. ξ 2 , ξ 3 2°. (ξ1 , ξ 2 , ξ 3 ), ξ1 5°. ξ2 , ξ3 3°. ξ1 ξ2 ξ3 , 38 Аналитическая геометрия и линейная алгебра из которых в дальнейшем мы будем использовать последнюю. В об→ → щем случае утверждение «вектор → ξ1 координатное представление → x в базисе {g1 , g 2 , g 3 } имеет ξ1 → ξ 2 » записывается как x ξ3 g = ξ2 , ξ3 но иногда, если это не приводит к неоднозначности толкования, будем ξ1 → использовать и сокращенную запись вида → → Наконец, если вектор → быть представлен как → имеет вид = x g x = ξ2 . ξ3 → x в базисе {g1 , g 2 } на плоскости может → → x = ξ1 g1 + ξ 2 g 2 , то его координатная запись ξ1 . ξ2 § 1.6. Действия с векторами в координатном представлении → Поскольку в конкретном базисе → → {g1 , g 2 , g 3 } каждый вектор пол- ностью и однозначно описывается упорядоченной тройкой чисел ξ1 , ξ 2 , ξ 3 – своим координатным представлением, то естественно возникает вопрос о том, как выполняются операции с векторами в координатном представлении. Оказывается, что возможно не только записывать векторы при помощи матриц (столбцов), но и оперировать с ними в матричной форме, поскольку правила действий с векторами в координатной форме совпадают с правилами соответствующих операций с матрицами. 39 Г л а в а 1 . Векторы и линейные операции с ними Имеет место Теорема В координатном представлении операции с векторами выполняются следующим образом: 1.6.1. 1°°. Сравнение векторов Два вектора → → → → x = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 → и → → → y = η1 g1 + η 2 g 2 + η3 g 3 равны тогда и только тогда, когда равны их координатные представления: → → = y x g 2°°. Сложение векторов g Координатное двух векторов → ξ1 = η1 или ξ 2 = η 2 . ξ = η 3 3 представление → → суммы → x = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 → и → → → y = η1 g1 + η 2 g 2 + η3 g 3 равно сумме координатных представлений слагаемых → → → x+ y g 3°°. Умножение векторов на число → = x + y g . g Координатное представление произведения числа λ на вектор → → → → x = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 40 Аналитическая геометрия и линейная алгебра λ на коорди- равно произведению числа → натное представление вектора → x: → λx =λ x . g g Доказательство. Поскольку рассуждения для всех трех пунктов аналогичны, рассмотрим лишь правило сложения векторов в координатной форме. По свойствам операций сложения и умножения на вещественное число векторов (теорема 1.3.1) имеем → → → x+ y → → → → → = (ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 ) + (η1 g1 + η 2 g 2 + η3 g 3 ) g = g → → → = (ξ1 + η1 ) g1 + (ξ 2 + η 2 ) g 2 + (ξ 3 + η3 ) g 3 = g ξ1 + η1 ξ1 η1 → = ξ 2 + η2 = ξ 2 + η2 = x ξ 3 + η3 ξ3 η3 → + y g . g Теорема доказана. Следствие 1.6.1. Координатное представление линейной комбинации → → λ x + µ y является той же линейной комбинацией → координатных представлений векторов → x и y: 41 Г л а в а 1 . Векторы и линейные операции с ними λξ1 + µη 1 ξ1 η1 λξ 2 + µη 2 = λ ξ 2 + µ η 2 . λξ 3 + µη 3 ξ3 η3 Рассмотрим теперь вопрос о том, как в координатном представлении записываются условия линейной зависимости и независимости векторов. → Теорема 1.6.2. → Для того чтобы два вектора x и y на плоскости были линейно зависимы, необходимо и достаточно, → чтобы их координатные представления = x g → = y и g ξ1 ξ2 η1 удовлетворяли условию η2 det ξ1 ξ2 η1 = 0. η2 Доказательство. Докажем необходимость. → Пусть векторы → x и y линейно зависимы, тогда в силу лем→ мы 1.4.1 имеет место равенство форме ξ1 = λη1 , Исключив λ из этих двух скалярных со ξ 2 = λη 2 . отношений, получим что → x = λ y или в координатной det ξ1 ξ2 ξ1η 2 − ξ 2 η1 = 0, но это и означает, η1 = 0. η2 42 Аналитическая геометрия и линейная алгебра Докажем достаточность. Пусть имеем, что det ξ1 ξ2 η1 = 0, тогда η2 ξ1 ξ 2 = при η1 ≠ 0 ; η 2 ≠ 0 , то есть соотη1 η 2 → → ветствующие координаты векторов x и y пропорциональны, что и доказывает линейную зависимость этих векторов. Случай η1η 2 = 0 предлагается рассмотреть самостоятельно. Теорема доказана. → → → Теорема 1.6.3. Для того чтобы три вектора в пространстве с координатными представлениями ξ1 → x g η1 → = ξ2 , ξ3 y g = η2 и η3 { x , y, z} κ1 → z g = κ2 κ3 были линейно зависимы, необходимо и достаточно, чтобы их координаты удовлетворяли условию ξ1 η1 κ1 det ξ 2 ξ3 η2 η3 κ 2 = 0. κ3 Доказательство. → → → Пусть линейная комбинация векторов → вому вектору, то есть → x , y , z равна нуле→ → λ1 x + λ 2 y + λ 3 z = o , или в коор- динатном представлении 43 Г л а в а 1 . Векторы и линейные операции с ними ξ1 η1 κ1 0 λ1 ξ 2 + λ 2 η 2 + λ 3 κ 2 = 0 . ξ3 η3 κ3 0 Это матричное равенство, очевидно, равносильно системе линейных уравнений λ1ξ1 + λ 2 η1 + λ 3 κ1 = 0, λ1ξ 2 + λ 2 η 2 + λ 3 κ 2 = 0, λ ξ + λ η + λ κ = 0, 2 3 3 3 1 3 которая (согласно теореме Крамера, теорема 6.4.1) имеет единственное решение тогда и только тогда, когда определитель ее основной матрицы отличен от нуля. Но, с другой стороны, очевидно, что данная система всегда имеет нулевое (тривиальное) решение. Значит, условие ξ1 η1 κ1 det ξ 2 ξ3 η2 η3 κ2 ≠ 0 κ3 равносильно системе равенств λ1 = λ 2 = λ 3 = 0, что и доказывает утверждение теоремы. Заметим, что альтернативная версия доказательства приводится в параграфе «Смешанное произведение векторов» (§ 2.6). Теорема доказана. 44 Аналитическая геометрия и линейная алгебра § 1.7. Декартова система координат → Определение 1.7.1. Совокупность базиса → → {g1 , g 2 , g 3 } и точки O, в кото- рую помещены начала всех базисных векторов, называется общей декартовой системой координат → → → (ДСК) и обозначается {O, g1 , g 2 , g 3 }. Определение Система координат {O, e1 , e2 , e3 } , порождаемая 1.7.2. ортонормированным базисом, называется нормальной прямоугольной (или ортонормированной) системой координат. → → Если задана система координат точке → → → → {O, g 1 , g 2 , g 3 } , то произвольной M в пространстве можно поставить во взаимно однозначное → соответствие вектор нец – в точке M . r , начало которого находится в точке O , а ко- → Определение 1.7.3. Вектор → точки Определение 1.7.4. → r = OM называется радиусом-вектором → → M в системе координат {O, g1 , g 2 , g 3 }. Координаты радиуса-вектора точки M называются координатами точки M в системе координат → → → {O, g1 , g 2 , g 3 }. Проиллюстрируем особенности использования векторнокоординатного описания геометрических объектов на примере решения следующих задач. 45 Г л а в а 1 . Векторы и линейные операции с ними Задача 1.7.1. В некоторой общей декартовой системе координат → → → {O , g 1 , g 2 , g 3 } заданы координаты радиусов-векторов точек M и N , которые являются началом и концом век→ тора → MN . Требуется найти координаты вектора MN . Решение. Решение очевидно из рис. 1.7.1 и свойств координат векторов. ξ1 → Пусть OM = ξ 2 и ON = η 2 . ξ3 η3 → Тогда → η1 → → → → OM + MN = ON имеем и → MN = ON − OM . Окончательно → MN = η 2 − ξ 2 . η3 − ξ 3 Рис. 1.7.1 Задача 1.7.2. η1 − ξ1 В некоторой общей декартовой системе координат → → → {O, g1 , g 2 , g 3 } заданы координаты несовпадающих точек → M 1 и M 2 , для которых соответственно ξ1 OM 1 = ξ 2 ξ3 и → M, такую, что η1 → OM 2 = η 2 . Требуется найти точку η3 → M 1 M = λ MM 2 . 46 Решение. Аналитическая геометрия и линейная алгебра Заметим, что λ может принимать любое значение, кроме − 1 , при котором точка M уходит в бесконечность (рис. 1.7.2). Найдем радиус-вектор точки M . Из соотношений в треугольниках OM 1 M и OMM 2 получаем → → → → → → OM1 + M 1 M = OM ; OM + MM 2 = OM 2 , → но так как → → M 1 M = λ MM 2 , то → → → OM − OM 1 = λ(OM 2 − OM ) и окончательно → OM = → → 1 λ OM 1 + OM 2 . 1+ λ 1+ λ Откуда радиус-вектор точки M = Рис. 1.7.2 равен ξ1 + λη1 1+ λ → ξ 2 + λη 2 OM = . 1+ λ ξ 3 + λη3 1+ λ Замечание: к задаче 1.7.2 сводится задача отыскания центра масс системы материальных точек. Г л а в а 1 . Векторы и линейные операции с ними § 1.8. 47 Изменение координат при замене базиса и начала координат Поскольку выбор системы координат может быть сделан различными способами, вопрос об изменении координат при переходе от одного базиса к другому и замене начала координат представляет значительный практический интерес. Найдем правила, выражающие зависимость координат произвольной точки пространства, заданных в одной системе координат, от координат этой же точки в другой ДСК. Пусть даны две декартовы системы координат: “старая” → → → → → → {O, g 1 , g 2 , g 3 } и “новая” {O ′, g 1′ , g 2′ , g 3′ } (рис. 1.8.1). Выразим → векторы “нового” базиса, а также вектор OO ′ через векторы “старого” базиса. В силу теоремы 1.5.1 это можно сделать всегда и притом единственным образом: → → → → → → → → → → → → g1′ = σ11 g1 + σ 21 g 2 + σ 31 g 3 , g ′2 = σ12 g1 + σ 22 g 2 + σ 32 g 3 , (1.8.1) g 3′ = σ13 g1 + σ 23 g 2 + σ 33 g 3 , → → → → OO ′ = β1 g1 + β 2 g 2 + β 3 g 3 . Тогда справедлива Теорема 1.8.1. Координаты произвольной точки в “старой” системе координат связаны с ее координатами в “новой” соотношениями ξ1 = σ11ξ1′ + σ12 ξ′2 + σ13 ξ′3 + β1 , ξ 2 = σ 21ξ1′ + σ 22 ξ′2 + σ 23 ξ′3 + β 2 , ξ 3 = σ 31ξ1′ + σ 32 ξ′2 + σ 33 ξ′3 + β 3 . (1.8.2) 48 Аналитическая геометрия и линейная алгебра Доказательство. Пусть → некоторая → M точка в “старой” системе ξ1 → {O, g 1 , g 2 , g 3 } имеет координаты ξ 2 , а в “новой” системе ξ3 ξ1′ {O ′, g 1′ , g 2′ , g 3′ } – ξ′2 . ξ′3 → → → Получим связь между “старыми” и “новыми” координатами точки M . Имеют место соотношения → → → → OM = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 и → → → → O ′M = ξ1′ g 1′ + ξ′2 g 2′ + ξ′3 g 3′ = → → → = ξ1′ (σ11 g1 + σ 21 g 2 + σ 31 g 3 ) + → → → → → → + ξ′2 (σ12 g1 + σ 22 g 2 + σ 32 g 3 ) + + ξ′3 (σ13 g 1 + σ 23 g 2 + σ 33 g 3 ) . Подставив → выражения → для векторов → OM , O ′M и OO′ в равенство → → → OM = O ′M + OO ′ Рис. 1.8.1 и перегруппировав слагаемые, получим соотношение вида 49 Г л а в а 1 . Векторы и линейные операции с ними → → → → λ1 g1 + λ 2 g 2 + λ 3 g 3 = o , где λ 1 = −ξ1 + σ11ξ1′ + σ12 ξ′2 + σ13 ξ′3 + β1 , λ 2 = −ξ 2 + σ 21ξ1′ + σ 22 ξ′2 + σ 23 ξ′3 + β 2 , λ 3 = −ξ 3 + σ 31ξ1′ + σ 32 ξ′2 + σ 33 ξ′3 + β 3 . → Поскольку векторы → → {g1 , g 2 , g 3 } линейно независимые, то их ли→ o , обязана быть тривиальной, и потоλ 1 = λ 2 = λ 3 = 0 или окончательно нейная комбинация, равная му ξ1 = σ11ξ1′ + σ12 ξ′2 + σ13 ξ′3 + β1 , ξ 2 = σ 21ξ1′ + σ 22 ξ′2 + σ 23 ξ′3 + β 2 , ξ 3 = σ 31ξ1′ + σ 32 ξ′2 + σ 33 ξ′3 + β 3 . Теорема доказана. Определение 1.8.1. Формулы (1.8.2) называются формулами перехода → от системы координат → координат → → → {O, g 1 , g 2 , g 3 } к системе → {O ′, g 1′ , g 2′ , g 3′ } . При использовании формул перехода следует обратить внимание на то, что «штрихованные» переменные в (1.8.1) и (1.8.2) находятся в разных частях этих равенств. Заметим также, что коэффициенты уравнений в формулах (1.8.2), выражающих “старые” координаты через “новые”, образуют матрицу S , столбцы которой есть координаты “новых” базисных векторов 50 Аналитическая геометрия и линейная алгебра β1 в “старом” базисе, а столбец β 2 содержит координаты “нового” β3 начала координат в “старом” базисе. Определение σ11 σ12 σ13 S = σ 21 σ 31 σ 22 σ 32 σ 23 называется матσ 33 рицей перехода от базиса {g1 , g 2 , g 3 } к базису Матрица 1.8.2. → → → → → → {g1′ , g 2′ , g 3′ } . Теорема 1.8.2. Для матрицы перехода σ11 σ12 σ13 det σ 21 σ 31 σ 22 σ 32 σ 23 ≠ 0. σ 33 Доказательство. Столбцы матрицы σ11 σ12 σ13 σ 21 σ 31 σ 22 σ 32 σ 23 σ 33 образованы коэф- фициентами разложения линейно независимых векторов ба→ зиса → → → → → {g1′ , g 2′ , g 3′ } по векторам базиса {g1 , g 2 , g 3 } . Тогда из теоремы 1.6.3 следует доказываемое утверждение. Теорема доказана. 51 Г л а в а 1 . Векторы и линейные операции с ними На параллелограмме построены две системы координат: Задача 1.8.1. → → → → “старая” {O, g 1 , g 2 } и “новая” {O ′, g 1′ , g 2′ } (рис. 1.8.2). Найти формулы перехода, выражающие “новые” координаты через “старые”, если → → → 1 → g1′ = O ′O и g ′2 = − g1 . 2 Решение. Из свойств параллелограмма находим соотношения, выражающие векторы “старого” базиса через “новые”: → → − 2 g 2′ , g1 = → → → g 2 = − g 1′ + 2 g ′2 . Тогда матрица перехода S = Рис. 1.8.2 β1 1 0 −1 ,а = . β2 0 −2 2 Следовательно, выражения “новых” координат через “старые” имеют вид − ξ 2 + 1, ξ1′ = ξ′2 = −2ξ1 + 2ξ 2 . Формулы перехода между ортонормированными системами координат на плоскости Рассмотрим → → две → ортонормированные → системы координат {O, e1 , e2 } и {O ′, e1′ , e′2 } . Получим формулы перехода для случая, показанного на рис. 1.8.3. 52 Аналитическая геометрия и линейная алгебра Из геометрически очевидных соотношений → → → → → → e1′ = e1 cos ϕ + e2 sin ϕ и e2′ = − e1 sin ϕ + e2 cos ϕ получаем матрицу перехода: S = → β1 cos ϕ − sin ϕ , и если OO ′ = , β2 sin ϕ cos ϕ то “старые” координаты будут связаны с “новыми” как ξ1 = ξ1′ cos ϕ − ξ′2 sin ϕ + β1 , ξ 2 = ξ1′ sin ϕ + ξ′2 cos ϕ + β 2 . Рис. 1.8.3 В рассмотренном случае обе системы координат удается совместить последовательным выполнением параллельного переноса “ста→ рой” системы на вектор OO′ и поворота на угол ϕ вокруг точки O ′. Однако добиться такого совмещения, используя только параллельный перенос и поворот, вообще говоря, нельзя. Соответствующий случай показан на рис. 1.8.4. → Здесь, после совмещения векторов e1 → и e1′ , еще потребуется отражение век→ Рис. 1.8.4 тора e2 симметрично относительно Г л а в а 1 . Векторы и линейные операции с ними 53 прямой, проходящей через совмещенные векторы. Формулы перехода будут в этом случае иметь вид ξ1 = ξ1′ cos ϕ + ξ′2 sin ϕ + β1 , ξ 2 = ξ1′ sin ϕ − ξ′2 cos ϕ + β 2 . Формально случаи, показанные на рис. 1.8.3 и рис. 1.8.4, можно различать, используя → Определение 1.8.3. Упорядоченная пара неколлинеарных векторов a и → b на плоскости с совмещенными началами называется правоориентированной, если кратчайший по→ → ворот от вектора a к вектору b при совмещении их начал виден выполняющимся против часовой стрелки. В противном случае эта пара векторов называется левоориентированной. Отметим, что для матрицы перехода нормированных базиса, S , связывающей два орто- det S = ±1 , причем det S = 1 , если ориентация обеих пар базисных векторов одинаковая (то есть если отражения не требуется), и различной ориентации. det S = −1 для случая базисных пар 54 Аналитическая геометрия и линейная алгебра Глава 2 ПРОИЗВЕДЕНИЯ ВЕКТОРОВ § 2.1. Ортогональное проектирование Определение 2.1.1. Прямую l с расположенным на ней ненулевым вектором → b будем называть осью. → Вектор b называется направляющим вектором оси l. Определение 2.1.2. Рис. 2.1.1 Пусть дана точка M , не лежащая на оси l, тогда основание перпендикуляра, опущенного из M на ось l ∗ – точку M , будем называть ортогональной проекцией точки M на ось. Примером оси может служить ось координат – прямая, проходящая через начало координат, направляющим вектором которой служит один из базисных векторов. → Определение 2.1.3. Ортогональной проекцией вектора a на ось l назы- Λ → вается вектор Prl a , лежащий на оси l, начало кото- рого есть ортогональная проекция начала вектора 55 Г л а в а 2 . Произведения векторов → a на ось l, а конец – ортогональная проекция конца → вектора a. → Выполним нормировку направляющего вектора → ним его на вектор b , то есть заме- → b e= → → и рассмотрим нормированный базис {e} |b| на оси l (рис. 2.1.1). Численным значением ортогональной проекции век- Определение 2.1.4. → тора Λ → a на ось l называется координата вектора → Prl a в базисе { e} 4. → → Углом между ненулевыми векторами a и b называется величина наименьшего из двух углов, образуемых этими векторами при совмещении их начал. Определение 2.1.5. → Численное значение ортогональной проекции вектора a на ось l → обозначим как → Пр a . Из рис. 2.1.2 очевидно, что l → → → Пр l a = a cos ϕ , где ϕ есть угол между a и e . Рис. 2.1.2 4 Верхний символ « Λ » будет использоваться для обозначения различного рода операций, например: проектирования, поворота, отражения, дифференцирования и т.д. 56 Аналитическая геометрия и линейная алгебра Свойства ортогональных проекций 1.1°. Проекция суммы двух векторов равна сумме проекций этих векторов: Λ → → Λ → Λ → Prl (a1 + a 2 ) = Prl a1 + Prl a 2 . Данное свойство иллюстрирует рис. 2.1.3. Рис. 2.1.3 1.2°. Если вектор умножить на вещественное число, то его проекция также умножится на это число: Λ → Λ → Prl (λ a ) = λ Prl a . Заметим, что свойства 1.1° и 1.2° можно объединить в следующее утверждение: Проекция линейной комбинации векторов равна той же линейной комбинации проекций: Λ → → Λ → Λ → Prl (λ 1 a1 + λ 2 a 2 ) = λ 1 Prl a1 + λ 2 Prl a 2 . Справедливость свойств 1.1° и 1.2° вытекает из определения операции ортогонального проектирования и правил действия с векторами. 57 Г л а в а 2 . Произведения векторов Свойства численных значений ортогональных проекций → → → → 2.1°. Пр l (a1 + a 2 ) = Пр l a1 + Пр l a 2 ; 2.2°. Пр l λ a = λ Пр l a . → → Или, объединяя 2.1° и 2.2°, → → → → Пр l (λ 1 a1 + λ 2 a 2 ) = λ 1 Пр l a1 + λ 2 Пр l a 2 . Отметим, что эти равенства следуют из свойств ортогональных проекций и свойств координат векторов. § 2.2. Скалярное произведение векторов и его свойства → Определение 2.2.1. Скалярным произведением ненулевых векторов a и → b называется число, равное произведению длин этих векторов на косинус угла между ними. В случае, когда хотя бы один из сомножителей есть нулевой вектор, скалярное произведение считается равным нулю. → Скалярное произведение векторов → a и b обозначается как → → → → ( a , b ) . Таким образом, для ненулевых векторов a и b : → → → → ( a , b ) = | a || b | cos ϕ , ϕ – угол между векторами-сомножителями. При этом согласно определению 2.1.5, 0 ≤ ϕ ≤ π . где → Заметим также, что если → b ≠ o , то справедливо равенство → → → → ( a , b ) = b Пр → a . b 58 Аналитическая геометрия и линейная алгебра Свойства скалярного произведения → → → 1°. → → → ( a , b ) = 0 при a ≠ o и b ≠ o тогда и только тогда, когда → → a и b взаимно ортогональны. → → 2°. → → ( a , b ) = ( b , a ) следует из определения скалярного произведения и свойств косинуса (коммутативность). → 3°. → → → → → → (a1 + a 2 , b ) = (a1 , b ) + (a 2 , b ) (дистрибутивность). Доказательство. → Если → → → b = o , то 3° очевидно. Пусть b ≠ o , тогда → → → → → → (a1 + a 2 , b ) = b Пр → (a1 + a 2 ) = b → → → → → → → → = b Пр → a1 + b Пр → a 2 = (a1 , b ) + (a 2 , b ). b b Свойство доказано. → → → → 4°. (λ a , b ) = λ ( a , b ) . 5°. (a, a ) = | a |2 ≥ 0 ∀ a ; | a | = ( a, a ) → → → → → → → → → (заметим также, что условия ны). → 6°. При → → → → a ≠ o и b ≠ o cos ϕ = → → (a, b ) → → | a || b | → векторами → a и b. → ( a , a ) = 0 и a = o равносиль- , где ϕ – угол меду 59 Г л а в а 2 . Произведения векторов § 2.3. Выражение скалярного произведения в координатах → Пусть задан базис → → → → {g1 , g 2 , g 3 } и два вектора a и b , координат- ные разложения которых в этом базисе имеют вид → → → → → → → → a = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 и b = η1 g1 + η 2 g 2 + η3 g 3 . По свойствам 3° и 4° скалярного произведения →→ → → → → → → (a, b ) = ( ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 , η1 g1 + η 2 g 2 + η3 g 3 ) = → → → → → → = ξ1η1 ( g1 , g 1 ) + ξ1η 2 ( g1 , g 2 ) + ξ1η3 ( g1 , g 3 ) + → → → → → → → → → → + ξ 2 η1 ( g 2 , g 1 ) + ξ 2 η 2 ( g 2 , g 2 ) + ξ 2 η 3 ( g 2 , g 3 ) + → → + ξ 3 η1 ( g 3 , g1 ) + ξ 3 η 2 ( g 3 , g 2 ) + ξ 3 η3 ( g 3 , g 3 ) = → 3 → → → → → = ∑ ( ξ j η1 ( g j , g1 ) + ξ j η 2 ( g j , g 2 ) + ξ j η3 ( g j , g 3 ) ) = j =1 3 → 3 → =∑∑ ξ j ηi ( g j , g i ). j =1 i =1 → В случае ортонормированного базиса → → {e1 , e2 , e3 } эта формула упро- щается, поскольку для попарных скалярных произведений базисных векторов справедливо равенство → → 1, i = j , (ei , e j ) = δ ij = 0, i ≠ j , где δ ij – так называемый символ Кронекера. Откуда для скалярного произведения векторов в ортонормированном базисе получаем формулу →→ (a, b ) = ξ 1η 1 + ξ 2 η 2 + ξ 3 η 3 , 60 Аналитическая геометрия и линейная алгебра из которой следуют полезные соотношения: → a = ξ12 + ξ 22 + ξ 32 → и для → → → a≠o и b≠o cos ϕ = ξ 1η 1 + ξ 2 η 2 + ξ 3 η 3 ξ12 + ξ 22 + ξ 32 η12 + η 22 + η32 . Отметим, что последнее равенство в сочетании с условием cos ϕ ≤ 1 приводит к неравенству Коши–Буняковского: ∀ξ i ; ηi , i = [1, 3] ξ 1η 1 + ξ 2 η 2 + ξ 3 η 3 ≤ ξ12 + ξ 22 + ξ 32 η12 + η 22 + η32 . Задача 2.3.1. Найти расстояние между двумя точками в ортонормированной системе координат, если известны радиусывекторы этих точек. Решение. Пусть задана ортонормированная система координат → → → → ξ1 {O, e1 , e2 , e3 } и радиусы-векторы точек OM 2 = ξ 2 ξ3 → и η1 OM 1 = η 2 в ней. Тогда, используя решение задачи η3 1.7.1, из равенства → → → → M 1 M 2 = (ξ1 − η1 ) e1 + (ξ 2 − η 2 ) e2 + (ξ 3 − η3 ) e3 и свойств скалярного произведения получаем → | M 1 M 2 | = (ξ1 − η1 ) 2 + (ξ 2 − η 2 ) 2 + (ξ 3 − η3 ) 2 . 61 Г л а в а 2 . Произведения векторов § 2.4. Векторное произведение векторов и его свойства Определение 2.4.1. Упорядоченная тройка некомпланарных векторов → → → {a , b , c } называется правой, если (после совмеще→ ния их начал) кратчайший поворот от вектора → → a к вектору b виден из конца вектора c совершающимся против часовой стрелки. В противном случае упорядоченная тройка некомпланарных векторов → → → {a , b , c } называется левой. Определение 2.4.2. Векторным произведением неколлинеарных векторов → → → a и b называется вектор c , такой, что → 1) → → | c | = | a | | b | sin ϕ , где ϕ – угол меж→ ду векторами → a и b; → 2) вектор → c ортогонален вектору a и век- → тору b; → → → 3) тройка векторов {a , b , c } правая. В случае, когда сомножители коллинеарны (в том числе, когда хотя бы один из сомножителей есть нулевой вектор), векторное произведение считается равным нулевому вектору. → Векторное произведение векторов → → → a и b обозначается как [ a , b ] . Из определения 2.4.2 следует, что 62 Аналитическая геометрия и линейная алгебра → → 1) [ a , b ] есть площадь параллелограмма, построенного на → векторах → a и b; → 2) → для коллинеарности ненулевых векторов a и b необходимо и достаточно, чтобы их векторное произведение было равно нулевому вектору. Свойства векторного произведения → → 1°. → → [ a , b ] = − [ b , a ] (антикоммутативность, следует из определения 2.4.2 и нечетности функции sin ϕ ). → → 2°. → → [λ a , b ] = λ [ a , b ] (следует из определения векторного → → [λ a , b ] и произведения и того факта, что векторы → → [ a , b ] ортогональны одной и той же плоскости при не→ коллинеарных → 3°. → → → a и b и λ ≠ 0 ). → → → → [ a + b , c ] = [ a , c ] + [b , c ] (дистрибутивность). Для доказательства дистрибутивности векторного произведения воспользуемся следующими вспомогательными утверждениями. → Лемма 2.4.1. Пусть даны два вектора → a и b , начала которых на→ ходятся в общей точке на оси с базисом → зультат поворота суммы векторов l . Тогда ре→ a и b на угол ϕ → вокруг оси l равен сумме результатов поворота каж→ дого из этих векторов вокруг оси l на угол ϕ . 63 Г л а в а 2 . Произведения векторов Утверждение леммы 2.4.1 будем обозначать как Λ → → Λ → Λ → Повϕ, →l ( a + b ) = Повϕ, →l ( a ) + Повϕ, →l ( b ). Справедливость этого утверждения ясна из рис. 2.4.1. Рис. 2.4.1 → Лемма 2.4.2. → → → → e = 1 и p ≠ o , то вектор [ p, e ] равен ре- Если → зультату поворота проекции вектора → перпендикулярную вектору угол π p на плоскость, → e , вокруг вектора e на по часовой стрелке. 2 Доказательство. Проведем две плоскости, одна из которых проходит через точку → → → O – общее начало векторов p и e , перпендикулярно e , а → вторая проходит через векторы → p и e. → Ортогональная проекция вектора p на плоскость, перпендику- → лярную e , будет лежать на линии пересечения построенных плоскостей, и тогда из определения векторного произведения следует (рис. 2.4.2): 64 Аналитическая геометрия и линейная алгебра → → → → [ p, e ] = p e → π sin α = p cos ( − α ) , 2 → поскольку → → e = 1. Следовательно, в рассматриваемом случае Λ Λ → Λ → [ p, e ] = Пов π → (Pr ⊥→e p ) , где Pr ⊥→e ( p) обозначает ортого2 ,e → нальное проектирование вектора p на плоскость, перпендику- → лярную вектору e. Рис. 2.4.2 Лемма доказана. Докажем теперь дистрибутивность векторного произведения. Доказательство свойства 3°. → → → → Если c = o , то свойство 3° очевидно. Пусть c ≠ o , тогда в силу утверждений лемм 2.4.1, 2.4.2 и свойства 1.1° из § 2.1 следует 65 Г л а в а 2 . Произведения векторов → → → → → → → → c [a + b, c ] = | c | [a + b, Λ → |c| → Λ 2 Λ ( → = | c | Пов π → Pr 2 → ( ,c ⊥c Λ Λ → = | c | ( [ a, ⊥c → ,c → ⊥c ) ) b = Λ Λ → a ) + Пов π → (Pr |c| 2 → → c ] + [b , → → → → ⊥c ,c 2 → c Λ a + Pr → = | c | Пов π → (Pr → Λ ( ] = | c | Пов π → Pr → ( a + b ) = → → → ⊥c ,c → → ) b) = → → ] ) = [ a , c ] + [ b , c ]. |c | Свойство доказано. § 2.5. Выражение векторного произведения в координатах → Пусть задан правый базис → ры → → → g1 , g 2 , g 3 образуют правую тройку) и пусть в этом базисе векто→ ры → {g1 , g 2 , g 3 } (то есть такой, что векто- → a и b имеют координатные разложения → → → → → a = ξ1 g 1 + ξ 2 g 2 + ξ 3 g 3 → → → → По свойствам 2° и 3° векторного произведения →→ → → → → [a, b ] = [ ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 , η1 g1 + η 2 g 2 + η3 g 3 ] = → → → → → → = ξ1η1[ g1 , g1 ] + ξ1η 2 [ g1 , g 2 ] + ξ1η3 [ g1 , g 3 ] + → → → → b = η1 g 1 + η 2 g 2 + η3 g 3 . и → → → + ξ 2 η1[ g 2 , g1 ] + ξ 2 η 2 [ g 2 , g 2 ] + ξ 2 η3 [ g 2 , g 3 ] + 66 Аналитическая геометрия и линейная алгебра → → → → → → + ξ 3 η1[ g 3 , g1 ] + ξ 3 η 2 [ g 3 , g 2 ] + ξ 3 η3 [ g 3 , g 3 ] = 3 → 3 → =∑∑ ξ j ηi [ g j , g i ]. j =1 i =1 → → базисных векторов → → → f1 , f 2 и f 3 попарные векторные произведения Обозначим через → [ g i , g j ] следующим образом: → → → → → → → → f 1 = [ g 2 , g 3 ] ; f 2 = [ g 3 , g1 ] ; f 3 = [ g 1 , g 2 ] . → → Подставив эти обозначения в выражение для [a , b ] и использовав формулу, связывающую определители квадратных матриц 2-го и 3-го порядков (см. теорему 1.1.1), получим →→ → → → [a, b ] = (ξ 2 η3 − ξ 3 η 2 ) f1 − (ξ1η3 − ξ 3 η1 ) f 2 + (ξ1η 2 − ξ 2 η1 ) f 3 = = det ξ2 η2 ξ3 → ξ f 1 − det 1 η3 η1 → → → f1 f2 f3 = det ξ1 η1 ξ2 η2 ξ3 . η3 ξ3 → ξ f 2 + det 1 η3 η1 ξ2 → f3 = η2 Случай ортонормированного базиса → → → Пусть исходный базис {e1 , e2 , e3 } ортонормированный, образующий правую тройку векторов, тогда по определению 2.4.2 → → f 1 = e1 , → → f 2 = e2 , → → f 3 = e3 . 67 Г л а в а 2 . Произведения векторов Тогда формула для векторного произведения векторов в правом ортонормированном базисе упростится: → → → e1 e2 e3 [a, b ] = det ξ1 η1 ξ2 η2 ξ3 . η3 →→ Из вышеприведенных формул вытекают полезные следствия. → Следствие 2.5.1. det ξ2 η2 или же Следствие 2.5.2. → Для того чтобы векторы a и b были коллинеарны, необходимо и достаточно, чтобы в любом базисе ξ3 ξ = det 1 η3 η1 ξ3 ξ = det 1 η3 η1 ξ2 =0, η2 ξ1 ξ 2 ξ 3 = = . η1 η 2 η3 В ортонормированном базисе площадь параллело→ грамма, построенного на векторах ляется по формуле S = det 2 ξ2 η2 ξ3 ξ + det 2 1 η3 η1 ξ3 ξ + det 2 1 η3 η1 причем для случая базиса на плоскости S = det ξ1 ξ2 η1 η2 . → a и b , вычис- ξ2 , η2 68 Аналитическая геометрия и линейная алгебра § 2.6. Смешанное произведение Смешанным (или векторно-скалярным) произведе- Определение 2.6.1. → → → a , b и c , обозначаемым как нием векторов → → → → → → ( a , b , c ) , называется число ( [ a , b ], c ) . Теорема 2.6.1. Абсолютная величина смешанного произведения → → → ( a , b , c ) равна объему параллелепипеда, векторов → построенного на векторах → → → → a , b и c . При этом если → тройка векторов a , b , c некомпланарная и правая, то их смешанное произведение положительно, а если тройка левая, то – отрицательно. Доказательство. → Если → a коллинеарен b , то утверждение теоремы очевидно. → → Пусть a неколлинеарен го произведения → → → b , тогда по определению скалярно→ → → ( a , b , c ) = | [ a , b ] | Πр → → c , [ a,b ] → где S = | [ a , → b ] | есть площадь параллелограмма, постро→ енного на векторах → a и b ,а → → | Пр → → c | = | c | | cos α | [a ,b ] 69 Г л а в а 2 . Произведения векторов – высота параллелепипеда с основанием S, откуда (см. рис. 2.6.1) → → → V = (a , b , c ) . Наконец, → → → (a, b, c ) = → → → = | [ a , b ] | | c | cos α, что и позволяет сделать заключение о знаке смешанного произведения. Рис. 2.6.1 Теорема доказана. Свойства смешанного произведения Для смешанного произведения справедливы тождества: → → → 1°. → → → → → → ( a , b , c ) = ( c , a , b ) = (b , c , a ) = → → → → → → → → → = −( b , a , c ) = −( c , b , a ) = − ( a , c , b ) ; → → → → → → 2°. (λ a , b , c ) = λ (a , b , c ) ; 3°. ( a1 + a 2 , b , c ) = ( a1 , b , c ) + ( a 2 , b , c ) , → → → → → → → → → → справедливость которых следует из определения смешанного произведения и теоремы 2.6.1. 70 Аналитическая геометрия и линейная алгебра Отметим, наконец, что смешанное произведение равно нулю, если среди сомножителей имеется хотя бы одна пара коллинеарных векторов. § 2.7. Выражение смешанного произведения в координатах → Пусть задан правый базис → → → → → {g1 , g 2 , g 3 } и три вектора a , b и c , координатные разложения которых в этом базисе имеют вид → → → → → → → → a = ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 , b = η1 g 1 + η 2 g 2 + η3 g 3 и соответст→ венно → → → c = κ1 g1 + κ 2 g 2 + κ 3 g 3 . По свойствам векторного произведения имеем [a, b ] = det ξ2 η2 → → →→ где векторы ξ3 → ξ f 1 − det 1 η3 η1 ξ3 → ξ f 2 + det 1 η3 η1 ξ2 → f , η2 3 → f 1 , f 2 , f 3 были определены в § 2.5. → → → ( g , g , g ), k = j , и для Откуда вытекает, что ( g k , f j ) = 1 2 3 0, k ≠ j, → → → → → ( a , b , c ) получаем → →→ → → → ( (a, b, c ) = ([a, b ], c ) = κ1 det + κ 3 det ξ1 ξ2 η1 η2 ) ξ2 η2 ξ3 ξ − κ 2 det 1 η3 η1 ξ1 ( g 1 , g 2 , g 3 ) = det η1 κ1 → → → ξ2 η2 κ2 ξ3 + η3 ξ3 → → → η3 ( g1 , g 2 , g 3 ) , κ3 71 Г л а в а 2 . Произведения векторов поскольку выражение, стоящее в больших круглых скобках, является разложением определителя 3-го порядка по последней строке. (См. теорему 1.1.1.) Замечания. 1°. Из последней формулы и теоремы 2.6.1 следует справедливость теоремы 1.6.3. 2°. В случае ортонормированного правого базиса → → → ( e1 , e2 , e3 ) = 1 , поэтому в таком базисе ξ1 ξ 2 ξ 3 → →→ (a, b, c ) = det η1 κ1 η2 κ2 η3 . κ3 → 3°. Для введенных в § 2.5 векторов → → f1 , f 2 , f 3 справед- лива → Тройка векторов Теорема 2.7.1. → → { f 1 , f 2 , f 3 } образует базис (назы→ ваемый взаимным базису → → {g1 , g 2 , g 3 } ). Доказательство. Для → доказательства → достаточно показать, что векторы → f 1 , f 2 , f 3 линейно независимы. Пусть существуют числа λ 1 , λ 2 , λ 3 , такие, что → → → → λ1 f1 + λ 2 f 2 + λ 3 f 3 = o . Умножив последовательно обе части этого равенства скалярно → на g j , j = [1, 3] , получим → → → → → → λ 1 ( f1 , g j ) + λ 2 ( f 2 , g j ) + λ 3 ( f 3 , g j ) = 0 , j = [1,3] . (2.7.1) 72 Аналитическая геометрия и линейная алгебра → → ( f i , g j ) , i = [1, 3] , j = [1, 3] имеем Для девяти выражений → → α, i = j , ( fi , g j ) = , где α ≠ 0 . Действительно, выраже 0, i ≠ j , → → ( f i , g i ) , i = [1, 3] суть смешанные произведения не- ния → → → g1 , g 2 , g 3 и потому отличны от ну- компланарных векторов → → ( f i , g j ) , i ≠ j будут рав- ля. Остальные шесть выражений ны нулю как смешанные произведения векторов, среди которых имеется пара равных. Подставляя значения выражений в систему равенств (2.7.1), получим, что все λ i = 0 , i = [1, 3] , что доказывает линейную → зависимость векторов → → f1 , f 2 , f 3 . Теорема доказана. § 2.8. Двойное векторное произведение → Определение 2.8.1. Двойным векторным произведением векторов → и → → → c называется вектор [ a , [ b , c ]] . Для решения ряда задач оказывается полезной Теорема 2.8.1. Имеет место равенство → → → → → → → → → [ a , [ b , c ]] = b ( a , c ) − c ( a , b ) → → → → a, b ∀ a, b, c . 73 Г л а в а 2 . Произведения векторов Доказательство. → → → Заметим, что если векторы a , b , c попарно ортогональны, то доказываемое равенство очевидно, поэтому далее будем предпо→ → → → ( a , b ) и ( a , c ) не равны нулю одновременно. лагать, что числа → → → → x = [ a , [ b , c ]]. По определению векторного произ- Обозначим → ведения вектор 1º. По → → свойствам → → x ортогонален как вектору [ b , c ] , так и a . → → смешанного произведения условие → → → ( x , [ b , c ]) = ( x , b , c ) = 0 означает, что тройка векторов → → → { x , b , c } компланарная и в силу леммы 1.4.1 → → → x = λ b+ µ c , где λ и µ − некоторые числа. → → 2º. Из условия ( x , a ) = 0 следует, что → → → → → → → (λ b + µ c , a ) = 0 или λ( b , a ) + µ( c , a ) = 0 . → 3º. Рассмотрим теперь вектор щему набору условий: r , удовлетворяющий следую- → а) → r (так же как и вектор x ) принадлежит плоскости, → проходящей через векторы → → б) → b и c; → → ( r , b ) = 0 и ( r , c ) > 0 . (См. рис. 2.8.1.) Найдем теперь выражение для смешанного произведения вида → → → → → → → → ( a , r , [ b , c ]) = ( a , [ r , [ b , c ]]) . С одной стороны, по свойствам → → смешанного произведения и в силу ( r , b ) = 0 имеем 74 Аналитическая геометрия и линейная алгебра Рис. 2.8.1 → → → → → → → → → → → → → → ( a , r , [ b , c ]) = − ( r ,a , [ b , c ]) = − ( r , [ a , [ b , c ]]) = −( r , x ) = → → → → → → → → → = − ( r , λ b + µ c ) = −λ ( r , b ) − µ( r , c ) = −µ( r , c ). → С другой стороны, вектор → → → → [ r , [ b , c ]] сонаправлен с b , то есть → → → ∃ κ > 0 такое, что [ r , [ b , c ] ] = κ b . Поэтому → → → → → → ( a , r , [ b , c ] ) = κ( a , b ) . Значение κ найдем из соотношений → → → → → → → → → → κ b = [ r , [ b , c ] ] = r b c sin α sin(∠{ r ; [ b , c ]}) = → → → → → → π = r b c cos( − α) = ( r , c ) b 2 → → ⇒ κ = (r, c) , 75 Г л а в а 2 . Произведения векторов → поскольку угол между → → → → r и [ b , c ] прямой. Значит, → → → → → → (a , r , [b , c ] ) = ( a , b ) ⋅ ( r , c ) . → → Приравнивая выражения для → → → → → → ( a , r , [ b , c ] ) , получаем → → → → − µ( r , c ) = ( a , b ) ⋅ ( r , c ) или µ = −( a , b ) . Наконец, из соотношения, полученного в п. 2º, находим, что → → λ = (a, c ) . Теорема доказана. Альтернативное доказательство этой теоремы приводится в Приложении 4 (см. Прил. 4.5). § 2.9. Замечания об инвариантности произведений векторов Операции векторных произведений были введены независимо от координатного представления сомножителей и, значит, независимо и от используемого базиса. С другой стороны, естественным представляется вопрос о возможности (и соответственно целесообразности) дать определения операций произведения векторов непосредственно в координатной форме. → В общем случае каждой упорядоченной паре векторов → имеющих в базисе → → → a и b, ξ1 {g1 , g 2 , g 3 } координатные представления ξ 2 и ξ3 76 Аналитическая геометрия и линейная алгебра η1 η 2 , естественно поставить в соответствие девятку попарных произη3 ведений ξ k ηi ; k , i = 1, 2, 3 , которую можно записать в виде матри- цы ξ1η1 ξ1η 2 ξ1 η 3 ξ 2 η1 ξ 3 η1 ξ 2 η2 ξ3η2 ξ 2 η3 . ξ 3 η3 (2.9.1) На первый взгляд, зависимость компонент этой матрицы от выбора базиса делает координатный способ введения произведений векторов малоцелесообразным, ибо придется давать их определение для каждого из возможных базисов. Однако было замечено, что существуют некоторые линейные комбинации чисел ξ k η i ; k , i = 1,2,3 , инвариантные (то есть не изменяющиеся) при замене базиса, которые можно принять за определение произведений векторов в координатном представлении. Покажем в качестве примера, что сумма элементов матрицы 2.9.1, стоящих на ее главной диагонали, не меняется при переходе от одного ортонормированного базиса к другому. → → Рассмотрим два ортонормированных базиса σ11 σ12 σ13 {e1 , e2 , e3 } с матрицей перехода S = σ 21 σ 22 σ 32 σ 23 . σ 33 → → → σ 31 → {e1′ , e′2 , e3′ } и Согласно § 1.8, в этом случае для базисных векторов имеют место → соотношения 3 → et′ = ∑ σ pt e p ; t = 1, 2, 3 , а для координат соответсp =1 77 Г л а в а 2 . Произведения векторов твенно 3 ξ s = ∑ σ si ξ′i ; i =1 Пусть 3 s = 1, 2, 3; η s = ∑ σ st η′t ; s = 1, 2, 3. t =1 δ it – символ Кронекера (см. § 2.3), тогда из условия орто→ → → нормированности базисов → → → 3 → → → {e1′ , e2′ , e3′ } и {e1 , e2 , e3 } имеем → 3 3 → 3 → (ei′ , et′ ) = δ it = (∑ σ si e s , ∑ σ pt e p ) = ∑∑ σ si σ pt (es , e p ) = s =1 3 p =1 s =1 p =1 3 3 = ∑∑ σ si σ pt δ sp =∑ σ si σ st ; t = 1, 2, 3 . s =1 p =1 s =1 3 Отметим, что соотношения ∑σ s =1 S свойством матрицы перехода базиса к другому. Найдем теперь выражение si σ st = δ it , i, t = 1, 2, 3, являются от одного ортонормированного для → → линейной комбинации → ξ1η1 + ξ 2 η 2 + ξ 3 η3 в базисе {e1′ , e′2 , e3′ } , используя зависимости между компонентами матрицы перехода и определение символа Кронекера: 3 3 3 ∑ ξ η = ∑ (∑ σ i =1 i i i =1 3 s =1 3 3 si 3 3 3 ξ′i )( ∑ σ st η′t ) = ∑∑ ξ′i η′t ∑ σ si σ st = t =1 i =1 t =1 s =1 3 = ∑∑ ξ′i η′t δ it = ∑ ξ′t η′t . i =1 t =1 Полученное ξ1η1 + ξ 2 η 2 t =1 равенство доказывает инвариантность суммы + ξ 3 η3 при замене одного ортонормированного базиса 78 Аналитическая геометрия и линейная алгебра другим, которая может быть принята в этих базисах за определение скалярного произведения векторов. Покажите самостоятельно, что при переходе от одного ортонормированного базиса к другому ортонормированному базису инвариантными также оказываются и линейные комбинации вида ξ 2 η3 − ξ 3 η 2 , ξ 3 η1 − ξ1η3 , ξ1η 2 − ξ 2 η1 . Выясните, каков геометрический смысл этой инвариантности. 79 Г л а в а 3 . Прямая и плоскость Глава 3 ПРЯМАЯ И ПЛОСКОСТЬ Как было показано, использование системы координат устанавливает взаимно однозначное соответствие между множеством точек пространства и множеством их радиусов-векторов. Это в свою очередь позволяет свести исследование свойств линий, поверхностей или тел к изучению множеств радиусов-векторов, соответствующих точкам, образующим исследуемые геометрические объекты. Глава 3 посвящена методам описания и исследования свойств простейших геометрических объектов – прямой и плоскости – средствами векторной алгебры. В главах 3, 4 и 5 настоящего пособия будут использоваться обозначения координаты по оси абсцисс через x , координаты по оси ординат через y и координаты по оси аппликат через z , равно как и стандартные формы записи уравнений. § 3.1. Прямая на плоскости → Пусть дана система координат → {O, g1 , g 2 } на плоскости и пря- → мая L, проходящая через точку r0 , с лежащим на ней ненулевым век- → тором a. → Определение 3.1.1. Вектор прямой a называется направляющим вектором L. 80 Аналитическая геометрия и линейная алгебра Теорема 3.1.1. Множество радиусов-векторов точек прямой → ставимо в виде → L пред- → r = r0 + τ a , где τ – произвольный вещественный параметр. Доказательство. → → Пусть r – некоторая точка на прямой L . Ненулевой вектор a образует базис на прямой L , поэтому лежащий на этой прямой → вектор → → r − r0 (рис. 3.1.1) может быть для каждого r пред→ ставлен единственным образом в виде → → → r = r0 + τ a → → r − r0 = τ a . Тогда ∀τ ∈ (−∞, + ∞). Теорема доказана. Рис. 3.1.1 Найдем теперь координатное представление множества радиусов→ векторов всех точек прямой = L . Пусть r g → = a g x y → , ax , тогда справедливы следующие теоремы. ay = r0 g x0 и y0 81 Г л а в а 3 . Прямая и плоскость Теорема 3.1.2. Всякая прямая в любой декартовой системе координат может быть задана уравнением вида Ax + By + C = 0 , A + B > 0. Доказательство. → Условие коллинеарности ненулевых векторов → → r − r0 и a в ко- ординатной форме имеет вид det Откуда x − x0 ax y − y0 =0. ay a y ( x − x 0 ) − a x ( y − y 0 ) = 0 , или же Ax + By + C = 0 , A + B > 0 , где A = a y ; B = − a x , C = − a y x 0 − a x y 0 , и мы получили, что уравнение прямой есть алгебраическое уравнение первой степени. Заметим, что справедливость неравенства A + B >0 → следует из условия → a ≠ o. Теорема доказана. Теорема 3.1.3. Всякое уравнение вида Ax + By + C = 0, A + B > 0 , в любой декартовой системе координат есть уравнение некоторой прямой. Доказательство. Пусть дано уравнение первой степени Ax + By + C = 0 , A + B > 0 . Подберем числа x0 и y 0 так, чтобы Ax0 + By 0 + C = 0 . 82 Аналитическая геометрия и линейная алгебра Вычитая почленно два эти равенства, получим A( x − x0 ) + B( y − y 0 ) = 0 . → Возьмем точку = r0 g → x0 и вектор a y0 = −B g A . По тео→ реме 3.1.2 имеем, что прямая, проходящая через точку r0 в на- → a , имеет уравнение вида A( x − x0 ) + B( y − y 0 ) = 0 . правлении вектора Следовательно, исходное уравнение есть уравнение прямой. Теорема доказана. Замечание: из теорем 3.1.1–3.1.3 следует, что каждое линейное уравнение в декартовой системе координат на плоскости задает некоторую конкретную прямую, но, с другой стороны, конкретная прямая на плоскости может быть задана бесчисленным множеством линейных уравнений и естественно возникает вопрос: при каких условиях два разных линейных уравнения задают одну и ту же прямую? Теорема 3.1.4. Для того чтобы уравнения A1 x + B1 y + C1 = 0, A1 + B1 > 0 и A2 x + B2 y + C 2 = 0, A2 + B2 > 0 были уравнениями одной и той же прямой, необходимо и достаточно, чтобы существовало число λ ≠ 0 , такое, что A1 = λ A2 ; B1 = λ B2 ; C1 = λC 2 . 83 Г л а в а 3 . Прямая и плоскость Доказательство достаточности. Пусть коэффициенты уравнений пропорциональны и имеет место равенство A2 x + B2 y + C2 = 0 . Тогда 1 1 1 A1 x + B1 y + C1 = λ λ λ 1 = ( A1 x + B1 y +C1 ) = 0 , λ но поскольку λ ≠ 0 , то A1 x + B1 y + C1 = 0 . A2 x + B2 y +C 2 = Аналогично из равенства A1 x + B1 y + C1 = 0 следует, что и A2 x + B2 y + C 2 = 0 . Доказательство необходимости. Пусть уравнения A1 x + B1 y + C1 = 0 и A2 x + B2 y + C 2 = 0 суть уравнения одной и той же прямой в некоторой декартовой системе координат. Тогда их направляющие векторы коллинеарны и существует (по теореме 3.1.2) λ ≠ 0 , такое, что A1 = λ A2 ; B1 = λ B2 . С другой стороны, из равносильности уравнений λA2 x + λB2 y + C1 = 0 и A2 x + B2 y + C2 = 0 следует, также, что и C1 = λC 2 . Теорема доказана. Замечание: уравнение прямой не в любой системе координат является алгебраическим уравнением первой степени. Например, в полярной системе координат (см. § 4.6) оно может иметь вид ρ = P sec(ϕ + ϕ 0 ) . 84 Аналитическая геометрия и линейная алгебра § 3.2. Способы задания прямой на плоскости → → В произвольной декартовой системе координат {O, g1 , g 2 } существуют различные формы задания прямой на плоскости. Рассмотрим основные из них. 1°. Уравнение Поскольку направляющий вектор данной прямой прямой, проходящей через две несовпадающие точки → r1 = → → y 2 − y1 , то ее уравнение в вектор→ → → → → r = r1 + τ( r2 − r1 ) или → → r = (1 − τ) r1 + τ r2 . y1 Соответственно в координатах, исключив параметр τ , получим одну из следующих формул: и → x 2 − x1 ной форме будет иметь вид x1 r2 = → a = r2 − r1 = x2 x − x1 y − y1 = ; ( x 2 − x1 )( y 2 − y1 ) ≠ 0; x 2 − x1 y 2 − y1 y2 y = y1 ∀x, если y 2 = y1 ; x = x1 ∀y, если x 2 = x1 . Заметим, что эти три случая могут быть описаны условием x det x1 x2 y y1 y2 1 1 = 0. 1 → Следствие 3.2.1. Для того чтобы три точки r1 → r3 = x3 y3 = x1 y1 → , r2 = x2 y2 лежали на одной прямой, необходимо и и 85 Г л а в а 3 . Прямая и плоскость достаточно, чтобы их координаты удовлетворяли уравнению x1 det x 2 x3 y1 1 y2 1 = 0 . y3 1 2°. Векторное уравнение прямой (уравнение прямой, проходящей через данную точку → r0 = x0 y0 , перпендикулярно заданному ненулевому вектору Рис. 3.2.1 → nx n= ) ny Возьмем в качестве направляющего вектора данной → → r = → → a = r − r0 = прямой x − x0 , y − y0 где вектор x y есть радиус-вектор некоторой точки на прямой (рис. 3.2.1). Тогда из условия ортогональ→ ности векторов → → n и r − r0 получим → → → ( n , r − r0 ) = 0 , → → или же → → ( n , r ) = d , где d = ( n , r0 ) . 86 Аналитическая геометрия и линейная алгебра При обратном переходе от записи уравнения пря→ → → → → ( n , r ) = d к ( n , r − r0 ) = 0 в качест→ → d → ве r0 можно взять, например, r0 = → → n . ( n, n ) мой в виде В ортонормированной системе координат → → {O, e1 , e2 } векторное уравнение прямой приобретает вид n x ( x − x0 ) + n y ( y − y 0 ) = 0, или же n x x + n y y = d , где d = n x x0 + n y y 0 . Сравнивая последнюю запись с общим видом уравнения прямой Ax + By + C = 0 , приходим к заключению, что в ортонормированной системе ко→ → ординат вектор = n , для которого n g A B , бу- дет ортогонален этой прямой. → n называется нормальным вектором пря- Определение 3.2.1. Вектор мой L . 3°. Нормаль- Рассмотрим скалярное уравнение прямой в орто- ное уравнение прямой → → нормированной системе координат {O, e1 , e2 } Ax + By + C = 0, A + B > 0 и преобразуем его, разделив обе A2 + B 2 . Подставляя обозначения части на 87 Г л а в а 3 . Прямая и плоскость cos ϕ = A A +B 2 2 ; sin ϕ = B A +B 2 2 ;ρ= C A + B2 2 , получим так называемую нормальную форму записи уравнения x cos ϕ + y sin ϕ + ρ = 0 . Геометрический смысл параметров ρ и ϕ ясен из рис. 3.2.2. Рис. 3.2.2 Замечание о линейных неравенствах Аналогично тому, как линейное уравнение задает на плоскости прямую, линейное неравенство Ax + By + C > 0 , A + B > 0 определяет часть плоскости (множество точек, координаты которых x и y удовлетворяют данному неравенству), ограниченную прямой Ax + By + C = 0 , A + B > 0. Покажем справедливость данного утверждения для случая, когда пря→ → L : ( n , r ) = d делит плоскость P на две части, обозначаемые P+ и P− (см. рис. 3.2.3). мая 88 Аналитическая геометрия и линейная алгебра Рис. 3.2.3 \ Определение 3.2.2. Будем говорить, что точка M с радиусом-вектором → R принадлежит P+ (или соответственно P− ), если существует λ > 0 (соответственно λ < 0 ), такое, → ∗ → M M = λ n , где точка M ∗ есть ортогональная проекция M на прямую L . что Тогда справедлива Теорема 3.2.1. Для того чтобы M ∈ P+ , необходимо и достаточно → → выполнения неравенства ( n , R) > d . 89 Г л а в а 3 . Прямая и плоскость Доказательство необходимости. M ∈ P+ , то есть существует λ > 0 такое, что Пусть → ∗ → → → M M = λ n . Оценим величину ( n , R) . Поскольку M ∗ ∈ L , → → то ( n , OM ∗ ) = d , и тогда → → → → → → → → → ( n , R) = ( n , OM ∗ + M ∗ M ) = ( n , OM ∗ ) + ( n , M ∗ M ) = → → = d + λ( n , n ) > d в силу положительности λ. Доказательство достаточности. → → → → → → → → → M ∗ M = λ n , тогда из ( n , OM ∗ ) = d Пусть ( n , R ) > d и получаем → → ∗ ∗ ( n , R) = ( n , OM + M M ) = → → → → → → = ( n , OM ∗ ) + ( n , M ∗ M ) = d + λ ( n , n ) > d . → А в силу → n ≠ o следует, что λ > 0 и, значит, M ∈ P+ . Теорема доказана. → Задача 3.2.1. Дана система координат → → прямая → {O, g1 , g 2 } на плоскости и → L с уравнением ( n , r − r0 ) = 0 . Найти рас- стояние до этой прямой от точки, радиус-вектор которой → r1 = x1 y1 . 90 Аналитическая геометрия и линейная алгебра → Решение 1°. Пусть → → → → MK = λ n , тогда r = r1 +λ n (рис. 3.2.4). 2°. Точка K принадлежит данной прямой, поэтому имеет место соотношение → → → → ( n , r1 + λ n − r0 ) = 0 . Откуда → → λ=− → ( n ,r1 − r0 ) →2 . |n| 3°. Подставив λ в выражение → для MK , получим → Рис. 3.2.4 → → | MK | = | (r1 − r0 , → n → ) |. |n | 4°. Пусть система координат ортонормированная. Для уравнения Ax + By + C = 0, A + B > 0 , как было показано, вектор → n= A B перпендикулярен прямой. Поэтому → | MK |= A( x1 − x0 ) + B( y1 − y0 ) A2 + B 2 . → Принимая во внимание, что точка довательно, r0 лежит на прямой L и, сле- Ax0 + By 0 + C = 0 , можно записать окончательный ответ в виде → | MK | = Ax1 + By1 + C A2 + B 2 . 91 Г л а в а 3 . Прямая и плоскость Определение 3.2.3. Теорема 3.2.2. Пучком прямых на плоскости называется совокупность всех прямых, проходящих через некоторую заданную точку, именуемую вершиной пучка. Пусть точка, общая для всех прямых пучка, является точкой пересечения непараллельных прямых A1 x + B1 y + C1 = 0 и A2 x + B2 y + C 2 = 0 . Тогда 1) для любой прямой пучка найдется пара не равных нулю одновременно чисел α и β , таких, что α( A1 x + B1 y + C1 ) + β( A2 x + B2 y + C 2 ) = 0 есть уравнение данной прямой, 2) при любых, не равных нулю одновременно β , уравнение α и α( A1 x + B1 y + C1 ) + β( A2 x + B2 y + C 2 ) = 0 есть уравнение некоторой прямой данного пучка. Доказательство. → 1°. Возьмем некоторую точку r∗ = x∗ , не совпадающую с y∗ вершиной пучка, и примем в качестве параметров α = A2 x ∗ + B2 y ∗ + C 2 , и β = −( A1 x ∗ + B1 y ∗ + C1 ) . Заметим при этом, что → ∗ α + β > 0 , поскольку точка r не принадлежит данным прямым одновременно. Кроме того, прямая ( A2 x ∗ + B2 y ∗ + C 2 )( A1 x + B1 y + C1 ) − − ( A1 x ∗ + B1 y ∗ + C1 )( A2 x + B2 y + C 2 ) = 0 → ∗ проходит как через точку r , так и через вершину пучка и, следовательно, принадлежит пучку. 92 Аналитическая геометрия и линейная алгебра 2°. Пусть A1 x + B1 y + C1 = 0 и A2 x + B2 y + C2 = 0 – пара пересекающихся прямых из рассматриваемого пучка, тогда очевидно, что α( A1 x + B1 y + C1 ) + β( A2 x + B2 y + C 2 ) = 0 . При этом уравнение (αA1 + βA2 ) x + (αB1 + β B2 ) y + (αC1 + β C 2 ) = 0 является уравнением прямой, поскольку из A1 + B1 > 0 , следует, что A2 + B2 > 0 и α + β > 0 αA1 + β A2 + α B1 + βB2 > 0 . Действительно, допустим противное: A1α + A2 β = 0, (3.2.1) B1α + B2 β = 0. Прямые A1x + B1 y + C1 = 0 и A2 x + B2 y + C 2 = 0 по построению имеют, по крайней мер, одну общую точку. Поэтому они либо совпадают, либо пересекаются. По теореме 3.1.4 они совпадают тогда и только тогда, когда существует λ ≠ 0 , для которого A1 = λA2 и B1 = λB2 . А последние два равенства по теореме 1.6.2 равносильны условию det A1 B1 A2 = 0. B2 В рассматриваемом случае прямые пересекаются, поэтому det A1 B1 A2 ≠0 B2 и в силу теоремы 1.1.2 система линейных уравнений 3.2.1 может иметь лишь единственное решение. С другой стороны, очевидно, что эта система имеет тривиальное решение α = β = 0 , что в совокупности противоречит неравенству α + β > 0. 93 Г л а в а 3 . Прямая и плоскость Следовательно, αA1 + β A2 + α B1 + β B2 > 0. Теорема доказана. Определение 3.2.4. Уравнение α( A1 x + B1 y + C1 ) + β( A2 x + B2 y + C 2 ) = 0 с неравными одновременно нулю параметрами α и β называется уравнением пучка прямых на плоскости. § 3.3. Плоскость в пространстве → → → {O, g1 , g 2 , g 3 } в пространстве и Пусть даны система координат → плоскость S , проходящая через точку с радиусом-вектором r0 и ле→ жащими на S неколлинеарными векторами → → p и q называются направляющими векторами плоскости S . Определение 3.3.1. Теорема 3.3.1. → p и q. Векторы Множество радиусов-векторов точек плоскости S → представимо в виде r → → → = r0 + ϕ p + θ q , где ϕ и θ – произвольные вещественные параметры. Доказательство. → → → r – некоторая точка плоскости S . Векторы p , q образуют базис на S , и лежащий на этой плоскости (рис. 3.3.1) Пусть → → вектор r − r0 может быть единственным образом представлен 94 Аналитическая геометрия и линейная алгебра как линейная комбина→ ция векторов → → → p иq → → r − r0 = ϕ p + θ q , и, следовательно, уравнение плоскости будет иметь вид → → → → r = r0 + ϕ p + θ q , ϕ ∈ (−∞, + ∞) и θ ∈ (−∞, + ∞). где Теорема доказана. Рис. 3.3.1 Найдем теперь координатное представление множества радиусов- x → векторов всех точек плоскости S . Пусть r g = y , p z g = py pz qx → и px → q g = q y , тогда будут справедливы следующие теоремы. qz Теорема 3.3.2. Всякая плоскость в любой декартовой системе координат может быть задана уравнением вида Ax + By + Cz + D = 0 , A + B + C > 0. Доказательство. → → Условие компланарности векторов r − r0 , → → p и q в коорди- натной форме имеет в силу теоремы 1.6.3 вид 95 Г л а в а 3 . Прямая и плоскость det x − x0 y − y0 z − z0 px qx py qy pz qz = 0. A( x − x0 ) + B( y − y 0 ) + C ( z − z 0 ) = 0 , или окончательно Ax + By + Cz + D = 0, где числа A , B и C нахо- Откуда дятся по теореме 1.1.1 и равны соответственно а A = det py qy pz p ; B = − det x qz qx C = det px qx py , qy pz ; qz D = − Ax0 − By 0 − Cz 0 , и, таким образом, мы получили, что уравнение плоскости есть уравнение первой степени. Условие невозможности одновременного равенства нулю чисел A , B и → → C вытекает из неколлинеарности векторов p и q и следствия 2.5.1. Теорема доказана. Теорема 3.3.3. Всякое уравнение вида Ax + By + Cz + D = 0 , A + B + C > 0 в любой декартовой системе координат есть уравнение некоторой плоскости. Доказательство. Непосредственной проверкой убеждаемся, что уравнение Ax + By + Cz + D = 0 , A + B + C >0 96 Аналитическая геометрия и линейная алгебра при C ≠ 0 может быть записано как x+ det а при DA A + B2 +C2 y+ 2 DB A + B2 + C 2 z+ 2 0 −C B C 0 −A det DA A + B2 y+ DB A + B2 2 z+0 −B A 0 0 0 1 2 → ибо в любой ДСК в качестве векторов 0 p g = −C B = 0, → p и q можно выбрать C → = q и = 0, к C = 0 в виде x+ → DC A + B2 + C 2 2 g 0 при C ≠ 0 , и, если C = 0 , −A то −B → = p g A 0 0 → и q g = 0 . 1 Очевидно, что оба эти уравнения определяют плоскость, проходящую через некоторую заданную точку параллельно двум неколлинеарным векторам. Теорема доказана. 97 Г л а в а 3 . Прямая и плоскость → Задача 3.3.1. → → В системе координат {O, g1 , g 2 , g 3 } составить уравнение плоскости, проходящей через три заданные, попарно несовпадающие и не лежащие на одной прямой точки: x1 → x2 → x3 → r1 = y1 ; r2 = y 2 ; r3 = y 3 . z1 z2 z3 Решение. Из условия задачи следует, что неколлинеарные векторы → → → → r2 − r1 и r3 − r1 параллельны искомой плоскости. Кроме того, для радиуса-вектора любой принадлежащей этой → → → плоскости точки r вектор r − r1 также будет ей параллелен. Из условия компланарности тройки векторов → → → → → → { r − r1 , r2 − r1 и r3 − r1 } получаем уравнение искомой плоскости, которое будет иметь вид → → → → → → ( r − r1 , r2 − r1 , r3 − r1 ) = 0 , или в координатной форме (согласно § 2.7) x − x1 y − y1 z − z1 det x 2 − x1 x3 − x1 y 2 − y1 y 3 − y1 z 2 − z1 = 0. z 3 − z1 → Задача 3.3.2. → → В системе координат {O, g1 , g 2 , g 3 } составить уравнение плоскости, проходящей через заданную точку → r0 = x0 y0 z0 → тору n = nx ny T перпендикулярно ненулевому векT nz . 98 Аналитическая геометрия и линейная алгебра → Решение. По условию задачи для радиуса-вектора r любой точки, → принадлежащей этой плоскости, векторы → дут ортогональны, т.е. → → r − r0 и n бу- → → ( r − r0 , n ) = 0 . → В ортонормированной системе координат это условие принимает вид → → {O, e1 , e2 , e3 } n x ( x − x0 ) + n y ( y − y 0 ) + nz ( z − z0 ) = 0 или, обозначив венно A = n x ; B = n y ; C = n z и соответст- D = − n x x0 − n y y 0 − n z z 0 , получим Ax + By + Cz + D = 0 . Следствие 3.3.1. Если плоскость задана в ортонормированной сис→ теме координат → → {O, e1 , e2 , e3 } уравнением Ax + By + Cz + D = 0, где A + B + C > 0, → то вектор A n = B ортогонален этой плоскости. C → Определение 3.3.2. Вектор → сти Определение 3.3.3. n называется нормальным вектором плоско→ → ( r − r0 , n ) = 0 . Вектор A B C T называется главным векто- ром плоскости Ax + By + Cz + D = 0, A + B + C > 0. 99 Г л а в а 3 . Прямая и плоскость В ортонормированной системе координат главный вектор плоскости является и нормальным ее вектором. В Задача 3.3.3. ортонормированной → → системе координат → {O, e1 , e2 , e3 } найти расстояние от точки M с радиусом-вектором → ∗ x∗ → → → r = y ∗ до плоскости ( r − r0 , n ) = 0 . z∗ Решение. 1°. Пусть K есть ортогональная проекция точки M на → → → → ∗ → данную плоскость, тогда MK = λ n и r = r +λ n . (рис. 3.3.2.) 2°. Точка K принадлежит данной плоскости, поэтому → → имеет место соотношение → следовательно, → → λ=− → ( n , r ∗ − r0 ) → 2 , |n| тогда для искомого расстояния получим → | MK | = → ∗ → = | ( r − r0 , → n → )|. |n | . Рассмотрим теперь ортонормированную систему координат. → ( n , r ∗ + λ n − r0 ) = 0 , и, Рис. 3.3.2 100 Аналитическая геометрия и линейная алгебра → n = A B C будет нормальным вектором плоскости Ax + By + Cz + D = 0 . Поэтому T В этом случае вектор → | MK | = | A( x ∗ − x0 ) + B( y ∗ − y 0 ) + C ( z ∗ − z 0 ) | A2 + B 2 + C 2 , → Точка r0 принадлежит данной плоскости, значит Ax0 + By 0 + Cz 0 + D = 0 , а, поскольку A + B + C > 0 , то ответ задачи можно за- писать в виде → | MK | = Теорема 3.3.4. Пусть | Ax ∗ + By ∗ + Cz ∗ + D | A2 + B 2 + C 2 A1 + B1 + C1 > 0 и . A2 + B2 + C2 > 0 , в этом случае плоскости A1 x + B1 y + C1 z + D1 = 0, A2 x + B2 y + C 2 z + D 2 = 0 будут параллельны тогда и только тогда, когда их главные векторы коллинеарны. Доказательство. Докажем достаточность. Если главные векторы коллинеарны, то существует такое число λ ≠ 0 , что A1 = λ A2 ; B1 = λ B2 ; C1 = λC 2 , и система уравнений A1 x + B1 y + C1 z + D1 = 0, A2 x + B2 y + C 2 z + D2 = 0 101 Г л а в а 3 . Прямая и плоскость может быть переписана в виде A1 x + B1 y + C1 z + D1 = 0, A1 x + B1 y + C1 z + λD2 = 0. D1 ≠ λD2 на этих плоскостях нет общих точек, а при D1 = λD2 – все точки общие, что и означает параллельность При плоскостей. Докажем необходимость. Пусть плоскости A1 x + B1 y + C1 z + D1 = 0 и A2 x + B2 y + C2 z + D2 = 0 параллельны. Тогда они должны пересекать одни и те же координатные плоскости по параллельным прямым. Пусть для определенности этими координатными плоскостями являются плоскости, для которых x = 0 и z = 0 . Линии пересечения, соответствующие первой из координатных плоскостей, будут определяться системами уравнений x = 0, x = 0, и B1 y + C1 z + D1 = 0 B2 y + C2 z + D2 = 0. Параллельность этих прямых означает существование такого, что B1 = λ B2 ; C1 = λC 2 . Рассматривая случай соотношений λ≠0 z = 0 , получаем аналогичную систему z = 0, z = 0, и A1 x + B1 y + D1 = 0 A2 x + B2 y + D2 = 0, но из условия B1 = λ B2 и параллельности этой пары прямых вытекает, что A1 = λ A2 . Теорема доказана. 102 Следствие 3.3.2. Аналитическая геометрия и линейная алгебра Для того чтобы уравнения A1 x + B1 y + C1 z + D1 = 0, A1 + B1 + C1 > 0 и A2 x + B2 y + C 2 z + D2 = 0, A2 + B2 + C 2 > 0 были уравнениями одной и той же плоскости, необходимо и достаточно, чтобы существовало число λ ≠ 0, такое, что A1 = λ A2 ; B1 = λ B2 ; C1 = λC 2 ; D1 = λ D2 . Определение 3.3.4. Пучком плоскостей в пространстве называется совокупность всех плоскостей, проходящих через данную прямую. Определение 3.3.5. Уравнением пучка плоскостей, проходящих через прямую, определяемую пересечением пары непараллельных плоскостей A1 x + B1 y + C1 z + D1 = 0, A1 + B1 + C1 > 0 и A2 x + B2 y + C 2 z + D2 = 0, A2 + B2 + C 2 > 0, называется уравнение вида α( A1 x + B1 y + C1 z + D1 ) + + β( A2 x + B2 y + C 2 z + D2 ) = 0, α + β > 0. Определение 3.3.6. Связкой плоскостей в пространстве называется совокупность всех плоскостей, проходящих через данную точку. 103 Г л а в а 3 . Прямая и плоскость Определение 3.3.7. Если точка плоскостям P , принадлежащая одновременно трем A1 x + B1 y + C1 z + D1 = 0, A1 + B1 + C1 > 0, A2 x + B2 y + C 2 z + D2 = 0, A2 + B2 + C 2 > 0 и A3 x + B3 y + C 3 z + D3 = 0, A3 + B3 + C 3 > 0, единственная, то уравнение вида α( A1 x + B1 y + C1 z + D1 ) + + β( A2 x + B2 y + C 2 z + D2 ) + + γ( A3 x + B3 y + C 3 z + D3 ) = 0, α + β + γ >0 называется уравнением связки плоскостей, проходящих через точку P . Для пучка и связки плоскостей в пространстве справедливы теоремы, аналогичные теореме 3.2.1 для пучка прямых на плоскости. § 3.4. Способы задания прямой в пространстве Существуют различные способы задания прямой в пространстве в → декартовой системе координат 1°. Уравнение прямой в параметрической форме → → {O, g1 , g 2 , g 3 } . Пусть точка с радиусом-вектором → r = x y z T лежит на прямой в пространстве, имеющей ненулевой направляющий вектор 104 Аналитическая геометрия и линейная алгебра ax → x0 → a = a y и проходящей через точку r0 = y 0 , тоaz z0 → гда из коллинеарности векторов → → a и r − r0 следует, что уравнение прямой в пространстве должно иметь → вид 2°. Уравнение прямой в канонической форме → → r = r0 + τ a . Если исключить параметр → уравнения → τ из скалярной записи → r = r0 + τ a x = x 0 + τa x , y = y 0 + τa y , z = z + τa , 0 z то получается так называемое каноническое уравнение прямой x − x0 y − y 0 z − z 0 = = , ax ay az хотя здесь правильнее говорить о системе уравнений. Случай a x a y a z = 0 рассматривается аналогично случаю, рассмотренному в § 3.2 (1°). → 3°. Уравнение прямой, проходящей через две Поскольку направляющий вектор данной прямой коллинеарен вектору x 2 − x1 r2 − r1 = y 2 − y1 , z 2 − z1 → → a 105 Г л а в а 3 . Прямая и плоскость две несовпадающие точки → → → → → r = r1 + τ(r2 − r1 ) ∀τ x1 r1 = y1 z1 → то уравнение прямой в векторной форме можно представить в виде и x2 r2 = y 2 z2 или → → → r = (1 − τ) r1 + τ r2 ∀τ . Соответственно в координатах после исключения параметра τ получаем соотношения x − x1 y − y1 z − z1 = = , x 2 − x1 y 2 − y1 z 2 − z1 если только ( x2 − x1 )( y2 − y1 )( z 2 − z1 ) ≠ 0 . 4°. Уравнение прямой в 1й векторной форме Прямая в пространстве может быть задана как линия пересечения двух плоскостей → → (n1 , r ) = d 1 → → → и (n2 , r ) = d 2 , → n1 и n2 – неколлинеарные, нормальные векторы этих плоскостей, а d1 и d 2 – некоторые числа. где → Или же, если известна точка r0 , через которую проходит данная прямая, то радиус-вектор любой точки этой прямой удовлетворяет следующей системе уравнений: → → → (n1 , r − r0 ) = 0, → → → (n2 , r − r0 ) = 0. Или в координатной форме A1 x + B1 y + C1 z + D1 = 0, A2 x + B2 y + C 2 z + D2 = 0. 106 Аналитическая геометрия и линейная алгебра 5°. Уравнение Прямая в пространстве может быть задана при помо→ прямой во 2-й вектор- щи иного условия коллинеарности векторов a и ной форме → → r − r0 , в виде уравнения → → → → [ a , r − r0 ] = o или же → → → → → → [ a , r ] = b , где b = [ a , r0 ] . Наконец, в ортонормированной системе координат → → → {O, e1 , e2 , e3 } данное уравнение прямой в пространстве принимает вид → → e1 det a x e2 ay x y → a y z − a z y = b x , e3 → a z = b или a z x − a x z = b y , a y − a x = b . z y z x Отметим, что в последней системе скалярных условий только два уравнения из трех независимые, то есть любое из этих уравнений является следствием двух других. Действительно, умножив первое уравнение на a x , второе на a y и a z и сложив затем полученные равенства почленно, приходим к тождеству вида 0 = 0 , поскольку числа a x , a y и a z не равны третье на нулю одновременно, а bx = a y z 0 − a z y 0 , b y = a z x 0 − a x z 0 , b = a y − a x . x 0 y 0 z 107 Г л а в а 3 . Прямая и плоскость Наконец, расстояние d в пространстве от некоторой точки с → радиусом-вектором → → R до прямой → r = r0 + τ a можно найти, воспользовавшись свойством, что S – площадь параллелограмма, построенного на паре векторов, равна длине векторного произведения этих векторов. Из рис. 3.4.1 получаем Рис. 3.4.1 → S d= → = → → [ R − r0 , a ] → a . a § 3.5. Решение геометрических задач методами векторной алгебры Эффективность использования методов векторной алгебры при решении геометрических задач во многом зависит от правильного выбора представления геометрических условий в векторной форме. Например, если ввести определения, равносильные используемым в элементарной геометрии, то вычисление углов, определяющих взаимное расположение прямых и плоскостей в пространстве, может быть сведено к нахождению скалярных и/или векторных произведений соответствующих нормальных и направляющих векторов. → Определение 3.5.1. Углом → → между плоскостями → → → ( r − r01 , n1 ) = 0 и ( r − r02 , n2 ) = 0 называется угол между их нор→ мальными векторами → n1 и n2 . 108 Аналитическая геометрия и линейная алгебра → Определение 3.5.2. → → → → ( r − r0 , n ) = 0 и прямой Углом между плоскостью → r = r0 + τ a называется угол π − α , где α – угол 2 → между векторами → n и a. В таблицах 3.5.1–3.5.3 приведены некоторые из часто употребляемых форм выражения геометрических условий при помощи векторных операций. Таблица 3.5.1 Относительная ориентация прямых в пространстве Геометрическое условие Коллинеарность прямых → → → → → → Возможная векторная форма представления 1°. → r = r01 + τ a1 и r = r02 + τ a 2 . → → → λ ≠ 0 , такое, что → a1 = λ a 2 . → 2°. → → [a1 , a2 ] = o . → → (a1 , a 2 ) = 0. Ортогональность прямых → Существует → r = r01 + τ a1 и → r = r02 + τ a 2 . Коллинеарность прямых → → → 1°. Существует → r = r0 + τ a и → λ ≠ 0 , такое, что → a = λ [n1 , n2 ] . → → (n1 , r ) = d1 , → → (n2 , r ) = d 2 . → 2°. → → → [ a , [n1 , n2 ]] = o . 109 Г л а в а 3 . Прямая и плоскость → → → → → ( a , n1 , n2 ) = 0. Ортогональность прямых → r = r0 + τ a и → → (n1 , r ) = d1 , → → (n2 , r ) = d 2 . Совпадение прямых → → 1°. → r = r01 + τ a1 и → → λ ≠ 0 и µ ≠ 0, Существуют → такие, что → → r = r02 + τ a 2 . → a1 = λ a2 и → → r01 − r02 = µ a1 . → 2°. → → [ a1 , a 2 ] = o и → → → → [r01 − r02 , a1 ] = o . Пересечение прямых → → → → → → r = r01 + τ a1 и → → → [ a1 , a 2 ] ≠ o и → → → (r01 − r02 , a1 , a 2 ) = 0. → r = r02 + τ a 2 . Условие скрещивания пря→ → → мых r = r01 + τ a1 и → → → r = r02 + τ a 2 . → → → [ a1 , a 2 ] ≠ o и → → → → (r01 − r02 , a1 , a 2 ) ≠ 0 . 110 Аналитическая геометрия и линейная алгебра Таблица 3.5.2 Относительная ориентация плоскостей в пространстве Геометрическое условие Возможная векторная форма представления Параллельность плоско→ стей → → 1°. Существует → → → → → r = r01 + ϕ p1 + θ q1 [ p1 , q1 ] = λ [ p 2 , q 2 ] и → (r01 − r02 , p1 , q1 ) ≠ 0 . → и → λ ≠ 0, такое, что → → r = r02 + ϕ p 2 + θ q 2 . → → → → 2°. → → → → [[ p1 , q1 ],[ p2 , q 2 ]] = o и → → → → (r01 − r02 , p1 , q1 ) ≠ 0. Совпадение плоскостей → → → 1°. Существует → → r = r01 + ϕ p1 + θ q1 и → → → → → → → → → → → → → → → → → → → → → → → (r01 − r02 , p1 , q1 ) = 0 . → r = r02 + ϕ p 2 + θ q 2 . Ортогональность плоско→ стей → → → r = r01 + ϕ p1 + θ q1 и → → → → r = r02 + ϕ p 2 + θ q 2 . → [[ p1 , q1 ],[ p2 , q 2 ]] = o и 2°. r = r01 + ϕ p1 + θ q1 и → → (r01 − r02 , p1 , q1 ) = 0 . Совпадение плоскостей → → [ p1 , q1 ] = λ [ p 2 , q 2 ] и r = r02 + ϕ p 2 + θ q 2 . → λ ≠ 0, такое, что → → ( [ p1 , q1 ], [ p 2 , q 2 ]) = 0 . 111 Г л а в а 3 . Прямая и плоскость Параллельность плоско→ стей → → → r = r0 + ϕ p + θ q и → → → → ( p , n ) = 0 при условии ( n , r0 ) ≠ d . →→ ( q , n ) = 0 → → ( n, r ) = d . Совпадение плоскостей → → → → r = r0 +ϕ p + θ q и → → → → ( p , n ) = 0 при условии ( n , r0 ) = d . →→ ( q , n ) = 0 → → ( n, r ) = d . Ортогональность плоско→ стей → → 1°. → → → r = r0 + ϕ p + θ q и → [ p, q ] = λ n . →→ → → ( n, r ) = d . λ ≠ 0, такое, что Существует 2°. → → [[ p, q ], n ] = o . Таблица 3.5.3 Относительная ориентация прямой и плоскости в пространстве Геометрическое условие Параллельность прямой → → → r = r01 + τ a плоскости → → → → r = r02 + ϕ p + θ q . Возможная векторная форма представления 1°. Существуют λ ; µ ; λ + µ > 0, → такие, что → → → → a = λ p+µ q и → → (r01 − r02 , p, q ) ≠ 0 . 112 Аналитическая геометрия и линейная алгебра 2°. Ортогональность прямой → → → → → → 1°. Существует → → → λ ≠ 0, такое, что a = λ [ p, q] . r = r01 + τ a плоскости → → r = r02 + ϕ p + θ q . → → → ( a , p, q) = 0, → → → → (r01 − r02 , p, q) = 0. 2°. → → → [ a ,[ p , q ]] = o . → → ( a , n) = 0 при условии Параллельность прямой → → → → → r = r01 + τ a плоскости ( n , r0 ) ≠ d . → → ( n, r ) = d . →→ ( a , n) = 0, → → (r0 , n) = d . Принадлежность прямой → → → r = r01 + τ a плоскости → → ( n, r ) = d . Ортогональность прямой → → 1°. → Существует → r = r01 + τ a плоскости λ ≠ 0, такое, что → a =λn. → → → → → ( n, r ) = d . 2°. [a, n] = o . Ортогональность прямой 1°. Существуют λ ; µ ; λ + µ > 0, такие, → → (n1 , r ) = d1 , → → (n2 , r ) = d 2 → → и плоскости ( n, r ) = d . → 2°. → → что n = λ n1 + µ n2 . → → → → [ n ,[ n1 , n2 ]] = o . 113 Г л а в а 3 . Прямая и плоскость Отметим, что в таблицах 3.5.1–3.5.3 сохранены введенные ранее обозначения и ограничения. При решении геометрических задач методами векторной алгебры также важно уметь переводить эти представления из одной эквивалентной формы в другую5. Найдем, например, для прямой, заданной в пространстве пересечением двух непараллельных плоскостей → → (n1 , r ) = d1 , → → (n2 , r ) = d 2 , → → → r = r0 + τ a . уравнение в параметрическом виде Нетрудно убедиться, что в качестве направляющего вектора дан→ → → → a = [ n1 , n2 ] , а радиус-вектор точки r0 ной прямой можно взять → выражается как некоторая линейная комбинация векторов → Действительно, пусть → → n1 и n2 . → r0 = ξ n1 + η n2 , тогда из системы линейных уравнений → → ∆η ∆ξ (n1 , r0 ) = d1 , находим ξ = и η= , → → ∆ ∆ (n2 , r0 ) = d 2 → где ∆ = det → (n1 , n1 ) → → → → (n1 , n2 ) → → (n2 , n1 ) (n2 , n2 ) → , ∆ ξ = det → d1 (n1 , n2 ) d2 (n2 , n2 ) → → 5 Следует иметь в виду, что использование различных векторных представлений одного и то же геометрического условия может приводить к различным, но, естественно, эквивалентным формам записи решения. (См., например, задачу 3.5.2.) 114 Аналитическая геометрия и линейная алгебра → и ∆ η = det → (n1 , n1 ) → d1 → (см. теорему 1.1.2). (n2 , n1 ) d 2 Покажите самостоятельно, что условие неколлинеарности нор→ → n1 и n2 равносильно условию ∆ ≠ 0 . мальных векторов Аналогично может быть выполнен и обратный переход. Пусть → уравнение прямой в пространстве имеет вид → → → предположим, что → r = r0 + τ a , причем r0 и a неколлинеарны. Тогда в качестве нор- мальных векторов плоскостей, которые пересекаются по данной пря→ мой, можно взять → → → → → n1 = [ a , r0 ] и n2 = [ a , n1 ] . Из второго равенства, используя формулу для двойного векторного произведения (см. § 2.8), получаем → → → → → → → → → → → → → → → → 2 → n2 = [ a , n1 ] = [ a , [ a , r0 ]] = ( a , r0 ) a − ( a , a ) r0 = ( a , r0 ) a − a r0 . → → В качестве → d 1 и d 2 , очевидно, можно принять d1 = (n1 , r0 ) и → → → d 2 = (n2 , r0 ) . Случай коллинеарных векторов r0 и a рассмотрите самостоятельно. В заключение приведем в качестве примеров решения некоторых стереометрических задач методами векторной алгебры. → → Задача 3.5.1. Даны плоскость → мая → ( n , r ) = d 0 и пересекающая ее пря- → r = r0 + τ a . Найти радиус-вектор точки пере- сечения этой прямой и плоскости. Г л а в а 3 . Прямая и плоскость 115 Решение. 1°. Заметим, что если ( n , a ) = 0 , то либо решений нет, → → либо вся прямая лежит на данной плоскости. Поэтому → → будем далее полагать, что (n, a ) ≠ 0 . → → → → r = r0 + λ n , где r – Имеем 2°. искомый радиус-вектор точки пересечения прямой и плоскости, а λ – соответствующее этой точке значение параметра τ (рис. 3.5.1). Поскольку точка пересечения принадлежит данной плоскости, то имеет место соотношение Рис. 3.5.1 → → → ( n , r0 + λ a ) = d 0 . → → Откуда λ= d − ( n, r0 ) → → ( n, a ) → → d − ( n , r0 ) → и, наконец, r = r0 + a. → → ( n, a ) → → → Задача 3.5.2. Даны точка с радиусом-вектором → → R и прямая → r = r0 + τ a . Найти расстояние от этой точки до данной прямой, не используя операцию векторного произведения. → Решение. 1°. Проведем через данную точку с радиусом-вектором R плоскость, перпендикулярную прямой (рис. 3.5.2). Обо→ значим через rx радиус-вектор точки пересечения пря- мой и плоскости. Тогда искомое расстояние будет равно → → ρ = | R −rx | . 116 Аналитическая геометрия и линейная алгебра → 2°. Точка rx будет удовлетворять одновременно соотношениям → → → ( a , R − rx ) = 0 → → → rx = r0 + λ a , но тогда, исключая параметр λ , нахо- и дим, что Рис. 3.5.2 ρ= и = → → → ( R − r0 , a ) → rx = r0 + a → 2 |a| → → → → → → → → ( R − r , a ) → → → ( R − r0 , a ) → ( R − r0 − → 0 a ,R − r0 − → a) 2 2 |a| |a| → → → → → | R − r0 | − 2 = → → ( R − r0 , a ) 2 → . | a |2 Заметим, → 2 → 2 p q что в силу → → легко проверяемого тождества 2 → → = ( p, q ) 2 + [ p, q ] → данное решение совпадает с полу→ → [ R − r0 , a ] ченным в § 3.4 значением ρ= → . |a| → Задача 3.5.3. Найти расстояние между прямыми → → → r = r02 + τ a 2 . → → r = r01 + τ a1 и 117 Г л а в а 3 . Прямая и плоскость → Решение. → 1°. Если векторы a1 и a 2 коллинеарны, тогда решение аналогично приведенному на рис. 3.4.1 и дается формулой → ρ= S = → → → | [r02 − r01 , a1 ] | → | a1 | . | a1 | → → 2°. Пусть векторы a1 и a 2 неколлинеарны, тогда построим пару плоскостей, параллельных этим векторам, одна из которых со→ держит точку r01 , а другая точ- → ку r02 (рис. 3.5.3). Объем параллелепипеда, → строенного на векторах → и Рис. 3.5.3 по→ a1 , a 2 → r02 − r01 , равен, с одной сто- роны, произведению площади параллелограмма, находящегося в основании, на искомую вели→ чину → → → ρ и (r02 − r01 , a1 , a 2 ) – с другой. Откуда находим, что → ρ= → → → | (r02 − r01 , a1 , a 2 ) | → → | [a1 , a 2 ] | . 118 Аналитическая геометрия и линейная алгебра → → Задача 3.5.4. Даны плоскость → → → ( n , r ) = δ и прямая [ p, r ] = q . Найти → R – радиус-вектор точки их пересечения. Решение. Умножив обе части уравнения прямой векторно слева на → → → → → → n , получим [ n ,[ p, r ]] = [ n , q ] . Подставляя в это соот→ ношение искомый вектор приходим к равенству → → → R и применяя формулу § 2.8, → → → → → p ( n , R) − R ( n , p ) = [ n , q ] . → Поскольку R принадлежит данной → → плоскости, то ( n , R) = δ , и тогда при естественном ограничении → → ( n , p ) ≠ 0 получаем → R= → → → δ p − [ n, q ] → → ( n , p) . Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 119 Глава 4 НЕЛИНЕЙНЫЕ ОБЪЕКТЫ НА ПЛОСКОСТИ И В ПРОСТРАНСТВЕ § 4.1. Линии на плоскости и в пространстве → → Пусть дана система координат вое множество ным). Определение 4.1.1. {O, g1 , g 2 } на плоскости и число- Ω, являющееся промежутком (возможно, бесконеч- Будем говорить, что линия L на плоскости задана па→ раметрически вектор-функцией координатной форме → = r g → r = F (τ) (или в Fx (τ) , F y ( τ) Fx (τ), Fy (τ) – непрерывные, скалярные функции аргумента τ , определенные для τ ∈ Ω ), если где 1) для любого τ ∈ Ω точка → → r = F (τ) ле- жит на L; → 2) для любой точки r0 , лежащей на L, су- ществует τ 0 ∈ Ω , такое, что выполнено равенство r0 = F (τ 0 ) . → → 120 Иногда Аналитическая геометрия и линейная алгебра линия на плоскости задается в виде уравнения G ( x , y ) = 0 , которое получается исключением параметра τ из сис x = Fx (τ) темы уравнений , τ∈Ω. y = Fy (τ) Пример 4.1.1. 1°. Прямая → → линия → задается вектор-функцией → → r = r0 + τ a , где a – направляющий вектор, а r0 – одна из точек данной прямой. Скалярная форма задания прямой в этом случае имеет вид x = x 0 + τa x , τ ∈ (−∞,+ ∞) , y = y 0 + τa y , Fx (τ) = x0 + τa x , τ ∈ (−∞, + ∞) , то есть ( ) , F τ = y + τ a y 0 y Ax + By + C = 0 , A + B > 0 , где G ( x , y ) = Ax + By + C . или 2°. В декартовой ортонормированной системе координат окружность радиуса R с центром в точке в параметрическом виде может быть задана как x = x0 + R cos τ, τ ∈ [0,2π) , то есть y = y 0 + R sin τ, Fx (τ) = x0 + R cos τ, τ ∈ [0,2π) , Fy (τ) = y 0 + R sin τ, или же уравнением ( x − x0 ) 2 + ( y − y0 ) 2 = R 2 , 2 2 2 где G ( x , y ) = ( x − x 0 ) + ( y − y 0 ) − R . x0 y0 Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве Определение 4.1.2. 121 Линия называется алгебраической, если ее уравнение в декартовой системе координат имеет вид m ∑α k =0 k x pk y qk = 0 , где p k и q k – целые неотрица- тельные числа, а числа α k не равны нулю одновре- менно. Определение 4.1.3. Число N = max { pk + q k } называется порядком k =[ 0 , m ] алгебраического уравнения, указанного в определении 4.1.2, где максимум находится по всем k , для которых α k ≠ 0 . Наименьший из порядков алгеб- раических уравнений, задающих данную алгебраическую линию, называется порядком алгебраической линии. Пример 4.1.2 (алгебраические линии). Теорема 4.1.1. x + 3y + 2 = 0 ( N = 1) y − x2 = 0 ( N = 2) Гипербола xy − 1 = 0 ( N = 2) “Декартов лист” x 3 + y 3 − xy = 0 ( N = 3) Прямая Квадратная бола пара- Порядок алгебраической линии не зависит от выбора системы координат. Доказательство. Пусть алгебраическая линия L имеет в системе координат → → {O, g1 , g 2 } уравнение G ( x , y ) = 0 и порядок N . Перейдем → → к системе координат {O, g1′ , g 2′ } . Формулы перехода, согласно соотношениям (1.8.2), имеют вид 122 Аналитическая геометрия и линейная алгебра x = σ11 x′ + σ12 y′ + β1 , y = σ 21 x′ + σ 22 y′ + β2 , поэтому уравнение линии L в “новой” системе координат будет G (σ11 x ′ + σ12 y ′ + β1 , σ 21 x ′ + σ 22 y ′ + β 2 ) = 0. Отсюда следует в силу определения 4.1.2, что N ≥ N ′ , то есть при переходе к “новой” системе координат порядок алгебраической кривой не может повыситься. Применяя аналогичные рассуждения для обратного перехода от системы координат → → → → {O, g1′ , g 2′ } к системе {O, g1 , g 2 } , получим N ≤ N ′ и окончательно N = N ′ . Теорема доказана. фигуры на плоскости можно задавать, используя ограничения типа неравенств. Замечание: Пример 4.1.4. 1°. В ортонормированной системе координат набор ус- x ≥ 0, ловий y ≥ 0, задает прямоугольный равx + y − 3 ≤ 0 нобедренный треугольник, катеты которого лежат на осях координат и имеют длины 3. 2°. В ортонормированной системе координат неравенство вида x + y − 4 ≤ 0 определяет круг радиуса 2 с центром в начале координат. 2 2 Рассмотрим теперь случай линии в пространстве. Пусть дана про→ странственная система координат → → {O, g1 , g 2 , g 3 } . Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве Определение 4.1.4. Будем говорить, что линия 123 L в пространстве задана → параметрически вектор-функцией координатной форме → r = F (τ) (или в Fx (τ) x y = Fy (τ) , z Fz (τ) где Fx ( τ), Fy ( τ), Fz ( τ) – непрерывные, скалярные функции от τ , определенные для τ ∈ Ω ), если → 1) для любого → τ ∈ Ω точка r = F (τ) ле- жит на L, → 2) для любой точки ществует r0 , лежащей на L, су- τ 0 ∈ Ω , такое, что выполнено → равенство r0 → = F (τ 0 ) . Иногда линия в пространстве задается системой уравнений G ( x, y, z ) = 0, H ( x, y, z ) = 0, которая получается исключением параметра x = Fx (τ), y = Fy (τ), z = F (τ), z τ из соотношений τ∈Ω, или же равносильным уравнением, например, вида G 2 ( x, y , z ) + H 2 ( x, y , z ) = 0 . Пример 4.1.3. 1°. В декартовой системе координат алгебраическая линия второго порядка x 2 + y 2 = 0 ∀z является прямой. 124 Аналитическая геометрия и линейная алгебра 2°. В ортонормированной системе координат винтовая линия радиуса R с шагом 2πa может быть задана в следующем параметрическом виде: x = R cos τ, y = R sin τ , τ ∈ (−∞,+∞) , z = aτ z x = R cos a , или же z y = R sin . a § 4.2. Поверхности в пространстве Пусть → → имеется пространственная система координат → {O, g1 , g 2 , g 3 } и Ω – множество упорядоченных пар чисел ϕ, θ , заданное условиями: α ≤ ϕ ≤ β, γ ≤ θ ≤ δ . Определение 4.2.1. Будем говорить, что в пространстве поверхность задана параметрически вектор-функцией → S → r = F (ϕ, θ) (или в координатной форме Fx (ϕ, θ) → r g = Fy (ϕ, θ) , Fz (ϕ, θ) Fx (ϕ, θ), Fy (ϕ, θ), Fz (ϕ, θ) – непрерывные скалярные функции двух аргументов ϕ, θ , определенные для ϕ, θ ∈ Ω ), если где Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 1) 125 для любой упорядоченной пары чисел → → ϕ, θ ∈ Ω точка r = F (ϕ, θ) лежит на S, → 2) для любой точки r0 , лежащей на S, существует упорядоченная пара чисел ϕ 0 , θ 0 ∈ Ω, таких, что выполнено равен→ ство r0 → = F (ϕ 0 , θ 0 ) . Иногда поверхность в пространстве задается в виде уравнения G ( x , y , z ) = 0 , которое получается исключением ϕ и θ из системы уравнений x = Fx (ϕ, θ), y = Fy (ϕ, θ), ϕ, θ ∈ Ω . z = F (ϕ, θ). z Пример 4.2.1. В ортонормированной системе координат сфера радиуса x0 R с центром в точке y0 может быть параметрически z0 задана в виде x = x0 + R cos ϕ sin θ, y = y 0 + R sin ϕ sin θ, z = z + R cos θ, 0 0 ≤ ϕ < 2π, 0 ≤ θ ≤ π, а ее уравнение в координатах ( x − x0 ) 2 + ( y − y0 ) 2 + ( z − z0 ) 2 = R 2 . 126 Аналитическая геометрия и линейная алгебра Определение 4.2.2. Поверхность называется алгебраической, если ее уравнение в декартовой системе координат имеет вид m ∑α k =0 k x pk q y kz rk = 0 , где p k , q k и rk – целые неотрицательные числа, а числа α k не равны нулю одновременно. Определение 4.2.3. Число N = max { pk + q k + rk } называется порядk =[ 0 ,m ] ком алгебраического уравнения, (указанного в определении 4.2.2), где максимум находится по всем k, для которых α k ≠ 0 . Наименьший из порядков алгебраических уравнений, задающих данную алгебраическую поверхность, называется порядком алгебраической поверхности. Пример 4.2.2 (алгебраические поверхности). Теорема 4.2.1. Прямой круговой цилиндр x2 + y2 −1 = 0 ( N = 2) x2 + y2 + z2 − R2 = 0 ( N = 2) Сфера Порядок алгебраической поверхности не зависит от выбора системы координат. Доказательство. Аналогично доказательству теоремы 4.1.1. Замечание: тела в пространстве можно задавать, используя ограни- чения типа неравенств. Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 127 § 4.3. Цилиндрические и конические поверхности → Пусть в пространстве заданы система координат → → → {O, g1 , g 2 , g 3 } → и некоторая линия r = F (ϕ) , ϕ ∈ Ω , которую будем называть направляющей. Проведем через каждую точку направляющей линии прямую, называемую образующей, параллельно некоторому ненуле→ вому вектору Определение 4.3.1. a. Совокупность всех точек пространства, лежащих на образующих данного вида, называется цилиндрической поверхностью. Составим уравнение цилиндрической поверхности в общем виде. → → → Во введенных обозначениях r = F (ϕ) + KM (см. рис. 4.3.1), но по определению цилиндрической поверхности → → KM = θ a , и, следовательно, уравнение цилиндрической поверхности в векторной форме имеет вид → → → r (ϕ, θ) = F (ϕ) + θ a , ϕ ∈ Ω, θ ∈ (−∞, + ∞). Пусть в координатной форме Fx (ϕ) → F (ϕ) g = Fy (ϕ) Fz (ϕ) ax → и a g = ay , az θ получаем x − Fx (ϕ) y − Fy (ϕ) z − Fz (ϕ) = = . ax ay az тогда после исключения 128 Пример 4.3.1. Аналитическая геометрия и линейная алгебра Прямая круговая цилиндрическая поверхность, для которой в ортонормированной системе координат - направляющей служит окружность радиуса 3, лежащая в плоскости, перпендикулярной оси аппликат, с центром в начале координат, - а образующими являются прямые, перпендикулярные этой плоскости, задается сиcтемой условий 3 cos ϕ 0 x = 3 cos ϕ, → → y = 3 sin ϕ, поскольку F (ϕ) = 3 sin ϕ ; a = 0 . z = θ, 0 1 Заметим, что если из полученных соотношений также исключить и параметр ϕ, то получится уравнение вида x + y = 9 для любого z , откуда следует, что порядок данной алгебраической поверхности N =2. 2 Рис. 4.3.1 2 Рис. 4.3.2 Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 129 Проведем через каждую точку направляющей линии прямую (называемую образующей), проходящую через некоторую фиксированную, не принадлежащую направляющей, точку A (называемую верши→ ной) с радиусом-вектором r0 . Совокупность всех точек пространства, лежащих на образующих данного вида, называется конической поверхностью. Определение 4.3.2. Составим уравнение конической поверхности в общем виде. → → → Аналогично рассмотренному выше случаю r = F (ϕ) + KM , но по определению конической поверхности (см. рис. 4.3.2) → → → KM = θ(r0 − F (ϕ)) , и, следовательно, уравнение конической поверхности в векторной форме имеет вид → → → r (ϕ, θ) = (1 − θ) F (ϕ) + θ r0 , ϕ ∈ Ω, θ ∈ (−∞, + ∞). x0 → Пусть в координатах r0 g раметра = y 0 , тогда после исключения паz0 θ получаем y − Fy (ϕ) x − Fx (ϕ) z − Fz (ϕ) = = . x0 − Fx (ϕ) y 0 − Fy (ϕ) z 0 − Fz (ϕ) Пример 4.3.2. Прямая круговая коническая поверхность, для которой в ортонормированной системе координат - направляющей служит окружность радиуса 3, лежащая в плоскости, перпендикулярной оси аппликат, с центром в начале координат, 130 Аналитическая геометрия и линейная алгебра - и образующими, → проходящими через точку r0 = 0 0 − 1 , T задается системой условий (см. пример 4.3.1): x − 3 cos ϕ y − 3 sin ϕ z = = , ϕ ∈ [0,2π) . − 3 cos ϕ − 3 sin ϕ −1 Заметим, что если из полученных соотношений исключить также и параметр ϕ, то получится уравнение вида то есть N = 2. x2 y2 + − ( z + 1) 2 = 0 , 9 9 § 4.4. Линии второго порядка на плоскости Пусть на плоскости дана ортонормированная система координат → → {O, e1 , e2 } и некоторая линия L . Определение 4.4.1. В соответствии с определениями 4.1.2 и 4.1.3 будем говорить, что линия L является алгебраической линией второго порядка, если ее уравнение в данной системе координат может иметь вид Ax 2 + 2 Bxy + Cy 2 + 2 Dx + 2 Ey + F = 0, (4.4.1) где числа A , B и C не равны нулю одновременно, а x и y суть координаты радиуса-вектора точки, принадлежащей L . Поскольку коэффициенты уравнения 4.4.1 зависят от выбора системы координат, при исследовании свойств линий второго порядка целесообразно предварительно перейти к другой ортонормированной Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 131 → → системе координат {O ′, e1′ , e2′ } , в которой запись уравнения линии оказывается наиболее простой. Теорема 4.4.1. Для любой линии второго порядка существует ортонормированная система координат, в которой уравнение этой линии имеет (при a ≥ b > 0, p > 0 ) один из следующих девяти (называемых каноническими) видов: Таблица 4 .4 .1 Тип линии Вид линии Эллиптический ∆>0 Пустые множества x′ 2 y ′ 2 + = −1 a2 b2 Изолированные точки x′ 2 y′ 2 + 2 =0 a2 b Гиперболический ∆<0 ∆=0 y ′ 2 = −a 2 ∀x ′ y′2 = 0 ∀x ′ Совпадающие прямые x′ 2 y ′ 2 y′2 = a 2 − = 0 a2 b2 ∀x ′ Несовпадающие прямые Кривые Параболический Эллипс Гипербола x′ 2 y ′ 2 + 2 =1 a2 b x′2 y′2 − =1 a2 b2 Парабола y ′ 2 = 2 px ′ 132 где Аналитическая геометрия и линейная алгебра ∆ = det A B = AC − B 2 . B C Доказательство. 1°. Предварительно заметим, что без ограничения общности можно считать выполненными условия: B ≥ 0 и A ≥ C . Действительно, если B < 0 , то можно изменить знаки всех коэффициентов в уравнении 4.4.1. Если же A < C , то, перейдя к новой ортонормированной системе координат, для которой → → → → → → e1′ = e2 ; e2′ = e1 ; OO′ = o , мы получим желаемое соотношение, поскольку при таком переходе имеют место равенства x = y ′; y = x ′ в силу утверждений § 1.8. Заметим также, что ∆ не меняется, поскольку C B A B det = det =∆. B A B C при этой замене B = 0 , то переходим к пункту 4° на с. 135. Если же B > 0 , то выбираем новую ортонормированную систему коор- 2°. Если → → {O′, e1′ , e′2 } , получаемую из исходной поворотом против часовой стрелки вокруг точки O на угол 0 < α ≤ π / 4, такой, чтобы коэффициент при произведении x ′y ′ оказался равным динат нулю. Выведем правило выбора этого угла. Рассмотрим поворот (см. § 1.8): → →′ → e = e cos α + e 1 1 2 sin α , → → → e2′ = − e1 sin α + e2 cos α, → → ′ O O = o, → → тогда формулы перехода от иметь вид → → {O, e1 , e2 } к {O′, e1′ , e′2 } будут Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 133 x = x ′ cos α − y ′ sin α , y = x ′ sin α + y ′ cos α . Подставляя выражения “старых” координат через “новые”, получаем уравнение 4.4.1 в виде A( x ′ cos α − y ′ sin α) 2 + + 2 B( x ′ cos α − y ′ sin α)( x ′ sin α + y ′ cos α) + + C ( x ′ sin α + y ′ cos α) 2 + 2 D( x ′ cos α − y ′ sin α) + + 2 E ( x ′ sin α + y ′ cos α) + F = 0, или же A ′x ′ 2 + 2 B ′x ′y ′ + C ′y ′ 2 + 2 D ′x ′ + 2 E ′y ′ + F ′ = 0 . Откуда находим, что A′ = A cos 2 α + 2 B cos α sin α + C sin 2 α , 2 B ′ = −2 A sin α cos α + 2 B cos 2 α − − 2 B sin 2 α + 2C sin α cos α , C ′ = A sin 2 α − 2 B sin α cos α + C cos 2 α . Из условия B ′ = 0 следует, что 2 B cos 2α − ( A − C ) sin 2α = 0, и окончательно tg 2α = 2B 1 2B ; α = arctg , при A > C , A−C 2 A−C π при A = C , то есть искомый угол найден. За4 метим, что угол α также может быть найден из равносильного или же α= уравнения tg 2 α + ибо если A−C tg α − 1 = 0, B ≠ 0, B B = 0 , то поворота не требуется. 134 Аналитическая геометрия и линейная алгебра 3°. Проверим, что при такой замене координат величины A + C не изменятся. Действительно, из соотношений 1 + ctg 2 2α = 1 + ( и неравенства sin 2α = 0<α≤ A−C 2 1 = ) 2B sin 2 2α π получаем 4 2B 4B 2 + ( A − C ) 2 ∆ и ; cos 2α = A−C 4B 2 + ( A − C ) 2 A ′ и C ′ имеем 1 + cos 2α 1 − cos 2α A′ = A + B sin 2α + C = 2 2 A+C A−C A+C = + cos 2α + B sin 2α = + 2 2 2 A−C A−C 2B + +B = 2 4B 2 + ( A − C) 2 4B 2 + ( A − C ) 2 Из предыдущих соотношений для значений = A+C 1 + 4B 2 + ( A − C ) 2 . 2 2 Аналогично получаем, что C′ = A+C 1 − 4B 2 + ( A − C ) 2 . 2 2 Теперь находим ∆ ′ = det A′ 0 0 C′ = A+C 2 1 − (4 B 2 + ( A − C ) 2 ) = 4 A B = AC − B 2 = det = ∆, B C = A′C ′ = ( ) 2 . Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 135 то есть величина ∆ не меняется при выполняемой замене системы координат. Также очевидно, что при этом и A′ + C ′ = A + C . 4°. В дальнейших рассуждениях будем полагать, что B = 0 , и рассмотрим отдельно случаи ∆ ≠ 0 и ∆ = 0 для уравнения вида Ax 2 + Cy 2 + 2 Dx + 2 Ey + F = 0 . Пусть ∆ ≠ 0 . Это означает, что A ≠ 0 и C ≠ 0 и уравнение линии может быть переписано в виде D 2 E 2 D2 E 2 +C y+ = + −F. A C A C D2 E 2 + − F , тогда, перейдя к новой ортоОбозначим P = A C A x+ ( ( ) ) нормированной системе координат → → ′ e = e D 1 1, ′ x = x − , → → A e2′ = e2 , E y = y′ − , → D→ E → C OO ′ = − e1 − e2 , A C 2 2 получим Ax ′ + Cy ′ = P , и откуда следует, что ± ( ± x′2 P | | A 2 x′ | C |2 ± ) ( 2 ± y′2 | A |2 y′2 P | | C = ±1 ; ) P ≠ 0, 2 = 0; P = 0, и мы приходим, таким образом, к одному из шести следующих уравнений: 136 Аналитическая геометрия и линейная алгебра x′2 y′ 2 + 2 = 0; a2 b 2 x′ y′2 − 2 = 0; a2 b x′2 y′2 + 2 = 1; a2 b 2 x′ y′2 − = 1; a2 b2 x′ 2 y′ 2 + 2 = −1 для ∆ > 0, a2 b 2 x′ y′2 − = −1 для ∆ < 0. a2 b2 Первые пять из этих случаев содержатся в формулировке теоремы (табл. 4.4.1), а шестой сводится к пятому умножением обеих частей уравнения на − 1 с последующим взаимным переобозначением переменных x ′ и y ′ . 5°. Пусть ∆ = 0 . Это означает, что AC = 0 , то есть либо A = 0 , либо C = 0 (но не вместе!). Пусть A = 0 (если это не так, то взаимно переобозначим переменные x ′ и y ′ ), тогда уравнение линии виде Cy 2 + 2 Dx + 2 Ey + F = 0 может быть записано в E C C y+ ( При ) 2 = E2 − F − 2 Dx, C ≠ 0. C D = 0 получаем C y+ ( E C ) 2 = E2 −F, C то есть одно из трех уравнений y ′ 2 = a 2 ; y ′ 2 = 0; y ′ 2 = − a 2 . D ≠ 0 , то уравнение можно привести к виду E 2 2D 1 E2 y+ =− x− −F , C C 2D C 2 2 и, таким образом, либо y ′ = 2 px ′ , либо y ′ = −2 px ′ , где p > 0. Если же ( ) ( ( )) Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 137 Первый из этих случаев указан в формулировке теоремы (табл. 4.4.1), а второй сводится к первому заменой координат: → →′ e = − e 1 → → 1, x = − x ′, e2′ = e2 , → y = y ′. → ′ O O = o , Теорема доказана. Замечания. 1°. В теореме 4.1.1 было показано, что порядок алгебраической линии, в том числе и для рассматриваемых в теореме 4.4.1 случаев, не меняется при замене системы координат. 2°. Из доказательства теоремы также следует, что поворот и параллельный перенос ортонормированной системы координат не допускают перемещения уравнения линии второго порядка из одной строки таблицы, приведенной в формулировке теоремы 4.4.1, в другую. Более того, в дальнейшем будет показано (см. § 5.4), что никакой заменой общей декартовой системы координат нельзя переместить линию второго порядка, находящуюся в одной из клеток таблицы в условии теоремы 4.4.1, в другую клетку. 3°. Пустое множество эллиптического типа иногда называют мнимым эллипсом, а пустое множество параболического типа – парой мнимых параллельных прямых. 4°. Алгоритм доказательства теоремы 4.4.1 можно использовать как для нахождения канонического вида уравнения линии второго порядка, так и для построения канонической системы координат, то есть системы координат, в которой данная линия второго порядка имеет канонический вид. 138 Аналитическая геометрия и линейная алгебра Исследование конкретных свойств различных типов линий второго порядка приводится в Приложении 1. § 4.5. Поверхности второго порядка в пространстве Пусть в пространстве дана ортонормированная система координат → → → {O, e1 , e2 , e3 } . Определение 4.5.1. В соответствии с определениями 4.2.2 и 4.2.3 будем говорить, что поверхность S является алгебраической поверхностью второго порядка, если ее уравнение в данной системе координат имеет вид A11 x 2 + A22 y 2 + A33 z 2 + + 2 A12 xy + 2 A13 xz + 2 A23 yz + (4.5.1) + 2 A14 x + 2 A24 y + 2 A34 z + A44 = 0, где числа A11 ; A22 ; A33 ; A12 ; A13 ; A23 не равны нулю одновременно, а x, y и z суть координаты радиуса-вектора точки, принадлежащей S. Как и в плоском случае, коэффициенты уравнения (4.5.1) зависят от выбора системы координат, поэтому при исследовании свойств поверхностей второго порядка целесообразно предварительно перейти в ту систему координат, для которой уравнение поверхности оказывается наиболее простым. Теорема 4.5.1. Для каждой поверхности второго порядка существует ортонормированная система координат → → → {O ′, e1′ , e2′ , e3′ } , в которой уравнение этой поверхности имеет один из следующих семнадцати канонических видов: Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве Пустые множества Точки, прямые и плоскости Изолированная точка x′2 y′ 2 + 2 + a2 b z′2 + 2 = −1 b x′ 2 y′ 2 + 2 + a2 b z′2 + 2 =0 b Прямая x′2 y′2 + 2 = −1 a2 b ∀z ′ x ′ 2 = −a 2 ∀ y ′, z ′ x′2 y′2 + 2 =0 a2 b ∀z ′ Пара пересекающихся плоскостей x′2 y′ 2 − =0 a2 b2 ∀z ′ Пара параллельных или совпадающих плоскостей x ′ 2 = a 2 ∀ y ′, z ′ x ′ 2 = 0 ∀ y ′, z ′ 139 Цилиндры и конусы Эллиптический цилиндр x′2 y′2 + 2 =1 a2 b ∀z ′ Гиперболический цилиндр x′2 y′ 2 − =1 a2 b2 ∀z ′ Параболический цилиндр y ′ 2 = 2 px ′ ∀z ′ Конус x′ 2 y ′ 2 + 2 − a2 b 2 z′ − 2 =0 c 140 Аналитическая геометрия и линейная алгебра Невырожденные поверхности Эллипсоиды Параболоиды Эллиптический параболоид x′ 2 y ′ 2 z ′ 2 + + =1 a2 b2 c2 x′ 2 y ′ 2 + = 2 z′ a 2 b2 Гиперболический параболоид x′ 2 y ′ 2 − = 2 z′ a 2 b2 причем a >0, b>0, c>0, Гиперболоиды Однополостный гиперболоид x′ 2 y ′ 2 z ′ 2 + − =1 a2 b2 c2 Двуполостный гиперболоид x′ 2 y ′ 2 z ′ 2 − − =1 a 2 b2 c2 p > 0. Доказательство. Хотя возможно доказать существование ортонормированной системы координат с требуемыми свойствами, применив подход, аналогичный использованному при доказательстве теоремы 4.4.1, представляется целесообразным рассмотреть этот вопрос в рамках теории евклидовых пространств, где утверждение теоремы 4.5.1 непосредственно вытекает из более общего случая, рассмотренного в § 12.2. Исследование свойств конкретных типов поверхностей второго порядка приводится в Приложении 2. Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 141 § 4.6. Альтернативные системы координат В ряде практических приложений оказывается целесообразным использование систем координат, отличных от декартовой. Полярная система координат Примером альтернативной системы координат на плоскости является полярная система координат. Положение точки на плоскости в этой системе координат задается парой упорядоченных чисел {ρ, ϕ} , где → → → ρ = OM , ϕ = ∠ ( OM , OP ) , удовлетворяющих ограничениям ρ ≥ 0, 0 ≤ ϕ < 2π . Точка O называется полюсом, а луч OP – полярной осью. Рис. 4.6.1 Угол ϕ отсчитывается против часовой стрелки (рис. 4.6.1). Для полюса этот угол не определяется. Формулы перехода от ортонормированной декартовой системы координат к полярной и обратно имеют следующий вид: x = ρ cos ϕ, y = ρ sin ϕ, cos ϕ = ρ = x2 + y2 ; x ; sin ϕ = x2 + y2 y x2 + y2 . Использование полярной системы координат позволяет упростить описание объектов, обладающих точечной симметрией. 142 Аналитическая геометрия и линейная алгебра Например, окружность единичного радиуса с центром в начале координат, имеющая в ортонормированной декартовой системе коорди- x 2 + y 2 = 1 , в полярной системе координат задается условием ρ = 1 . нат уравнение Более того, в Приложении 1 показано, что в полярной системе координат три различных типа линий второго порядка – эллипс, гипербола и парабола – задаются одним и тем же уравнением ρ(1 − ε cos ϕ) − p = 0 , где ε > 0 и p > 0 – некоторые константы, называемые эксцентриситетом и фокальным параметром соответственно, и что для различных значений эксцентриситета при фиксированном p получаются различные типы кривых: эллипсы при 0 < ε < 1 , параболы при ε = 1 и гиперболы при ε > 1 . Соответствующие случаи показаны на рисунке 4.6.2. Рис. 4.6.2. Зависимость типа конического сечения от величины эксцентриситета Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 143 Проверим справедливость этого утверждения, выполнив в уравнении ρ(1 − ε cos ϕ) − p = 0 переход от полярной к ортонормированной декартовой системе координат. Действительно, поскольку ρ = x 2 + y 2 и cos ϕ = x x +y 2 2 , то данное уравнение преобразуется к виду x 2 + y 2 (1 − ε x x + y2 2 ) − p = 0, которое в свою очередь равносильно при соблюдении условий и ε>0 p > 0 уравнению (1 − ε ) x + y = 2ε px + p . 2 2 2 2 Если ε = 1 , то мы получаем уравнение параболы. Если же то исходное уравнение можно записать так: (x − ε≠1, εp 2 1 p2 2 ) + y = . 1 − ε2 1 − ε2 (1 − ε 2 ) 2 Рассуждая далее, как в пункте 4° доказательства теоремы 4.4.1, можно прийти к заключению, что условие 0 < ε < 1 приводит к эллиптическому случаю линии второго порядка, а условие ческому типу. Если ослабить ограничения на ε > 1 – к гиперболи- параметры уравнения ρ(1 − ε cos ϕ) − p = 0 , разрешив им принимать (в смысле предельного перехода) как нулевые, так и бесконечно большие положительные значения, то можно получить и другие виды линий второго порядка, указанные в формулировке теоремы 4.4.1. ε = 0 и p ≠ 0 мы имеем окружность, при ε = 0 и p = 0 – изолированную точку, а при p = 0 и ε cos ϕ = 1 – пару Например, при пересекающихся прямых. 144 Аналитическая геометрия и линейная алгебра Рис. 4.6.3. Построение конических сечений Определение 4.6.1. Линия, уравнение которой в полярной системе координат имеет вид ρ(1 − ε cos ϕ) − p = 0 ∀p ≥ 0 , ∀ε ≥ 0, называется коническим сечением. Действительно, различные виды линий второго порядка, включая и вырожденные случаи, могут быть получены сечением круговой конической поверхности плоскостью, что иллюстрирует рисунок 4.6.3. Сферическая система координат В ряде практических приложений, требующих аналитического исследования пространственных объектов, используется так называемая сферическая система координат. Г л а в а 4 . Нелинейные объекты на плоскости и в пространстве 145 Положение точки в пространстве в этой системе однозначно задается при помощи упорядоченной тройки чисел {ρ, ϕ, θ} (рис. 4.6.4), где → → → → → ρ = OM , ϕ = ∠(Ox, OP) , θ = ∠(OM , Oz ) , которые удовлетворяют ограничениям ρ ≥ 0 ; 0 ≤ ϕ < 2π ; 0 ≤ θ ≤ π . Использование сферической системы координат иногда позволяет получить более простое аналитическое описание геометрических объектов, обладающих точечной симметрией. Например, уравнение сферы единичного радиуса с центром в начале координат в сферической системе будет иметь вид ρ = 1 . Формулы перехода между ортонормированной декартовой системой координат и сферической имеют следующий вид: x = ρ cos ϕ sin θ, y = ρ sin ϕ sin θ, z = ρ cos θ, а для обратного перехода соответственно Рис. 4.6.4 146 Аналитическая геометрия и линейная алгебра x 2 2 2 ; sin ϕ = ρ = x + y + z ; cos ϕ = 2 2 x y + z cos θ = . 2 x + y2 + z2 y x + y2 2 ; Цилиндрическая система координат В тех случаях, когда исследуемый пространственный объект обладает осевой симметрией, может оказаться удобным применение цилиндрической системы координат. Положение точки в пространстве в этой системе однозначно задается при помощи упорядоченной тройки чисел {ρ, ϕ, h} (рис. 4.6.5), где → → → ρ = OM , ϕ = ∠(Ox, OP) , Рис. 4.6.5 удовлетворяющие ограничениям ρ ≥ 0 ; 0 ≤ ϕ < 2π ; h ∈ (−∞, + ∞). Формулы перехода от ортонормированной декартовой системы координат к цилиндрической и обратно имеют следующий вид: x = ρ cos ϕ, y = ρ sin ϕ, z = h, cos ϕ = ρ = x2 + y2 ; x x2 + y2 ; sin ϕ = y x2 + y2 ; h = z. 147 Г л а в а 5 . Преобразования плоскости Глава 5 ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ § 5.1. Произведение матриц Определение 5.1.1. Матрица C размера m × n с элементами γ ji ∀i = [1, n] , ∀j = [1, m] называется произведением матрицы A размера m × l с элементами α jk ∀j = [1, m] , ∀k = [1, l ] B размера l × n с элементами β ki ∀k = [1, l ] , ∀i = [1, n] , где на матрицу l γ ji = ∑ α jk β ki ∀i = [1, n] , ∀j = [1, m] . k =1 Результат умножения матриц – матрица C – есть матрица раз- m × n при любом натуральном l , которая обозначается как C = A B . Правило нахождения компонентов произведения по мера компонентам сомножителей матричного произведения иллюстрирует рис. 5.1.1. Пример 5.1.1. Приведем результаты умножения матриц, имеющих не более чем пару строк или столбцов. 1°. Пусть размер A есть 2 × 2 , а размер B – 2 × 1 , тогда размер C будет 2 × 1 . 148 Аналитическая геометрия и линейная алгебра C = A = B = α11 α12 β11 α 21 α 22 β 21 = α11β11 + α12β 21 α 21β11 + α 22β 21 β11 β12 ... β1i ... β1n β21 β22 ... β2i ... β2n α11 α12 ... ... ... ... ... α1l α21 α22 ... ... ... ... ... α2l ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... αjl ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... αml ... ... ... ... ... ... ... βli ... βln ... ... αj1 αj2 ... ... αm1 αm2 βl1 βl 2 = γ11 γ12 ... γ1i ... γ1n γ21 γ22 ... γ2i ... γ2n ... ... ... ... ... γ ji ... γ jn ... ... ... ... ... γmi ... γmn ... ... γ j1 γ j2 ... ... γm1 γm2 . = l γji =∑αjk βki k=1 Рис. 5.1.1 2°. Если размер размер C = B A есть 2 × 2 , а размер B – 1× 2 , то C будет 1× 2 . A = β11 β12 α 11 α 21 = α 11β11 + α 21β12 α 12 = α 22 α 12 β11 + α 22 β12 . 149 Г л а в а 5 . Преобразования плоскости 3°. Наконец, пусть размер матрица A и B есть 2 × 2 , тогда C будет иметь размер 2 × 2. Замечания об умножении матриц Из определения произведения матриц непосредственно следует, что для матриц подходящих размеров: 1) умножение матриц некоммутативно, то есть в общем случае 2) A B ≠ B умножение матриц ассоциативно A ( B 3) A , C )=( A B ) C , умножение матриц обладает свойством дистрибутивности A ( B + C )= A B + A C . Отметим еще раз, что произведение двух матриц существует только тогда, когда число столбцов первого сомножителя равно числу строк второго. Легко убедиться, что умножение (как справа, так и слева) любой матрицы A на подходящего размера единичную матрицу (см. § 1.1) дает в результате ту же самую матрицу Определение 5.1.2. Матрица матрице A −1 A . называется обратной квадратной A , если выполнены равенства A −1 E A = A A −1 = E . 150 Аналитическая геометрия и линейная алгебра Обратная матрица существует не для произвольной квадратной A , необходимо матрицы. Для существования матрицы, обратной к det A ≠ 0 6. и достаточно, чтобы выполнялось условие Определение 5.1.3. A , для которой det A = 0 , называется Матрица вырожденной, а матрица, для которой det A ≠ 0 , – невырожденной. Лемма 5.1.1. Если обратная матрица существует, то она единственна. Доказательство. A имеет две об- Предположим, что невырожденная матрица A ратные: −1 1 A A −1 A и −1 1 2 . Тогда из равенств = E A и A −1 2 = E следует, что A A −1 1 − A A −1 = E − E = O . 2 Умножая слева обе части данного равенства на A −1 1 , полу- чаем A −1 1 и, учтя, что A ( A A −1 1 −1 1 − A −1 2 )= A −1 1 O = O A = E , приходим к равенству A −1 1 − A −1 2 = O . Лемма доказана. 6 Правило нахождения определителя квадратной матрицы порядка n приводится в главе 6. 151 Г л а в а 5 . Преобразования плоскости В частном случае, A = когда −1 det A ≠ 0 , матрица A α 11 α 12 α 21 α22 и если имеет вид α 22 − α12 1 ⋅ . (5.1.1) α11 det A − α 21 Для квадратных матриц порядка n справедливы7 следующие раA −1 = венства: B ) = det ( A ) det ( B ) ; det ( A det A Пример 5.1.2. −1 = 1 det A , если det A ≠ 0 . Используя матричные операции, систему линейных уравнений α11ξ1 + α12 ξ 2 = β1 , α 21ξ1 + α 22 ξ 2 = β 2 можно записать в виде x = ξ1 ; ξ2 x = b , где A b = β1 β2 ; A = а ее решение (если существует x = A Пример 5.1.3. −1 A α11 α 21 −1 α12 , α 22 ) – в виде b . Формулы перехода от одной декартовой системы координат к другой (1.8.2) с помощью матричных операций могут быть записаны в виде Для n = 2 эти соотношения проверяются непосредственно по определению 1.1.9, случай произвольного n рассматривается в главе 6. 7 152 Аналитическая геометрия и линейная алгебра → → g1′ → g2′ = S T → Теорема 5.1.1. ξ2 = S ξ3 ; → g3′ где → g2 g3 S ξ1′ β1 ξ ′2 + β 2 , ξ ′3 β3 ξ1 g1 – матрица перехода. Имеет место соотношение ( A B )T = B T A T . Доказательство. Будем предполагать, что размеры матриц A и B таковы, что произведения матриц, указанные в формулировке теоремы, существуют. Пусть числа и α ik , β kj , γ i j суть элементы матриц A , B C = A B соответственно. Тогда, согласно определе- нию 5.1.1, l γ ij = ∑ α ik β kj . k =1 Но, с другой стороны, по определению 1.1.8 операции транспонирования l l l k =1 k =1 k =1 γ iTj = γ j i = ∑ α j k β k i = ∑ α Tk j β iTk = ∑ β iTk α Tk j , откуда, учитывая определение 5.1.1, делаем заключение о справедливости утверждения теоремы. Теорема доказана. 153 Г л а в а 5 . Преобразования плоскости Заметим, что согласно правилу транспонирования произведения → → g1′ g1 → g2′ = S матриц равенство T → → → g 2′ → → g 3′ = g 1 может быть записано в виде → g3′ g1′ → g2 g3 → g2 → g3 S . Для дальнейших рассуждений нам будет полезно следующее вспомогательное утверждение. Лемма 5.1.2. Q Пусть произведение квадратной матрицы произвольный нулевой n -компонентный столбец x на есть n -компонентный столбец, тогда матрица Q нулевая. Доказательство. ω11 ω 21 Пусть Q = ... ω n1 ω12 ω 22 ... ωn2 ... ω1n ... ω 2 n . Выберем в качестве ... ... ... ω nn 0 ... столбец вида 1 , где единица стоит в строке с номером i. ... 0 x 154 Аналитическая геометрия и линейная алгебра Q Тогда ω1i 0 0 ... ... ... 1 = ωii = 0 и в силу произвольности i при... ... ... ω ni 0 0 ходим к заключению о справедливости утверждения леммы. Лемма доказана. Теорема 5.1.2. Для невырожденных одинакового размера квадрат- A и B справедливо соотношение ных матриц −1 B ) −1 = B ( A A −1 . Доказательство. 1°. Пусть произведение матрицы B ) −1 на некото- ( A рый n-компонентный столбец x есть столбец c . То- B ) −1 x = c или, что то же самое, гда ( A x = A B c (см. определения 5.1.1 и 5.1.2). 2°. С другой стороны, из последнего равенства получаем, что A и аналогично B −1 −1 x = B A −1 c x = c . 3°. Вычитая почленно равенства ( A B ) −1 x = c и B −1 A −1 x = c , 155 Г л а в а 5 . Преобразования плоскости в силу дистрибутивности матричного произведения приходим к соотношению B ) −1 − B (( A −1 A −1 ) x = o , которое по лемме 5.1.2 ввиду произвольности столбца x означает, что матрица ( A B ) −1 − B −1 A −1 нулевая. Теорема доказана. Задача 5.1.1. Проверить тождество ( A −1 T ) = ( A T ) −1 . Невырожденная квадратная матрица Определение 5.1.4. рой Q −1 Q , для кото- T = Q , называется ортогональной. Свойства ортогональных матриц, играющих важную роль во многих приложениях, можно сформулировать в виде следующих теорем. Теорема 5.1.3. Для ортогональной матрицы ство Q справедливо равен- det Q = ±1 . Доказательство. Умножая равенство слева на нию Q Q −1 = Q T последовательно справа и Q , в силу определения 5.1.2 приходим к соотношеT Q = Q Q det 2 Q = 1 , поскольку T = E . Откуда находим, что 156 Аналитическая геометрия и линейная алгебра - определитель произведения квадратных матриц одинакового размера равен произведению определителей сомножителей; - определитель матрицы не меняется при ее транспонировании; det E = 1 . - Теорема доказана. Теорема 5.1.4. Каждая ортогональная матрица второго порядка для которой виде Q , det Q = 1 , может быть представлена в cos ϕ − sin ϕ , где ϕ – некоторое число, а каsin ϕ cos ϕ ждая ортогональная матрица с cos ϕ sin ϕ det Q = −1 – в виде sin ϕ . − cos ϕ Доказательство. Q = Пусть матрица ω11 ω 21 ω12 ω 22 ортогональная, тогда должны быть справедливы равенства Q Q T = ω11 ω 21 ω12 ω11 ω 22 ω12 ω 21 = E ω 22 и, следовательно, 2 2 ω11 + ω12 ω11ω 21 + ω12 ω 22 1 0 ω11ω 21 + ω12 ω 22 = . 2 2 0 1 ω 21 + ω 22 Г л а в а 5 . Преобразования плоскости 157 Последнее матричное равенство может быть записано в виде системы скалярных условий 2 2 ω11 + ω12 =1, ω11ω 21 + ω12 ω 22 = 0 , ω2 + ω2 = 1 , 22 21 причем из этих равенств, как было показано при доказательстве теоремы 5.1.3, следует, что случай det Q = ±1 . Рассмотрим вначале det Q = 1 . Если из суммы первого и третьего уравнений системы вычесть удвоенное равенство ω11ω 22 − ω12 ω 21 = 1 , то мы получим 2 2 (ω11 + ω12 ) + (ω 221 + ω 222 ) − 2(ω11ω 22 − ω12 ω 21 ) = 0 или (ω11 − ω 22 ) 2 + (ω12 + ω 21 ) 2 = 0 , откуда следует, что ω11 = ω 22 , ω12 = −ω 21 . 2 2 ω11 + ω12 = 1 ; ω 221 + ω 222 = 1 имеем 2 2 оценки 0 ≤ ω11 ≤ 1 ; 0 ≤ ω 21 ≤ 1 , которые позволяют ввести Наконец, из условий обозначения матрицы Q , поскольку из полученных соотношений также следует, что Случай ω11 = cos ϕ , приводящие к требуемому виду ω 21 = sin ϕ 2 ω11 + ω 221 = 1 . det Q = −1 рассматривается аналогично. Теорема доказана. 158 Аналитическая геометрия и линейная алгебра Матрица перехода от одного ортонормированного базиса на плоскости к другому ортогональная. Следствие 5.1.1. Доказательство. В § 1.8 было показано, что S – матрица перехода от одной ортонормированной системы координат на плоскости к другой − может иметь один из двух следующих видов: cos ϕ − sin ϕ cos ϕ sin ϕ или , sin ϕ cos ϕ sin ϕ − cos ϕ где ϕ – угол между первыми базисными векторами. Но тогда матрица перехода S ортогональная в силу теоремы 5.1.4. Следствие доказано. § 5.2. Операторы и функционалы. Отображения и преобразования плоскости Вводимое в курсе математического анализа понятие функции (как правила, устанавливающего однозначное соответствие между числом, принадлежащим области определения, и числом, принадлежащим множеству значений) может быть естественным образом обобщено на случай, когда область определения и область значений не являются числовыми множествами. Определение 5.2.1. Будем говорить, что задан оператор  , действующий на множестве Ω со значениями в множестве Θ , если указано правило, по которому каждому элементу множества Ω поставлен в соответствие единственный элемент из множества Θ . 159 Г л а в а 5 . Преобразования плоскости Символически результат действия оператора y = Aˆ x,  обозначается так: x ∈ Ω, y ∈ Θ . Элемент y в этом случае называется образом элемента x , элемент x – прообразом элемента y . Определение 5.2.2. Если Θ – область значений некоторого оператора – является числовым множеством, то говорят, что на множестве Ω задан функционал. Функционалы обычно обозначаются так же, как и функции: например, y = Φ ( x ), x ∈ Ω . → Пример 5.2.1. 1°. Если каждому вектору x в пространстве постав→ лен в соответствие вектор y , являющийся ортого→ нальной проекцией вектора x на некоторую ось l , то говорят, что в пространстве задан оператор → Λ → y = Pr l x ортогонального проектирования векторов на ось l . В этом случае символически можно Λ записать, что 2°. Aˆ = Pr l . Каждой дифференцируемой на [α, β] функции f (τ) можно поставить в однозначное соответствие f ′(τ) – ее производную функцию, поэтому можно говорить об операторе дифференцирования d f (τ) , символически обозначаемом dτ d . как  = dτ f ′(τ) = 160 Аналитическая геометрия и линейная алгебра → Каждому вектору 3°. x в пространстве можно поста→ вить в однозначное соответствие число x – его длину. Очевидно, что данная зависимость является функционалом, заданным на множестве векторов. Для каждой непрерывной на 4°. [α, β] функции f (τ) β существует интеграл ∫ f (τ)dτ , который можно α β рассматривать как функционал Ф ( f ) = ∫ f (τ)dτ α на множестве функций, непрерывных на Определение 5.2.3. [α, β] . Оператором  , отображающим плоскость (или просто отображением плоскости) P на плоскость Q, называется правило, по которому каждой точке плоскости P поставлена в соответствие единственная точка плоскости Q . Отображение плоскости принято обозначать следующим образом: Aˆ : P → Q . Если точка M плоскости P отображается в точку M ∗ ∗ ˆ M (что иногда заплоскости Q, то это представляется как M = A писывают в виде зом точки M ∗ = Aˆ ( M ) ), при этом точка M ∗ является обра- M , а точка M – прообразом точки M ∗ . Определение 5.2.4. Aˆ : P → Q называется взаимно однозначным, если каждая точка плоскости Q имеет проОтображение образ и притом единственный. 161 Г л а в а 5 . Преобразования плоскости Определение 5.2.5. Отображение  плоскости преобразованием плоскости P в саму себя называется P. Определение 5.2.6. Последовательное выполнение преобразований M ∗ = Aˆ M и M ∗∗ = Bˆ M ∗ называется произведением (или композицией) этих преобразований. ∗∗ ˆ M. Произведение операторов записывается в виде M = Bˆ A Заметим, что в общем случае это произведение не коммутативно, но ассоциативно. Определение 5.2.7. Преобразованием, обратным взаимно однозначному Aˆ : P → P , называется оператор Aˆ : P → P , такой, что для каждой точки M плоскости P имеет место Aˆ −1 ( Aˆ M ) = M . преобразованию −1 Определение 5.2.8. Точка плоскости P , переводимая преобразованием  сама в себя, называется неподвижной точкой для  . Множество на P , состоящее из неподвижных точек для  , называется неподвижным для  . Множество точек P , переходящее при  само в себя, называется инвариантным множеством преобразования  . § 5.3. Линейные операторы на плоскости Пусть → на плоскости с декартовой системой координат → {O, g1 , g 2 } каждой ее точке M поставлена в однозначное соответ∗ ствие точка M , то есть согласно определению 5.2.6 162 Аналитическая геометрия и линейная алгебра ∗ ˆ M . Пусть коордизадано преобразование этой плоскости M = A натные представления радиусов-векторов этих точек суть → = rM g x y → и x∗ ∗ ∗ , тогда координаты x и y будут ∗ y = rM ∗ g x ∗ = Fx ( x , y ) некоторыми функциями от x и y ∗ , и потому равен y = Fy ( x , y ) Fx ( x , y ) x∗ ство = можно рассматривать как представление Fy ( x , y ) y∗ → оператора → → → rM ∗ = Aˆ rM в системе координат {O, g1 , g 2 } . Далее мы будем рассматривать частные, но важные для приложений виды функций Fx ( x , y ) и Fy ( x, y ) . → Определение 5.3.1. Оператор → rM ∗ = A$ rM называется линейным опера- тором, если в каждой декартовой системе координат → → {O, g1 , g 2 } он задается формулами x ∗ = α11 x + α12 y + β1 , ∗ y = α 21 x + α 22 y + β 2 . При помощи операций с матрицами линейный оператор может быть записан в виде x∗ = Aˆ y∗ Aˆ g g = β x + 1 , где матрица β2 y α11 α 21 α 12 α 22 163 Г л а в а 5 . Преобразования плоскости называется матрицей линейного оператора → ставлением A$ (координатным пред- → A$ ) в {O, g1 , g 2 } . → Определение 5.3.2. Оператор → rM ∗ = A$ rM называется линейным одно- родным оператором, если он удовлетворяет определению 5.3.1 и, кроме того, β1 = β 2 = 0. Если же β1 + β 2 > 0 , то оператор  называется неоднородным. Пример 5.3.1. К линейным однородным операторам относятся: - $ , действие которого сводится к оператор A умножению координат радиуса-вектора прообраза на фиксированные положительные числа, называемый “оператором сжатия к осям”, или просто “сжатием к осям”, имеющий матрицу Aˆ g = κ1 0 0 , где числа κ2 κ1 и κ 2 – коэффициенты сжатия; - - Теорема 5.3.1. оператор ортогонального проектирования радиусов-векторов точек плоскости на некоторую заданную ось, проходящую через начало координат; гомотетия с коэффициентом κ и с центром в начале координат. Для линейного однородного оператора вы соотношения: A$ справедли- 164 Аналитическая геометрия и линейная алгебра → → → → → → 1°°. Aˆ (r1 + r2 ) = Aˆ r1 + Aˆ r2 ∀ r1 , r2 . 2°°. Aˆ (λ r ) = λ Aˆ r ∀ r , λ . → → → Доказательство. В справедливости утверждения теоремы убедимся непосредственной проверкой, используя правила действия с матрицами. Например, для 1º имеем → → α Aˆ (r1 + r2 ) = 11 α 21 = α12 x1 ( α 22 + y1 α11 α12 x1 α 21 α 22 y1 + x2 )= y2 α11 α12 x2 α 21 α 22 y2 → → = Aˆ r1 + Aˆ r2 . Теорема доказана. Теорема 5.3.2. Если для некоторого оператора ношения 1°°. → → → A$ справедливы соот→ → → Aˆ (r1 + r2 ) = Aˆ r1 + Aˆ r2 ∀ r1 , r2 , → → → $ ( λ r ) = λ A$ r ∀ r , λ , 2°°. A то этот оператор линейный и однородный. Доказательство. → → → → ∗ → → ∗ $ r = x g + y g – соответстПусть r = x g1 + y g 2 и A 1 2 венно координатные разложения для прообраза и образа, тогда → → → → → → x ∗ g1 + y ∗ g 2 = A$ ( x g1 + y g 2 ) = x A$ g1 + y A$ g 2 . По теореме 1.5.1 существуют числа α 11 , α 12 , α 21 , α 22 такие, что → → → → → → Aˆ g1 = α11 g1 + α 21 g 2 и Aˆ g 2 = α12 g1 + α 22 g 2 . 165 Г л а в а 5 . Преобразования плоскости Тогда получаем → → → → x ∗ g 1 + y ∗ g 2 = x Aˆ g 1 + y Aˆ g 2 = → → = (α11 x + α12 y ) g1 + (α 21 x + α 22 y ) g 2 . → А в силу линейной независимости векторов α x∗ = 11 ∗ α 21 y x ∗ = α11 x + α12 y , или ∗ y = α 21 x + α 22 y → g1 и g 2 α12 α 22 x . y Теорема доказана. → → Отметим также, что для вектора = a , имеющего a g → ax в баay → → зисе {g1 , g 2 } , при любом линейном преобразовании образом является вектор с координатным представлением → = Aˆ a g a x∗ a ∗ y = α 11 α 12 ax α 21 α 22 ay  a . Из теорем 5.3.1 и 5.3.2 вытекают важные следствия. Следствие 5.3.1. Столбцами матрицы линейного однородного опера→ тора → A$ в базисе {g1 , g 2 } являются координатные → представления векторов Следствие 5.3.2. → A$ g1 и A$ g 2 . Каждому линейному однородному оператору преобразования плоскости в конкретном базисе соответствует однозначно определяемая квадратная матрица второго порядка, а каждая квадратная матрица второго порядка задает в этом базисе некоторый линейный однородный оператор. 166 Аналитическая геометрия и линейная алгебра Задача 5.3.1. Исходя из правил действия с матрицами, показать, что для линейных однородных операторов на плоскости справедливы утверждения: 1°. Матрица произведения линейных однородных операторов равна произведению матриц операторов- Aˆ Bˆ сомножителей: g = Aˆ Bˆ g g . A$ −1 есть оператор, обратный линейному $ , то однородному оператору A −1 A$ −1 = A$ . 2°. Если g g Выясним теперь, как изменится матрица линейного однородного оператора при замене базиса. Имеет место → Теорема 5.3.3. → Пусть в системе координат {O, g1 , g 2 } некоторый однородный линейный оператор имеет матрицу A$ → g → {O, g1′ , g 2′ } этот . Тогда в системе координат оператор будет иметь матрицу A$ где g′ = S −1 A$ S , g S – матрица перехода. Доказательство. Пусть в исходной системе координат действие линейного опера→ тора A$ задается формулой r ∗ = Aˆ g теме координат – → ∗ = Aˆ r g′ → перехода от ДСК → → r g , а в новой сисg → g′ r , и пусть S – матрица g′ → → {O, g1 , g 2 } к ДСК {O, g1′ , g 2′ } , такая, что 167 Г л а в а 5 . Преобразования плоскости → → → = S r r и r∗ = S g′ g → r∗ . g′ g Подставляя два последних соотношения в первое и принимая во внимание утверждение теоремы 1.8.2 о невырожденности матрицы перехода S −1 S (то есть существование матрицы ), по- лучаем, что → r∗ S → → = Aˆ S g g′ r r∗ = S или g′ −1 Aˆ g′ → g S r . g′ Наконец, вычитая последнее равенство почленно из равенства → r∗ = Aˆ g′ → → g′ r , в силу произвольности r (согласно g′ g′ лемме 5.1.2) приходим к соотношению Aˆ g′ = S −1 Aˆ S . g Теорема доказана. Следствие 5.3.3. Величина det Aˆ не зависит от выбора базиса. g Доказательство. Поскольку определитель произведения матриц равен произведению определителей сомножителей, то в силу теоремы 5.3.3 и S имеем невырожденности матрицы перехода det Aˆ = det ( S g′ = det S = Следствие доказано. 1 det S −1 −1 Aˆ S )= g det Aˆ det Aˆ g g det S = det S = det Aˆ g . 168 Аналитическая геометрия и линейная алгебра Задача 5.3.2. В ортонормированной системе координат найти матрицу оператора, ортогонально проектирующего радиусы-векторы точек координатной плоскости на прямую x + 3y − 2 = 0 . Решение. Пусть точка-прообраз M имеет радиус→ вектор r0 = x0 y0 , а ∗ точка M – образ точки M – соответственно ее радиус→ вектор r0∗ = x0∗ . y 0∗ Рис. 5.3.1 ∗ Из рис. 5.3.1 следует, что M есть точка пересечения прямой x + 3y − 2 = 0 и перпендикуляра к ней, проходящего через M. Поскольку нормальный вектор прямой x + 3y − 2 = 0 является направляющим вектором этого перпендикуляра, то уравнение последнего будет иметь вид x x 1 = 0 +τ . y0 y 3 Откуда следует, что координаты радиуса-вектора точки M ∗ будут удовлетворять системе уравнений 3 1 ∗ 9 x0∗ = x 0 + τ, x0 = x0 − y 0 + , ∗ 10 10 5 или y 0 = y 0 + 3τ, 3 1 3 x∗ + 3 y∗ − 2 = 0 y 0∗ = − x0 + y 0 + . 0 0 10 10 5 169 Г л а в а 5 . Преобразования плоскости Используя правила операций с матрицами, получаем окончательно, что 9 x0∗ = 10 ∗ 3 y0 − 10 − 3 10 1 10 1 x0 + 5 , 3 y0 5 то есть Aˆ e 9 = 10 3 − 10 − 3 10 1 10 . § 5.4. Аффинные преобразования и их свойства Линейные операторы, преобразующие плоскость саму в себя (то $ : P → P ) и имеющие обратный есть линейные операторы вида A оператор, играют важную с практической точки зрения роль и потому выделяются в специальный класс. Определение 5.4.1. Линейный оператор x∗ = Aˆ y∗ g β x + 1 , отоβ2 y бражающий плоскость P саму на себя, с матрицей Aˆ det g = α11 α 21 α11 α 21 α12 , для которой в любом базисе α 22 α12 ≠ 0 , называется аффинным преобα 22 разованием плоскости. 170 Аналитическая геометрия и линейная алгебра Теорема 5.4.1 (признак аффинности). Если для линейного преобразования плоскости det A$ g ≠ 0 в некоторой декартовой системе координат, то это условие будет выполнено и в любой другой декартовой системе координат. Доказательство. По следствию 5.3.3 определитель матрицы линейного оператора не зависит от выбора базиса, поэтому для аффинности линейного преобразования достаточно, чтобы det A$ g ≠ 0 хо- тя бы в одном базисе. Теорема доказана. Теорема 5.4.2. Каждое аффинное преобразование имеет единственное обратное, которое также является аффинным. Доказательство. Поскольку det Aˆ g ≠ 0 , то матрица Aˆ −1 существует, g единственна и невырожденная (см. § 5.1), а в силу теоремы 1.1.2 система линейных уравнений Aˆ g β x x∗ = ∗ − 1 β2 y y x всегда имеет единственное решение y для любого вектора x∗ . Но это означает, что между образами и прообразами y∗ 171 Г л а в а 5 . Преобразования плоскости аффинного преобразования существует взаимно однозначное соответствие, то есть для  существует единственное обратное аффинное преобразование, задаваемое формулами x = Aˆ y −1 g β ∗1 β1∗ x∗ + ∗ , где ∗ = − Aˆ β2 β2 y∗ −1 g β1 β2 . Теорема доказана. Задача 5.4.1. Определитель матрицы, полученной при решении задачи 5.3.2, оказался равным нулю. Сохранится ли верным это равенство, если произвольным образом изменить коэффициенты уравнения прямой, на которую выполняется ортогональное проектирование? Теорема 5.4.3. При аффинном преобразовании всякий базис переходит в базис, а для любых двух базисов существует единственное аффинное преобразование, переводящее первый базис во второй. Доказательство. Пусть аффинное преобразование задано формулами x ∗ = α11 x + α12 y + β1 , ∗ y = α 21 x + α 22 y + β 2 , тогда образами первой пары базисных векторов будут векторы → → → → → → g 1∗ = α 11 g 1 + α 21 g 2 ; g 2∗ = α12 g1 + α 22 g 2 . А поскольку det Aˆ = det α11 α 21 α12 ≠ 0, α 22 172 Аналитическая геометрия и линейная алгебра → ∗ → ∗ то векторы g1 и g 2 линейно независимы (теорема 1.6.2) и из них можно образовать базис. Сопоставляя определение 1.8.2 и следствие 5.3.1, замечаем, что → в том случае, когда базис → → {g1∗ , g 2∗ } является образом базиса → {g1 , g 2 } при аффинном преобразовании  , матрица перехо→ да от базиса → → → {g1 , g 2 } к базису {g1∗ , g 2∗ } S = Aˆ . g Но поскольку для любой пары базисов матрица перехода существует, единственна и невырождена, то и преобразование, переводящее первый базис во второй, существует, аффинное и единственное. Теорема доказана. Рассмотрим теперь вопрос о том, что происходит с различными геометрическими объектами на плоскости при ее аффинном преобразовании. Теорема 5.4.4. При аффинном преобразовании образом прямой линии является прямая. Доказательство. Пусть даны прямая x = x0 + τ p , где p и q − не равные нулю y = y0 + τ q одновременно координаты направляющего вектора прямой, и аф- x∗ = Aˆ финное преобразование y∗ β x + 1 . β2 y 173 Г л а в а 5 . Преобразования плоскости Тогда образом прямой будет множество точек плоскости с координатами x ∗ = (α11 x0 + α12 y 0 + β1 ) + (α11 p + α12 q)τ , ∗ y = (α 21 x0 + α 22 y 0 + β 2 ) + (α 21 p + α 22 q)τ . Заметим, что если α11 p + α 12 q + α 21 p + α 22 q > 0 , то мы имеем прямую. Предположим противное, пусть α11 p + α12 q = 0, α 21 p + α 22 q = 0, тогда в силу аффинности преобразования det α11 α 21 α12 ≠0 α 22 и по теореме 1.1.2 (Крамера) p = q = 0 есть единственное решение этой системы уравнений, что противоречит условию. Теорема доказана. Теорема 5.4.5. При аффинном преобразовании образом параллельных прямых являются параллельные прямые, общая точка пересекающихся прямых-прообразов переходит в точку пересечения их образов. Доказательство. Предположим, что пара параллельных прямых переведена аффинным преобразованием в пересекающиеся или совпадающие прямые. Рассмотрим одну из точек, общих для образов прямых. Поскольку аффинное преобразование взаимно однозначно, то прообраз общей точки единственный и должен принадлежать одновременно каждой из прямых-прообразов. Однако таких точек нет, ибо прямые-прообразы параллельны. Следовательно, образы параллельных прямых также параллельны. 174 Аналитическая геометрия и линейная алгебра Если же прямые-прообразы пересекаются, то в силу взаимной однозначности аффинного преобразования образом их точки пересечения может быть только точка пересечения образов этих прямых. Теорема доказана. Теорема 5.4.6. При аффинном преобразовании сохраняется деление отрезка в данном отношении. Доказательство. xi∗ Пусть точки M , i = 1, 2, 3, с координатами являются yi∗ ∗ i образами (рис. 5.4.1) точек M i , i = 1, 2, 3 соответственно Рис. 5.4.1 с координатами xi x2 − x1 . И пусть дано, что =λ и x3 − x 2 yi y 2 − y1 = λ , где λ ≠ −1 , нужно показать, что y3 − y 2 175 Г л а в а 5 . Преобразования плоскости x 2∗ − x1∗ y 2∗ − y1∗ = λ и = λ. y3∗ − y 2∗ x3∗ − x 2∗ Если аффинное преобразование задано в виде x ∗ = α11 x + α12 y + β1 , ∗ y = α 21 x + α 22 y + β 2 , то x 2∗ − x1∗ α11 ( x 2 − x1 ) + α12 ( y 2 − y1 ) = = x3∗ − x 2∗ α11 ( x3 − x 2 ) + α12 ( y 3 − y 2 ) = α11λ ( x3 − x 2 ) + α 12 λ ( y3 − y 2 ) = λ. α11 ( x3 − x 2 ) + α 12 ( y3 − y 2 ) y 2∗ − y1∗ Аналогично показывается, что ∗ = λ. y 3 − y 2∗ Заметим, что из полученных соотношений следует равенство отношения длин образов и отношения длин прообразов отрезков, лежащих на одной прямой. Проверим справедливость этих утверждений для случая ортонормированной системы координат: → M 1∗ M 2∗ → ∗ 3 M M = = ∗ 2 ( x 2∗ − x1∗ ) 2 + ( y 2∗ − y1∗ ) 2 ( x 3∗ − x 2∗ ) 2 + ( y 3∗ − y 2∗ ) 2 λ ( x 3∗ − x 2∗ ) 2 + ( y 3∗ − y 2∗ ) 2 ( x 3∗ − x 2∗ ) 2 + ( y 3∗ − y 2∗ ) 2 = λ = = λ ( x3 − x 2 ) 2 + ( y 3 − y 2 ) 2 ( x3 − x 2 ) 2 + ( y 3 − y 2 ) 2 → ( x 2 − x1 ) + ( y 2 − y1 ) 2 = 2 ( x3 − x 2 ) 2 + ( y 3 − y 2 ) 2 Теорема доказана. = M 1M 2 → M 2M 3 . = 176 Аналитическая геометрия и линейная алгебра Отметим также, что из теоремы 5.4.6 непосредственно вытекает, что при аффинном преобразовании отрезок прямой переходит в отрезок. Теорема 5.4.7. При аффинном преобразовании отношение длин образов двух отрезков, лежащих на параллельных прямых, равно отношению длин их прообразов. Доказательство. → M 1M 2 Пусть дано, что → = λ . Проведем прямую M 3 M 3′ , M 3M 4 параллельную M 4 M 2 . Поскольку при аффинном преобразовании образы параллельных прямых параллельны, то в силу теоремы 5.4.6 M 4 M 2 M 3′ M 3 и M ∗4 M ∗2 M ′3 ∗ M 3∗ – паралле- лограммы (рис. 5.4.2). Следовательно, → ∗ M 2 M 4∗ = → ∗ M 3 M 3′ ∗ Рис. 5.4.2 . 177 Г л а в а 5 . Преобразования плоскости Наконец, по теореме 5.4.7 получаем → → M 1∗ M 2∗ → ∗ 3 M M M 1∗ M 2∗ = ∗ 4 → ∗ 3 M′ M = ∗ 2 → → M 1M 2 M 1M 2 → M 3′ M 2 = → = λ . M 3M 4 Теорема доказана. При аффинном преобразовании всякая декартова система координат переходит в декартову систему координат, причем координаты образа каждой точки плоскости в новой системе координат будут совпадать с координатами прообраза в исходной. Теорема 5.4.8. Доказательство. Рис. 5.4.3 Пусть исходная система координат образована базисом → → {g1 , g 2 } и началом координат O . Согласно теореме 5.4.3 при аффинном преобразовании базис переходит в базис. Дополняя преобразованный базис образом начала координат O ∗ , мы по→ лучаем преобразованную систему координат → {O ∗ , g1∗ , g 2∗ } . 178 Аналитическая геометрия и линейная алгебра Пусть в исходной системе координаты точки-прообраза M суть x и y , а в преобразованной системе координаты точки∗ ∗ ∗ образа M суть x и y (рис. 5.4.3), тогда в силу теоремы 5.4.6 будут справедливы соотношения → → x = OM 1 → O ∗ M 1∗ = g1 g → → y = OM 2 → = x∗ ; → ∗ 1 O ∗ M 2∗ = g2 = y∗ . → ∗ 2 g После естественного обобщения на случай координат различных знаков получаем доказываемое свойство. Теорема доказана. Для выяснения геометрического смысла числовых характеристик матрицы аффинного преобразования переформулируем определение 1.8.3 ориентации пары неколлинеарных векторов на плоскости, используя операцию векторного произведения. → Определение 5.4.2. Пусть n есть некоторый нормальный вектор плоскости P , направленный в сторону наблюдателя. Тогда → → пару неколлинеарных векторов a и b назовем правоориентированной, если существует λ > 0 (и соответственно левоориентированной, если существует → → → λ < 0 ) такое, что [ a , b ] = λ n . 179 Г л а в а 5 . Преобразования плоскости Тогда будет справедлива ∗ 1°°. Теорема 5.4.9. При аффинном преобразовании величины S – площади образа параллелограмма и S – площади прообраза параллелограмма связаны соотношением S ∗ = det 2°°. α11 α12 α 21 α 22 ⋅S . При аффинном преобразовании ориентация образов пары неколлинеарных векторов совпадает с ориентацией прообразов, если det α11 α 21 α12 >0, α 22 и меняется на противоположную, если det α 11 α 21 α12 < 0. α 22 Доказательство. При аффинном преобразовании параллелограмм переходит в параллелограмм. Рассмотрим некоторый базис, образованный векто→ рами → g1 и g 2 , образы которых при аффинном преобразовании  есть соответственно → → → → → → → → g 1∗ = Aˆ g 1 = α11 g 1 + α 21 g 2 и g 2∗ = Aˆ g 2 = α12 g1 + α 22 g 2 , α11 , α12 , α 21 и α 22 $ , то есть являются элементами матрицы линейного оператора A где, согласно следствию 5.3.2, коэффициенты Aˆ g = α 11 α 21 α12 . α 22 180 Аналитическая геометрия и линейная алгебра По свойству векторного произведения (см. § 2.4) площадь па→ → равна → S = [ g1 , g 2 ] , а площадь параллелограмма, построен- → → → → ∗ 1 ∗ → ∗ 2 S = [ g , g ] . Но ного на образах базисных векторов, – → → g1 и g2 , раллелограмма, построенного на базисных векторах → → [ g1∗ , g 2∗ ] = [α11 g1 + α 21 g 2 , α12 g1 + α 22 g 2 ] = → → = (α11α 22 − α12 α 21 )[ g1 , g 2 ] = det Aˆ S ∗ = det Aˆ поэтому g det A$ det A$ пары g >0 g <0. и g → S , а (согласно определению 5.4.2) → ориентация → [ g1 , g 2 ] , векторов меняется → {g1 , g2 } не меняется при на противоположную при Наконец, отметим, что полученные соотношения будут выполнены для любого базиса, а значит, и для любого параллелограмма. Теорема доказана. Теорема 5.4.10. Для любой линии второго порядка, указанной в формулировке теоремы 4.4.1: - при аффинном преобразовании ее тип не может измениться; - найдется аффинное преобразование, переводящее ее в любую другую линию второго порядка этого же типа. Г л а в а 5 . Преобразования плоскости 181 Доказательство. Рассмотрим первое утверждение теоремы. 1°. В силу теорем 5.4.6 и 5.4.8 параллелограмм вместе со своей внутренней частью переходит в параллелограмм, и, значит, ограниченная линия перейдет в ограниченную. Отсюда следует, что эллипсы и точки могут переходить только в эллипсы и точки. С другой стороны, точка не может переходить в эллипс и наоборот, поскольку это противоречит свойству взаимной однозначности аффинного преобразования. 2°. Среди линий второго порядка только гиперболы и параллельные прямые имеют несвязанные ветви, то есть существует прямая, не пересекающая линию второго порядка, такая, что ветви этой линии расположены по разные стороны от прямой. Сохранение данного свойства при аффинном преобразовании очевидно. Параллельные же прямые не могут перейти в ветви гиперболы в силу теоремы 5.4.5. 3°. Среди непрямых линий второго порядка только парабола является неограниченной связной кривой. Следовательно, при аффинном преобразовании парабола может перейти только в параболу. 4°. Если линия второго порядка есть точка, прямая или же пара параллельных или пересекающихся прямых, то из утверждения теорем 5.4.4 и 5.4.5 вытекает, что их тип не может измениться. Рассмотрим второе утверждение теоремы. Из теорем 4.4.1 и 5.4.1 следует, что для каждой линии второго порядка может быть построено аффинное преобразование, приводящее уравнение линии к одному из следующих девяти видов: x ′ 2 + y ′ 2 = ±1 ; x ′ 2 − y ′ 2 = 1; x ′ 2 ± y ′ 2 = 0 ; y ′ 2 ± 1 = 0 ; y ′ 2 − 2 x ′ = 0 ; y ′ 2 = 0. (5.4.1) 182 Аналитическая геометрия и линейная алгебра Но поскольку уравнения любой пары линий, принадлежащих к одному и тому же типу, приводятся двумя различными аффинными преобразованиями к одному и тому же виду из списка (5.4.1), то в силу взаимной однозначности аффинного преобразования и очевидной аффинности произведения аффинных преобразований следует справедливость второго утверждения теоремы. Теорема доказана. Замечание: Теорема 5.4.11. изменение при аффинном преобразовании типа линии второго порядка оказывается также невозможным и для случая "пустых множеств". Справедливость этого утверждения будет показана в § 9.4 (теорема 9.4.1). Для всякого аффинного преобразования существует пара взаимно ортогональных направлений, которые переводятся данным аффинным преобразованием во взаимно ортогональные. Доказательство. Рассмотрим ортонормированную систему координат. Пусть пара исходных взаимно ортогональных направлений задается в ней → ненулевыми векторами ниями → = p e → p и q с координатными представлеξ η → и = q e η . −ξ Потребуем, чтобы их образы (ненулевые в силу аффинности) → ∗ = p e α11 α 21 α12 ξ α ξ + α12 η = 11 , α 22 η α 21ξ + α 22 η 183 Г л а в а 5 . Преобразования плоскости → ∗ = q e α11 α 21 α12 η α η − α12 ξ = 11 α 22 − ξ α 21η − α 22 ξ были также взаимно ортогональны. → Условие ортогональности векторов → p ∗ и q ∗ в базисе → → {e1 , e2 } имеет вид (α11ξ + α12 η)(α11η − α12 ξ) + + (α 21ξ + α 22 η)(α 21η − α 22 ξ) = 0 или 2 2 − (α11α12 + α 21α 22 )ξ 2 + (α11 − α12 + α 221 − α 222 )ξη + + (α11α12 + α 21α 22 )η 2 = 0, а после переобозначения коэффициентов − Uξ 2 + 2Vξη + Uη 2 = 0 . Рассмотрим следующие случаи: 1) Если U = V = 0 , то любая пара взаимно ортогональных векторов данным преобразованием переводится во взаимно ортогональную пару векторов. 2) Если U = 0 и V ≠ 0 , то векторов базисная. 3) Наконец, если → ξ η = 0 , то есть искомая пара U ≠ 0 , то отношение координат векторов → p и q находится из квадратного уравнения ξ 2V ξ ( η) 2 − U ( η ) − 1 = 0 , имеющего действительные решения вом U. Теорема доказана. ξ V V2 = ± ( η )1,2 U U 2 + 1 при любом ненуле- 184 Аналитическая геометрия и линейная алгебра § 5.5. Ортогональные преобразования плоскости Определение 5.5.1. Ортогональным преобразованием плоскости P называется линейный вида β x + 1 , матрица которого β2 y * x = Qˆ y* Q$ оператор e Qˆ e = ω11 ω 21 ω12 ω 22 ортогональная в любой ортонормированной системе координат. Заметим, что ортогональное преобразование является частным случаем аффинного преобразования, поскольку в силу теоремы 5.1.3 det Q$ имеет место либо e = 1 , либо det Q$ e = −1 . Помимо при- веденных в § 5.4 аффинных свойств, ортогональные преобразования обладают своими специфическими особенностями. Рассмотрим основные из них. Признак того, что некоторый линейный оператор является ортогональным, может быть сформулирован как Теорема 5.5.1. Линейный оператор на плоскости является ортогональным, если его матрица ортогональная хотя бы в одной ортонормированной системе координат. Доказательство. Пусть на плоскости P имеются два ортонормированных базиса → → → → {e1 , e2 } и {e1′ , e2′ } с матрицей перехода S . Согласно следствию 5.1.1, эта матрица также ортогональная и для нее справедли- S во равенство → гональна в → −1 = S T , и пусть матрица оператора {e1 , e2 }, то есть для нее Qˆ −1 e = Q T e . Q$ орто- 185 Г л а в а 5 . Преобразования плоскости → Q$ , согласно теореме 5.3.3, будет иметь вид оператора Qˆ Qˆ e′ −1 e′ −1 = S −1 e′ Qˆ e S . Найдем в новом базисе матрицу . Используя теоремы 5.1.1 и 5.1.2, а также ортогональ- S и Q$ e , получим ность матриц Qˆ → {e1′ , e2′ } , в котором матрица линейного Перейдем к базису =( S = S −1 =( S T Но равенство −1 Qˆ Qˆ Qˆ Qˆ −1 e e −1 e′ e S ) −1 = S S = S T T e′ Qˆ e ( S −1 −1 ) = T −1 Qˆ T e S ) T = Qˆ e′ . означает, что матрица линейного → оператора −1 T Qˆ e ( S ) T = S )T = ( S = Q −1 → Q̂ ортогональная и в базисе {e1′ , e2′ } . Теорема доказана. Теорема 5.5.2. В ортонормированной системе координат ортогональное преобразование плоскости сохраняет: 1) скалярное произведение векторов; 2) длины векторов и расстояния между точками плоскости; 3) углы между прямыми. Доказательство. 1°. Пусть дано ортогональное преобразование плоскости матрицей Q̂ Q̂ с в ортонормированной системе координат e 186 Аналитическая геометрия и линейная алгебра → → {O, e1 , e2 } . Тогда, как было показано в § 2.3, скалярное про→ → a и b с координатными представлениями → η1 и b = в ОНБ выражается в следуюη2 e изведение векторов → = a e ξ1 ξ2 щем виде: → → ( a , b ) = ξ1η1 + ξ 2 η 2 = ξ1 → η1 = a η2 ξ2 T → b . e e → Тогда для скалярного произведения образов векторов принимая во внимание ортогональность матрицы → a и b, Q̂ e , полу- чаем → → T → → (Qˆ a , Qˆ b ) = Qˆ a = Qˆ b e e → = ( Qˆ e → T = a a ) T Qˆ Qˆ → T e → T = a e T −1 Qˆ e → e → = b e → T → E = b e = a b e → → Qˆ e Qˆ = b e e = a → e e → → → → = ( a , b ). b e → → → e ˆ a , Qˆ b ) = ( a , b ) ∀ a , b и означает, что при Равенство (Q ортогональном преобразовании плоскости скалярное преобразование сохраняется в любом ортонормированном базисе. 187 Г л а в а 5 . Преобразования плоскости 2°. Из сохранения при ортогональном преобразовании скалярного произведения для любой пары векторов следует сохранение длин векторов, поскольку → → → → → → Qˆ a = (Qˆ a , Qˆ a ) = ( a , a ) = a → ∀a. 3°. Тогда в силу 2° при ортогональном преобразовании равные треугольники переходят в равные, и величины углов между векторами на плоскости будут сохраняться. Теорема доказана. Используя свойства ортогональных преобразований, можно показать, что для аффинных преобразований справедлива следующая важная теорема. Теорема 5.5.3. Каждое аффинное преобразование может быть представлено в виде произведения ортогонального преобразования и двух сжатий по взаимно ортогональным направлениям. Доказательство. 1°. В силу следствия 5.3.2, а также справедливости утверждений задачи 5.3.1 и примера 5.3.1 нам достаточно убедиться, что матрица каждого аффинного преобразования в любом орто→ → нормированном базисе {e1 , e2 } может быть представлена в виде произведения ортогональной матрицы и диагональной матрицы с положительными значениями диагональных элементов. 2°. По теореме 5.4.11 существует ортогональный (но, вообще го→ воря, не нормированный) базис → {ε1 , ε 2 } , в который данное 188 Аналитическая геометрия и линейная алгебра  переведет исходный ортонорми- аффинное преобразование → → {e1 , e2 } . При этом существуют положительные нормирующие множители κ1 и κ 2 , такие, что рованный базис → → → ε ε e1′ = 1 ; e2′ = 2 ; κ1 κ2 → → то есть → κ1 = ε1 ; → {e1′ , e′2 } – ортонормированный базис. 3°. С другой стороны, линейное преобразование → → Q̂ , переводящее → {e1 , e2 } в ортонормированный ба- ортонормированный базис зис → κ2 = ε2 , → {e1′ , e′2 } , очевидно, ортогональное и имеет в исходном баQ̂ e . Тогда будут справедливы зисе ортогональную матрицу соотношения → κ = 1 0 ε1 → ε2 → e1′ 0 κ2 → e′2 → → e1′ ; = Qˆ → e2′ → e1 T ; → e e2 → ε1 = Aˆ → ε2 T e e1 → , e2 из которых следует равенство ( Aˆ T e − κ1 0 0 κ2 → Qˆ T e ) → e1 o . = → o e2 → Тогда в силу линейной независимости базисных векторов → → {e1 , e2 } мы имеем Aˆ T e = κ1 0 0 κ2 Qˆ T или после e транспонирования обеих частей этого равенства 189 Г л а в а 5 . Преобразования плоскости Aˆ = Qˆ e κ1 0 e 0 . κ2 Таким образом, аффинное преобразование представимо в виде произведения ортогонального преобразования и оператора "сжатия к осям" (см. пример 5.3.1). Теорема доказана. § 5.6. Понятие группы Определение 5.6.1. Множество G называется группой по отношению к заданной операции, если любым двум его элементам x и y поставлен в соответствие третий элемент этого же множества, называемый произведением и обозначаемый xy , и если выполняются следующие условия: 1) x ( yz ) = ( xy ) z ; 2) существует элемент 3) для каждого кой, что ∀x∈G e , такой, что xe = ex = x ; x существует элемент x −1 , таx −1 x = e . Если, кроме того, xy = yx мутативной, или абелевой. Пример 5.6.1. ∀x, y ∈ G , то группа называется ком- К группам относятся, например: 1) множество вещественных чисел относительно операции сложения образует группу, где e – число 0 ; 190 Аналитическая геометрия и линейная алгебра 2) множество положительных вещественных чисел относительно операции умножения, где e – число 1; 3) множество поворотов плоскости вокруг фиксированной точки относительно операции композиции; множество аффинных преобразований плоскости относительно операции композиции. 4) Г л а в а 6 . Системы линейных уравнений 191 Глава 6 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ § 6.1. Определители Рассмотрим множество, состоящее из натуральных чисел 1, 2, 3, ... , n . Будем обозначать перестановки этих чисел (то есть последовательную их запись в некотором порядке без повторений) как {k1 , k 2 , k 3 ,..., k n } . Напомним, что полное число таких различных перестановок равно n! . Определение 6.1.1. Будем говорить, что числа k i и k j образуют в перестановке беспорядок (нарушение порядка, или инверсию), если при i < j имеет место k i > k j . Полное число беспорядков в перестановке {k1 , k 2 , k 3 ,..., k n } будем обозначать Б( k1 , k 2 ,..., k n ) . Например, Б(3, 1, 4, 2) = 3 . Пусть дана квадратная матрица α11 α 21 A = α 31 ... α n1 α12 α 22 α 32 ... α n2 α 13 α 23 α 33 ... α n3 ... ... ... ... ... α1n α 2n α 3n = α ij ; i, j = [1, n]. ... α nn 192 Аналитическая геометрия и линейная алгебра Определение 6.1.2. Детерминантом (или определителем) квадратной A матрицы размера n × n называется число det A , получаемое по формуле det A = ∑ (−1) Б ( k1 , k 2 , k 3 ,...,k n ) α1k1 α 2 k 2 ...α nk n , { k1 , k 2 , k3 ,...,k n } где {k1 , k 2 , k 3 ,..., k n } – всевозможные различные перестановки, образованные из номеров столбцов матрицы A . Поскольку в данном определении указано, что сумма берется по всем возможным различным перестановкам, то число слагаемых равно n!. Из определения 6.1.2 также вытекает, что каждое слагаемое содержит в качестве сомножителя по одному элементу матрицы из каждого столбца и каждой строки. Задача 6.1.1. Проверить совпадение определения 6.1.2 и определения детерминантов матриц второго и третьего порядков 1.1.9 и 1.1.10. § 6.2. Свойства определителей При транспонировании матрицы ее определитель Теорема 6.2.1. не меняется. Доказательство. Общий вид слагаемого в формуле определителя транспонированной матрицы ( −1) B = A T имеет вид Б( m1 , m2 ,...,mn ) β1m β 2 m ...β nm , 1 2 n 193 Г л а в а 6 . Системы линейных уравнений но, учитывая, что det A T β k mk = α mk k , получим = ∑ (−1) Б ( m1 , m2 ,...,mn ) { m1 , m2 ,...,mn } α m11α m2 2 ...α mn n . Упорядочим сомножители каждого слагаемого по номерам строк, то есть приведем их к виду (−1) Б( m1 , m2 ,...,mn ) α1k1 α 2 k 2 ... α nk n , где 1, 2, 3, ... , n – номера строк, а k1 , k 2 , k 3 ,..., k n – номера соответствующих столбцов. Отметим, что для введенных обозначений имеет место очевидное равенство: k m = i ∀i и при выполненном изменении i порядка сомножителей для каждого слагаемого в формуле определителя имеет место равенство Б( m1 , m2 ,..., mn ) = Б(k1 , k 2 ,..., k n ) . mi и m j дают беспорядок, то есть Действительно, пусть mi > m j при i < j , тогда дают беспорядок и числа k mi и k m j , поскольку ∀i : k mi = i , и, значит, будет справедливо неравенство при k mi = i < j = k m j mi > m j . Заметим, что верно и обратное утверждение. Окончательно получаем det A T = ∑ (−1) Б( k1 , k 2 ,...,k n ) α1k1 α 2 k 2 ...α nk n = det A . {k1 , k 2 ,...,k n } Теорема доказана. Замечание 6.2.1. Утверждение теоремы 6.2.1 допускает следующую наглядную интерпретацию. Выделим в матрице A элементы, входящие в неко- торое слагаемое определения 6.1.2, и соединим их от- 194 Аналитическая геометрия и линейная алгебра резками прямых, как показано на рис. 6.2.1. Заметим, что пара элементов α iki и α jk j дает беспоря- α11 α 21 α 31 K α n1 α12 α 22 α 32 K α n2 α13 α 23 α 33 K α n3 K K K K K α1n α 2n α 3n K α nn док, если соединяющий их отрезок имеет “положительный” наклон, то есть праРис. 6.2.1 вый конец отрезка расположен выше левого. Очевидно, что при транспонировании квадратной матрицы число отрезков с “положительным” наклоном не меняется, поэтому не меняется и знак каждого слагаемого в формуле 6.1.2, и, следовательно, значение определителя сохраняется. Следствие 6.2.1. Всякое свойство определителя матрицы, сформулированное для ее столбцов, справедливо для ее строк, и наоборот. Теорема 6.2.2. При перестановке двух столбцов матрицы знак ее определителя меняется на противоположный. Доказательство. Рассмотрим вначале случай, когда переставляются соседние столбцы. Поскольку общий вид слагаемых в выражении для определителя дается формулой ∑ (−1) Б( k1 , k 2 ,...,k n ) α1k1 α 2 k 2 ...α nk n , { k1 , k 2 ,...,k n } то достаточно показать, что число беспорядков изменится при перестановке соседних столбцов на единицу. Г л а в а 6 . Системы линейных уравнений 195 Рассмотрим перестановку чисел {k1 , k 2 , ... k i , k i +1 , k i + 2 ... , k n } . Если в ней поменять местами числа ki и ki+1, то число беспорядков, образуемых числами {k1 , k 2 ,...k i −1 , k i + 2 ,..., k n } , останется прежним, а за счет изменения порядка следования чисел ki и ki +1 общее число беспорядков изменится на единицу. Это означает, что знак каждого слагаемого в формуле определителя изменится на противоположный и, следовательно, изменит знак и весь определитель. Наконец, если требуется поменять местами столбцы, между которыми находится l столбцов, то для этого потребуется l + l + 1 = 2l + 1 перестановок соседних столбцов, но по2 l +1 = −1 , то знак определителя изменится на скольку ( −1) противоположный. Теорема доказана. Следствие 6.2.2. Определитель матрицы, содержащей два одинаковых столбца, равен нулю. Доказательство. При перестановке одинаковых столбцов значение определителя, с одной стороны, не меняется, но, с другой стороны, это значение должно изменить знак. Поэтому данный определитель может равняться только нулю. Следствие доказано. Теорема 6.2.3 (линейное свойство определителя). Если k -й столбец матрицы задан в виде линейной комбинации некоторых "новых" столбцов, то ее определитель представим в виде той же линейной комбинации определителей матриц, k -ми столбцами которых являются соответствующие "новые" столбцы из исходной линейной комбинации. 196 Аналитическая геометрия и линейная алгебра Доказательство. Пусть в матрице A k -й столбец состоит из элементов α α ik = λβ ik + µ γ ik , где i = 1, 2, K , n . Тогда справедливы равенства (−1) Б ( k1 ,k 2 ,...,k n ) α1k1 α 2 k 2 ...α ik ...α nk n = = (−1) Б( k1 , k 2 ,...,k n ) α 1k1 α 2 k 2 ...(λβ ik + µ γ ik )...α nk n = = (−1) Б( k1 , k 2 ,...,k n ) α 1k1 α 2 k 2 ...λβ ik ...α nk n + + (−1) Б ( k1 ,k 2 ,...,k n ) α1k1 α 2 k 2 ...µ γ ik ...α nk n . n! слагаемых в формуле для содержит точно по одному элементу из k -го столб- А поскольку каждое из det A ца, то α det A столбцы матриц элементов α = λ ⋅det A A β и A β γ + µ⋅det A γ , где k − ыe соответственно состоят из β ik и γ ik , i = 1, 2, K , n . Теорема доказана. Следствие 6.2.3. При вычислении определителя из столбца матрицы можно выносить общий множитель. Следствие 6.2.4. Если к некоторому столбцу матрицы прибавить линейную комбинацию остальных ее столбцов, то определитель не изменится. Доказательство. Действительно, определитель, получившийся в результате данной операции с матрицей, можно (по теореме 6.2.3) представить в виде линейной комбинации исходного определителя и линейной комбинации определителей матриц, имеющих одинаковые столбцы. Последние равны нулю по следствию 6.2.2. Следствие доказано. 197 Г л а в а 6 . Системы линейных уравнений Определитель произведения матриц размера равен произведению их определителей, то есть Теорема 6.2.4. n×n det ( A B ) = det A ⋅ det B . Доказательство. 1°. Обозначим C C = A B . Пусть матрицы имеют соответственно элементы A , B и α ij , β kl и γ pq . Тогда n по определению 5.1.1 γ pq = ∑ α pj β jq , и потому j =1 det C = α 11β11 + α 12 β 21 + ... + α 1n β n1 = det ... α 11β1n + ... + α 1n β nn α 21β11 + α 22 β 21 + ... + α 2 n β n1 ... α 21β1n + ... + α 2 n β nn . ... ... ... α n1β11 + α n 2 β 21 + ... + α nn β n1 ... α n1β1n + ... + α nn β nn Введем в рассмотрение специальный тип перестановок натуральных чисел 1, 2, 3, ... , n , в которых допускаются повторения одинаковых чисел. Такие перестановки условимся обозначать как [i1 , i 2 , i3 ,..., i n ] . По линейному свойству определителя (теорема 6.2.3) det C = = = ∑β β i2 2 ... β in n det i1 1 [ i1 ,i2 ,...,in ] ∑β i1 1 [ i1 ,i2 ,...,in ] α 1i1 α1i2 ... α1in α 2i1 α 2 i2 ... α 2in ... ... α ni1 α ni2 β i2 2 ... β in n det A∗ [ i1 ,i2 ,...,in ] ... ... ... α nin . = 198 Аналитическая геометрия и линейная алгебра Поскольку перестановки [i1 , i 2 , i3 ,..., i n ] (в отличие от {i1 , i 2 ,..., i n } ) могут содержать одинаковые числа, то общее n число слагаемых в полученной сумме равно n , но ненулевых среди этих слагаемых в силу следствия 6.2.2 только n! . 2°. Заметим, что поскольку матрицы тех же столбцов, что и A∗ {i1 ,i2 ,...,in } составлены из A , но записанных в разном поряд- ке, то их определители могут отличаться в силу теоремы 6.2.2 только знаком. Перестроим каждую из матриц A∗ {i1 ,i2 ,...,in } , переставив ее столбцы ik ; k так, чтобы каждый столбец с индексом = [1, n] был расположен слева от столбцов с большими индексами. В итоге этой операции столбцы будут полностью упорядочены, для чего потребуется число перестановок столбцов, равное числу беспорядков в перестановке {i1 , i2 ,..., in } , и, следовательно, для каждой матрицы A∗ {i1 ,i2 ,...,in } будет справедливо соотношение det A∗ {i1 ,i2 ,...,in } = ( −1) Б ( i1 ,i2 ,...,in ) det A 3°. Подставляя это соотношение в выражение для . det C , полу- чаем det C = det A ∑ (−1) Б ( i1 ,i2 ,...,in ) {i1 ,i2 ,...,in } = det A ⋅ det B , T β i11β i2 2 ...β in n = 199 Г л а в а 6 . Системы линейных уравнений что в силу теоремы 6.2.1 означает det ( A B ) = det A ⋅ det B . Теорема доказана. § 6.3. Разложение определителей n -го порядка A строки с нои столбцы с номерами j1 , j 2 ,..., j k , где Выберем в квадратной матрице i1 , i 2 ,..., i k 1≤ k ≤ n. мерами Определение 6.3.1. Детерминант квадратной матрицы порядка k , образованной элементами, стоящими на пересечении строк i1 , i 2 ,..., i k и столбцов j1 , j 2 ,..., j k , называется минором k -го порядка и обозначается j , j2 ,..., jk M i 1, i ,..., . ik 1 2 Определение 6.3.2. Детерминант квадратной матрицы порядка n − k , образованной элементами, остающимися после вычеркивания строк i1 , i 2 ,..., i k и столбцов j1 , j 2 ,..., j k , называется минором, дополнительным к минору 2 ,..., j k M i j1, i, j,..., , и обозначается i 1 2 k j , j ,..., j M i 1,i 2,...,i k . 1 2 k Выберем в матрице A i -ю строку и j -й столбец, на пересече- нии которых расположен элемент α ij . Удалим из строку и столбец, рассмотрим квадратную матрицу (n − 1) × (n − 1) . A выбранные A+ размера 200 Аналитическая геометрия и линейная алгебра Детерминант матрицы Определение 6.3.3. тельным минором A+ называется дополни- j M i элемента α ij . Сгруппируем в определении 6.1.2 – детерминанта матрицы все A – (n − 1)! слагаемых, содержащих элемент α ij , и вынесем его за скобки. Получим выражение вида det A = α ij Dij + K . Число Определение 6.3.4. Dij называется алгебраическим дополнением элемента α ij . Заметим, что по определению 6.1.2 имеют место равенства n n j =1 k =1 det A = ∑ α ij Dij = ∑ α kj Dkj ∀j = [1, n] , ∀i = [1, n], (6.3.1) которые можно использовать для вычисления определителей квадратных матриц, находя значения алгебраических дополнений при помощи соотношений, которые устанавливает Теорема Справедливы равенства 6.3.1. Доказательство. Dij = (−1) i + j M i . j 1°. По определению детерминанта 6.1.2 det A = α11 ∑ (−1) Б (1, k 2 , k 3 ,...,k n ) α 2 k 2 ...α nk n + K , {1, k 2 , k3 ,...,k n } то есть D11 = ∑ (−1) Б ( k 2 ,...,k n ) α 2 k 2 α 3k3 ...α nk n , поскольку { k 2 ,...,k n } очевидно, что Б(1, k 2 , k 3 ,..., k n ) = Б(k 2 , k 3 ,..., k n ) , 201 Г л а в а 6 . Системы линейных уравнений но тогда выражение для теля матрицы порядка D11 совпадает с формулой определи- n − 1 , получаемой из A вычеркива- нием первого столбца и первой строки. Следовательно, 1 D11 = M 1 . A ′ , переместив элемент α ij мат- 2°. Построим новую матрицу A в ее левый верхний угол, переставив i-ю строку на первое место, для чего потребуется i − 1 перестановок, и переставим на первое место j-й столбец, что потребует j − 1 перерицы становок. Тогда определитель перестроенной матрицы A′ равен det A ′ = ( −1) i −1+ j −1 det A = ( −1) i + j det A . Согласно линейному свойству определителя (теорема 6.2.3) данное соотношение будет также выполняться и для каждого из его слагаемых, а значит, в силу формул (6.3.1) и для каждого алгебраического дополнения Dij . Поэтому справедливо равенство ′ . Dij = (−1)i + j D11 3°. Наконец, очевидно, что значение дополнительного к нора не зависит от положения j α ij в матрице A′ , и потому 1 M i = M ′1 . 4°. Учитывая полученные соотношения j 1 M i = M ′1 = D11′ = (−1) i + j Dij , j приходим к равенству Теорема доказана. α ij ми- Dij = (−1) i + j M i . 202 Аналитическая геометрия и линейная алгебра Следствие 6.3.1. Разложение определителя по i -у столбцу имеет вид n det A = ∑ (−1) k +i α ki M k i k =1 или n det A = ∑ (−1) k +i M ki M k . i k =1 Для практических приложений особо полезной является Теорема 6.3.2. Для любой квадратной матрицы A имеет место равенство n ∑α i =1 где ij Dis = δ js ⋅ ∆ , 1 , j = s, ∆ = det A и δ js = – символ Кро0 , j ≠ s некера (см. § 2.2). Доказательство. По определению 6.3.4 алгебраического дополнения имеем det A = α1 j D1 j + α 2 j D2 j + K + α nj Dnj , то есть утверждение теоремы для случая j = s справедливо. Пусть теперь j ≠ s . Тогда выражение α1 j D1s + α 2 j D2 s + ... + α nj Dns можно рассматривать как разложение по s-му столбцу определителя матрицы, у которой s-й столбец совпадает с j-м столбцом. Но такой определитель равен нулю по следствию 6.2.2. Теорема доказана. 203 Г л а в а 6 . Системы линейных уравнений Следствие 6.3.2. A невырожденна, то Если квадратная матрица элементами ее обратной матрицы A −1 являются (−1) i + j M j ; i, j = [1, n] . ∆ i числа β ij = Доказательство. Найдем произведение матриц A и B , элементы которых α i j и β i j ; i, j = [1, n] . Пусть γ pq – элемент произведения A и B , тогда, согласно определению 5.1.1 и теореме 6.3.2, n γ pq = ∑ α pj β jq j =1 = (−1) j + q M q 1 n =∑ α pj = ∑ α pj Dqj = ∆ ∆ j =1 j =1 j n 1 ⋅ ∆ ⋅ δ pq = δ pq ; i, j = [1, n] . ∆ Аналогичное соотношение получается и для произведения B A и по определению 1.1.4 A B = B A = E , но тогда, согласно определению 5.1.2 и лемме 5.1.1, B = A −1 . Следствие доказано. Проверьте самостоятельно справедливость формулы (5.1.1). Обозначим I = i1 + i2 + ... + ik и J = j1 + j 2 + ... + j k , тогда оказывается справедливой обобщающая следствие 6.3.1 204 Теорема 6.3.3 (Лапласа). Аналитическая геометрия и линейная алгебра j1 , j2 ,..., jk Для фиксированного набора столбцов имеет место равенство det A = ∑ (−1) I +J j1 , j2 ,..., jk 2 ,..., j k M i1j1,i,2j,..., ik M i1 ,i2 ,...,ik . {i1 ,i2 ,...,ik } Отметим, что суммирование выполняется по всем возможным перестановкам номеров строк i1 , i 2 ,..., i k . Задача 6.3.1. Найти определитель матрицы n-го порядка: x a a ... a a ∆ n = det a x a a ... a x ... a . ... ... ... ... ... a a a ... x Решение. 1°. Заметим, что сумма элементов каждого столбца матрицы одинакова и равна x + a ( n − 1) . Поэтому, прибавив к первой строке сумму остальных строк и вынося общий множитель из первой строки, мы получим матрицу с тем же определителем (см. следствия 6.2.4 и 6.2.3): 1 1 1 ... 1 a x a ... a ∆ n = ( x + a (n − 1)) ⋅ det a a x ... a . ... ... ... ... ... a 2°. a a ... x Вычитая из каждой строки, начиная со второй, первую строку, умноженную на a , получим 205 Г л а в а 6 . Системы линейных уравнений 1 1 1 ... 1 0 x−a 0 ... 0 x − a ... 0 ∆ n = ( x + a (n − 1)) ⋅ det 0 0 ... ... ... ... 0 0 0 ... x − a . ... Последовательно применив n − 1 раз следствие 6.3.1 для разложения определителя по первому столбцу, приходим к выражению 3°. ∆ n = ( x + a (n − 1))( x − a ) n −1 . § 6.4. Правило Крамера Будем рассматривать систему вестными: n линейных уравнений с n неиз- α11ξ 1 + α12 ξ 2 + ... + α1n ξ n = β 1 , α ξ + α ξ + ... + α ξ = β , 21 1 22 2 2n n 2 ............................................... α n1 ξ 1 + α n 2 ξ 2 + ... + α nn ξ n = β n n в неразвернутом виде ∑ α ji ξ i = β j ; (6.4.1) j = [1, n] или же в матрич- i =1 A ной форме компоненты x = b , где квадратная матрица A имеет α ji , а столбцы x и b – соответственно ξ i и β j . Определение 6.4.1. Упорядоченный набор чисел {ξ 1 , ξ 2 ,..., ξ n } будем называть решением системы линейных уравнений, если при подстановке этих чисел в каждое из уравнений системы мы получаем тождество. 206 Аналитическая геометрия и линейная алгебра Имеет место Теорема 6.4.1 (правило Крамера). Для того чтобы система линейных уравнений (6.4.1) имела единственное решение, необходимо и достаточно, чтобы ∆ = det A ≠ 0 , и в этом случае реше- ние данной системы будет иметь вид ξi = где ∆i ; i = 1,2,..., n , ∆ ∆ i – определитель матрицы, получаемой из мат- рицы A заменой ее i -го столбца на столбец своb : бодных членов α11 α ∆ i = det 21 ... α n1 α12 α 22 ... α n2 ... β1 ... β 2 ... ... ... β n ... α1n ... α 2 n . ... ... ... α nn ↑ i -й столбец Доказательство. 1°. Получим вначале утверждение теоремы в предположении, что ξ1 ξ2 система (6.4.1) имеет решение x = , то есть когда вы... ξn полняются равенства n ∑α i =1 ji ξ i = β j ; j = [1, n] . 207 Г л а в а 6 . Системы линейных уравнений j = [1, n] обе части этих равенств на алгебраическое дополнение D jk и просуммировав результаты умножения по j , получим Умножив последовательно для всех n n n j =1 i =1 j =1 ∑ D jk (∑ α ji ξ i ) = ∑ β j D jk ∀k = [1, n]. Изменим порядок суммирования (то есть выполним перегруппировку слагаемых) в левой части этого равенства: n n ∑ (∑ α i =1 j =1 n ji D jk )ξ i = ∑ β j D jk . j =1 Но выражение в круглых скобках равно ∆⋅δ ik (по теореме 6.3.2), поэтому, учитывая, что n n j =1 i =1 ∑ β j D jk = ∆ k и ∆∑ δ ik ξ i = ξ k ∆ k , получаем ξ k ∆ = ∆ k , k = [1, n] . Или окончательно ξk = ∆k ∀k = [1, n] . ∆ (6.4.2) Наконец, заметим, что из соотношений ξ k ∆ = ∆ k , k = [1, n] в предположении ∆ ≠ 0 следует, что решение, определяемое формулами (6.4.2), существует и единственно. 2°. Докажем теперь, что в условиях теоремы набор чисел { ξi = ∆k , i = [1, n] } ∆ есть решение данной системы линейных уравнений. Убедимся в этом, подставив значения ξ i в левые части исходной системы линейных уравнений (6.4.1): 208 Аналитическая геометрия и линейная алгебра n ∑ α ji i =1 n n ∆i 1 n 1 n = ∑ α ji (∑ β k Dki ) = ∑ β k (∑ α ji Dki ) = ∆ ∆ i =1 ∆ k =1 k =1 i =1 n 1 = ∑ β k δ kj ∆ = β j , j = [1, n]. ∆ k =1 Для получения последнего равенства мы снова изменили порядок суммирования и воспользовались теоремой 6.3.2. Теорема доказана. § 6.5. Ранг матрицы Рассмотрим матрицу A размера m × n . Пусть 1 ≤ k ≤ min{m, n} . A k фиксированных столбцов и строк, на пересечении которых стоит матрица минора порядка k . Пусть при данном k все миноры k -го порядка равны нулю, тогда будут равны нулю и все миноры порядка выше, чем k , поскольку каждый минор ( k + 1) -го порядка представим в виде линейной комбинации миноров порядка k (cм. следствие 6.3.1). Выберем в Определение 6.5.1. Наивысший из порядков, отличных от нуля миноров матрицы значается A , называется рангом матрицы и обоrg A . Определение 6.5.2. Любой ненулевой минор матрицы, порядок которого равен ее рангу, называется базисным минором. Определение 6.5.3. Столбцы (строки) матрицы, входящие в матрицу базисного минора, называются базисными. 209 Г л а в а 6 . Системы линейных уравнений Далее рассмотрим n m -компонентных столбцов вида α11 α12 α1n α α α a1 = 21 ; a2 = 22 ; ... ; an = 2 n ... ... ... α m1 α m2 α mn β1 0 β2 0 и столбцы b = ; o = . ... ... βm 0 Поскольку для столбцов (как частного случая матриц) определены операции сравнения, сложения и умножения на число, то будем говорить, что столбец a1 , a 2 , ... , a n b есть линейная комбинация столбцов , если существуют числа λ 1, λ 2 , ... , λ n , n b = ∑ λ i ai . такие, что i =1 Теорема 6.5.1 (о базисном миноре). Всякий столбец (строка) матрицы есть линейная комбинация базисных столбцов (строк) этой матрицы. Доказательство. 1°. Пусть ранг матрицы равен r . Без ограничения общности можно считать, что матрица базисного минора расположена в левом верхнем углу матрицы A . Окаймим матрицу базисного минора фрагментами i -й строки и j -го столбца и рассмотрим определитель построенной матрицы. 210 Аналитическая геометрия и линейная алгебра α11 ... ∆ = det α r1 α i1 ... α1r ... ... ... α rr ... α ir α1 j ... , α rj α ij который равен нулю как минор порядка r + 1 в матрице ранга r. 2°. Разложив определитель ∆ по последней строке, получим α i1 D1 + α i 2 D2 + ... + α ir Dr + α ij M = 0 , где M ≠ 0 – базисный минор, а D1 ,..., Dr – некоторые алгебраические дополнения, не зависящие от i . Следовательно, α ij = λ 1α i1 + λ 2 α i 2 + ... + λ r α ir , где λs = − Ds , s = [1, r ] и ∀i . M Теорема доказана. Определение 6.5.4. Столбцы n ∑λ i =1 Лемма 6.5.1. будем называть ли- i ai = o , n ( ∑ λ i > 0 ). i =1 Для того чтобы столбцы (строки) матрицы были линейно зависимыми, необходимо и достаточно, чтобы один из них был линейной комбинацией остальных. Доказательство. Лемма 6.5.2. a1 , a 2 ,..., a n нейно зависимыми, если существуют не равные нулю одновременно числа λ1 , λ 2 ,..., λ n , такие, что Совпадает с доказательством леммы 1.4.1. Если среди столбцов матрицы есть линейно зависимое подмножество, то множество всех столбцов этой матрицы также линейно зависимое. 211 Г л а в а 6 . Системы линейных уравнений Доказательство. Допустим, что линейно зависимыми являются первые k столбцов, то есть для них существует нетривиальная линейная комбинация, равная нулевому столбцу: α11 α12 α1k 0 α α α 2k 0 λ1 21 + λ 2 22 + ... + λ k = . ... ... ... ... α m1 α m2 α mk 0 Тогда очевидно, что нетривиальная линейная комбинация всех столбцов этой матрицы вида α11 λ1 α1k α 1, k +1 α 1n α 2, k +1 α 21 α 2k α + ... + λ k +0 + ... + 0 2 n ... ... ... ... α m,k +1 α m1 α mk α mn будет также равна нулевому столбцу. Лемма доказана. Теорема 6.5.2. Для того чтобы определитель был равен нулю, необходимо и достаточно, чтобы его столбцы (строки) были линейно зависимыми. Доказательство необходимости. Пусть определитель равен нулю, тогда ранг его матрицы меньше n . По теореме о базисном миноре всякий столбец есть линейная комбинация базисных столбцов и тогда по лемме 6.5.2 столбцы матрицы линейно зависимы. . 212 Аналитическая геометрия и линейная алгебра Доказательство достаточности. Пусть столбцы матрицы линейно зависимы. По лемме 6.5.1 один из столбцов есть линейная комбинация остальных. n −1 Пусть этот столбец последний, то есть a n = ∑ λ i ai . Умi =1 ножим последовательно (для i число = 1, 2, K , n − 1 ) i -й столбец на λ i и сложим все их. Вычитание этой суммы из столбца an не изменит величины определителя, но поскольку при этом мы получим нулевой столбец, то определитель равен нулю. Теорема доказана. Теорема 6.5.3 (о ранге матрицы). Максимальное число линейно независимых столбцов матрицы равно максимальному числу линейно независимых строк и равно рангу этой матрицы. Доказательство. 1°. Если ранг матрицы нулевой, то все ее элементы нулевые и среди них нет линейно независимых. Пусть ранг матрицы равен r > 0 . Рассмотрим матрицу, составленную из r базисных столбцов матрицы. Она имеет ненулевой минор r -го порядка и, следовательно, ее столбцы линейно независимы. 2°. Выберем k > r столбцов матрицы и покажем, что эти столбцы линейно зависимы. Построим из выбранных столбцов матрицу A ∗ . Ее ранг R ≤ r , поскольку ляется частью матрицы A . A∗ яв- 213 Г л а в а 6 . Системы линейных уравнений Следовательно, R ≤ r < k и в матрице A∗ есть, по крайней мере, один небазисный столбец, и тогда столбцы A линейно зависимы по лемме 6.5.2. матрицы Теорема доказана. § 6.6. Системы m линейных уравнений с n неизвестными Рассмотрим систему вида m линейных уравнений с n неизвестными α 11 ξ1 + α 12 ξ 2 +... + α 1n ξ n = β1 , α ξ + α ξ +...+ α ξ = β , 21 1 22 2 2n n 2 .............................................. α m1 ξ1 + α m 2 ξ 2 +... +α mn ξ n = β m , (6.6.1) которая в неразвернутой форме записывается как n ∑α i =1 ji ξi = β j , или же в матричной форме мера A j = [1, m] , x = b , где матрица A раз- m × n имеет компоненты α ji , а столбцы x и b соответ- ственно компоненты Определение 6.6.1. ξ i , i = [1, n] , и β j , j = [1, m] . Упорядоченный набор чисел {ξ10 , ξ 02 ,..., ξ 0n } будем называть частным решением системы линейных уравнений (6.6.1), если при подстановке этих чисел в систему мы получаем верные равенства. 214 Аналитическая геометрия и линейная алгебра Частное решение системы линейных уравнений также может быть записано в виде столбца ξ10 ξ 02 0 x = . Совокупность всех частных решений ... ξ 0n системы линейных уравнений (6.6.1) назовем общим решением системы (6.6.1). Определение 6.6.2. Если система (6.6.1) имеет хотя бы одно частное решение, то она называется совместной, в противном случае – несовместной системой уравнений. Определение 6.6.3. α 11 α 21 Матрица A = ... α m1 α12 α 22 ... α m2 ... α1n ... α 2 n называется ... ... ... α mn основной матрицей системы (6.6.1), а матрица α11 α A b = 21 ... α m1 α12 α 22 ... α m2 ... α1n ... α 2 n ... ... ... α mn β1 β2 K βm – расширенной матрицей этой системы. Определение 6.6.4. Система (6.6.1) называется однородной, если β j = 0 ∀j = [1, m] , в противном случае – неоднородной системой уравнений. 215 Г л а в а 6 . Системы линейных уравнений Для того чтобы система (6.6.1) была совместна, Теорема 6.6.1 необходимо и достаточно, чтобы ранг ее основной (Кронекера– матрицы был равен рангу расширенной. Капелли). Доказательство необходимости. Пусть существует решение системы (6.6.1) {ξ1 , ξ 2 ,..., ξ n } , тогда эту систему можно представить в виде следующего равенства: ξ1 a1 + ξ 2 a 2 + ... + ξ n a n = b , где a i = α 1i T α 2i L α mi , i = [1, n] . Поскольку в этом случае столбец свободных членов есть линейная комбинация столбцов, образующих основную матрицу, то число линейно независимых столбцов основной и расширенной матриц будет одинаковым. Следовательно, по теореме 6.5.3 (о ранге матрицы) rg A = rg A b . Доказательство достаточности. Пусть ранг основной матрицы равен рангу расширенной матрицы и равен r . Без ограничения общности предположим, что базисный минор расположен в левом верхнем углу расширенной матрицы, но тогда по теореме 6.5.1 (о базисном r миноре) имеет место равенство b = ∑ λ i a i , которое i =1 можно переписать в виде r n i =1 i = r +1 b = ∑ λ i ai + ∑0 a i . Однако последнее означает, что система (6.6.1) имеет решение {λ1 , λ 2 ,..., λ r ,0,...,0} , то есть она совместна. Теорема доказана. 216 Задача 6.6.1. Аналитическая геометрия и линейная алгебра Докажите справедливость следующего утверждения. Для того чтобы прямые Ai x + Bi y + Ci = 0 , i = [1, n] пересекались в одной и той же точке плоскости, необходимо и достаточно, чтобы rg A1 B1 A2 B2 ... ... An Bn = rg A1 B1 C1 A2 B2 C2 ... ... ... An Bn Cn . § 6.7. Фундаментальная система решений В § 6.6 было показано, что факт совместности или несовместности системы (6.6.1) можно установить, сравнив ранги ее основной и расширенной матриц. Рассмотрим теперь случай, когда система (6.6.1) совместна и найдем все ее решения. При построении общего решения системы (6.6.1) воспользуемся следующими вспомогательными утверждениями. Лемма 6.7.1. Любая линейная комбинация частных решений однородной системы (6.6.1) также является ее частным решением. Доказательство. Пусть ξ1i ξi xi = 2 , ... ξ in системы, то есть i = [1, k ] – частные решения однородной A xi = o ∀i = [1, k ] . 217 Г л а в а 6 . Системы линейных уравнений k Рассмотрим столбец y = ∑ λ i x i . По правилам действий i =1 с матрицами для него справедливы равенства n n i y = A ∑ λi x = ∑ λi ( A i =1 i =1 A xi ) = o . Лемма доказана. Лемма 6.7.2. Сумма некоторого частного решения однородной системы (6.6.1) и некоторого частного решения неоднородной системы является частным решением неоднородной системы (6.6.1). Доказательство. x – частное решение однородной системы, а y – Пусть некоторое частное решение неоднородной, то есть A x = o , A y = b . Тогда по правилам действий с матрицами справедливы равенства A ( x + y )= A x + A y = o + b = b . Лемма доказана. Лемма 6.7.3. Разность двух некоторых частных решений неоднородной системы (6.6.1) является частным решением однородной системы (6.6.1). Доказательство. Пусть то есть x и y – частные решения неоднородной системы, A x = b , A y = b . Тогда по правилам действий с матрицами справедливы равенства A ( x − y )= A x − A y = b − b = o . Лемма доказана. 218 Аналитическая геометрия и линейная алгебра Замечания 1°. Из лемм 6.7.1–6.7.3. следует, что общее решение неоднородной системы уравнений есть общее решение однородной плюс некоторое частное решение неоднородной, и поэтому целесообразно вначале изучить вопрос о нахождении общего решения однородной системы линейных уравнений. 2°. Однородная система линейных уравнений всегда совместна, поскольку у нее есть, по крайней мере, одно частное, называемое тривиальным, решение, для которого все неизвестные имеют нулевое значение. 3°. Поскольку частные решения системы линейных уравнений представимы в виде столбцов, то, используя операции сравнения, сложения и умножения на число для столбцов, а также лемму 6.7.1, можно ввести понятие линейной зависимости решений однородной системы линейных уравнений аналогично определению 6.5.4. Теорема 6.7.1. Однородная система (6.6.1) имеет n − rg A линейно независимых частных решений. Доказательство. 1°. Рассмотрим вначале совместную неоднородную систему (6.6.1) α 11ξ1 + α 12 ξ 2 +...+ α 1n ξ n = β1 α ξ + α ξ +...+ α ξ = β 21 1 22 2 2n n 2 ............................................... α m1ξ 1 + α m 2 ξ 2 +... +α mn ξ n = β m и предположим, что матрица базисного минора расширенной матрицы A | b , ранга r ≤ min{m, n + 1} , расположена в ле- вом верхнем углу последней. 219 Г л а в а 6 . Системы линейных уравнений По теореме 6.5.1 (о базисном миноре) последние m − r уравнений являются линейными комбинациями первых r уравнений, и, следовательно, их можно отбросить, поскольку они будут тождественно удовлетворяться решениями первых r уравнений. В оставшихся уравнениях перенесем в правые части слагаемые, содержащие неизвестные ξ r +1 , ξ r + 2 ,..., ξ n . ξ1 ,..., ξ r называются основными (главными, зависимыми, базисными), а неизвестные ξ r +1 ,..., ξ n – свободныНеизвестные ми (параметрическими, независимыми, небазисными). α11ξ1 + α12 ξ 2 + ... + α1r ξ r = β1 − α1r +1ξ r +1 − ...− α 1n ξ n , α ξ + α ξ + ... + α ξ = β − α ξ − ... − α ξ , 21 1 22 2 2r r 2 2 r +1 r +1 2n n ...................................................................................... α r1ξ1 + α r 2 ξ 2 + ... + α rr ξ r = β r − α r ,r +1ξ r +1 − ... − α r , n ξ n . Присвоим свободным неизвестным некоторые конкретные значения ξ r +1 = µ1 ,..., ξ n = µ n − r и рассчитаем по правилу Крамера (теорема 6.4.1) соответствующие им значения основных неизвестных: j -й столбец ↓ n−r α 11 ... β1 − ∑ α 1, r + k µ k 1 ξj = det M k =1 ... ... n−r ... α r1 ... β r − ∑ α r , r + k µ k k =1 где j = [1, r ] , а M – базисный минор. ... α 1r ... ... , ... α rr (6.7.1) 220 Аналитическая геометрия и линейная алгебра 2°. Заметим, что из соотношений (6.7.1), положив µ k = 0 ; k = [1, n − r ] , можно найти частное решение неоднородной системы (6.6.1). Теперь рассмотрим однородную систему. По линейному свойству определителей (теорема 6.2.3) получаем выражения для значений неизвестных: n−r ξ j = ∑ κ jk µ k , j = [1, r ] ; k =1 (6.7.2) ξ r +i = µ i , i = [1, n − r ] , где κ jk α11 ... − α1,r + k 1 = det ... ... ... M α r1 ... − α r ,r + k ... α1r ... ... , ... α rr j = [1, r ] , k = [1, n − r ] . ↑ j -й столбец Наконец, в матричной форме соотношения (6.7.2) могут быть записаны в виде κ11 ξ1 κ 21 ξ2 = L L κ r1 ξr κ12 κ 22 L κr2 L κ1,n −r ξ r +1 L κ 2, n − r ξ r + 2 L L L L κ r ,n −r ξ n (6.7.3) 221 Г л а в а 6 . Системы линейных уравнений ξ1 κ11 ξ2 κ 21 L L ξr κ = r1 или ξ r +1 1 ξ r +2 0 L L ξn 0 3°. Полагая κ12 κ 22 L κr2 0 1 L 0 L κ1,n −r L κ 2, n − r µ1 L L L κ r ,n − r µ 2 . L L 0 µ n−r L 0 L L L 1 µ1 = 1 , µ 2 = µ 3 = ... = µ n −r = 0 , получим решение {ξ11 , ξ12 , ... , ξ1r , 1, 0, ... , 0} . Аналогично при µ1 = 0 , µ 2 = 1, µ 3 = ... = µ n −r = 0 найдем решение {ξ1 , ξ 2 , ... , ξ r , 0 , 1, ... , 0} . И, продолжая этот процесс, получим на последнем шаге при 2 2 2 µ1 = µ 2 = µ 3 = ... = µ n −r −1 = 0, µ n− r = 1 решение {ξ1n −r , ξ 2n − r , ... , ξ rn −r , 0, 0, ... , 1} . Полученные решения будем называть нормальными фундаментальными решениями. 4°. Покажем теперь, что построенные n − r частных решений однородной системы уравнений (6.6.1) являются линейно независимыми. Действительно, записав эти решения как строки, получим матрицу вида ξ11 ξ12 ... ξ1n −r ξ12 ξ 22 ... ξ n2 −r ... ξ1r ... ξ r2 ... ... ... ξ rn −r 1 0 ... 0 0 1 ... 0 ... ... ... ... 0 0 . ... 1 (6.7.4) 222 Аналитическая геометрия и линейная алгебра Заметим, что ее ранг, с одной стороны, не меньше, чем n − r , поскольку содержит ненулевой минор этого порядка, но, с другой стороны, не больше, чем число строк в этой матрице, равное n − r , и потому ранг в точности равен n − r, что доказывает линейную независимость построенных частных решений. Теорема доказана. Определение 6.7.1. Фундаментальной системой решений для системы линейных уравнений (6.6.1) называется совокупность любых n − rg A частных, линейно независимых решений однородной системы (6.6.1), где неизвестных в системе (6.6.1), а n – число A – ее основная матрица. Матрица (6.7.4) называется фундаментальной. Теорема 6.7.2. Каждое частное решение однородной системы (6.6.1) может быть представлено в виде линейной комбинации частных решений, образующих нормальную фундаментальную систему решений. Доказательство. {ξ1 , ξ 2 ,..., ξ n } однородной системы (6.6.1). Рассмотрим матрицу размера ( n − r + 1) × n Пусть дано решение ξ1 ξ11 ξ12 ... ξ1n− r ξ2 ξ12 ξ 22 ... ξ n2 −r ... ξ r ... ξ1r ... ξ r2 ... ... ... ξ rn −r ξ r +1 1 0 ... 0 ξ r +2 0 1 ... 0 ... ξ n ... 0 ... 0 , (6.7.5) ... ... ... 1 223 Г л а в а 6 . Системы линейных уравнений ранг которой, с одной стороны, очевидно, не меньше, чем n − r . С другой стороны, первые r столбцов этой матрицы являются линейными комбинациями (заданными соотношениями (6.7.3)) последних n − r столбцов. Действительно, эти соотношения, связывающие значения свободных и основных переменных, одни и те же для всех строк матрицы (6.7.5), и потому в этой матрице каждый из первых r столбцов есть линейная комбинация последних n − r . Значит, ранг матрицы не превосходит n − r , и, следовательно, равен в точности n − r . Наконец, по теореме 6.5.1 − о базисном миноре, который располагается в последних r строках, первая строка матрицы (6.7.5) должна быть некоторой линейной комбинацией остальных, и, следовательно, общее решение однородной системы (6.6.1) может быть записано в виде ξ1 ξ2 ... ξr ξ r +1 ξ r +2 ... ξn где = λ1 ξ11 ξ 12 ξ1n − r ξ12 ... ξ1r 1 0 ... 0 ξ 22 ... ξ 2r 0 1 ... 0 ξ n2 − r ... ξ nr − r , 0 0 ... 1 + λ2 + ... + λ n − r λ i ∀i = [1, n − r ] – произвольные константы. Теорема доказана. Следствие 6.7.1. Общее решение неоднородной системы (6.6.1) может быть дано формулой 224 Аналитическая геометрия и линейная алгебра ξ1 ξ 11 ξ 12 ξ2 ... ξ ξ ξr = λ1 ξ r +1 ξ r +2 ... ξn 1 2 ... ξ 1r 1 0 + λ2 ... ξ r2 0 1 ξ 1n − r ξ 10 n−r 2 ξ 02 ... ξ 2 2 ... + ... + λ n − r ξ rn − r 0 0 + ξ 0r ξ 0r +1 ξ 0r + 2 ... ... ... ... 0 0 1 ξ 0n , ξ10 ξ 02 ... 0 где ξ r ξ 0r +1 ξ 0r + 2 ... ξ 0n является некоторым частным решением неоднородной системы (6.6.1), а числа λ i ∀i = [1, n − r ] – произвольные константы. Доказательство. Пусть x 0 – некоторое (найденное, например, подбором) ча- стное решение неоднородной системы (6.6.1), а x – ее про- извольное решение. Тогда по лемме 6.6.3 произвольное решение однородной системы (6.6.1) y представимо в виде y = x − x 0 . Откуда получаем x = y + x 0 . Следствие доказано. 225 Г л а в а 6 . Системы линейных уравнений Из теорем 6.7.1 и 6.7.2 непосредственно вытекает Следствие 6.7.2. Для того чтобы однородная система (6.6.1) с n < m имела ненулевое решение, необходимо и достаточно, чтобы ранг ее основной матрицы удовлетворял условию rg A < n . В случае, когда основная матрица однородной системы (6.6.1) квадратная, условие существования нетривиального решения равносильно равенству det A = 0 . Иное полезное для приложений условие совместности системы линейных уравнений дает Теорема 6.7.3 (Фредгольма). Для того чтобы система (6.6.1) была совместной, необходимо и достаточно, чтобы каждое решение y = η1 η2 ... η m T сопряженной системы α 11η1 + α 21η 2 + ... + α m1η m = 0, α η + α η + ... + α η = 0, 12 1 22 2 m2 m .......... .......... .......... .......... ....... α 1n η1 + α 2 n η 2 + ... + α mn η m = 0 A (или в матричном виде m летворяло условию ∑β η i =1 ном виде b T i i T y = o ) удов- = 0 (или в матрич- y = 0 ). Доказательство необходимости. Пусть система уравнений (6.6.1) совместна, то есть для каждого ее решения x справедливо равенство b = A x . 226 Аналитическая геометрия и линейная алгебра Найдем T A T b T b произведение y в предположении, что y = o . Имеем y = ( A x )T y = x T A T y = x T o = 0. Доказательство достаточности. Пусть b T уравнений y = 0 для любого решения системы линейных A T нейных уравнений y = o . Тогда общие решения систем лиA T A b y = o и T y = o , T y =0 совпадают, и для этих систем максимальное число линейно независимых решений одинаково. Поэтому, согласно теоремам 6.7.1 и 6.7.2, m − rg A T A = m − rg b T или rg A T A = rg b T , но поскольку ранг матрицы не меняется при ее транспонировании, то имеет место равенство rg A = rg A | b , означающее в силу теоремы 6.6.1 совместность системы линейных уравнений A x = b . Теорема доказана. Альтернативное доказательство теоремы Фредгольма приведено в главе 10 (см. теоремы 10.6.4 и 10.6.5). 227 Г л а в а 6 . Системы линейных уравнений § 6.8. Элементарные преобразования. Метод Гаусса Практическое применение теорем 6.7.3 и 6.7.4 затрудняется тем, что заранее, как правило, неизвестно, совместна ли решаемая система. Определение же рангов основной и расширенной матриц независимо от поиска решений оказывается весьма нерациональной (с точки зрения расходования вычислительных ресурсов) процедурой. Более эффективным вычислительным алгоритмом, позволяющим либо находить общее решение системы (6.6.1), либо устанавливать факт ее несовместности, является метод Гаусса. Суть этого метода заключается в приведении расширенной матрицы системы линейных уравнений к наиболее простому виду последовательностью так называемых элементарных преобразований, каждое из которых не меняет общего решения системы уравнений. Под “наиболее простым” видом расширенной матрицы мы будем понимать верхнюю треугольную форму (т.е. случай, когда α ij = 0 при i > j ), для которой возможно рекуррентное нахождение неизвестных путем лишь решения на каждом шаге процедуры линейного уравнения с одним неизвестным. Ниже приведен пример матрицы размера m × n ( n > m) , имеющей верхнюю треугольную форму a11 a12 a13 ... a1, m − 2 a1, m −1 a1, m a1, m +1 ... a1n 0 a 22 a 23 ... a 2, m − 2 a 2, m −1 a 2, m a 2, m +1 ... a 2n 0 ... 0 ... a 33 ... ... a 3, m − 2 ... ... a 3, m −1 ... a 3, m ... a 3, m +1 ... ... ... a 3n ... 0 0 0 ... 0 a m −1, m −1 a m −1, m 0 0 0 ... 0 0 a mm . a m −1, m +1 ... a m −1,n a m, m +1 ... a mn К элементарным преобразованиям матрицы относятся: перестановка строк (перенумерация уравнений); перестановка столбцов основной матрицы (перенумерация неизвестных); 228 Аналитическая геометрия и линейная алгебра удаление нулевой строки (исключение уравнений, тождественно удовлетворяющихся любыми значениями неизвестных); умножение строки на ненулевое число (нормирование уравнений); сложение строки с линейной комбинацией остальных строк с записью результата на место исходной строки (замена одного из уравнений системы следствием ее уравнений, получаемым при помощи линейных операций). Решение неоднородной системы уравнений (равно как и ранг ее матрицы) не изменится также и при использовании любой комбинации элементарных операций. Непосредственной проверкой можно убедиться, что элементарные преобразования любой матрицы могут быть выполнены при помощи умножения ее на матрицы следующего специального вида. Например: - - перестановка столбцов с номерами A размера i и j матрицы m × n осуществляется путем ее умно- S 1 размера n × n , которая в свою очередь получается из единичной матрицы n го порядка E путем перестановки в последней i -го и j -го столбцов; жения справа на матрицу - i -й строки матрицы умножение число λ ≠ A на некоторое 0 осуществляется путем умножения слева на матрицу ной размера A S 2 , которая получается из единич- m × m матрицы E путем замены в по- следней i -го диагонального элемента (равного единице) на λ ; 229 Г л а в а 6 . Системы линейных уравнений - сложение строк с номерами i и j матрицы A осу- ществляется путем ее умножения слева на матрицу S 3 размера m × n , которая получается из единич- m ной матрицы порядка E путем замены в по- следней нулевого элемента, стоящего в i -й строке и j -м столбце, на единицу (при этом результат суммирования окажется на месте A ). рицы ца i -й строки исходной мат- В дальнейшем (см. теорему 8.4.3) будет показано, что если матриS квадратная и невырожденная и возможно умножение матри- цы S на матрицу A , то справедливо равенство rg ( S A ) = rg A . Поскольку ранг det S 1 = −1 , det S 2 = λ ≠ 0 и det S 3 = 1 , то A при рассмотренных выше преобразованиях не меняется. Проверьте самостоятельно, что будут также справедливы следующие теоремы. Теорема 6.8.1. Последовательное применение нескольких элементарных преобразований есть новое преобразование, которое имеет матрицу, являющуюся произведением матриц данных элементарных преобразований. Теорема 6.8.2. Если умножение матрицы матрицу S над строками S T A слева на квадратную реализует некоторое преобразование A , то умножение A справа на реализует то же самое преобразование матрицы A , но выполненное над ее столбцами. 230 Аналитическая геометрия и линейная алгебра Отмеченные свойства элементарных преобразований позволяют в ряде случаев упрощать вычислительные процедуры с матричными ∗ S выражениями. Пусть, например, есть матрица преобразования, A переводящего невырожденную матрицу преобразование с матрицей ∗ S в единичную. Тогда переведет единичную матрицу −1 E в матрицу A , поскольку в силу E = S рожденности A справедливы равенства E A −1 = S ∗ A A −1 A или −1 ∗ = S A и невы∗ E . Из этих соотношений следует, что вычисление произведения квадратных матриц A −1 B может быть сведено к последовательности A | B (то есть матрицы, элементарных преобразований матрицы B к матрице A ), образованной добавлением столбцов матрицы A к единичной. В результате искомое приводящих подматрицу произведение оказывается на месте подматрицы B . Проиллюстрируем применение метода Гаусса на примере решения следующей системы линейных уравнений. Задача Решить систему уравнений: 6.8.1. ξ1 3ξ 1 5ξ1 + ξ2 + ξ3 + ξ4 + ξ5 = + 2ξ 2 + ξ3 + ξ4 − 3ξ 5 = − 2, ξ2 + 4ξ 2 + 2ξ 3 + 3ξ 3 + 2ξ 4 + 3ξ 4 + 6ξ 5 − ξ5 = = 7, 23, 12. 231 Г л а в а 6 . Системы линейных уравнений Решение. 1°. Составляем расширенную матрицу системы 1 1 1 1 1 7 3 2 1 1 −3 −2 . 0 1 2 2 6 23 5 4 3 3 − 1 12 2°. Приводим ее к верхнему треугольному виду. Для этого а) преобразуем в нули все элементы первого столбца, кроме элемента, стоящего в первой строке. Например, для зануления элемента, стоящего во второй строке первого столбца, заменим вторую строку матрицы строкой, которая является суммой первой строки, умноженной на ( − 3 ), и второй строки. Аналогично поступаем с четвертой строкой: ее заменяем линейной комбинацией первой и четвертой строк с коэффициентами ( − 5 ) и 1 соответственно. Третью, естественно, не меняем: там уже имеется необходимый для треугольного вида ноль. В итоге матрица приобретает вид 1 1 1 1 1 7 0 − 1 − 2 − 2 − 6 − 23 ; 0 1 2 2 6 23 0 − 1 − 2 − 2 − 6 − 23 б) выполняем теперь операцию зануления элементов второго столбца, стоящих в его третьей и четвертой строках. Для этого третью строку матрицы заменяем суммой второй и третьей, а четвертую – разностью второй и четвертой. Получаем 232 Аналитическая геометрия и линейная алгебра 1 1 1 1 1 7 0 − 1 − 2 − 2 − 6 − 23 ; 0 0 0 0 0 0 0 в) 0 0 0 0 0 поскольку в данном конкретном случае элемент, расположенный в четвертой строке третьего столбца, оказался равным нулю, то приведение расширенной матрицы к верхнему треугольному виду завершено. 3°. Полученная матрица является расширенной матрицей системы линейных уравнений, равносильной исходной системе. Ранг этой матрицы совпадает с рангом исходной. Потому заключаем, что а) система совместна, поскольку ранг основной матрицы равен рангу расширенной и равен 2 (по теореме 6.6.1 Кронекера–Капелли); б) однородная система уравнений будет иметь по теореме 6.7.1 n − rg A = 5 − 2 = 3 линейно независимых ре- шения. 4°. Поскольку общее решение неоднородной системы есть общее решение однородной плюс частное решение неоднородной, то нам достаточно найти три любых линейно независимых решения однородной системы и какое-нибудь одно решение неоднородной. Перепишем исходную систему в преобразованном виде, приняв первое и второе неизвестные за основные, а третье, четвертое и пятое – за свободные: ξ 1 + ξ2 ξ2 = 7 − ξ3 = 23 − 2ξ 3 − ξ4 − 2ξ 4 − ξ5 , (6.8.1) − 6ξ 5 . 233 Г л а в а 6 . Системы линейных уравнений Второе уравнение для удобства вычислений умножим на (−1 ) , а третье и четвертое уравнения отбросим как удовлетворяющиеся тождественно. Положив в системе (6.8.1) свободные неизвестные равными ну- − 16 23 лю, находим частное решение неоднородной системы 0 . 0 0 Значения основных неизвестных определяются из легко решаемой системы линейных уравнений ξ1 + ξ2 ξ2 = 7, = 23. Для однородной системы ξ 1 + ξ2 ξ2 = 0 − ξ3 = 0 − 2ξ 3 − ξ4 − 2ξ 4 − ξ5 , − 6ξ 5 строим нормальную фундаментальную систему решений по схеме, использованной при доказательстве теоремы 6.7.1. Первое 1 −2 независимое решение 1 находится из системы 0 0 ξ 1 + ξ2 ξ2 = −1, = − 2. 234 Аналитическая геометрия и линейная алгебра 1 −2 Аналогично получаются 0 1 5 −6 и 0 0 0 – второе и третье ре- 1 шения. Окончательно общее решение исходной неоднородной системы в матричном виде может быть записано как: ξ1 1 ξ2 −2 ξ 3 = λ1 1 ξ4 0 ξ5 0 Замечание: + λ2 1 5 −2 −6 0 + λ3 0 1 0 0 1 − 16 23 + 0 0 0 ∀λ1 , λ 2 , λ 3 . поскольку существует свобода выбора как частного решения неоднородной системы, так и линейно независимых решений однородной, то общее решение неоднородной системы может быть записано в различных, но, естественно, равносильных формах. 235 Г л а в а 7 . Линейное пространство Глава 7 ЛИНЕЙНОЕ ПРОСТРАНСТВО § 7.1. Определение линейного пространства Определение 7.1.1. Множество Λ , состоящее из элементов x, y , z ,K , для которых определена операция сравнения8, называется линейным пространством, если 1°. Каждой паре элементов x, y этого множества поставлен в соответствие третий элемент этого же множества, называемый их суммой и обозначаемый x + y , таким образом, что выполнены аксиомы а) x + y = y + x ; б) x + ( y + z ) = ( x + y ) + z ; в) существует нулевой элемент o , такой, что для любого x ∈ Λ имеет место x + o = x ; г) для каждого x существует противоположный элемент (− x ) , такой, что 8 x + (− x ) = o . Эта операция дает возможность устанавливать факты «равенства ( x = y) или «неравенства x тов принадлежащих множеству и y» Λ. ( x ≠ y) x и y» для любой пары двух элемен- 236 Аналитическая геометрия и линейная алгебра 2°. 3°. Для любого элемента x и любого числа λ существует такой принадлежащий Λ элемент, обозначаемый λ x и называемый произведением числа на элемент, что выполнены аксиомы: а) 1x = x ; б) (λµ ) x = λ (µ x ) . Для операций сложения элементов и умножения элемента на число выполнены аксиомы дистрибутивности: а) (λ + µ) x = λ x + µ x ; б) Замечания. 1°. 2°. Пример 7.1.1. λ( x + y ) = λ x + λ y ∀x, y ∈ Λ ; и для любых чисел λ, µ . Под “числами” в аксиомах второй и третьей групп подразумеваются действительные или комплексные числа. Первая группа аксиом равносильна требованию, чтобы Λ являлось абелевой группой относительно операции сложения (см. § 5.6). Линейным пространством является 9: 1°. Множество всех векторов на плоскости. 2°. Множество всех векторов в пространстве. 3°. Множество всех n -компонентных столбцов. 4°. Множество всех многочленов степени не выше, чем n . 5°. Множество всех матриц размера 9 m× n . Предполагается, что операции сложения и умножения на число выполняются в соответствии с ранее данными определениями. 237 Г л а в а 7 . Линейное пространство 6°. C[α, β] – множество всех функций, непрерывных на [α, β] . 7°. Множество всех решений однородной системы линейных уравнений с n неизвестными. Задача 7.1.1. m Показать, что в общем случае множество радиусов→ → векторов точек, принадлежащих плоскости ( n , r ) = δ , не является линейным пространством. Выяснить, при каких значениях параметра δ данное множество будет линейным пространством. Задача 7.1.2. Показать, что множество, состоящее из одного нулевого элемента, является линейным пространством. Задача 7.1.3. Будет ли линейным пространством множество всех положительных чисел R+ ? Решение. Ответ зависит от способа введения операций сложения и умножения на число элементов рассматриваемого множества. 1°. Пусть операции вводятся “естественным” образом. В этом случае множество положительных чисел не образует линейного пространства, поскольку в нем отсутствует нулевой элемент. 2°. Если операцию “сложения” определить как обычное произведение двух чисел, а “умножение на число λ ” определить как возведение положительного числа в степень λ , то множество положительных чисел будет являться линейным пространством, в котором роль нулевого элемента играет число “1”. 238 Аналитическая геометрия и линейная алгебра Теорема 7.1.1. Линейное пространство имеет единственный нулевой элемент. Доказательство. Пусть существуют два различных нулевых элемента o1 и o2 . Тогда, согласно аксиоме 1°(в) из определения 7.1.1 линейного пространства, будут справедливы равенства o1 + o2 = o1 и o2 + o1 = o2 . Откуда в силу коммутативности операции сложения получаем o1 = o2 . Теорема доказана. Теорема 7.1.2. Для каждого элемента x линейного пространства имеет место равенство 0 x = o . Доказательство. Из аксиоматики линейного пространства имеем x = 1x = (0 + 1) x = 0 x + 1x = 0 x + x. Прибавляя к обеим частям равенства x = 0 x + x элемент y , противоположный элементу x , получаем, что 0x = o . Теорема доказана. Теорема 7.1.3. Для каждого элемента линейного пространства существует единственный противоположный элемент. Доказательство. x существуют два различных противоположных элемента y1 и y 2 . Тогда, согласно аксиоме 1°(г) лиПусть для элемента нейного пространства, будут справедливы равенства x + y1 = o и x + y 2 = o . Прибавим к обеим частям первого равенства элемент y 2 , получим 239 Г л а в а 7 . Линейное пространство y 2 + ( x + y1 ) = y 2 в силу ассоциативности операции сложения и второго равенства. Но, с другой стороны, y 2 + ( x + y1 ) = ( y 2 + x ) + y1 = o + y1 = y 1 , то есть y 2 = y1 . Теорема доказана. Теорема 7.1.4. Для каждого x ∈ Λ противоположным элементом служит элемент ( −1) x . Доказательство. Из аксиоматики линейного пространства и в силу теорем 7.1.2– 7.1.3 имеем o = 0 x = (1 − 1) x = 1x + (−1) x = x + (−1) x . Это равенство и означает, что противоположный к x элемент имеет вид ( −1) x . Теорема доказана. § 7.2 Линейная зависимость, размерность и базис в линейном пространстве n Определение 7.2.1. 1°. Выражение ∑λ i =1 i xi комбинацией элементов называется линейной x1, x2 ,..., x n линейно- го пространства Λ . 2°. Элементы x1 , x 2 , ... , x n линейного пространства Λ называются линейно зависимыми, если существуют числа λ1 , λ 2 ,..., λ n , не равные нуn лю одновременно, такие, что ∑λ i =1 i xi = o . 240 Аналитическая геометрия и линейная алгебра 3°. Элементы ства x1 , x 2 , ... , x n линейного простран- Λ называются линейно независимыми, есn ли из равенства ∑λ i =1 i xi = o следует, что λ 1 = λ 2 = ... = λ n = 0 . Лемма 7.2.1. Для того чтобы некоторое множество элементов линейного пространства было линейно зависимым, необходимо и достаточно, чтобы один из этих элементов являлся линейной комбинацией остальных. Доказательство. Доказательство совпадает с доказательством леммы 1.4.1, в котором слово “вектор” заменено словом “элемент”. Лемма 7.2.2. Если некоторое подмножество элементов x1 , x 2 , ... , x n линейно зависимо, то линейно зависимы и сами элементы x1 , x 2 , ... , x n . Доказательство. Без ограничения общности можно предположить, что линейно зависимое подмножество состоит их первых k < n элементов множества x1 , x 2 , ... , x n . Тогда существуют не равные нулю λ1 , λ 2 ,..., λ k , такие, что одновременно числа k ∑λ i =1 Но это равенство можно записать в виде k n i =1 i = k +1 ∑ λ i xi + ∑ 0x i =o, что и доказывает линейную зависимость элементов x1 , x 2 , ... , x n . Лемма доказана. i xi = o . 241 Г л а в а 7 . Линейное пространство Определение 7.2.2. Определение 7.2.3. Базисом в линейном пространстве Λ называется любой упорядоченный набор его n элементов, если 1) эти элементы линейно независимые; 2) любое подмножество в Λ , содержащее n + 1 элемент, включая эти n элементов, линейно зависимое. Линейное пространство Λ называется n-мерным и обозначается Λ , если в нем существует базис, состоящий из n элементов. Число n называется разn мерностью линейного пространства ется Теорема 7.2.1. dim( Λn ) . Λn и обознача- Для каждого элемента линейного пространства Λ существует единственное представление в виде линейной комбинации базисных элементов. n Доказательство. линейном пространстве Λ {g1 , g 2 ,..., g n } и произвольный элемент Пусть n в заданы базис x . Тогда по определению базиса система элементов {g1 , g 2 ,..., g n , x} линейно зависима и по лемме 7.2.1 элемент x является линейной комбинацией элементов g1 , g 2 ,..., g n . Существование разложения, таким образом, доказано. Покажем теперь единственность разложения. Допустим, что существуют две различные линейные комбинации n n i =1 i =1 x = ∑ ξ i gi и x = ∑ ηi gi . Тогда получаем, что n ∑ (ξ i =1 i − ηi )gi = o , 242 Аналитическая геометрия и линейная алгебра но это означает, что при данном допущении система элементов g1 , g 2 ,..., g n линейно зависима. Полученное противоречие доказывает единственность. Теорема доказана. В общем случае линейное пространство может не иметь базиса. Таким свойством обладает, например, линейное пространство, состоящее из одного нулевого элемента. В таблице 7.2.1 приведены примеры базисов в линейных пространствах. Таблица 7 .2 .1 Примеры базисов в линейных пространствах Линейное пространство Размерность Множество всех радиусоввекторов на плоскости 2 Упорядоченная пара неколлинеарных векторов на плоскости. Множество всех векторов в пространстве 3 Упорядоченная тройка нормированных, попарно ортогональных векторов. Множество всех n -компонентных столбцов n n cтолбцов вида 1 0 0 0 1 0 0 ; 0 ; 1 ; ... ... ... ... 0 0 0 Пример базиса 0 0 0 . ... 1 243 Г л а в а 7 . Линейное пространство Множество всех алгебраических многочленов степени не выше, чем n +1 n + 1 одночлен вида P1 (τ) = 1 ; P2 (τ) = τ; P3 (τ) = τ 2 ; P4 (τ) = τ 3 ; n ... ; Pn (τ) = τ n−1 ; Pn+1 (τ) = τ n . Множество всех матриц размера m× n Множество всех функций, непрерывных на [α, β] Множество решений однородной системы m линейных уравнений с n неизвестными и рангом основной матрицы, равным r n⋅m ∞ n−r n ⋅ m всевозможных различных матриц размера m× n , все элементы которых равны нулю, кроме одного, равного 1. Базис не существует10. Нормальная фундаментальная система решений. 10 В этом линейном пространстве (вопреки определению 7.2.2) для любого натурального n можно построить линейно независимый набор, состоящий из n + 1 элемента. Например, множество функций вида { 1, τ, τ 2 , K, τ n } . 244 Аналитическая геометрия и линейная алгебра § 7.3. Подмножества линейного пространства Подпространство Определение 7.3.1. Непустое множество Ω , образованное из элементов линейного пространства Λ , называется подпространством этого линейного пространства, если для любых x , y ∈ Ω и любого числа λ 1) x + y ∈ Ω , 2) λx ∈ Ω . Замечание: Пример 7.3.1. из определения 7.3.1 следует, что множество Ω само является линейным пространством, поскольку для него, очевидно, выполняются все аксиомы операций в линейном пространстве. 1°. Множество радиусов-векторов всех точек, лежащих на некоторой плоскости, проходящей через начало координат, является подпространством во множестве радиусов-векторов всех точек трехмерного геометрического пространства. 2°. Множество всех многочленов степени не выше, чем n , есть подпространство в линейном пространстве непрерывных функций C[α, β] . 3°. В пространстве n -мерных столбцов совокупность решений однородной системы линейных уравнений с n неизвестными и с основной матрицей ранга r образует подпространство размерности n − r . 4°. Подпространством любого линейного пространства будет: а) само линейное пространство; б) множество, состоящее из одного нулевого элемента. 245 Г л а в а 7 . Линейное пространство Определение 7.3.2. Пусть даны два подпространства пространства Λ . Тогда Ω1 и Ω 2 линейного Ω1 и Ω 2 называется множество элементов x ∈ Λ , таких, что x ∈ Ω1 либо x ∈ Ω 2 . Объединение подпространств Ω1 и Ω 2 обозначается Ω1 ∪ Ω 2 . 1°. Объединением подпространств Ω1 и Ω 2 называется множество элементов x ∈ Λ , принадлежащих Ω1 и Ω 2 одновременно. Пересечение подпространств Ω1 и Ω 2 обозначается Ω1 ∩ Ω 2 . 2°. Пересечением подпространств Ω1 и Ω 2 называется совокупность всех элементов x1 + x 2 ∈ Λ при условии, что x1 ∈ Ω1 и x 2 ∈ Ω 2 . Сумма подпространств Ω1 и Ω 2 обозначается Ω1 + Ω 2 . 3°. Суммой подпространств 4°. Прямой суммой подпространств Ω1 и Ω 2 называется совокупность всех элементов x1 + x 2 ∈ Λ при условии, что x1 ∈ Ω1 и x2 ∈ Ω 2 и Ω1 ∩ Ω 2 = {o} . Прямая сумма обозначается Ω1 ⊕ Ω 2 . Покажите самостоятельно, что справедлива 246 Аналитическая геометрия и линейная алгебра Теорема 7.3.1. Как сумма, так и пересечение подпространств Теорема 7.3.2. Размерность суммы подпространств равна Ω 2 в Λ суть также подпространства в Λ . Ω1 и Ω1 и Ω 2 dim(Ω1 + Ω 2 ) = = dim(Ω1 ) + dim(Ω 2 ) − dim(Ω1 ∩ Ω 2 ). Доказательство. 1°. Пусть Ω1 ∩ Ω 2 подпространство имеет базис {g1 , g 2 ,..., g k } и соответственно размерность k. Дополним этот базис элементами {g1′ , g ′2 ,..., g l′ } до базиса в ′′ } до базиса в Ω 2 . В Ω1 и элементами {g1′′, g ′2′ ,..., g m этом случае каждый элемент x ∈ Ω1 разложен по системе элементов + Ω 2 может быть ′′ }. {g1, g 2 ,..., g k , g1′ , g ′2 ,..., g l′ , g1′′, g ′2′ ,..., g m 2°. Покажем теперь, что набор элементов {g1, g 2 ,..., g k , g1′ , g ′2 ,..., g l′ , g1′′, g ′2′ ,..., g ′m′ } линейно независим в Λ . Рассмотрим некоторую, равную нулевому элементу, линейную комбинацию этих элементов: l k m i =1 j =1 p =1 ~ x = ∑ λ ′i g i′ + ∑ λ j g j + ∑ λ ′p′ g ′p′ = o . m Заметим, что по построению ∑ λ ′′ g ′′ ∈ Ω p =1 p p 2, (7.3.1) 247 Г л а в а 7 . Линейное пространство но, с другой стороны, этот же элемент m l k p =1 i =1 j =1 ∑ λ′p′ g ′p′ = − ( ∑ λ ′i g i′ + ∑ λ j g j ) ∈ Ω1 . x ∈Ω 1 ∩ Ω 2 и, следовательно, в равенстЭто означает, что ~ ве (7.3.1) все λ′i = 0 , i = [1, l ] ; λ ′′p = 0 , p = [1, m] . {g1, g 2 ,..., g k } – базис в Ω1 ∩ Ω 2 , то и все λ j = 0, j = [1, k ] , и линейная комбинация, стоящая в левой А поскольку части равенства (7.3.1), тривиальная. Следовательно, {g1, g 2 ,..., g k , g1′ , g ′2 ,..., g l′ , g1′′, g ′2′ ,..., g ′m′ } – линейно независимая система элементов. 3°. Из пункта 2° следует, что набор элементов {g1, g 2 ,..., g k , g1′ , g ′2 ,..., g l′ , g1′′, g ′2′ ,..., g ′m′ } является базисом в Ω1 + Ω 2 . Размерность подпространства Ω1 + Ω 2 при этом равна dim(Ω1 + Ω 2 ) = l + k + m = (k + l ) + (k + m) − k = = dim(Ω1 ) + dim(Ω 2 ) − dim(Ω1 ∩ Ω 2 ). Теорема доказана. Следствие 7.3.1. В случае прямой суммы подпространств dim(Ω1 ⊕ Ω 2 ) = dim(Ω1 ) + dim(Ω 2 ) x ∈ (Ω1 ⊕ Ω 2 ) представим в виде x1 + x2 так, что x1 ∈ Ω1 и x 2 ∈ Ω 2 , единственным и каждый элемент образом, поскольку набор элементов {g1′ , g 2′ ,..., g l′ , g1′′, g ′2′,..., g m′′ } является базисом в Ω1 ⊕ Ω 2 . 248 Аналитическая геометрия и линейная алгебра Линейная оболочка системы элементов Определение 7.3.3. Совокупность всевозможных линейных комбинаций некоторого множества элементов { x1, x 2 ,..., xk } линейного пространства Λ называется линейной оболочкой этого множества и обозначается L {x1 , x 2 ,..., x k } . Множество многочленов степени не выше, чем n, является линейной оболочкой набора одночленов Пример 7.3.2. {1, τ, τ 2 ,..., τ n } в линейном пространстве непрерывных функций C[α, β] . Пусть задан набор элементов {x1 , x 2 ,..., x k } ∈ Λ , порождающих линейную оболочку L{x1, x2 ,..., xk } , тогда любой элемент этой лиk нейной оболочки имеет вид x = ∑ λ i xi и справедлива i =1 Теорема 7.3.3. Множество всех элементов, принадлежащих линейной оболочке L{x1, x 2 ,..., xk } , является в Λ подпространством размерности m , где m – максимальное число линейно независимых элементов во множестве {x1, x2 ,..., xk } . Доказательство. 1°. Непосредственной проверкой убеждаемся, что для совокупk ности элементов вида λi x = ∑ λ i xi (в предположении, что i =1 − произвольные числа) справедливы все аксиомы из 249 Г л а в а 7 . Линейное пространство определения 7.1.1, то есть рассматриваемая линейная оболочка является линейным пространством. 2°. Пусть максимальное число линейно независимых элементов в наборе {x1 , x2 ,..., xk } равно m ≤ k . Без ограничения общности можно считать, что эти элементы суть x1, x2 ,..., xm . В этом случае m x j = ∑ α ji xi ; j = [m + 1, k ] i =1 и любой элемент линейной оболочки может быть представлен в виде линейной комбинации элементов x1 , x 2 ,..., x m . 3°. Покажем теперь, что любой набор из l ( l > m ) элементов данной линейной оболочки будет линейно зависимым. Для этого выберем l элементов y1 , y 2 ,..., y l , принадлежащих линейной оболочке, и выразим ты x1 , x 2 ,..., x m , получим m y j = ∑ β ji xi ; их через элемен- j = [1, l ]. i =1 Приравняем нулевому элементу произвольную линейную комбинацию выбранного набора y1 , y 2 ,..., y l : l l m m l j =1 j =1 i =1 i =1 j =1 ∑ µ j y j = ∑ µ j ∑ β ji xi = ∑ (∑ β ji µ j ) xi = o . x1 , x2 ,..., xm линейно независимы, то Поскольку элементы коэффициенты µ i должны удовлетворять следующей од- нородной системе линейных уравнений l ∑β j =1 ji µ j = 0 , i = [1, m]. Пусть ранг ее основной матрицы равен r. 250 Аналитическая геометрия и линейная алгебра Эта система имеет (по теореме 6.7.1) l−r ≥l−m >0 линейно независимых, и следовательно, ненулевых решений, поскольку r ≤ m . Принимая во внимание, что l и m − не равные друг другу натуральные числа, получаем l − m ≥ 1, то есть существует нетривиальная линейная комбинация элементов y1 , y 2 , ..., y l , равная o. Теорема доказана. Гиперплоскость Определение 7.3.4. Γ , образованное из элементов вида x0 есть произвольный фиксированный элемент линейного пространства Λ , а x – любой элемент некоторого подпространства Ω ⊂ Λ , назыМножество x + x0 , где вается гиперплоскостью (или линейным многообразием) в линейном пространстве Λ . Замечания. 1°. 2°. Задача 7.3.1. В общем случае гиперплоскость не является подпространством. Если dim(Ω) перплоскости. = k , то говорят о k -мерной ги- Показать, что если элементы некоторой гиперплоскости лежать и элемент x и y принадлежат Γ , то ей будет принад- z = αx + (1 − α ) y , где α – любое число. 251 Г л а в а 7 . Линейное пространство § 7.4. Операции с элементами линейного пространства в координатном представлении Определение 7.4.1. Коэффициенты ξ1 , ξ 2 ,..., ξ n разложения по базису n x = ∑ ξ i gi i =1 называются координатами (или компонентами) элемента x линейного пространства Λn в базисе {g1 , g 2 ,..., g n } . Заметим, что в силу теоремы 7.2.1 элемент x линейного про- Λ в базисе {g1 , g 2 ,..., g n } однозначно представляется n странства n -компонентным столбцом, называемым координатным представлением элемента x в базисе {g1 , g 2 ,..., g n } : ξ1 ξ x g= 2 . ... ξn В Λ базис может быть выбран не единственным способом и потому необходимо установить правило изменения координат элемента n линейного пространства му. Λn при переходе от одного базиса к друго- Λn даны два базиса: “старый” {g1 , g 2 ,..., g n } и “новый” {g1′ , g ′2 ,..., g n′ } с соответствующими координатными разложениями Пусть в элемента n n i =1 i =1 x : x = ∑ ξ i g i и x = ∑ ξ′i g i′ . 252 Аналитическая геометрия и линейная алгебра Пусть, кроме того, известны разложения элементов “нового” базиса по элементам “старого”: n g ′j = ∑ σ ij g i ; j = [1, n]. (7.4.1) i =1 Определение 7.4.2. S , j -й (∀j = [1, n]) столбец которой Матрица состоит из коэффициентов σ ij координатных разло- жений элементов “нового” базиса по элементам “старого”, называется матрицей перехода от базиса {g1, g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } . Отметим, что это определение является обобщением определения 1.8.2 и что справедлива Теорема 7.4.1. ξ1 , ξ 2 ,..., ξ n и ξ1′ , ξ′2 ,..., ξ′n связаны со- Координаты n отношениями ξ i = ∑ σ ij ξ′j ∀i = [1, n] , называеj =1 мыми формулами перехода, где коэффициенты элементы матрицы перехода σ ij – S . Доказательство. В силу соотношений (7.4.1) будут справедливы равенства n n n n n n j =1 j =1 i =1 i =1 j =1 ∑ ξ i g i = x = ∑ ξ′j g ′j = ∑ ξ′j ∑ σ ij g i = ∑ (∑ σ ij ξ′j ) g i i =1 n или n ∑ (ξ − ∑ σ i =1 i j =1 ij ξ′j ) g i = o . 253 Г л а в а 7 . Линейное пространство Но если линейная комбинация линейно независимых (в данном случае базисных) элементов равна нулевому элементу, то она тривиальная. Откуда получаем, что n ξ i = ∑ σ ij ξ′j ∀i = [1, n] . j =1 Теорема доказана. Заметим, что если столбец элементов “нового” базиса выражается через столбец элементов “старого” при помощи умножения слева на транспонированную матрицу перехода S T , то координатный стол- бец в “старом” базисе равен произведению матрицы перехода на координатный столбец в “новом” базисе. x Действительно, рассматривая столбцы g и x g′ в форму- лах перехода как двухиндексные матрицы, получаем n ξ i1 = ∑ σ ij ξ′j1 ∀i = [1, n] , j =1 что равносильно равенству x g = S x g′ (см. § 5.1). Используя аналогичный прием, также и соотношения (7.4.1) можно записать в матричном виде g1′ g 2′ ... g1 = S T g n′ или g1′ g 2′ ... g n′ = g1 g2 ... gn g2 ... g n S . В заключение выясним, как операции с элементами линейного пространства выполняются в координатной форме. 254 Аналитическая геометрия и линейная алгебра n n i =1 i =1 x = ∑ ξ i g i и y = ∑ η i g i , тогда в Пусть в конкретном базисе силу определения базиса и аксиом линейного пространства будут справедливы следующие соотношения: 1°. Для операции сравнения: два элемента в n тогда, когда ∑ξ i =1 Λn равны тогда и только n i gi = x = y = ∑ ηi gi , i =1 или в координатной форме x= y ⇔ x g = y g . n 2°. Для операции сложения: x + y = ∑ (ξ i + η i ) g i , i =1 или в координатной форме x+ y g = x g + y g. 3°. Для операции умножения на число: n n λ x = λ ∑ ξ i g i = ∑ ( λξ i ) g i , i =1 или в координатной форме i =1 λx g =λ x g . Откуда следует, что элементы конечномерного линейного пространства не только могут представляться матрицами (столбцами), но и правила выполнения операций с этими элементами совпадают с определением соответствующих матричных операций. § 7.5. Изоморфизм линейных пространств Рассмотрим два линейных пространства: множество многочленов P2 (τ) степени не выше, чем 2, и множество векторов трехмерного геометрического пространства. 255 Г л а в а 7 . Линейное пространство Операции сложения многочленов и их умножения на число выглядят следующим образом: (ξ1 + η1τ + κ1τ 2 ) + (ξ 2 + η 2 τ + κ 2 τ 2 ) = = (ξ1 + ξ 2 ) + (η1 + η 2 )τ + ( κ1 + κ 2 )τ 2 , λ (ξ + ητ + κτ 2 ) = (λ ξ) + (λη)τ + (λκ)τ 2 . Те же операции с трехмерными векторами в координатной форме в свою очередь записываются так: ξ1 ξ2 ξ1 + ξ2 η1 + η 2 = η1 + η 2 ; κ1 κ2 κ1 + κ 2 ξ λξ λ η = λη . κ λκ Сопоставляя эти записи, можно заключить, что природа данных множеств не играет роли, когда исследуются их характеристики, связанные только с операциями сравнения, сложения и умножения на число. Отмеченное свойство линейных пространств носит название изоморфизма. Более точно его описывает Определение 7.5.1. Два линейных пространства Λ1 и Λ 2 называются изоморфными, если существует взаимно однозначное отображение F̂ : Λ1 → Λ 2 , такое, что для ∀λ и ∀x, y ∈ Λ 1 , Fˆ ( x + y ) = Fˆx + Fˆy ; 2°. Fˆ (λ x ) = λ Fˆ x. Отображение F$ называется изоморфизмом линейных пространств Λ1 и Λ 2 . 1°. 256 Аналитическая геометрия и линейная алгебра Напомним, что отображение (биективным), если а) б) F$ является взаимно однозначным разные элементы из Λ1 имеют в Λ 2 разные образы ( F$ инъективно); каждый элемент из Λ 2 является образом некоторого элемента из Теорема 7.5.1 (об изоморфизме). Λ1 ( F$ сюръективно). Два линейных конечномерных пространства Λ1 и Λ 2 изоморфны тогда и только тогда, когда их размерности равны. Доказательство. dim(Λ 1 ) = dim(Λ 2 ) . Принимая правило отображения, при котором каждому элементу x ∈ Λ 1 ставится в соответствие элемент из Λ 2 , имеющий те же самые координаты, а такПусть же используя правила действий с элементами в координатном представлении, приходим к изоморфизму Λ1 и Λ 2 . Допустим, что n = dim(Λ 1 ) > dim(Λ 2 ) = m , где Λ1 и Λ 2 изоморфны. Тогда некоторый набор n линейно независимых элементов из Λ1 отображается в n элементов в Λ 2 , которые обязаны быть линейно зависимыми. Поскольку при изоморфизме нулевой элемент переходит в нулевой элемент, то мы приходим к противоречию с предположением о линейной независимости выбранных n элементов из Λ1 . В случае n < m аналогичные рассуждения также приводят к противоречию, и, следовательно, n = m . Теорема доказана. 257 Г л а в а 7 . Линейное пространство Пример 7.1.2. Изоморфизм одномерных пространств вещественных чи+ сел R и всех положительных чисел R (с операциями, определенными в условии задачи 7.1.3) задается при помощи функций x = ln( y ) и y = e x ; x ∈ R; y ∈ R + . Очевидным следствием теоремы 7.5.1 является изоморфизм любого линейного n -мерного пространства Λ и линейного пространства n -компонентных столбцов, позволяющий убедиться в справедливоn сти свойств столбцов, установленных в §§ 6.5–6.7 для каждого Действительно, имеет место Теорема 7.5.2. Λn . Максимальное число линейно независимых элементов в любом конечном наборе элементов из Λ равно рангу матрицы, столбцы которой содержат координаты элементов данного набора в некотором базисе. n Доказательство. Следует из изоморфности линейного пространства Λ и линейного пространства всех n-компонентных столбцов, а также из теоремы 6.5.3 (о ранге матрицы). n Следствие 7.5.1. Следствие 7.5.2. k элементов в Λn линейно зависимы тогда и только тогда, когда ранг матрицы, столбцы которой содержат координаты этих элементов в некотором базисе, меньше, чем min{n , k } . Матрица перехода невырожденная, то есть det S ≠ 0 . Доказательство. Предположим противное, det S = 0 , тогда rg S < n и столбцы матрицы перехода линейно зависимые. 258 Аналитическая геометрия и линейная алгебра g1′ , g ′2 ,..., g n′ , что противоречит условию о том, что {g1′ , g ′2 ,..., g ′n } – базис. Но тогда будут зависимыми и элементы Следствие доказано. Отметим также, что факт равенства или неравенства двух элементов в координатной форме можно проверять в любом базисе, по- S скольку в силу невырожденности матрицы оказываются спра- ведливыми соотношения x g = y ⇔ g S x g′ = S це перехода g′ ⇔ T = S Существует матрица Следствие 7.5.3. y −1 x g′ = x g′ . , обратная матри- S , называемая обратной матрицей перехода. Для обратной матрицы перехода справедливы соотношения g1 g2 = T ... gn g1′ T g1′ g ′2 и ... g n′ x g′ g 2′ K g n′ = g1 = T x g , следующие из равенств g2 K gn S , x g = S x g′ и теоремы 7.4.1. Пусть в Λn задан базис {g1 , g 2 ,..., g n } , в котором координатное n представление элементов представляется в виде x = ∑ ξ i g i . Тогда i =1 имеет место 259 Г л а в а 7 . Линейное пространство Следствие 7.5.4. Каждая однородная линейная система уравнений с n неизвестными n ∑α i =1 ji m линейных ξ i = 0 , j = [1, m] определяет некоторое подпространство Ω в Λn . Доказательство. Следует из того факта, что данное подпространство Ω в силу теоремы 6.7.2 является линейной оболочкой нормальной фундаментальной системы решений системы линейных уравнений n ∑α i =1 ji ξ i = 0 , j = [1, m] , а Λn изоморфно линейному про- странству n-компонентных столбцов ξ1 ξ2 ... ξ n T . Таким образом, каждое подпространство в Λ может быть задано либо однородной системой линейных уравнений, либо как линейная оболочка базиса подпространства – фундаментальной системы ее решений. n Также справедливо Следствие 7.5.5. Каждая совместная неоднородная линейная система m линейных уравнений с n неизвестными n ∑α i =1 ji ξ i = β j , j = [1, m] определяет некоторую гиперплоскость Γ в Λn . Доказательство. Аналогично рассуждениям, приведенным для следствия 7.5.4. 260 Задача 7.5.1. Аналитическая геометрия и линейная алгебра Проверить, что элементы g1 , g 2 , g3 образуют базис в Λ и найти координатное представление элемента этом базисе, если в некотором исходном базисе: 3 1 1 x = 3 , g1 = 1 , g 2 1 1 Решение. 1°. 2 = 1 0 Для того чтобы из элементов g3 и x в 3 = 0 . 1 g1 , g 2 , g3 можно бы- ло образовать в Λ базис, необходимо и достаточно (определение 7.2.2), чтобы эти элементы были линейно независимыми. По следствию 7.5.1 данное ус3 ловие в Λ3 равносильно неравенству 1 2 3 rg 1 1 0 ≥ 3 , 1 0 1 которое выполняется, поскольку 1 2 3 det 1 1 0 = −4 ≠ 0 . 1 0 1 2°. Обозначим искомые координаты элемента x через ξ1 , ξ 2 , ξ 3 . Тогда x = ξ1 g1 + ξ 2 g 2 + ξ 3 g 3 , или в координатной форме 1 1 2 3 3 = ξ1 1 + ξ 2 1 + ξ 3 0 . 1 1 0 1 261 Г л а в а 7 . Линейное пространство 3°. Использовав условие равенства двух элементов в координатной форме, получим систему линейных уравнений ξ1 + 2ξ 2 + 3ξ 3 = 1, = 3, ξ1 + ξ 2 ξ + ξ 3 = 1, 1 решив которую (например, по правилу Крамера – теорема 6.4.1 или методом Гаусса – § 6.8), получим ξ1 = 2, ξ 2 = 1, ξ 3 = −1 . Откуда следует, что элемент x в базисе { g1 , g 2 , g 3 }, имеет координатное представление 2 x Задача 7.5.2. g = 1 . −1 Найти матрицу перехода от базиса в Λ , образованного элементами {g1′ , g 2′ , g 3′ } , к базису {g1′′, g 2′′, g 3′′} , если в некотором исходном базисе: 3 1 g1′ = 1 , 1 2 g 2′ = 1 , 0 16 g ′2′ = 5 и g 3′′ = 9 22 7 . 8 7 3 g 3′ = 0 , g1′′ = 3 , 1 3 262 Решение. Аналитическая геометрия и линейная алгебра 1°. Пусть x , x′ и x ′′ обозначают коорди- натные столбцы элемента x в трех базисах: исходном, {g1′, g 2′ , g 3′ } и {g1′′, g 2′′, g 3′′} соответственно. Тогда (по определению 7.4.2 и в силу теоремы 7.4.1) имеют место равенства x = G где матрицы x′ и x = F и F составлены из коорди- G x ′′ , g1′, g 2′ , g3′ и натных столбцов базисных элементов g1′′, g 2′′, g3′′ , то есть 1 2 3 7 16 G = 1 1 1 0 0 и F = 3 1 3 5 9 Обозначим через S 22 7 . 8 матрицу перехода от базиса {g1′ , g 2′ , g 3′ } к базису {g1′′, g 2′′, g 3′′} , для которой x′ = S и x ′′ . Но из условий x = G x = F x′ x ′′ следует, что x′ = G поскольку матрица −1 F x ′′ , G , очевидно, невырожден- ная. Тогда элемента S x ′′ = G −1 F x ′′ для любого x ′′ , а это в силу леммы 5.1.2 означает, что искомая матрица перехода S = G −1 F . 263 Г л а в а 7 . Линейное пространство 2°. Подсчитав произведение 1 2 3 1 1 0 1 0 1 −1 7 16 3 3 5 9 22 7 , 8 используя, например, схему, описанную в § 6.8, для G выражений вида −1 F , получаем 2 3 4 S = 1 2 3 . 1 3 4 Задача 7.5.3. В линейном пространстве многочленов степени не выше, чем 3, найти базис и размерность пересечения двух линейных оболочек элементов: x1 (τ) = 1 + 2τ + τ 2 + 3τ 3 , x 2 (τ) = −1 + 8τ − 6τ 2 + 5τ 3 , x 3 ( τ) = 10τ − 5τ 2 + 8τ 3 y1 (τ) = 1 + 4τ − τ 2 + 5τ 3 , и y 2 (τ) = 3 − 2τ + 6τ 2 + 3τ 3 , y 3 ( τ ) = 4 + 2 τ + 5τ 2 + 8τ 3 . Решение. 1°. По теореме 7.4.1 каждая из линейных оболочек является подпространством. Первое из них Π 1 образовано элементами вида x = λ1 x1 + λ 2 x2 + λ 3 x3 , 264 Аналитическая геометрия и линейная алгебра а второе Π 2 – соответственно элементами y = µ1 y1 + µ 2 y 2 + µ 3 y3 . Составим однородные системы линейных уравнений, задающих эти подпространства (см. следствие 7.5.4). Пусть каждое из уравнений этих систем имеет вид α1 α 2 α 3 α 4 ξ1 ξ2 = 0. ξ3 ξ4 Тогда, воспользовавшись изоморфизмом между Π 1 и пространством четырехкомпонентных столбцов вида ξ1 ξ2 = λ1 ξ3 ξ4 где 1 −1 0 2 8 10 + λ2 + λ3 , 1 −6 −5 3 5 8 λ 1 , λ 2 , λ 3 – произвольные числа, приходим к ус- ловию ξ1 α1 α 2 α 3 α 4 ξ2 ξ3 = ξ4 −1 1 = α 1 α 2 α 3 α 4 (λ 1 2 1 3 + λ2 8 −6 5 0 + λ3 10 −5 8 )=0, 265 Г л а в а 7 . Линейное пространство которое будет выполняться при любых если числа λ1 , λ 2 , λ 3 , α1 , α 2 , α 3 , α 4 образуют решение сле- дующей системы линейных уравнений: α1 + 2α 2 + α 3 + 3α 4 = 0, − α1 + 8α 2 − 6α 3 + 5α 4 = 0, 10α 2 − 5α 3 + 8α 4 = 0. Решив эту систему, например, по схеме, описанной в § 6.8, получим общее решение в виде α1 −4 −7 α2 1 −4 = κ1 + κ2 ∀κ1 , κ 2 α3 2 0 α4 0 5 откуда заключаем, что существует два независимых набора искомых чисел α 1 , α 2 , α 3 , α 4 , и, следовательно, однородная система линейных уравнений, задающая подпространство Π 1 имеет вид = 0, − 4 ξ1 + ξ 2 + 2 ξ 3 + 5ξ 4 = 0. − 7 ξ 1 − 4ξ 2 Аналогично строим однородную систему линейных уравнений, задающую Π 2 : − 22ξ1 + 9ξ 2 +14ξ 3 − 11ξ1 − 6ξ 2 Наконец, подпространство ваться системой = 0, + 7ξ 4 = 0. Π 1 ∩ Π 2 будет зада- 266 Аналитическая геометрия и линейная алгебра − 4ξ1 + ξ 2 + 2ξ 3 − 7 ξ − 4ξ 1 2 − 22ξ1 +9ξ 2 +14ξ 3 − 11ξ1 − 6ξ 2 = 0, + 5ξ 4 = 0, = 0, + 7ξ 4 = 0, общее решение которой есть ξ1 2 ξ2 −6 , = σ1 ξ3 7 ξ4 −2 и, следовательно, для Π1 ∩ Π 2 имеем dim( Π 1 ∩ Π 2 ) = 1 и базис, состоящий из одного 2 элемента − 6 . 7 −2 Г л а в а 8 . Линейные зависимости в линейном пространстве 267 Глава 8 ЛИНЕЙНЫЕ ЗАВИСИМОСТИ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ § 8.1. Линейные операторы Определение 8.1.1. Пусть каждому элементу x линейного пространства Λ поставлен в соответствие единственный элемент y линейного пространства Λ∗ . Тогда говорят, что в Λ задан оператор, действующий в Λ и имеющий ∗ значения в Λ , действие которого обозначается как y = Aˆ x . При этом элемент y называется образом элемента x , а элемент x – прообразом элемента y . Как и в § 5.2, операторы подразделяются на отображения, если ∗ Λ ⊄ Λ , и преобразования, если Λ∗ ⊆ Λ . В дальнейшем, за исключением особо оговоренных случаев, будет предполагаться, что Λ∗ ⊆ Λ , то есть мы будем рассматривать преобразования, действующие в Λ . Определение 8.1.2. $ называется линейным, если для y = Ax любых x, x1 , x2 ∈ Λ и любого числа λ имеют место Оператор равенства $ + Ax $ и A$ ( x1 + x 2 ) = Ax 1 2 ˆ (λ x) = λ Aˆ x . 2°. A 1°. 268 Пример 8.1.1. Аналитическая геометрия и линейная алгебра 1°. В пространстве 2-мерных векторов линейным оператором является правило η1 a = 11 η2 a 21 связывающее вектор-прообраз образом y= a12 ξ1 , a22 ξ 2 x= ξ1 с векторомξ2 η1 . η2 2°. В пространстве бесконечно дифференцируемых функций линейным оператором является операция дифференцирования, ставящая в соответствие каждому элементу этого пространства его производную функцию. 3°. В пространстве многочленов Pn (τ) линейным опе- ратором является операция умножения многочлена на независимую переменную τ . Задача 8.1.1. Задача 8.1.2. Решение. Доказать, что операторы в примерах 1°, 2° и 3° являются линейными. $ , ставящий каждому Является ли линейным оператор A элементу x ∈ Λ в соответствие фиксированный элемент a ∈ Λ ? Если элемент вующий в Λ . a = o , то A$ – линейный оператор, дейст- Г л а в а 8 . Линейные зависимости в линейном пространстве 269 § 8.2. Действия с линейными операторами Определение 8.2.1. $ и B$ называются равными, Линейные операторы A Aˆ x = Bˆ x . Равенство операторов ˆ = Bˆ . обозначается как A если ∀x ∈ Λ : $ и B$ называется Суммой линейных операторов A $ + B$ , ставящий кажоператор C$ , обозначаемый A дому элементу x линейного пространства Λ в соот$ ветствие элемент Ax Лемма 8.2.1. $ . + Bx Сумма двух линейных операторов является линейным оператором. Доказательство. Пусть x, y ∈ Λ и λ ; µ – числа, а C$ = A$ + B$ , тогда Cˆ (λ x + µ y ) = A(λ x + µ y ) + Bˆ (λ x + µ y ) = = λ Aˆ x + µ Aˆ y + λBˆ x + µ Bˆ y = = λ( Aˆ x + Bˆ x) + µ ( Aˆ y + Bˆ y ) = = λ( Aˆ + Bˆ ) x + µ ( Aˆ + Bˆ ) y = λ Cˆ x + µ Cˆ y. Лемма доказана. Определение 8.2.2. $ называется оператор, ставяНулевым оператором O щий каждому элементу x линейного пространства Λ в соответствие нулевой элемент этого линейного пространства. 270 Аналитическая геометрия и линейная алгебра Определение 8.2.3. Оператором, противоположным оператору A$ , назы- вается оператор, обозначаемый −  , ставящий каждому x элементу линейного пространства Λ в соответствие элемент ˆ ). −( Ax Заметим, что нулевой и противоположный операторы являются линейными. Легко проверяются следующие равенства для линейных операторов: Aˆ + Bˆ = Bˆ + Aˆ ; ( Aˆ + Bˆ ) + Cˆ = Aˆ + ( Bˆ + Cˆ ) ; Aˆ + Oˆ = Aˆ ; Aˆ + (− Aˆ ) = Oˆ . Определение 8.2.4. Лемма 8.2.2. λ на линейный оператор A$ называется оператор, обозначаемый λ , ставящий каждому элементу x линейного пространства Λ в ˆ x) . соответствие элемент λ( A Произведением числа Произведение линейного оператора на число является линейным оператором, для которого выполняются соотношения α(β Aˆ ) = (αβ) Aˆ ; 1Aˆ = Aˆ ; (α+ β) Aˆ = α Aˆ + β Aˆ ; α( Aˆ + Bˆ ) = α Aˆ + α Bˆ . Доказательство. Утверждение леммы проверяется непосредственно. Например, для третьего равенства имеем ∀x ∈ Λ : (α + β) Aˆ x = = Aˆ ((α + β) x) = Aˆ (αx + β x) = αAˆ x + β Aˆ x . Г л а в а 8 . Линейные зависимости в линейном пространстве Теорема 8.2.1. 271 Множество всех линейных операторов, действующих в линейном пространстве Λ , является линейным пространством. Доказательство. Следует из определений 7.1.1, 8.2.1–8.2.4 и лемм 8.2.1, 8.2.2. Определение 8.2.5. Теорема 8.2.2. Произведением линейных операторов A$ и B$ назы- Aˆ Bˆ , ставящий каждому элементу x линейного пространства Λ в соотˆ ( Bˆ x ) . ветствие элемент A вается оператор, обозначаемый Произведение линейных операторов является линейным оператором, для которого справедливы соотношения Aˆ ( Bˆ Cˆ ) = ( Aˆ Bˆ )Cˆ ; Aˆ ( Bˆ + Cˆ ) = Aˆ Bˆ + Aˆ Cˆ ; ( Aˆ + Bˆ )Cˆ = Aˆ Cˆ + Bˆ Cˆ . Доказательство. Докажем вначале линейность произведения линейных операторов. Действительно, ∀x, y ∈ Λ и любых чисел α, β Aˆ Bˆ (α x + β y ) = Aˆ (α Bˆ x + β Bˆ y ) = = α Aˆ ( Bˆ x) + β Aˆ ( Bˆ y ) = α( Aˆ Bˆ ) x + β( Aˆ Bˆ ) y. Проверим теперь сочетательный закон для произведения линейных операторов. Имеем ( Aˆ ( Bˆ Cˆ )) x = Aˆ ( Bˆ Cˆ x) = Aˆ ( Bˆ (Cˆ x)) , но, с другой стороны, (( Aˆ Bˆ )Cˆ ) x = Aˆ Bˆ (Cˆ x) = Aˆ ( Bˆ (Cˆ x)) , что и требовалось показать. Остальные утверждения теоремы проверяются аналогично. Теорема доказана. 272 Аналитическая геометрия и линейная алгебра в общем случае произведение линейных операторов не обладает перестановочным свойством (или, иначе говоря, операторы не коммутируют), то есть Замечание: A$ B$ ≠ B$ A$ . Определение 8.2.6. A$ B$ − B$ A$ называется коммутатором $ и B$ . операторов A Оператор Коммутатор коммутирующих операторов есть нулевой оператор. Задача 8.2.1. В линейном пространстве алгебраических многочленов n Pn (τ) = ∑ α k τ k найти коммутатор для операторов: k =0 A$ , ставящего в соответствие многочлену его производную функцию, и B$ – оператора умножения многочлена на независимую переменную. Решение. A$ B$ − B$ A$ . Для любого Pn (τ ) Построим оператор имеем n d d n Aˆ Pn (τ) = Pn (τ) = ( ∑ α k τ k ) = ∑ k α k τ k −1 , dτ dτ k = 0 k =1 n n k =0 k =0 Bˆ Pn (τ) = τ (∑ α k τ k ) = ∑ α k τ k +1 . Откуда получаем n n n k =1 k =0 Bˆ ( Aˆ Pn (τ)) = τ ( ∑ k α k τ k −1 ) = ∑ k α k τ k = ∑ k α k τ k k =1 n n d A( Bˆ Pn (τ)) = ( ∑ α k τ k +1 ) = ∑ (k + 1)α k τ k , dτ k = 0 k =0 Г л а в а 8 . Линейные зависимости в линейном пространстве n n k =0 k =0 273 ( Aˆ Bˆ − Bˆ Aˆ ) Pn (τ) = (∑ (k + 1)α k τ k ) − (∑ k α k τ k ) = n = ∑ α k τ k = Pn (τ). k =0 Следовательно, данные линейные операторы не коммутируют. В рассмотренной выше задаче 8.2.1 оказалось, что действие опера- ˆ Bˆ − Bˆ Aˆ на любой элемент линейного пространства многочлетора A нов не приводит к изменению этого элемента. Введем для такого оператора специальное наименование. Определение 8.2.7. Оператор E$ называется единичным (или тождественным) оператором, если каждому элементу x линейного пространства Λ он ставит в соответствие тот же самый элемент, то есть Êx = x ∀x ∈ Λ . Докажите самостоятельно справедливость соотношений: Aˆ Eˆ = Eˆ Aˆ = Aˆ ∀Aˆ , а также линейность и единственность Ê. Определение 8.2.8. Пример 8.2.1. B$ называется обратным оператору A$ и $ −1 , если AB $ $ = BA $ $ = E$ . обозначается A Оператор В линейном пространстве функций f (τ ) , имеющих на [α, β] производную любого порядка и удовлетворяющих условиям f ( k ) (α) = 0 ; k = 0,1, 2, ... , оператор диффе- ренцирования Âf = τ df и Bˆ f = ∫ f (σ) dσ − оператор dτ α 274 Аналитическая геометрия и линейная алгебра интегрирования с переменным верхним пределом являются взаимно обратными. Действительно, τ d Aˆ Bˆ f = ∫ f (σ)dσ = f (τ) = Eˆ f и dτ α τ df Bˆ Aˆ f = ∫ dσ = f (τ) − f (a) = f (τ) = Eˆ f . d σ α Замечания. 1°. Не для всякого линейного оператора существует обратный оператор. Например, нулевой оператор O$ не имеет обратного. Действительно, пусть Oˆ x = o при всех ∀x ∈ Λ , тогда для любого B$ имеет место ( Bˆ Oˆ ) x = Bˆ (Oˆ x) = o ∀x ∈ Λ , ˆ = Eˆ не выполи, следовательно, равенство Bˆ O няется ни при каком B$ . 2°. Обратный оператор, если существует, то только единственный. (Покажите это самостоятельно, использовав как аналог доказательство леммы 5.1.1.) 3°. В случае бесконечномерного линейного простран- Aˆ Bˆ = Eˆ может ˆ = Eˆ , что не следовать выполнение условия Bˆ A ства из справедливости условия имеет место, например, в пространстве многочленов n Pn (τ) = ∑ α k τ k k =0 $ и B$ , где B$ есть операдля пары операторов A тор умножения многочлена на независимую пере- Г л а в а 8 . Линейные зависимости в линейном пространстве A$ многочлену менную, а оператор n ∑α k =0 n соответствие многочлен ∑α k =1 k 275 τ k ставит в τ k −1 . k § 8.3. Координатное представление линейных операторов Пусть в Λn заданы базис {g1 , g 2 ,..., g n } и линейный оператор A$ являющийся отображением в Λm с базисом { f 1 , f 2 ,..., f m } . ∀x ∈ Λn существует единственное разложение ξ1 n ξ2 . Аналогично в Λm существует x = ∑ ξ i g i , то есть x g = ... i =1 ξn В § 7.2 показано, что единственное разложение для сти y = Aˆ x , для которого в силу линейно-  справедливо представление вида n n i =1 i =1 y = Aˆ x = Aˆ (∑ ξ i g i ) = ∑ ξ i Aˆ g i . Приняв во внимание возможность и единственность в m жения Λm разло- Aˆ g i = ∑ α k i f k ∀i = [1, n] , с одной стороны, получаем, что k =1 m n k =1 i =1 y = ∑ (∑ α k i ξ i ) f k . 276 Аналитическая геометрия и линейная алгебра С другой стороны, если y f η1 η = 2 ... ηm – координатное представле- m ние, то имеет место равенство y = ∑ η k f k . Наконец, в силу единk =1 ственности разложения элемента конечномерного пространства по базису получаем n η k = ∑ α k i ξ i ; k = [1, m] . i =1 Данные соотношения позволяют находить координатное представление образов элементов линейного пространства по координатному представлению прообраза. При этом отметим, что каждый линейный Aˆ : Λn → Λm в паре конкретных базисов полностью и однозначно описывается матрицей размера m × n с элементами α k i . оператор вида Определение 8.3.1. m × n , столбцы которой образованы компонентами элементов Âg i : Матрица размера Aˆ fg α11 α = 21 ... α m1 α12 α 22 ... α m2 ... α1n ... α 2 n , ... ... ... α mn называется матрицей линейного оператора зисах A$ в ба- {g1 , g 2 ,..., g n }∈ Λn и { f 1 , f 2 ,..., f m } ∈ Λm . Г л а в а 8 . Линейные зависимости в линейном пространстве 277 n В матричной форме соотношения η k = ∑ α k i ξ i ; k = [1, m] i =1 имеют вид y f = Aˆ fg x g , (8.3.1) в чем легко убедиться, воспользовавшись их двухиндексной формой записи: n η k 1 = ∑ α k i ξ i1 ; k = [1, m] . i =1 Полученный результат формулируется как Теорема 8.3.1. Между множеством всех линейных операторов вида Aˆ : Λn → Λm и множеством всех матриц размера m × n имеется взаимно однозначное соответствие. Доказательство. Выше было показано, что каждому линейному оператору для ˆ : Λ → Λ можно сопоставить конкретной пары базисов A по определению 8.3.1 матрицу размера m × n . n m С другой стороны, соотношение η1 α11 η2 α = 21 ... ... ηm α m1 α12 α 22 ... α m2 ... α1n ξ1 ... α 2 n ξ 2 ... ... ... ... α mn ξ n может быть принято за определение некоторого оператора ви- ˆ : Λ → Λ , линейность которого следует из правил опеда A раций с матрицами. n Теорема доказана. m 278 Пример 8.3.1. Аналитическая геометрия и линейная алгебра 1°. В трехмерном векторном пространстве c ортонормированным базисом рассмотрим линейный оператор, ортогонально проектирующий радиусы-векторы на плоскость Oxy . Поскольку в данном случае → → → → Aˆ g1 = 1 g 1 + 0 g 2 + 0 g 3 → → → → Aˆ g 2 = 0 g1 + 1 g 2 + 0 g 3 , то → → → → Aˆ g = 0 g + 0 g + 0 g 3 1 2 1 0 0 A$ g 3 = 0 1 0 . 0 0 0 Действия с линейными операторами в матричной форме Aˆ : Λn → Λn , то есть n линейные преобразования, действующие в Λ с базисом {g1 , g 2 ,..., g n } , матрица которых квадратная, порядка n . ВведенБудем рассматривать далее операторы вида ные в § 1.1 и § 5.1 операции с матрицами позволяют описать в конкретном базисе действия с линейными операторами в следующей форме. Aˆ = Bˆ ⇔ 1°. Сравнение операторов: Aˆ g = Bˆ . g Aˆ = Bˆ означает, что Согласно определению 8.2.1 условие ∀x ∈ Λn : Aˆ x = Bˆ x , или в координатной форме Aˆ x = Bˆ x ∀x ∈ Λn . g g g g Но тогда по лемме 5.1.2 матрица Aˆ g следовательно, условие − Bˆ Aˆ = Bˆ равносильно Aˆ = Bˆ . g g нулевая и, g Г л а в а 8 . Линейные зависимости в линейном пространстве 2°. Сложение операторов: A$ + B$ Действительно, из g = A$ g + B$ g 279 . n n k =1 k =1 Aˆ g i = ∑ α ki g k и Bˆ g i = ∑ β ki g k следует, что ( Aˆ + Bˆ ) g i = Aˆ g i + Bˆ g i = n n n k =1 k =1 k =1 = ∑ α ki g k + ∑ β ki g k = ∑ (α ki + β ki ) g k . 3°. Умножение оператора на число: λ Aˆ = λ Aˆ g g . n Из Aˆ g i = ∑ α ki g k для любого числа λ находим, что k =1 n (λAˆ ) g i = Aˆ (λg i ) = ∑ (λα ki ) g k . k =1 4°. Произведение операторов: $$ AB g = A$ g B$ g . По определению матрицы линейного оператора имеем n ( Aˆ Bˆ ) g i = Aˆ ( Bˆ g i ) = Aˆ (∑ β ki g k ) = k =1 n n n n k =1 k =1 j =1 j =1 = ∑ β ki Aˆ g k = ∑ β ki ∑ α jk g j = ∑ κ ji g j , n где κ j i = ∑ α jk β k i , что совпадает с определением произk =1 ведения матриц 5.1.1. 280 Аналитическая геометрия и линейная алгебра A$ −1 5°. Обращение операторов: g = A$ −1 g . Будем предполагать, что обратный оператор существует. Поскольку из определения 8.2.8 следует, что A$ −1 A$ = A$ A$ −1 = E$ , принимая во внимание результат пункта 3°, получаем, что искомое матричное представление A$ −1 g шениям оператора A$ −1 g A$ A$ −1 должно удовлетворять соотноg = A$ g A$ −1 являться обратной матрицей к матрице g = E$ A$ g g , то есть . Следствие Размерность линейного пространства линейных отоn m 8.3.1. бражений вида Λ → Λ равна m × n . Доказательство. Из теоремы 8.3.1 и правил действий с линейными операторами в матричной форме следует изоморфизм линейного пространства линейных операторов Λ → Λ и линейного пространства всех матриц размера m × n . Но тогда по теореме 7.5.1 (об изоморфизме) их размерности равны. n m Следствие доказано. Изменение матрицы линейного оператора при замене базиса Выясним, как меняется  fg – матрица линейного отображения Aˆ : Λn → Λm при замене базисов. Пусть в Λn даны два базиса {g1 , g 2 ,..., g n } и {g1′ , g ′2 ,..., g ′n } , Г л а в а 8 . Линейные зависимости в линейном пространстве 281 G , а в Λm – два базиса связанные матрицей перехода { f 1 , f 2 ,..., f m } и { f 1′, f 2′,..., f m′ } с матрицей перехода  fg и Aˆ f ′g ′ F . Найдем соотношение, связывающее . В этом случае справедлива Теорема 8.3.2. Aˆ Матрица линейного оператора f ′g ′ в базисах {g1′ , g ′2 ,..., g n′ } и { f 1′, f 2′,..., f m′ } связана с матрицей этого же оператора  fg в базисах {g1, g 2 ,..., g n } и { f 1 , f 2 ,..., f m } соотношением Aˆ ′′ fg = F −1 Aˆ fg G . Доказательство. {g1, g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } компоненты элементов x – прообраза, и y – По теореме 7.3.1 при переходе от базиса  , в этих базисах связаны раи y f = F y f ′ , где образа при действии оператора венствами x g = G x g′ ξ1 x g= ξ2 ... ξn ; x′ g′ = ξ1′ ξ′2 ... ξ′n , 282 Аналитическая геометрия и линейная алгебра y а f η1′ η′ y f′ = 2 . ... η′m η1 η = 2 ; ... ηm При этом в рассматриваемых базисах образы и прообразы элементов связаны соотношениями y f = Aˆ fg x y и g f′ = Aˆ x f ′g ′ , g′ но поскольку матрица перехода имеет обратную, то из выписанных соотношений последовательно получаем y f′ = F −1 = F −1 y = F f Aˆ fg G −1 x Aˆ g′ x fg g = . Наконец, приходим к равенству ( Aˆ f ′g ′ − F −1 Aˆ fg G ) x g′ из которого в силу произвольности столбца = o , x g′ и леммы 5.1.2 следует утверждение теоремы. Теорема доказана. Следствие 8.3.2. Матрица линейного преобразования при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } в Λn изменяется по правилу Aˆ g′ = S −1 Aˆ g S . Г л а в а 8 . Линейные зависимости в линейном пространстве Следствие 8.3.3. 283 Определитель матрицы линейного преобразования не зависит от выбора базиса в Λn . Доказательство. Из утверждения теоремы 8.3.2 следует det Aˆ g′ = det ( S −1 Aˆ g S ), но поскольку det ( S −1 Aˆ S ) = (det S g и а det S −1 = −1 )(det Aˆ g )(det S ) 1 det S , det S ≠ 0 , то окончательно получаем, что det Aˆ g′ = det Aˆ g . Следствие доказано. Отметим, наконец, что в силу теоремы 8.3.2 в любом базисе нулевой оператор будет иметь нулевую матрицу, а единичный оператор – единичную. § 8.4. Область значений и ядро линейного оператора Трактуя линейный оператор, действующий в линейном пространстве как некоторое обобщение понятия функции, естественно рассмотреть вопрос об области определения и области значений линейных операторов. $ будем понимать Под областью значений линейного оператора A множество образов всех элементов x ∈ Λ , то есть элементов вида $ . В этом случае очевидно, что для любого линейного оператора Ax его область определения совпадает с Λ . 284 Аналитическая геометрия и линейная алгебра Ответ на вопрос: “Что представляет собой область значений линейного оператора?” дает Теорема 8.4.1. A$ – линейный оператор, действующий в линейном пространстве Λ . Тогда Пусть 1°°. Множество элементов странство в Âx ∀x ∈ Λ есть подпро- Λ. Λ = Λn с базисом {g1 , g 2 ,..., g n } , 2°°. Если, кроме того, то размерность этого подпространства равна rg  g . Доказательство. Пусть Λ∗ есть множество элементов вида $ и пусть Ax y1 , y 2 ∈ Λ∗ . Тогда существуют x1 ∈ Λ и x 2 ∈ Λ , такие, что $ = y и Ax $ = y . По свойству линейности оператора Ax 1 1 2 2 A$ имеем y1 + y 2 = Aˆ x1 + Aˆ x 2 = Aˆ ( x1 + x 2 ) ∈ Λ∗ . ˆ x = Aˆ (λ x) ∈ Λ∗ и потому Λ∗ есть Аналогично λ y = λ A подпространство Λ . Λ = Λn с базисом {g1 , g 2 ,..., g n } . Поскольку каждый элемент x ∈ Λ есть линейная комбинация базисных Пусть теперь элементов, то соответственно в силу линейности каждый эле- A$ есть та же линейная комбинаˆ g , Aˆ g ,..., Aˆ g , то есть Λ∗ − линейная ция элементов A 1 2 n ˆ ˆ ˆ g }. оболочка множества { Ag , Ag ,..., A мент из области значений 1 2 n Г л а в а 8 . Линейные зависимости в линейном пространстве Выделим из множества 285 { Aˆ g1 , Aˆ g 2 ,..., Aˆ g n } максимальное подмножество линейно независимых элементов, и пусть число их оказалось равным k. Тогда, применяя теорему 7.4.1, приходим к заключению, что размерность Λ* есть k, а из теоремы 7.5.2 следует, что и rg A$ g =k. Теорема доказана. Определение 8.4.1. $ в Рангом линейного оператора A размерность его области значений. Ранг линейного оператора Следствие 8.4.1. rg Aˆ = rg Aˆ g Λn называется A$ обозначается как rg  . ≤ n и не зависит от выбора бази- са. Следствие 8.4.2. Размерность области значений линейного оператора A$ , действующего на некотором подпростран- стве линейного пространства ходит Λ∗ ⊆ Λ , не превос- dim(Λ∗ ) . Доказательство. ∗ Поскольку подпространство Λ является линейным пространством, то к нему применима теорема 8.4.1. Следствие доказано. Теорема 8.4.2. $ и Ранг произведения линейных операторов A превосходит ранга каждого из этих операторов. B$ не 286 Аналитическая геометрия и линейная алгебра Доказательство. $ $ . По Рассмотрим область значений линейного оператора AB следствию 8.4.2 это подпространство имеет размерность не большую, чем размерность области значений оператора С другой стороны, область значений оператора $ $ содержитAB A$ , и, следовательно, размер- ся в области значений оператора ность области значений B$ . $ $ не превосходит размерности обAB A$ . ласти значений Теорема доказана. A невырожденная, то для Теорема Если квадратная матрица 8.4.3. B любой квадратной матрицы rg ( A B ) = rg ( B того же размера A ) = rg B . Доказательство. A и B как координатные $ и B$ в некотором бапредставления линейных операторов A Будем рассматривать матрицы зисе. Если det A ≠ 0 , то существует 8.4.2 имеем, с одной стороны, другой – rg B = rg ( A Поэтому rg( A Теорема доказана. −1 A rg ( A −1 и в силу теоремы B ) ≤ rg B , но с A B ) ≤ rg ( A B ) = rg( B A ) = rg B . B ). Г л а в а 8 . Линейные зависимости в линейном пространстве Замечания. 1°. Если матрица B не квадратная, но существует одно из произведений det A ≠ 0 при A B B или также верны A , то равенства B ) = rg B или соответственно rg ( A A ) = rg B . rg ( B В этом можно убедиться, заменив матрицу рицей 287 B ∗ B мат- , являющейся дополнением нулевыми столбцами или нулевыми строками B до квадрат- ной так, чтобы существовали A B ∗ B ∗ или A , ибо очевидно, что rg B ∗ = rg B . 2°. Ранг произведения матриц может быть меньше рангов каждого из сомножителей. Например: 1 0 0 0 0 0 0 1 = 0 0 0 0 . Другой важной характеристикой линейного оператора является совокупность элементов линейного пространства Λ , называемая ядром линейного оператора и обозначаемая Определение 8.4.2. ker  . Ядро линейного оператора $ = o. x ∈Λ, таких, что Ax A$ состоит из элементов 288 Аналитическая геометрия и линейная алгебра Теорема 8.4.4. Λ = Λn и rg Aˆ = r , то ker A$ есть подпространˆ) = n− r . ство и dim( ker A Если Доказательство. Непосредственной проверкой можно убедиться, что для выполняются условия определения 7.4.1. ker A$ {g1 , g 2 ,..., g n } оператор  имеет матрицу $ = r для любого . По следствию 8.4.1 rg A g Пусть в базисе Aˆ g = α ij базиса. Тогда в координатной форме условие принадлежности x ∈ Λn с x некоторого элемента A$ имеет вид n ∑α j =1 ij g ξ1 ξ = 2 ядру оператора ... ξn ξ j = 0 ; i = [1, n]. С другой стороны, поскольку каждое решение однородной системы линейных уравнений n ∑α j =1 ij ξ j = 0 ; i = [1, n] $ , то размерность ядра является элементом ядра оператора A есть максимальное число линейно независимых решений этой системы уравнений, которое, согласно теореме 6.7.1, равно n − rg A$ g = n−r. Теорема доказана. Г л а в а 8 . Линейные зависимости в линейном пространстве 289 Типы линейных отображений Как было отмечено в § 8.1, в тех случаях, когда область значений оператора не принадлежит области определения, следует говорить об отображении. В § 7.5 было использовано понятие взаимно однозначного отображения, называемого иногда биекцией. Для отображений также выделяются специальные случаи так называемых инъективных и сюръективных отображений. Рассмотрим эти случаи подробнее. Определение 8.4.3. Отображение y = Aˆ x , x ∈ Ω, екцией), если из условия В случае y = Aˆ x , x1 = x2 , x1 , x2 ∈Ω . инъекции множество x ∈ Ω, Определение 8.4.4. y ∈ Θ множества Ω в множество Θ называется инъективным (или инъ- всех Aˆ x1 = Aˆ x 2 вытекает значений оператора y ∈ Θ может не совпадать с Θ . y = Aˆ x , x ∈ Ω, y ∈ Θ множества Ω на множество Θ называется сюръективным (или сюръекцией), если каждый элемент из Θ имеет прообраз в Ω . Отображение В случае сюръекции прообраз любого элемента из Θ всегда существует в Ω , но, вообще говоря, он не единственен. В таблице 8.4.1 для сравнения приведены примеры отображений различных типов. A$ отображает элементы Λ в элементы Λ с базисом {g1 , g 2 ,..., g n } , то Заметим, что в частном случае, когда линейный оператор n n есть является преобразованием в Λ , оказывается возможным следующее дополнение к определению 8.3.1. n 290 Аналитическая геометрия и линейная алгебра Таблица 8.4.1 Примеры отображений различных типов Тип отображения Инъективное Неинъективное Сюрьективное Несюрьективное Определение 8.4.5. Квадратная матрица  g порядка n , столбцы кото- рой есть координатные представления элементов Aˆ g1 , Aˆ g 2 ,..., Aˆ g n в базисе {g1 , g 2 ,..., g n } , называется матрицей ли$ в базисе {g , g ,..., g }. нейного преобразования A 1 2 n Отметим также, что в конечномерном случае сюръективность ото- Aˆ : Λn → Λm означает выполнение условия Θ = Λm , а ˆ = { o } . Откуда следует, что справединъективность – условия ker A бражения лива Г л а в а 8 . Линейные зависимости в линейном пространстве Теорема 8.4.5. 291 Ранг матрицы линейного оператора, являющегося сюръективным отображением, равен числу ее строк, а ранг матрицы инъективного отображения равен числу ее столбцов. Доказательство. 1º. Пусть в базисах Aˆ : Λ → Λm ние rg Aˆ Aˆ {g1 , g 2 ,..., g n } и { f 1 , f 2 ,..., f m } отображе- n fg fg x g = y f fg причем , ∀ y по теореме 6.6.1 (Кронекера−Капелли) f ∈ Λm , поскольку для ее расширенной rg Aˆ y = m . Значит, для A$ каждый образ имеет хотя бы один прообраз и 2º. Пусть  матрицу = m . Тогда система линейных уравнений вида имеет решение матрицы имеет rg Aˆ fg A$ − сюръективно. = n . Тогда, по теореме 6.4.1 (Крамера), сис- тема линейных уравнений вида Aˆ fg x g = o f имеет единственное решение, которое очевидно тривиальное. Поэтому A$ − инъективно. Теорема доказана. Наконец, отображение, являющееся одновременно и инъективным и сюръективным, будет взаимно однозначным, или биекцией (см. определение 5.2.4). В общем случае, исследование свойств оператора, у которого область значений не содержится в области его определения, может оказаться достаточно сложной задачей. Если же область значений принадлежит конечномерному линейному пространству, то пользуясь 292 Аналитическая геометрия и линейная алгебра теоремой 7.5.1 (об изоморфизме), можно попытаться свести исследование отображения к исследованию преобразования, установив изоморфизм между областью значений отображения и некоторым подпространством области его определения. Λ Пример 8.4.1. 1°. Оператор Pr , ставящий в соответствие каждой точке трехмерного геометрического пространства ее ортогональную проекцию на некоторую фиксированную прямую, проходящую через начало координат, очевидно, есть отображение Λ → Λ , которое, однако, можно рассматривать и как преобразование трехмерного пространства в одномерное подпространство. 3 1 Отметим, что, хотя в данном случае и отображение и преобразование реализуют геометрически одну и ту же функцию, вид задающих их матриц может быть различным. Например, пусть в ортонормированной системе коор→ → → динат {O, e1 , e2 , e3 } прямая, на которую выполняется ортогональное проектирование, задана направляю→ щим вектором e1∗ = 1 1 1 . T e → Несложно убедиться, что радиус-вектор x → r нальной проекции точки с e → ∗ r = → → ( r , e∗ ) → 2 ∗ e r ∗ ортого- = y равен z → e∗ , Г л а в а 8 . Линейные зависимости в линейном пространстве 293 x+ y+z 3 x x + y + z , то есть матрица преобразо∗ y = 3 z∗ x+ y+z 3 ∗ или Λ Λ вания Pr имеет вид Pr e 1 1 1 1 = 1 1 1 . 3 1 1 1 → Но, с другой стороны, приняв вектор в e1∗ за базисный Λ1 , получим, согласно определению 8.4.5, матрицу Λ отображения Pr в виде Λ = Pr e ∗e 1 1 1 1 . 3 2°. Пусть линейный оператор  ставит в соответствие каждой матрице второго порядка мерный столбец вида α 11 α 21 α12 двуα 22 α11 + α12 . α 21 + α 22 Исследование свойств данного отображения можно свести к исследованию свойств преобразования, ставящего в соответствие квадратным матрицам квадратные матрицы вида α11 + α12 α 21 + α 22 0 . 0 294 Задача 8.4.1. Аналитическая геометрия и линейная алгебра Линейное отображение задано матрицей  : Λ3 → Λ3 в некотором базисе 1 2 3 Aˆ = 2 3 4 . Найти его ядро и 3 5 7 множество значений. Выяснить, является ли данное отображение инъективным или сюръективным. ξ1 Решение. 1°. Пусть η1 x = ξ 2 и y = η 2 – координатные предξ3 η3 ставления соответственно прообраза и образа оператора y = Aˆ x . Тогда ядро – множество элементов x , таких, ˆ x = o , задается в координатном представлении что A системой линейных уравнений Aˆ x = o ξ1 + 2ξ 2 + 3ξ 3 = 0, или 2ξ1 + 3ξ 2 + 4ξ 3 = 0, 3ξ + 5ξ + 7ξ = 0, 2 3 1 общее решение которой есть ξ1 1 ξ2 = λ − 2 . ξ3 1 Отсюда заключаем, что ядро линейного отображения  1 есть линейная оболочка элемента − 2 , и поскольку 1 оно не состоит только из нулевого элемента, то данное отображение неинъективное. Г л а в а 8 . Линейные зависимости в линейном пространстве 295 К этому же заключению можно прийти, приняв во внимание, что 1 2 3 1 2 3 rg 2 3 4 = rg 0 1 2 = 2 < 3 3 5 7 0 0 0 – числа столбцов матрицы отображения. 2°.  состоит из ˆ элементов y ∈ Θ, таких, что y = Ax ∀x ∈ Ω . В координатной форме принадлежность элемента y ко множеОбласть значений линейного отображения ству значений означает совместность системы линейных уравнений 1 2 3 ξ1 η1 2 3 4 3 5 7 ξ 2 = η2 , ξ3 η3 следовательно, нам необходимо выяснить, при каких значениях η1 , η 2 , η 3 данная система линейных уравнений совместна. Это можно сделать, например, при помощи теоремы 6.6.1 (Кронекера–Капелли), сравнив ранги основной и расширенной матриц данной системы. Затем из условия 1 2 3 η1 rg 2 3 4 η 2 = 3 5 7 η3 1 2 3 = rg 0 1 2 η1 2η1 − η 2 0 0 0 − η1 − η 2 + η3 1 2 3 = rg 2 3 4 = 2 3 5 7 296 Аналитическая геометрия и линейная алгебра найдем, что для совместности необходимо и достаточно, чтобы η1 + η 2 − η3 = 0 , что, в свою очередь, означает, что множество значений отображения ментов вида η1 −1 A$ состоит из эле- 1 η2 = λ1 1 + λ 2 0 η3 0 1 являющихся решениями уравнения ∀λ 1 , λ 2 , η1 + η 2 − η3 = 0 . Заметим, наконец, что поскольку не каждый элемент y ∈ Θ = Λ3 имеет прообраз в Ω = Λ3 , то данное отображение не является и сюръективным. § 8.5. Инвариантные подпространства и собственные векторы Определение 8.5.1. ∗ Подпространство Λ линейного пространства Λ называется инвариантным подпространством A$ , если ∀ x ∈ Λ∗ : Aˆ x ∈ Λ∗ . линейного оператора Пример 8.5.1. 1°. Множество радиусов-векторов точек некоторой прямой на плоскости Oxy , проходящей через начало координат, является инвариантным подпространством оператора Рис. 8.5.1 Г л а в а 8 . Линейные зависимости в линейном пространстве 297 поворота на угол π этих радиусов-векторов вокруг оси Oz (см. рис. 8.5.1). 2°. Для оператора дифференцирования в линейном пространстве функций f (τ) , имеющих на (α, β) производную любого порядка, n -мерным инвариантным подпространством является линейная оболочка совокупности элементов вида {e где λ 1τ ,e λ 2τ , ... , e λ nτ }, λ 1 , λ 2 ,..., λ n – некоторые, попарно различные константы. Теорема 8.5.1. Матрица линейного оператора нейном пространстве A$ , заданного в ли- Λn с базисом {g1 , g 2 ,..., g n } , тогда и только тогда имеет вид α 11 ... α r1 0 ... 0 ... α1r ... ... ... α rr ... 0 ... ... α1,r +1 ... α r ,r +1 α r +1,r +1 ... ... α1n ... ... ... α rn , ... α r +1,n ... ... ... α n,r +1 ... 0 α nn когда линейная оболочка подмножества базисных элементов {g1 , g 2 ,..., g r } есть инвариантное подпространство оператора A$ . 298 Аналитическая геометрия и линейная алгебра Доказательство. $ имеет Докажем достаточность. Пусть матрица оператора A указанный в формулировке теоремы вид. Тогда образ любой линейной комбинации элементов {g1, g 2 ,..., g r } будет принадлежать их линейной оболочке, поскольку в силу определения 8.3.1 каждый столбец матрицы линейного оператора составлен из компонентов образа соответствующего базисного элемента. r Иначе говоря, если ∑λ k =1 k g k ∈ Λ∗ , то и r Aˆ (∑ λ k g k ) = k =1 r r r = ∑ λ k ( Aˆ g k ) = ∑ λ k ∑ α ik g i = k =1 k =1 r r i =1 k =1 i =1 r = ∑ (∑ α ik λ k ) g i = ∑ β i g i ∈ Λ∗ . i =1 ∗ Λ – подпространство. Доста- Из теоремы 7.4.1 следует, что точность доказана. Λ∗ есть инвариантное подпро$ , являющееся линейной обостранство линейного оператора A лочкой подмножества базисных векторов {g1, g 2 ,..., g r } . ТоДокажем необходимость. Пусть гда образ любого, в том числе и базисного, элемента, принад∗ лежащего Λ , также будет принадлежать редь означает, что r n i =1 i = r +1 Aˆ g k = ∑ α ik g i + ∑ 0g i Λ∗ . Это в свою оче- ; k = [1, r ] и в сочетании с определением 8.4.5 доказывает необходимость. Теорема доказана. Г л а в а 8 . Линейные зависимости в линейном пространстве Задача 8.5.1. 299 Показать, что всякое инвариантное подпространство $ является невырожденного линейного оператора A также инвариантным подпространством оператора A$ −1 . Решение. x ∈ Λ∗ , где – Λ∗ инвариантное подпространство $ , тогда по условию задачи y = Aˆ x ∈ Λ∗ . оператора A Пусть A$ невырожденный, то для него сущест$ −1 и связь элементов x, y ∈ Λ∗ можно вует обратный A $ −1 y , что и означает инвариантзаписать в виде x = A Если оператор ность подпространства A$ −1 . Λ∗ относительно оператора В приложениях важную роль играют так называемые задачи "поиска собственных вектором и собственных значений", основой которых служит понятие одномерного инвариантного подпространства. Определение 8.5.2. f ∈ Λ называется собственным $ , если существует вектором линейного оператора A ˆ f = λ f . Число λ называется число λ , такое, что A $ , соответстсобственным значением оператора A Ненулевой элемент вующим собственному вектору f. f является ненуˆ − λ Eˆ , то есть левым элементом ядра линейного оператора A f ∈ ker( Aˆ − λ Eˆ ) . Заметим, что, согласно данному определению, 300 Аналитическая геометрия и линейная алгебра Замечание о важности собственных векторов Допустим, что для некоторого линейного оператора A$ , заданного Λn , удалось найти n линейно независимых собственных векторов {g1 , g 2 ,..., g n } , для которых выполнены равенства в Aˆ g1 = λ 1 g1 ; Aˆ g 2 = λ 2 g 2 ; ... ; Aˆ g n = λ n g n . Приняв набор этих элементов за базис, данные соотношения можно рассматривать как координатные разложения по базису образов базисных элементов: Aˆ g k = 0 ⋅g1 + 0 ⋅g 2 + K + λ k g k + K + 0 ⋅g n ; ∀k = [1, n] . Поскольку, согласно теореме 7.2.1, эти разложения единственны, то, исходя из определения 8.3.1, можно утверждать, что матрица линейного оператора A$ в этом базисе будет иметь диагональный вид: Aˆ f = λ1 0 0 ... 0 λ2 ... 0 ... 0 ... 0 , ... ... ... λ n для которого исследование свойств этого оператора существенно упрощается. Задача 8.5.2. Показать, что если линейный оператор A$ имеет соб- f с соответствующим ему собственным значением λ , то элемент f будет также являться ственный вектор собственным вектором линейного оператора $$ A$ 2 = AA с собственным значением λ2 . Г л а в а 8 . Линейные зависимости в линейном пространстве По условию Решение. ратора 301 Aˆ f = λ f , но тогда в силу линейности опе-  Aˆ 2 f = Aˆ ( Aˆ f ) = Aˆ (λf ) = λ2 f . Вычисление собственных векторов и собственных значений линейного оператора в Λn Выберем в Λn некоторый базис {g1, g 2 ,..., g n }, в котором разn ложение элемента f ∈ Λn будет f = ∑ ξ i g i , а линейный оператор i =1 A$ имеет в этом базисе матрицу Aˆ Равенство Aˆ g f g g = αk j . Aˆ f = λ f в координатной форме в Λn имеет вид =λ f g , то есть α11ξ1 + α12 ξ 2 + ... + α 1n ξ n = λξ1 , α ξ + α ξ + ... + α ξ = λξ , 21 1 22 2 2n n 2 .......... .......... .......... .......... .......... . α n1ξ1 + α n 2 ξ 2 + ... + α nn ξ n = λξ n , или (α11 − λ )ξ1 + α 12 ξ 2 + ... + α1n ξ n = 0, α ξ + (α − λ)ξ + ... + α ξ = 0, 21 1 22 2 2n n ........................................................ α n1ξ1 + α n 2 ξ 2 + ... + (α nn − λ)ξ n = 0. (8.5.1) 302 Аналитическая геометрия и линейная алгебра Поскольку собственный вектор должен быть ненулевым по определению, то нас интересуют только нетривиальные решения системы (8.5.1), необходимым условием существования которых, согласно следствию 6.7.2, является равенство нулю определителя основной матрицы системы (8.5.1). Таким образом, мы приходим к условию, которому должны удовлетворять собственные значения λ данного линейного оператора: det α kj − λδ kj = 0 α11 − λ α12 α 21 α 22 − λ или же det ... ... α n1 α n2 Определение 8.5.3. Уравнение det Aˆ − λ Eˆ ристическим det Aˆ − λ Eˆ оператора Теорема 8.5.2. ... α1n ... α 2n = 0. ... ... ... α nn − λ g = 0 называется характе- уравнением, g (8.5.2) а определитель – характеристическим многочленом A$ , действующего в Λ n . Характеристический многочлен линейного оператора не зависит от выбора базиса в Λn . Доказательство. Заметим, что оператор Aˆ − λ Eˆ , очевидно, линейный в силу линейности операторов  и Ê . Тогда, согласно следствию 8.3.3, определитель его матрицы не меняется при замене базиса. Поэтому при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } имеем: det Aˆ − λ Eˆ Теорема доказана. g′ = det Aˆ − λ Eˆ g . Г л а в а 8 . Линейные зависимости в линейном пространстве 303 Характеристическое уравнение является алгебраическим уравнением n -й степени относительно λ , что следует из определения детерминанта 6.1.2 и формулы (8.5.2). Таким образом, мы получаем универсальный для Λ алгоритм вычисления собственных значений и соответствующих им собственных векторов: n Решив характеристическое уравнение (8.5.2), из однородной системы уравнений (8.5.1) можно найти собственные векторы, соответствующие последовательно подставляемым в основную матрицу этой системы, найденным собственным значениям. Примеры использования данного алгоритма в Λ иллюстрируют решения задач 8.6.1 и 8.6.2. В случае же линейных пространств, не имеющих базиса, задача отыскания собственных значений и построения собственных векторов может оказаться значительно сложнее. Например, в линейном пространстве функций, имеющих на некотором интервале производную любого порядка, линейный оператор дифференцирования имеет бесконечно много собственных векторов вида f (τ) = α e λτ (где α – произвольная ненулевая константа) и соотn ветствующих им собственных значений λ , находимых из дифферен- df циального уравнения =λf . dτ § 8.6. Свойства собственных векторов и собственных значений Теорема 8.6.1. В комплексном линейном пространстве Λ всякий линейный оператор имеет хотя бы один собственный вектор. n 304 Аналитическая геометрия и линейная алгебра Доказательство. Поскольку характеристическое уравнение является алгебраическим уравнением n -й степени относительно λ , то к нему при11 менима основная теорема высшей алгебры , утверждающая, что такое уравнение имеет хотя бы один комплексный корень. Теорема доказана. В случае вещественного линейного пространства теорема 8.6.1 неверна. Например, линейный оператор поворота плоскости Oxy вокруг начала координат на угол ϕ ≠ kπ не имеет ни одного собственного вектора. Действительно, характеристическое уравнение для этого оператора имеет вид (см. § 5.5): det cos ϕ − λ − sin ϕ sin ϕ cos ϕ− λ = 0 или λ2 − 2λcos ϕ+ 1 = 0 , то есть λ = cos ϕ ± i sin ϕ . Откуда следует, что при ϕ ≠ kπ вещественных решений данное характеристическое уравнение не имеет. Теорема 8.6.2. В вещественном линейном пространстве Λ всякий линейный оператор имеет либо хотя бы один собственный вектор, либо двумерное инвариантное подпространство. n Доказательство. Если характеристическое уравнение имеет вещественный корень, то из системы (8.5.1) находим собственный вектор. Пусть характеристическое уравнение имеет комплексный корень λ = α + β i, тогда, решив систему (8.5.1), получим соответствующий ему комплекснозначный собственный вектор f = u + w i , где u и w – элементы Λn , представляемые вещественными n -компонентными столбцами. 11 Доказывается, например, в курсе ТФКП. Г л а в а 8 . Линейные зависимости в линейном пространстве 305 u и w линейно независимые. Допустим противное: u = κw . Тогда из соотношения Aˆ f = λ f имеем, что Aˆ (( κ + i ) w) = λ( κ + i )w , или Aˆ w = λ w , то есть λ – веще- Покажем, ственное, что противоречит предположению о невещественности собственного значения. Подставим выражения для собственного значения и собственного вектора в их определение: Aˆ f = λ f . Получаем Aˆ (u + wi ) = (α + β i )(u + w i ) , $ или в силу линейности A ( Aˆ u ) + ( Aˆ w) i = (αu − βw) + (βu + α w) i, и из равенства действительных и мнимых частей находим, что Aˆ u = αu − βw, ˆ Aw = βu + α w. $ имеет двумерное инвариНо это и означает, что оператор A антное подпространство, совпадающее с двумерной линейной оболочкой элементов u и w, поскольку Aˆ (ξu + ηw) = ξ Aˆ u + η Aˆ w = ξ(αu − βw) + η(βu + αw) = = (ξα + ηβ)u + (ηα − ξβ) w. Теорема доказана. Задача 8.6.1. Найти собственные значения и собственные векторы $ , действующего в пространстве трехмероператора A ных столбцов и заданного матрицей −1 − 2 2 − 2 −1 2 . −3 −2 3 306 Аналитическая геометрия и линейная алгебра Решение: $ действует в ком1°. Рассмотрим сначала случай, когда оператор A плексном линейном пространстве. Будем искать собственные значения по формулам (8.5.1) – (8.5.2). Воспользовавшись правилом разложения определителя по первой строке (см. теорему 1.1.1), получим −1− λ −2 2 det − 2 −1− λ 2 = −3 −2 3−λ = − (1 + λ )(λ − 1) 2 + 2(2λ − 6 + 6) + 2(4 − 3 − 3λ ) = = −λ3 + λ2 − λ + 1 = −(λ2 + 1)(λ − 1). Откуда следует, что из трех собственных значений одно – вещественное и два женные12. λ1 = 1 λ 2 = i и λ 2 = −i – комплексно сопря- 2°. Найдем теперь собственные векторы. Пусть по формулам (8.5.2) имеем − 2 − 2 2 ξ1 λ = λ 1 = 1 , тогда, 0 − 2 − 2 2 ξ2 = 0 . − 3 − 2 2 ξ3 0 Преобразовав матрицу построенной системы линейных уравнений, получим компоненты собственных векторов ξ1 , ξ 2 и ξ 3 из 1 условий 1 12 См. приложение 3. 1 0 −1 0 ξ1 0 ξ2 = 0 . ξ3 0 Г л а в а 8 . Линейные зависимости в линейном пространстве 307 Следовательно, собственный вектор f 1 , отвечающий собственному значению λ1 = 1 , имеет вид ξ1 0 ξ2 = µ 1 ξ3 1 3°. Пусть теперь (8.5.1) λ = λ2 = i , −1− i −2 −3 ∀µ ≠ 0 . тогда систему линейных уравнений −2 2 −1− i 2 − 2 3−i ξ1 0 ξ2 = 0 ξ3 0 можно упростить, разделив13 обе части первого уравнения на 1 + i . Заметим, что в полученной таким образом системе −1 −1+ i 1− i ξ1 − 2 −1− i 2 −3 −2 3−i ξ2 = 0 ξ3 0 0 третье уравнение оказывается суммой первых двух и его можно отбросить как линейно зависимое. Заменив затем второе уравнение разностью удвоенного первого и второго, получим −1 −1+ i 1− i 0 − 1 + 3 i 2i 13 ξ1 0 ξ2 = 0 . ξ3 0 Правило деления комплексных чисел приведено в приложении 3. 308 Аналитическая геометрия и линейная алгебра И наконец, после умножения обеих частей второго уравнения на ( −i ) приходим к −1 −1+ i 1− i 0 3+i −2 ξ1 0 ξ2 = 0 . ξ3 0 Полагая значение свободного неизвестного ξ 3 = 3 + i , находим второй собственный вектор: ξ1 2 f2 = ξ2 = µ 2 ξ3 3+i ∀µ ≠ 0 . 4°. Проведя аналогичные вычисления, найдем, что собственный вектор, отвечающий собственному значению λ 3 = −i , имеет вид ξ1 2 f3 = ξ2 = µ 2 ξ3 3−i ∀µ ≠ 0. (Покажите самостоятельно, что комплексная сопряженность f 2 и f 3 не случайна, то есть если λ 2 и λ 3 комплексно сопряжены, то будут комплексно сопряжены и собственные векторы f 2 и f 3 .) $ действует в вещественном линейном про5°. Если оператор A $ имеет собственный векстранстве, то согласно теореме 8.6.2 A тор 0 1 , отвечающий собственному значению λ 1 = 1 , 1 Г л а в а 8 . Линейные зависимости в линейном пространстве 309 и инвариантное подпространство, являющееся линейной оболоч- 2 0 кой элементов u = 2 и w = 0 , то есть которое будет со3 1 стоять из элементов вида ξ1 2 0 ξ 2 = µ1 2 + µ 2 0 ; ∀µ1 , µ 2 . ξ3 3 1 Заметим, что при необходимости искомое инвариантное подпространство может быть задано и в виде α 1 ξ1 + α 2 ξ 2 + α 3 ξ 3 = 0 (см., например, решение задачи 8.4.1). Теорема 8.6.3. Совокупность собственных векторов, отвечающих некоторому собственному значению линейного опера- $ , дополненная нулевым элементом линейного тора A пространства Λ , является инвариантным подпро- $. странством оператора A Доказательство. Aˆ f 1 = λ f 1 и Aˆ f 2 = λ f 2 . Тогда для любых, не равных нулю одновременно чисел α и β : Aˆ (α f 1 + β f 2 ) = = α Aˆ f 1 + β Aˆ f 2 = αλ f 1 + βλ f 2 = λ(α f1 + β f 2 ), Пусть что и показывает справедливость утверждения теоремы. Теорема доказана. 310 Аналитическая геометрия и линейная алгебра Определение 8.6.1. Подпространство, состоящее из собственных векторов, отвечающих некоторому собственному значению, дополненных нулевым элементом, называется инвариантным собственным (или просто собственным) $. подпространством линейного оператора A Теорема 8.6.4. Всякое инвариантное собственное подпространство линейного оператора  является также инвариантным подпространством линейного оператора B̂ , если операторы  и B̂ коммутируют. Доказательство. Λ∗ – инвариантное собственное подпространство опера∗ тора  , то есть  f = λ f ∀f ∈Λ . ˆ f = Bˆ (λf ) , а в силу комНо тогда справедливо равенство Bˆ A Пусть $ и B$ будет верно и мутируемости и линейности операторов A ∗ Aˆ ( Bˆ f ) = λ ( Bˆ f ) при ∀f ∈ Λ . B̂ f ∈ Λ∗ при ∀f ∈ Λ∗ , то ∗ есть Λ – инвариантное подпространство оператора B$ . Последнее условие означает, что Теорема доказана. Теорема 8.6.5. Собственные векторы линейного оператора, отвечающие различным собственным значениям, линейно независимы. Доказательство. Один собственный вектор линейно независим как ненулевой. Пусть имеются m линейно независимых собственных векторов f 1 , f 2 , ... , f m оператора A$ , отвечающих различным собственным значениям. Г л а в а 8 . Линейные зависимости в линейном пространстве 311 Покажем, что в этом случае будут линейно независимы и m + 1 собственных векторов f 1 , f 2 , ... , f m , f m+1 , если они также отвечают различным собственным значениям. Предположим противное: существует нетривиальная и равная нулевому элементу линейная комбинация собственных векторов f 1 , f 2 , ... , f m , f m +1 : κ1 f 1 + κ 2 f 2 + ... + κ m f m + κ m +1 f m+1 = o , (8.6.1) причем без ограничения общности можно считать, что число κ m +1 ≠ 0. Подействуем  на обе части равенства (8.6.1): Aˆ ( κ1 f1 + κ 2 f 2 + ... + κ m f m + κ m+1 f m+1 ) = = κ1λ 1 f1 + κ 2 λ 2 f 2 + ... + κ m λ m f m + κ m+1λ m+1 f m+1 = o. (8.6.2) С другой стороны, умножая обе части равенства (8.6.1) на λ m+1 и вычитая почленно результат этого умножения из равенства (8.6.2), получим κ1 (λ 1 − λ m+1 ) f 1 + κ 2 (λ 2 − λ m+1 ) f 2 + ... K + κ m (λ m − λ m +1 ) f m = o . Поскольку все собственные значения разные, а векторы f1 , f 2 ,..., f m линейно независимые, то κ1 = κ 2 = ... = κ m = 0. Но тогда из (8.6.1) следует κ m+1 = 0 , что противоречит сде- ланному выше предположению, и по принципу математической индукции из линейной независимости элементов f1 , f 2 , ... , f m следует линейная независимость элементов f 1 , f 2 , ... , f m , f m+1 . Теорема доказана. 312 Аналитическая геометрия и линейная алгебра Следствие 8.6.1. Теорема 8.6.6. Линейный оператор A$ в Λ может иметь (с точностью до произвольного ненулевого множителя) не более чем n собственных векторов, отвечающих различным собственным значениям. n $ , действующий в Λ , Если линейный оператор A имеет n различных собственных значений, то существует базис, образованный собственными вектораn $ , в котором матрица данного линейного операми A тора имеет диагональный вид, причем на ее диагонали $. расположены собственные числа оператора A Доказательство. Следует из теоремы 8.6.5 и замечания о важности собственных векторов § 8.5. Теорема 8.6.7. Λ∗ – инвариантное собственное подпростран$ , отвечающее некоторому ство линейного оператора A Пусть собственному значению λ 0 кратности k. Тогда имеет место соотношение 1 ≤ dim(Λ∗ ) ≤ k . Доказательство. Выберем в Λn базис {g1, g 2 ,..., g m , g m +1,..., g n } так, чтобы его первые m = dim(Λ∗ ) элементов принадлежали Λ∗ . В силу условия кратности собственного значения Aˆ g i = λ 0 g i ; i = [1, m] , поэтому матрица Aˆ − λ Eˆ g в этом базисе, согласно замеча- нию о важности собственных векторов (см. § 8.5), будет иметь вид Г л а в а 8 . Линейные зависимости в линейном пространстве Aˆ − λ Eˆ g = λ0 −λ = 313 ... 0 α1,m +1 ... α1n λ 0 − λ ... ... ... 0 ... α 2, m+1 ... ... ... α 2n ... α mn ... 0 0 ... 0 ... 0 ... ... λ 0 − λ α m, m+1 ... ... ... ... ... 0 0 ... 0 α n ,m +1 . ... α nn − λ Откуда следует, что det Aˆ − λ Eˆ g = (λ 0 − λ) m Pn−m (λ ). Поскольку множители вида (λ 0 − λ) могут содержаться также и в многочлене Pn−m (λ ) , то m ≤ k , где k – кратность корня λ 0 характеристического многочлена det Aˆ − λ Eˆ g . Условие 1 ≤ m очевидно, поскольку подпространство нулевое (содержит собственные векторы). Λ∗ не- Теорема доказана. Таким образом, размерность инвариантного собственного подпро- Λ∗ , отвечающего собственному значению λ 0 кратности k , может оказаться меньше k , что иллюстрирует странства Задача 8.6.2. Найти собственные значения и собственные векторы оператора, действующего в пространстве двумерных 1 1 столбцов и заданного матрицей 0 1 . 314 Аналитическая геометрия и линейная алгебра Решение. Находим собственные значения: det 1− λ 1 = (1 − λ) 2 = 0, 0 1− λ то есть λ 1, 2 = 1 и кратность собственного значения k = 2 . Найдем теперь собственные векторы: 0 1 0 0 ξ1 0 = ξ2 0 ⇒ x=µ 1 0 ∀µ ≠ 0 . Таким образом, получаем, что данный линейный оператор имеет одномерное инвариантное собственное подпро∗ странство ( m = dim( Λ ) = 1 ), соответствующее собст- венному значению кратности 2. λ =1 На основании теорем 8.6.2, 8.6.5 и 8.6.6 приходим к выводу, что базис в конечномерном вещественном линейном пространстве, образованный из собственных векторов действующего в нем линейного оператора, может не существовать из-за невещественности или кратности его собственных значений. Теорема 8.6.8. Λn имеет нулевое собствен$ ное значение тогда и только тогда, когда оператор A $ в Линейный оператор A не является взаимно однозначным. Доказательство. $ имеет в Λ собственное значение, равЛинейный оператор A ное нулю, тогда и только тогда, когда его матрица вырожденn ная, то есть в любом базисе det A$ = 0 . Пусть в Λ координатный столбец образа связан с координатным столбцом прообраза n Г л а в а 8 . Линейные зависимости в линейном пространстве η1 α11 η2 α = 21 ... ... ηn α n1 α12 α 22 ... α n2 315 ... α1n ξ1 ... α 2 n ξ 2 . ... ... ... ... α nn ξ n Из теоремы 6.4.1 (Крамера) следует, что для заданного координатного столбца элемента-образа эта система линейных уравнений, у которой неизвестными являются компоненты столбца элемента-прообраза, либо будет несовместной (элементпрообраз не существует), либо будет иметь согласно следствию 6.7.1 неединственное решение (элемент-прообраз определяется неоднозначно). Теорема доказана. Определение 8.6.2. Q с натуральным показателем k ≥ 2 называется произведение k сомножителей вида Q . Будем также считать, что Степенью квадратной матрицы Q Теорема 8.6.9 (Гамильтона– Кэли). 1 = Q и Q 0 = E . $ в Λ удовлеМатрица линейного оператора A творяет его характеристическому уравнению. n Доказательство. Докажем данную теорему в предположении, что собственные векторы оператора  образуют в Λn базис { f 1 , f 2 ,..., f n } . Пусть данный линейный оператор  в этом базисе имеет матn рицу  и характеристическое уравнение f ∑α k =0 k λk = 0 . 316 Аналитическая геометрия и линейная алгебра Тогда в силу линейности  для собственного вектора f , соответствующего собственному значению λ , имеем (см. задачу 8.5.2) n n k (∑ α k Aˆ k ) f = ∑ α k ( Aˆ f k =0 f )= f k =0 n = ∑ α k ( Aˆ f k =0 ( Aˆ f ...( Aˆ n n k =0 k =0 f f )...) ) = = ∑ α k (λk f ) = (∑ α k λk ) f = 0 ⋅ f = o . Но поскольку это соотношение верно для всех базисных векторов, то оно будет верно и для каждого элемента x ∈ Λ . Тогда из леммы 5.1.2 следует, что n n ∑α k =0 k Aˆ k = Oˆ f . f Наконец, выполнив переход к произвольному базису {g1 , g 2 ,..., g n } , получим n ∑ α k Aˆ k =0 k g n = ∑αk ( S −1 = ∑ αk ( S Aˆ k =0 n = ∑ αk ( S k =0 −1 Oˆ Aˆ k =0 n = S −1 f Теорема доказана. −1 Aˆ f k f S S −1 S )= S S = Oˆ g . S )k = f Aˆ −1 −1 S ... S f n ( ∑ α k Aˆ k =0 k f Aˆ f ) S = S )= Г л а в а 8 . Линейные зависимости в линейном пространстве 317 теорема Гамильтона–Кэли также верна и для линейных операторов, из собственных векторов которых базис образовать не удается. Замечание: § 8.7. Линейные функционалы Рассмотрим специальный случай линейного оператора, когда его область значений содержится в одномерном линейном пространстве, изоморфном множеству вещественных чисел. Такого рода зависимости, следуя классификации, введенной в § 5.2, следует относить к функционалам. Напомним данное ранее Определение 8.7.1. Пусть каждому элементу x линейного пространства Λ поставлено в соответствие однозначно определяемое число, обозначаемое f ( x ) . Тогда говорят, что в Λ задан функционал f ( x) . Пример 8.7.1. 1°. В пространстве n-компонентных столбцов можно ξ1 ξ2 задать функционал, поставив столбцу в соот... ξn n ветствие число ∑φ ξ i =1 i i , где φ i , i = [1, n] – неко- торые фиксированные константы. 2°. В векторном геометрическом пространстве функционалом является длина вектора, то есть → f ( x) = | x |. 3°. В пространстве функций x ( τ) , определенных на [−1,1] , функционалом является f ( x) = x(0) – 318 Аналитическая геометрия и линейная алгебра ”дельта-функция”, обозначаемая как δ( x) , ставящая в соответствие каждой функции x ( τ) ее значение в нуле. 4°. В пространстве функций x ( τ) , непрерывных на [α, β] , функционалом является определенный интеβ грал, то есть f ( x) = ∫ p(τ) x(τ)dτ , где p (τ) – неα которая заданная на [α, β] непрерывная функция. 5°. В линейном пространстве квадратных матриц вида α11 α 21 α12 функционалом является определитель α 22 det Определение 8.7.2. α11 α 21 α 12 = α11α 22 − α12 α 21 . α 22 Функционал f ( x ) называется линейным функционалом (или линейной формой), если для любых x, y ∈ Λ и любого числа λ : 1°. f ( x + y ) = f ( x ) + f ( y ). 2°. f (λ x ) = λ f ( x ). Задача 8.7.1. Доказать, что функционалы в примерах 1°, 3° и 4° являются линейными, а функционалы в примерах 2° и 5° – нет. Представление линейного функционала в Λn Пусть в Λn дан базис {g1 , g 2 ,..., g n } и пусть координатное пред- ставление элемента линейного пространства имеет вид x = n ∑ξ i =1 i gi . Г л а в а 8 . Линейные зависимости в линейном пространстве 319 Тогда в силу линейности функционала справедливы соотношения n n n i =1 i =1 i =1 f ( x) = f (∑ ξ i g i ) = ∑ ξ i f ( g i ) = ∑ φ i ξ i , где φ i = f ( g i ) , i = [1, n] – числа, называемые компонентами линейного функционала в данном базисе. Из последних равенств следует легко проверяемая Теорема 8.7.1. Каждый линейный функционал f ( x ) в кретном базисе {g1, g 2 ,..., g n } имеет однозначно оп- ределяемую f g строку = φ1 компонентов φ 2 K φ n , а каждая строка компо- φ1 нентов Λn в кон- φ2 K φn в конкретном базисе в Λ определяет некоторый линейный функционал по n n формуле f ( x) = ∑ φ i ξ i или в матричном виде i =1 f ( x) = f g x g . Запись координатного представления линейного функционала в Λ в виде строки (а не столбца!) следует из необходимости обеспечить соответствие этого представления определению 8.4.5, поскольку n линейный функционал в бражение Λ → Λ . n Λn можно рассматривать как линейное ото- 1 Получим теперь правило изменения компонент линейного функционала в Λ при переходе от одного базиса к другому. Пусть в Λ даны два базиса {g1 , g 2 ,..., g n } и {g1′ , g ′2 ,..., g n′ } , связанные матриn n n цей перехода S = σ ij , где g ′j = ∑ σ ij g i ∀j = [1, n] . i =1 320 Аналитическая геометрия и линейная алгебра x будут иметь Координатные представления некоторого элемента в рассматриваемых базисах вид x = n ∑ξ i =1 n i g i = ∑ ξ′i g i′ , а коордиi =1 натные представления линейного функционала f ( x ) – соответственно n n i =1 i =1 f ( x) = ∑ φ i ξ i = ∑ φ′i ξ′i . Найдем выражения для величин φ′i через φ i . Используя введен- ные обозначения, получаем n n n k =1 k =1 k =1 φ′i = f ( g i′ ) = f (∑ σ ki g k ) = ∑ σ ki f ( g k ) =∑ φ k σ ki , что доказывает следующее утверждение. Теорема 8.7.2. Λ n в базисах {g1 , g 2 ,..., g n } и {g1′ , g ′2 ,..., g n′ } ком- В поненты координатных представлений линейного f функционала f g′ = φ1′ , φ′2 , ... , φ′n g = φ1 , φ 2 , ... , φ n связаны и соотношением n φ′k = ∑ φ i σ ik ; k = [1, n] , где коэффициенты σ ik – i =1 коэффициенты S – матрицы перехода от первого базиса ко второму. В f матричной g′ = f g форме это утверждение имеет вид S , что означает, что компоненты линейного функ- ционала в Λ преобразуются при замене базиса так же, как преобразуются столбцы базисных элементов (см. § 7.3). n Г л а в а 8 . Линейные зависимости в линейном пространстве 321 Двойственное (сопряженное) пространство. Взаимный (биортогональный) базис Поскольку линейные функционалы в Λ являются частным случаем линейных операторов, то для них можно ввести операции сравнения, сложения и умножения на число. Задача 8.7.2. Показать, что в Λ с базисом {g1 , g 2 ,..., g n } операции сложения и умножения на число для линейных функционалов p( x ) и q ( x ) в координатном представлении имеют вид n p+q g = φ1 + ψ 1 λp φ2 + ψ 2 ... φ n + ψ n g = λφ1 λφ 2 g = K φ1 φ2 ... φ n и = ψ1 ψ2 ... ψ n . и ... λφ n , где p q g Очевидно, что при этом будут справедливы все утверждения § 8.2, в том числе и Теорема 8.7.3. Множество всех линейных функционалов, заданных в линейном пространстве Λ , является линейным пространством. Определение 8.7.3. Линейное пространство линейных функционалов, заданных в Λ , называется двойственным (или сопряженным) пространству Λ и обозначается Λ+ . Теорема 8.7.1 устанавливает взаимно однозначное соответствие между множествами линейных функционалов и n-компонентных строк, последнее из которых является линейным n-мерным простран- 322 Аналитическая геометрия и линейная алгебра ством. Принимая во внимание, что операции с линейными функционалами в координатном представлении в Λ совпадают с аналогичными операциями для n-компонентных строк, можно прийти к заклюn чению об изоморфности линейных пространств будет справедлива Теорема 8.7.4. Размерность пространства равна n . Λn и Λn+ . Поэтому Λn+ , двойственного Λn , Как и во всяком n-мерном линейном пространстве, в существовать базис. Пусть он состоит из n+ {r1 , r2 ,..., rn }; ri ∈ Λ Λn+ должен элементов ∀i = [1, n] . Тогда каждый элемент f ∈ Λn+ может быть однозначно представлен в виде линейной комбинации базисных элементов, то есть f = n ∑ ρ r , а стандартное для i =1 i i Λn столбцовое координатное представление элемента f , будет иметь вид f r ρ1 ρ = 2 . L ρn Связь между координатными представлениями линейного функционала f в базисах {g1 , g 2 ,..., g n } ⊂ Λn и {r1 , r2 ,..., rn } ⊂ Λn + задается квадратной, порядка рой являются числа ла n , матрицей Γ γ ij = ri ( g j ) ; i, j = [1, n] ri на элементах g j . rg , элементами кото- – значения функциона- Г л а в а 8 . Линейные зависимости в линейном пространстве Задача 8.7.3. Доказать, что если 323 {r1 , r2 ,..., rn } – базис в Λn+ , а {g1 , g 2 ,..., g n } – базис в Λn , то f Определение 8.7.4. r =( Γ T rg ) −1 f Если матрица Γ rg T g f или g = f T r Γ rg . = E , то есть 1, i = j , γ ij = δ ij = ∀i, j = [1, n] , 0, i ≠ j то базисы {g1 , g 2 ,..., g n } и {r1 , r2 ,..., rn } называются взаимными (биортогональными). Отметим, что если базис для базиса {r1 , r2 ,..., rn } в Λn+ является взаимным {g1 , g 2 ,..., g n } в Λn , то для любого линейного функ- ционала f ( x) его координатные представления в ны очевидным соотношением f r = f T g Λn и в Λn+ связа- . Вторичное двойственное (вторичное сопряженное) пространство Λn+ является n -мерным линейным пространством, то n в нем так же, как и в Λ , возможно определять линейные функционаПоскольку лы и рассматривать их множество как новое линейное пространство Λn+ + , двойственное к Λn+ . Будем называть пространство Λn+ + втоn ричным двойственным для линейного пространства Λ . n n+ n+ + Вполне очевидно, что линейные пространства Λ , Λ и Λ nмерные и, следовательно, изоморфны друг другу. Однако для проn+ + существует особый изоморфизм, позволяющий странств Λ и Λ не делать различия между ними и который может быть построен следующим образом. n 324 Аналитическая геометрия и линейная алгебра x – некоторый элемент из Λn , а X ( f ) – действующий в Λn+ функционал, такой, что X ( f ) = f ( x) ∀f ∈ Λn + . Убедимся n+ вначале, что X ( f ) линейный на Λ , то есть он будет некоторым n+ + элементом в Λ . Действительно, Пусть X (λ 1 f 1 + λ 2 f 2 ) = λ 1 f 1 ( x ) + λ 2 f 2 ( x ) = = λ 1 X ( f1 ) + λ 2 X ( f 2 ) ∀λ 1 , λ 2 ∈ ℜ ; Это означает, что f1 , f 2 ∈ Λn + . X ( f ) ∈ Ω ∀f ∈ Λn + , где, согласно теореме 8.4.1, Ω – подпространство линейного пространства Λn+ + . X ( x) : Λn → Ω , которое можно n записать и как y = X ( f ( x )) ∀x ∈ Λ ; y ∈ Ω . Оно будет линейным, как произведение (композиция) линейных отображений X ( f ) и f ( x) , и, кроме того, очевидно, взаимно однозначным. Следовательно, y = X ( f ( x )) – отображение, устанавливающее изоморфизм лиТеперь рассмотрим отображение Λn и множества Ω , а тогда в силу теоремы n 7.5.1 dim(Ω) = dim ( Λ ) = n . нейного пространства Наконец, отметим, что сочетание условий dim (Λn++ ) = n = dim(Ω) и Ω ⊂ Λn+ + n++ означает совпадение множества Ω и линейного пространства Λ . Таким образом, мы приходим к заключению, что отображение y = X ( f ( x)) ∀x ∈ Λn ; y ∈ Λn + + устанавливает тождественное взаимно однозначное соответствие между элементами линейных про- Λn и Λn+ + , позволяющее считать их одним и тем же проn странством Λ и записывать связь между значениями линейных n n+ функционалов, действующих в Λ и Λ , в симметричной форме странств вида x( f ) = f ( x) ; ∀x ∈ Λn ; ∀f ∈ Λn + . Г л а в а 9 . Нелинейные зависимости в линейном пространстве 325 Глава 9 НЕЛИНЕЙНЫЕ ЗАВИСИМОСТИ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ § 9.1. Билинейные функционалы Определение 9.1.1. Пусть в линейном пространстве Λ каждой упорядоченной паре элементов x и y поставлено в соответ- B ( x, y ) так, что 1) B(α x1 + β x 2 , y ) = α B( x1 , y ) + βB( x 2 , y ) ствие число ∀x1 , x 2 , y ∈ Λ ; ∀α, β , 2) B( x, α y1 + β y 2 ) = α B( x, y1 ) + β B( x, y 2 ) ∀x, y1 , y 2 ∈ Λ ; ∀α, β , тогда говорят, что в Λ задан билинейный функционал (или билинейная форма). Пример 9.1.1. 1°. Произведение двух линейных функционалов и F (x ) G ( y ) , определенных в Λ , B ( x, y ) = F ( x )G ( y ) есть билинейный функционал. 2°. Двойной интеграл B( x, y ) = ∫∫ K (τ, σ) x(τ) y (σ)dσdτ = Ω β α β (∫ K (τ, σ) y(σ)dσ)dτ, = ∫ x ( τ) α где функция двух переменных K (τ, σ) непрерывна 326 Аналитическая геометрия и линейная алгебра на множестве α ≤ τ ≤ β Ω: , есть билинейный α ≤ σ ≤ β функционал в линейном пространстве непрерывных на [α, β] функций. Билинейным функционалом является скалярное произведение векторов на плоскости или в пространстве. 3°. Билинейные функционалы в Λn . Λn заданы базис {g1 , g 2 ,..., g n } и билинейный функционал B ( x , y ) . Найдем формулу для выражения его значения через Пусть в координаты аргументов. n Предположим, что в рассматриваемом базисе x = ∑ ξ i gi и i =1 n y = ∑ η j g j , тогда, согласно определению 9.1.1, справедливы раj =1 венства n n n i =1 j =1 i =1 n B ( x, y ) = B ( ∑ ξ i g i , ∑ η j g j ) = ∑ ξ i B ( g i , ∑ η j g j ) = n n n j =1 n = ∑∑ ξ i η j B( g i , g j ) = ∑∑ β ij ξ i η j . i =1 j =1 Определение 9.1.2. i =1 j =1 β ij = B ( g i , g j ) называются компонентами билинейного функционала B ( x , y ) в базисе Числа {g1 , g 2 ,..., g n } , а матрица B g = βij – матрицей билинейного функционала в этом базисе. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 327 В Λn с базисом {g1 , g 2 ,..., g n } билинейный функционал может быть представлен в виде n n n n n n k =1 i =1 Β ( x, y ) = ∑∑ β ki ξ k ηi = ∑∑ ξ k1β ki ηi1 =∑ ξ 1Tk ∑ β ki ηi1 = k =1 i =1 = ξ1 = x где столбцы x k =1 i =1 ξ2 T B g g и β11 β12 β 21 β 22 ... ... β n1 β n 2 ... ξ n g y y g g ... β1n η1 ... β 2 n η 2 = ... ... ... ... β nn η n , – координатные представления элементов x и y в данном базисе. Матрица билинейного функционала зависит от выбора базиса. Правило изменения матрицы билинейного функционала при замене базиса дает Теорема 9.1.1. S – матрица перехода от базиса {g1, g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } , тогда Пусть B g′ = S T B g S . Доказательство. По определению матрицы перехода от одного базиса к другому в Λn (см. § 7.3) имеют место соотношения n g k′ = ∑ σ ik g i , k = [1, n] , i =1 328 Аналитическая геометрия и линейная алгебра но тогда n n i =1 j =1 β′kl = B( g k′ , g l′ ) = B(∑ σ ik g i , ∑ σ jl g j ) = n n = ∑∑ σ ik σ jl B ( g i , g j ) = i =1 j =1 n n n n i =1 j =1 = ∑∑ σ ik σ jl β ij = ∑ σ Tki ∑ β ij σ jl i =1 j =1 для всех k , l = [1, n] . Теорема доказана. Следствие det 9.1.1. Доказательство. B g′ = det B g det 2 S . Следует из теоремы 9.1.1, а также свойств детерминанта (теоремы 6.2.1 и 6.2.4). Отметим, что в силу невырожденности матрицы перехода знак определителя матрицы билинейного функционала не зависит от выбора базиса. Следствие 9.1.2. Ранг матрицы билинейного функционала не зависит от выбора базиса. Доказательство. Следует из теоремы 8.4.3 и невырожденности матрицы перехода Определение 9.1.3. S . Билинейный функционал B ( x , y ) называется симметричным, если для любой упорядоченной пары элементов x и y линейного пространства Λ имеет место равенство B( x, y ) = B( y, x ) . Г л а в а 9 . Нелинейные зависимости в линейном пространстве 329 Теорема 9.1.2. Для симметричности билинейного функционала в Λn необходимо и достаточно, чтобы его матрица была симметрической. Доказательство. Необходимость следует из соотношений β ij = B( g i , g j ) = B( g j , g i ) = β ji ∀i, j = [1, n]. Докажем достаточность. Действительно, если β ij = β ji ∀i, j = [1, n] , то n n n n B( y, x) = ∑∑ β ji η j ξ i = ∑∑ β ji ξ i η j = j =1 i =1 n j =1 i =1 n = ∑∑ β ij ξ i η j = B( x, y ). i =1 j =1 Теорема доказана. § 9.2. Квадратичные функционалы Определение 9.2.1. Пусть в линейном пространстве Λ каждому элементу x поставлено в соответствие число Ф( x) = B( x, x) , где B( x, y ) – некоторый билинейный функционал в Λ , тогда говорят, что в Λ задан квадратичный функционал (или квадратичная форма). В общем случае в вещественном линейном пространстве по заданному квадратичному функционалу нельзя восстановить порождающий его билинейный функционал, однако это можно сделать в случае симметричного билинейного функционала. 330 Аналитическая геометрия и линейная алгебра Действительно, пусть квадратичный функционал Φ(x) порожден симметричным билинейным функционалом B ( x, y ), тогда для любых x и y имеет место равенство Φ( x + y ) = B( x + y, x + y ) = = B ( x, x ) + B ( x, y ) + B ( y , x ) + B ( y , y ) = = Φ( x) + 2 B( x, y ) + Φ( y ) , откуда Φ( x + y ) − Φ( x) − Φ( y ) . 2 B ( x, y ) = Λn симметрическая матрица билинейного функ1 ционала ( Φ( x + y ) − Φ( x) − Φ( y )) называется 2 В Определение 9.2.2. матрицей квадратичного функционала Φ(x). Если в Λ задан базис {g1, g 2 ,..., g n } , то квадратичный функn ционал может быть представлен в виде n n Ф( x) = ∑∑ ϕ ki ξ k ξ i = k =1 i =1 = ξ1 = x ξ2 T g Ф ... ξ n g x g ϕ11 ϕ 21 ... ϕ n1 ϕ12 ϕ 22 ... ϕn2 ... ϕ1n ξ1 ... ϕ 2 n ξ 2 = ... ... ... ... ϕ nn ξ n , n где x g – координатный столбец элемента x = ∑ ξ i g i в данном i =1 базисе. Замена базиса, естественно, приводит к изменению матрицы квадратичного функционала по формуле ределяемой теоремой 9.1.1. Φ g′ = S T Φ g S , оп- Г л а в а 9 . Нелинейные зависимости в линейном пространстве 331 Отметим, что иногда целесообразно строить квадратичный функционал Ф(x ) по порождающему билинейному функционалу, просимметрировав предварительно последний. Действительно, для любого B ( x , y ) можно указать симметричный билинейный функционал 1 ( B( x , y ) + B( y , x )) , который будет порождать тот же са2 мый квадратичный функционал Ф(x ) , что и B ( x , y ) .. В этом случае вида очевидно, что ϕ ij = β ij + β ji 2 = β ji + β ij = ϕ ji ∀i, j = [1, n] , 2 – элементы симметрической матрицы. Пример 9.2.1. Пусть в Λ3 задан билинейный функционал B1 ( x, y ) = ξ1η1 + 3ξ 2 η 2 − ξ 2 η1 − − 3ξ1η 2 + 2ξ 3 η1 − ξ 2 η3 − ξ 3 η 2 = = ξ1 имеющий матрицу ξ2 ξ3 −3 3 −1 1 −1 2 1 −3 0 −1 2 3 −1 −1 0 0 −1 0 η1 η2 , η3 и в силу теоремы 9.1.2 не являющийся симметрическим. Порождаемый им в Λ3 квадратичный функционал будет иметь вид Ф1 ( x) = ξ12 + 3ξ 22 − 4ξ1ξ 2 + 2ξ1ξ 3 − 2ξ 2 ξ 3 . В то же время симметричный билинейный функционал 332 Аналитическая геометрия и линейная алгебра B2 ( x, y ) = ξ1η1 + 3ξ 2 η 2 − 2ξ1η 2 − 2ξ 2 η1 + + ξ1η3 + ξ 3 η1 − ξ 2 η3 − ξ 3 η 2 = = ξ1 ξ2 имеющий матрицу в ξ3 1 −2 1 1 −2 −2 1 3 −1 −2 3 −1 1 −1 0 η1 η2 , η3 1 − 1 , будет порождать 0 Λ3 квадратичный функционал вида Ф 2 ( x) = ξ12 + 3ξ 22 − 4ξ1ξ 2 + 2ξ1ξ 3 − 2ξ 2 ξ 3 , который совпадает с Ф1 ( x) и имеет матрицу 1 −2 1 −2 1 −1 . 0 3 −1 В ряде важных прикладных задач оказывается необходимым отыскание базисов, в которых квадратичный функционал имеет наиболее простой и удобный для исследования вид. Определение 9.2.3. Квадратичный функционал ный вид в базисе Ф(x) имеет диагональ- {g1 , g 2 , ..., g n } ⊂ Λn , если он в этом базисе представим как n Ф( x) = ∑ λ i ξ i2 , i =1 где λ i ∀i = [1, n] – некоторые числа. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 333 Если, кроме того, числа λ i , i = [1, n] принимают лишь значения 0 или ±1, то говорят, что квадратичный функционал в данном базисе имеет канонический вид. Для каждого квадратичного функционала в Λn существует базис, в котором функционал имеет канонический вид. Теорема 9.2.1 (Метод Лагранжа). Доказательство. 1°. Воспользуемся методом математической индукции. При n = 1 в любом базисе Ф(x ) = ϕ 11 ξ 12 . Если ϕ11 = 0 , то мы уже имеем канонический вид, если же ϕ 11 ≠ 0 , то, вы- полняя ξ1′ = 2°. невырожденную замену переменных ϕ11 ξ1 , приходим к каноническому виду. Предположим, что утверждение теоремы верно для квадратичных функционалов, зависящих от n − 1 переменной, и рассмотрим случай n переменных. Будем считать, что ϕ 11 ≠ 0 . Этого можно добиться изменением нумерации переменных в случае, когда хотя бы одно из чисел ϕ ii , i = [ 2, n] не равно нулю. Если же все ϕ ii , i = [1, n] равны нулю одновременно, то без ограничения общности можно считать, что ϕ 12 ≠ 0 . Тогда, выполняя невырожденную замену переменных ξ 1 = ξ′1 + ξ′2 , ξ 2 = ξ′1 − ξ′2 , ξ 3 = ξ′3 , ..., ξ n = ξ′n , получаем запись квадратичного функционала с ненулевым диагональным элементом 334 Аналитическая геометрия и линейная алгебра Ф(x) = 2ϕ12 ξ1′ 2 − 2ϕ 21 ξ′22 + F (ξ1′ , ξ′2 , ξ′3 ,..., ξ′n ) , где F (ξ1′ , ξ′2 , ξ ′3 ,..., ξ′n ) не содержит квадратов от ξ′1 и ξ′2 . 3°. В записи квадратичного функционала сгруппируем слагаемые, содержащие переменную ξ 1 : n n Ф( x) = ∑∑ ϕ ik ξ i ξ k = i =1 k =1 n = ϕ11 (ξ12 + 2∑ i=2 n n ϕ1i ξ1ξ i ) + ∑∑ ϕ ik ξ i ξ k , ϕ11 i=2 k =2 и выделим полный квадрат, воспользовавшись соотношениями n n ∑∑α k =1 i =1 n k n n i =1 k =1 α i = (∑ α k )( ∑ α i ) = (∑ α k ) 2 = k =1 n n n k =2 k =2 = (α1 + ∑ α k ) 2 = α12 + 2∑ α1α k + (∑ α k ) 2 = k =2 n n n = α12 + 2∑ α1α k + ∑∑ α k α i . k =2 k =2 i = 2 Получим n Ф( x) = ϕ11 (ξ12 + 2∑ i=2 n n + ∑∑ (ϕ ik − i =2 k = 2 n n ϕ1i ϕ ϕ ξ1ξ i + ∑∑ 1i 2 1k ξ i ξ k ) + ϕ11 i = 2 k = 2 ϕ11 ϕ1i ϕ1k )ξ i ξ k ϕ11 и окончательно n Ф( x) = ϕ11 (ξ1 + ∑ i =2 ϕ1i 2 n n ϕ ϕ ξ i ) + ∑∑ (ϕ ik − 1i 1k )ξ i ξ k . ϕ11 ϕ11 i =2 k = 2 Г л а в а 9 . Нелинейные зависимости в линейном пространстве 335 В последней формуле первое слагаемое есть полный квадрат, а второе – квадратичный функционал, не зависящий от ξ 1 и приводящийся, согласно предположению индукции, к каноническому виду некоторой невырожденной заменой переменных n ξ′k = ∑ τ ki ξ i , k = [2, n] . i=2 4°. Выполним замену переменных квадратичного функционала Ф(x) по формулам n ϕ1i ′ ξ = ϕ ( ξ + ξi ) , ∑ 11 1 1 i = 2 ϕ11 n ξ′k = ∑ τ ki ξ i ; k = [2, n] , i =2 (9.2.1) которая приведет к представлению его в каноническом виде. Поскольку в силу ϕ11 ≠ 0 матрица выполненной замены переменных ϕ11 T = ϕ11 0 τ 22 ... 0 ϕ12 ϕ11 ... ϕ11 ... τ 2n ... ... ... τ n2 ... τ nn ϕ1n ϕ11 имеет определитель, не равный нулю, то замена (9.2.1) – невырожденная. S = T Но −1 тогда матрица T имеет (см. следствие 7.5.3), которая в свою очередь яв- ляется матрицей перехода к искомому базису. Теорема доказана. обратную: 336 Аналитическая геометрия и линейная алгебра Замечание: базис, в котором квадратичный функционал имеет диа- гональный или канонический вид, не единственный, равно как не является единственным сам канонический или Λn . диагональный вид квадратичного функционала в Метод Лагранжа не всегда оказывается наиболее простой (с точки зрения затрат вычислительных усилий) процедурой. Иногда приведение матрицы квадратичного функционала к диагональному (или каноническому) виду можно выполнить более эффективно путем использования некоторого набора элементарных преобразований. Действительно, при переходе от исходного базиса к новому {g1′ , g ′2 ,..., g n′ } с матрицей перехода S тичного Ф S цы g′ функционала = S T Ф g меняется {g1, g 2 ,..., g n } матрица квадра- по правилу S . Будем теперь рассматривать матрицу как матрицу некоторого элементарного преобразования матри- Ф g (см. § 6.8). Пусть матрица S такова, что умножение на нее справа Ф g приводит последнюю к нижнему треугольному виду, тогда в силу теоремы 6.8.2 матрица роны, матрица S Ф g′ оказывается диагональной. С другой сто- представима как произведение матриц элемен- тарных преобразований, последовательно примененных к столбцам единичной матрицы. Поэтому, выполнив диагонализацию Ф g не- которым набором элементарных преобразований, применяемых на каждом шаге процедуры как к ее строкам, так и к ее столбцам, и применив тот же самый набор элементарных преобразований к столбцам единичной матрицы, мы получим как диагональный вид матрицы Г л а в а 9 . Нелинейные зависимости в линейном пространстве 337 квадратичного функционала Ф g′ x , так и формулы перехода от исходного базиса g = S x g′ – {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } , в котором матрица квадратичного функционала оказывается диагональной. Применение данного алгоритм иллюстрирует следующий пример. Задача 9.2.1. Привести в функционал Λ3 к диагональному виду квадратичный Ф( x) = −2ξ12 − ξ 22 − 4ξ 32 − 8ξ1ξ 2 + 2ξ1ξ 3 − 8ξ 2 ξ 3 . Решение. В исходном базисе функционал Ф( x) имеет матрицу −2 −4 1 −4 1 −1 −4 −4 . −4 1º. На первом шаге процедуры выполним следующие элементарные операции: - заменим вторую строку исходной матрицы разностью второй и третьей ее строк; - в полученной матрице заменим второй столбец разностью второго и третьего столбца, в результате чего получаем матрицу вида −2 −5 −5 1 3 0 1 0 . −4 Кроме того, заменив в единичной матрице 1 0 0 0 0 1 0 0 второй столбец разностью второго и 1 338 Аналитическая геометрия и линейная алгебра третьего, получим 1 0 0 0 1 −1 0 0 . 1 2º. На втором шаге заменяем вначале первую строку утроенной первой, сложенную со второй, взятой с коэффициентом 5. Соответственно такое же преобразование выполняется со столбцами. Получаем следующие две матрицы: − 93 0 0 3 3 0 3 0 и −4 3 0 5 −5 1 −1 0 0 . 1 3º. На третьем шаге заменяем третью строку первой, сложенную с третьей, взятой с коэффициентом 31. Выполнив такие же преобразования со столбцами, соответственно получаем матрицы − 93 0 0 0 3 0 0 0 и − 3751 3 0 5 −5 1 −1 3 5 . 26 Таким образом, перейдя к базису 3 0 3 5 ; 1 ; 5 −5 −1 26 и выполнив замену координат по формулам перехода Г л а в а 9 . Нелинейные зависимости в линейном пространстве 339 + 3ξ′3 , ξ1 = 3ξ1′ ξ 2 = 5ξ1′ + ξ′2 + 5ξ′3 , ξ = −5ξ′ − ξ′ + 26ξ′ , 1 2 3 3 мы получим следующий диагональный вид исходного квадратичного функционала: Ф( x) = −93ξ1′ 2 + 3ξ′22 − 3751 ξ′32 . § 9.3. Исследование знака квадратичного функционала Несмотря на неединственность диагонального или канонического представления, квадратичные функционалы обладают рядом важных свойств, инвариантных относительно (то есть не зависящих от) выбора базиса в Λ . Одной из таких характеристик является ранг квадратичного функционала. n Определение 9.3.1. Теорема 9.3.1. Максимальное число не равных нулю коэффициентов канонического вида квадратичного функционала Ф( x) называется его рангом и обозначается rg Φ. Ранг квадратичного функционала в Λn не зависит от выбора базиса. Доказательство. По следствию 9.1.2 ранг матрицы билинейного функционала не зависит от выбора базиса. Поэтому не будет зависеть от выбора базиса и ранг матрицы порождаемого им квадратичного функционала. С другой стороны, в силу теорем 8.4.3 и 9.1.1 ранг матрицы квадратичного функционала равен числу ненулевых коэффициентов в его каноническом виде. Теорема доказана. 340 Аналитическая геометрия и линейная алгебра При исследовании знака значений квадратичного функционала оказывается полезным использование следующих его характеристик. 1°. Определение 9.3.2. Максимальное число положительных коэффициентов диагонального (канонического) вида квадратичного функционала Ф( x ) в Λ называется его положительным индексом инерции и обозначается rg + Ф . n 2°. Максимальное число отрицательных коэффициентов диагонального (канонического) вида квадратичного функционала Ф( x ) в Λ называется его отрицательным индексом инерции и обозначается rg − Ф . n 3°. Разность между положительным и отрицательным индексами инерции называется сигнатурой квадратичного функционала значается Ф( x) в Λn и обо- sgnФ = rg + Ф − rg − Ф . Теорема 9.3.2 (инерции квадратичных функционалов). Значения положительного и отрицательного индексов инерции, а также сигнатуры квадратичного функционала Ф( x) в Λn не зависят от выбора базиса, в котором этот функционал имеет диагональный (канонический) вид. Доказательство. 1°. Пусть квадратичный функционал базисе Ф( x) имеет в некотором {g1 , g 2 ,..., g n } представление n n Ф( x) = ∑∑ ϕ ij ξ i ξ j i =1 j =1 Г л а в а 9 . Нелинейные зависимости в линейном пространстве 341 и пусть существуют два различных базиса {g1′ , g ′2 ,..., g n′ } и {g1′′, g ′2′ ,..., g n′′} , в которых Ф( x) имеет следующий вид: k Ф( x) = ∑ λ i ηi2 − i =1 m ∑λ i = k +1 i ηi2 ; m ≤ n , λ i > 0 ∀i = [1, m] и соответственно p Ф( x) = ∑ µ i κ − i =1 2 i q ∑µ κ i = p +1 i 2 i ; q ≤ n , µ i > 0 ∀i = [1, q] . В силу сделанных предположений должны существовать невы- ωij и θ ij при пе- рожденные матрицы замены переменных реходах от базиса {g1 , g 2 ,..., g n } к базисам {g1′ , g ′2 ,..., g n′ } и {g1′′, g ′2′ ,..., g n′′ } такие, что n n j =1 j =1 η s = ∑ ω sj ξ j ; s = [1, n] и κ s = ∑ θ sj ξ j ; s = [1, n] . (9.3.1) 2°. Ф( x) в базисах {g1′ , g ′2 ,..., g n′ } и {g1′′, g ′2′ ,..., g n′′} Приравняем значения функционала для некоторого элемента n n n x = ∑ ξ k g k = ∑ ηi g i′ = ∑ κ j g ′j′ , k =1 k ∑ λ i ηi2 − i =1 i =1 m j =1 p ∑ λ i ηi2 = ∑ µ i κ i2 − i = k +1 i =1 q ∑µ κ i = p +1 i 2 i и преобразуем полученное равенство к виду k ∑ λ i ηi2 + i =1 q p ∑ µ i κ i2 = ∑ µ i κ i2 + i = p +1 i =1 m ∑ λ i ηi2 . i = k +1 (9.3.2) 342 3°. Аналитическая геометрия и линейная алгебра Исследуем полученное соотношение. Допустим, что k < p и предположим, что элемент x имеет в рассматриваемых базисах компоненты ηi = 0 ∀i = [1, k ] ; κ i = 0 ∀i = [ p + 1, n] . Этих условий меньше, чем n , поскольку k < p . Если их подставить в равенства (9.3.1), то мы получим однородную систему линейных уравнений относительно неизвестных {ξ1 , ξ 2 ,..., ξ n } . Поскольку число таких уравнений меньше числа неизвестных, то можно утверждать, что она в силу теоремы 6.7.1 имеет нетривиальные решения, и, следовательно, элемент x может быть ненулевым. С другой стороны, из равенства (9.3.2), положительности чисел λ i ; i = [1, m] и µ i ; i = [1, q ] , а также условий ηi = 0 ∀i = [1, k ] ; κ i = 0 ∀i = [ p + 1, n] следует, что и κ i = 0 ; i = [1, p ]. Тогда в силу (9.3.1) мы получаем однородную систему n ли- n нейных уравнений κ s = ∑ θ sj ξ j ; s = [1, n] с n неизвестj =1 ными и невырожденной основной матрицей, имеющую только тривиальное решение, то есть элемент x обязан быть нулевым. Полученное противоречие показывает ошибочность предположения о том, что k < p . 4°. Аналогичными рассуждениями показываем, что невозможно и соотношение k > p . Поэтому приходим к заключению, что k = p. 5°. По теореме 9.3.1 Теорема доказана. m = q , и потому k − m = p − q . Г л а в а 9 . Нелинейные зависимости в линейном пространстве 343 Для исследования знака значений квадратичного функционала введем в рассмотрение понятие его знаковой определенности. Определение 9.3.3. 1°. Квадратичный функционал Ф( x ) называется положительно определенным на подпространстве Ω + ⊂ Λ , если Ф( x) > 0 для любого ненулевого x ∈Ω + . 2°. Квадратичный функционал Ф( x ) называется отрицательно определенным на подпространстве Ω − ⊂ Λ , если Ф( x) < 0 для любого ненулевого x ∈Ω − . + − 3°. Если же Ω (или Ω ) совпадает с Λ , то говорят, что квадратичный функционал Ф( x ) является положительно (отрицательно) определенным. 4°. Если же Ф( x ) ≥ 0 ( Ф( x ) ≤ 0 ) для всех x ∈ Λ , то говорят, что квадратичный функционал является положительно (отрицательно) полуопределенным. Теорема 9.3.3. Максимальная размерность подпространства в Λn , на котором квадратичный функционал положительно (отрицательно) определен, равняется положительному (отрицательному) индексу инерции этого функционала. Доказательство. Следует из теоремы 9.3.2 и очевидного равенства числа положительных (отрицательных) элементов матрицы квадратичного функционала в диагональном представлении размерности подпространства Ω + ( Ω − ). 344 Аналитическая геометрия и линейная алгебра В ряде прикладных задач оказывается необходимым проведение исследования знаковой определенности квадратичного функционала без приведения его к диагональному виду. Удобное необходимое и достаточное условие положительной определенности квадратичного функционала дает Теорема 9.3.4 (Критерий Сильвестра). Для положительной определенности квадратичного функционала в Λn необходимо и достаточно, чтобы все главные миноры его матрицы, имеющие вид ϕ11 ϕ det 21 ... ϕ k1 ϕ12 ϕ 22 ... ϕk 2 ... ϕ1k ... ϕ 2 k ; k = [1, n] , ... ... ... ϕ kk были положительными. Доказательство достаточности. 1°. Воспользуемся методом математической индукции. Для k = 1 достаточность очевидна. Допустим, что из положительности главных миноров матрицы квадратичного функционала порядка до k = n − 1 включительно следует возможность приведения квадратичного функционала от n − 1 переменных к виду n −1 Ф( x) = ∑ ξ i2 . i =1 2°. Покажем, что в этом случае достаточность будет иметь место и для квадратичных функционалов, зависящих от n переменных. В выражении для квадратичного функционала, зависящего от n переменных, выделим слагаемые, содержащие ξ n : Г л а в а 9 . Нелинейные зависимости в линейном пространстве 345 n −1 n −1 n −1 k =1 i =1 k =1 Ф( x) = ∑ ∑ ϕ ki ξ k ξ i + 2∑ ϕ kn ξ k ξ n + ϕ nn ξ 2n . Двойная сумма в правой части этого равенства есть квадратич∗ ный функционал Ф ( x ) , зависящий от n − 1 переменной, причем его главные миноры совпадают с главными минорами Ф( x) до порядка n − 1 включительно, которые, по предположению индукции, положительны. Отсюда следует, что квадра∗ тичный функционал Ф ( x ) положительно определенный, и для него существует невырожденная замена переменных n −1 ξ k = ∑ σ ki ηi ; k = [1, n − 1] , i =1 n −1 приводящая его к каноническому виду Ф ∗ ( x) = ∑ ηi2 . i =1 Выпишем представление квадратичного функционала новых переменных: n −1 n −1 i =1 i =1 Ф( x) в Ф( x) = ∑ ηi2 + 2∑ ϕ′in ηi ξ n + ϕ nn ξ 2n и выделим в нем полные квадраты: n −1 Ф( x) = ∑ (ηi2 + 2ϕ′in ηi ξ n + ϕ′in2 ξ 2n ) + i =1 n −1 n −1 i =1 i =1 ′ ξ 2n , + (ϕ nn − ∑ ϕ′in2 )ξ 2n = ∑ ζ i2 + ϕ′nn где n −1 ′ = ϕ nn − ∑ ϕ′in2 ; ζ i = ηi + ϕ′in ξ n ; i = [1, n − 1] . ϕ′nn i =1 В матричном виде эту замену переменных можно записать как 346 Аналитическая геометрия и линейная алгебра ζ1 η1 1 0 L 0 ϕ1′,n ζ2 0 1 L 0 ϕ 2, n η 2 L = L L L L L L , ζ n−1 0 0 0 1 ϕ′n −1,n η n −1 ξn ξn 0 0 0 0 1 и поскольку определитель ее матрицы отличен от нуля, то эта замена невырожденная. 3°. Наконец, в силу следствия 9.1.1 определитель матрицы квадратичного функционала сохраняет знак при замене базиса. Знак определителя матрицы квадратичного функционала в исходном базисе положительный, поскольку этот определитель имеет вид ϕ11 ϕ det 21 ... ϕ n1 ϕ12 ϕ 22 ... ϕn2 ... ϕ1n ... ϕ 2 n ... ... ... ϕ nn и является главным минором порядка n . Но тогда из выражения для Ф( x ) в конечном базисе мы получаем, что определитель матрицы квадратичного функционала Поэтому ′ . Ф( x) равен ϕ′nn ′ > 0 и можно сделать замену переменных ϕ′nn ′ , приводящую к каноническому виду функциоζ n = ξ n ϕ′nn n нал Φ( x) = ∑ ζ i2 . i =1 Следовательно, квадратичный функционал Φ ( x ) положительно определен для числа переменных n , а значит, в силу математической индукции, для любого числа переменных. Достаточность доказана. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 347 Доказательство необходимости критерия Сильвестра положительной определенности квадратичного функционала приводится в разделе “Евклидово пространство” § 10.3. Исходя из критерия Сильвестра для положительной определенности квадратичного функционала, можно получить аналогичный критерий отрицательной определенности квадратичного функционала. Следствие 9.3.1. Для отрицательной определенности квадратичного функционала в Λn необходимо и достаточно, чтобы главные миноры четного порядка матрицы функционала были положительны, а нечетного порядка – отрицательны. Доказательство. Ф( x) отрицательно определенный, тогда функционал − Ф( x) будет, очевидно, положиПусть квадратичный функционал тельно определенным. Применяя к нему критерий Сильвестра положительной определенности, получим для главного минора k -го порядка, использовав линейное свойство определителя, условие det − ϕ11 − ϕ12 ... − ϕ1k − ϕ 21 ... − ϕ 22 ... ... − ϕ 2 k = ... ... − ϕ k1 − ϕk 2 ... − ϕ kk = (−1) k det ϕ11 ϕ12 ... ϕ1k ϕ 21 ϕ 22 ... ϕ 2 k ... ... ϕ k1 ϕk 2 ... ... > 0 ∀k = [1, n] . ... ϕ kk Откуда и следует доказываемое утверждение. Следствие доказано. 348 Аналитическая геометрия и линейная алгебра § 9.4. Инварианты линий второго порядка на плоскости Независимость значений ранга и сигнатуры квадратичного функционала от выбора базиса позволяет выполнить классификацию линий второго порядка на плоскости способом, отличным от приведенного в теореме 4.4.1. Рассмотрим линию второго порядка на плоскости Oxy в базисе {g1 , g 2 } и с началом координат в точке O. Эта линия в общем случае задается согласно определению 4.4.1 уравнением вида Ax + 2 Bxy + Cy + 2 Dx + 2 Ey + F = 0 , где числа A, B, C, D, F 2 2 и E произвольны с одним лишь ограничением, что A, B и C не равны нулю одновременно ( A + B + C > 0 ). Нетрудно проверить, что при замене начала координат коэффициенты A, B и C не меняются, а при смене базиса преобразуются как коэффициенты квадратичного функционала (см. теорему 9.1.1). Поэтому можно считать, что многочлен тичный функционал Ax 2 + 2 Bxy + Cy 2 задает квадра- Φ( x, y ) = Ax 2 + 2 Bxy + Cy 2 A B с матрицей в исходном базисе {g1 , g 2 } . B C rg Φ – ранг и sgn Φ – сигнатура квадратичного функционала Φ( x, y ) не зависят На основании теорем 9.2.2 и 9.3.1 заключаем, что от выбора системы координат и, следовательно, rg Φ и sgn Φ являются инвариантами линии второго порядка на плоскости. Использование модуля сигнатуры необходимо, поскольку одновременное изменение знаков всех коэффициентов уравнения линии второго порядка изменит, естественно, само уравнение, хотя линия при этом останется той же. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 349 Поскольку в запись уравнения линии второго порядка на плоскости входят также и коэффициенты D, F и E, то следует выяснить, не существуют ли дополнительные инварианты, образованные из всей совокупности коэффициентов A, B, C, D, F и E. Для этого рассмотрим вспомогательный квадратичный функционал в Λ3 вида Ψ ( x, y, z ) = Ax 2 + 2 Bxy + Cy 2 + 2 Dxz + 2 Eyz + Fz 2 A B D с матрицей B C E в базисе {g1 , g 2 , g 3 } . D E F Заметим, что совокупность всех точек в Λ3 , для которых Ψ ( x, y,1) = 0 , есть рассматриваемая нами линия второго порядка, расположенная в пространстве на плоскости z = 1 . Пусть в Λ выполняется замена базиса, при которой плоскость z = 1 переходит сама в себя. Найдем для этой замены базиса правило изменения коэффициентов квадратичного функционала Ψ ( x, y , z ) . 3 Лемма 9.4.1. перехода от базиса {g1, g 2 , g 3 } к базису {g1′ , g ′2 , g 3′ } , для которой плоскость z = 1 переходит сама в себя, имеет вид Матрица S σ11 σ12 σ13 S = σ 21 0 σ 22 0 σ 23 . 1 Доказательство. Замена координат в плоскости лам Oxy выполняется по форму- x = σ11 x ′ + σ12 y ′ + σ13 , y = σ 21 x ′ + σ 22 y ′ + σ 23 , 350 Аналитическая геометрия и линейная алгебра z = 1 и z ′ = 1 , то x σ11 σ12 σ13 x′ y = σ 21 σ 22 σ 23 y′ . 1 0 0 1 1 но поскольку при этом Невырожденность матрицы вия det σ11 σ 21 S следует из очевидного усло- σ12 ≠ 0. σ 22 Лемма доказана. Поскольку ранг и сигнатура квадратичного функционала не меняются при любых заменах базиса, то это будет верным и для замен, переводящих плоскость z = 1 саму в себя. Поэтому rg Ψ и sgn Ψ сохраняются при таких заменах, а числа rg Ψ и sgn Ψ являются инвариантами уравнения линии второго порядка. Таким образом, доказана Теорема 9.4.1. При любых заменах декартовой системы координат на плоскости Oxy числа rg Φ , rg Ψ , sgn Φ и sgn Ψ являются инвариантами линии второго порядка. Подсчитаем значения чисел rg Φ , rg Ψ , sgn Φ и sgn Ψ для девяти видов линий второго порядка на плоскости, приведенных в формулировке теоремы 4.4.1, результаты поместим в таблицу 9.4.1 из которой следует, что каждый вид линии второго порядка на плоскости имеет свой, уникальный набор значений инвариантов, который может быть принят за признак принадлежности некоторой линии второго порядка к конкретному виду. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 351 Таблица 9.4.1 Вид линии 1 Эллипс 2 Мнимый эллипс 3 Точка 4 Гипербола 5 Пересек. прямые 6 Парабола 7 Параллельные прямые Пара мнимых прямых Совпадающие прямые 8 9 Каноническое уравнение x′2 y′2 + 2 =1 a2 b rg Ψ sgn Ψ rg Φ sgn Φ 3 1 2 2 3 3 2 2 2 2 2 2 3 1 2 0 2 0 2 0 y ′ 2 = 2 px ′ 3 1 1 1 y′2 = a2 2 0 1 1 y ′ 2 = −a 2 2 2 1 1 y′2 = 0 1 1 1 1 x′2 y′2 + 2 = −1 a2 b 2 x′ y′2 + =0 a2 b2 x′2 y′2 − 2 =1 a2 b x ′2 a2 − y′2 b2 =0 В заключение отметим, что 1°. Подсчет значений рангов и модулей сигнатур выполняется путем приведения квадратичного функционала к диагонально- 352 Аналитическая геометрия и линейная алгебра му виду. Однако для параболы приведение функционала Ψ ( x, y, z ) к диагональному виду матрицей перехода, переводящей плоскость z = 1 саму в себя, вообще говоря, невоз0 0 −κ 0 −κ можно, поскольку его матрица имеет вид 1 0 0 . 0 В этом случае для подсчета ранга и сигнатуры можно использовать матрицу перехода S = 1 0 1 0 −1 1 0 0 , которая, хо1 тя и не обеспечивает выполнение условия перехода плоскости z = 1 самой в себя, но, как всякая линейная замена координат, сохраняет ранг и сигнатуру. Действительно, Ψ g′ = S T Ψ g S = −1 0 1 1 = 0 1 0 1 0 0 0 −κ 2κ = 0 0 0 0 1 0 . 0 − 2κ 0 −κ 1 1 0 0 0 0 −1 0 1 0 1 0 = 1 2°. Для линий второго порядка на плоскости существуют и другие ортогональные инварианты, например, инвариантами являются числа I 1 = A + C и I 2 = det A B . СправедлиB C вость этого утверждения показана в § 4.4. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 353 3°. Схема классификации, аналогичная рассмотренной, может быть построена и для поверхностей второго порядка в пространстве. § 9.5. Экстремальные свойства квадратичных функционалов Из теоремы 9.2.1 следует существование в Λ базиса, в котором квадратичный функционал Ф( x ) имеет диагональный вид. Допусn тим, что этот базис {g1′ , g ′2 ,..., g n′ } построен так, что n Ф( x) = ∑ λ i ξ′i 2 и λ 1 ≤ λ 2 ≤ ... ≤ λ n −1 ≤ λ n . i =1 Тогда справедлива Теорема 9.5.1. Для квадратичного функционала Ф( x) в Λn справедливы λ 1 = minn Ф( x) соотношения x∈Λ и λ n = maxn Ф( x) при условии, что компоненты x x∈Λ n удовлетворяют условию ∑ ξ′ i =1 2 i = 1. Доказательство. n Если в рассматриваемом базисе Ф( x) = ∑ λ i ξ′i 2 , то в силу i =1 соотношений λ 1 ≤ λ 2 ≤ ... ≤ λ n −1 ≤ λ n будут иметь место неравенства n n n n i =1 i =1 i =1 i =1 ∑ λ i ξ′i 2 ≤ λ n ∑ ξ′i 2 и λ1 ∑ ξ′i 2 ≤ ∑ λ i ξ′i 2 . 354 Аналитическая геометрия и линейная алгебра n ∑ ξ′ Но поскольку i =1 i 2 = 1 , то будут также справедливы и оценки n n i =1 i =1 ∑ λ i ξ′i 2 ≤ λ n и λ1 ≤ ∑ λ i ξ′i 2 . То есть при x = 0, 0, ...,1 x = 1, 0, ..., 0 T T достигается максимум, а при – минимум значений функционала. Теорема доказана. § 9.6. Полилинейные функционалы По аналогии с билинейными функционалами, зависящими от пары элементов линейного пространства, можно определить нелинейные функционалы, обладающие аналогичными свойствами, но зависящие от большего числа аргументов. Определение 9.6.1. Пусть в линейном пространстве Λ каждому упорядоченному набору из k элементов { x1 , x 2 ,..., xk } поставлено в соответствие число так, что для любого j = [1, k ] Q ( x1, x 2 ,..., xk ) Q( x1 ,..., α x ′j + β x ′j′ ,..., x k ) = = αQ( x1 ,..., x ′j ,..., x k ) + βQ( x1 ,..., x ′j′ ,..., x k ) ∀x ′, x ′′ ∈ Λ ∀α, β, тогда говорят, что в Λ задан полилинейный функционал, а именно, k -линейный функционал. Г л а в а 9 . Нелинейные зависимости в линейном пространстве 355 Пример 9.6.1. Λ k линейных функционалов F1 ( x ), F2 ( x ), K , Fk ( x ) , то есть 1°. Произведение определенных в Q( x1 , x 2 , K, x k ) = F1 ( x1 ) F2 ( x 2 ) K Fk ( x k ) , является k -линейным функционалом в Λ . 2°. Смешанное произведение трех векторов в трехмерном геометрическом пространстве является трилинейным функционалом. n -го порядка есть полилинейный n функционал от n элементов в Λ в случае, когда ко- 3°. Определитель ординатные представления этих элементов являются столбцами данного определителя. 356 Аналитическая геометрия и линейная алгебра Глава 10 ЕВКЛИДОВО ПРОСТРАНСТВО § 10.1. Определение и основные свойства В произвольном линейном пространстве отсутствуют понятия “длины”, “расстояния”, “величины угла” и других метрических характеристик. Однако их использование становится возможным, если в линейном пространстве дополнительно ввести специальную, определяемую ниже операцию. Определение 10.1.1. Пусть в вещественном линейном пространстве каждой упорядоченной паре элементов x и y поставлено в соответствие вещественное число ( x, y ), называемое скалярным произведением, так, что выполнены аксиомы: 1) ( x, y ) = ( y, x ); 2) 3) 4) (λx, y ) = λ( x, y ); ( x1 + x 2 , y ) = ( x1, y ) + ( x 2 , y ); ( x, x ) ≥ 0 , причем ( x, x ) = 0 ⇔ x = o , тогда говорят, что задано евклидово пространство E. Замечание: аксиомы 1–4 в совокупности означают, что скалярное произведение есть билинейный (что следует из аксиом 2 и 3) и симметричный (следует из аксиомы 1) функционал, который, кроме того, порождает положительно определенный квадратичный (следует из аксиомы 4) функционал. Любой билинейный функционал, обладающий данными свойствами, может использоваться в качестве скалярного произведения. 357 Г л а в а 1 0 . Евклидово пространство Пример 10.1.1. 1°. Трехмерное геометрическое пространство со скалярным произведением, введенным по правилам § 2.2, является евклидовым. 2°. Пространство n-мерных столбцов ξ1 ξ x= 2 ; y= ... ξn η1 η2 ... ηn со скалярным произведением, определяемым по n формуле ( x, y ) = ∑ ξ i ηi , есть евклидово проi =1 странство. 3°. Евклидовым будет пространство непрерывных на [α, β] функций со скалярным произведением β ( x, y ) = ∫ x(τ) y (τ)dτ . α Задача 10.1.1. Можно ли в трехмерном пространстве скалярное произведение определить как произведение длин векторов на куб косинуса угла между ними? Решение. Нет, нельзя, так как не будет выполняться аксиома 3 определения 10.1.1. Определение 10.1.2. В евклидовом пространстве 1) E назовем нормой (или длиной) элемента x число x = ( x, x) ; 2) расстоянием между элементами число x− y . x и y 358 Аналитическая геометрия и линейная алгебра Замечание: использование для обозначения нормы элемента ограни- чителей вида ... не приводит к каким-либо конфлик- там с введенными ранее обозначениями, поскольку для линейного пространства вещественных чисел норма числа, очевидно, совпадает с его абсолютной величиной, для комплексного числа норма совпадает с его модулем, а для линейного пространства геометрических векторов – с длиной вектора. Теорема 10.1.1 (неравенство Коши– Буняковского). Для любых x, y ∈ E имеет место неравенство ( x, y) ≤ x y . Доказательство. Для ∀x, y ∈ E и вещественного числа τ элемент Согласно аксиоме 4 из определения 10.1.1 x − τy ∈ E . 0 ≤ ( x − τ y, x − τ y ) = ( x, x) − 2( x, y )τ + ( y, y )τ 2 = = x − 2( x, y )τ + y τ 2 ∀τ. 2 2 Полученный квадратный трехчлен неотрицателен для любого τ тогда и только тогда, когда его дискриминант неположителен, то есть ( x, y ) 2 − x y ≤ 0 . 2 2 Теорема доказана. Задача 10.1.2. Показать, что неравенство Коши–Буняковского превращается в равенство тогда и только тогда, когда элементы x и y линейно зависимы. Следствие 10.1.1 (неравенство треугольника). Для любых x, y ∈ E имеет место неравенство x+y ≤ x + y . 359 Г л а в а 1 0 . Евклидово пространство Доказательство. Из аксиом евклидова пространства и неравенства Коши– Буняковского имеем x+ y 2 = ( x + y , x + y ) = ( x , x ) + 2( x , y ) + ( y , y ) ≤ ≤ x +2 x y + y 2 2 = ( x + y )2 , x + y и x + y по- откуда в силу неотрицательности чисел лучаем неравенство треугольника. Следствие доказано. Отметим, что неравенства Коши–Буняковского и треугольника для евклидова пространства из примера 10.1.1 (2°) имеют вид n ∑ ξ i ηi ≤ i =1 n ∑ (ξ i =1 + ηi ) 2 ≤ i n n ∑ ξ 2j ∑η j =1 k =1 n ∑ξ j =1 2 j 2 k ∀ξ i ,ηi , i = [1, n] ; n + ∑η k =1 2 k ∀ξ i ,ηi , i = [1, n] , в то время как для евклидова пространства из примера 10.1.1 (3°) соответственно: β | ∫ x(τ) y(τ)dτ | ≤ α β 2 ∫ ( x(τ) + y(τ)) dτ ≤ α β 2 ∫ x (τ)dτ α β β ∫y (τ)dτ ; α 2 ∫ x (τ)dτ + α 2 β ∫y α 2 (τ)dτ . 360 Аналитическая геометрия и линейная алгебра Определение 10.1.3. В евклидовом пространстве E величиной угла между ненулевыми элементами x и y назовем число α ∈ [0, π] , удовлетворяющее соотношению ( x, y ) cos α = . x y Из неравенства Коши–Буняковского (теорема 10.1.1) следует, что величина угла существует для любой пары ненулевых элементов в E . Определение 10.1.4. E элементы x и y называются ортогональными, если ( x , y ) = 0 . В евклидовом пространстве Откуда следует, что нулевой элемент евклидова пространства ортогонален любому другому элементу. § 10.2. Ортонормированный базис. Ортогонализация базиса Определение 10.2.1. n В конечномерном евклидовом пространстве E базис {e1 , e2 ,..., en } называется ортонормированным, если (ei , e j ) = δ ij ∀i, j = [1, n]. Теорема Во всяком евклидовом пространстве 10.2.1 ортонормированный базис. (Грама– Шмидта). Доказательство. E n существует E n дан некоторый, вообще говоря, неортогональный {g1, g 2 ,..., g n } . Построим вначале базис {e1′ , e ′2 ,..., e n′ } из попарно ортогональных элементов. После- 1°. Пусть в базис довательное построение этих элементов будем называть процессом ортогонализации базиса. 361 Г л а в а 1 0 . Евклидово пространство e1′ = g1 . Элемент e2′ будем искать в виде e2′ = g 2 + α 21 e1′ , где α 21 – некоторая константа. Подберем α 21 так, чтобы (e1′ , e2′ ) = 0 , для этого достаточно, чтобы Возьмем (e1′ , e2′ ) = (e1′ , g 2 + α 21e1′ ) = = (e1′ , g 2 ) + α 21 (e1′ , e1′ ) = 0 ; α 21 = − (e1′ , g 2 ) . (e1′ , e1′ ) e′2 ≠ o . Действительно, из o = e2′ = g 2 + α 21 e1′ = g 2 + α 21 g1 следует линейная зависимость g1 и g 2 , что противоречит Заметим, что условию принадлежности этих элементов базису (см. лемму 7.2.2). 2°. Допустим теперь, что нам удалось ортогонализовать k − 1 элемент, и примем в качестве e k′ элемент k −1 e′k = g k + ∑ α k j e′j . j =1 (ek′ , ei′ ) = 0 ∀i = [1, k − 1] , но тогда в силу (e′j , ei′ ) = 0 ; j = [1, k − 1] имеем Потребуем, чтобы k −1 (ei′ , e′k ) = (ei′ , g k + ∑ α kj e′j ) = (ei′ , g k ) + α ki (ei′ , ei′ ) = 0 ; j =1 α ki = − (ei′ , g k ) ; (ei′ , ei′ ) i = [1, k − 1] . Покажем теперь, что в этом случае e k′ ≠ o . Допустим проk −1 тивное: ek′ = g k + ∑ α k j e′j = o . Однако поскольку все элеj =1 362 Аналитическая геометрия и линейная алгебра менты ei′ , i = [1, k − 1] по построению есть некоторые ли- g i ;i = [1, k − 1] , мы приходим к линейной зависимости g i ; i = [1, k ] , что противоречит условию теоремы. Следовательно, e′k ≠ o . нейные комбинации элементов 3°. Процесс ортогонализации продолжается до исчерпания множества элементов g i ; i = [1, n] , после чего достаточно пронормировать полученные элементы ei′ ; i = [1, n] , чтобы получить искомый ортонормированный базис где ek = {e1 , e2 ,..., en } , ek′ ; k = [1, n] . ek′ Теорема доказана. Процесс ортогонализации Грама–Шмидта может быть применен к любой, в том числе и к линейно зависимой, системе элементов евклидова пространства. Если ортогонализуемая система линейно зависима, то на некотором шаге мы получим нулевой элемент, после отбрасывания которого можно продолжить процесс ортогонализации. § 10.3. Координатное представление скалярного произведения Полезным инструментом исследования свойств некоторого набора элементов { f 1 , f 2 ,..., f k } в евклидовом пространстве является матрица Грама. Определение 10.3.1. В евклидовом пространстве E матрицей Грама системы элементов { f 1 , f 2 ,..., f k } называется симметрическая матрица вида 363 Г л а в а 1 0 . Евклидово пространство Γ f ( f 1 , f 1 ) ( f1 , f 2 ) ( f 2 , f1 ) ( f 2 , f 2 ) = L L ( f k , f1 ) ( f k , f 2 ) L ( f1 , f k ) L ( f2 , fk ) . L L L ( fk , fk ) E n дан базис {g1 , g 2 ,..., g n } . Скалярное произведение Пусть в элементов x = n n i =1 j =1 ∑ ξ i g i и y = ∑ η j g j , согласно определению 10.1.1, представляется в виде n n i =1 j =1 n n n n ( x, y ) = (∑ ξ i g i , ∑ η j g j ) = ∑∑ ξ i η j ( g i , g j ) = ∑∑ γ ij ξ i η j , i =1 j =1 i =1 j =1 где γ i j = ( g i , g j ) ∀i, j = [1, n] – компоненты матрицы Γ g , на- зываемой базисной матрицей Грама. Заметим, что эта матрица симметрическая, в силу коммутативности скалярного произведения (см. аксиому 1 в опр. 10.1.1), является матрицей симметричного билинейного функционала, задающего скалярное произведение. Тогда (принимая во внимание опр. 9.1.2) координатное представление скалярного произведения может быть записано так: ( x, y ) = x = ξ1 ξ2 T g Γ g ... ξ n y g = ( g 1 , g1 ) ( g 1 , g 2 ) ( g 2 , g1 ) ( g 2 , g 2 ) ... ... ( g n , g1 ) ( g n , g 2 ) ... ( g1 , g n ) ... ( g 2 , g n ) ... ... ... ( g n , g n ) η1 η2 , ... ηn 364 где тов Аналитическая геометрия и линейная алгебра x g и y g – координатные представления (столбцы) элемен- x и y в базисе {g1 , g 2 ,..., g n } . Очевидно, что эта формула со- гласуется с § 2.3 и § 9.2. Заметим, наконец, что в ортонормированном базисе Γ e = E , и, следовательно, формула для скалярного произведения принимает вид ( x, y ) = Теорема 10.3.1. x n T y g = ∑ ξ i ηi . g i =1 Γ Для базисной матрицы Грама det Γ g в любом базисе g > 0. Доказательство. Из определения 10.1.1 следует, что скалярное произведение есть билинейный, симметричный функционал, поэтому при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } (с S ) по теореме 9.1.1 для матрицы Грама матрицей перехода имеют место равенства Γ где g′ = S T Γ g S ; det Γ g′ = det Γ g (det S ) 2 , det S ≠ 0 . Откуда следует, что значение sgn ( det Γ g ) инвариантно, то есть не изменяется при замене базиса. А, приняв во внимание, что в ортонормированном базисе det Γ e = 1 , приходим к за- ключению, что в любом базисе det Γ Теорема доказана. g > 0. 365 Г л а в а 1 0 . Евклидово пространство Следствие Система элементов 10.3.1. { f1 , f 2 ,..., f k } в E n линейно не- зависима тогда и только тогда, когда определитель матрицы Грама этой системы положителен. Доказательство. Если элементы { f1 , f 2 ,..., f k } линейно зависимы, то опреде- литель их матрицы Грама равен нулю. Действительно, пусть существуют не равные нулю одновременно числа λ1 , λ 2 ,..., λ k , такие, что λ 1 f 1 + λ 2 f 2 + ... + λ k f k = o . Умножив это равенство скалярно слева на f i ∀i = [1, k ] , по- лучим λ 1 ( f i , f 1 ) + λ 2 ( f i , f 2 ) + ... + λ k ( f i , f k ) = 0 ∀i = [1, k ] . Тогда, согласно правилам действий с матрицами (см. § 1.1), следует, что нетривиальная линейная комбинация столбцов матрицы Грама, имеющая коэффициентами числа λ1 , λ 2 ,..., λ k , будет равна нулевому столбцу и, следовательно, будет равен нулю определитель матрицы Грама (см. лемму 6.5.2 и теорему 6.5.2). С другой стороны, если элементы { f 1 , f 2 ,..., f k } линейно независимы, то они образуют базис в своей линейной оболочке и к ним применим результат теоремы 10.3.1. Следствие доказано. Теперь можно доказать необходимость в теореме 9.3.4. Теорема 9.3.4 Для положительной определенности квадратичного функционала в Λn необходимо и достаточно, 366 Аналитическая геометрия и линейная алгебра (Критерий Сильвестра). чтобы все главные миноры его матрицы, имеющие вид ϕ11 ϕ12 ϕ ϕ 22 det 21 ... ... ϕ k1 ϕ k 2 ... ϕ1k ... ϕ 2 k ; k = [1, n] , ... ... ... ϕ kk были положительными. Доказательство необходимости. 1°. В § 10.1 было отмечено, что введение скалярного произведения в линейном пространстве равносильно заданию некоторого симметричного билинейного функционала, порождающего положительно определенный квадратичный функционал. Обратно, по положительно определенному квадратичному функционалу, однозначно восстанавливается породивший его симметричный билинейный функционал, который можно принять за скалярное произведение. 2°. Покажем, что у положительно определенного квадратичного функционала все (указанного в условии теоремы вида) главные миноры его матрицы положительны. Действительно, если ввести в Λ скалярное произведение при помощи его порождающего билинейного функционала, то матрица этого квадратичного функционала в базисе {g1 , g 2 ,..., g n } есть матрица Грама этого базиса. n Рассмотрим последовательно линейные оболочки систем элементов вида {g1 , g 2 ,..., g k } ; k = [1, n] . Все эти системы линейно независимые (как подмножества базиса), и по теореме 10.3.1 соответствующие им матрицы Грама имеют положительные определители, поэтому 367 Г л а в а 1 0 . Евклидово пространство det β11 β12 ... β1k β 21 β 22 ... β 2 k ... ... ... β k1 β k 2 ... β kk ( g 1 , g1 ) = det = ... ( g 1 , g 2 ) ... ( g 1 , g k ) ( g 2 , g 1 ) ( g 2 , g 2 ) ... ( g 2 , g k ) ... ... ... ... >0; ( g k , g 1 ) ( g k , g 2 ) ... ( g k , g k ) k = [1, n]. Теорема доказана. Теорема 10.3.2. x x евклидова пространства E в базисе {g1 , g 2 ,..., g n } может Координатный столбец любого элемента n быть представлен в виде x g = Γ −1 g b g , ( x , g1 ) где Γ g – матрица Грама, а b g = ( x, g2 ) ... . ( x, gn ) Доказательство. n Умножим обе части равенства x = ∑ ξ i g i скалярно на g k , i =1 k = [1, n] . Тогда получим систему уравнений n ∑ ξ (g , g i =1 i i k ) = ( x, g k ) , k = [1, n] , 368 Аналитическая геометрия и линейная алгебра основная матрица которой есть базисная матрица Грама. Поскольку в силу теоремы 10.3.1 эта матрица невырожденная, приходим к формуле x g = Γ −1 g b g. Теорема доказана. Следствие В ортонормированном базисе 10.3.2. n ва пространства {e1 , e2 ,..., en } евклидо- E для любого элемента n x = ∑ ξ i ei ∈ E n i =1 имеют место равенства Замечание: формула ξ i = ( x, ei ) , i = [1, n] . ξ i = ( x, ei ) , i = [1, n] малополезна для ко- нечномерных евклидовых пространств, поскольку элемент x в этом случае однозначно и полностью описывается своими координатами. Однако данная формула может быть использована для обобщения понятия координатного представления на случай евклидовых пространств с неограниченным числом линейно независимых элементов (см. § 12.3). § 10.4. Ортогональные матрицы в евклидовом пространстве Согласно определению 5.1.4 матрица отношению Q T = Q −1 Q , удовлетворяющая со- , называется ортогональной, причём для любой ортогональной матрицы справедливы равенства Q T Q = Q Q T = E и det Q = ±1 . Кроме того, в евклидовом пространстве будут справедливы следующие теоремы. 369 Г л а в а 1 0 . Евклидово пространство Теорема 10.4.1. n Ортогональные матрицы (и только они) в E могут служить матрицами перехода от одного ортонормированного базиса к другому. Доказательство. Рассмотрим два различных ортонормированных базиса {e1 , e2 ,..., en } и {e1′ , e′2 ,..., e′n } в E с матрицей перехода S n от первого базиса ко второму. Поскольку в этих базисах матрица Грама единичная, то из соотношения Γ e′ = S T Γ e S следует равенство Ε = S T Ε S , или E = S S Поскольку матрица перехода S тельно имеем −1 = S T S . невырожденная, то оконча- T . Теорема доказана. E = S В развернутой форме равенство n T S принимает вид k , l = [1, n] , частный случай которого для n = 3 δ kl = ∑ σ Tki σ il ; i =1 был получен в § 2.9. Теорема 10.4.2. Собственные значения линейного оператора, имеющеn го в E ортогональную матрицу, равны по модулю единице. Доказательство. Из равенства Aˆ g f f g =λ f T g Aˆ T g g следует, что =λ f T g. 370 Аналитическая геометрия и линейная алгебра Перемножив почленно эти равенства, получим соотношение f T g T Aˆ g Aˆ В силу ортогональности потому f T g f g g Aˆ = λ2 f скольку собственные векторы f g = λ2 f имеем g T g f g T g Aˆ T g f Aˆ , и, наконец, g . g = Eˆ , а λ2 = 1 , по- f ненулевые. Теорема доказана. Ортогональные матрицы также играют важную роль в вычислительных методах алгебры, что, например, иллюстрирует Теорема 10.4.3. Если матрица вида A = Q рица, а A невырожденная, то ее разложение R , где Q – ортогональная мат- R – верхняя треугольная матрица с поло- жительными диагональными элементами, существует и единственно. Доказательство. Предположим, что имеется14 два разложения A = Q1 R1 = Q2 Из невырожденности R2 . A следует невырожденность R1 R2 , поскольку Q1 и Q2 и ортогональные и, очевидно, невырожденные. Тогда последнее равенство можно переписать 14 Обоснование существования такого разложения выходит за рамки данного курса. Здесь мы ограничимся рассмотрением лишь вопроса о его единственности. 371 Г л а в а 1 0 . Евклидово пространство в виде Q2 где −1 R1 T Q1 = R2 R1 −1 , – также верхняя треугольная матрица. R2 Заметим, что R1 −1 есть диагональная матрица. Дей- ствительно, с одной стороны, она верхняя треугольная матрица как произведение верхних треугольных. С другой стороны, R2 −1 R1 должна быть и нижней треугольной, поскольку она ортогональная (как произведение двух ортогональных матриц Q2 T Q1 −1 ) и ее обратная матрица совпадает с транс- понированной. Очевидно, что диагональная ортогональная матрица может иметь на диагонали лишь элементы, равные по модулю едини- R1 це. Но диагональные элементы и R2 положительны по условию, поэтому остается возможным лишь случай R2 R1 −1 = E , откуда и следует единственность раз- ложения. Теорема доказана. Отметим, что в силу теоремы 10.4.3 решение неоднородной систе- A мы линейных уравнений x = b может быть сведено к раз- ложению невырожденной матрицы треугольной R A – на произведение верхней и ортогональной Q , поскольку в этом случае система преобразуется к легко решаемому виду R x = Q T b . 372 Аналитическая геометрия и линейная алгебра § 10.5. Ортогональные дополнения и ортогональные проекции в евклидовом пространстве Пусть в E задано подпространство E1 . Рассмотрим множество E 2 ⊂ E элементов x , ортогональных всем элементам из E1 . Определение 10.5.1. Теорема 10.5.1. E совокупность элементов x , таких, что ( x , y ) = 0 ∀y ∈ E 1 ⊂ E называется ортогональным дополнением множества E1 . В евклидовом пространстве Ортогональное дополнение k -мерного подпростран- E1 ⊂ E является подпространством размерности n − k . ства n Доказательство. E1 ⊂ E n со стандартным скалярным произведением дан ортонормированный базис и пусть E 2 – ортогональное дополнение к E1 . Выберем некоторый базис в E1 {g1 , g 2 ,..., g k } . Тогда из условия ортогональности произвольного элемента x ∈ E 2 каждому элементу E1 , следует (см. теорему 7.4.1), что Пусть в ( x , gi ) = 0 ; i = [1, n] или же в координатной форме: ε11ξ1 + ε 21ξ 2 + ... + ε n1ξ n = 0, ε ξ + ε ξ + ... + ε ξ = 0, 12 1 22 2 n2 n .......................................... ε1k ξ1 + ε 2 k ξ 2 + ... + ε nk ξ n = 0, 373 Г л а в а 1 0 . Евклидово пространство ε1i ε 2i где g i e = ; i = [1, k ] и x ... ε ni ξ1 ξ2 . e= ... ξn Эта однородная система линейных уравнений (неизвестными в которой являются компоненты элемента x ), определяющая ор- E 2 , имеет ранг k в силу линейной независимости элементов {g1 , g 2 ,..., g k } . Тогда по теореме 6.7.1 у нее есть n − k линейно независимых решений, образующих базис подпространства E 2 . тогональное дополнение Теорема доказана. Убедимся теперь в справедливости следующего утверждения. Теорема 10.5.2. E 2 – ортогональное дополнение подпространства E1 ⊂ E , то E1 является ортогональным дополнением E 2 . Если Доказательство. x ∈ E 2 по условию следствия имеет место равенство ( y , x ) = 0 ; ∀y ∈ E1 . Но это означает, что для каждого y ∈ E1 справедливо ( x, y ) = 0 ; ∀x ∈ E 2 , то есть E1 является ортогональным дополнением к E 2 в E . Для каждого элемента Теорема доказана. Определение 10.5.2. В евклидовом пространстве E элемент y называется ортогональной проекцией элемента x на подпространство E ∗ , если ∗ 1°. y ∈ E ; 2°. ( x − y, z ) = 0 ∀z ∈ E ∗ . 374 Аналитическая геометрия и линейная алгебра Теорема 10.5.3. ∗ Если E ⊂ E является k -мерным подпространством, то элемент y – ортогональная проекция x ∈ E на E ∗ – существует и единственен. Доказательство. Если в E ∗ существует базис {g1 , g 2 ,..., g k } , то элемент k y ∈ E ∗ может быть представлен в виде y = ∑ ξ i g i . i =1 Условие сти x − ∗ ( x − y, z ) = 0 ∀z ∈ E равносильно ортогональноy каждому из базисных элементов подпространства E ∗ , то есть ( x − y, g j ) = 0 ∀j = [1, k ] , и, следовательно, числа ξ i , i = [1, k ] могут быть найдены из системы линейных уравнений k ( x − ∑ ξ i g i , g j ) = 0 ∀j = [1, k ] i =1 или k ∑ (g , g i =1 i j )ξ i = ( x, g j ) ∀j = [1, k ] . Поскольку основная матрица этой системы (как матрица Грама набора линейно независимых элементов g1 , g 2 ,..., g k , см. следствие 10.3.1) невырожденная, то по теореме 6.4.1 (Крамера) решение данной системы существует и единственно. Теорема доказана. Отметим, что если базис {e1 , e2 ,..., ek } в подпространстве E ∗ ортонормированный, то ортогональная проекция элемента k есть элемент вида y = ∑ ( x, ei )ei . i =1 x на E ∗ 375 Г л а в а 1 0 . Евклидово пространство Задача 10.5.1. 4 В евклидовом пространстве E со стандартным скалярным произведением в некотором ортонормированном базисе система линейных уравнений ξ1 + ξ 2 − ξ 3 − ξ 4 = 0, =0 2ξ1 + ξ 2 ∗ задает подпространство E . Найти в этом базисе матрицу оператора ортогонального проектирования элементов E 4 на E ∗ . Решение. ∗ 1°. За базис подпространства E можно принять пару элементов g1 и g 2 , координатные представления которых в исходном базисе {e1 , e2 , e3 , e4 } являются линейно независимыми решения- ми однородной системы линейных уравнений, задающей например, −1 g 2°. Поскольку 1 e = 2 ; 1 0 E∗, −1 g 2 e = 2 . 0 1 dim E ∗ = 2, то размерность ортогонального допол∗ нения к E согласно теореме 10.5.1 также равна 2. За базис в этом ортогональном дополнении удобно принять элементы g 3 и g 4 , такие, что g3 e 1 1 ; = −1 −1 g4 e 2 1 = , 0 0 376 Аналитическая геометрия и линейная алгебра поскольку они линейно независимы и ортогональны каждому ∗ элементу из подпространства E , как образованные из коэффициентов заданной в условии задачи системы линейных уравнений. 3°. Элементы g1 , g 2 , g 3 и g 4 линейно независимые по построе4 4 нию и образуют базис в E , и каждый элемент из E может быть представлен и притом единственным образом как линейная комбинация элементов этого базиса {g1 , g 2 , g 3 , g 4 } . Искомый оператор A$ ортогонального проектирования элемен- E 4 на E ∗ должен, очевидно, удовлетворять соотношениям Aˆ g 1 = g1 ; Aˆ g 2 = g 2 ; Aˆ g 3 = o; Aˆ g 4 = o, в силу которых его матрица в базисе {g1 , g 2 , g 3 , g 4 } будет тов иметь следующий вид: Aˆ g = 1 0 0 0 0 0 0 1 0 0 0 0 0 0 . 0 0 4°. С другой стороны, матрица перехода от базиса базису {e1 , e2 , e3 , e4 } к {g1 , g 2 , g 3 , g 4 } S = −1 −1 1 2 2 1 0 2 0 1 1 −1 −1 1 0 0 , 377 Г л а в а 1 0 . Евклидово пространство Aˆ но поскольку Aˆ = S e Aˆ = S g −1 S g −1 Aˆ e S и, следовательно, , то, воспользовавшись § 5.1 и § 6.8, найдем, что Aˆ e = = = −1 −1 1 2 1 0 0 0 −1 −1 1 2 2 1 2 0 1 −1 1 0 0 0 1 0 0 0 0 0 2 1 2 0 1 −1 1 0 0 1 −1 0 0 0 0 0 0 1 −1 0 2 −4 −1 −1 1 −4 11 − 1 −1 8 2 2 6 2 −5 2 −5 6 −1 = . Замечание: геометрическая интерпретация ортогонального проекти- рования вполне очевидна, однако эта операция используется и в других приложениях. Например, если E есть евклидово пространство непрерывных на [α, β] функций со скалярным произведением β ( x, y ) = ∫ x(τ) y (τ)dτ , α а E ∗ – подпространство алгебраических многочленов n Pn (τ) = ∑ α k τ k степени не выше, чем n , то ортогоk =0 x(τ) – элемента E – на E ∗ может рассматриваться как наилучшее на [α, β] приближение x(τ) линейной комбинацией степенных многочленов. нальная проекция Подробно эта задача рассмотрена в § 12.3. 378 Аналитическая геометрия и линейная алгебра § 10.6. Сопряженные операторы в евклидовом пространстве Поскольку евклидово пространство является частным случаем линейного пространства, то все изложенные в главе 8 утверждения справедливы и для линейных операторов, действующих в евклидовом пространстве. Однако операция скалярного произведения позволяет выделять в евклидовых пространствах специфические классы линейных операторов, обладающих рядом полезных свойств. Определение 10.6.1. + $ , заданный в евклидовом Линейный оператор A пространстве E , называется сопряженным линейно- A$ , если ∀x , y ∈ E имеет место ра$ , y ) = ( x , A$ + y ) . венство ( Ax му оператору Пример 10.6.1. В евклидовом пространстве, образованном бесконечно дифференцируемыми функциями, равными нулю вне некоторого конечного интервала, со скалярным произведением ( x, y ) = +∞ ∫ x(τ) y(τ)dτ для линейного оператора −∞ d (дифференцирования) сопряженным будет опеdτ d + ратор  = − . dτ  = Действительно, согласно правилу интегрирования несобственных интегралов по частям имеют место равенства ( Aˆ x, y ) = +∞ dx(τ) y ( τ ) dτ = d τ −∞ ∫ = x ( τ) y ( τ) +∞ −∞ − +∞ ∫ x ( τ) −∞ dy (τ) dτ = dτ 379 Г л а в а 1 0 . Евклидово пространство = +∞ ∫ x(τ)(− −∞ dy (τ) )dτ = ( x, Aˆ + y ) . dτ n Рассмотрим теперь конечномерное евклидово пространство E с базисом {g1 , g 2 ,..., g n } и выясним связь матриц линейных операто- A$ и A$ + в этом базисе, предположив, что сопряженный оператор $ и A$ + имеют соответстсуществует. Пусть матрицы операторов A $ $ + , а координатные представления элементов венно вид A и A g g ров x и y в базисе {g1 , g 2 ,..., g n } – x x g g где Γ g η1 η y g= 2 , ... ηn и $ , y ) = ( x , A$ + y ) можно записать как ( Ax тогда равенство ( Aˆ g ξ1 ξ = 2 ... ξn )T Γ g y g = x T g – матрица Грама выбранного в В силу соотношения Γ g Aˆ + y g g , (10.6.1) E n базиса. ( A B )T = B T A T последнее равен- ство можно преобразовать к виду x T g ( Aˆ T g Γ g − Γ g Aˆ + ) y g g = 0, а поскольку это равенство справедливо при любых x и y, то, приняв во внимание невырожденность матрицы Грама и проведя рассуждения, аналогичные использованным при доказательстве леммы 5.1.2, заключаем, что матрица, стоящая в круглых скобках, – нулевая, а из соотношения 380 Aˆ Аналитическая геометрия и линейная алгебра T Γ g g − Γ g Aˆ + g = O следует Aˆ + g = Γ которое, в частности, для ортонормированного базиса имеет вид g Aˆ T g Γ {e1 , e2 ,..., en } T Aˆ + = Aˆ e . e Если Лемма 10.6.1. −1 ( x, Aˆ y ) = 0 ∀x, y ∈ E , то оператор  нулевой. Доказательство. ∀x , y ∈ E справедливо равенство ( x , A$ y ) = 0 . Тогда $ y . Но из равенства оно будет верным и для x = A ( A$ y , A$ y ) = 0 согласно определению 10.1.1 следует, что Пусть Aˆ y = o. Наконец, в силу произвольности элемента y и опре$ = O$ . деления 8.2.2 приходим к заключению, что A Лемма доказана. Теорема 10.6.1. Каждый линейный оператор в евклидовом пространстве E n имеет единственный сопряженный оператор. Доказательство. Существование в E n оператора A$ + , сопряженного оператору A$ , следует из возможности построения матрицы вида T −1 Γ Aˆ Γ для любого линейного оператора A$ . g g g A$ + . Предположим, что A$ $ + и A$ × . Это означает, имеет два сопряженных оператора A что ∀x , y ∈ E одновременно выполнены равенства Покажем теперь единственность g , 381 Г л а в а 1 0 . Евклидово пространство $ , y ) = ( x , A$ + y ) и ( Ax $ , y ) = ( x , A$ × y ) . ( Ax $ + − A$ × ) y ) = 0 , но тоВычитая их почленно, получим ( x , ( A $ + − A$ × = O$ . гда по лемме 10.6.1 A Теорема доказана. Теорема 10.6.2. Для любых линейных операторов щих в E , имеет место равенство A$ и B$ , действую- $ $ ) + = B$ + A$ + . ( AB Доказательство. Имеет место ∀x , y ∈ E $ $ ) + x , y ) = ( x , ABy $ $ ) = ( A$ + x , By $ ) = ( B$ + A$ + x , y ) . (( AB ((( Aˆ Bˆ ) + − Bˆ + Aˆ + ) x, y ) = 0 ∀x , y ∈ E и в $ $ ) + − B$ + A$ + = O$ . силу леммы 10.6.1 ( AB Это означает, что Теорема доказана. Теорема 10.6.3. Имеет место равенство ( A$ + ) + = A$ . Доказательство. ∀x , y ∈ E справедливы равенства $ , y) . (( A$ + ) + x , y ) = ( x , A$ + y ) = ( Ax (( A$ − ( A$ + ) + ) x , y ) = 0 ∀x , y ∈ E и то$ − ( A$ + ) + = O$ . гда по лемме 10.6.1 A Откуда следует, что Теорема доказана. 382 Аналитическая геометрия и линейная алгебра Теорема 10.6.4. Ортогональное дополнение области значений оператора A$ в E n является ядром оператора A$ + . Доказательство. A$ + , обозначаемое че$ + , содержится во множестве Π – ортогональном рез ker A $. дополнении области значений оператора A $ + , то есть такой, Действительно, любой элемент y ∈ ker A 1°. Покажем вначале, что ядро оператора + $ y что A скольку $ , x ∈ E n , по= o , ортогонален элементу b = Ax $ , y ) = ( x , A$ + y ) = 0 . (b, y ) = ( Ax + $ и Π . С одной стороны, 2°. Теперь сравним размерности ker A в силу невырожденности базисной матрицы Грама и теоремы 8.4.3 dim( ker Aˆ + ) = n − rg Aˆ + = = n − rg ( Γ −1 Aˆ T Γ ) = n − rg Aˆ T = n − rg Aˆ . Но, с другой стороны, по теореме 8.4.1 размерность области значений A$ равна rg A$ , поэтому dim(Π ) = n − rg Aˆ по теореме 10.5.1. Наконец, из + соотношений dim(ker Aˆ + ) = dim(Π ) + ker  ⊂ Π следует совпадение множеств ker  и Π . Теорема доказана. и 383 Г л а в а 1 0 . Евклидово пространство Замечания: 1) в использованных обозначениях теорема 10.6.4 до- пускает формулировку, совпадающую с формулировкой теоремы 6.7.3 (Фредгольма), поскольку равенст- $ = b означает, что элемент b принадлежит обAx $. ласти значений линейного оператора A 2) в предположении, что столбцы y и b суть во m координатные представления элементов E в ортонормированном базисе, также и нижеследующую формулировку: Теорема 10.6.5 (Фредгольма). Система линейных уравнений A x = b со- вместна тогда и только тогда, когда каждое решение однородной сопряженной системы ортогонально столбцу свободных членов A T y = o b . § 10.7. Самосопряженные операторы Определение 10.7.1. Линейный оператор R$ , действующий в евклидовом пространстве E , называется самосопряженным, если ∀x , y ∈ E имеет место равенство ( Rˆ x, y ) = ( x, Rˆ y ) . Пример 10.7.1. В евклидовом пространстве операторы вида A$ + A$ + , $ $ + и A$ + A$ будут самосопряженными для любого лиAA $. нейного оператора A Действительно, для оператора что ∀x , y ∈ E . A$ + A$ , например, имеем, 384 Аналитическая геометрия и линейная алгебра $ , y ) = ( Ax $ , Ay $ ) = ( x , A$ + Ay $ ), ( A$ + Ax откуда и следует его самосопряженность. Свойства самосопряженных операторов сформулируем в виде следующих утверждений. Лемма 10.7.1. Линейный оператор R$ в E является самосопряженным тогда и только тогда, когда его матрица в каждом ортонормированном базисе симметрическая. n Доказательство. Rˆ + = Γ Из определения 10.7.1 и формулы g −1 Rˆ g T g Γ g {e1 , e2 ,..., en } в T силу самосопряженности оператора R̂ имеем R$ = R$ . e e для некоторого ортонормированного базиса Перейдем теперь к другому ортонормированному базису {e1′ , e′2 ,..., e′n } . Матрица перехода S , как было показано в Rˆ T e′ −1 =( S = S T = S T Rˆ Rˆ Rˆ e = x T e Rˆ + Лемма доказана. T e T y e y e ) = S T T ( S e S = S e −1 Rˆ = S T T e Rˆ Rˆ e T e T . Поэтому S )T = S = S = Rˆ e′ . T Rˆ e = Rˆ e , то ∀x, y ∈ E n Верно и обратное: если ( Rˆ x, y ) = Rˆ x S )T = ( S T e −1 S § 10.4, ортогональная, то есть для нее = ( Rˆ = x T e Rˆ e e x e )T y e = x e y e T = Rˆ y = ( x, Rˆ y ). e 385 Г л а в а 1 0 . Евклидово пространство Признак самосопряженности может быть сформулирован как n Следствие 10.7.1 Если линейный оператор в E имеет симметриическую матрицу в некотором ортонормированном базисе, то он самосопряженый. Лемма 10.7.2. Все собственные значения самосопряженного оператора R$ в E n вещественные числа. Доказательство. Допустим противное: пусть характеристическое уравнение самосопряженного оператора λ = α + β i , где β ≠ 0 . R$ имеет комплексный корень По теореме 8.6.2 оператор R$ в этом случае имеет двумерное инвариантное подпространство. То есть существует пара линейно независимых элементов x и y таких, что Rˆ x = α x − β y, ˆ Ry = α y + β x. Умножая эти равенства скалярно: первое – справа на – слева на x , получим y , второе ( Rˆ x, y ) = α( x, y ) − β( y, y ), ˆ ( x, Ry ) = α( x, y ) + β( x, x). Вычитая почленно второе равенство из первого и принимая во внимание самосопряженность R$ , приходим к заключению, что β ( x + y ) = 0 . Однако это противоречит предположению о том, что β ≠ 0 . 2 Лемма доказана. 2 386 Аналитическая геометрия и линейная алгебра Лемма 10.7.3. Собственные векторы самосопряженного оператора, отвечающие различным собственным значениям, попарно ортогональны. Доказательство. R$ имеют место равенства Rˆ f1 = λ1 f1 и Rˆ f 2 = λ 2 f 2 , где ненулевые элементы f 1 $ и λ ≠ λ – сооти f 2 – собственные векторы оператора A 1 2 Пусть для самосопряженного оператора ветствующие им собственные значения. Умножив эти равенства соответственно: первое – скалярно справа на f 2 , второе – скалярно слева на f 1 , получим ( Rˆ f 1 , f 2 ) = (λ 1 f 1 , f 2 ), ( Rˆ f 1 , f 2 ) = λ 1 ( f1 , f 2 ), или ˆ ˆ ( f 1 , R f 2 ) = ( f 1 ,λ 2 f 2 ) ( f 1 , R f 2 ) = λ 2 ( f1 , f 2 ). Вычитая эти равенства почленно и учитывая, что пряженный оператор, приходим к равенству (λ 1 − λ 2 )( f1 , f 2 ) = 0 , откуда R$ – самосо- ( f1, f 2 ) = 0 . Лемма доказана. Лемма 10.7.4. Пусть E ′ – инвариантное подпространство самосопря- женного оператора R$ , действующего в E , и пусть E ′′ – ортогональное дополнение к E ′ в E . Тогда E ′′ – также инвариантное подпространство оператора R$ . Доказательство. E′ инвариантно для оператора R$ , то есть $ ∈ E ′ . Если E ′′ – ортогональное дополнение ∀x ∈ E ′ : Rx E ′ , то для любых x ′ ∈ E ′ и x ′′ ∈ E ′′ : ( x ′, x ′′) = 0 . 387 Г л а в а 1 0 . Евклидово пространство E ′ – инвариантное подпространство R$ , то будет $ ′, x ′′) = 0 . Но в силу самосопряженнотакже иметь место ( Rx $ ′′) = 0 . Последнее равенство означает, что сти R$ и ( x ′, Rx Поскольку Rˆ x ′′ ∈ E ′′ ∀x ′′ ∈ E ′′ , то есть и подпространство E ′′ будет инвариантным для оператора R$ . Лемма доказана. Теорема 10.7.1. Для любого самосопряженного оператора R$ в E существует ортонормированный базис, состоящий из n собственных векторов R$ . Доказательство. Для самосопряженного оператора R$ в крайней мере, одно собственное значение E n существует, по λ 1 . По лемме 10.7.2 это собственное значение вещественно. Из системы уравнений (8.5.1) можно найти отвечающий λ 1 собственный вектор e1 . Без ограничения общности можно считать, что e1 = 1 . Если n = 1 , то доказательство завершено. 1 Рассмотрим E – линейную оболочку элемента e1 , являющуюся одномерным инвариантным собственным подпространством R$ . Пусть E n −1 – ортогональное дополнение к E 1 . Тогда по n −1 лемме 10.7.4 E – также инвариантное подпространство $ оператора R . Рассмотрим теперь оператор R$ как действующий только в E n −1 . Тогда очевидно, что R$ – самосопряженный оператор, 388 Аналитическая геометрия и линейная алгебра заданный в E n −1 , поскольку E n −1 инвариантно относительно R$ по лемме 10.7.4 и, кроме того, $ , y ) = ( x , Ry $ ), ∀x , y ∈ E n : ( Rx в том числе и ∀x , y ∈ E n −1 . Применяя изложенные выше рассуждения, найдем новое собственное значение λ 2 и соответствующий ему собственный вектор e2 . Без ограничения общности можно считать, что e2 = 1 . При этом λ 2 может случайно совпасть с λ 1 , однако из построения ясно, что ( e1 , e2 ) = 0 . n = 2 , то построение базиса завершено. Иначе рассмот2 рим E – линейную оболочку { e1 , e2 } и ее ортогональное Если E n − 2 , найдем новое собственное значение λ 3 и соответствующий ему собственный вектор e3 и т.д. дополнение Аналогичные рассуждения проводим до исчерпания En . Теорема доказана. Следствие 10.7.2. В базисе, построенном в теореме 10.7.1, самосопряженный оператор R$ имеет диагональную матрицу в En . Доказательство. Вытекает из замечания о важности собственных векторов в § 8.5. Следствие 10.7.3. Размерность собственного инвариантного подпространства, отвечающего некоторому собственному значению самосопряженного оператора, равна кратности этого собственного значения. 389 Г л а в а 1 0 . Евклидово пространство Доказательство. Следует из доказательства теоремы 10.7.1. Следствие 10.7.4. Если линейный оператор R$ в E имеет n попарно ортогональных собственных векторов, то он самосопряженный. n Доказательство. Пронормируем собственные векторы оператора R$ и примем их за ортонормированный базис, в котором матрица этого линейного оператора R$ e диагональная и, следовательно, симмет- рическая. Тогда в силу леммы 10.7.1 линейный оператор мосопряженный. R$ са- Следствие доказано. Следствие 10.7.5. Если R симметрическая матрица, то существу- ет ортогональная матрица Q такая, что матри- ца D = Q −1 R Q = Q T R Q диагональная. Доказательство. В ортонормированном базисе симметрическая матрица определяет самосопряженный оператор в стве искомой матрицы R E n , поэтому в каче- Q можно выбрать матрицу перехо- да от данного ортонормированного базиса к ортонормированному базису, образованному собственными векторами этого оператора по схеме, использованной в доказательстве теоремы 10.7.1. Следствие доказано. 390 Аналитическая геометрия и линейная алгебра Теорема 10.7.2. A$ и B$ имеют обn щую систему собственных векторов в E тогда и ˆ Bˆ = Bˆ Aˆ . только тогда, когда A Два самосопряженных оператора Доказательство. Докажем необходимость. Пусть Aˆ a = λa и Bˆ a = µa , тогда Bˆ Aˆ a = λBˆ a = λµa ; Aˆ Bˆ a = µAˆ a = λµa , ˆ Bˆ − Bˆ Aˆ ) a = o . Поскольи, вычитая почленно, получим, что ( A ку a – произвольный собственный вектор, то данное соотношение верно и для всей совокупности собственных векторов, а знаE n , так как из собственных векто$ $ − BA $ $ = O$ . ров можно образовать базис. Поэтому AB чит, и для любого элемента в Докажем достаточность. Пусть самосопряженные операторы A$ и B$ коммутируют и Aˆ a = λa . Рассмотрим здесь лишь случай, ко$ различны. гда все собственные значения оператора A пусть, кроме того, Покажем, что элемент евклидова пространства собственным вектором оператора $ является b = Ba A$ . Действительно, в силу $ $ = BA $ $ имеем AB Aˆ b = Aˆ Bˆ a = Bˆ Aˆ a = Bˆ λa = λBˆ a = λb . $ кратности единица, то Поскольку все собственные значения A λ есть его собственное значение, отвечающее a и b одновре$ , также Bˆ a = κa . b = κa и, поскольку b = Ba Значит, a – собственный вектор оператора B$ . менно. Поэтому Теорема доказана. 391 Г л а в а 1 0 . Евклидово пространство § 10.8. Ортогональные операторы Определение 10.8.1. Линейный оператор Q$ , действующий в евклидовом пространстве E , называется ортогональным (или изометрическим), если ∀x , y ∈ E имеет место равенство $ , Qy $ ) = ( x, y) . (Qx Из определения 10.8.1 следует, что ортогональный оператор сохраняет нормы элементов и величины углов между ними. Действительно, Qˆ x = (Qˆ x, Qˆ x) = ( x, x) = x ; cos ψ = (Qˆ x, Qˆ y ) ( x, y ) = = cos ϕ ; x y Qˆ x Qˆ y x, y ∈ E , ϕ – величина угла между элементами x и y , а ψ – величина угла $ и Qy $ . между элементами Qx где Теорема 10.8.1. $ имеет сопряженный Если ортогональный оператор Q оператор, то он имеет и обратный оператор, причем Q$ −1 = Q$ + . Доказательство. По определению 10.8.1 следует, что $ , Qy $ ) = ( x , y ) , откуда ∀x , y ∈ E (Qx $ ) = ( x , y ) или ( x ,( Q$ + Q$ − E$ ) y ) = 0 . ( x , Q$ + Qy Последнее равенство в силу леммы 10.6.1 означает, что Q$ + Q$ − E$ = O$ . 392 Аналитическая геометрия и линейная алгебра Q$ + Q$ − E$ = O$ вытекает, что Q$ + Q$ = E$ . Тогда Qˆ + Qˆ Qˆ + = Eˆ Qˆ + , а в силу того, что единичный оператор комˆ + Qˆ Qˆ + = Qˆ + Eˆ или мутирует с любым другим, получаем Q $ $ + = E$ . Наконец, по определению 8.2.8 приходим к QQ Из равенства Q$ −1 = Q$ + . Теорема доказана. Q̂ + и Qˆ −1 также ортогональные. Следствие 10.8.1. Операторы Теорема 10.8.2. Матрица ортогонального оператора в E в каждом ортонормированном базисе ортогональная. n Доказательство. Пусть оператор Q$ ортогональный. Тогда из соотношения Q$ −1 = Q$ + по теореме 10.8.1 и в силу § 8.3 (4°) в ортонормированном базисе справедливы равенства Q$ Но тогда Q$ −1 e −1 e = Q$ −1 e = Q$ + = Q$ e T = Q$ e . T e , что и означает, согласно определе- нию 5.1.4, ортогональность матрицы Q$ e . Теорема доказана. Признак ортогональности линейного оператора в Теорема 10.8.3. E n дает n Для того чтобы линейный оператор в E был ортогональным, достаточно, чтобы его матрица была ортогональной в некотором ортонормированном базисе. 393 Г л а в а 1 0 . Евклидово пространство Доказательство. Q$ в некотором ортонормиро- 1º. Пусть у линейного оператора Qˆ ванном базисе T (Qˆ x, Qˆ y ) = Qˆ x = x T Qˆ e T e Qˆ Qˆ y e y e e −1 e T = Qˆ = ( Qˆ e = x T e x e ) T Qˆ e Qˆ ∀x, y ∈ E n . Тогда e −1 e Qˆ y e y e e e = x = T e y e = ( x, y ). То есть условие ортогональности выполнено в {e1 , e2 ,..., en } . 2º. Перейдем теперь к {e1′ , e′2 ,..., e′n } − некоторому другому ор- тонормированному базису и убедимся, что условие ортогональности при этом переходе не нарушится. Действительно, в силу ортогональности матрицы перехода S , связывающей два ортонормированных базиса, имеем Qˆ −1 e′ =( S = S T =( S Qˆ −1 −1 T e Qˆ Qˆ e S ) −1 = S S = S e T T −1 Qˆ ( S S ) T = Qˆ e T e′ Qˆ −1 e T T S = S −1 T Qˆ ) =( S Qˆ e T e S = S )T = . Теорема доказана. В ряде приложений оказывается полезной Теорема 10.8.4 (о полярном разложении). Любой линейный оператор A$ в E n с det Aˆ ≠ 0 может быть единственным образом представлен в $ $ , где оператор Q$ ортогональный, а A$ = QR оператор R$ – самосопряженный и имеющий по- виде ложительные собственные значения. 394 Аналитическая геометрия и линейная алгебра Доказательство. 1°. Покажем вначале, что самосопряженный оператор $+ A A$ (см. пример 10.7.1) имеет только положительные собстˆ + Aˆ f = λ f , тогда, с венные значения. Действительно, пусть A ˆ + Aˆ f , f ) = ( Aˆ f , Aˆ f ) > 0 при f ≠ o , а с одной стороны, ( A другой – ( Aˆ + Aˆ f , f ) = (λ f , f ) = λ ( f , f ) , то есть ( Aˆ f , Aˆ f ) = λ( f , f ) . Но тогда все λ > 0 в силу определения ˆf =o скалярного произведения, поскольку из допущения A при f ≠ o следует, что Aˆ f = 0 f ⇔ det Aˆ = 0 . {e1 , e2 ,..., en } – ортонормированный базис, состоящий $ + A$ . Рассмотрим множеиз собственных векторов оператора A $ ; i = [1, n] , для которых ство элементов Ae 2°. Пусть i ( Aˆ ei , Aˆ e j ) = ( Aˆ + Aˆ ei , e j ) = λ i (ei , e j ) = λ i δ ij ;i, j = [1, n] . Но это означает, что 1 ˆ Aei ; i = [1, n] – также баei′ = λi зис и притом ортонормированный. Q$ оператор, переводящий ортонормированный базис {e1 , e2 ,..., en } в ортонормированный базис {e1′ , e′2 ,..., e′n } , и убедимся, что в каче$ −1 A$ . стве R$ можно взять оператор Q 3°. Примем за искомый ортогональный оператор Действительно, во-первых, имеет место равенство Во-вторых, из соотношений $ $. A$ = QR Rˆ ei = Qˆ −1 Aˆ ei = Qˆ −1 λ i ei′ = λ i ei ;i = [1, n] Г л а в а 1 0 . Евклидово пространство 395 следует, что базисные элементы ei , i = [1, n] суть собствен- R$ , отвечающие положительным собстλ i , а значит, матрица R$ e в базисе ные векторы оператора венным значениям {e1 , e2 ,..., en } диагональная и потому симметрическая. Тогда в силу леммы 10.7.1 оператор R$ самосопряженный. 4°. Покажем, наконец, единственность разложения. Во введенных обозначениях справедливо равенство A$ + A$ = R$ 2 , поскольку из $ $ и A$ + = R$ + Q$ + следует, что A$ = QR $ $ = R$ + Q$ −1QR $ $ = R$ + R$ , A$ + A$ = R$ + Q$ + QR $ + A$ = R$ 2 . то в силу самосопряженности R$ A Предположим, что существуют два различных самосопряжен- R$1 и R$ 2 с положительными собственными зна$ + A$ = R$ 2 ; A$ + A$ = R$ 2 и R$ 2 − R$ 2 = O$ . чениями, такие, что A ных оператора 1 2 1 2 Заметим, что R$1 и R$ 2 по построению (см. 2°) имеют общую систему собственных векторов, а потому они коммутируют. Но тогда, согласно § 8.2, справедливы равенства Rˆ12 − Rˆ 22 = Rˆ12 − Rˆ1 Rˆ 2 + Rˆ 2 Rˆ1 − Rˆ 22 = = ( Rˆ1 − Rˆ 2 )( Rˆ1 + Rˆ 2 ) = Oˆ . Из невырожденности и линейности R$1 и R$ 2 в силу теоремы 8.6.8 оператор R$1 + R$ 2 также невырожденный и поэтому из $ следует R$ − R$ = O$ . равенства ( R$ − R$ )( R$ + R$ ) = O 1 2 1 2 1 2 Таким образом, R$ – самосопряженный оператор, определяе$ однозначно. Но Qˆ = Aˆ Rˆ −1 и, значит, также опремый по A $. деляется однозначно по A Теорема доказана. 396 Аналитическая геометрия и линейная алгебра Теорема о полярном разложении является обобщением теоремы 5.5.2 о возможности представления аффинного преобразования плоскости в виде произведения двух операторов, первый из которых ортогональный, а второй – сжатие по двум взаимно перпендикулярным направлениям, матрица которого диагональная. Замечания. 1°. $ разложение, В случае вырожденного оператора A аналогичное указанному в теореме 10.8.2, с неотрицательными собственными значениями самосопря- 2°. женного оператора венно. Задача 10.8.1. R$ существует, но не единст- В некотором ортонормированном базисе в оператор 2 A$ имеет матрицу Aˆ e0 = E 2 линейный −1 0 2 . Найти его полярное разложение. Решение. 1°. Выполним искомое разложение по схеме, использованной в A$ + A$ в ис0 0 ходном (стандартном) ортонормированном базисе {e1 , e2 } доказательстве теоремы 10.8.2. Матрица оператора имеет вид Aˆ + Aˆ = 2 −1 e0 = Aˆ + 0 2 e0 2 0 Aˆ e0 = Aˆ T e0 Aˆ e0 = −1 2 − 2 = . − 2 2 3 397 Г л а в а 1 0 . Евклидово пространство Собственные значения и собственные векторы этого оператора равны соответственно λ1 = 1 ; λ 2 = 4 ; f1 e0 2 = 1 ; f2 e0 = −1 , 2 поэтому (сохраняя обозначения, использованные в доказательстве теоремы 10.8.2) получим координатные представления в {e10 , e20 } для элементов, образующих ортонормированные базисы {e1 , e2 } : e1 = и f1 f1 = 2 3 1 3 − f2 ; e2 = f2 1 3 = , 2 3 {e1′ , e′2 } : e1′ = 1 ˆ A e1 = λ1 = 1 2 2 0 1 3 ; e2′ = 1 3 − 1 ˆ A e2 = λ2 2 3 −1 2 − 2 3 = 2 3 . 1 3 398 2°. Аналитическая геометрия и линейная алгебра Обозначив через 2 3 G = − 1 3 и 1 3 1 3 F = 2 3 − 2 3 2 3 1 3 соответственно матрицы перехода от исходного (стандартного) базиса {e1 , e2 } к базисам {e1 , e2 } и {e1′ , e′2 } и рассуждая так же, как при решении задачи 7.5.2, получим для матрицы орто0 0 гонального оператора Q$ выражение Qˆ e0 = F G −1 . Действительно, в рассматриваемом случае преобразование Qˆ {e1 , e2 } → {e1′ , e′2 } может быть представлено как произведение (последовательное выполнение) преобразований Gˆ −1 {e1 , e2 } → {e10 , e20 } Следовательно, Qˆ e0 = Fˆ Fˆ {e10 , e20 } → {e1′ , e2′ } . и e0 Gˆ −1 e0 . Наконец, в силу определений (8.3.1) и (7.4.2), а также равенства Gˆ −1 e0 = Gˆ −1 e0 получаем, что Учитывая, что матрица Qˆ e0 = F G −1 . G ортогональная (как матрица пе- рехода, связывающая два ортонормированных базиса), находим матрицу Qˆ e0 = F G −1 = F G T = 399 Г л а в а 1 0 . Евклидово пространство 1 3 = 2 3 − 2 3 2 3 1 3 − 1 3 1 3 2 2 3 = − 1 3 , 2 3 1 3 2 2 3 которая в исходном ортонормированном базисе ортогональная. 3°. Поскольку Rˆ e0 = R$ = Q$ −1 A$ , то = Qˆ −1 e0 2 2 3 − Aˆ e0 1 3 1 3 Aˆ −1 = 2 2 0 2 2 3 −1 e0 = Qˆ e0 T e0 = Qˆ 4 3 − Aˆ e0 = 2 3 , − 2 3 5 3 и, следовательно, искомое полярное разложение имеет вид Aˆ e0 = Qˆ e0 Rˆ e0 = 2 2 3 − 1 3 4 3 − 2 3 . 1 3 2 2 3 − 2 3 5 3 400 Аналитическая геометрия и линейная алгебра Глава 11 УНИТАРНОЕ ПРОСТРАНСТВО § 11.1. Определение унитарного пространства Определение 11.1.1. Пусть в комплексном линейном пространстве U каждой упорядоченной паре элементов a и b поставлено в соответствие комплексное15 число ab , называемое их скалярным произведением, так, что выполнены аксиомы: 1°. ab = ba ; 2°. λa b =λ a b 3°. a1 + a 2 b = a1 b + a 2 b ; 4°. a a – вещественное неотрица- ; тельное число, причем a a =0 ⇔ a =o, тогда говорят, что задано унитарное пространство. Для обозначения скалярного произведения в унитарном пространстве используются не круглые скобки, принятые в евклидовом пространстве, а скобки типа “брэкет”. Замечание: вид аксиомы 1° позволяет избежать проблемы, которая возникает в случае использования евклидовского правила коммутативности скалярного произведения для комплексных линейных пространств. 15 Определение и основные свойства комплексных чисел приводятся в приложении 3. 401 Г л а в а 1 1 . Унитарное пространство Действительно, если принять, что a b = b a , то a λb = λ a b , и очевидно, что при некотором ненулевом a и λ = i : ia ia = (i)(i) a a = (−i ) 2 a a = i 2 a a = − a a , но тогда либо ia ia , либо a a не положительно и аксиома 4° не будет справедливой. В случае же равенства a b = b a вынос λ из вто- рого сомножителя скалярного произведения выполняется иначе: a λb = λb a = λ b a = λ b a = λ a b , = поскольку λ = λ , что в рассматриваемом примере приводит к равенству ia ia = ii a a = a a , которое согласуется с аксиомой 4°. Пример 11.1.1. 1°. Пространство n-мерных столбцов ξ1 ξ a= 2 ; b= ... ξn η1 η2 , где ξ i , η i ; i = [1, n] ... ηn – комплексные числа, со скалярным произведением, n определяемым по формуле a b = ∑ ξ i ηi , является i =1 унитарным. 402 Аналитическая геометрия и линейная алгебра 2°. Унитарным будет пространство непрерывных на [α, β] комплекснозначных функций вещественного аргумента со скалярным произведением β a b = ∫ a (τ)b(τ)dτ . α В унитарных пространствах, как правило, существуют аналоги определений и теорем, справедливых для евклидова пространства. Например, неравенство Коши–Буняковского имеет вид aa bb ≥ ab ba . Действительно, aa bb ≥ ab В 2 конечномерном = ab ab = ab ba унитарном ∀a, b ∈U . пространстве Un базис {g1, g 2 ,..., g n } при необходимости может быть ортогонализирован по схеме Грама–Шмидта. Выражение для скалярного произведения в координатах аналогично соответствующей формуле в евклидовом пространстве: a b = ξ1 ξ2 K ξn Γ g η1 η2 = K ηn = ξ1 ξ2 K ξn g1 g1 g 2 g1 K g1 g 2 g2 g2 K K K K g1 g n g2 gn K g n g1 gn g2 K gn gn η1 η2 K ηn , 403 Г л а в а 1 1 . Унитарное пространство где Γ g – базисная матрица Грама в унитарном пространстве Заметим, что поскольку во Γ T g = Γ Определение 11.1.2. g U n. g i g j = g j g i , то имеет место равенст- . Матрица A , удовлетворяющая соотношению A = A , называется эрмитовой. T Матрица A T A , удовлетворяющая соотношениям A = E и A A T = E , называется уни- тарной. Определитель унитарной матрицы есть комплексное число, модуль которого равен единице. Действительно, det ( A T A ) = det A = det A T det A = det A det A = 2 = det E = 1 . § 11.2. Линейные операторы в унитарном пространстве Для унитарного пространства справедливы определения, введенные для линейных операторов в главе 10. В данном параграфе будут рассмотрены лишь специфические особенности линейных операторов, действующих в унитарном пространстве. 404 Аналитическая геометрия и линейная алгебра Определение 11.2.1. $ , действующий в унитарном Линейный оператор A пространстве U , называется унитарным (или изометрическим), если ∀a , b ∈U имеет место равенство Aˆ a Aˆ b = a b . унитарный линейный оператор, действующий в конеч- Замечание: n номерном унитарном пространстве U , в ортонормированном базисе имеет унитарную матрицу. Определение 11.2.2. + $ , действующий в унитарном Линейный оператор A пространстве U , называется эрмитово сопряженным линейному оператору сто равенство A$ , если ∀a , b ∈U имеет ме- Aˆ a b = a Aˆ + b . Теорема 11.2.1. $ и B$ , действующих в Для линейных операторов A унитарном пространстве U , справедливы соотношения: $ $ ) + = B$ + A$ + и (λAˆ ) + = λ Aˆ + . ( AB Доказательство. Докажем первое соотношение. Имеем ( Aˆ Bˆ )a b = Bˆ a Aˆ + b = a Bˆ + Aˆ + b ∀a, b ∈ U . Откуда получаем по определению 11.2.2, что $ $ ) + = B$ + A$ + . ( AB Аналогично (λAˆ )a b = λ Aˆ a b = λ a Aˆ + b = a λ Aˆ + b ∀a, b ∈ U для любого комплексного числа Теорема доказана. λ. 405 Г л а в а 1 1 . Унитарное пространство Для эрмитовски сопряженных операторов, действующих в конечномерном пространстве U n , имеет место A$ + , эрмитово сопряженного оператору A в U , в базисе {g1 , g 2 ,..., g n } определяется Теорема Матрица оператора 11.2.2. n $ соотношением Aˆ + g = Γ −1 Aˆ T g Γ , доказательство которой аналогично выводу формулы (10.6.1) для евклидова пространства. § 11.3. Эрмитовы операторы Определение 11.3.1. $ , действующий в унитарном Линейный оператор A пространстве, называется эрмитово самосопряженным (или просто эрмитовым), если A$ = A$ + . Замечание: эрмитов оператор, действующий в конечномерном n унитарном пространстве U , обладает свойствами, аналогичными свойствам самосопряженного оператора в евклидовом пространстве E n . В частности: 1°. Собственные значения эрмитова оператора вещественны. 2°. Собственные векторы, отвечающие различным собственным значениям эрмитова оператора, ортогональны. 3°. Для каждого эрмитова оператора существует ортонормированный базис, состоящий из его собственных векторов. 406 Аналитическая геометрия и линейная алгебра 4°. В любом ортонормированном базисе унитарn ного пространства U эрмитов оператор имеет эрмитову матрицу. Определение 11.3.2. $ Собственное значение λ линейного оператора A называется вырожденным, если отвечающее ему инвариантное собственное подпространство имеет размерность больше единицы. Приведем формулировки и обоснование наиболее важных свойств эрмитовых операторов. Теорема 11.3.1. $ и B$ имеют общую сисДва эрмитовых оператора A тему собственных векторов тогда и только тогда, ко- ˆ Bˆ гда A руют. = Bˆ Aˆ , то есть когда эти операторы коммути- Доказательство. Aˆ a = λa и Bˆ a = µa , тогда Bˆ Aˆ a = λBˆ a = λµa, Aˆ Bˆ a = µAˆ a = λµa, $ $ − BA $ $ ) a = o . Пои, вычитая почленно, получим, что ( AB Докажем необходимость. Пусть скольку a – произвольный собственный вектор, то данное соотношение верно и для всей совокупности собственных векторов, а значит, и для любого элемента унитарного пространства, так как из собственных векторов можно образовать базис. Поэтому $ $ − BA $ $ = O$ . AB Докажем достаточность. Пусть эрмитовы операторы A$ и B$ ˆ a = λa . Рассмотрим слукоммутируют и пусть, кроме того, A чай лишь невырожденных собственных значений, то есть случай, когда все собственные значения различны. 407 Г л а в а 1 1 . Унитарное пространство Покажем теперь, что элемент унитарного пространства $ является собственным вектором оператора A$ . Дейстb = Ba $ $ = BA $$ вительно, в силу AB Aˆ b = Aˆ Bˆ a = Bˆ Aˆ a = Bˆ λa = λBˆ a = λb . $ кратности единица, то Поскольку все собственные значения A λ есть его собственное значение, отвечающее a и b одновре$ Bˆ a = κa . То есть a менно. Поэтому b = κa и в силу b = Ba – собственный вектор оператора B$ . Теорема доказана. $ коммутирует с каждым Если эрмитов оператор A Теорема 11.3.2 из двух некоммутирующих между собой эрмитовых (о вырожоператоров B̂ и Ĉ , то все собственные значения дении). оператора A$ вырожденные. Доказательство. ∗ Пусть Λ – линейная оболочка элемента f – является одномерным инвариантным собственным подпространством оператора A$ , отвечающим его собственному значению λ кратности еди∗ ница. То есть предположим, что dim Λ = 1 . $ и B$ (по теореме 11.3.1) Из коммутируемости операторов A $ и C$ следует, имеем, что Bˆ f = µ f , а из коммутируемости A ˆ f = λ f справедливы равенчто Cˆ f = κ f . Но тогда в силу A ства Aˆ Bˆ f = Bˆ Aˆ f = λµ f , Cˆ Bˆ Aˆ f = λµκ f , Aˆ Cˆ f = Cˆ Aˆ f = λκ f , Bˆ Cˆ Aˆ f = λµκ f , Cˆ Bˆ (λ f ) = µκ(λ f ) и Bˆ Cˆ (λ f ) = µκ(λ f ). 408 Аналитическая геометрия и линейная алгебра Вычитая эти равенства почленно, получаем, что ( Bˆ Cˆ − Cˆ Bˆ )(λ f ) = o ∀f ∈ Λ∗ , $ $ − CB $ $ = O$ и операторы B$ и C$ коммутируют. Но то есть BC последнее утверждение противоречит условию теоремы, и, следовательно, необходимо допустить существование более чем одного линейно независимого элемента в Λ∗ . Теорема доказана. Таблица 11.3.1 Евклидово пространство Унитарное пространство Правило выноса константы из первого сомножителя в скалярном произведении: Правило выноса константы из первого сомножителя в скалярном произведении: (λ a , b ) = λ ( a , b ) A$ : ( Aˆ a, Aˆ b) = (a, b) ∀a, b ∈ E Ортогональный оператор Ортогональная матрица: A T A = E В ортонормированном базисе в E n ортогональный оператор имеет ортогональную матрицу λa b = λ a b Унитарный оператор Aˆ a Aˆ b = a b A$ : ∀a, b ∈U Унитарная матрица: A T A = E В ортонормированном базисе в U n унитарный оператор имеет унитарную матрицу 409 Г л а в а 1 1 . Унитарное пространство A$ + : Сопряженный оператор Эрмитово сопряженный оператор ( Aˆ a, b) = (a, Aˆ + b) ∀a, b ∈ E n В E сопряженный оператор имеет матрицу Aˆ + g = Γ −1 Aˆ T g Симметрическая матрица: −1 Aˆ T g Γ ∀a, b ∈U Aˆ a b = a Aˆ b Эрмитова матрица: = A A В ортонормированном базисе в E g = Γ Эрмитово самосопряженный (эрмитов) оператор: ( Aˆ a, b) = (a, Aˆ b) ∀a, b ∈ E T n В U эрмитово сопряженный оператор имеет матрицу Aˆ + Γ Самосопряженный оператор: A A$ + : Aˆ a b = a Aˆ + b ∀a , b ∈U . n T = A В ортонормированном базисе в U n эрмитов оператор имеет эр- самосопряженный оператор имеет симметрическую матрицу митову матрицу Из собственных векторов само- Из собственных векторов эрмито- n сопряженного оператора в E можно образовать ортонормированный базис n ва оператора в U можно образовать ортонормированный базис В таблице 11.3.1 приведены некоторые понятия и свойства евклидова и унитарного пространств таким образом, чтобы облегчить их сравнительное сопоставление. 410 Аналитическая геометрия и линейная алгебра § 11.4. Эрмитовы функционалы. Среднее значение и дисперсия эрмитова оператора Как и в любом линейном пространстве, в унитарном пространстве можно ввести билинейные и квадратичные функционалы. Например, в унитарном пространстве непрерывных комплекснозначных на [α, β] функций ψ ( τ) билинейным по ся выражение ϕ(τ) и ψ(τ) функционалом являет- B(ϕ(τ), ψ (τ)) = ∫∫ ϕ(σ) K (σ, τ) ψ (τ) dσdτ . Ω Определение 11.4.1. Квадратичный функционал вида Φ( x) = x Aˆ x , где x ∈U , а линейный оператор A$ – эрмитов, называется эрмитовым функционалом (или эрмитовой формой) в унитарном пространстве U . Определение 11.4.2. Число Aˆ a = a Aˆ a называется средним значением $ по a – нормированному элеэрмитова оператора A менту из унитарного пространства. Замечания. 1°. Если a – нормированный (то есть с a = a a = 1) A$ с соответствующим собственным значением λ , то  a = λ , собственный вектор эрмитова оператора поскольку в этом случае Aˆ a = a Aˆ a = a λa = λ a a = λ . 2°. Среднее значение эрмитова оператора, заданного в унитарном пространстве, вещественно. Пусть A$ + = A$ , тогда 411 Г л а в а 1 1 . Унитарное пространство Aˆ a a = a Aˆ + a = a Aˆ a = Aˆ a a , но если некоторое число равно своему комплексному сопряжению, то оно вещественно. 3°. Если принять, что оператор умножения на константу κ есть κˆ = κ Ê , где E$ – единичный оператор, то $ − A$ имеет место соотношение A = 0 . Действиaa тельно, Aˆ − Aˆ a a = a ( Aˆ − Aˆ a )a = a Aˆ a − a Aˆ a a = = ( Aˆ a − Aˆ a ) a a = 0 . Определение 11.4.3. Число A$ = ( A$ − A$ a ) 2 a a называется дисперсией эрмитова оператора  по нормированному элементу унитарного пространства a. Отметим следующие свойства дисперсии. Теорема 11.4.1. Дисперсия A$ эрмитова оператора A$ , действующе- a го в унитарном пространстве, есть вещественное неотрицательное число, для которого справедливо равенство Aˆ = ( Aˆ ) 2 a − ( Aˆ a ) 2 . == a Доказательство. Покажем вначале, что число A$ вещественное и неотрицаa ˆ − Aˆ a , очевидно, эрмитов, поскольку тельное. Оператор A $ (по условию теоремы) и эрмитовыми являются операторы A  a (как оператор умножения на константу). 412 Аналитическая геометрия и линейная алгебра Тогда Aˆ = a ( Aˆ − Aˆ a ) 2 a = a ( Aˆ − Aˆ a )( Aˆ − Aˆ a )a = a = ( Aˆ − Aˆ a ) + a ( Aˆ − Aˆ a )a = = ( Aˆ − Aˆ a )a ( Aˆ − Aˆ a )a ≥ 0. С другой стороны, исходя из определения 11.4.2, получим Aˆ = ( Aˆ − Aˆ a ) 2 = a ( Aˆ − Aˆ a ) 2 a = a a = a (( Aˆ ) 2 − 2 Aˆ Aˆ a + ( Aˆ a ) 2 )a = = a ( Aˆ ) 2 a − 2 Aˆ a a Aˆ a + ( Aˆ a ) 2 a a = = ( Aˆ ) 2 − 2 Aˆ a Aˆ a + ( Aˆ a ) 2 = ( Aˆ ) 2 − ( Aˆ a ) 2 . a a Теорема доказана. $ , действующего в унитарТеорема Для эрмитова оператора A 11.4.2. ном пространстве, дисперсия, взятая по его нормированному собственному вектору, равняется нулю. Доказательство. Пусть Aˆ a = λa , тогда 2 = = a λAˆ a − a λa 2 Aˆ = ( Aˆ ) 2 a − ( Aˆ a ) 2 = a ( Aˆ ) 2 a − a Aˆ a == a = a Aˆ ( Aˆ a) − a Aˆ a = a Aˆ (λa) − a λ a 2 2 = = 413 Г л а в а 1 1 . Унитарное пространство = λ a λ a − λ2 a a 2 = λ2 a a − λ2 a a 2 = = λ2 − λ2 = 0 , поскольку a a = 1. Теорема доказана. § 11.5. Соотношение неопределенностей Для эрмитовых операторов, действующих в унитарном пространстве, справедлива Теорема 11.5.1 (cоотношение неопределенностей). $ и B$ , заданДля двух эрмитовых операторов A ных в унитарном пространстве, имеет место соотношение Aˆ Bˆ ≥ a a 1 4 2 Aˆ Bˆ − Bˆ Aˆ a . Доказательство. 1°. Рассмотрим оператор Qˆ = ( Aˆ − Aˆ a ) + τ( Bˆ − Bˆ a ) i (где τ – некоторый вещественный параметр), для которого эрмитово сопряженным будет оператор вида Qˆ + = ( Aˆ − Aˆ a ) − τ( Bˆ − Bˆ a ) i , ибо эрмитовыми являются следующие четыре оператора: A$ , A$ , B$ , B$ . Заметим также, что оператор Qˆ + Qˆ – эрмиa тов и что a a Qˆ + Qˆ a = Qˆ a Qˆ a ≥ 0 ∀Qˆ . (См. доказатель- ство теоремы 10.8.2, пункт 1°.) 414 Аналитическая геометрия и линейная алгебра 2°. Выразим оператор Q$ + Q$ через операторы A$ , A$ , B$ , B$ , a a получим Qˆ + Qˆ = (( Aˆ − Aˆ a ) − τ( Bˆ − Bˆ a )i)(( Aˆ − Aˆ a ) + + τ( Bˆ − Bˆ a )i) = = ( Aˆ − Aˆ a ) 2 + τ 2 ( Bˆ − Bˆ a ) 2 + + τ(( Aˆ − Aˆ a )( Bˆ − Bˆ a ) − ( Bˆ − Bˆ a )( Aˆ − Aˆ a ))i = = ( Aˆ − Aˆ a ) 2 + τ 2 ( Bˆ − Bˆ a ) 2 + τ( Aˆ Bˆ − Bˆ Aˆ )i. 3°. Обозначим Cˆ = −( Aˆ Bˆ − Bˆ Aˆ ) i , причем отметим, что из пре- дыдущего равенства следует эрмитовость оператора Ĉ как линейной комбинации эрмитовых операторов. Подсчитаем теперь среднее значение эрмитова оператора Qˆ + Qˆ : Qˆ + Qˆ a = Aˆ + τ 2 Bˆ + a τ( Aˆ Bˆ − Bˆ Aˆ )ia = a a = τ Bˆ − τ Cˆ a + Aˆ . 2 a Полученное значение a Q$ + Q$ есть вещественный квадратный a трехчлен относительно τ , который должен быть неотрицательным при любом τ . Отсюда следует, что его дискриминант не положителен, то есть ( C$ a ) 2 − 4 A$ B$ ≤ 0 , a a или окончательно A$ B$ a Теорема доказана. a ≥ 1 4 $ $ − BA $$ AB 2 a . Г л а в а 1 2 . Прикладные задачи линейной алгебры 415 Глава 12 ПРИКЛАДНЫЕ ЗАДАЧИ ЛИНЕЙНОЙ АЛГЕБРЫ В данной главе рассматриваются некоторые классы задач, имеющие важное значение в прикладных разделах математики, таких, как математическая физика, теория оптимального управления, математическая экономика, вычислительная математика и т.д., причем общим для этих задач является использование в процессе их решения понятий и методов различных разделов линейной алгебры. § 12.1. Приведение квадратичных функционалов к диагональному виду Задача отыскания базиса, в котором квадратичный функционал имеет диагональный или канонический вид, достаточно часто встречается в различных приложениях механики, физики, теории оптимального управления. Приведение к диагональному виду квадратичного функционала, заданного в ортонормированном базисе Пусть в ортонормированном базисе странства E n {e1 , e2 ,..., en } евклидова про- задан некоторый квадратичный функционал n Φ(x). Рассмотрим задачу отыскания в E ортонормированного базиса {e1′ , e2′ ,..., e′n } , в котором функционал Φ(x) имеет диагональный вид. 416 Аналитическая геометрия и линейная алгебра Принципиальная разрешимость подобной задачи для неортонормированного базиса следует из теоремы 9.2.1. Очевидно, что такой базис не единственный, и потому представляется интересным исслеn дование возможности построения в E ортонормированного базиса, в котором данный квадратичный функционал Φ (x ) имеет диагональный вид. Напомним предварительно (см. § 9.2), что квадратичный функционал в Λn может быть задан формулой n n Φ( x) = ∑∑ ϕ ki ξ k ξ i = x k =1 i =1 Φ в которой симметрическая матрица де от базиса T g Φ g x g , преобразуется при перехо- g {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g ′n } по правилу Φ g′ = S T Φ g S . При доказательстве теоремы 9.2.1 использовалась математическая индукция в сочетании с методом выделения полных квадратов (называемым иногда методом Лагранжа), применение которого на практике может потребовать значительных затрат вычислительных ресурсов. Существенно более эффективным оказывается алгоритм, основой которого является Теорема 12.1.1. 16 Для всякого квадратичного функционала, заданного в ортонормированном базисе, существует ортонормированный базис, в котором этот функционал имеет диагональный вид16. Иногда задачу отыскания ортонормированного базиса, в котором квадратичный функционал имеет диагональный вид, называют “приведением квадратичного функционала к диагональному виду при помощи ортогональной матрицы перехода”. 417 Г л а в а 1 2 . Прикладные задачи линейной алгебры Доказательство. 1°. Как было показано в § 9.2, матрица квадратичного функционала Φ ( x ) изменяется по правилу Φ где = S e′ T Φ e S , S = σ ij – матрица перехода от базиса {e1 , e2 ,..., en } к базису {e1′ , e′2 ,..., en′ } , то есть n ek′ = ∑ σ sk e s , k = [1, n] , s =1 а Φ e – симметрическая матрица билинейного функциона- ла, порождающего квадратичный функционал S 2°. Поскольку матрица перехода Φ( x) . от одного ортонормиро- ванного базиса к другому ортогональная (§ 10.4), то для нее справедливо равенство S −1 = S T . Откуда вытекает, что в рассматриваемом нами случае Φ e′ = S −1 Φ e Φ 3°. Формально симметрическая матрица ванном базисе S . e в ортонормиро- {e1 , e2 ,..., en } определяет самосопряженный оператор (лемма 10.7.1) Ф̂ , матрица которого в базисе {e1′ , e2′ ,..., e′n } находится по формуле (теорема 8.3.2) Φ 4°. e′ = S −1 Φ e S . Совпадение формул изменения матриц квадратичного функционала и самосопряженного оператора при переходе от одного ортонормированного базиса к другому позволяет использовать в качестве базиса {e1′ , e2′ ,..., e′n } – ортонормированный базис из собственных векторов оператора Φ̂ . 418 Аналитическая геометрия и линейная алгебра Этот базис существует (см. теорему 10.7.1) и в нем матрица оператора Φ̂ (а значит, и матрица квадратичного функционала Φ (x ) ) имеет диагональный вид, причем на главной диагонали расположены собственные значения самосопряженного оператора Φ̂ . Теорема доказана. Заметим, что утверждение теоремы 12.1.1 согласуется с утверждением следствия 10.7.4. Определение 12.1.1. Линейный самосопряженный оператор Φ̂ называется присоединенным к квадратичному функционалу Φ( x) в E n . При этом очевидно выполнение равенства ˆ x) ; ∀x ∈ E n . Φ ( x ) = ( x, Φ Определение 12.1.2. ( x, Aˆ x) n , заданный в E для ( x, x ) $ , называнекоторого самосопряженного оператора A Функционал ρ( x ) = ется отношением Релея. Используя теорему 12.1.1, можно упростить процедуру оценки экстремальных значений квадратичного функционала. В качестве примера рассмотрим задачу нахождения максимума и минимума ρ(x ) . Следствие 12.1.1. В ортонормированном базисе максимальное (минимальное) значение ρ(x ) равно максимальному (минимальному) собственному значению операто- $ , и это значение достигается на соответстра A вующем собственном векторе этого оператора. 419 Г л а в а 1 2 . Прикладные задачи линейной алгебры Доказательство. Поскольку при переходе к ортонормированному базису, образованному из собственных векторов самосопряженного оператора A$ (в силу теоремы 12.1.1), справедливы соотношения n ( x, Aˆ x) ρ( x ) = = ( x, x ) ∑ α ij ξ i ξ j i =1 n ∑ξ i =1 2 i n = ∑ λ ξ′ i =1 n i 2 i , ∑ ξ′ 2 i i =1 то, проводя рассуждения, аналогичные доказательству теоремы 9.5.1, получаем, что λ min ≤ ρ( x ) ≤ λ max . Следствие доказано. Проиллюстрируем применение теоремы 12.1.1 на примере решения следующей задачи. Задача 12.1.1. При помощи ортогонального оператора привести к диа- E 3 квадратичный функционал Φ(x) = 2ξ1ξ 2 + 2ξ1ξ 3 − 2ξ 2 ξ 3 . гональному виду в Решение. 1°. Пусть исходный ортонормированный базис состоит из элементов 1 {e1 , e2 , e3 } с 0 0 e1 = 0 , e2 = 1 , e3 = 0 . Восстано0 0 1 вим по квадратичному функционалу Φ(x) = 2ξ1ξ 2 + 2ξ1ξ 3 − 2ξ 2 ξ 3 порождающий его симметричный билинейный функционал B( x , y ) , использовав формулу 420 Аналитическая геометрия и линейная алгебра B ( x, y ) = В данном случае 1 ( Φ ( x + y ) − Φ ( x) − Φ( y )) (см. § 9.2). 2 Φ( y ) = 2η1η 2 + 2η1η3 − 2η 2 η3 , а Φ( x + y ) = 2(ξ1 + η1 )(ξ 2 + η 2 ) + + 2(ξ1 + η1 )(ξ 3 + η3 ) − 2(ξ 2 + η 2 )(ξ 3 + η3 ), и потому B( x, y ) = ξ1η 2 + ξ1η3 − ξ 2 η3 + η1ξ 2 + η1ξ 3 − η 2 ξ 3 , ξ1 где x e η1 = ξ2 и y ξ3 e = η2 . η3 Следовательно, матрица функционала Φ e 0 1 = 1 1 0 −1 Φ(x) имеет вид 1 −1 . 0 2°. Рассмотрим построенную симметрическую матрицу как задающую самосопряженный оператор Φ̂ в E и найдем для него собственные значения. Составляем характеристическое уравнение 8.5.2: 3 −λ det 1 1 1 − λ − 1 = 0 или λ3 − 3λ + 2 = 0 . 1 −1 − λ Оно имеет корни: λ 1 = −2, λ 2,3 = 1 , которые и являются соб- ственными значениями. Заметим, что если нас интересует только диагональный вид квадратичного функционала, то его можно написать, основываясь на следствии 10.7.1: Г л а в а 1 2 . Прикладные задачи линейной алгебры 421 Φ( x) = −2ξ1′ 2 + ξ′22 + ξ′32 и на этом закончить решение задачи. 3°. В случае, когда требуется найти также и матрицу S – матрицу перехода от исходного ортонормированного базиса к искомому, необходимо определить собственные векторы оператора Φ̂ . Для этого будем последовательно подставлять найденные собственные значения в систему (8.4.1) и строить ее общие решения. Для λ = −2 имеем 2 1 1 ξ1 0 1 2 −1 ξ2 = 0 . 1 − 1 2 ξ3 0 Заметим, что ранг основной матрицы этой системы равен 2, поскольку третье уравнение есть разность первых двух. Далее, действуя по схеме, описанной в § 6.8 (метод Гаусса), получаем для компонентов собственного вектора систему условий 2ξ1 + ξ 2 = −ξ 3 , ξ1 + 2ξ 2 = ξ 3 . Принимая ξ 3 за свободное неизвестное, получим собственный −1 вектор f1 = 1 . 1 Кратность собственного значения λ = 1 равна 2, и в силу следствия 10.7.2 ему должны отвечать два линейно независимых (но не обязательно ортогональных) собственных вектора. Конкретно, компоненты собственного вектора должны удовлетворять следующей системе уравнений: 422 Аналитическая геометрия и линейная алгебра −1 1 1 ξ1 0 1 −1 −1 ξ2 = 0 , 1 − 1 − 1 ξ3 0 из которых независимое только одно ξ1 = ξ 2 + ξ 3 . Общее ре- шение этой системы будет иметь вид ξ1 1 1 ξ2 = α 1 + β 0 ξ3 0 1 ∀α, β . Каждый столбец такого вида ортогонален f1 , но выбранные конкретные фундаментальные решения не ортогональны друг другу. Поэтому пару ортогональных собственных векторов, отвечающих λ = 1 , сформируем из первого фундаментального решения и ортогональной ему линейной комбинации первого и 1 α+β α , β очевидно, есть 2α + β = 0 . Откуда, например, выбрав α = 1 и 1 −1 второго. Условие ортогональности столбцов β = −2 , получим f 2 = 1 и f 3 = 0 4°. Набор элементов 1 и 0 1 . −2 { f1 , f 2 , f 3 } является в E 3 ортогональным, но ненормированным базисом. Чтобы построить ортонормированный базис, выполним нормировку каждого из элементов базиса { f1 , f 2 , f 3 } . В результате получим 423 Г л а в а 1 2 . Прикладные задачи линейной алгебры − e1′ = 1 3 1 , e′2 = 3 1 3 1 2 1 2 0 1 6 1 и e3′ = . 6 2 − 6 − Матрица − S = 1 3 1 3 1 3 (перехода от “старого” базиса 1 2 1 2 1 6 1 6 2 0 − 6 − {e1 , e2 , e3 } к “новому” базису {e1′ , e′2 , e3′ } ), столбцами которой являются координатные представления элементов базиса {e1′ , e2′ , e3′ } по базису {e1 , e2 , e3 } , ортогональная, то есть удовлетворяет соотношению S −1 = S T , что позволяет легко получить формулы, выражающие “новые” координаты через “старые”. ξ1 Действительно (§ 7.4), из соотношения ξ1′ ξ′2 = S ξ′3 −1 ξ1 ξ 2 , или окончательно ξ3 ξ2 = S ξ3 ξ1′ ξ′2 следует ξ′3 424 Аналитическая геометрия и линейная алгебра 1 3 ξ1′ 1 ξ′2 = 2 ξ′3 1 − 6 − 1 3 1 2 1 6 1 3 0 − 2 6 ξ1 ξ2 . ξ3 Приведение одним линейным оператором пары квадратичных функционалов, первый из которых знакоопределенный, соответственно к каноническому и диагональному виду Пусть в некотором базисе {g1 , g 2 ,..., g n } линейного пространст- ва Λ задана пара квадратичных функционалов Φ ( x ) и Ψ ( x ) , первый из которых знаковоопределенный (например, положительно). Рассмотрим задачу отыскания базиса {g1′ , g ′2 ,..., g ′n } , в котором n функционал Φ ( x ) имеет канонический, а функционал гональный вид. Ψ ( x) – диа- Отметим, что условие знаковой определенности одного из приводимых квадратичных функционалов существенно, поскольку в общем случае два различных квадратичных функционала одним линейным преобразованием к диагональному виду не приводятся.17 Например, квадратичный функционал Φ( x) = Aξ12 + 2 Bξ1ξ 2 + Cξ 22 в Λ можно привести к диагональному виду при помощи линейного оператора, сводящегося к повороту плоскости радиусов-векторов на угол α . 2 17 Как и ранее, под “приведением квадратичного функционала к диагональному виду” понимается задача отыскания базиса (или построения матрицы перехода к базису), в котором матрица квадратичного функционала диагональная. Г л а в а 1 2 . Прикладные задачи линейной алгебры 425 При этом необходимо (см. доказательство теоремы 4.4.1), чтобы удовлетворяло уравнению ( A − C ) sin 2α = 2 B cos 2α . α Однако для пары квадратичных функционалов Φ 1 ( x) = ξ12 − ξ 22 и Φ 2 ( x) = ξ1ξ 2 угла α , удовлетворяющего системе условий 2 sin 2α = 0, 0 = cos 2α, очевидно, не существует. Опишем теперь алгоритм приведения в Λ пары квадратичных функционалов Φ ( x ) и Ψ ( x ) , заданных в некотором исходном базиn се {g1 , g 2 ,..., g n } , первый из которых положительно определенный, соответственно к каноническому и диагональному виду. 1°. Поскольку квадратичный функционал Φ( x) положительно оп- ределенный, то для него в Λ найдется другой базис {g1′ , g ′2 ,..., g ′n } , в котором он имеет канонический вид, причем n все его коэффициенты равны единице (см. теорему 9.2.1). Приведем этот функционал к данному виду каким-либо методом, например, выделив полные квадраты с последующей нормировкой элементов его матрицы. Одновременно тем же самым методом преобразуем также и квадратичный функционал Ψ ( x ) . 2°. Введем в Λn скалярное произведение по формуле n ( x, y ) = ∑ ξ′k η′k , k =1 превратив тем самым данное линейное пространство в евклидово Ε n . Отметим, что в этом случае базис 426 Аналитическая геометрия и линейная алгебра {g1′ , g 2′ ,..., g n′ } = {e1′ , e′2 ,..., e′n } , в котором Φ ( x ) имеет канонический вид, ортонормированный. 3°. Построим теперь третий, также ортонормированный базис {e1′′, e′2′ ,..., e′n′} , переход к которому выполняется при помощи S , приведя квадратичный функционал Ψ ( x) к матрицы диагональному виду по схеме, описанной в § 12.1.1. При этом переходе квадратичный функционал Φ ( x ) не потеряет канонического вида, поскольку из условия нальности Φ Φ e = E и ортого- S следует, что e′ T = S = S T Φ e S = S S = S −1 T E S = S = E . Таким образом, построен базис, в котором квадратичный функционал Φ (x ) имеет канонический вид, а функционал Ψ (x) – диагональный. В заключение отметим, что матрица перехода к искомому ортонормированному базису есть произведение матрицы перехода, при котором знакоопределенный квадратичный функционал приводится к каноническому виду, и ортогональной матрицы Задача 12.1.2. S . Найти замену переменных, приводящую квадратичные функционалы Φ(x) = ξ12 + 2ξ1ξ 2 + 3ξ 22 и Ψ (x) = 4ξ12 + 16ξ1ξ 2 + 6ξ 22 соответственно к каноническому и диагональному виду. Г л а в а 1 2 . Прикладные задачи линейной алгебры 427 Решение. 1°. Исследуем квадратичные функционалы Φ (x ) и Ψ (x ) на знаковую определенность. Из критерия Сильвестра (теорема 9.3.2) и неравенств 1 1 4 8 = 2 > 0 ; det = −40 < 0 1 3 8 6 заключаем, что Φ (x ) – положительно определенный квадратичный функционал, в то время как функционал Ψ (x ) не явdet ляется знакоопределенным. 2°. Приведем положительно определенный квадратичный функционал Φ (x ) к каноническому виду методом Лагранжа. Поскольку Φ(x) = ξ12 + 2ξ1ξ 2 + 3ξ 22 = (ξ1 + ξ 2 ) 2 + 2ξ 22 , то, выполнив замену переменных ξ = ξ1′ − 1 ξ2 = получим ξ1′ = ξ1 + ξ 2 или 2ξ2 ξ′2 = 1 ξ′2 2 , 1 ξ′2 2 Φ( x) = ξ1′ 2 + ξ′22 и соответственно Ψ ( x) = 4ξ1′ 2 + 4 2ξ1′ ξ′2 − 3ξ′22 . 3°. Введение в Λ скалярного произведения с единичной матрицей Грама означает, что координаты {ξ1′ ; ξ ′2 } есть координаты 2 евклидова пространства Ε2 с базисом {e1′ , e′2 } , где 428 Аналитическая геометрия и линейная алгебра e1′ = e′ 1 ; 0 e2′ e′ Матрица квадратичного функционала Ψ e′ = 4 2 2 2 2 −3 = 0 1 . Ψ (x) в этом базисе . Она задает присоединенный самосо- пряженный оператор, имеющий собственные значения и λ 2 = −4 , а также ортонормированные собственные векторы f1 e′ = 2 2 3 − и f2 1 3 новый базис {e1′′, e ′2′ } . 4°. λ1 = 5 e′ = 1 3 , которые примем за 2 2 3 Матрица перехода от ортонормированного базиса ортонормированному базису {e1′′, e ′2′ } , в котором {e1′ , e′2 } к Φ(x) = ξ1′′ 2 + ξ′2′ 2 и Ψ (x) = 5ξ1′′ 2 − 4ξ′2′ 2 , ортогональная и имеет вид S = 2 2 1 − 3 3 . 1 3 Откуда окончательно получаем, что 2 2 3 Г л а в а 1 2 . Прикладные задачи линейной алгебры 2 2 1 ξ1′ + ξ′2 ξ1′′ = 3 3 ξ′′ = − 1 ξ′ + 2 2 ξ′ 2 1 2 3 3 ⇒ 429 2 2 ξ1 + 2 ξ 2 , ξ1′′ = 3 ξ′2′ = − 1 ξ1 + ξ 2 . 3 Если в задаче одновременного приведения пары квадратичных функционалов, один из которых положительно определенный, соответственно к каноническому и диагональному виду, требуется найти лишь этот вид (а не формулы замены переменных), то можно воспользоваться более простой схемой расчетов. Допустим, что положительно определенный квадратичный функционал Φ(x) приведен при помощи матрицы перехода S к каноT S = E . После того же преобразования матрица квадратичного функционала Ψ (x ) будет иметь S ническому виду, то есть вид Ψ∗ = S T Ψ Φ S . Согласно теореме 12.1.1 в ортонормированном базисе для построения диагонального вида квадратичного функционала Ψ ( x ) достаточно найти собственные числа самосопряженного оператора, матрица которого есть Ψ ∗ . Найдем выражение для этой матрицы, учи- тывающее связь между матрицами Φ и S . Из равенства S следует, что S =( S T T Φ S = E Φ ) −1 . Тогда, используя правила об- ращения и транспонирования произведения матриц, перестановочность обращения и транспонирования, а также симметричность и невырожденность матрицы Φ , имеем 430 Аналитическая геометрия и линейная алгебра Ψ∗ = S T Ψ S =(( S = ( ( Φ ) −1 ( S = S −1 ( Φ T −1 T ) T −1 ) ) Ψ T Φ ) −1 ) T Ψ Ψ S = S = S = S −1 ( Φ −1 Ψ∗ Полученное равенство означает, что матрица Ψ ) S . может рас- сматриваться как результат преобразования матрицы линейного оператора Φ −1 Ψ при замене базиса с матрицей перехода S . Поскольку собственные значения линейного оператора не зависят от выбора базиса, то решение задачи может быть сведено к определению собственных значений оператора, имеющего матрицу Φ −1 Ψ . Собственные векторы и собственные значения этого оператора находятся согласно § 8.5 из системы линейных уравнений ( Φ −1 Ψ ) f =λ f , которую можно преобразовать к виду ( Ψ −λ Φ ) f = o . Условие существования ненулевых столбцов ˆ − λΦ ˆ det Ψ g f : =0 – алгебраическое уравнение относительно λ , корни которого и являются искомыми коэффициентами диагонального представления квадратичного функционала Ψ ( x ) . Проиллюстрируем применение данного метода для нахождения диагонального вида квадратичных форм в задаче 12.1.2. В этом случае Φ = 1 1 1 3 и Ψ = 4 8 , то есть для определения коэф8 6 фициентов диагонального представления квадратичного функционала Ψ ( x) необходимо решить уравнение 431 Г л а в а 1 2 . Прикладные задачи линейной алгебры det ( 4 8 8 3 −λ 1 1 1 3 ) = 0 или det 4−λ 8−λ 8 − λ 3 − 3λ = 0. λ 1 = 5 и λ 2 = −4 , то 2 2 искомый диагональный вид для Ψ ( x ) будет Ψ ( x ) = 5ξ1′ − 4ξ′2 , в 2 2 то время как очевидно, что Φ ( x ) = ξ1′ + ξ′2 . Поскольку данное уравнение имеет корни § 12.2. Классификация поверхностей второго порядка Пусть в евклидовом пространстве 1 E 3 с базисом {e1 , e2 , e3 } , где 0 0 e1 = 0 , e2 = 1 , e3 = 0 , 0 0 1 дано уравнение поверхности α11ξ12 + 2α12 ξ1ξ 2 + α 22 ξ 22 + 2α13 ξ1ξ 3 + α 33 ξ 32 + + 2α 23 ξ 2 ξ 3 + 2α14 ξ1 + 2α 24 ξ 2 + 2α 34 ξ 3 + α 44 = 0 3 второго порядка ( k ∑∑ α k =1 i =1 ik > 0 ). Квадратичную часть данного уравнения можно рассматривать как 3 квадратичный функционал в E . Приведем его к диагональному виду ортогональным оператором по схеме, изложенной в § 12.1. Получим уравнение ′ ξ1′ + 2α ′24 ξ′2 + 2α ′34 ξ ′3 + α ′44 = 0, λ 1 ξ1′ 2 + λ 2 ξ ′22 + λ 3 ξ′32 + 2α 14 λ1 + λ 2 + λ 3 > 0 , для которого рассмотрим три следующих случая. 432 I. Аналитическая геометрия и линейная алгебра Центральный случай: λ 1λ 2 λ 3 ≠ 0 или, что в силу теоремы 8.6.8 то же самое, α11 α12 α13 det α 21 α 31 α 22 α 32 α 23 ≠ 0 . α 33 После переноса начала координат, устраняющего линейные слагаемые, получаем уравнение ′ = 0, λ 1 ξ1′′ 2 + λ 2 ξ′2′ 2 + λ 3 ξ′3′ 2 + α ′44 для которого можно выделить следующие варианты: если ′ ≠0 α′44 1) мнимый эллипсоид при sgn(λ i ) 2) эллипсоид при ′ ) , i = 1, 2, 3 ; = sgn(α ′44 ′ ) , i = 1, 2, 3 ; sgn(λ i ) = − sgn(α ′44 3) однополостный гиперболоид при sgn(λ 1 ) = sgn( λ 2 ) = ′ ); = − sgn(λ 3 ) = − sgn(α ′44 4) двуполостный гиперболоид при sgn(λ 1 ) = − sgn( λ 2 ) = ′ ); = − sgn(λ 3 ) = − sgn(α ′44 если ′ =0 α ′44 5) мнимый конус при sgn( λ1 ) = sgn( λ2 ) = sgn( λ3 ) ; 6) конус при sgn( λ1 ) = sgn( λ2 ) = − sgn( λ3 ) . Г л а в а 1 2 . Прикладные задачи линейной алгебры II. Первый нецентральный случай: 433 λ 1 ≠ 0, λ 2 ≠ 0, λ 3 = 0 . После переноса начала координат приходим к уравнению ′ = 0 , для которого выделяем λ 1ξ1′′ 2 + λ 2 ξ′2′ 2 + 2α ′34′ ξ ′3′ + α ′44 варианты: если α ′34′ ≠ 0 , то уравнение приводится к ′′ ξ′3′′ = 0 , λ 1ξ1′′′ 2 + λ 2 ξ′2′′ 2 + 2α ′34 и тогда имеем: 7) эллиптический параболоид при sgn(λ 1 ) = sgn( λ 2 ) ; 8) гиперболический параболоид при sgn( λ 1 ) = − sgn(λ 2 ) ; если ′ ≠ 0 , то имеем: α ′34′ = 0, α ′44 9) мнимый эллиптический цилиндр ′ ), i при sgn(λ i ) = sgn(α ′44 10) эллиптический цилиндр ′ ) при sgn(λ i ) = − sgn(α ′44 = 1, 2 ; , i = 1, 2 ; 11) гиперболический цилиндр при sgn(λ 1 ) = − sgn( λ 2 ) ; если же ′ = 0 , то имеем: α ′34′ = 0, α ′44 12) пару мнимых пересекающихся плоскостей при sgn( λ i ) = sgn(λ 2 ) ; 13) пару пересекающихся плоскостей при sgn(λ i ) = − sgn( λ 2 ) . 434 Аналитическая геометрия и линейная алгебра III. Второй нецентральный случай: λ1 ≠ 0 и λ 2 = λ 3 = 0 . После переноса начала координат приходим к уравнению ′ ξ ′2′ + 2α ′34′ ξ ′3′ + α ′44 ′ = 0, λ 1ξ1′′ 2 + 2α ′24 для анализа которого целесообразно перейти к новому ортонормированному базису по формулам ξ1′′′ = ξ1′′ ; ξ′2′′ = ′ ξ′2′ + α ′34′ ξ′3′ α ′24 α ′′ + α ′′ 2 24 2 34 ; ξ′3′′ = ′ ξ′3′ α ′34′ ξ′2′ − α ′24 ′ 2 + α ′34′ 2 α ′24 (что, очевидно, является поворотом в плоскости Oξ 2 ξ 3 ). В итоге получаем уравнение ′ 2 + α ′34 ′ 2 )ξ′2′′ + α ′44 ′ =0 λ 1ξ1′′′ 2 + 2( α ′24 и соответствующие ему варианты: если ′ ≠ 0 или α ′34′ ≠ 0 , то после переноса начала коордиα′24 нат имеем: 14) параболический цилиндр; если ′ = α ′34′ = 0 , то имеем: α ′24 15) пару мнимых параллельных плоскостей ′ ); при sgn( λ 1) = sgn(α ′44 16) пару параллельных плоскостей ′ ); при sgn(λ 1) = − sgn(α ′44 если ′ = α ′34′ = α ′44 ′ = 0 , то имеем: α ′24 17) пару совпадающих плоскостей. Г л а в а 1 2 . Прикладные задачи линейной алгебры 435 Замечания. 1°. Для классификации конкретной поверхности второго порядка необходимо сделать преобразование квадратной части уравнения к диагональному виду и выполнить переносы начала координат. 2°. Схема исследования кривых второго порядка на плоскости аналогична случаю, рассмотренному для поверхностей второго порядка. § 12.3. Аппроксимация функций многочленами Задача построения наилучшего (в некотором смысле) приближения заданной на [ a, b] функции f ( τ) линейной комбинацией некоторых других функций g 0 (τ), g1 (τ), g 2 (τ), ..., g n (τ), ... , определенных и обладающих более привлекательными (с точки зрения удобства их исследования по сравнению с f ( τ) ) свойствами на τ ∈ [a, b] , достаточно часто встречается в различных приложениях. Ввиду большого разнообразия постановок задач этого класса мы ограничимся рассмотрением лишь двух из них, имея целью только проиллюстрировать на примере их решения, использование методов линейной алгебры. Рассмотрим в качестве объекта аппроксимации непрерывную на [−1,1] функцию f (τ) , а в качестве аппроксимирующих функций выберем одночлены вида {g k (τ) = τ k , k = [0, n]} . Задача состоит в отыскании алгебраического многочлена, степени n не выше n , Pn (τ) = ∑ ξ k τ k , который наилучшим образом прибли- жает функцию f ( τ) . k =0 Предварительно заметим, что множество непрерывных на функций образует линейное пространство [−1,1] Λ , элементами которого 436 Аналитическая геометрия и линейная алгебра g k (τ) , причем Λ∗ – линейная оболочка сово- являются и функции {g k (τ) = τ k , k = [0, n] } есть (n + 1) -мерное подпространство пространства Λ , в качестве базиса которой можно купности элементов взять набор элементов { g k = g k (τ), k = [0, n] }. Для количественной оценки качества аппроксимации одной функции другой введем в Λ скалярное произведение по формуле 1 ( x , y ) = ∫ x ( τ ) y ( τ ) dτ −1 и превратим его тем самым в евклидово пространство E . Тогда мера близости элементов x ( τ) и y ( τ) может быть оценена величиной 1 ρ = x − y = ( x − y, x − y ) = ∫ ( x(τ) − y (τ)) 2 dτ −1 (называемой обычно расстоянием между x (τ) и y (τ) в E ), которая в силу свойств определенных интегралов равна нулю только в случае x ( τ) = y ( τ) ∀τ ∈ [−1,1] . Далее для краткости будем опускать аргументы элементов в E , то есть будем обозначать функцию f (τ) как f ∈ E . Квадрат расстояn ния между элементами f и ∑ξ k =0 n k g k в E равен n ρ2 = ( f − ∑ ξk g k , f − ∑ ξk g k ) . k =0 Подберем значения коэффициентов k =0 ξ k , k = [0, n] так, чтобы вели- чина ρ оказалась минимальной. В силу билинейности скалярного произведения получаем 2 437 Г л а в а 1 2 . Прикладные задачи линейной алгебры n n ρ2 = ( f − ∑ ξk gk , f − ∑ ξk gk ) = k =0 k =0 n n n = ( f , f ) − 2∑ ξ k ( f , g k ) + ∑∑ ξ k ξ i ( g k , g i ), k =0 k =0 i =0 а из условий равенства нулю частных производных от ρ 2 по всем ξ k k = [0, n] , то есть из системы линейных уравнений n ∑ξ i =0 ∗ i ( g k , g i ) = ( f , g k ), k = [0, n] , находятся оптимальные значения коэффициентов (12.3.1) ξ ∗k , k = [0, n] , при которых ρ минимально. Заметим, что данная система уравнений имеет единственное решение, поскольку ее основная матрица невырожденная, как матрица Грама базисных векторов. Отметим формальное совпадение полученной формулы с утверждением теоремы 10.3.2, которое позволяет заключить, что опти2 мальные значения коэффициентов элемента ξ ∗k ; k = [0, n] суть координаты f в базисе {g k = g k (τ), k = [0, n] } в том случае, когда f принадлежит линейной оболочке Λ∗ . Найдем минимальное значение ρ2 : n n n k =0 k =0 i=0 ρ 2 = ( f , f ) − ∑ ξ ∗k ( f , g k ) + ∑ ξ ∗k (−( f , g k ) + ∑ ξ ∗i ( g k , g i )) = n n k =0 k =0 = ( f , f ) − ∑ ξ ∗k ( f , g k ) = ( f , f − ∑ ξ ∗k g k ). Иначе говоря, полученное выражение равно нулю для n f = ∑ ξ ∗k g k , k =0 438 Аналитическая геометрия и линейная алгебра что означает равенство нулю погрешности аппроксимации лишь в случае, когда элемент f принадлежит подпространству Λ∗ . Более содержательная оценка величины погрешности аппроксимации ρ 2 получается при подстановке в правую часть равенства n ρ 2 = ( f , f − ∑ ξ ∗k g k ) оптимальных значений ξ ∗k , k = [0, n] , наk =0 ходимых при решении системы линейных уравнений 12.3.1. Заметим, что это сделать гораздо удобнее в случае ортонормированного базиса ∗ подпространства Λ . Можно показать, что применение к неортогональному базису { g k = g k (τ) = τ k , k = [0, n] } процедуры ортогонализации Грама–Шмидта, использованной при доказательстве теоремы 10.2.1, дает ненормированную систему ортогональных многочленов вида 1 e0′ (τ) = 1 ; e1′ (τ) = τ ; e′2 (τ) = τ 2 − ; 3 n 3 d e3′ (τ) = τ 3 − τ ; ... ; e′n (τ) = n (τ 2 − 1) n , 5 dτ называемых полиномами Лежандра. Поскольку все предыдущие вычисления делались для базиса { g k = τ k , k = [0, n] } , но без учета его конкретного вида, то они будут и справедливы для ортогонального (но, вообще говоря, ненормированного) базиса { ek′ (τ) = dk 2 (τ − 1) k , k = [0, n] }. k dτ Для ортогонального базиса матрица Грама диагональная и, следовательно, система уравнений 12.3.1 Г л а в а 1 2 . Прикладные задачи линейной алгебры 439 n ∑ ξ (e′ , e′ ) = ( f , e′ ) , k = [0, n] i =0 i k i k ξ ∗k = будет иметь решения вида: на ( f , ek′ ) ; k = [0, n] , а величи(ek′ , ek′ ) ρ2 : ( f , ek′ ) 2 ρ = ( f , f − ∑ ξ e′ ) = ( f , f ) − ∑ . k =0 k = 0 (e′k , e′k ) n 2 ∗ k k n {ek , k = [0, n] } ортонормированный, то есть (ek , ei ) = δ ki ; ∀ k , i = [0, n] , тогда Если же, кроме того, базис ξ ∗k = ( f , ek ) ; k = [0, n] и ρ 2 = f Отметим, что значения 2 n − ∑ ξ ∗k2 . k =0 ξ ∗k , k = [0, n] – оптимальных коэффици- ентов аппроксимирующего многочлена формально совпадают: 1) с решением задачи о нахождении ортогональной проекции элемента 2) f евклидова пространства на подпространство Λ∗ ; со значениями компонент разложения элемента, принадлежащего Λ∗ , по ортонормированному базису {ek , k = [0, n] } (см. следствие 10.3.2). Таким образом, ортогональность системы элементов, используемой для аппроксимации, существенно упрощает вычисления. Вместе с тем ортогонализация по методу Грама–Шмидта в случае бесконечномерного евклидова пространства может оказаться достаточно сложной процедурой. 440 Аналитическая геометрия и линейная алгебра Возможной альтернативой в процессе построения ортонормированной системы аппроксимирующих элементов является лемма 10.7.3, утверждающая, что собственные векторы самосопряженного оператора, отвечающие различным собственным значениям, попарно ортогональны. Рассмотрим линейный оператор R̂ в евклидовом пространстве бесконечно дифференцируемых на [−1,1] функций, ставящий каждой такой функции в соответствие18 ее вторую производную, взятую с обратным знаком, и выясним, при каких условиях этот оператор будет самосопряженным. Интегрируя по частям, получим 1 d 2x dx ˆ ( Rx , y ) = − ∫ 2 y ( τ ) d τ = − y ( τ) dτ −1 d τ 1 1 + −1 dx dy ∫ dτ dτ dτ. −1 Но, с другой стороны, 1 ( x, Rˆ y ) = − ∫ x(τ) −1 d2y dy dτ = − x ( τ ) 2 dτ dτ Поэтому для самосопряженности оператора 1 dx dy y (τ) = x(τ) dτ dτ −1 1 −1 1 dx dy dτ . d τ d τ −1 +∫ R̂ достаточно, чтобы 1 . Это условие выполняется, например, для −1 функций, которые (так же, как и их производные) имеют равные значения на концах отрезка [−1,1]. 18 В примере 10.7.1 было показано, что оператор вида Aˆ + Aˆ есть самосо- пряженный и имеет неотрицательные собственные значения. Если  =  + = − d и dτ d (при выполнении соответствующих граничных условий), то dτ d2 Rˆ = Aˆ + Aˆ = − 2 . dτ Г л а в а 1 2 . Прикладные задачи линейной алгебры Найдем теперь собственные векторы линейного оператора ловие Rˆ x = уравнению 441 R̂ . Ус- λx в данном случае сводится к дифференциальному d 2x = − λ x, λ ≥ 0 , d τ2 решение которого дается формулой где ты. x(τ) = α e τ −λ + β e −τ −λ , α и β – произвольные, не равные нулю одновременно констан- Из условий x(−1) = x(1) и dx dτ = −1 dx dτ получаем по формуле 1 Эйлера (см. приложение 3): e −λ − e − −λ = 0 ⇒ sin λ = 0 . Следовательно собственные значения будут λ k = π 2 k 2 ∀ k = 0,1, 2, ... , а отвечающие им собственные векторы − x k (τ) = ξ k cos πkτ + η k sin πkτ . ξ k и η k здесь произвольные, но не равные нулю одновременно для каждого k . Числа Таким образом, мы получили систему попарно ортогональных элементов, линейная оболочка которых является подпространством евклидова пространства непрерывных на [−1,1] функций. Эта система (так же, как система полиномов Лежандра) может быть использована для построения аппроксимирующих многочленов, однако в данном случае эти многочлены будут тригонометрическими. 442 Аналитическая геометрия и линейная алгебра Замечание: полученные результаты приводят к естественному во- просу: можно ли уменьшить погрешность аппроксимации за счет увеличения n ? Или, иначе говоря, справедливо ли равенство lim ( f n →∞ 2 n − ∑ ξ ∗k2 ) = 0 ? k =0 Ответ на этот вопрос в общем случае отрицательный. Рассмотрим, например, некоторое подпространство E ∗ евклидова пространства ∗ E , не имеющее базиса (то есть E бесконечномерное), и пусть су∈ E , но f ∉ E ∗ , такой, что ( f , g k ) = 0 ∀k ществует ненулевой элемент f (где все g k ∈ E ∗ , а их любое конечное подмножество линейно неза- висимо). В этом случае все аппроксимирующие коэффициенты равны нулю и данное предельное равенство, очевидно, не выполняется19. 19 Условия возможности построения линейной комбинации из элементов множества {g k , k = 0,1, 2, ...} , аппроксимирующей ∀f ∈ E с любой наперед заданной точностью, выходят за рамки предмета линейной алгебры и изучаются в курсе математического анализа. П р и л . 1 . Свойства линий второго порядка на плоскости 443 Приложение 1 СВОЙСТВА ЛИНИЙ ВТОРОГО ПОРЯДКА НА ПЛОСКОСТИ В § 4.4 были перечислены конкретные типы линий второго порядка, различие между которыми сохраняется при переходе из одной декартовой системы координат в другую. В данном приложении будут рассмотрены характерные свойства этих линий. Приложение 1.1. Вырожденные линии второго порядка К вырожденным линиям второго порядка будем относить все типы, перечисленные в первых четырех столбцах таблицы теоремы 4.4.1. Кратко опишем их свойства. 1°. Тип линии “Несовпадающие прямые” x2 y2 Уравнение 2 − 2 = 0 определяет пару пересекающихся пряa b → → мых в системе координат {O, e1 , e2 } . В свою очередь уравнение y 2 = a 2 при a ≠ 0 определяет пару параллельных прямых. → Пример Прил. 1.1.1. → {O, e1 , e2 } задана линия второго 2 2 порядка 3 x + 4 xy + y = 0. Преобразовав ее урав- Пусть на плоскости нение к виду 444 Аналитическая геометрия и линейная алгебра (2 x + y ) 2 − x 2 = 0 (метод Лагранжа), получим две прямые y = − x и y = −3x . (Рис. Прил. 1.1.1.) В данном случае ∆ = −1 < 0 , а угол поворота осей системы координат α= 1 arctg 2 . 2 Рис. Прил. 1.1.1 2°. Тип линии “Совпадающие прямые” Уравнение y 2 = 0 определяет прямую y = 0 в системе коорди- → → {O, e1 , e2 } . Получается из типа линии 1° предельным переходом при b → +0 . нат 3°. Тип линии “Точки” Уравнение x2 y2 + = 0 определяет единственную точку – начаa2 b2 → → ло координат системы {O, e1 , e2 } . 4°. Тип линии “Пустые множества” → → На плоскости {O, e1 , e2 } не существует точек, координаты которых удовлетворяют уравнениям П р и л . 1 . Свойства линий второго порядка на плоскости 445 x2 y2 + 2 = −1 или y 2 = − a 2 . 2 a b Однако эти случаи иногда именуют “мнимыми линиями”. Приложение 1.2. Эллипс и его свойства Определение Прил. 1.2.1. Линия, уравнение которой в некоторой ортонормированной системе координат имеет вид x2 y2 + =1; a ≥ b > 0, a2 b2 называется эллипсом. Определение Прил. 1.2.2. Число ε= a2 − b2 a называется эксцентрисите- том эллипса. ± εa называются фокусами эллипса. 0 a Прямые x = ± называются директрисами эллипса. ε 2 b Число p = называется фокальным параметром a Точки эллипса. Свойства эллипса 1. Эллипс – ограниченная линия: | x | ≤ a и записи канонического уравнения в форме | y | ≤ b, что следует из 446 Аналитическая геометрия и линейная алгебра y=± b a2 − x2 . a 2. Эллипс L обладает осевой симметрией относительно осей Ox и Oy , а также центральной симметрией относительно начала координат. Это вытекает из отношений −x y ∈L ⇔ x y ∈L ⇔ x ∈ L, −y c −x −y ∈ L, очевидных для канонического уравнения эллипса. Рис. Прил. 1.2.1 ρ( P, Q) расстояние между геометрическими объектами P и Q , а через α и β обозначим углы между касательной и фокальными радиусами – отрезками F1 A и F2 A . Будем обозначать через П р и л . 1 . Свойства линий второго порядка на плоскости Теорема Прил. 1.2.1. Пусть x A= y 447 есть точка, принадлежащая эллип- су L , заданному каноническим уравнением, тогда имеют место следующие соотношения: → 1) → r1 = | F1 A | = a − ε x ; r2 = | F2 A | = a + ε x ; → → | F1 A | + | F2 A | = 2a ; ρ( A, F1 ) ρ( A, F2 ) 3) = =ε; ρ( A, D1 ) ρ( A, D2 ) 2) 4) ρ( M , F1 ) = ε ⇒ ∀M ∈ L ; ρ( M , D1 ) 5) | F2 B | = p , где F2 B ортогонален оси Ox ; 6) ∠α = ∠β . → → Доказательство. 1°. Имеем (см. рис. Прил. 1.2.1) r1 = ( x − aε) 2 + y 2 ; r2 = ( x + aε) 2 + y 2 . Тогда, учитывая каноническое уравнение и определение эксцентриситета, получаем для i = 1, 2 : b2 2 ri = ( x ± aε) + y = ( x ± aε) + 2 (a − x 2 ) = a 2 2 2 = ( x ± aε) 2 + (1 − ε 2 )(a 2 − x 2 ) = 448 Аналитическая геометрия и линейная алгебра = x 2 ± 2 xaε + a 2 ε 2 + a 2 − a 2 ε 2 − x 2 + x 2 ε 2 = = a 2 ± 2 xaε + x 2 ε 2 = | a ± ε x | . Но поскольку довательно, | x | ≤ a и 0 ≤ ε < 1 , то a ± ε x ≥ 0 и, сле→ → r1 = | F1 A | = a − ε x ; r2 = | F2 A | = a + ε x. 2°. Утверждение 2° очевидно в силу 1°. 3°. Далее ρ( A, F1 ) a − xε ρ( A, F2 ) a + xε = = ε; = = ε. ρ( A, D1 ) a ρ( A, D2 ) a −x +x ε ε 4°. Справедливость 4° докажите самостоятельно. 5°. Наконец, → | F2 B | = b b b a 2 − a 2ε2 = a 1 − ε2 = b = p . a a a 6°. Доказательство приводится после доказательства теоремы Прил. 1.2.2. Теорема доказана. Проведение касательных к эллипсу Теорема Прил. 1.2.2. Пусть A= x0 есть точка, принадлежащая элy0 липсу, заданному каноническим уравнением, П р и л . 1 . Свойства линий второго порядка на плоскости 449 тогда уравнение касательной к этому эллипсу, проходящей через точку A, имеет вид x0 x y0 y + 2 = 1. a2 b Доказательство. A имеет вид y − y0 = y ′( x0 )( x − x0 ) . Уравнение касательной в точке Для эллипса из канонического уравнения получаем 2 x 2 yy ′ + 2 = 0, a2 b то есть y ′( x0 ) = − Но тогда ние, что y − y0 = − b 2 x0 . a 2 y0 b 2 x0 ( x − x0 ) , и, принимая во внимаa 2 y0 x02 y 02 + = 1 , окончательно получим a2 b2 x0 x y 0 y + 2 = 1. a2 b Наконец, непосредственно проверяем утверждение теоремы для точек y 0 = 0 , где уравнения касательных имеют вид x = ± a. Теорема доказана. Доказательство свойства 6° теоремы Прил. 1.2.1. Пусть касательная к эллипсу проведена через точку касания A, 450 Аналитическая геометрия и линейная алгебра имеющую координаты F2 с координатами x0 . Тогда расстояние d 2 от фокуса y0 −c 0 до касательной равно (см. задачу 3.2.1): d2 = 1 x 0 ( − c ) y 0 ( 0) 1 x0 c + 2 −1 = +1 = 2 ∆ ∆ a2 a b r 1 = x0 ε + a = 2 , где ∆ = ∆a ∆a Аналогично находим расстояние x02 a2 + y 02 b2 . d 1 от фокуса F1 с координа- c тами 0 до касательной: d1 = r 1 x0 c 1 −1 = x0 ε − a = 1 . 2 ∆ a ∆a ∆a α и β острые, то из равенств d d 1 1 sin α = 1 = и sin β = 2 = r1 ∆ a r2 ∆ a следует ∠α = ∠β . Поскольку углы Свойство 6° теоремы Прил. 1.2.1 доказано. Из теорем Прил. 1.2.1 и Прил. 1.2.2 следует возможность альтернативных формулировок свойств эллипса. Фокальное свойство эллипса: эллипс есть геометрическое место точек, сумма расстояний от которых до двух фокусов постоянна и равна 2a . П р и л . 1 . Свойства линий второго порядка на плоскости 451 Директориальное свойство эллипса: эллипс (исключая случай окружности) есть геометрическое место точек, отношение расстояния от которых до данной точки (фокуса) к расстоянию до данной прямой (директрисы) постоянно и меньше единицы. Оптическое свойство эллипса: касательная в любой точке эллипса образует с фокальными радиусами точки касания равные острые углы. (Любой луч света, исходящий из одного фокуса, после отражения в эллипсе проходит через другой фокус.) Уравнение эллипса в полярной системе координат Поместим полюс полярной системы координат в левый фокус эллипса, а полярную ось направим по линии, соединяющей его фокусы. Для произвольной точки A , лежащей на эллипсе (рис. Прил. 1.2.1.), имеем ρ = r2 = a + xε = a + ε (ρ cos ϕ − aε) = a + ερ cos ϕ − aε 2 . Откуда ρ(1 − εcos ϕ) = = a(1 − ε 2 ) и окончательно ρ= p . 1 − ε cos ϕ (Сравните эти формулы с выкладками в § 4.6.) Рис. Прил. 1.2.2 452 Аналитическая геометрия и линейная алгебра Приложение 1.3. Гипербола и ее свойства Определение Прил. 1.3.1. Линия, уравнение которой в некоторой ортонормированной системе координат имеет вид x2 y2 − = 1 ; a > 0, b > 0, a2 b2 называется гиперболой. Определение Прил. 1.3.2. ε= Число a2 + b2 a называется эксцентрисите- том гиперболы. Точки ± εa называются фокусами гиперболы. 0 x=± Прямые a называются директрисами гиперε болы. Число p= b2 называется фокальным параметром a гиперболы. Свойства гиперболы 1°. Гипербола – неограниченная кривая, существующая для | x| ≥ a, что следует из записи канонического уравнения в форме y=± b x2 − a2 ; a П р и л . 1 . Свойства линий второго порядка на плоскости 453 2°. Гипербола L обладает осевой симметрией относительно осей Ox и Oy , а также центральной симметрией относительно начала координат. Это вытекает из отношений −x ∈L y ⇔ x ∈L y ⇔ x ∈ L, −y c −x ∈ L, −y очевидных для канонического уравнения гиперболы. Через α и β обозначим углы между касательной и фокальными радиусами (рис. Прил. 1.3.1). Определение Прил. 1.3.3. y = u x + v называется асимптотой для линии y = f (x ) при x → ∞ , если f ( x) u = lim и v = lim( f ( x ) − u x ) . x →∞ x →∞ x Прямая 3°. Гипербола обладает асимптотами вида y=± b x . Дейстa b b x 2 − a 2 = ± и, кроме того, x → ±∞ ax a b b b v = lim ( x2 − a2 m x ) = lim ( x 2 − a 2 m x ) = x → ±∞ x a a a →±∞ вительно, = u = lim b (x2 − a 2 ) − x2 1 lim = − ab lim = 0. x → ±∞ a x →±∞ x 2 − a 2 ± x x2 − a2 m x 454 Аналитическая геометрия и линейная алгебра Свойства гиперболы иллюстрирует рис. Прил. 1.3.1. Рис. Прил. 1.3.1 Теорема Прил.1.3.1 . Пусть A= x y есть точка, принадлежащая гипер- боле L , заданной каноническим уравнением, тогда имеют место следующие соотношения: 1°°. Для правой ветви → r1 = | F1 A | = − a + ε x ; → r2 = | F2 A |= a + ε x ( x > a) . Для левой ветви → r1 = | F1 A | = a − ε x ; → r2 = | F2 A | = − a − ε x 2°°. | r1 − r2 | = 2a ; ( x < −a) ; П р и л . 1 . Свойства линий второго порядка на плоскости 3°°. ρ( A, F1 ) ρ( AF2 ) = =ε; ρ( A, D1 ) ρ( A, D2 ) 4°°. ρ( M , F1 ) = ε ⇒ ∀M , M ∈ L; ρ( M , D1 ) 5°°. | F2 B |= p ; 6°°. ∠α = ∠β . 455 → Доказательство. 1°. Доказательство аналогично доказательству теоремы Прил. 1.2.1, поэтому ограничимся здесь лишь нахождением величин r1 = ( x − aε) 2 + y 2 ; r2 = ( x + aε) 2 + y 2 , используя каноническое уравнение и определение эксцентриситета. Для i = 1, 2 получаем ri = ( x ± aε) 2 + y 2 = ( x ± aε) 2 + b2 2 (a − x 2 ) = a2 = ( x ± aε) 2 + (1 − ε 2 )(a 2 − x 2 ) = = x 2 ± 2 xaε + a 2 ε 2 + a 2 − a 2 ε 2 − x 2 + x 2 ε 2 = = a 2 ± 2 xaε + x 2 ε 2 = | a ± ε x | . Но поскольку для гиперболы вой ветви → | x | ≥ a и ε > 1 , то для пра→ r1 = | F1 A | = − a + ε x ; r2 = | F2 A | = a + ε x, 456 Аналитическая геометрия и линейная алгебра а для левой соответственно → → r1 = | F1 A | = a − ε x ; r2 = | F2 A| = − a − ε x. Откуда и следует 2° и 3°. Справедливость 4° докажите самостоятельно. 5°. Наконец, → | F2 B | = b b b a 2ε2 − a 2 = a ε2 − 1 = b = p . a a a 6°. Докажите это утверждение самостоятельно по аналогии с доказательством свойства 6° теоремы Прил. 1.2.1, используя также теорему Прил. 1.3.1. Теорема доказана. Замечание о свойствах гиперболы Каноническое уравнение изучаемой в курсе элементарной математики гиперболы y= a получается путем следующей замены коордиx нат: 1 x= x′ − 2 1 y = x′ + 2 1 y ′, 2 1 y ′. 2 Из теорем Прил. 1.3.1 и Прил. 1.2.2 следует возможность альтернативных формулировок свойств гиперболы. Фокальное свойство гиперболы: гипербола есть геометрическое место точек, абсолютная величина разности расстояний от которых до двух фокусов постоянна и равна 2a . П р и л . 1 . Свойства линий второго порядка на плоскости 457 Директориальное свойство гиперболы: гипербола есть геометрическое место точек, отношение расстояния от которых до данной точки (фокуса) к расстоянию до данной прямой (директрисы) постоянно и больше единицы. Оптическое свойство гиперболы: касательная в любой точке гиперболы образует с фокальными радиусами точки касания равные углы. (Изображение точечного источника света, расположенного в одном из фокусов, есть мнимое и находится в другом фокусе гиперболы.) Проведение касательных к гиперболе Теорема Прил. 1.3.2. Пусть A= x0 y0 есть точка, принадлежащая ги- перболе, заданной каноническим уравнением, тогда уравнение касательной к этой гиперболе, проходящей через точку А, имеет вид x0 x y 0 y − 2 =1. a2 b Доказательство. Уравнение касательной в точке A имеет вид y − y 0 = y ′( x0 )( x − x0 ) . Для гиперболы из канонического уравнения получаем 2 x 2 yy ′ − 2 = 0, a2 b то есть y ′( x 0 ) = b 2 x0 b 2 x0 . Но тогда y − y 0 = 2 ( x − x0 ) , a 2 y0 a y0 и, принимая во внимание, что 458 Аналитическая геометрия и линейная алгебра x02 y 02 − = 1 , окончательно получим a2 b2 x0 x y 0 y − 2 =1. a2 b Наконец, непосредственно проверяем утверждение теоремы для точек y 0 = 0 , где уравнения касательных имеют вид x = ± a. Теорема доказана. Уравнение гиперболы в полярной системе координат Поместим полюс полярной системы координат в правый фокус гиперболы, а полярную ось направим по положительной полуоси Ox (рис. Прил. 1.3.2). Тогда для произвольной точки A , лежащей на правой ветви гиперболы, ρ = r1 = − a + xε = = −a + ε (ρ cos ϕ + aε) = Рис. Прил. 1.3.2 = −a + ερ cos ϕ + aε 2 . Откуда ρ(1 − εcos ϕ) = a(ε 2 − 1) и окончательно ρ= p . 1 − ε cos ϕ (Сравните эти формулы с выкладками в § 4.6.) 459 П р и л . 1 . Свойства линий второго порядка на плоскости Приложение 1.4. Парабола и ее свойства Определение Прил. 1.4.1. Линия, уравнение которой в некоторой ортонормированной системе координат имеет вид y 2 = 2 px ; p > 0 , называется параболой. Определение Прил. 1.4.2. Точка p 2 называется фокусом параболы. 0 Прямая x=− p называется директрисой парабо2 лы. Число болы. p называется фокальным параметром пара- Свойства параболы иллюстрирует рис. Прил. 1.4.1, на котором через α обозначим угол между касательной и фокальным радиусом, а через β – угол между касательной и положительным направлением оси абсцисс. Свойства параболы 1°. Парабола – неограниченная кривая, существующая ∀x ≥ 0; 2°. Парабола L обладает осевой симметрией относительно оси Ox , что вытекает из отношения x ∈L y ⇔ x ∈ L, −y очевидного для канонического уравнения параболы. 460 Аналитическая геометрия и линейная алгебра Рис. Прил. 1.4.1 3°. Для параболы имеет место монотонное возрастание абсолютной величины ординаты при возрастании абсциссы, причем в нуле касательная к параболе вертикальна. Теорема Прил. 1.4.1. Пусть A= x есть точка, принадлежащая параy боле L , заданной каноническим уравнением, тогда имеют место следующие соотношения: p ; 2 1°°. r = x+ 2°°. ρ( A, F ) = 1; ρ( A, D) 3°°. ρ( M , F ) = 1 ⇒ ∀M , M ∈ L ; ρ( M , D) 4°°. | FB | = p ; → 5°°. ∠α = ∠β . П р и л . 1 . Свойства линий второго порядка на плоскости 461 Доказательство. 1°. Имеем r = (x − p 2 ) + y 2 , используя каноническое 2 уравнение, получаем p2 p + 2 px = | x + | , 4 2 p но поскольку x ≥ − , приходим сразу к справедли2 r = x 2 − px + вости утверждений 1° и 2°. Справедливость 3° докажите самостоятельно. → | FB |= 2 p p = p. 2 4°. Наконец, 5°. Доказательство приводится после доказательства теоремы Прил. 1.4.2. Теорема доказана. Замечания о свойствах параболы Каноническое уравнение параболы вида y = ax , изучаемой в курсе элементарной математики, получается путем взаимного переименования координатных переменных. Из теоремы Прил. 1.4.1 следует возможность альтернативных формулировок свойств параболы. 2 Директориальное свойство параболы: парабола есть геометрическое место точек, отношение расстояния от которых до данной точки (фокуса) к расстоянию до данной прямой (директрисы) постоянно и равно единице. 462 Аналитическая геометрия и линейная алгебра Оптическое свойство параболы: касательная в любой точке гиперболы образует равные углы с фокальным радиусом точки касания и положительным направлением оси абсцисс. (Каждый луч света, выходящий из фокуса параболы, после отражения от параболы распространяется параллельно ее оси.) Проведение касательных к параболе A= Пусть Теорема Прил.1.4.2 . x0 y0 есть точка, принадлежащая пара- боле, заданной каноническим уравнением, тогда уравнение касательной к этой параболе, проходящей через точку A , имеет вид yy 0 = p( x + x0 ) . Доказательство. Уравнение касательной в точке A имеет вид y − y 0 = y ′( x0 )( x − x0 ) . Для параболы из канонического уравнения получаем 2 yy ′ = 2 p , то есть y ′( x0 ) = Но тогда что y − y0 = p , y0 ≠ 0 . y0 p ( x − x0 ) , и принимая во внимание, y0 y 02 = 2 px0 , окончательно получим yy 0 = p( x + x0 ) . Наконец, непосредственно проверяем утверждение теоремы для точки y 0 = 0 , где уравнение касательной x = 0 . Теорема доказана. 463 П р и л . 1 . Свойства линий второго порядка на плоскости Доказательство свойства 5° теоремы Прил.1.4.1. A есть Направляющий вектор касательной к параболе в точке y0 p , а вектор фокального радиуса – x0 − p 2 . Поэтому y0 p ) + py 0 2 = p 2 2 ( x0 − ) + y 0 2 y 0 ( x0 − cos α = y +p 2 0 2 Но, с другой стороны, косинус угла y0 y 02 + p 2 β между векторами 1 0 выражается той же формулой. Поскольку углы Теорема доказана. Уравнение параболы в полярной системе координат ρ = x+ p = 2 Рис. Прил.1.4.2 y0 и p α и β острые, то они равны. Поместим полюс полярной системы координат в фокус параболы, а полярную ось направим по линии, перпендикулярной директрисе и проходящей через ее фокус (рис. Прил. 1.4.2). Для произвольной точки A , лежащей на параболе, . 464 Аналитическая геометрия и линейная алгебра = Откуда p p + ρ cos α + = p + ρ cos ϕ . 2 2 ρ(1 − cos ϕ) = p и окончательно p ρ= . 1 −cos ϕ (Сравните эти формулы с выкладками в § 4.6.) П р и л . 2 . Свойства поверхностей второго порядка 465 Приложение 2 СВОЙСТВА ПОВЕРХНОСТЕЙ ВТОРОГО ПОРЯДКА В теореме 4.5.1 были перечислены конкретные типы поверхностей второго порядка, различие между которыми сохраняется при переходе из одной декартовой системы координат в другую. В данном приложении будут рассмотрены основные свойства поверхностей этих типов. Приложение 2.1. Вырожденные поверхности второго порядка К вырожденным поверхностям второго порядка относятся типы, указанные в первой части таблицы формулировки теоремы 4.5.1. В первых двух столбцах этой таблицы перечислены типы пустых множеств, а также объекты точечно-линейного типа, исследование которых полностью аналогично случаям, рассмотренным в приложении 1, в ортонормированной, канонической системе координат → → → {O, e1 , e2 , e3 } . Первые три типа поверхностей, содержащиеся в третьей колонке таблицы, являются частными случаями цилиндрической поверхности, образующая которых параллельна прямой x = 0, а направляющими y = 0, служат плоские кривые – эллипс, гипербола и парабола, соответственно расположенные в плоскости Oxy . 466 Аналитическая геометрия и линейная алгебра Описание свойств невырожденных поверхностей второго порядка будет также выполнено в ортонормированной системе координат → → → {O, e1 , e2 , e3 } . В общем случае можно показать, что в сечении поверхности второго порядка плоскостью получается кривая второго порядка. Однако для описания основных свойств невырожденных поверхностей второго порядка достаточно рассмотреть сечения, параллельные координатным плоскостям. Приложение 2.2. Эллипсоид Определение Прил. 2.2.1. Поверхность, задаваемая в некоторой ортонормированной системе координат уравнением вида x2 y2 z2 + + = 1 , a > 0, b > 0, c > 0, a2 b2 c2 называется эллипсоидом. Свойства эллипсоида 1°. Эллипсоид – ограниченная поверхность, поскольку из его канонического уравнения следует, что | x | ≤ a ; | y | ≤ b ; | z | ≤ c . 2°. Эллипсоид обладает: - центральной симметрией относительно начала координат; - осевой симметрией относительно координатных осей; - плоскостной симметрией относительно координатных плоскостей. 3°. В сечении эллипсоида плоскостью, ортогональной любой из осей координат, получается эллипс. Например, рассматривая секущую П р и л . 2 . Свойства поверхностей второго порядка плоскость 467 z = z 0 , где z 0 < c , получаем следующее уравнение линии сечения: x2 y2 + = 1, z 02 2 z 02 2 (a 1 − 2 ) (b 1 − 2 ) c c z = z0 , являющейся эллипсом. (Рис. Прил. 2.2.1.) Рис. Прил. 2.2.1 Приложение 2.3. Эллиптический параболоид Определение Прил. 2.3.1. Поверхность, задаваемая в некоторой ортонормированной системе координат уравнением вида 468 Аналитическая геометрия и линейная алгебра x2 y2 + = 2 z , a > 0, b > 0, a2 b2 называется эллиптическим параболоидом. Свойства эллиптического параболоида 1°. Эллиптический параболоид – неограниченная поверхность, поскольку из его канонического уравнения следует, что z ≥ 0 и принимает сколь угодно большие значения. Рис. Прил. 2.3.1 2°. Эллиптический параболоид обладает - осевой симметрией относительно оси Oz ; - плоскостной симметрией относительно координатных плоскостей Oxz и Oyz . П р и л . 2 . Свойства поверхностей второго порядка 469 3°. В сечении эллиптического параболоида плоскостью, ортогональной оси Oz , получается эллипс, а плоскостями, ортогональными осям Ox или Oy – парабола. Например, рассматривая секущую плоскость z = z 0 > 0 , получаем следующее уравнение плоской линии: x2 y2 + = 1, (a 2 z 0 ) 2 (b 2 z 0 ) 2 z = z0 , являющейся эллипсом. (Рис. Прил. 2.3.1.) С другой стороны, сечение плоскостью y = y 0 приводит к уравнению линии 2 y2 x = 2a 2 ( z − 02 ), 2b y = y0 , являющейся параболой. Для случая сечения плоскостью x = x0 уравнение сечения имеет аналогичный вид: 2 x2 y = 2b 2 ( z − 0 2 ), 2a x = x0 . Приложение 2.4. Гиперболический параболоид Определение Прил. 2.4.1. Поверхность, задаваемая в некоторой ортонормированной системе координат уравнением вида x2 y2 − = 2 z , a > 0, b > 0, a2 b2 называется гиперболическим параболоидом. 470 Аналитическая геометрия и линейная алгебра Свойства гиперболического параболоида 1°. Гиперболический параболоид – неограниченная поверхность, поскольку из его канонического уравнения следует, что z – любое. Рис. Прил. 2.4.1 2°. Гиперболический параболоид обладает - осевой симметрией относительно оси Oz ; - плоскостной симметрией относительно координатных плоскостей Oxz и Oyz . 3°. В сечении гиперболического параболоида плоскостью, ортогональной оси координат Oz , получается гипербола, а плоскостями, ортогональными осям Ox или Oy , – парабола. (Рис. Прил.2.4.1.) Например, рассматривая секущую плоскость z = z 0 > 0 , получаем следующее уравнение линии сечения: П р и л . 2 . Свойства поверхностей второго порядка 471 x2 y2 − = 1, (a 2 z 0 ) 2 (b 2 z 0 ) 2 z = z0 , являющейся гиперболой. При z 0 < 0 уравнение гиперболы бу- дет иметь вид x2 y2 − = −1, (a − 2 z 0 ) 2 (b − 2 z 0 ) 2 z = z0 . С другой стороны, при сечении гиперболического параболоида плоскостью x = x 0 получаем плоскую кривую: 2 x2 y = −2b 2 ( z − 0 2 ) 2a , x = x0 являющуюся параболой. Для случая сечения плоскостью y = y 0 уравнение аналогич- но и имеет вид 2 y2 x = 2a 2 ( z + 02 ), 2b y = y0 . Из полученных уравнений следует, что гиперболический параболоид может быть получен поступательным перемещением в пространстве параболы так, что ее вершина перемещается вдоль другой параболы, ось которой параллельна оси первой параболы, а ветви направлены противоположно, причем их плоскости взаимно перпендикулярны. 4°. Гиперболический параболоид имеет два семейства прямолинейных образующих. 472 Аналитическая геометрия и линейная алгебра Если записать уравнение данной поверхности в виде x y x y ( a + b )( a − b ) = 2 z , то можно прийти к заключению, что при любых значениях параметра α точки, лежащие на прямых x y x y a + b = 2α, a − b = 2α, и x y x y α ( − ) = z α ( + ) = z , a b a b также принадлежат и гиперболическому параболоиду, поскольку почленное перемножение уравнений плоскостей, задающих эти прямые, дает уравнение гиперболического параболоида. Заметим, что для каждой точки гиперболического параболоида, существует пара прямых, проходящих через эту точку и целиком лежащих на гиперболическом параболоиде. Уравнения этих прямых могут быть получены (с точностью до некоторого общего ненулевого множителя) путем подбора конкретных значений параметра α . Приложение 2.5. Однополостный гиперболоид \ Определение Прил. 2.5.1. Поверхность, задаваемая в некоторой ортонормированной системе координат уравнением вида x2 y2 z2 + − = 1, a > 0, b > 0, c > 0, a2 b2 c2 называется однополостным гиперболоидом. Свойства однополостного гиперболоида 1°. Однополостный гиперболоид – неограниченная поверхность, поскольку из его канонического уравнения следует, П р и л . 2 . Свойства поверхностей второго порядка что 473 z ∈ (−∞, + ∞) . Рис. Прил. 2.5.1 2°. Однополостный гиперболоид обладает (рис. Прил. 2.5.1) - центральной симметрией относительно начала координат; - осевой симметрией относительно всех координатных осей; - плоскостной симметрией относительно всех координатных плоскостей. 3°. В сечении однополостного гиперболоида плоскостью, ортогональной оси координат Oz , получается эллипс, а плоскостями, ортогональными осям Ox или Oy – гипербола. Вывод уравнений для линий сечения аналогичен рассмотренным ранее случаям. 4°. Однополостный гиперболоид имеет два семейства прямолинейных образующих. Записав уравнение данной поверхности в виде 474 Аналитическая геометрия и линейная алгебра x z x z y2 + − = 1 − ( a c )( a c ) b 2 , можно прийти к заключению, что при любых не равных нулю одновременно α и β , точки, лежащие на прямых y x z x z α( a + c ) = β(1 − b ), α( a + c ) = β(1 + и x z y x z β( − ) = α(1 + ) β( − ) = α(1 − b a c a c y ), b y ), b будут принадлежать и однополостному гиперболоиду, поскольку почленное перемножение уравнений плоскостей, задающих эти прямые, дает уравнение однополостного гиперболоида. То есть для каждой точки однополостного гиперболоида существует пара прямых, проходящих через эту точку и целиком лежащих на однополостном гиперболоиде. Уравнения этих прямых могут быть получены путем подбора конкретных значений α и β . Приложение 2.6. Двуполостный гиперболоид Определение Прил. 2.6.1. Поверхность, задаваемая в некоторой ортонормированной системе координат уравнением вида x2 y2 z2 − − = 1 , a > 0, b > 0, c > 0, a2 b2 c2 называется двуполостным гиперболоидом. Свойства двуполостного гиперболоида 1°. Двуполостный гиперболоид – неограниченная поверхность, поскольку из его канонического уравнения следует, что не ограничен сверху. x ≥a и П р и л . 2 . Свойства поверхностей второго порядка 475 Рис. Прил. 2.6.1 2°. Двуполостный гиперболоид обладает - центральной симметрией относительно начала координат; - осевой симметрией относительно всех координатных осей; - симметрией относительно всех координатных плоскостей. 3°. В сечении двуполостного гиперболоида плоскостью, ортого- Ox , при x > a получается эллипс, а плоскостями, ортогональными осям Oy или Oz , – гипербола. нальной оси координат (Рис. Прил. 2.6.1.) Приложение 2.7. Поверхности вращения Пусть некоторая кривая, расположенная в плоскости Oxz , имеет уравнение F ( x , z ) = 0 . Если вращать эту кривую вокруг оси Oz , то каждая ее точка будет описывать окружность. 476 Аналитическая геометрия и линейная алгебра Совокупность точек, координаты которых удовлетворяют уравнению Определение Прил. 2.7.1. F (± x 2 + y 2 , z ) = 0, называется поверхностью вращения. К поверхностям вращения, например, относятся: Пример Прил. 2.7.1. 1°. Эллипсоид вращения 2°. x2 + y2 z2 + 2 = 1. a2 c 2 2 2 2 Конус вращения k z = x + y . Замечание: поверхности вращения линии второго порядка не всегда задаются уравнениями второго порядка. Например, если квадратную параболу z 2 = 2 px вра- щать вокруг оси Ox , то получается эллиптический параболоид вращения, однако при вращении этой же кривой вокруг оси Oz получится поверхность, задаваемая уравнением вида z 2 = ± 2 p x 2 + y 2 или z 4 = 4 p 2 ( x 2 + y 2 ) . Составить уравнение поверхности вращения, получае- Задача Прил. 2.7.1. мой при вращении линии z 2 = 2 px вокруг оси Ox . Решение. Зафиксируем на вращаемой линии точку с координатами x0 0 . Линия, получаемая при вращении этой точки воz0 круг оси са Ox в плоскости x = x0 , есть окружность радиу- z 0 с уравнением y 2 + z 2 = z 02 . П р и л . 2 . Свойства поверхностей второго порядка С другой стороны, 477 z 02 = 2 px0 , поэтому y 2 + z 2 = 2 px0 . x0 Наконец, в силу произвольности точки 0 , выбранной z0 на линии вращения, получаем, что уравнение поверхности вращения – эллиптического параболоида − есть y 2 + z 2 = 2 px . 478 Аналитическая геометрия и линейная алгебра Приложение 3 КОМПЛЕКСНЫЕ ЧИСЛА Рассмотрим двумерное линейное пространство Ω , изоморфное20 линейному пространству радиусов-векторов на плоскости, с ортонормированной системой координат {O, g 1 , g 2 } . Каждый элемент z пространства Ω в некотором базисе одноα значно задается двухкомпонентным столбцом элементы пространства вольный элемент Ω суть g1 = . Если базисные β 1 0 и g2 = , то произ0 1 α представляется в виде β 1 0 z=α +β = α g1 + β g 2 . 0 1 z= Введем новую операцию – операцию умножения элементов рассматриваемого линейного пространства. Определение Прил. 3.1. Результатом операции умножения элементов z1 = 20 α1 β1 и z2 = α2 β2 Изоморфизм (см § 7.5) в данном случае означает, что операции сравнения, сложения и умножения на вещественное число выполняются в данном множестве так же, как и для векторов на плоскости. 479 П р и л . 3 . Комплексные числа пространства странства Ω является элемент этого же про- z1 z 2 = α1α 2 − β1β 2 . α1β 2 + α 2β1 Двумерное линейное пространство Определение Прил. 3.2. {g 1 = 1 0 , g2 = 0 1 Ω с базисом }, в котором введена операция умножения элементов согласно определению Прил. 3.1, называется множеством комплексных чисел, а каждый элемент z ∈ Ω – комплексным числом. Замечания. 1°. Операция умножения комплексных чисел коммутативна и обладает распределительным свойством относительно операции сложения, что следует непосредственно из ее определения. 2°. Операция умножения комплексных чисел позволяет ввести операцию деления: частным от деления комплексного числа z1 на ненулевое z 2 называется комплексное число z ∗ , такое, что ∗ z1 = z 2 z . 3°. Нетрудно убедиться, что подмножество комплексных чисел вида α , где α – произволь0 ное вещественное число, в силу определения Прил. 3.2 обладает всеми свойствами вещественных чисел, и потому можно говорить, что вещественные числа есть подмножество комплексных чисел. 480 Аналитическая геометрия и линейная алгебра На практике более употребительна специальная, упрощенная форма записи комплексных чисел: в представлении z=α 1 0 +β = α g1 + β g 2 0 1 g1 опускается (заменяется не записываемым явно множителем “единица”), а символ g 2 заменяется символом i (называемым символ иногда “мнимой единицей”). Тогда произвольное комплексное число z представимо как z = α + β i , а записи операций с комплексными числами принимают следующий вид: z1 + z 2 = (α 1 + β1i ) + (α 2 + β 2 i ) = (α1 + α 2 ) + (β1 + β 2 )i ; λ z = λ(α + βi ) = (λα ) + (λβ)i ; z1 z 2 = (α 1 + β1i )(α 2 + β 2 i ) = (α 1α 2 − β1β 2 ) + (α 1β 2 + α 2 β1 )i . Данная форма записи удобна тем, что с комплексными числами можно оперировать как с обычными алгебраическими двучленами, если принимать во внимание, что i 2 = ii = (0 + 1i )(0 + 1i ) = i 2 = −1 , поскольку 0 1 0 −1 = = (−1) + 0 i = −1 . 1 0 Тогда, перемножая комплексные числа как двучлены и заменяя повсюду i 2 на число (−1) , мы формально приходим к соотношению z1 z 2 = (α1 + β1i )(α 2 + β 2 i ) = α1α 2 + α 1βi + α 2β1i + β1β 2 i 2 = = (α1α 2 − β1β 2 ) + (α1β 2 + α 2β1 ) i, которое согласуется с введенным выше определением Прил. 3.1. Достаточно просто может выполняться также и операция деления: 481 П р и л . 3 . Комплексные числа z1 α1 + β1i (α1 + β1i )(α 2 − β 2 i ) = = = z 2 α 2 + β 2 i (α 2 + β 2 i )(α 2 − β 2 i ) = (α1α 2 + β1β 2 ) + (α 2β1 − α1β 2 )i α 22 + β 22 = Определение Прил. 3.3. = α1α 2 + β1β 2 α 2β1 − α1β 2 + i. α 22 + β 22 α 22 + β 22 Для комплексного числа z = α+βi: 1°. Вещественное число ственной частью Re z . α называется вещеz и обозначается β называется мнимой частью z и обозначается Im z . 2°. Вещественное число 3°. Вещественное число зывается модулем z и обозначается z . 4°. Вещественное число cos ϕ = sin ϕ = ρ = α 2 + β 2 наϕ , такое, что α α 2 + β2 β и , α 2 + β2 называется аргументом z и обозначается arg z при условии, что z ≠ 0 . 5°. Комплексное число α − β i называется комплексно-сопряженным числу z и обозначается z . 482 Замечания: Аналитическая геометрия и линейная алгебра 1°. Определения, аналогичные пунктам 1°, 2° и 5°, могут быть сделаны и для матриц, элементами которых являются комплексные числа. 2°. Поскольку существует взаимно однозначное соответствие множества радиусов-векторов на плоскости и множества комплексных чисел, то комплексные числа можно изображать точками на плоскости. Свойства комплексного сопряжения Имеют место следующие, легко проверяемые свойства для любых z , z1 , z 2 ∈ Ω : 1°. (z ) = z . 2°. Число z будет вещественным тогда и только тогда, когда z = z . 3°. Число z z = α отрицательное. 4°. 2 + β 2 всегда вещественное и не- z1 + z 2 = z1 + z 2 ; z1 z 2 = z1 z 2 . n 5°. Если Pn ( z ) = ∑ α k z k – многочлен с вещестk =0 венными коэффициентами, имеющий корень λ , то этот многочлен также будет иметь и корень n Действительно, пусть ∑α k =0 k λk = 0 , тогда λ. 483 П р и л . 3 . Комплексные числа n n k =0 k =0 k 0 = 0 = ∑ α k λk = ∑ α k λ . Замечание: если алгебраическое уравнение с вещественными коэф- фициентами имеет комплексные корни, то они попарно сопряжены, а алгебраическое уравнение с вещественными коэффициентами нечетной степени имеет, по крайней мере, один вещественный корень. Задача Прил. 3.1. На множестве комплексных чисел решить уравнение z 2 +1 = 0 . Решение. Переписывая это уравнение, приняв, что z = α +β i = α β , получаем α α β β + 1 0 = 0 0 . Заметим, что здесь мы воспользовались развернутыми представлениями чисел 1 = 1 + 0i = 1 0 и 0 = 0 + 0i = 0 0 . Выполнив умножение и сложение в правой части уравнения, приходим к равенству 0 α 2 − β2 + 1 = . 0 2αβ Но поскольку два комплексных числа равны тогда и только тогда, когда одновременно равны их вещественные и мнимые части, то мы получаем следующую систему нелинейных уравнений относительно вещественных неизвестных α и β : 484 Аналитическая геометрия и линейная алгебра α 2 − β 2 + 1 = 0, 2αβ = 0, которая, как легко видеть, имеет два решения α = 0, и β =1 α = 0, Поэтому исходное уравнение также имеет два β = −1. решения z1 = 0 0 = 0 + 1i = i и z 2 = = 0 + (−1)i = −i . 1 −1 Тригонометрическая и экспоненциальная формы записи комплексных чисел Используя определение Прил. 3.3, можно получить специальную форму записи ненулевых комплексных чисел, называемую тригонометрической: z = α + β i = α 2 + β2 ( α α 2 + β2 + β α2 + β2 i) = = ρ(cos ϕ + i sin ϕ) . Тригонометрическая форма записи комплексных чисел аналогична описанию точки, изображающей комплексное число, в полярной системе координат. Пусть направляющим элементом полярной оси служит элемент g1 = 1 0 , а полюс совпадает с началом ортонормированной системы координат {O, g1 , g 2 } . 485 П р и л . 3 . Комплексные числа Тогда - значение модуля комплексного числа z равно ρ – расстоя- нию от начала координат до точки, изображающей данное число, - значение аргумента arg z совпадает с величиной полярного угла ϕ , отсчитываемого против часовой стрелки, поэтому, согласно определению Прил. 3.3, комплексное число представимо в тригонометрической форме: z = α +βi z = ρ(cos ϕ + i sin ϕ) . Рис. Прил.3.1 Другой часто используемой формой представления комплексных чисел является их экспоненциальная форма, которая получается преобразованием тригонометрической формы по формуле Эйлера: e iz = cos z + i sin z ∀z ∈ Ω . 486 Аналитическая геометрия и линейная алгебра В этом случае из z = α + β i = z (cos ϕ + i sin ϕ) iϕ следует, что z = ρ e . Использование экспоненциальной формы записи комплексных чисел может упростить решение некоторых задач, поскольку при перемножении комплексных чисел их модули перемножаются, а аргументы складываются21. Например, z1 z 2 = ρ1 e iϕ1 ρ2e iϕ 2 = ρ1 ρ 2 e i (ϕ1 + ϕ 2 ) или, приняв во внимание, что i = 0 + 1i = cos получим i i = (e π i π π + i sin = e 2 , 2 2 iπ i 2 ) − =e π 2 . Задача Прил. 3.2. Найти какое-либо вещественное решение уравнения Решение. Из формулы Эйлера следует, что cos x = 5 . cos z = e iz + e −iz 2 ∀z ∈ Ω , поэтому данное уравнение можно записать в виде 21 Обоснование обобщения свойств экспоненциальной функции вещественного аргумента на комплексный случай приводится в курсе ТФКП. 487 П р и л . 3 . Комплексные числа ei x + e −i x 2 где = 5 или y + 1 − 10 = 0 , y y = ei x . Откуда находим, что ei x = 5 ± 2 6 , то есть i x = ln(5 ± 2 6 ), или окончательно x = − ln 2 (5 ± 2 6 ). 488 Аналитическая геометрия и линейная алгебра Приложение 4 ЭЛЕМЕНТЫ ТЕНЗОРНОГО ИСЧИСЛЕНИЯ Приложение 4.1. Замечания об определении объектов в линейном пространстве В предыдущих разделах курса линейной алгебры исследовались наиболее часто встречающиеся в приложениях виды объектов в линейном пространстве, такие, как элемент линейного пространства, линейный функционал, линейный оператор, билинейный функционал и т.д., хотя вполне очевидно, что в линейном пространстве могут быть определены и иные, быть может, более сложные объекты, представляющие практический интерес. Определение всех рассмотренных ранее объектов давалось вне зависимости от наличия или отсутствия базиса линейного пространства, причем в случае существования базиса для каждого из объектов приводился альтернативный, покомпонентный способ его описания. И поскольку замена базиса меняет, вообще говоря, данное описание, то специально исследовался вопрос о характере этого изменения. Однако естественно допустить, что в линейном пространстве Λ существуют объекты, которые можно определить, используя лишь значения их компонентов в некотором базисе. Такой подход привлекателен тем, что, во-первых, в этом случае не требуется объяснять, что представляет собой данный объект безотносительно к базису, и, во-вторых, определения объектов разной природы могут быть выполнены единообразно. n 489 П р и л . 4 . Элементы тензорного исчисления С другой стороны, недостатком такой схемы является очевидная зависимость описания объекта от выбора базиса, то есть необходимость указывать (в самом определении объекта!), что происходит с его компонентами при переходе от одного базиса к другому. Для оценки целесообразности использования определения объектов в Λ через их компоненты приведем в таблице Прил. 4.1.1 основные, рассмотренные нами ранее, типы объектов, формы их представления в базисе и правила изменения этого представления при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } . n Таблица Прил. 4.1.1 Тип объекта в Λn Координатное представление в базисе {g1 , g 2 ,..., g n } Правило изменения координатного представления при переходе к базису {g1′ , g ′2 ,..., g n′ } Элемент x Столбец x Линейный функционал f (x ) g ξ1 ξ = 2 ... ξn Строка f g где φ2 ... φ n , φi = f ( g i ) g′ = S −1 x или n ξ′j = ∑ τ ji ξ i i =1 f = = φ1 x g′ = f g или n φ′j = ∑ φ i σ ij i =1 S g 490 Аналитическая геометрия и линейная алгебра Линейный оператор  Aˆ = g Aˆ α11 α = 21 ... α n1 α12 α 22 ... α n2 ... α 1n ... α 2 n , ... ... ... α nn = g′ −1 = S Aˆ g S или α ′ki = n n = ∑∑ τ kj σ mi α jm где n Aˆ g j = ∑ α ij g i ; j = [1, n] j =1 m =1 i =1 Билинейный функционал B( x, y ) B g = β11 = B β12 β 21 β 22 ... ... β n1 β n 2 ... β1n ... β 2 n , ... ... ... β nn = S T β ij = B ( g i , g j ); i, j = [1, n] Квадратичный функционал Φ(x) Ф = g ϕ11 ϕ 21 ϕ12 ϕ 22 ... ϕ n1 ... ϕ n2 ... ϕ1n ... ϕ 2 n , ... ... ... ϕ nn g S β′ki = n = ∑∑ σ jk σ mi β jm j =1 m =1 Φ = B или n где = g′ g′ = S = T Φ g S 491 П р и л . 4 . Элементы тензорного исчисления где или ϕ ij = β ij + β ji 2 ϕ′ki = ; i, j = [1, n] n n = ∑∑ σ jk σ mi ϕ jm j =1 m =1 Как и ранее, будем предполагать, что матрица перехода n ет компоненты σ ij , где g ′j = ∑ σ ij g i ; S име- j = [1, n] , а матрица об- i =1 ратного перехода n g j = ∑ τ ij g i′ ; T = S −1 имеет компоненты τ ij , то есть j = [1, n] . i =1 Сопоставление формул третьей колонки таблицы позволяет заметить, что для данных объектов: 1° 2° {g1′ , g ′2 ,..., g n′ } линейны по значениям компонентов в базисе {g1 , g 2 ,..., g n } ; значения их компонентов в базисе коэффициентами в этих формулах служат либо компоненты матриц S или S −1 , либо и той и другой одновременно. В курсе линейной алгебры нами были рассмотрены далеко не все виды объектов, которые обладают подобными трансформационными свойствами. Например, в Λ можно ввести произведение элементов x ⊗ y , поставив в каждом базисе упорядоченной паре элементов n x = ξ1 ξ2 ... ξ n T и y = η1 η2 ... η n T 492 Аналитическая геометрия и линейная алгебра в соответствие матрицу размера ξ1 η1 ξ 2 η1 ... ξ n η1 n × n , имеющую вид ξ1 η 2 ξ 2 η2 ... ξ n η2 ... ξ1 η n ... ξ 2 η n ... ... ... ξ n η n . x ⊗ y при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } меняется в соответствии с Нетрудно убедиться, что объект правилами 1° и 2°. Действительно, из n n ξ′k = ∑ τ k i ξ i и η′j = ∑ τ jm η m i =1 n n следует, что m =1 ξ′k η′j = ∑∑ τ ki τ jm ξ i η m , или же, в матричном виде, i =1 m =1 x⊗y g′ =( S −1 T ) x⊗ y g S −1 . Последнее равенство означает, что введенное нами произведение элементов обладает свойствами 1° и 2°. Рассмотрим другой пример, демонстрирующий существование более сложных объектов, обладающих данными свойствами. Достаточно часто в физических приложениях используется метод, в котором линейный оператор описывает зависимость одного вектора, характеризующего некоторое свойство точки пространства, от другого вектора, являющегося другой физической характеристикой этой же точки. → Например, закон Гука связывает вектор силы F , возникающей в → результате упругой деформации, с вектором деформации шением κ xx κ xy κ xz ∆x Fy = κ yx Fz κ zx κ yy κ zy κ yz κ zz ∆y , ∆z Fx ∆r соотно- 493 П р и л . 4 . Элементы тензорного исчисления → или же индукция электрического поля → женность электрического поля D выражается через напря- E формулой θ xx θ xy θ xz Ex D y = θ yx Dz θ zx θ yy θ zy θ yz θ zz Ey . Ez Dx Если среда однородная, то коэффициенты матриц этих операторов константы. Однако если исследуемые свойства среды меняются от точки к точке, то соответствующие операторы уже не будут линейными, и может возникнуть вопрос о характере их зависимости от координат. В этом случае можно ввести в рассмотрение объект, компоненты которого являются частными производными компонентов матрицы оператора по переменным x, y и z . Для рассматриваемых примеров таких частных производных будет 27, и их удобно представить в виде трехмерной таблицы (или, как иногда говорят, “куб-матрицы”). Например, для закона Гука этот объект состоит из трех матриц вида ∂κ xx ∂x ∂κ yx ∂ κ xy ∂x ∂κ zx ∂x ∂x ∂κ zy ∂x ∂κ yy ∂x ∂κ xz ∂κ xx ∂x ∂y ∂κ yz ∂κ yx ∂ κ xy ∂x ∂κ zz ∂x ∂y ∂κ zy ∂y ∂κ zx ∂y ∂y ∂κ yy ∂y ∂κ xz ∂κ xx ∂y ∂z ∂κ yz ∂κ yx ∂ κ xy ∂y ∂κ zz ∂y ∂z ∂κ zy ∂z ∂κ zx ∂z ∂κ xz ∂z ∂κ yz ∂z ∂κ yy ∂z ∂κ zz ∂z ∂z В общем случае n-мерного линейного пространства можно ввести объект, называемый производной оператора, обозначаемый ∂ A$ → ∂r g . 494 Аналитическая геометрия и линейная алгебра n и задаваемый в конкретном базисе упорядоченным набором из n чисел. Найдем закон преобразования компонентов этого объекта при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g n′ } . Поскольку правило изменения компонентов матрицы оператора ет вид A$ g′ = S −1 A$ n g S A$ в Λn име- n α′ki = ∑∑ τ kj σ mi α jm ) , (или j =1 m =1 то из правила дифференцирования сложной функции следует, что ∂α ′k i ∂ξ′l n n = ∑∑ τ kj σ mi j =1 m =1 n n n ∂α jm ∂ξ′l T = ∑∑∑ τ k j σ im n n j =1 m =1 ∂α jm j =1 m =1 p =1 n = ∑∑ τ kj σ mi ∑ ∂ξ p p =1 ∂α jm ∂ξ p ∂ξ p ∂ξ′l = σpl , или, в матричной форме, ∂ A$ = S → ∂r g′ −1 S T ∂ A$ S . → ∂r g Откуда делаем заключение, что введенный нами новый объект также обладает свойствами 1° и 2°. С другой стороны, отметим, что не всякий однозначно определяемый своими компонентами объект будет обладать подобными трансформационными свойствами. 495 П р и л . 4 . Элементы тензорного исчисления Например, рассмотрим однокомпонентный объект ξ1 ξ2 которого для каждого элемента x = ... ξn сумма компонентов ω , значение пространства Λn есть x . Для него в базисе {g1 , g 2 ,..., g n } имеем n ω = ∑ ξi , i =1 ω′ и определяется однозначно в базисе {g1′ , g ′2 ,..., g ′n } , оно не выражается линейно через ω , так как и, хотя значение n n n ω′ = ∑ ξ′i = ∑∑ τ ij ξ j . i =1 i =1 j =1 Таким образом, мы приходим к заключению, что в конечномерном линейном пространстве существует достаточно широкий класс объектов: - задаваемых совокупностью значений своих компонентов в некотором базисе; - обладающих свойствами вида 1° и 2°, характеризующими изменения этих компонентов при переходе от одного базиса к другому. Объекты, обладающие перечисленными свойствами, называют тензорами, уточняя это название, в случае присутствия матриц или S T S в формулах пересчета компонентов тензора при замене базиса, термином ковариантный (то есть преобразующийся так же, как и базисные элементы) или же в случае присутствия матриц S −1 или ( S −1 T ) – термином контравариантный. 496 Аналитическая геометрия и линейная алгебра Приложение 4.2. Определение и обозначение тензоров Определение тензора, исходя из вышеизложенных соображений, можно было бы дать, например, в такой форме: Будем говорить, что в вещественном линейном простран- Λn определен тензор типа (q, p ) q раз контравариантный и p раз ковариантный (или ( p + q ) - стве Λn задан объект, который в каждом p+ q базисе характеризуется упорядоченным набором n чисел ξ j1 j2 ... jq i1i2 ...i p (где jm = [1, n] ; m = [1, q] – конвален-тный), если в травариантные индексы и ik = [1, n] ; k = [1, p] – ко- вариантные), преобразующихся при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g ′n } по закону ξ′ j′ j′ ... j′ i′i′ ...i′ = ∑∑ ...∑∑ ∑ ...∑ σ i i′ σ i i′ ...σ i i′ n 1 2 q12 p n i1 =1 i2 =1 n n n i p =1 j1 =1 j 2 =1 n 11 j q =1 2 2 p p × × τ j1′ j1 τ j2′ j2 ...τ jq′ jq ξ j1 j2 ... jqi1i2 ...i p , где ik′ = [1, n] ; k = [1, p] и jk′ = [1, p] ; k = [1, m] , а σ ij и τ ij суть соответственно компоненты матрицы перехода S и ей обратной T = S −1 . Громоздкость записи и неудобочитаемость тензоров при использовании стандартной схемы обозначений очевидны уже на примере этого определения. Поэтому в тензорном исчислении используется специальная, более компактная форма описания тензорных объектов и операций с ними, основу которой составляют следующие правила. 497 П р и л . 4 . Элементы тензорного исчисления Запись тензоров 1°. Упорядоченный набор вещественных чисел, являющихся компонентами тензора, образует ( q + p ) -мерную таблицу (называемую также (q + p ) -мерной матрицей, или (q + p ) -мерным массивом), каждый элемент которой однозначно определен набором значений контравариантных индексов j1, j2 ,..., jq и ковариантных индексов i1, i2 ,..., i p . Если какой-либо из индексов принимает значения от 1 до n , то в записи тензора перечень значений индекса не указывается и предполагается, что выписаны компоненты тензора для всех этих значений. Пример Прил. 4.2.1. 2°. ξ i = ηi означает, что ξ i = ηi ∀i = [1, n] . Порядок следования индексов в записи тензоров существен. Для того чтобы избежать возможной неоднозначности, применяется следующее правило: если необходимо выписать последовательно все компоненты тензора (например, в виде одной строки), то в первую очередь увеличиваются индексы, расположенные ближе к правому концу индексного списка. Пример Прил. 4.2.2. 3°. Запись Тензор ξ ijk в Λ2 имеет следующий порядок компо- нентов: ξ111 , ξ112 , ξ121 , ξ122 , ξ 211 , ξ 212 , ξ 221 , ξ 222 . В тензорных записях для отличия контравариантных индексов от ковариантных принято первые обозначать верхними индексами, а вторые – нижними. При этом, чтобы сохранить общий порядок следования индексов в списке, в запись каждого индекса добавляется символ “точка” под каждым верхним индексом и над каждым нижним. 498 Аналитическая геометрия и линейная алгебра Пример Прил. 4.2.3. 4°. ξ i..j.kl m.. . Если точки не использованы в записи тензора, то предполагается, что нижние индексы следуют в списке после верхних. Пример Прил. 4.2.4. Линейный оператор S$ , переводящий базис {g1 , g 2 ,..., g n } в {g1′ , g ′2 ,..., g ′n } , является двухвалентным тензором типа (1,1) σij (один раз контравариантным и один раз ковариантным), причем его компоненты совпадают с компонентами матрицы перехода σ ji как следствие совпадения определения 7.3.2 и определения матрицы линейного оператора 8.3.1. Соглашение о суммировании Пусть имеется выражение, являющееся произведением сомножителей, имеющих как верхние, так и нижние индексы, причем некоторый индекс встречается в записи выражения дважды: один раз как верхний, а второй раз как нижний. Тогда под таким выражением понимается сумма членов данного вида, выписанных для всех значений повторяющегося индекса. В случае присутствия в выражении нескольких пар совпадающих индексов имеет место многократное суммирование. Пример Прил. 4.2.5. 1°. Квадратичный функционал записывается теперь в виде Φ( x) = ϕ ij ξ i ξ j . 499 П р и л . 4 . Элементы тензорного исчисления 2°. Система линейных уравнений вида α11ξ1 + α12 ξ 2 + ... + α1n ξ n = β1 2 1 2 2 2 n 2 α1 ξ + α 2 ξ + ... + α n ξ = β ............................................. α1n ξ1 + α n2 ξ 2 + ... + α nn ξ n = β n с учетом соглашений о тензорных обозначениях записывается просто как α ik ξ i = β k . Используя соглашения о тензорных обозначениях и принимая во внимание, что числа σ ij и τ ij (компоненты матриц прямого и обрат- ного перехода между базисами {g1 , g 2 ,..., g n } и {g1′ , g ′2 ,..., g ′n } ) являются также компонентами тензоров типа (1,1), сформулируем Определение Прил. 4.2.1. Будем говорить, что в вещественном линейном пространстве Λ определен тензор типа ( q, p ) , q раз контравариантный и p раз ковариантный, если в n Λn задан объект, который в каждом базисе характеp +q ризуется упорядоченным набором n чисел j1 j2 ... jq ξ i1i2 ...i p (где j m ; m = [1, q] – контравариантные ik ; k = [1, p] – ковариантные), изменяющимся при переходе от базиса {g1 , g 2 ,..., g n } к базису {g1′ , g ′2 ,..., g ′n } по закону индексы и ξ′ ij′i′′j′......i′ j ′ = σ ii′ σ ii′ ...σ ii′ τ jj′ τ jj′ ...τ jj′ ξ iji j......i j 1 2 12 q p 1 2 p 1 2 q 1 2 p 1 2 q 1 2 12 p q . 500 Аналитическая геометрия и линейная алгебра Определение Прил. 4.2.2. Число (q + p ) называется валентностью (или ран- гом) тензора Определение Прил. 4.2.3. ξi1ji2j2......i pjq . 1 Два тензора называются равными, если они одного и того же типа и во всех базисах имеют равные компоненты. Замечания. 1°. Для равенства тензоров одного типа достаточно, что- бы их компоненты были равны лишь в некотором базисе, так как из формул пересчета компонентов следует, что эти тензоры будут иметь равные компоненты и в любом другом базисе. 2°. Если объект характеризуется одним числом, причем не зависящим от выбора базиса, то его можно считать тензором типа (0,0). Таблица Прил. 4.2.1 Тип объекта в Λn Элемент x Тип тензора и его запись в базисе {g1 , g 2 ,..., g n } Одновалентный (один раз контравариантный) тензор типа (1,0) Линейный функционал f ( x) Изменение компонент тензора при переходе к базису {g1′ , g ′2 ,..., g ′n } ξ′ j = τ ij ξ i ξj Одновалентный (один раз ковариантный) тензор типа (0,1) φ j φ′j = φ i σ ij 501 П р и л . 4 . Элементы тензорного исчисления Линейный оператор A$ Двухвалентный (один раз контравариантный и один раз ковариантный) тензор типа (1,1) α′km = τ mj σ ik α ij α ij Двухвалентный (дважды ковариантный) тензор типа (0,2) β ji β′km = σ kj σ imβ ji Квадратичный функционал Двухвалентный (дважды ковариантный) тензор типа (0,2) ϕ ji ϕ′km = σ kj σ im ϕ ji Символ Кронекера Двухвалентный (один раз контравариантный и один раз ковариантный) тензор типа (1,1) δ′km = τ mj σ ik δ ij Билинейный функционал B( x, y ) Φ( x) 1, i = j δ ij = 0, i ≠ j δ j i Таблица Прил. 4.2.1 содержит описание основных тензорных объектов и правил пересчета их компонентов при замене базиса. Отметим, что последний из приведенных в таблице Прил. 4.2.1 тензоров – символ Кронекера – во всех базисах имеет компоненты, совпадающие с компонентами единичной матрицы, если считать, что верхний индекс этого тензора есть номер строки, а нижний – столбца. Действительно, по определению Прил. 4.2.1 справедливы соотношения 1 , i = j , δ′km = τ mj σ ik δ ij = τ mj σ kj = 0 , i ≠ j. 502 Аналитическая геометрия и линейная алгебра Последнее равенство, очевидно, имеет место, поскольку выражение τ mj σ kj есть результат произведения двух невырожденных, взаимно обратных матриц, компоненты которых совпадают с компонентами тензоров τ mj и σ kj . Замечания о матричной записи тензоров В ряде случаев тензоры удобно представлять в виде блочных матриц, то есть матриц, элементами которых являются обычные матрицы с числовыми элементами. При этом примем следующие соглашения: 1°. Тензор типа типа (1, 0) записывается матрицей-столбцом. Тензор (0,1) записывается матрицей-строкой. 2°. Элементы матриц, используемых для записи тензоров, нумеруются нижними индексами, порядок следования индексов определен выше, в правиле 2° "Запись тензоров". Обратите внимание, что при этом запись тензоров валентности большей, чем 1, не будет отражать тип тензора. 3°. Первый индекс определяет номер строки в числовой матрице, второй индекс – номер столбца. Третий индекс определяет номер строки в блочной матрице, состоящей из числовых матриц, четвертый индекс соответственно – номер столбца в блочной матрице. Приведем для иллюстрации общий вид матричной записи тензора четвертой валентности в двумерном пространстве: α1111 α 2111 α1121 α 2121 α1211 α 2211 α1221 α 2221 α1112 α 2112 α1122 α 2122 α1212 α 2212 . α1222 α 2222 503 П р и л . 4 . Элементы тензорного исчисления Задача Прил. 4.2.1. x и y линейного пространства Λ сопоставляется число f ( x , y ) , определяеКаждой паре элементов 4 мое через компоненты этих элементов ξ1 , ξ 2 , ξ 3 , ξ 4 и η1 , η2 , η3 , η 4 в стандартном базисе {g1 , g 2 , g 3 , g 4 } по формуле f ( x, y ) = ξ1η 3 + 3 ξ 2 η 4 . Показать, что данное сопоставление определяет тензор, найти его тип, выписать его компоненты в данном базисе. Решение. 1°. Очевидно, что данное сопоставление линейно по каждому из аргументов. Найдем закон изменения его компонентов при замене базиса. Пусть 4 g i′ = ∑ σ ik g k k =1 при переходе от базиса {g1 , g 2 , g 3 , g 4 } к базису {g1′ , g 2′ , g 3′ , g ′4 } . Тогда в силу линейности сопоставления 4 4 k =1 l =1 f ( g i′ , g ′j ) = f (∑ σ ik g k , ∑ σ lj g l ) = 4 4 = ∑∑ σ ik σ lj f ( g k , g l ) . k =1 l =1 Поскольку компоненты исследуемого объекта в новом базисе выражаются линейно через компоненты в старом, а коэффициентами служат попарные произведения элементов матрицы перехода S , то по определению Прил. 4.2.1 этот объект является тензором типа (0, 2). 504 Аналитическая геометрия и линейная алгебра f ( g k , g l ) в исходном 2°. Найдем компоненты этого тензора базисе 1 g1 g = 0 0 ; g2 0 g = 0 0 1 ; g3 0 g = 0 0 0 ; g4 1 0 g = 0 . 0 1 По условию задачи f ( g1 , g 3 ) = 1 ; f ( g 2 , g 4 ) = 3 и f ( g k , g l ) = 0 в остальных случаях. Таким образом, искомая матрица тензора имеет вид 0 0 1 0 0 0 0 3 0 0 0 0 . 0 0 0 0 Приложение 4.3. Операции с тензорами Вводимые ниже операции с тензорами во всех случаях требуют обоснования того, что результатом каждой из них является также тензор. В рамках данного курса эти утверждения предлагаются в качестве упражнений. Сложение тензоров Определение Прил. 4.3.1. Пусть даны два тензора типа β i11i2 2...i p q j j ... j . Тензор типа ( q, p ) 1 2 q (q, p ) α i1i2 ...i p и j j ... j γ iji j......i j 1 2 12 p q называется 505 П р и л . 4 . Элементы тензорного исчисления суммой тензоров α i11i2 2...i p q j j ... j и β i11i2 2...i p q j j ... j , если в каждом базисе имеет место равенство γ i11i2 2...i p q = α i11i2 2...i p q + β i11i2 2...i p q . j j ... j Пример Прил. 4.3.1. j j ... j j j ... j Сумма двух линейных операторов α ij и βij , являющих- ся тензором типа (1,1), есть также линейный оператор и, следовательно, тензор типа (1,1) γ ij , для компонентов которого справедливы соотношения γ ij = α ij + β ij . Умножение тензоров на число Определение Прил.4.3.2. Пусть дан тензор типа Тензор типа (q, p ) α i11i2 2...i p q и число λ . j j ... j 1 2 q (q, p ) γ i1i2 ...i p называется произведе- нием тензора j j ... j α i11i2 2...i p q j j ... j на λ , если в каждом базисе имеет место равенство γ i11i2 2...i p q = λα i11i2 2...i p q . j j ... j Замечание: j j ... j нетрудно показать, что множество тензоров типа (q, p ) с операциями сложения и умножения на число является линейным пространством размерности nq + p . Тензорное произведение Определение Прил. 4.3.3. Пусть даны два тензора типа (q, p ) α i11i2 2...i p q и типа j j ... j 506 Аналитическая геометрия и линейная алгебра β lk11lk2 2......lskr (r , s ) γ i11i2 2...i pl1ql21...2ls j j ... j k k ... k r α i11i2 2...i p q j j ... j и . Тензор типа (q + r , p + s ) называется произведением тензоров β lk11lk2 2......lskr , если в каждом базисе имеет место равенство γ i11i2 2...i pl1ql21...2ls j j ... j k k ... k r = α i1i2 ...i p j1 j2 ... jq β lk11lk2 2......lskr . Иногда тензорное произведение обозначают символом ⊗. Пример Прил. 4.3.2. Мы видели, что элементы линейного пространства Λ являются один раз контравариантными тензорами. Найдем их произведение по определению Прил. 4.3.3. n Получаем, что антный тензор. Заметим, x ⊗ x ⊗ y = ξ k ηi есть дважды контравариy ≠ y ⊗ x . Дело в том, что хотя и ξ η = η ξ , но упорядочивание компонентов этих k i i k тензоров выполняется по-разному. Следовательно, тензорное произведение некоммутативно. Задача Прил. 4.3.1. Определить тип и матрицу тензора c a – тензор типа ( 0,3) с матрицей = a ⊗ b , если 1 2 3 4 5 6 7 8 тензор типа ( 0,1) с матрицей 9 10 . и b – 507 П р и л . 4 . Элементы тензорного исчисления Решение. По определению тензорного произведения c есть тензор типа ( 0,4) с матрицей, составленной (с учетом соглашения о порядке индексов) из поэлементных произведений вида α ijk β l , где α ijk и β l – компоненты тензоров a и b соответственно. Таким образом, матрица тензора 1⋅ 9 2 ⋅ 9 1 ⋅ 10 2 ⋅ 10 c имеет вид 9 18 10 20 3 ⋅ 9 4 ⋅ 9 3 ⋅ 10 4 ⋅ 10 27 36 30 40 = . 5 ⋅ 9 6 ⋅ 9 5 ⋅ 10 6 ⋅ 10 45 54 50 60 7 ⋅ 9 8 ⋅ 9 7 ⋅ 10 8 ⋅ 10 63 72 70 80 Свертывание тензоров Определение Прил. 4.3.4. 1 2 q (q, p ) α i1i2 ...i p , причем j j ... j Пусть дан тензор типа q ≥ 1 и p ≥ 1 . Выберем один верхний (например, jr ) и один нижний (например, i s ) индексы и в записи тензора заменим их обозначения одним и тем же символом (например, m ). Тензор типа (q − 1, p − 1) β i11i2 2...i p −q1−1 j j ... j называется сверткой тензора сам α i11i2 2...is ...r i p q j j ... j ... j по индек- jr и i s , если в каждом базисе имеет место ра- венство β i11i2 2...i p −q1−1 j j ... j = α i11i2 2...m...i p q . j j ...m ... j 508 Аналитическая геометрия и линейная алгебра Заметим, что в последнем равенстве правая часть – это сумма n слагаемых, где m – индекс, по которому выполняется суммирование, а само данное тензорное равенство равносильно ( q − 1)( p − 1) скалярным равенствам. Пример Прил. 4.3.3. Свертка тензора типа оператором (1,1) , являющегося линейным α , есть тензор типа (0, 0) , то есть инj i вариант относительно замены базиса, имеющий единственный компонент, равный α mm = α11 + α 22 + ... + α nn . Данное выражение есть сумма диагональных элементов матрицы линейного оператора, которая не меняется при замене базиса. Заметим, что данным свойством не обладает, например, матрица билинейного функционала. Операция свертки часто комбинируется с операцией умножения тензоров. Например, результатом произведения один раз ковариантного тензора на один раз контравариантный с последующей сверткой является инвариант, представляющий значение линейного функционала в Λn . Действительно, f ( x) = φ i ξ i . В этом случае говорят, что тензор φi свертывается с тензором ξ k . Задача Прил. 4.3.2. Даны тензоры: a – типа (1,1) с элементами α ij и матрицей 1 2 3 4 5 6 ; 7 8 9 509 П р и л . 4 . Элементы тензорного исчисления b – типа (1, 0) с элементами β j и матрицей 2 −3 ; 4 c – типа (0,1) с элементами γ i и матрицей 2 −3 4 . Найти свертки Решение. 1°. α ij β j и α ij γ i . α ij β j – По определению операции свертывания, 3 тензор типа (1, 0) с компонентами δ i = ∑ α ij β j . j =1 Поэтому δ1 = α 11β1 + α 12 β 2 + α 13 β 3 = 1 ⋅ 2 + 2 ⋅ (−3) + 3 ⋅ 4 = 8, δ 2 = α 12 β1 + α 22 β 2 + α 32 β 3 = 4 ⋅ 2 + 5 ⋅ (−3) + 6 ⋅ 4 = 17, δ 3 = α 13β1 + α 32 β 2 + α 33β 3 = 7 ⋅ 2 + 8 ⋅ (−3) + 9 ⋅ 4 = 26. 2°. Аналогично, α ij γ i – тензор типа (0,1) с компо3 нентами ϕ j = ∑ α ij γ i . Тогда i =1 ϕ1 = α 11 γ 1 + α 12 γ 2 + α 13 γ 3 = 1 ⋅ 2 + 4 ⋅ ( −3) + 7 ⋅ 4 = 18, ϕ 2 = α 12 γ 1 + α 22 γ 2 + α 32 γ 3 = 2 ⋅ 2 + 5 ⋅ ( −3) + 8 ⋅ 4 = 21, ϕ 3 = α 13 γ 1 + α 32 γ 2 + α 33 γ 3 = 3 ⋅ 2 + 6 ⋅ ( −3) + 9 ⋅ 4 = 26. 510 Аналитическая геометрия и линейная алгебра Транспонирование тензоров Как уже отмечалось ранее, перестановка местами любой пары ковариантных (или пары контравариантных) индексов у тензора, то есть транспонирования тензора, вообще говоря, приводит к его изменению, поскольку в определении тензора говорится об упорядоченной системе индексов. При этом новый тензор будет того же типа, что и исходный. В общем случае для группы, состоящей из N верхних (или нижних) индексов, существует N! различных способов перестановок. Это означает, что, переставляя данные индексы, можно построить N! новых тензоров. 1 2 Задача Прил. 4.3.3. Тензор α ijk задан матрицей 3 4 5 6 . 7 8 Найти матрицу транспонированного тензора. Решение. Данный тензор можно транспонировать по паре контравариантных индексов i и j. После перестановки соответствующих элементов получаем тензор с матрицей 1 3 2 4 5 7 . 6 8 Симметрирование и альтернирование тензоров Определение Прил. 4.3.5. Тензор называется симметричным относительно группы (верхних или нижних) индексов, если он не П р и л . 4 . Элементы тензорного исчисления 511 меняется при перестановке любых двух индексов, принадлежащих данной группе. Определение Прил. 4.3.6. Тензор называется антисимметричным (или кососимметричным) относительно группы индексов, если он меняет, в смысле указанного выше определения равенства тензоров, свой знак на противоположный при перестановке любых двух индексов, принадлежащих данной группе. Выделим у тензора группу, состоящую из N индексов (либо верхних, либо нижних), построим путем перестановок индексов данной группы N! всевозможных новых тензоров и возьмем их среднее арифметическое. В результате мы получим тензор, симметричный по выбранной группе индексов. Данная операция называется симметрированием тензора по группе индексов. Группа индексов, по которой выполняется симметрирование тензора, выделяется круглыми скобками. Пример Прил. 4.3.4. N =1 ξ ( i1 ) = ξ i1 , N =2 ξ ( i1 ,i2 ) = N =3 ξ (i1 ,i2 ,i3 ) = {ξ i1 ,i2 ,i3 + ξ i3 ,i1 ,i2 + ξ i2 ,i3 ,i1 + 1 2! (ξ i1 ,i2 + ξ i2 ,i1 ), 1 3! + ξ i2 ,i1 ,i3 + ξ i3 ,i2 ,i1 + ξ i1 ,i3 ,i2 } ... ... 512 Аналитическая геометрия и линейная алгебра Операция симметрирования часто комбинируется с умножением, причем имеет место следующий порядок действий: сначала умножение, а потом симметрирование. Пример Прил. 4.3.5. ξ (i η j ) . Выделим у тензора группу, состоящую из N индексов (либо верхних, либо нижних), построим путем перестановок индексов данной группы N! всевозможных новых тензоров, приписав каждому из них (−1) Б (k 1 , k 2 ,...,k N ) , где Б(k1 , k 2 ,..., k N ) – число беспорядков в перестановке чисел {1,2,..., N } , и возьмем их среднее арифметичезнак ское. В результате мы получим тензор, антисимметричный по выбранной группе индексов. Данная операция называется альтернированием тензора по группе индексов. Группа индексов, по которой выполняется альтернирование тензора, выделяется квадратными скобками. Пример Прил. 4.3.6. N =1 ξ[i1 ] = ξ i1 , 1 N =2 ξ [i1 ,i2 ] = N =3 ξ[i1 ,i2 ,i3 ] = ... 2! {ξ i1 ,i2 − ξ i2 ,i1 }, 1 {ξ i ,i ,i + ξ i3 ,i1 ,i2 + ξ i2 ,i3 ,i1 − 3! 1 2 3 − ξ i2 ,i1 ,i3 − ξ i3 ,i2 ,i1 − ξ i1 ,i3 ,i2 } ... 513 П р и л . 4 . Элементы тензорного исчисления Операция альтернирования часто комбинируется с умножением, причем имеет место следующий порядок действий: сначала умножение, а потом альтернирование. Пример Прил. 4.3.7. ξ[ i η j ] . Заметим, что как симметрирование кососимметричного тензора, так и альтернирование симметричного дает нулевой тензор. 1 2 Задача Прил. 4.3.4. Тензор α ijk задан матрицей 3 4 5 6 . Найти мат- 7 8 рицы тензоров Решение. 1°. Тензор α (ij ) k , α i ( jk ) и α i[ jk ] . β ijk = α jik , транспонированный к данному по паре индексов i и j , имеет матрицу 1 3 2 4 5 7 (см. задачу Прил. 4.3.3). 6 8 Тензор γ ijk = α ikj , транспонированный к данному по паре индексов j и k , будет иметь матрицу 1 5 3 7 2 6 4 8 , 514 Аналитическая геометрия и линейная алгебра в которой элементы первых столбцов блочных матриц исходного тензора записаны в первой блочной строке. 2°. Тогда тензор α (ij ) k имеет матрицу 1+1 2+3 2 3+2 2 4+4 5 2 2 2 1 5 2 4 = тензор , 5+5 6+7 2 7+6 2 8+8 13 2 2 2 5 13 2 8 α i ( jk ) – матрицу 1+1 2+5 2 3+3 2 4+7 2 2 1 3 7 2 11 2 = а тензор , 5+2 6+6 7 2 7+4 2 8+8 2 11 2 2 2 α i[ jk ] – матрицу 6 8 515 П р и л . 4 . Элементы тензорного исчисления 1−1 2−5 2 3−3 2 4−7 2 2 0 0 − − 3 2 3 2 = . 5−2 6−6 3 2 7−4 2 8−8 2 3 2 2 2 0 0 Приложение 4.4. Тензоры в евклидовом пространстве В случае евклидова пространства тензоры обладают дополнительными специфическими свойствами, обусловленными тем фактом, что скалярное произведение есть билинейный функционал, а потому является дважды ковариантным тензором, компоненты которого в любом базисе совпадают с компонентами матрицы Грама. Этот ковариантный тензор иногда называют фундаментальным метрическим тензором. Поясним эти свойства следующим примером. Пусть дан базис {g1 , g 2 ,..., g n } в E n и его некоторый элемент x , являющийся одξ i . Свернем i фундаментальный метрический тензор γ ij = ( g i , g j ) с тензором ξ , новалентным, один раз контравариантным тензором получим ξ j = γ ij ξ i = ( g i , g j )ξ i = ( g i ξ i , g j ) = ( x, g j ) . Данное равенство означает, что элемент зуется в каждом базисе n x однозначно характери- E также и компонентами один раз ковариан- 516 тного тензора Аналитическая геометрия и линейная алгебра ξ j . Числа ξ j называются ковариантными компонен- тами элемента x в базисе {g1 , g 2 ,..., g n } , и они однозначно опре- деляются обычными контравариантными компонентами элемента x в силу невырожденности матрицы Грама из системы уравнений ξ j = γ i j ξi . Таким образом, в евклидовом пространстве исчезает принципиальная разница между ковариантными и контравариантными индексами тензоров. Более того, в ортонормированном базисе ковариантные и контравариантные компоненты элемента x совпадают (см. теорему 10.3.2). Операция опускания индекса Определение Прил. 4.4.1. Пусть в 1 2 q E n задан тензор типа (q, p ) α i1i2 ...i p , где j j ... j • j ... j 2 q q ≥ 1 . Тензор типа (q − 1, p + 1) β i0i1i2 ...i p называет- ся результатом операции опускания контравариантного индекса 1 2 q j1 у тензора α i1i2 ...i p , если в каждом j j ... j базисе имеет место равенство • j ... j β i0i12i2 ...iqp = γ i0 j1 α i11i2 2...i p q . j j ... j Заметим, что использование точек для указания порядка следования индексов в этой операции оказывается необходимым, чтобы сделать ее однозначной. Иначе непонятно, куда следует опустить индекс. Операция поднятия индекса Определение Прил. 4.4.2. Дважды контравариантный тензор, компоненты которого в любом базисе евклидова пространства E n сов- 517 П р и л . 4 . Элементы тензорного исчисления падают с матрицей, обратной матрице Грама, называется контравариантным метрическим тензором. Убедимся вначале, что матрица, обратная матрице Грама, задает в (2, 0) . Имеем Γ каждом базисе тензор типа g′ T = S Γ g S . Исходя из этого соотношения, получаем следующее правило преобразования обратной матрицы Грама при замене базиса: Γ −1 g′ =( S = S поскольку из Γ T −1 Γ E = E g g S ) −1 = S ( S T −1 T ) =( S Γ g T −1 ( S ) = −1 T ) , =( S S дует, что для невырожденной матрицы ( S −1 −1 T −1 T ) =( S S ) S T сле- справедливо равенство T −1 ) . А это и означает, что обратная матрица Грама определяет во всех базисах дважды контравариантный тензор γij . По аналогии с операцией опускания индекса дадим Определение Прил. 4.4.3. Пусть в 1 2 q E n дан тензор типа (q, p ) α i1i2 ...i p , где j j ... j 0 1 2 p ≥ 1 . Тензор типа (q + 1, p − 1) β • i2 ...i p j j j ... jq называ- ется результатом поднятия ковариантного индекса 1 2 q i1 у тензора α i1 i 2 ...i p , если в каждом базисе имеет j j ... j место равенство β •0i21...2i p q = γ i1 j0 α i11i2 ...2 i p q . j j j ... j j j ... j 518 Задача Прил. 4.4.1. Аналитическая геометрия и линейная алгебра E 2 с фундаментальным метрическим тензором 2 3 i тензор α • jk задан матрицей γ ij = 3 5 В 3 4 5 7 2 5 . 1 3 Найти матрицы тензоров Решение. 1°. α ijk и α ijk• . Для опускания первого индекса воспользуемся формулой α ijk = γ im α •mjk . Получаем 2 α111 = γ 11α111 + γ 12 α11 = 2 ⋅ 3 + 3 ⋅ 5 = 21, 2 α112 = γ 11α112 + γ 12 α12 = 2 ⋅ 2 + 3 ⋅ 1 = 7, α121 = γ 11α121 + γ 12 α 221 = 2 ⋅ 4 + 3 ⋅ 7 = 29, α122 = γ 11α122 + γ 12 α 222 = 2 ⋅ 5 + 3 ⋅ 3 = 19, 2 α 211 = γ 21α111 + γ 22 α11 = 3 ⋅ 3 + 5 ⋅ 5 = 34, 2 α 212 = γ 21α112 + γ 22 α 12 = 3 ⋅ 2 + 5 ⋅ 1 = 11, α 221 = γ 21α121 + γ 22 α 221 = 3 ⋅ 4 + 5 ⋅ 7 = 47, α 222 = γ 21α122 + γ 22 α 222 = 3 ⋅ 5 + 5 ⋅ 3 = 30. Следовательно, матрица тензора 21 29 34 47 7 19 11 30 . α ijk имеет вид 519 П р и л . 4 . Элементы тензорного исчисления 2°. Для поднятия второго индекса следует применить формулу α ij•• k = α i•mk γ mj , где γ ij – контравари- антный метрический тензор, матрица которого обратна матрице тензора γ ij и имеет вид 2 3 3 5 −1 = 5 −3 −3 2 . Поэтому α11 = α1•11 γ 11 + α1• 21 γ 21 = 3 ⋅ 5 − 4 ⋅ 3 = 3, • •1 α12 = α1•11 γ 12 + α1•21 γ 22 = −3 ⋅ 3 + 4 ⋅ 2 = −1, • •1 α •21•1 = α •211 γ 11 + α •221 γ 21 = 5 ⋅ 5 − 7 ⋅ 3 = 4, α •22•1 = α •211 γ 12 + α •221 γ 22 = 5 ⋅ (−3) + 7 ⋅ 2 = −1, α11 = α 1•12 γ 11 + α1• 22 γ 21 = 2 ⋅ 5 − 3 ⋅ 5 = −5, • •2 α12 = α 1•12 γ 12 + α1•22 γ 22 = 2 ⋅ (−3) + 5 ⋅ 2 = 4, • •2 α •21•2 = α •212 γ 11 + α •222 γ 21 = 1 ⋅ 5 + 3 ⋅ (−3) = −4, α •22•2 = α •212 γ 12 + α •222 γ 22 = 1 ⋅ (−3) + 3 ⋅ 2 = 3. Таким образом, тензор α ijk• имеет матрицу 3 −1 4 −1 −5 4 −4 3 . В ортонормированном базисе очевидно, что γ i j = γ i j = δ ij , то есть между ковариантными и контравариантными индексами нет 520 Аналитическая геометрия и линейная алгебра никакой разницы, что также следует из равенства S −1 = S T , верного в ортонормированном базисе, и определения тензоров. Приложение 4.5. Тензоры в ортонормированном базисе Совпадение ковариантных и контравариантных индексов в ортонормированных базисах евклидова пространства позволяет ввести в рассмотрение упрощенный класс тензоров, определенных только в таких базисах и называемых евклидовыми тензорами. Два евклидовых тензора считаются одинаковыми, если один из них может быть преобразован во второй операциями опускания или поднятия индексов. Поэтому можно в дальнейшем рассматривать евклидовы тензоры как имеющие лишь нижние индексы. При этом, правда, придется допустить суммирование по паре совпадающих ковариантных индексов. При помощи евклидовых тензоров удобно продемонстрировать связь методов тензорного исчисления и аппарата векторной алгебры в 3 обычном трехмерном векторном пространстве E . Введем предварительно в рассмотрение трехвалентный дискриминантный тензор ε ijk , определяемый во всех ортонормированных базисах по правилу ε ijk = (−1) Б(i , j ,k ) , если среди чисел i , j , k нет равных, ε ijk = 0 – в остальных случаях. Б(l , m, n), как и раньше, обозначает число беспорядков в перестановке чисел {l , m, n} (см. § 6.1). Всего у тензора ε ijk , антисимметричного по любой паре индексов, Здесь 27 компонентов, из которых только шесть ненулевых: три равные 1 и три равные − 1. П р и л . 4 . Элементы тензорного исчисления Убедимся вначале, что объект 521 ε ijk преобразуется при переходе от 3 одного ортонормированного базиса в E к другому как трижды ковариантный тензор. Запишем выражения для компонентов в новом базисе в явном виде: ε′lmn = σ li σ mj σ nk ε ijk = σ l1σ m 2 σ n 3 + σ l 2 σ m 3 σ n1 + σ l 3 σ m1σ n 2 − − σ l1σ m3 σ n 2 − σ l 2 σ m1σ n3 − σ l 3 σ m 2 σ n1 = σ l1 σl 2 σl3 = det σ m1 σ n1 σ m2 σn2 σ m3 , σ n3 что в свою очередь по свойствам определителя дает ε′lmn = (−1) Б(l ,m,n ) , если среди чисел l , m, n нет равных, ε′ lmn = 0 – в остальных случаях, поскольку матрица σ11 σ12 σ13 σ 21 σ 31 σ 22 σ 32 σ 23 σ 33 ортогональная (как матрица перехода от одного ортонормированного базиса к другому) и ее определитель равен ±1. Но если объект ε ijk в новом произвольном ортонормированном базисе имеет (при использованных правилах преобразования) те же компоненты, что и в исходном, то мы приходим к заключению, что это трехвалентный евклидов тензор. 522 Аналитическая геометрия и линейная алгебра Тензоры и произведения векторов Покажем теперь связь тензорного произведения элементов про3 странства E и произведений векторов, введенных в данном пособии (см. § 2.2 и § 2.4). Все базисы по-прежнему ортонормированные. Рассмотрим два одновалентных ковариантных тензора ξ i и η k , которые в аналитической геометрии (что было показано ранее) интер→ → претируются как обычные геометрические векторы a и b . Их тензорное произведение ξ i η k есть дважды ковариантный евклидов тензор, имеющий 9 компонентов, записываемых обычно в виде матрицы следующего вида: ξ1η1 ξ1η 2 ξ1η 3 ξ 2 η1 ξ 3 η1 ξ 2η2 ξ 3 η2 ξ 2 η3 . ξ 3 η3 Согласно правилам сложения тензоров и умножения их на число, данный тензор можно представить как сумму симметричного и антисимметричного тензоров: ξi ηk = 1 1 (ξ i η k + ξ k η i ) + ( ξ i η k − ξ k η i ) , 2 2 или в матричном виде: ξ1η1 ξ1η 2 ξ 2 η1 ξ 2 η2 ξ 3 η1 ξ3 η2 ξ1 η 3 ξ1η1 + ξ1η1 1 ξ 2 η3 = ξ 2 η1 + ξ1η 2 2 ξ 3 η3 ξ 3 η1 + ξ1η3 0 1 + ξ 2 η1 − ξ1η 2 2 ξ 3 η1 − ξ1η3 ξ1η 2 + ξ 2 η1 ξ1η3 + ξ 3 η1 ξ 2 η2 + ξ 2 η2 ξ 2 η3 + ξ 3 η 2 + ξ 3 η 2 + ξ 2 η3 ξ 3 η3 + ξ 3 η3 ξ1η 2 − ξ 2 η1 ξ1η3 − ξ 3 η1 0 ξ 2 η3 − ξ 3 η 2 . ξ 3 η 2 − ξ 2 η3 Рассмотрим теперь каждое слагаемое по отдельности. 0 523 П р и л . 4 . Элементы тензорного исчисления Во-первых, отметим, что из симметричности матричного представления для первого слагаемого следует существование ортонормированного базиса, в котором эта матрица диагональна. Теперь покажем, что свертка этого слагаемого есть инвариант, то есть она не зависит от выбора базиса. Действительно, учитывая, что ξ i и η k суть одновалентные ковариантные тензоры, и используя свойства матрицы перехода S , по- лучим следующее правило преобразования их свертки: ξ′k η′k = σ ki ξ i σ kj η j = σ ikT σ kj ξ i η j = δ ij ξ i η j = ξ i ηi , что и означает инвариантность этой свертки относительно замены базиса. Отсюда следует важный вывод: любой паре элементов (векторов) → → a и b , имеющих соответственно компоненты ξ i и η k в E 3 , мож- но поставить в соответствие не зависящее от выбора ортонормированного базиса число ξ i η i = ξ1η1 + ξ 2 η 2 + ξ 3 η 3 . (См. также § 2.9.) Выясним геометрический смысл этого инварианта, обозначаемого → → → → ( a , b ) = δ ki ξ i η k . Каковы бы ни были векторы a и b , всегда найдется ортонормированный базис, в котором их координатные представления соответственно имеют вид → b cos ϕ → a → 0 0 и b sin ϕ , 0 524 Аналитическая геометрия и линейная алгебра → где → ϕ – угол между a и b . Тогда значение инварианта равно → → → → ( a , b ) = a b cos ϕ , и мы приходим к формуле скалярного произведения векторов, которая обычно принимается за его определение. Рассмотрим теперь второе слагаемое. Как нетрудно видеть, матрица 0 ξ1η 2 − ξ 2 η1 ξ1η 3 − ξ 3 η1 ξ 2 η1 − ξ1η 2 ξ 3 η1 − ξ1η3 0 ξ 3 η 2 − ξ 2 η3 ξ 2 η3 − ξ 3 η2 0 имеет только три независимых компонента, из чего следует, что паре → векторов → a и b в E 3 может быть поставлен в соответствие третий → вектор, обозначаемый как → [ a , b ] , с компонентами ξ 2 η3 − ξ 3 η 2 ξ 3 η1 − ξ1η3 . ξ1η 2 − ξ 2 η1 Исследуем его свойства. Во-первых, заметим, что число независимых компонентов у кососимметричной части тензорного произведения элементов в случае размерности пространства n равно (n − 1)n , 2 поскольку это есть число компонентов, стоящих в матрице над ее E 3 это число 3 совпадает с размерностью пространства, и только в E произведе- главной диагональю. Отсюда следует, что только в нию двух элементов можно подобным образом ставить в соответствие третий элемент. 525 П р и л . 4 . Элементы тензорного исчисления Во-вторых, убедимся, что имеют место соотношения → → [ a , b ]i = ε ijk ξ j η k . Действительно, например, для i = 1: ε1 jk ξ j η k = ε111ξ1η1 + ε112 ξ1η 2 + ε113 ξ1η3 + + ε121ξ 2 η1 + ε122 ξ 2 η 2 + ε123 ξ 2 η3 + + ε131ξ 3 η1 + ε132 ξ 3 η 2 + ε133 ξ 3 η3 = = ξ 2 η3 − ξ 3 η 2 . В-третьих, покажем инвариантность тензора κ i = ε ijk ξ j η k при 3 переходе от одного ортонормированного базиса к другому в E . Пусть это соотношение в новом ортонормированном базисе κ′i = ε′ijk ξ′j η′k , тогда в исходном базисе будут справедливы равенства σ is κ s = ε ′ijk σ jm σ kl ξ m ηl . Умножив обе части последнего равенства на тензор σ qi и свернув произведения по индексу i, получим σ qi σ is κ s = σ qi σ jm σ kl ε′ijk ξ m ηl , но σ qi σ is κ s = δ qs κ s = κ q , а ε qml = σ qi σ jm σ kl ε′ijk , поскольку тен- зор ε ijk инвариантен при переходе от одного ортонормированного базиса к другому. Следовательно, κ i = ε iml ξ m ηl , что и означает ин- вариантность этого элемента относительно замены базиса. → Выясним, наконец, геометрический смысл вектора → тим, что для любых векторов 3 → [ a , b ] . Заме- → a и b можно выбрать ортонормиро- ванный базис в E , в котором их координатные представления имеют вид соответственно 526 Аналитическая геометрия и линейная алгебра 0 0 → → a 0 → где и b cos ϕ , → b sin ϕ → ϕ – угол между a и b . → Тогда значение первого компонента → → → [ a , b ] есть a b sin ϕ , в то время как остальные компоненты нулевые, и получилась формула векторного произведения, принимаемая обычно за его определение. Таким образом, можно заключить, что введенные в курсе векторной алгебры операции скалярного и векторного произведений базируются не только на “их полезности для приложений”, но и отражают инвариантные свойства тензорного произведения элементов евклидова пространства при переходах между ортонормированными базисами. В заключение покажем, что тензорная символика может быть эффективно использована и для более сложных конструкций векторной алгебры. Например: 1°. Смешанное произведение трех векторов (см. § 2.6) представимо в виде → → → → → → → → (a , b , c ) = ( a , [ b , c ] ) = ξ i [ b , c ]i = ξ i ε ijk η j κ k = ε ijk ξ i η j κ k . 2°. Выражение для двойного векторного произведения трех векторов (см. § 2.8) может быть получено следующим образом: → → → → → [a , [ b , c ] ]i = ε ijk ξ j [ b , c ] k = ε ijk ξ j ε klm ηl κ m = = ε ijk ε klm ξ j ηl κ m . 527 П р и л . 4 . Элементы тензорного исчисления Принимая во внимание достаточно легко проверяемую формулу ε ijk ε klm = δ il δ jm − δ im δ jl , приходим к равенству → → → [a , [ b , c ] ]i = ε ijk ξ j ε klm ηl κ m = (δ il δ jm − δ im δ jl )ξ j ηl κ m = → → → → = ηi ξ m κ m − κ i ξ j η j = ηi (a , c ) − κ i (a , b ) , или, окончательно, → → → → → → → → → [a , [ b , c ] ] = b (a , c ) − c (a , b ) . 528 Аналитическая геометрия и линейная алгебра ЛИТЕРАТУРА 1. Беклемишев Д. В. Курс аналитической геометрии и линейной алгебры. 10-е изд., испр. М.: Физматлит, 2005. 2. Чехлов В. И. Лекции по аналитической геометрии и линейной алгебре. М.: МФТИ, 2005. 3. Мальцев А. М. Основы линейной алгебры. М.: Наука, 1976. 4. Постников М. М. Лекции по геометрии. М.: Наука, 1979. 5. Беклемишев Д. В. Дополнительные главы линейной алгебры. М.: Наука, 1983. 6. Шилов Г. Е. Введение в теорию линейных пространств. М.: Гос. изд-во технико-теоретической литературы, 1956. 7. Волков Т. Ф. Тензоры и векторы: учебное пособие. М.: МФТИ, 1976. 8. Беклемишева Л. А., Петрович А. Ю., Чубаров И. А. Сборник задач по аналитической геометрии и линейной алгебре. М.: Физматлит, 2001. Предметный указатель ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А Алгебраическая линия § 4.1. Алгебраическая поверхность § 4.2. Алгебраическое дополнение элемента матрицы § 6.3. Альтернирование тензоров Прил. 4.3. Аппроксимация функций многочленами § 12.3. Аффинное преобразование плоскости § 5.4. Б Базис § 1.5. Базис в пространстве § 1.5. Базис линейного пространства § 7.2. Базис на прямой § 1.5. Базис на плоскости § 1.5. Базисная строка матрицы § 6.5. Базисный минор § 6.5. Базисный столбец матрицы § 6.5. Билинейная форма § 9.1. Билинейный функционал § 9.1. Биортогональный базис § 8.7. В Вектор, множество векторов § 1.3. Векторное произведение векторов § 2.4, Прил. 4.5. Взаимно однозначное отображение § 5.2. 529 530 Аналитическая геометрия и линейная алгебра Взаимно однозначное соответствие (биекция) § 8.4. Взаимный базис § 2.5, § 8.7. Вторичное двойственное (вторичное сопряженное) пространство § 8.7. Выражение векторного произведения векторов в координатах § 2.5. Выражение векторного произведения векторов в ортонормированной системе координат § 2.5. Выражение скалярного произведения векторов в координатах § 2.3. Выражение смешанного произведения векторов в координатах § 2.7. Выражение скалярного произведения векторов в ортонормированной системе координат § 2.3. Выражение смешанного произведения векторов в ортонормированной системе координат § 2.7. Вырожденная матрица § 5.1. Вырожденные линии второго порядка Прил. 1.1. Вырожденные поверхности второго порядка Прил. 2.1. Г Геометрический смысл модуля определителя аффинного преобразования § 5.4. Геометрический смысл знака определителя аффинного преобразования § 5.4. Гипербола § 4.4. Гиперболический параболоид § 4.5. Гиперболический цилиндр § 4.5. Гиперплоскость в линейном пространстве § 7.4. Главный вектор плоскости § 3.3. Группа § 5.6. Предметный указатель 531 Д Двойное векторное произведение § 2.8, Прил. 4.5. Двойственное линейное пространство § 8.7. Двуполостный гиперболоид § 4.5. Действия с линейными операторами § 8.2. Действия с линейными операторами в матричной форме § 8.3. Детерминант матрицы 2-го и 3-го порядка § 1.1. Детерминант матрицы n-го порядка § 6.1. Диагональный вид квадратичного функционала § 9.2. Директориальное свойство гиперболы Прил. 1.3. Директориальное свойство параболы Прил. 1.4. Директориальное свойство эллипса Прил. 1.2. Дисперсия эрмитова оператора § 11.4. Дополнительный минор § 6.3. Дополнительный минор элемента матрицы § 6.3. Е Евклидово пространство § 10.1. Единичная матрица § 1.1. Единичный оператор § 8.2. З Запись тензоров Прил. 4.2. И Изменение компонентов билинейного функционала при смене базиса § 9.1. 532 Аналитическая геометрия и линейная алгебра Изменение компонентов квадратичного функционала при смене базиса § 9.2. Изменение компонентов линейного функционала при смене базиса § 8.7. Изменение координат точки при смене базиса § 1.8. Изменение координат элемента линейного пространства при смене базиса § 7.3. Изменение матрицы линейного оператора при смене базиса § 8.3. Изоморфизм § 7.5. Изоморфные линейные пространства § 7.5. Инвариантное подпространство линейного оператора § 8.5. Инвариантное собственное подпространство линейного оператора § 8.6. Инварианты линий второго порядка на плоскости § 9.4. Инъективное линейное отображение (инъекция) § 8.4. К Канонические уравнения линии второго порядка на плоскости § 4.4. Канонические уравнения поверхности второго порядка § 4.5. Канонический вид квадратичного функционала § 9.2. Квадратная матрица § 1.1. Квадратичная форма § 9.2. Квадратичный функционал § 9.2. Квадратная матрица порядка n § 1.1. Классификация поверхностей второго порядка § 12.2. Коллинеарность § 1.4. Коллинеарные векторы § 1.4. Коммутатор линейных операторов § 8.2. Компланарность § 1.4. Компланарные векторы § 1.4. Комплексные числа Прил. 3.0. Компоненты вектора § 1.5. Компоненты элемента линейного пространства § 7.3. Предметный указатель Коническая поверхность § 4.3. Коническое сечение § 4.6. Конус § 4.5. Координатное представление билинейного функционала в базисе § 9.1. Координатное представление линейного оператора в базисе § 8.3. Координатное представление линейного функционала в базисе § 8.7. Координатное представление скалярного произведения § 10.3. Координаты вектора § 1.5. Координаты элемента линейного пространства § 7.3. Композиция операторов § 5.2. Компоненты вектора § 1.5. Координаты вектора § 1.5. Критерий Сильвестра § 9.3, § 10.3. Л Линейная зависимость векторов § 1.4. Линейная зависимость элементов линейного пространства § 7.2. Линейная комбинация векторов § 1.4. Линейная комбинация элементов линейного пространства § 7.2. Линейная независимость векторов § 1.4. Линейная независимость элементов линейного пространства § 7.2. Линейная оболочка элементов линейного пространства § 7.4. Линейное неравенство § 3.2. Линейное пространство § 7.1. Линейное пространство линейных операторов § 8.2. Линейное пространство линейных функционалов § 8.7. Линейный оператор § 8.1. Линейный оператор на плоскости § 5.3. 533 534 Аналитическая геометрия и линейная алгебра Линейная форма § 8.7. Линейный функционал § 8.7. Линия в пространстве § 4.1. Линия второго порядка на плоскости § 4.4. Линия на плоскости § 4.1. М Матрица § 1.1. Матрица билинейного функционала § 9.1. Матрица Грама § 10.3. Матрица квадратичного функционала § 9.2. Матрица линейного оператора § 8.3. Матрица линейного отображения § 8.4. Матрица линейного оператора на плоскости § 5.3. Матрица перехода от одной системы координат к другой § 1.8. Матрица перехода от одного базиса к другому в линейном пространстве § 7.3. Матрица элементарных преобразований § 6.8. Метод Гаусса § 6.8. Метод Лагранжа § 9.2. Минор k -го порядка § 6.3. Н Направленный отрезок § 1.2. Направляющие векторы плоскости § 3.3. Направляющий вектор прямой на плоскости § 3.2. Невырожденная матрица § 7.5. Неоднородная система линейных уравнений § 6.6. Неоднородный линейный оператор на плоскости § 5.3. Неравенство Коши–Буняковского § 10.1. Неравенство треугольника § 10.1. Предметный указатель Неразвернутое представление матрицы § 1.1. Нетривиальная линейная комбинация векторов § 1.4. Норма элемента в евклидовом пространстве § 10.1. Нормальная прямоугольная система координат § 1.7. Нормальное уравнение прямой на плоскости § 3.2. Нормальный вектор прямой на плоскости § 3.2. Нормальный вектор плоскости § 3.3. Нулевая матрица § 1.1. Нулевой вектор § 1.3. Нулевой направленный отрезок § 1.2. Нулевой оператор § 8.2. Нулевой функционал § 8.7. Нулевой элемент линейного пространства § 7.1. О Область значений линейного оператора § 8.4. Обратная матрица § 5.1. Обратная матрица перехода § 7.5. Обратное отображение § 5.2. Обратный оператор § 8.2. Обращение произведения матриц § 5.1. Обращение линейного оператора в матричной форме § 8.3. Общая декартова система координат § 1.7. Общее решение системы линейных уравнений § 6.6, § 6.7. Общее решение неоднородной системы линейных уравнений § 6.7. Общее решение системы однородной линейных уравнений § 6.7. Однополостный гиперболоид § 4.5. Однородная система линейных уравнений § 6.6. Однородный линейный оператор на плоскости § 5.3. Оператор § 5.2, § 8.1. Оператор сжатия к осям § 5.3. Операции с линейными функционалами § 8.7. Операции с тензорами Прил. 4.3. 535 536 Аналитическая геометрия и линейная алгебра Операции с элементами линейного пространства в координатной форме § 7.3. Определитель матрицы 2-го порядка § 1.1. Определитель матрицы 3-го порядка § 1.1. Определитель матрицы n -го порядка § 6.1. Определитель произведения матриц § 6.2. Опускание индекса у тензора Прил. 4.4. Оптическое свойство гиперболы Прил. 1.3. Оптическое свойство параболы Прил. 1.4. Оптическое свойство эллипса Прил. 1.2. Ортогонализация базиса § 10.2. Ортогональная матрица § 5.1, § 10.4. Ортогональное проектирование § 2.1, § 10.5. Ортогональная проекция вектора на ось § 2.1. Ортогональная проекция точки на ось § 2.1. Ортогональное дополнение § 10.5. Ортогональное преобразование плоскости § 5.5. Ортогональные элементы в евклидовом пространстве § 10.1. Ортогональный базис § 1.5. Ортогональный оператор § 10.8. Ортонормированная система координат § 1.7. Ортонормированный базис § 1.5, § 10.2. Основная матрица системы линейных уравнений 6.6. Ось § 2.1. Отношение Релея § 12.1. Отображение плоскости § 5.2. Отрицательно определенный квадратичный функционал § 9.3. П Парабола § 4.4. Параболический цилиндр § 4.5. Параметрическое представление плоскости § 3.3. Параметрическое представление прямой на плоскости § 3.1. Пересечение подпространств линейного пространства § 7.4. Предметный указатель 537 Переход от одной ортонормированной системы координат к другой § 1.8. Поверхности вращения Прил. 2.7. Поверхности второго порядка § 4.5. Поднятие индекса у тензора Прил. 4.4. Подпространство линейного пространства § 7.4. Полилинейный функционал § 9.6. Положительно определенный квадратичный функционал § 9.3. Полярная система координат § 4.6. Порядок алгебраической линии § 4.1. Порядок алгебраической поверхности § 4.2. Правило замыкающей § 1.2. Правило Крамера § 6.4. Правило треугольника § 1.2. Правило параллелограмма § 1.2. Преобразование плоскости § 5.2. Приведение квадратичного функционала к диагональному виду § 9.2, § 12.1. Приведение пары квадратичных функционалов к диагональному виду § 9.2, § 12.1. Приведение уравнения линии второго порядка на плоскости к каноническому виду § 4.4. Присоединенный оператор § 12.1 Произведение матриц § 5.1. Произведение операторов § 5.2. Произведение линейных операторов § 8.2. Произведение линейных операторов в матричной форме § 8.3. Произведение числа и линейного оператора § 8.2. Произведение числа и линейного функционала § 8.7. Произведение числа и матрицы § 1.1. Произведение числа и направленного отрезка § 1.2. Противоположный оператор § 8.2. Противоположный функционал § 8.7. Противоположный элемент линейного пространства § 7.1. 538 Аналитическая геометрия и линейная алгебра Прямая сумма подпространств линейного пространства § 7.4. Пучок плоскостей в пространстве § 3.3. Пучок прямых на плоскости § 3.2. Р Равенство векторов в координатной форме § 1.6. Радиус-вектор точки § 1.7. Развернутое представление матрицы § 1.1. Разложение определителей § 6.3. Разложение определителя 3-го порядка по столбцу или строке § 1.1. Размер матрицы § 1.1. Размерность линейного пространства § 7.2. Ранг линейного оператора § 8.4. Разность направленных отрезков § 1.2. Ранг матрицы § 6.5. Расстояние между скрещивающимися прямыми § 3.4. Расстояние между элементами в евклидовом пространстве § 10.1. Расстояние от точки до прямой на плоскости § 3.2. Расстояние от точки до прямой в пространстве § 3.4. Расстояние от точки до плоскости § 3.3. Расширенная матрица системы линейных уравнений § 6.6. Решение системы двух линейных уравнений с двумя неизвестными § 1.1. С Самосопряженный оператор § 10.7. Свертывание тензоров Прил. 4.3. Свойства аффинного преобразования плоскости § 5.4. Свойства векторного произведения векторов § 2.4. Свойства гиперболического параболоида Прил. 2.4. Предметный указатель 539 Свойства гиперболы Прил. 1.3. Свойства двуполостного гиперболоида Прил. 2.6. Свойства однополостного гиперболоида Прил. 2.5. Свойства операций сложения векторов и умножения вектора на число § 1.3. Свойства определителя матрицы n-го порядка § 6.2. Свойства параболы Прил. 1.4. Свойства собственных значений линейного оператора § 8.6. Свойства собственных векторов линейного оператора § 8.6. Свойства скалярного произведения векторов § 2.2. Свойства смешанного произведения векторов § 2.6. Свойства эллипса Прил. 1.2. Свойства эллипсоида Прил. 2.2. Свойства эллиптического параболоида Прил. 2.3. Связка плоскостей в пространстве § 3.3. Сигнатура квадратичного функционала § 9.3. Символ Кронекера § 2.3. Симметрирование тензоров Прил. 4.3. Симметрическая матрица § 1.1. Симметричный билинейный функционал § 9.1. Система n линейных уравнений с n неизвестными § 6.4. Система m линейных уравнений с n неизвестными § 6.6. Скалярное произведение векторов § 2.2, Прил. 4.5. Скалярное произведение элементов в евклидовом пространстве § 10.1. Сложение матриц § 1.1. Сложение векторов в координатной форме § 1.6. Сложение линейных операторов в матричной форме § 8.3. Сложение направленных отрезков § 1.2. Сложение тензоров Прил. 4.3. Смешанное произведение векторов § 2.6. Собственное значение (число) линейного оператора § 8.5. Собственный вектор линейного оператора § 8.5. Совместная система линейных уравнений § 6.6. Соглашение о суммировании § 1.4. Соотношение неопределенностей § 11.5. 540 Аналитическая геометрия и линейная алгебра Сопряженное линейное пространство § 8.7. Сопряженный оператор § 10.6. Сравнение матриц § 1.1. Сравнение направленных отрезков § 1.2. Среднее значение оператора § 11.4. Столбец элементов матрицы § 1.1. Строка элементов матрицы § 1.1. Сумма линейных операторов § 8.2. Сумма линейных функционалов § 8.7. Сумма подпространств линейного пространства § 7.4. Степень квадратной матрицы с целым неотрицательным показателем § 8.6. Сферическая система координат § 4.6. Сюръективное линейное отображение (сюръекция) § 8.4. Т Тензоры Прил. 4.2. Тензоры в евклидовом пространстве Прил. 4.4. Тензоры в ортонормированном базисе Прил. 4.5. Теорема Гамильтона–Кэли 8.6. Теорема Грама–Шмидта § 10.3. Теорема инерции квадратичных функционалов § 9.3. Теорема Кронекера–Капелли § 6.6. Теорема Лапласа § 6.3. Теорема о базисном миноре § 6.5. Теорема о полярном разложении § 10.8. Теорема о ранге матрицы § 6.5. Теорема об изоморфизме § 7.5. Теорема Фредгольма § 6.7, § 10.6. Тождественный оператор § 8.2. Точка пересечения прямой и плоскости § 3.4. Транспонирование матрицы § 1.1. Транспонирование произведения матриц § 5.1. Транспонирование тензоров Прил. 4.3. Тривиальная линейная комбинация векторов § 1.4. Предметный указатель Тригонометрическая форма записи комплексных чисел Прил. 3.0. У Угол между векторами § 2.2. Угол между элементами в евклидовом пространстве § 10.1. Умножение матрицы на число § 1.1. Умножение направленного отрезка на число § 1.2. Умножение вектора на число в координатной форме § 1.6. Умножение линейного оператора на число в матричной форме § 8.3. Умножение тензоров Прил. 4.3. Умножение тензоров на число Прил. 4.3. Унитарное пространство § 11.1. Унитарный оператор § 11.2. Уравнение плоскости в декартовой системе координат § 3.3. Уравнение прямой на плоскости в декартовой системе координат § 3.1. Уравнение пучка прямых на плоскости § 3.2. Условие коллинеарности векторов в координатной форме § 1.6. Условие компланарности векторов в координатной форме § 1.6. Условие ортогональности прямых на плоскости § 3.5. Условие ортогональности прямых в пространстве § 3.5. Условие ортогональности прямой и плоскости § 3.5. Условие параллельности прямых на плоскости § 3.1. Условие параллельности прямых в пространстве § 3.1. Условие параллельности прямой и плоскости § 3.1. Ф Фокальное свойство гиперболы Прил. 1.3. Фокальное свойство эллипса Прил. 1.2. 541 542 Аналитическая геометрия и линейная алгебра Формула Эйлера Прил. 3.0. Формулы перехода от одной системы координат к другой § 1.8. Формы задания плоскости в пространстве § 3.3. Формы задания прямой на плоскости § 3.2. Фундаментальная система решений системы линейных уравнений § 6.7. Фундаментальная матрица § 6.7. Функционал § 5.2. Х Характеристический многочлен линейного оператора § 8.5. Характеристическое уравнение линейного оператора § 8.5. Ц Цилиндрическая поверхность § 4.3. Цилиндрическая система координат § 4.6. Ч Частное решение системы линейных уравнений § 6.6. Численное значение ортогональной проекции на ось § 2.1. Э Экспоненциальная форма записи комплексных чисел Прил. 3.0. Экстремальные свойства квадратичных функционалов § 9.5. Элемент матрицы § 1.1. Элемент обратной матрицы § 6.3. Элементарные операции преобразования матрицы системы линейных уравнений § 6.8. Предметный указатель Эллипс § 4.4. Эллипсоид § 4.5. Эллиптический параболоид § 4.5. Эллиптический цилиндр § 4.5. Эрмитово сопряженный оператор § 11.2. Эрмитово самосопряженный оператор § 11.3. Эрмитов оператор § 11.3. Эрмитов функционал § 11.4. Эрмитова форма § 11.4. Я Ядро линейного оператора § 8.4. 543 . . . . . . , . . , . . . . .- 06.10.2011. 400 . . . 33,5. 60 « )» , ( 84 1/16. . . . 34,0. 141700, ., . ., 9 E-mail: rio@mail.mipt.ru _________________________________________________________ « 125412, , . » , .13, .2