Рис. 3.2 - Mathscinet.ru

реклама
Санкт-Петербургский государственный университет
аэрокосмического приборостроения
---------------------------------------------------------------------------------------------------
Л.А. Мироновский
ИНВАРИАНТЫ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
Текст лекций
Часть 1
1991
УДК 512.7
МИРОНОВСКИЙ Л.А. Инварианты математических моделей:
Текст лекций/ЛИАП.Л.,1991
32с.:ил.
Излагаются основы математической теории инвариантов.
Рассматриваются классические инварианты
линейных
отношению к изометрическим, аффинным
другим
ниям
евклидова
и
форм по
преобразова-
пространства.
Текст лекций предназначен для слушателей факультета повышения
квалификации преподавателей.
ОГЛАВЛЕНИЕ
1. ПОНЯТИЕ ИНВАРИАНТНОСТИ В НАУКЕ И ТЕХНИКЕ
3
2. ИСТОРИЧЕСКИЕ СВЕДЕНИЯ И ОПРЕДЕЛЕНИЕ ИНВАРИАНТОВ . . 12
2.1. Исторические сведения . . . . . . . . . . . . .. . 12
2.2. Определение инвариантов . . . . . . . . . . . .. . 16
3. КЛАССИФИКАЦИЯ ЗАДАЧ ТЕОРИИ ИНВАРИАНТОВ . .
3.1. Стандартные математические объекты
. . .. . 21
. . . . . .. . 21
3.2. Классические группы линейных преобразований . .. . 25
3.3. Основные задачи теории инвариантов
4. ИНВАРИАНТЫ ВЕКТОРОВ И ЛИНЕЙНЫХ ФОРМ
. . . . . .. . 28
. . . . . .. . 30
4.1. Определение инвариантов линейных форм и векторов . 30
4.2. Аффинные инварианты . . . . . . . . . . . . . .
. 31
4.3. Инварианты унимодулярного преобразования
. . .
. 33
4.4. Инварианты унипотентного преобразования . . . .
. 36
4.5. Инварианты ортогонального преобразования
. . .
. 38
ЗАКЛЮЧЕНИЕ . . . . . . . . . . . . .. . . . . . . .
. 41
Библиографический список . . . . . . . . . . . . . . . .
42
Постоянство такого родства Основной механизм Рождества.
И. Бродский. 24 декабря 1971 года.
1.ПОНЯТИЕ ИНВАРИАНТНОСТИ В НАУКЕ И ТЕХНИКЕ.
Понятие инвариантности и его различные модификации чрезвычайно широко используются в научных и технических дисциплинах. По своей распространенности и семантической перегруженности оно, пожалуй, сравнимо с понятиями модели и моделирования. Это понятие играет центральную роль во
многих математических и физических теориях, отражая наиболее фундаментальные свойства изучаемых объектов и явлений.
Под инвариантностью в широком смысле слова понимают неизменность,
сохраняемость чего-либо в процессе тех или иных преобразований. При этом
строгого определения инвариантности и инвариантов зачастую не даётся, особенно если речь идет о гуманитарных дисциплинах - истории, психологии, филологии и др. Можно привести много примеров использования понятия инвариантности в указанном смысле.
Например, В. И. Вернадский называл "инвариантом российской истории"
гигантскую авторитарную элитарно-бюрократическую суперсистему, проникшую во все поры общества и неизменно сохраняющую свои позиции со времён
петровских реформ до наших дней вопреки любым общественно-политическим
преобразованиям.
В биологии, зоологии, ботанике инварианты выступают в качестве признаков, используемых при решении задач классификации и систематики, которыми занимались ещё Аристотель, Линней, Кювье и Дарвин. К настоящему
времени в этих областях сложилось деление организмов на группы, поделённые в соответствии с установившимися принципами на таксоны (виды, роды,
отряды и т.п.). Отнесение организмов к тому или иному таксону производится
по набору признаков, остающихся неизменными (инвариантными) в пределах
данного таксона. В этот набор признаков (советский учёный-систематик профессор Мейен предложил называть его мероном от греческого слова "мера")
могут входить самые разные показатели - число тычинок у цветка растения,
число конечностей у животного, биохимические свойства и т.д. По существу
мерон представляет собой набор инвариантов, позволяющий описывать таксоны (задача классификации) и относить предъявленный организм к одному из
них (задача идентификации).
При этом необходимо, чтобы мерон был достаточно информативным
(представлял собой полный набор инвариантов). В противном случае возможны конфликтные ситуации, подобные той, о которой рассказывается в следующей истории. В античные времена неоднократно пытались дать определения
человеку, отделяющие его от остальных представителей животного мира.
Например, одна из древних дефиниций гласит: "Человек - это млекопитающее,
не имеющее мочек на ушах". Не избежал соблазна дать своё определение и
Платон, сформулировав его так: "Человек - это беспёрое двуногое животное".
Рассказывают, что в ответ на это Диоген принёс ему ощипанного петуха со
словами: "Вот человек Платона!".
Большое значение имеет выделение и изучение инвариантных показателей
организма в медицине при диагностике различных заболеваний и отклонений
от нормы. К наиболее известным инвариантам здесь относятся: нормальная
температура (36,6), артериальное давление, группа крови, число хромосом и др.
Более строгий смысл вкладывается в понятие инвариантности в естественных науках. В частности, в физике инвариантность выражается в форме различных законов сохранения, которые связывают переменные, характеризующие состояние физической системы. Например, инвариантом консервативной
механической системы является её полная энергия E  E k  E п , которая
остается постоянной при любых изменениях кинетической и потенциальной
энергий. Многочисленные инварианты, отражающие законы сохранения количества движения, вещества, тепла, заряда и т.д. часто встречаются в задачах
математической физики, электро-, гидро- и аэродинамики и других областях.
Отыскание подобных инвариантов составляет одну из главных задач
науки, и открытие каждого нового инварианта всегда представляло собой
научное событие. В начале 17 века таким событием было, например, открытие
Кеплером инвариантов движения небесных тел - полукубического инварианта
R 3 / T 2 ( R - радиус орбиты; Т -период обращения) и секториального инварианта S, равного площади сектора, заметаемого за единицу времени орбитальным вектором при движении планеты. Обе эти величины сохраняют постоянное значение для всех планет солнечной системы. В настоящее время в небесной механике известен целый ряд инвариантов такого рода - это так называемые первые интегралы уравнений движения небесных тел.
Понятие инвариантности широко используется и в технических науках.
Например, в традиционной теории автоматического управления инвариантными называются системы, выходные сигналы которых реагируют на управляющие входные воздействия, но нечувствительны к возмущающим воздействиям
и помехам. Задача синтеза таких систем имеет важное прикладное значение,
для её решения разработаны различные специальные методы.
В современной теории систем управления инвариантами называют характеристики динамических систем, остающиеся неизменными при определенных
преобразованиях этих систем. Например, передаточные нули системы инвариантны по отношению к введению в систему обратных связей, марковские параметры инвариантны к изменению базиса в пространстве состояний, инвариантные показатели управляемости и наблюдаемости (инварианты Кронекера)
не меняются при введении обратных связей по состоянию и произвольных ли-
нейных преобразованиях входов, выходов и переменных состояния. Значение
этих и других инвариантов существенно облегчает решение задач анализа динамических систем, синтеза систем управления с заданными характеристиками,
моделирования их на вычислительных машинах.
Наиболее полное и законченное развитие получила теория инвариантов в
классической математике. Она активно применяется в геометрии, алгебре, топологии, теории групп, теории чисел и многих других разделах математики.
При этом в математике инвариантом называется все то, что остаётся неизменным при некоторых преобразованиях математических объектов. Например,
длина вектора инвариантна к ортогональному преобразованию декартовой системы координат, собственные числа матриц инвариантны к преобразованиям
подобия, ранг системы векторов является инвариантом по отношению к произвольному линейному преобразованию пространства, дискриминант квадратного уравнения не меняет знака при линейной замене переменной. Все это примеры инвариантов соответствующих преобразований.
Во всех случаях инварианты представляют собой важные характеристики
системы, отражающие её самые существенные свойства. Поэтому изучение
любой системы, с какой бы целью оно не проводилось (анализ, моделирование,
управление, редукция), следует начинать с отыскания её инвариантов. В этом
смысле тория любого явления сводится к описанию его инвариантов и связей
между ними.
В частности, предметом школьной геометрии является изучение свойств
прямых, треугольников, окружностей и других фигур, инвариантных по отношению к изометрическим преобразованиям плоскости или пространства.
Знание инвариантов в данной предметной области может значительно облегчить решение теоретических и прикладных задач, приводя к экономии усилий, времени и вычислительных ресурсов. Проиллюстрируем это несколькими
простыми примерами.
Пример 1. (Задача о вписанном эллипсе). В данный параллелограмм ABCD
(рис.1.1. а) требуется вписать эллипс наибольшей площади.
а)
б)
A
В
С
В
D
А
в)
В
С
D
А
С
D
Рис.1.1
Стандартная процедура решения состоит в том, что на плоскости нужно ввести
систему координат, записать в ней уравнение эллипса, выразить его площадь
через координаты точек касания со сторонами параллелограмма, затем взять
производную, приравнять ее к нулю и найти корни полученного алгебраического уравнения.
Вряд ли перспектива выполнения описанных рутинных выкладок вызовет
у читателя энтузиазм. Теория инвариантов позволяет предложить изящное решение этой задачи, вообще не использующее вычислений.
Оно сводится к тому, что сначала с помощью аффинного преобразования
плоскости (о нем речь будет идти в разд.3) параллелограмм отображается в
квадрат (см. рис.1.1,б). Известно, что аффинное преобразование переводит эллипсы в эллипсы, а также сохраняет отношение длин и площадей (эти отношения являются его инвариантами). Среди всех эллипсов, вписанных в квадрат,
наибольшей площадью обладает круг, он касается середин сторон квадрата.
Выполняя обратное аффинное преобразование, получаем, что решением задачи
будет эллипс, касающийся середины сторон параллелограмма АВСD
( рис. 1,1, в). Поскольку аффинное преобразование сохраняет отношение площадей, то его площадь будет составлять такую же долю от площади параллелограмма, как площадь вписанного круга по отношению к площади квадрата,
т.е.  4  0,785 . Упрощение решения достигнуто за счет знания инвариантов
аффинного преобразования.
Пример 2. ("Игра 15"). В ряде широко известных игр, таких как "Игра
15", "Кубик Рубика" и др. требуется перевести головоломку из некоторого
начального состояния в заданное конечное. В частности в "Игре 15" требуется
перестановкой косточек с номерами 1,...,15 расположить их в естественном
порядке (рис.1.2). В своё время была
2
1
3
4
1
2
3
4
15
7
7
6
5
6
7
8
10
8
9
11
9
10
11
12
12
14
13
13
14
15
Рис. 1.2
объявлена большая премия за решение этой задачи, и миллионы людей во всём
мире потратили массу времени на поиски решения (как потом выяснилось, его
не существовало).
В каждой из таких игр существуют инварианты, знание которых либо облегчает поиск пути к цели (конечному состоянию), либо позволяет доказать,
что цель из данного начального состояния недостижима. Так в "игре 15" имеется инвариант J , который в зависимости от расположения косточек принимает
значение "0" или ''1" (для его вычисления надо определить, чётно или нечётно
число попарных перестановок косточек, отличающих начальное расположение
от требуемого). Если J=1, то конечная расстановка в принципе недостижима
(косточки невозможно расставить в естественном порядке). Из всего множества
начальных расстановок таким значением инварианта будет обладать ровно половила, т. е. 15!/2 (одна из таких расстановок и предлагалась публике).
Для кубика Рубика "неразрешимое" начальное состояние можно получить,
переклеив цветные наклейки на двух соседних элементарных кубиках.
Пример 3. (Задача о компьютерном вирусе). Рассмотрим сеть из 27 компьютеров, которая имеет вид кубической решетки размера 3х3х3 (рис.1.3).
Непосредственный обмен информацией возможен только между компьютерами, находящимися в соседних узлах решетки, так что компьютеры, находящиеся в 8 угловых вершинах куба, могут общаться только с тремя соседними; компьютеры, находящиеся в центре граней- с четырьмя соседними; а компьютер,
находящийся в центре куба -с шестью соседними. В центральную машину попадает компьютерный вирус, который полностью
выводит её из строя, после чего переходит в соседнюю машину и т.д. Повторно проходить через компьютер, уже выведенный из строя, вирус не может.
Спрашивается, может ли вирус вывести из строя все
27 компьютеров сети? Ответить на тот же вопрос для
случая кубической решетки 4х4х4, 5х5х5 и вообще
nxnxn.
Попытка решить задачу путем непосредственного построения траектории вируса, проходящего через
все компьютеры, к успеху не приводит, и после ряда
Рис.1.3
неудачных проб возникает подозрение, что вывести
из строя все компьютеры, начиная движение из центра невозможно. Однако строгое доказательство этого, основанное на полном
переборе всех траекторий, громоздко и ненаглядно, а при n>4 и вовсе затруднительно.
Ключ к решению, как и в предыдущих примерах, дает использование инварианта. Чтобы найти его, раскрасим мысленно центральный компьютер в белый цвет, шесть его соседей - в чёрный, их соседей - в белый и т.д. В итоге все
компьютеры оказываются раскрашенными в шахматном порядке, так что вирус, выведя из строя "белый" компьютер, обязательно попадает в "чёрный" и
наоборот. Всего на 27 компьютеров 13 окажутся "белыми", а 14 - "чёрными".
Рассмотрим равные траектории вируса и обозначим через J разность белых
и черных точек (компьютеров) на траектории. В зависимости от цвета началь-
ной точки и длины траектории число J (оно является инвариантом нашей задачи) может принимать значение -1, 0, +1. Тем самым все возможные траектории разбиваются на три класса эквивалентности, отвечающие этим трем значениям инварианта J. Будем называть траекторию, для краткости, белой или
черной, в зависимости от цвета её начальной точки, и чётной или нечётной в
зависимости от количества точек на ней.
Легко сообразить, что первый класс (для которого J = -1) будет образован
всеми чёрными нечетными траекториями, второй класс (для которого J = 0) белыми чётными, и третий класс (для него J = l) - белыми нечётными.
Траектория, проходящей через все 27 компьютеров, содержит 13 белых и
14 чёрных точек, характеризуется значением J=13-14=-1, т.е. может относиться
только к первому классу. Однако все траектории этого класса начинаются в
чёрной точке, что противоречит условию задачи. Следовательно вирус, начиная из центральной точки куба, не сможет вывести из строя все 27 компьютеров.
Фактически мы решили более широкую задачу - указали все начальные
точки вычислительной сети, для которых решение не существует (это 13 белых
точек), а также все точки, для которых оно существует (это 14 чёрных точек).
При этом сложную задачу построения конкретных траекторий мы заменили
простой задачей вычисления инвариантов этих траекторий.
Полученное решение без труда обобщается на случай кубической решетки
nxnxn, а также на другие регулярные конфигурации вычислительных сетей.
Пример 4. ( Инварианты статической обратной связи ). Объект
управления с известной передаточной функцией
Q0 ( p ) 
b p n 1    b1 p  b0
B( p)
 n n 1
A( p) p  a n 1 p n 1    a1 p  a 0
охвачен отрицательной обратной связью с коэффициентом k (рис.1.4).
Такая обратная связь изменяет корни характеристического уравнения,
устойчивость системы, её весовую функцию и другие свойства объекта.
Требуется найти характеристики объекта, остающиеся неизменными при
произвольном варьировании коэффициента обратной связи.
Определяя передаточную функцию замкнутой системы, получаем
Q1 ( p) 
Q0 ( p )
bn 1 p n 1    b1 p  b0
B( p)

 n
.
1  kQ0 ( p) A( p)  kB( p) p  (a n 1  kbn 1 ) p n 1    (a1  kb1 ) p  a 0  kb0
x
Q0(p)
-
k
Рис.1.4
y
Отсюда видно, что n параметров коэффициенты числителя передаточной функции не изменили своего
значения. То же самое можно сказать
о нулях системы, т.е. корнях полинома В(р).
Возникает вопрос - имеются ли другие параметры, инвариантные по отношению к статической обратной связи, независимые от указанных, и сколько
их? методы теории инвариантов позволяют получить исчерпывающий ответ на
этот вопрос.
Запишем коэффициенты передаточных функций Q0(p) и Q1(p) в виде матриц:
b
C0   0
a 0
b1  bn 1 
,
a1  a n 1 
 b0
C1  
a 0  kb0
b1

bn 1

.
a1  kb1  a n 1  kbn 1 
Эти матрицы связаны соотношением C1= TC0, где матрица преобразования Т
имеет вид
1 0
T 
.
k 1
Следовательно, задача свелась к нахождению инвариантов прямоугольной матрицы по отношению к умножению её на треугольную матрицу Т с единичной
диагональю (в линейной алгебре такое преобразование называется унипотентным). Из классической теории инвариантов известно, что искомыми инвариантами кроме эллементов первой строки матриц С являются её миноры второго
порядка
bi
bj
bi b j

,
i, j  0, n  1 .
a i  kbi a j  kb j a i a j
2
Общее число этих миноров равно C n , однако среди них лишь n-1 независимых, поэтому общее число инвариантов составляет N0 = 2n-1. В качестве них
может быть взят следующий набор величин:
b0 , b1 ,  , bn 1 ,
b0
a0
b1
b
,, 0
a1
a0
bn 1
.
a n 1
Все остальные инварианты статической обратной связи могут быть выражены
через эти величины.
Здесь, как и в предыдущих случаях, решение получено за счёт использования информации об инвариантах (подробнее вопрос об инвариантах унипотентного преобразования рассматривается в разд.4).
Рассмотренные примеры, несмотря на их простоту, демонстрируют
общую идею применения теории инвариантов при решении прикладных задач.
Она состоит в том, что нужно указать и описать группу допустимых преобразований задачи и отыскать её инварианты, после чего можно рассчитывать на
значительное упрощение процедуры решения.
Очевидно, что для успешного применения этой идеи на практике необходимо иметь запас знаний об инвариантах часто встречающихся математических
преобразований. Богатая информация о таких инвариантах, накопленная в рамках классической теории инвариантов и теории линейных динамических систем, к сожалению, плохо освещена в технической литературе и крайне слабо
используется инженерами и специалистами.
В настоящей работе излагаются некоторые результаты теории инвариантов, которые могут быть использованы в приложениях, в том числе при построении математических моделей реальных объектов, их преобразовании, редукции и реализации на ЭВМ.
Отдельные сведения об инвариантах динамических систем содержатся в
учебных пособиях [1-3], систематическое изложение теории инвариантов имеется в учебнике Гуревича [4], однако использование тензорного языка при изложении значительно затрудняет его чтение. Ещё менее доступны для понимания инженерами современные математические книги по теории инвариантов
[5,6], свидетельствующие о возрастании интереса математиков к этой области.
Но может быть находится как раз
К их голосам в пропорции ваш вес.
И. Бродский. Anno Domini.
2. ИСТОРИЧЕСКИЕ СВЕДЕНИЯ И ОПРЕДЕЛЕНИЕ ИНВАРИАНТОВ
2.1. Исторические сведения
Возникновение теории инвариантов как математической дисциплины относится к середине 18 века, хотя отдельные разрозненные результаты по инвариантам были известны и ранее. Так Лагранж ещё в 18 веке, исследуя представление целых чисел квадратичными формами вида
Q( x, y)  ax 2  2bxy  cy 2
(2.1)
обнаружил, что при замене переменных x = x' + y все коэффициенты квадратичной формы изменяются, однако их комбинация вида  = ac – b2 остается
неизменной(1773г.). Эта величина, получившая название дискриминанта квадратичной формы (она совпадает с обычным дискриминантом квадратного
трехчлена, получаемого из (2.1) при у = 1), является единственным инвариантом формы (2.1).
Спустя четверть века Гаусс рассматривал произвольные линейные замены
переменных в бинарной форме (2.1) и в тернарной форме
Q( x, y, z)  ax 2  by 2  cz 2  2dxy  2exz  2 fyz
(2.2)
Он показал, что при этом дискриминант умножается на квадрат определителя матрицы, описывающей замену переменных (1801 г.).
Обобщение этого результата на случай квадратичной формы от произвольного числа аргументов
Qx1 , , x n  
n
a
i , j 1
ij x i x j
(2.3)
было получено через 16 лет в работах Бине и Коши с помощью теоремы об
определителе произведения матриц. В современных обозначениях их результат
сводится к следующему. Запишем квадратичную форму (2.3) в матричных обозначениях
Q( X )  X T AX ,
X  ( x1 , , x n ) .
(2.4)
После замены переменных Х = GY о матрицей G получаем
Q(Y )  Y T AY ,
A  G Tt AG.
Вычислим определитель матрицы А':
A  G T AG  G T A G  G
2
A.
(2.5)
Таким образом, определитель квадратичной формы (именно он является
её дискриминантом) при замене переменных с матрицей G действительно
умножается на квадрат её определителя. В терминах теории инвариантов
он представляет собой относительный инвариант порядка два. Отсюда легко
получается результат Лагранжа, поскольку для бинарной квадратичной формы
(2.1) имеем
a b 
A
,
b c 
1  
G
,
0 1 
IGI  1,
  IGI  ac  b 2 ,
т.е. в данном случае определитель квадратичной формы представляет собой
абсолютный алгебраический инвариант (так в теории инвариантов называют
алгебраические выражения из коэффициентов форм, не меняющиеся при замене переменных).
Другое направление, предшествовавшее созданию теории инвариантов,
связано с исследованиями в области проективной геометрии, выполненными в
первой половине 19 века Понселе, Плюккером, Мебиусом и другими математиками. Именно в это время сформировался взгляд на евклидову и аффинную
геометрии как частные случаи проективной, сформулированный Кэли в виде
броского утверждения: "Проективная геометрия - это вся геометрия". Согласно нему евклидова геометрия изучает свойства фигур, сохраняющиеся при их
ортогональном проектировании, аффинная при цилиндрическом, а проективная
- при коническом проектировании. Типичным инвариантом 1-го из этих преобразований является длина отрезка (метрический инвариант). Цилиндрическое
проектирование уже не сохраняет длин отрезков, но сохраняет их отношение,
которое является аффинным инвариантом. Наконец, при коническом проектировании не сохраняется ни длины отрезков, ни их отношения, но сохраняется
"отношение отношений" - так называемое двойное или сложное отношение.
Оно представляет собой основной проективный инвариант и занимает центральное место в теоремах проективной геометрии.
Наиболее последовательно и убедительно взгляд на любую геометрию
(включая неевклидовы) как науку о инвариантах геометрических объектов относительно некоторой группы преобразований был развит впоследствии в знаменитой лекции Феликса Клейна, прочитанной им в 1872 г. при вступлении в
должность профессора университета в Эрлангене ( Клейну было тогда всего 23
года!).
Окончательное становление теории инвариантов принято связывать с работами Дж. Буля (сегодня имя этого математика более известно в связи с булевой алгеброй), Дж. Сильвестра и А. Кэли, выполненными в 1840-1850 гг.. В
это время был открыт закон инерции Сильвестра для квадратичных форм, создано исчисление гипердетерминантов Кэли, введены понятия ковариантов комитантов и других разновидностей инвариантов (сам термин "инвариант" впервые был введен Дж. Сильвестром в1851 г.).
Тогда же Кэли сформулировал общую проблему об отыскании базиса
алгебраических инвариантов, т. е. такого конечного набора инвариантов
J1,…,JN, чтобы всякий другой инвариант J мог быть выражен в виде многочлена
от них
J  P J 1 ,  , J N  .
(2.6)
При этом под инвариантом, в свою очередь, понимался некоторый многочлен
от коэффициентов исследуемой формы или системы форм, не меняющийся при
заданных преобразованиях переменных.
Говоря языком современной алгебры, множество инвариантов образует
кольцо (если J1, J2- инварианты, то ими будут и J1+ J2, J1 J2 и т. д.), поэтому
проблема Кэли состоит в отыскании конечного числа образующих этого кольца.
Первый наиболее значительный результат в этом направлении получил
немецкий математик П.Гордон, который в 1868г. доказал, выполнив массу трудоемких алгебраических преобразований, существование такого базиса для бинарных форм произвольного порядка r , т.е. форм вида
Q( x, y)  a r x r  a r 1 x r 1 y    a1 xy r 1  a0 y r .
(2.7)
Базисный инвариант для случая r = 2 был указан выше - это найденный Лагранжем дискриминант квадратичной формы (2.1). При r = 3 у бинарной кубической формы
Q( x, y)  ax 3  3bx 2 y  3cxy 2  dy 3
(2.8)
также имеется только один базисный инвариант-дискриминант этой формы
  3b 2 c 2  6abcd  4b 3 d  4ac 3  a 2 d 2 .
При r > 3 число базисных инвариантов бинарных форм определяется формулой
N = г - 2. За свой результат Гордан был удостоен современниками титула "короля инвариантов".
Отметим, что инварианты бинарных форм удобно выражать через корни
х1,.... хn полинома Q(х,1), получаемого из формы (2.7) при y = 1.
В частности для дискриминанта квадратичной формы (2.1) получаем
выражение  =ac – b2 = a2 (x1 – x2)2, а для дискриминанта кубической формы
(2.8) - выражение  = a4(x1 – x2)(x2 – x3)(x3 – x1).
Далее на протяжении нескольких десятилетий активно велись работы по
поиску инвариантов различных форм и их сочетаний по отношению к равным
линейным преобразованиям, в результате чего был накоплен богатый "запас"
инвариантов. Однако все полученные результаты носили частный характер и,
поставленный Кэли вопрос о существовании конечного базиса инвариантов в
общем случае оставался открытым.
Получить общий ответ на него удалось лишь Давиду Гильберту, который в
1890-93гг.(ему было тогда около 30 лет) доказал две фундаментальные теоремы, полностью решающие проблему Кэли. Эта работы Гильберта произвели
ошеломляющее впечатление на математиков и сразу принесли ему мировую
известность. Здание классической теории инвариантов оказалось практически
завершенным и долгие годы никто из математиков не рисковал работать в этой
области. Их можно было понять - все "решаемые" задачи были решены, а немногие оставшиеся выглядели настолько "неподъемными", что не сулили шансов на успех.
К ним относилась, в частности, одна из 23 знаменитых проблем Гильберта,
поставленных им летом 1900г. на втором международном конгрессе математиков. Речь идет о 14-й проблеме, в которой предлагалось подтвердить (или
опровергнуть) гипотезу о конечности рационального базиса инвариантов для
произвольной подгруппы общей линейной группы.
Эта проблема оставалась нерешенной более полувека, пока в 1958г. японскому математику Нагате не удалось построить опровергающий её контрпример. В настоящее время теория инвариантов вновь начинает привлекать внимание математиков, о чем свидетельствует появление ряда монографий и научных статей (см. например [5,6]).
В целом значение теории инвариантов в математике очень велико и отнюдь не сводится к полученным конкретным результатам. Об этом убедительно свидетельствует следующая цитата, взятая из "математического энциклопе-
дического словаря" ( М.,1988,с.226): "Концепция инвариантов является одной
из важнейших в математике, поскольку изучение инвариантов непосредственно
связано с задачами классификации объектов того или иного типа. По существу,
целью всякой математической классификации является построение некоторой
полной системы инвариантов (по возможности наиболее простой), т.е. такой
системы, которая разделяет любые два неэквивалентных объекта из рассматриваемой совокупности".
Для прикладных исследований - теории моделирования, распознавания
образов, управления, идентификации, классификации, технической диагностики - основной интерес представляет именно классическая теория инвариантов.
Она дает в руки инженерам полезную методологию и математический инструмент, которые позволяют успешно решать многие технические задачи.
В связи с этим далее главное внимание уделяется алгебраическим инвариантам стандартных математических объектов - векторов, линейных и квадратичных форм, матриц - по отношению к линейным преобразованиям.
2.2. Определение инвариантов
Существует два равноправных подхода к определению инвариантов. Согласно первому из них рассматривается множество М , на котором задана
группа преобразований G. Это означает, в частности, что в результате действия
любого преобразования g из группы G на элемент m множества M вновь будет
получен элемент того же множества, что формально записывается следующим
образом:
gm  M ,
 m  M ,  g G .
Из обычных свойств группы вытекает, что если g1 , g2  G, то и g3 = g1 g2  G.
Кроме того, группа наряду с каждым элементом gG содержит обратный
g -1G и единичный элемент g -1 g = е , такой что em = m .
Например, если M - это множество n - мерных векторов, а G - множество
квадратных невырожденных матриц, то роль единичного и обратного элементов играют единичная и обратная матрицы. Если М - множество треугольников
на плоскости, а G - вращения плоскости, то элементу g , задающему поворот на
угол , будет соответствовать элемент g -1, задающий поворот на угол - ,
а g -1 g = е будет означать поворот на нулевой угол.
Определение 1. Функция  , задающая отображение множества М на
вещественную ось R, : М  R, называется инвариантом группы G на множестве М , если для любых m  M , g  G выполняется равенство (gm) = (m) .
Например, в упомянутом случае треугольников на плоскости в качестве
функции  может выступать площадь треугольника или его периметр.
При втором подходе к определению инвариантов группа G явно не вводится, а вместо этого на множестве М задается разбиение на непересекающиеся
классы M1, M2 … эквивалентных элементов (рис.2.1). Обычно такое разбиение
задается путем введения отношения эквивалентности , которое должно удовлетворять стандартным требованиям рефлексивности, симметричности и
транзитивности. Обозначая эквивалентность значком , эти требования кратно
записываются следующим образом:
1) m  m; 2) m1  m2  m2  m1 ; 3) (m1  m2, m1  m2)  (m1  m3).
Последнее соотношение (транзитивность)
можно интерпретировать как правило "друг
моего друга – мой друг". Такое отношение
приводит к однозначному разбиению множества М на непересекающиеся классы эквивалентности.
М
Мi
М1
М2
…
…
mi
Рис.2.1
Например, рассматривая треугольники на плоскости в объявляя любые два
треугольника с одинаковыми углами эквивалентными, получаем разбиение
множества треугольников на подобные. Все треугольники, подобные данному,
будут образовывать один класс эквивалентности.
Определение 2. Функция , задающая отображение множества М на вещественную ось R, : МR, называется инвариантом отношения эквивалентности  на множестве М , если для любой пары эквивалентных элементов
mi, mj  М , справедлива импликация
mi  mj  (mi) = (mj),
согласно которой эквивалентность элементов влечет за собой равенство инвариантов.
Иногда используется другая (равносильная) формулировка определения 2,
согласно которой функция  называется инвариантом, если она постоянна на
классах эквивалентности.
Показать равносильность определений 1 и 2 удобнее всего с помощью понятия орбиты. Орбитой элемента mi (на рис. 2.1 она условно показана линией
со стрелкой) называют подмножество Mi  M всех элементов вида gmi, где g
пробегает все значения из группы G . Кратко это записывают как Mi = G(mi).
Определяя отношение эквивалентности на множестве М равенством gmi ~ mi,
получаем разбиение множества M на классы эквивалентности, которыми являются орбиты. Тем самым показано, что задание группы G на множестве M индуцирует введение на нем отношения эквивалентности. Обратное утверждение
тоже верно – всякое отношение эквивалентности на множестве М задает связанную с ним группу преобразований G (действие этой группы не будет выводить элементы из их классов эквивалентности).
В связи с определением 2, возникает вопрос: можно ли по равенству инвариантов судить об эквивалентности элементов ? Очевидно, что в общем случае
это не так. Например, из равенства площадей треугольников или их периметров
(это инварианты евклидовой геометрии) никак не следует равенство самих треугольников, изменить положение можно, взяв достаточно представительный
набор инвариантов.
Определение 3. Набор инвариантов 1,…,N отношения эквивалентности 
на множестве M называется полным, если из равенства инвариантов двух элементов следует их эквивалентность
 mi , m j  M : (mi m j )  ( k (mi )   k (m j )) ,
k  1, N .
В примере с треугольниками полная система инвариантов должна содержать
как минимум три величины - например, длины трех сторон, либо площадь треугольника, его периметр и произведение длин сторон и т.д. С этой точки зрения
известные школьные теоремы о равенстве треугольников по двум сторонам и
углу и родственные им сводятся как раз к указанию различных полных наборов
инвариантов.
Исключив из полного набора зависимые инварианты, всегда можно придти
к минимальному полному набору инвариантов, т.е. к набору, удаление из которого любого инварианта приводит к потере свойства полноты.
Следующее понятие, которое нам нужно ввести, связано с базисом инвариантов. Во многих практически важных случаях инварианты представляют
собой рациональные алгебраические функции от коэффициентов или координат исследуемого объекта, т.е. имеют вид полиномов от этих коэффициентов,
примерами могут служить дискриминанты квадратичных форм (2.1),(2.2) и кубичной формы (2.3). Такие инварианты называются алгебраическими.
Зададим на множестве инвариантов операции сложения и умножения. Это
позволяет наряду с исходными алгебраическими инвариантами 1,…,N рассматривать любые произведения вида 1  2 ... N , а также их линейные
комбинации, каждая из которых также будет алгебраическим инвариантом. Тем
r1
r2
rN
самым множество инвариантов наделяется алгебраической структурой кольца
(и даже алгебры).
Определение 4. Набор алгебраических инвариантов 1,…,N называется
базисом, если всякий другой алгебраический инвариант  выражается через него рациональным образом, т. е. в виде некоторого многочлена  = Р(1,…,N) .
При этом базисные инварианты 1,…,N играют роль образующих кольца
или алгебры инвариантов I (такая алгебра называется конечнопорожденной) .
Всякий базисный набор обязательно будет обладать свойством полноты в
смысле определения 3, но может не обладать свойством минимальности. В общем случае элементы базисного набора не являются функционально независимыми и могут быть связаны некоторыми полиномиальными соотношениями
вида
F  (1 , ,  N )  0 ,
(2.9)
которые тождественно обращаются в нуль при подстановке в них выражений
для 1,…,N. В классической теории инвариантов такие соотношения называются сизигиями ("сизигия" в переводе на русский как раз и означает "отношение"). В современной терминологии наличие сизигий означает, что алгебра инвариантов I не является свободной алгеброй.
Рассмотрим теперь наряду о полиномами (2.9) их суммы и произведения,
которые также будут полиномами. Это приводит к полиномиальному кольцу
сизигий, в котором также можно выделить конечное число базисных элементов
- образующих этого кольца. В свою очередь, эти базисные элементы вновь могут оказаться связанными некоторыми полиномиальными соотношениями - так
будут определены вторые сизигии и т.д.
В связи с этим при изучении инвариантов группы Q на заданном множестве U возникает два принципиальных вопроса: существует ли конечный базис
инвариантов и конечна ли цепь сизигий ?
Классическая теория инвариантов дает положительные ответы на оба эти
вопроса для случая, когда множество M образовано однородными многочленами произвольной степени r от любого числа переменных n, т.е. n - арными
формами степени г, а группа G задает произвольную невырожденную линейную замену переменных. В этом случае, как утверждает 1-я основная теорема
теории инвариантов, всегда существует конечный базис, т.е. полиномиальное
кольцо инвариантов порождается конечным числом образующих. Ив 2-й основной теоремы теория инвариантов следует, что если конечен базис инвариантов, то и базис сизигий конечен. Оба доказательства конструктивны, т.е.
имеется возможность (по крайней мере теоретическая), проделав необходимые
выкладки, построить как все базисные инварианты, так и все сизигии.
Следует заметить, что в практических задачах множество M и группа G
далеко не всегда бывает такими простыми и приятными, как в классической
теории инвариантов, поэтому во многих случаях ответы на оба вопроса неизвестны или отрицательны.
Например, при исследования параметрических инвариантов динамических
систем в качестве множества М может рассматриваться множество линейных
динамических систем, а в качестве группы G - группа линейных преобразований переменных состояния. При изучении сигнальных инвариантов динамических систем множеством M могут служить различные геометрические многообразия (линии, поверхности), а действие группы G характеризуется фазовым
потоком соответствующей динамической системы, порождающей некоторую
группу Ли.
Далее нас будет интересовать только классический случай, когда существование конечных базисов инвариантов и сизигий гарантируется. При этом
возникает ряд задач, связанных с отысканием и исследованием базисных наборов. Их описанию посвящён следующий раздел.
... и взявши лупу,
я обнаружил группу
И. Бродский. Бабочка
3. КЛАССИФИКАЦИЯ ЗАДАЧ ТЕОРИИ ИНВАРИАНТОВ
3.1. Стандартные математические объекты
Определение инвариантов, данное в предыдущем разделе, носит достаточно общий характер, поскольку в нем не оговаривается ни вид множества изучаемых объектов, ни группа выполняемых над ними преобразований. При дальнейшем наложении мы ограничимся рассмотрением классической теории инвариантов, которая занималась изучением свойств однородных алгебраических
форм различных степеней (линейных, квадратичных и т.д.), и ряда других математических объектов (векторов, матриц, тензоров), сохраняющихся при линейных заменах переменных.
Как правило, эти объекты и их инварианты допускают наглядную геометрическую интерпретацию, которой удобно пользоваться при изложении.
Например, бинарной квадратичной форме (2.1) соответствуют линии второго
порядка на плоскости, которые в зависимости от знака инварианта (дискриминанта) распадаются на три класса - эллипсы (при  > 0), гиперболы (при  < 0)
и скрещенные прямые (при  = 0).
Бинарной кубической форме (2.8) соответствуют плоские кривые третьего
порядка, бинарной форме (2.7) - алгебраические кривые порядка r. Аналогично,
квадратичной форме (2.3) отвечают поверхности второго порядка в n- мерном
евклидовом пространстве Rn- эллипсоиды, гиперболоиды и др. Во всех случаях
знание инвариантов позволяет провести исчерпывающую классификацию этих
кривых и поверхностей, относя равные их типы к равным классам эквивалентности.
Таким образом, при геометрическом подходе элементами множества М
выступают различные геометрические объекты n-мерного евклидова пространства Rn. Действие группы G сводится к линейному преобразованию этого пространства. Если в пространстве Rn ввести координатные оси x1,...,xn, то его произвольное невырожденное линейное преобразование может быть описано формулой
X   GX ,
(3.1)
где G - матрица преобразования размера n x n с ненулевым определителем
G  0 . Обратное преобразование описывается формулой
X  HX ,
H  G 1 .
(3.2)
Разнообразие задач теории инвариантов определяется тем, что с одной
стороны мы можем рассматривать различные виды объектов в пространстве
Rn- точки, векторы, плоскости, поверхности, операторы, а также их сочетания,
а с другой стороны - различные группы линейных преобразований - изометрические, унимодулярные, аффинные и др.
В общем случае такие преобразования могут изменять длины векторов и
углы между ними, форму геометрических фигур и другие характеристики геометрических и алгебраических объектов, заданных в пространстве. Совокупность инвариантов преобразования, т. е. числовых характеристик изучаемых
объектов, которые не меняются при преобразовании (3.1), зависят как от самих
объектов, так и от вида матриц G , используемых в этом преобразовании. Выясним сначала, как действует преобразование (3.1) на стандартные математические объекты в пространстве Rn.
1) Простейшим объектом такого рода является совокупность конечного
числа точек или соответствующих векторов а1,... ,аk пространства Rn. Поскольку две точки задают отрезок, три - треугольник и т. д., то это эквивалентно рассмотрению множества М , включающего стандартный набор плоских геометрических фигур и пространственных тел. Под действием преобразования (3.1)
векторы а1,...,аk , заданные своими координатами в базисе х1,...,xn , перейдут в
векторы а1,... ,аk, вычисляемые по формулам
ai  Gai ,
i  1, k .
(3.3)
Если из координат векторов аi составить прямоугольную матрицу A  a1 ,..., a k 
размеров n x к , то она будет преобразовываться по формуле
A  GA ,
(3.4)
представляющей собой матричную запись соотношений (3.3).
2) Двойственным объектом по отношению к системе точек является
система линейных форм
L1  a11 x1    a in x n
.......... .......... .......... ..........
Lk  a k1 x1    a kn x n
(3.5)
Геометрически каждая из форм описывает гиперплоскость с направляющим
вектором a i  a i 1 ,..., a in  , а их совокупность задает пересечение гиперплоскостей.
Матричная запись уравнений (3.5) имеет вид
T
L  AX ,
где А - матрица коэффициентов системы (3.5); L - вектор-столбец с компонентами Li.
Подставляя сюда вместо Х его значение из (3.1) Х = G-1 X', получаем
L  AT X T ,
A  AG1  AH .
(3.6)
Следовательно, в данном случае матрица А при переходе к новым координатам
преобразуется с помощью обратной матрицы преобразования G-1 .
3) Следующий по сложности объект - это квадратичные формы. Как
уже отмечалось, они задают в пространстве Rn различные гиперповерхности
второго порядка. Общий вид квадратичной формы от n переменных
задается формулой (2.3), её матричное описание имеет вид
Q  X T AX ,
где А - симметричная матрица n-го порядка. Подставляя вместо Х его
значение из (3.2) Х = Н X' , получаем
Q  ( X )T AX ,
A  H T AH
(3.7)
Последнее соотношение можно также переписать в форме A = GT А' G .
Это означает, что матрицы А и А' связаны конгруэнтным преобразованием.
4) Кроме рассмотренных объектов, в линейной алгебре и аналитической
геометрии изучаются линейные операторы. При фиксированном базисе в пространстве Rn линейный оператор, осуществляющий отображение пространства
на себя, задается квадратной матрицей А, а само отображение описывается
формулой
Y=AX
(3.8)
которая сопоставляет каждому вектору XRn вектор YRn . При преобразовании пространства согласно (3.1), (3.2) имеем X' = G Х , Y' = GY , или Х = Н X' ,
Y = Н Y', откуда
Y   AX ,
A  H 1 AH  GAG1.
(3.9)
Такое преобразование матрицы линейного оператора называется подобным. Оно не изменяет след и определитель матрицы, которые являются примерами его инвариантов. Это преобразование часто встречается при решении
прикладных задач, описываемых линейными алгебраическими или дифференциальными уравнениями.
Мы описали действие группы линейных преобразований пространства на
четыре стандартных математических объекта - векторы, линейные и квадратичные формы и линейные операторы. Изученные результаты сведены в
табл.3.1, в которой указан вид преобразуемых объектов, результат преобразования (матрица Н определена равенством (3.2)) и его название.
Таблица 3.1
Действие преобразования (3.1) на математические объекты.
Объект
Вектор
Квадратичная форма
a
Линейная
форма
L = cX
QT  XAX
Линейный
оператор
Y = AX
Исходное описание
Результат преобразования
Вид преобразования
a   H 1 a
c   cH
A  H T AH
A  H 1 AH
Конгруэнтное
Подобное
Контравариантное
Ковариантное
Термины ковариантный и контравариантный означают, что в одном случае
преобразование осуществляется по той же формуле, что и для базисных векторов пространства, а в другом - по обратным формулам.
Определение полных систем инвариантов указанных объектов относятся к
числу базовых задач теории инвариантов. Более сложными являются задачи
отыскания совместных инвариантов совокупностей рассмотренных стандартных объектов - квадратичной формы и вектора, пары квадратичных форм, линейного оператора и системы векторов и т.д.
Задачи такого типа часто возникает в приложениях. Проиллюстрируем
это характерным примером, связанным с моделированием n-мерной линейной
динамической системы с входом U и выходом у, заданной своим описанием в
пространстве состояний
X  AX  bu ,
y  cX ,
(3.10)
где Х - вектор состояния; А - квадратная матрица n - го порядка;
b - вектор-столбец; с - вектор строка.
Выполняя замену переменных Х = Н X' получим описание эквивалентной модели, которая может оказаться удобнее для моделирования, нежели исходная
X   AX   bu ,
y  cX ,
где матрицы новой системы определяются равенствами
A  H 1 AH,
b  H 1b,
c  cH.
Следовательно задача об отыскании инвариантов системы (3.10) относительно линейной замены переменных сводится к определению совместных инвариантов вектора b, линейной формы у = c X, и линейного оператора А, т. е.
совместных инвариантов ковариантного, контравариантного и подобного преобразования.
3.2. Классические группы линейных преобразований
Многочисленность задач теории инвариантов определяется не только разнообразием исследуемых объектов (т.е. рассмотрением различных множеств
К), но и разнообразием используемых преобразований (т.е. рассмотрение различных групп G). Здесь мы также ограничимся изучением четырех стандартных случаев, рассмотрев четыре наиболее употребительные группы вещественных линейных преобразований.
1) Полная линейная группа GL(n), называемая также центроаффинной
группой. Она образована всеми невырожденными квадратными матрицами G
n-го порядка, т.е. матрицами, удовлетворяющими условию G  0 . Число свободных параметров группы N равно числу элементов матрицы G, т.е. N = n2.
Такая группа называется n2-параметрической.
Действие центроаффинного преобразования на плоские геометрические фигуры поясняется рис.3.1. Оно не сохраняет углы, длины, площади, но сохраняет
параллельность, а также общий вид геометрической фигуры - треугольники переходят в треугольники , параллелограммы в параллелограммы, эллипсы в эллипсы и т. д.
GL(2)
Рис. 3.1
2) Специальная линейная группа SL(n), называемая также унимодулярной
группой. Она отличается от группы GL(n) заменой условия G  0 на условие
G  1 , т. е. образована матрицами с единичным определителем. Благодаря этому свойству обеспечивается сохранение площадей (объемов) геометрических
фигур. Число свободных параметров этой группы на 1 меньше, чем у полной
линейной группы, т. е. равно N = n2 - 1.
3) Унипотентная группа Т(n), образованная верхними треугольными матрицами с единичной диагональю. Определители таких матриц равны единице,
поэтому унипотентные матрицы одновременно являются унимодулярными.
Название группы связано о тем, что характеристический полином любой матрицы GТ(n) имеет вид (-1)n; т.е. все её собственные числа равны единице.
Число свободных параметров этой группы равно числу наддиагональных элементов матрицы, т.е. N = n(n-1)/2. Каждая из перечисленных групп является
подгруппой предыдущей: T(n)  SL(n)  G(n). Пример действия группы Т(n) на
различные геометрические фигуры показан на рис. 3.2.
=-2
0
Рис. 3.2
4) Ортогональная группа O(n), образованная всеми ортогональными матрицами
n-го порядка, т.е. матрицами, удовлетворяющими условиям GTG = E. Определители таких матриц равны +1 или -1. С геометрической, точки зрения эта
группа осуществляет различные вращения пространства и зеркальные отображения, т.е. преобразования, не изменяющие длины векторов. Число свободных
параметров ортогональной группы такое же, как у унипотентной группы
N = n (n-l)/2. В частности для группы 0(3) получаем N = 3, что соответствует
трем углам Эйлера, характеризующим произвольный поворот тела в трехмерном пространстве.
Приведенные данные о числе свободных параметров четырех классических групп сведены в табл. 3.2,где кроме того указаны названия групп, их обозначения и ограничения на элементы.
Характеристика классических групп
Таблица 3.2
Название
группы
Обозначения
Полная линейная
GL(n)
Специальная
линейная
SL(n)
Унипотентная
Ортогональная
T(n)
0(n)
Определяющие
условия
Число параметров N
IGI=0
IGI=0
GTG=E
n2
n2-1
gij =1, j<1
gii =1
n(n-1)/2
n(n-1)/2
Кроме перечисленных, к классическим группам относят ещё специальную
ортогональную группу, унитарную, симплектическую, и некоторые другие.
Можно также рассматривать отдельные подгруппы приведенных групп,
например, группу масштабных преобразований, задаваемых диагональными
матрицами, группу гомотетий (преобразований подобия), задаваемых скалярными матрицами, симметрическую группу, задаваемую матрицами перестановок и др.
3.3. Основные задачи теории инвариантов
Перейдем к поиску инвариантов разных геометрических и алгебраических
объектов, подвергающихся действию различных групп.
Даже если ограничиться рассмотрением четырех перечисленных групп
преобразований для четырех стандартных математических объектов, включенных в табл. 3.1 , то получается 16 базовых задач теории инвариантов. Если же
рассмотреть другие классические группы и более сложные математические
объекты, то его число возрастает до нескольких десятков.
Сформулируем четыре основные вопроса, возникающие при решении
каждой из получающихся таким образом задач. Они сводятся к следующему.
1) Описание полной системы относительных и абсолютных инвариантов.
2) Определение числа независимых инвариантов и построение базисной
системы инвариантов.
3) Отыскание соотношений, связывающих базисные инварианты.
4) Определение простейшего вида, к которому можно привести исследуемый
математический объект с помощью рассматриваемой группы
преобразований, т.е. построение канонических форм.
В этот перечень не включены вопросы о существовании и конечности базисов инвариантов и сизигий, об отыскании критериев эквивалентности объектов относительно рассматриваемой группы преобразований, о вычислении
матриц перехода, связывающих эквивалентные объекты, о решении обратных
задач теории инвариантов и некоторые другие.
Классификация задач теории инвариантов по трем рассмотренным признакам - виду множества М, типу группы G и цели исследования представлена на
рис. 3.3. Она отражает 4  4  5  80 различных задач.
Векторы
GL(n)
Классическая
теория инвариантов
Линейные
операторы
SL(n)
Множество М
Группа G
Квадратичные формы
0(n)
Цель исследования
Линейные
операторы
Поиск инвариантов
Критерии эквивалентности
Канонические формы
T(n)
Построение
базиса
Поиск сизигий
Рис. 3.3
В следующем разделе излагаются результаты решения части из них для
случая, когда исследуемый объект представляет собой совокупность векторов
либо линейных форм (см. левую часть рис.3.3). В обоих случаях требуется
найти полную систему инвариантов по отношению к каждой из групп линейных преобразований, перечисленных в правой части рис. 3.3 (аффинной, унимодулярной, ортогональной и треугольной), а также ответить на другие вопросы, указанные в его нижней части, в первую очередь о критериях эквивалентности объектов, базисе инвариантов и системе сизигий.
Там тот, кто впереди
похож на тех, кто сзади
К. Бродский. Пятая годовщина
4. ИНВАРИАНТЫ ВЕКТОРОВ И ЛИНЕЙНЫХ ФОРМ
4.1. Определение инвариантов линейных форм и векторов
В данном разделе приводятся основные сведения о инвариантах линейных
преобразований для двух классов объектов в евклидовом пространстве Rn- системы векторов (или точек) а1,...,аk и системы линейных форм L1,...,Lk (3.5).
Эти классы объектов имеют аналогичные совокупности инвариантов, поскольку матрицы обеих систем -(n х k)-матрица А из координат точек аi и
(k х n)-матрица А из коэффициентов линейных форм Li -преобразуются при переходе к новому базису X' = GX в пространстве Rn по близким формулам (3.4),
(3.6); A' = GA ; А' = АН. Поэтому задача поиска инвариантов линейных форм
сводится к аналогичной задаче для системы векторов простым транспонированием матрицы А.
Учитывая это, ограничимся исследованием инвариантов системы k векторов или, что то же, системы k точек в пространстве Rn . Применительно к ним
общее определение инвариантов, данное в разд. 2, выглядит следующим образом.
Абсолютным инвариантом системы k точек а1,...,аk евклидова пространства Rn по отношению к группе линейных преобразований GL(n), называется
любая числовая функция этих точек (a1,..., аk), удовлетворяющая условию
(Ga1 , , Gak )  (a1 , , a k ),
ai  R n ,
G  GL(n) .
(4.1)
При этом инвариант называется арифметическим, если функция  принимает только целочисленные значения, называется алгебраическим, если она
имеет вид полинома от координат векторов и называется гладким, если функция  является непрерывной дифференцируемой функцией своих аргументов.
Если функция  такова, что условие (4.1) выполняется с точностью до скалярного множителя r = r(G): (Ga1,... ,Gak) = r (а1,... ,аk), то инвариант называется относительным.
q
Обычно r  G , где q-целое число, называемое порядком относительного
инварианта. Отношение двух относительных инвариантов одного порядка будет являться абсолютным инвариантом (т.е. относительным инвариантом порядка нуль).
Перейдем к описанию системы векторов относительно действия полной
линейной группы GL(n), а также её подгрупп, охарактеризованных в предыдущем разделе - унимодулярной SL(n), унипотентной Т(n) и ортогональной 0(n).
4.2. Аффинные инварианты
Очевидно, что полная группа будет обладать меньшим числом инвариантов, чем её подгруппы, поскольку она осуществляет более глубокое преобразование пространства. Однако её инварианты будут являться и инвариантами
всех её подгрупп.
Как уже отмечалось, полная линейная группа GL(n) образована всеми невырожденными матрицами G n-го порядка, G  0 . Она задает так называемое
центроаффинное преобразование пространства R, отличающегося от общего
аффинного преобразования отсутствием сдвига (параллельного переноса). Это
преобразование не сохраняет длин отрезков и углов, однако сохраняет отношение длин отрезков, расположенных на одной прямой (рис.3.1). Центроаффинное преобразование (3.1) переводит систему n-мерных векторов а1,...,аk в си|
|
стему векторов a1 ,..., a k согласно формулам (3.3), при этом матрица A  a1 ,..., a k  , составленная из координат этих векторов, преобразуется по
формуле (3.4). где G  GL(n).
Рассмотрим сначала случай, когда число векторов равно размерности пространства k = n. При этом все три матрицы А,G,А' будут квадратными, и из
матричного равенства (3.4) следует равенство для определителей
A  G  A .
Это означает, что определитель А является относительным инвариантом
веса 1. При k = n он оказывается единственным инвариантом и по этой причине
называется фундаментальным относительным инвариантом системы n точек в
пространстве Rn .
При k>n появляются другие относительные инварианты. Ими будут служить различные миноры n-го порядка матрицы А, поскольку при умножении
матрицы А на матрицу В все они будут умножаться на определитель матрицы
G. Отношение любых двух миноров будут представлять собой абсолютный инвариант.
Общее число таких миноров будет равно числу способов, которыми можk
но выбрать n векторов из k, т.е. c n , однако среди них будет много зависимых.
Число N независимых инвариантов, образующих минимальный полный набор,
можно подсчитать, вычитая из общего числа N1 = n k исходных параметров
(элементов матрицы А) число N = n2 параметров группы (элементов матрицы
G).
N 0  N1  N  nk  n 2  n(k  n) .
(4.2)
Эта формула характеризует число абсолютных независимых инвариантов,
число относительных инвариантов будет на единицу больше, так как абсолютные инварианты можно получить делением на один из относительных. В частности, при k = n получаем, что число абсолютных инвариантов равно нулю, а
число относительных - единице (это отмеченный выше фундаментальный инвариант).
В качестве примера рассмотрим случая n - S. k - 4 (четыре вектора на
плоскости). Зри этом у матрицы А
a
A   11
a 21
a12
a 22
a13
a 23
a14 
a 24 
будет c42  6 различных миноров 2-го порядка
 12 
a11
a 21
a
a12
,  13  11
a 21
a 22
a13
a
,  ,  34  13
a 23
a 23
a14
.
a 24
(4.3)
В соответствии с формулой (4.2) N0 = 4, т.е. имеется четыре независимых абсолютных инварианта и 4 + 1 = 5 относительных. Следовательно, 6 выписанных
миноров (все они являются относительными инвариантами) функционально зависимы и должны удовлетворять некоторому связывающему их соотношению.
Это соотношение имеет вид
12  34  13  42  14  23  0
(4.4)
и представляет собой пример сизигии. Благодаря её наличию в данном случае
базис содержит на один инвариант больше, чем минимальный полный набор
инвариантов. Геометрический смысл соотношения (4.4) и инвариантов  i j . будет пояснен далее.
При k<n алгебраические инварианты отсутствуют (как абсолютные, так и
относительные),однако остается арифметический инвариант, равный рангу
матрицы А (умножение на невырожденную матрицу G не меняет ранга матрицы А). Геометрически инвариантность ранга матрицы А означает, что число
линейно независимых векторов среди совокупности а1,...,аk при аффинном пре-
образовании не меняется, в частности, сохраняется принадлежность точек одной прямой.
4.3. Инварианты унимодулярного преобразования
Как уже отмечалось, матрицы G унимодулярного преобразования удовлетворяют единственному ограничению - их определитель должен быть единичным G  1 . Группа унимодулярных преобразований SL(n) несколько уже
полной линейной группы, но также не сохраняет ни длины векторов, ни углов
между ними. Замена условия G  0 на G  1 приводит к тому, что все относительные инварианты группы GL(n) становятся абсолютными инвариантами
группы SL(n). Поэтому теория инвариантов этих групп по существу совпадает.
Например, при k = n имеем |А'| = |А|, т.е.  = |A| представляет собой абсолютный инвариант. Он называется фундаментальным инвариантом системы n
точек в пространстве Rn и образует базис инвариантов.
Поясним его геометрический смысл при различных значениях n. При n - 2
имеем двумерную плоскость, на которой расположены два вектора а1, а2 (рис.
4.1). Инвариант точек а1= (х1, у1), а2 = (x2 у2)

x1
y1
x2
 x1 y 2  x 2 y1
y
(4.5)
численно равен удвоенной площади треугольника О a1a2 , или площади параллелограмма, построенного на векторах а1 и а2. Унимодулярное преобразование
произвольным образом меняет вид этого треугольника (в частности, он может
стать из остроугольного тупоугольным, как это показано на рис.4.1), но сохраняет неизменной площадь. Таким образом, группа унимодулярных преобразований SL(2) разбивает множество треугольников на классы эквивалентности,
образованные треугольниками с одинаковыми площадями.
y
 1
1
2
y1
y2
2
3
0
x1
x2
x
0
1
 2
Рис. 4.1
Рис. 4.2
В трехмерном пространстве фундаментальным инвариантом системы трех точек a1 a2 a3 является определитель
x1
  a1 , a 2 , a 3  y1
z1
x2
y2
z2
x3
y3
z3
(4.6)
.
Геометрически он равен удвоенному объему тетраэдра, образованного
заданными тремя векторами a1 a2 a3 (рис.4.2).
Аналогично в пространстве Rn при k = n инвариант  = |А| характеризует
объем тетраэдра, построенного на векторах а1, а2, ... , аn .
При k > n инвариантами будут различные миноры n-го порядка матрицы
А. В этом можно убедиться, заменяя равенство В = GА системой равенств
Вi = Gi А i ,где А i-различные квадратные подматрицы матрицы А. Переходя от
этих матричных равенств к соответствующим детерминантным равенствам,
получаем полную систему инвариантов в виде старших миноров матрицы А.
Геометрически им соответствуют удвоенные объемы тетраэдров, образованные разными группами по n векторов. В частности в трехмерном пространстве это будут тетраэдры, образованные различными тройками
N
Nб
10
9
8
7
6
5
4
3
2
1
0
a2
N0


a3
a1

0
1 2
3
4
5
k
6
Рис.4.3
Рис.4.4
векторов, аналогичные изображенному на рис. 4.2. В n-мерном случае
k
общее число таких миноров равно c n , однако среди них много зависимых.
Число независимых абсолютных инвариантов полного набора равно
N 0  N1  N  nk  (n 2 1)  n(k  n)  1,
(4.7)
где N,-число исходных параметров (элементов матрицы А); N – число параметров группы. Из формулы (4.7) следует, что при k = n имеется единственный абсолютный инвариант, а с ростом k при фиксированном n число независимых
инвариантов линейно возрастает. Соответствующий график для n = 2 показан
на рис. 4.3. сплошной линией. Пунктирной линией изображен график параболы
Nб = k(k-l)/2, характеризующий общее число миноров 2-го порядка матрицы А.
Графики пересекаются в точках с абсциссами k = 2 и k = 3, отвечающих случаям функциональной независимости инвариантов базисного набора.
В частности, при k = 2 имеется единственный инвариант (4.5), характеризующий удвоенную площадь треугольника О а1 а2. При k > 2 унимодулярное
преобразование будет сохранять площади треугольников вида О ai aj i,j=1,k,
причем эти площади будут образовывать базисную систему инвариантов. При
k=3 инвариантами являются три минора матрицы А, полученные вычеркиванием одного из столбцов
 12 
a11
a 21
a
a12
,  13  11
a 21
a 22
a13
,
a 23
 23 
a12
a 22
a13
.
a 23
соответствующие им три треугольника показаны на рис. 4.4.
При k = n из графиков рис. 4.3 получаем, что N0 = 5, Nб = 6, т.е. число базисных инвариантов на единицу превышает число инвариантов минимального
полного набора. Алгебраическое описание этого случая было приведено выше
(см. инварианты (4.3) и сизигию (4.4)). Геометрическая интерпретация дается
рис.4.6, на котором можно увидеть шесть треугольников, образованных точками a1, а2, а3, а4 и началом координат 0.
Площади  i j этих треугольников дают в совокупности шесть инвариантов. Они образуют базисную систему инвариантов, которая, однако, не будет
минимальной, поскольку указанные площади связаны алгебраическим соотношением (4.4). Его можно рассматривать как некую геометрическую теорему о
площадях, что вполне соответствует точке зрения на геометрию, как науку о
соотношениях между инвариантами заданной группы преобразований.
При k<n алгебраические инварианты отсутствуют, однако остается арифметический инвариант, равный рангу матрицы А (умножение на невырожденную матрицу не меняет ранга).
4.4. Инварианты унипотентного преобразования.
Группа уиипотентных преобразований Т(n) описывается верхними треугольными матрицами n-го порядка с единицами на главной диагонали. Число
варьируемых элементов матрицы G (они расположены выше главной диагонали) равно N = 0,5 n(n-l), что на 0,5 n (n+l) меньше, чем у полной линейной
группы. Естественно ожидать, что число инвариантов унипотентной группы
будет больше на такую же величину.
Отыскание инвариантов начнем со случая k = n = 2 (рис. 4.5), когда имеется пара векторов а1,а2 и матрица преобразования G, содержащая один свободный параметр
x 
a1   1  ,
 y1 
x 
a2   2  ,
 y2 
1 
G
.
0 1 
Указанные преобразования переводят векторы а1, а2 в векторы b1 ,b2 , определяемые равенствами
 x  y1 
b1  Ga1   1
,
y
1


 x  y2 
b2  Ga 2   2
.
y
2


Это означает, что при преобразовании концы векторов скользят вдоль горизонтальных прямых, т.е. величины у1,у2 являются инвариантами унипотентного
преобразования (рис.4.6).
a2
y
y2
a2
b2
a3
a1
y1
a1
a4
b1
x
0
Рис.4.5
Рис.4.6
Еще один инвариант получаем, рассматривая площади 1 и 2 треугольников О а1 а2 и О b1 b2. Указанные площади выражаются через следующие определители:
1 
1 x1
2 x2
y1
,
y2
2 
1 x1  y1
y1
2
x 2  y 2
.
y2
Легко проверить, что они равны, т.е. унипотентное преобразование сохраняет
площади треугольников, а также параллелограммов и других фигур (рис. 3.2).
Полученная совокупность трех независимых величин {y1 ,y2 ,x1 y2 – x2 y1}
образует базисный набор инвариантов при n = k = 2. Если на плоскости задано
более двух векторов, то базисная система инвариантов будет иметь вид


I  y i , xi y j  x j y i ,
i, j  1, k .
(4.8)
Найдем теперь полную систему унипотентных инвариантов при произвольном
n. Для этого используем алгебраический подход и рассмотрим наряду с произведением A' = G А произведения вида А'i = Gi Ai., где матрицы Аi и А'i получены из матриц А и А' вычеркиванием первых n-1строк, а матрица Gi образована
вычеркиванием из матрицы G первых n -1 строк и столбцов. Поскольку каждая
из матриц Gi будет унимодулярной, то при любом i = 1,n-1 старшие миноры
матрицы Аi будут инвариантами рассмотренного преобразования. В частности,
при i = 1 имеем А1 = А'1, что означает инвариантность элементов последней
строки матрицы А.
Полная система инвариантов образуется следующими минорами матрицы
А:
1) минорами первого порядка, связанными с последней строкой (т.е. элементами этой строки аn1,... ,аnk);
2) минорами второго порядка, связанными с последними двумя строками, т. е.
определителями вида
a n 1,i
a ni
a n 1, j
,
a nj
i, j  1, n ;
3) минорами третьего порядка, связанными с последними тремя строками матрицы А и т. д. вплоть до миноров матрицы А порядка n. Отметим, что последние представляют собой инварианты группы SL(n) (унимодулярные инварианты), что вполне естественно, поскольку унипотентная группа Т(n) является её подгруппой T(n)  SL(n). Общее число унипотентных инвариантов
получаем, подсчитывая количество миноров матрицы А различных порядков
N б  Ck1  Ck2    Ckn .
(4.9)
При этом число независимых инвариантов определяется формулой
N 0  N1  N  nk  n(n  1) / 2.
(4.10)
4.5. Инварианты ортогонального преобразования
Группа ортогональных преобразований 0(n) описывает различные вращения
и зеркальные отражения евклидова пространства Rn. Матрицы таких преобразований удовлетворяют условию GT G = E, которое эквивалентно n(n+1)/2 скалярным условиям. Число свободных параметров группы определяется формулой N = n2 - n(n+l)/2 = n(n-l)/2. что совпадает с числом параметров унипотентной группы . Следовательно число независимых инвариантов ортогональной
группы также должно определяться формулой (4.10).
Отыскание инвариантов начнем с рассмотрения однопараметрической
группы 0(2). В этом случае имеется двумерная плоскость R2, на которой заданы
k векторов а1,...,аk. Под действием преобразования G0(2) они поворачиваются
на некоторый угол  (рис. 4.7). Матрица G такого преобразования имеет вид
 cos  sin    1 0 
G
   0  1

sin

cos


 

где первый сомножитель
описывает поворот, а второй
учитывает возможность зеркального отражения. Очевидно,
что при этом сохраняются
длины, векторов l1,...,lk и углы
между ними. Следовательно
инвариантами будут и всевозможные скалярные произведения вида
a'2
(4.11)
a'1
ak

a2
0
a1
Рис.4.7
c ij  (a i , a j )  a1i a1 j  a 2i a 2 j ,
i, j  1, k
(4.12)
06щее количество таких инвариантов равно k(k+l)/2. Эта система инвариантов
является полной, но не минимальной. Количество независимых инвариантов в
ней определяется формулой N0 = 2k-1, поскольку 2k исходных параметров, характеризующих систему векторов а1 ,...,аk, уменьшается на единицу за счет одного свободного параметра . В качестве инвариантов минимального полного
набора можно взять, например. инварианты c11=l21,...,ckk =l2k, равные квадратам
длин векторов а1,...,аk и инварианты c12,…,c1k, характеризующие углы между
вектором а1 и остальными векторами.
Найдем соотношения (сизигии), связывающие инварианты (4.12). Для этого перепишем их в виде cij = li lj cos i j , где i j - угол между векторами аi и аj.
Преобразуя это выражение с учетом равенств i j = i1 - j1 , получаем
c11cij  l12 l i l j (cos 1i cos 1 j  sin 1i sin 1 j )  c1i c1 j  (c11cii  c12i )(c11c jj  c12j ) .
Избавляясь от иррациональностей, находим требуемые алгебраические соотношения (сизигии) :
(c11c ii  c12i )( c11c jj  c12j )  (c11c ij  c1i c1 j ) 2 ,
i, j  1, k .
Полную систему инвариантов (4.12) можно получить чисто алгебраическим путем. При n-2, матрицы А и A' = G А, составленные из векторов аi и а'i,
имеют размеры 2хn. Рассматривая матрицу С = (A')T A' и учитывая равенство
GTG = Е, получим
C  ( A) T A  AT G T GA  AT A .
Следовательно, k2 элементов cij симметричной матрицы С являются инвариантами ортогонального преобразования. Непосредственное вычисление
показывает, что эти элементы имеют вид (4.12). Выбранные ранее независимые
инварианты расположены на главной диагонали этой матрицы и в её первой
строке.
Полученный алгебраический результат легко обобщается на n-мерное
пространство Rn. Инвариантами n-мерного ортогонального преобразования попрежнему служат элементы матрицы С = ATA .
С другой стороны инвариантами ортогонального преобразования должны
быть аффинные и унимодулярные инварианты, поскольку 0(n)  GL(n) и S0(n)
 SL(n), где S0 (n)-группа ортогональных матриц с единичным определителем
|G| = 1. Поэтому у ортогональной группы можно выделить 3 типа инвариантов :
квадраты длин векторов l2i ; скалярные произведения (ai, аj); определители (кососкалярные произведения) любой совокупности из n векторов (старшие миноры матрицы А).
Инварианты первых двух типов называют изометрическими, поскольку
они гарантируют сохранение расстояний в евклидовом пространстве, в то время как инварианты третьего типа - унимодулярные и гарантирует только
сохранение площадей. В совокупности эти инварианты функционально (и алгебраически) зависимы, в качестве полной минимальной системы могут быть
выбраны любые N0 независимых из них, где N0 определяется формулой (4.10).
В частности, для двух векторов на плоскости длины l1 и l2 и углом  между
ними величина их скалярного произведения R = l1 l2 cos  является изометри-
ческим инвариантом, но не является унимодулярным инвариантом. Напротив,
площадь треугольника S = l1 l2 sin , представляющая собой единственный
унимодулярный инвариант, будет одновременно и изометрическим инвариантом, поскольку из условий S = const и l1 l2= const (выполняется при изометрическом преобразовании) следует R 2  l12 l22  S 2  const .
Мы описали инварианты системы векторов по отношению к центроафинным, упимодулярным, унипотентным и ортогональным преобразованиям.
Аналогичным образом рассматриваются другие группы преобразований, задаваемые, например, диагональными матрицами, нижнетреугольными, симллектическими, циркулянтными и другими. При этом взаимосвязь инвариантов
различных групп подчиняется принципу вложенности, согласно которому цепочка включений групп преобразований порождает обратную цепочку включений для их инвариантов. Применительно к рассматриваемым группам преобразований этот принцип иллюстрируется следующими двумя цепочками:
GL  SL  T
GL  SL  S 0
I1  I 2  I 3
I1  I 2  I 4
где через I1, I2, I3, I4 обозначены множества инвариантов соответствующих
групп. В частности, последняя цепочка включений означает, что аффинные инварианты являются подмножеством унимодальных, а те в свою очередь - подмножеством изометрических инвариантов. Тем самым любой аффинный инвариант автоматически будет унимодальным и изометрическим инвариантом, т.е.
аффинные инварианты отображают более фундаментальные свойства системы
векторов.
Заключение
Теория инвариантов имеет широкие возможности применения при решении
прикладных задач. Это касается как общеметодологических рекомендаций, согласно которым любое разумно организованное исследование сводится к отысканию инвариантов и установлению связей между ними, так и конструктивных методов построения полных наборов инвариантов.
В тексте лекций изложены основные понятия и определения классической теории инвариантов и описаны инварианты системы векторов и линейных
форм. Эти инварианты могут быть использованы, например, при моделировании на ЭВМ линейных динамических систем, заданных передаточными функциями или уравнениями в пространстве состояний, при моделировании систем
линейных алгебраических или разностных уравнений, сетей Петри и т.д.
В дальнейшем предполагается описать инварианты квадратичных форм и
операторов, а также рассмотреть взаимосвязь инвариантов и канонических
форм.
Библиографический список
1.Балберин В. В., Мироновский Л. А., Петровский А. Б. Понижение порядка
моделей. Учеб. пособие/ ЛИАП, Л, 1989. 48 с.
2. Мироновский Л. А. Аналоговое и гибридное моделирование. Многомерные
системы: Учеб. пособие/ ЛИАП Л., 1986. 88 с.
3. Сибирский К.С. Введение в алгебраическую теорию инвариантов
дифференциальных уравнений. Кишинев: Шгиинца,1982.168 с.
4.Гуревич Г.В. Основы теории алгебраических инвариантов.
М. -Л: ГИТТЛ. 1948. 408 С.
5.Спрингер Т. Теория инвариантов. М.: Мир, 1981. 191 с.
6.Крафт Х. Геометрические методы в теории инвариантов. М: Мир, 1987. 312 с.
Скачать