Актуальные проблемы теории устойчивости и

реклама
Актуальные проблемы
теории устойчивости
и управления
Тезисы докладов Международной конференции
Abstracts of International Conference
Actual Problems
of Stability and Control Theory
Actual Problems
of Stability and Control Theory
APSCT’2009
Abstracts of International Conference
Ekaterinburg, Russia
September 21–26, 2009
Ekaterinburg
2009
РОССИЙСКАЯ АКАДЕМИЯ НАУК
УРАЛЬСКОЕ ОТДЕЛЕНИЕ
ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМ. А. М. ГОРЬКОГО
Актуальные проблемы
теории устойчивости и управления
Тезисы докладов Международной конференции
Екатеринбург, Россия
21–26 сентября 2009 г.
Екатеринбург
2009
УДК 517.977 + 519.63
Конференция проводится в рамках программы Президиума РАН
«Математическая теория управления»,
при финансовой поддержке РФФИ (проект 09-01-06091)
и Уральского отделения РАН
Редакционная коллегия
В. С. Пацко (отв. редактор)
М. И. Гусев, А. Г. Иванов, Н. Ю. Лукоянов, В. И. Максимов,
Н. Н. Субботина, В. Н. Ушаков, А. И. Ченцов, Г. С. Шелементьев
Актуальные проблемы теории устойчивости и управления:
Тез. докл. Междунар. конференции. Екатеринбург, Россия,
21–26 сентября 2009 г. Екатеринбург: УрО РАН. 2009. 190 с.
В сборнике анонсируются результаты исследований по теории устойчивости и математической теории управления. Представлены следующие
научные направления: проблемы устойчивости движения и стабилизации,
задачи управления в условиях неопределенности и дифференциальные игры, управление распределенными системами, обобщенные решения уравнений Гамильтона – Якоби, численные методы теории управления и приложения.
УДК 517.977 + 519.63
c Институт математики и механики УрО РАН, 2009
°
c Уральский государственный университет, 2009
°
Содержание
Агеев А. Л.
Некоторые вопросы обработки изображений для целей
навигации . . . . . . . . . . . . . . . . . . . . . . . . . .
Ананьев Б. И.
Задачи коррекции движения статистически неопределенных систем . . . . . . . . . . . . . . . . . . . . . . . .
Азамов А. А., Ахмедов О. С., Тилавов А. М.
Установление существования замкнутой траектории
динамических систем методом DN-слежения . . . . . .
Азамов А. А., Кучкаров А. Ш., Саматов Б. Т.
Стратегия параллельного сближения: аналогии и обобщения . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Баенхаева А. В., Самсонюк О. Н.
Достаточные условия оптимальности для задач оптимального управления с траекториями ограниченной
вариации . . . . . . . . . . . . . . . . . . . . . . . . . . .
Банников А. С., Петров Н. Н., Сахаров Д. В.
Конфликтное взаимодействие групп управляемых объектов . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Бердышев В. И.
Относительная видимость движущегося объекта для
группы наблюдателей . . . . . . . . . . . . . . . . . . .
Бердышев Ю. И.
Нелинейная задача последовательного управления с
элементами противодействия . . . . . . . . . . . . . . .
Близорукова М. С., Кадиев А. М., Максимов В. И.
О динамической реконструкции в системах с последействием . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Братусь А. С., Чумерина Е. С., Антипов А. В.
Задачи оптимальной терапии в биологических моделях
Брыкалов С. А., Латушкин Я. А.
Непрерывная обратная связь в задачах уклонения от
окружности . . . . . . . . . . . . . . . . . . . . . . . . .
3
19
21
23
25
27
29
31
33
35
37
38
Васильев С. Н.
Преобразование моделей в динамике систем и их свойства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Васильев С. Н., Козлов Р. И., Ульянов С. А.
О стабилизации движущихся формаций в условиях
неопределенности . . . . . . . . . . . . . . . . . . . . . .
Васин В. В., Еремин И. И.
Итерационные процессы фейеровского типа и их приложения . . . . . . . . . . . . . . . . . . . . . . . . . . .
Габасов Р., Дмитрук Н. М., Кириллова Ф. М., Поясок Е. И.
Задачи оптимального управления с подвижной целью
Гаева З. С., Шананин А. А.
Приложение алгоритма Чебышёва – Маркова – Крейна
для численного решения задачи управления микрофизическими процессами в градовых облаках . . . . . . .
Ганебный С. А., Кумков С. С., Пацко В. С.
Экстремальное управление в задачах с неизвестным
уровнем динамической помехи . . . . . . . . . . . . . .
Гороховик В. В.
Условия минимальности второго порядка в задачах
векторной оптимизации с ненаправленным отношением предпочтения . . . . . . . . . . . . . . . . . . . . . .
Григоренко Н. Л., Камзолкин Д. В., Лукьянова Л. Н.,
Пивоварчук Д. Г.
Об одном классе нелинейных задач управления с дисконтированием . . . . . . . . . . . . . . . . . . . . . . .
Гусев М. И.
Оценки множеств достижимости многомерных управляемых систем с нелинейными перекрестными связями
Данилин А. Р., Зорин А. П.
Асимптотика оптимального граничного управления сингулярным эллиптическим уравнением в круге . . . . .
Дарьин А. Н., Минаева Ю. Ю.
О физической реализуемости теории быстрых управлений . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
40
42
44
46
49
51
53
55
57
59
61
Демьянов В. Ф., Тамасян Г. Ш.
Негладкие задачи вариационного исчисления . . . . .
Дигайлова И. А.
О синтезе управлений при коммуникационных ограничениях . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Долгий Ю. Ф.
Квадратичные функционалы Ляпунова в задаче устойчивости линейной системы с последействием . . . . . .
Думшева Т. Д., Костоусов В. Б., Костоусова Е. К.,
Починский В. И.
Исследование задачи оптимального вывода полезной
нагрузки на заданную эллиптическую орбиту . . . . .
Дыхта В. А., Сорокин С. П.
Полурешения уравнения Гамильтона – Якоби в задачах оптимального управления с концевыми ограничениями . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Егоров А. И., Знаменская Л. Н.
Управляемость колебаний сети из связанных объектов
с распределенными и сосредоточенными параметрами
со свободными концами . . . . . . . . . . . . . . . . . .
Желонкина Н. И., Сесекин А. Н.
Необходимые условия оптимальности для одного класса механических систем . . . . . . . . . . . . . . . . . .
Ильин А. В., Коровин С. К., Фомичев В. В.
Синтез минимальных линейных стабилизаторов . . . .
Ильин А. М., Хачай О. Ю.
Асимптотика решения вырожденной системы дифференциальных уравнений с малым параметром . . . . .
Ким А. В.
Предельные множества функционально-дифференциальных уравнений . . . . . . . . . . . . . . . . . . . . . . .
Клейменов А. Ф., Кувшинов Д. Р., Осипов С. И.
Численное построение решений в неантагонистической
дифференциальной игре двух лиц . . . . . . . . . . . .
5
63
64
65
68
70
72
75
76
79
82
84
Колесов А. Ю., Мищенко Е. Ф., Розов Н. Х.
Многочастотные автоколебания в двумерных решетках связанных осцилляторов . . . . . . . . . . . . . . .
Костоусова Е. К.
Об ограниченности и неограниченности полиэдральных оценок линейных управляемых систем . . . . . . .
Красовский А. А., Тарасьев А. М.
Построение нелинейных регуляторов в модели экономического роста с исчерпаемыми энергетическими ресурсами . . . . . . . . . . . . . . . . . . . . . . . . . . .
Красовский Н. А., Тарасьев А. М.
Декомпозиционные методы нахождения точек максимума векторного критерия . . . . . . . . . . . . . . . .
Красовский Н. Н., Котельникова А. Н.
О дифференциальной игре на перехват . . . . . . . . .
Кругликов C. B.
Об одной иерархической модели условий для задачи
прокладки оптимального маршрута . . . . . . . . . . .
Кряжимский А. В., Осипов Ю. С.
Задачи позиционного управления с неполной информацией и метод программных пакетов . . . . . . . . . .
Куржанский А. Б.
О задачах управления групповым движением . . . . .
Лукоянов Н. Ю.
О формализме Гамильтона – Якоби в задачах управления наследственными динамическими системами . .
Мурзабекова Г. Е.
Решение систем уравнений кодифференцируемых функций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Никонов O. И.
Методы теории гарантированного управления в задачах финансовой математики . . . . . . . . . . . . . . .
Петросян Л. А.
Кооперативные дифференциальные игры на сетях . .
6
86
89
91
93
95
98
100
103
104
106
108
110
Пименов В. Г.
Разностные схемы в моделировании эволюционных управляемых систем с последействием . . . . . . . . . . . . . 111
Попова С. Н.
Вариационные методы в задачах управления асимптотическими инвариантами . . . . . . . . . . . . . . . . . 113
Прудников И. М.
Свойства интегральной аппроксимации негладких функций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Решмин С. А.
Метод декомпозиции в задачах управления механическими системами с дефицитом управляющих параметров . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Розанова О. С.
Об одной возможности построения обобщенного решения уравнения Гамильтона – Якоби . . . . . . . . . . . 120
Рублев И. В., Файзуллин Д. С.
Об одном численном алгоритме для решения трехмерных задач достижимости . . . . . . . . . . . . . . . . . 122
Ряшко Л. Б.
Стабилизация инвариантных многообразий нелинейных стохастических систем . . . . . . . . . . . . . . . . 124
Серков Д. А.
Об оптимальном по риску управлении в случае программной помехи . . . . . . . . . . . . . . . . . . . . . . 125
Смирнов Р. О., Чистяков С. В.
Решение проблемы выбора параметров управления в
одной модели налогообложения . . . . . . . . . . . . . 126
Соколов В. Ф.
Оценка робастного качества номинальной модели по
данным измерений при наличии помех измерений . . . 127
Срочко В. А.
К численному решению многоэкстремальных задач управления в линейных системах . . . . . . . . . . . . . . . . 129
7
Стружанов В. В., Просвиряков Е. Ю.
Об устойчивости одной деформируемой градиентной
системы . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Субботин Ю. Н., Черных Н. И.
Применение гармонических всплесков при решении бигармонического уравнения в круге . . . . . . . . . . . . 133
Субботина Н. Н., Колпакова Е. А., Токманцев Т. Б.,
Шагалова Л. Г.
Обобщенный метод характеристик в теории и приложениях оптимальных процессов управления и законов
сохранения . . . . . . . . . . . . . . . . . . . . . . . . . . 134
Сурков А. В.
Задачи стабилизации и быстродействия систем функционально-дифференциальных уравнений . . . . . . . . . 136
Тимофеева Г. А., Завалищин Д. С.
Задача управления транспортными потоками на перекрестке . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Толстоногов А. А.
Расширение задач оптимального управления с субдифференциальными операторами . . . . . . . . . . . . . . 138
Ухоботов В. И.
Однотипные дифференциальные игры с выпуклой целью . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
Ушаков В. Н., Успенский А. А., Матвийчук А. Р.
О построении решений в игровых задачах управления,
линейных по управлению одного из игроков . . . . . . 141
Филиппова Т. Ф.
Оценки множеств достижимости нелинейных динамических систем с импульсным управлением . . . . . . . 143
Финогенко И. А.
О регулируемых системах с разрывными и импульсными управлениями . . . . . . . . . . . . . . . . . . . . . . 145
Ченцов А. Г.
Ограничения асимптотического характера и расширения в классе конечно-аддитивных мер . . . . . . . . . . 147
8
Черноусько Ф. Л., Болотник Н. Н.
Мобильные роботы, управляемые движением внутренних тел . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Шориков А. Ф.
Задача минимаксного программного управления процессом сближения-стабилизации в двухуровневой иерархической дискретной динамической системе . . . . . . 151
Щеглова А. А.
Управляемость нелинейных алгебро-дифференциальных систем . . . . . . . . . . . . . . . . . . . . . . . . . . 153
Янулевич М. В., Стрекаловский А. С.
О численном решении одной задачи оптимального управления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Botkin N. D., Hoffmann K.-H.
Control design in cryopreservation of living cells . . . . . 158
Burton T .A., Dwiggins D. P.
Perturbed kernels of integral equations . . . . . . . . . . 160
Chikrii A. A.
Guaranteed result in game problems of dynamics . . . . . 161
Dzhafarov V., Büyükköroğlu T., Akyar H.
Common Lyapunov functions for linear switching systems 162
Falcone M., Rorro M.
Numerical approximation of the effective Hamiltonian and
applications . . . . . . . . . . . . . . . . . . . . . . . . . 163
Feichtinger G., Glass D., Tragler G., Caulkins J. P.
Optimal control of “deviant” behavior . . . . . . . . . . . 165
Glizer V. Y., Turetsky V., Shinar J.
Differential game with linear dynamics and multiple information delays . . . . . . . . . . . . . . . . . . . . . . . 166
Guseinov Kh. G., Nazlipinar A. S.
Attainable sets of the nonlinear control systems with limited resources . . . . . . . . . . . . . . . . . . . . . . . . . 168
Korotkii A. I., Kovtunov D. A.
Optimal boundary control of a system describing thermal
convection . . . . . . . . . . . . . . . . . . . . . . . . . . 170
9
Ledyaev Yu. S.
Discontinuous feedback in nonlinear control: dynamic observers and stabilizers . . . . . . . . . . . . . . . . . . . .
Pickl S., Lozovanu D.
Stochastic discrete control problems and dynamic programming algorithms for solving them . . . . . . . . . . .
Malanowski K.
Stability and sensitivity analysis for optimal control problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Melnikov N. B., O’Neill B. C., Dalton M. G.
Aggregation in dynamic equilibrium models of economic
growth with CES functions . . . . . . . . . . . . . . . . .
Mordukhovich B. S.
Optimal control and feedback design of state-constrained
parabolic systems under uncertainties . . . . . . . . . . .
Polovinkin E. S.
On strongly convex analysis and its applications . . . . .
Turova V. L.
Modeling the osmotic de- and rehydration of living cells
using Hamilton – Jacobi equations and reachable set techniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Veliov V. M.
Discrete-time approximations to control/uncertain systems
10
172
174
176
176
178
179
181
183
Contents
Ageev A. L.
Image processing for navigation . . . . . . . . . . . . . .
Ananiev B. I.
Problems of motion correction for statistically uncertain
systems . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Azamov A. A., Axmedov O. S., Tilavov A. M.
Establishing existence of a closed trajectory of dynamic
system by the method of DN-tracking . . . . . . . . . . .
Azamov A. A., Kuchkarov A. Sh., Samatov B. T.
Strategies of parallel pursuit: analogues and generalizations
Baenkhaeva A. V., Samsonyuk O. N.
Sufficient conditions of optimality for optimal control
problems with trajectories of bounded variation . . . . .
Bannikov A. S., Petrov N. N., Sakharov D. V.
The conflict interaction between groups of control objects
Berdyshev V. I.
Relative visibility of a moving object for group of observers
Berdyshev Yu. I.
The nonlinear sequential approach problem with counteraction elements . . . . . . . . . . . . . . . . . . . . . . . .
Blizorukova M. S., Kadiev A. M., Maksimov V. I.
On dynamical reconstruction in time-delay systems . . .
Bratus A. S., Antipov A. V., Chumerina E. S.
Problems of optimal therapy in biological models . . . . .
Brykalov S. A., Latushkin Y. A.
Continuous feedback in problems of evasion from circumference . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vassilyev S. N.
Transformations of models in system dynamics and their
properties . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vassilyev S. N., Kozlov R. I., Ulyanov S. A.
On stabilization of moving formations under uncertainty
Vasin V. V., Eremin I. I.
Iterative processes of the Fejér type and its applications .
11
19
21
23
25
27
29
31
33
35
37
38
40
42
44
Gabasov R., Dmitruk N. M., Kirillova F. M., Poyasok E. I.
Some optimal control problems with moving target . . .
Gaeva Z. S., Shananin A. A.
Application of Markov – Chebyshev – Krein’s algorithm
for numerical solution of control problem for microphysical processes in hail clouds . . . . . . . . . . . . . . . . .
Ganebny S. A., Kumkov S. S., Patsko V. S.
Extremal control in problems with unknown level of dynamic disturbance . . . . . . . . . . . . . . . . . . . . . .
Gorokhovik V. V.
Second order minimality conditions in vector optimization
problems with undirected preference relation . . . . . . .
Grigorenko N. L., Kamzolkin D. V., Lukianova L. N.,
Pivovarchuk D. G.
On a class of nonlinear problems with discounting . . . .
Gusev M. I.
Estimates of reachable sets for multidimensional control
systems with nonlinear interconnections . . . . . . . . . .
Danilin A. R., Zorin A. P.
The asymptotics of the optimal boundary control to a singular elliptic equation in a disk . . . . . . . . . . . . . . .
Daryin A. N., Minaeva J. J.
On physical realizations of fast control theory . . . . . .
Demyanov V. F., Tamasyan G. Sh.
Nonsmooth problems of calculus of variations . . . . . . .
Digailova I. A.
On feedback control under communication constraints . .
Dolgii Yu. F.
Lyapunov quadratic functionals in the stability for linear
systems with aftereffect . . . . . . . . . . . . . . . . . . .
Dumsheva T. D., Kostousov V. B., Kostousova E. K.,
Potchinskii V. I.
On a problem of optimal insertion a payload onto a given
elliptic orbit . . . . . . . . . . . . . . . . . . . . . . . . .
12
46
49
51
53
55
57
59
61
63
64
65
68
Dykhta V. A., Sorokin S. P.
Semisolutions of Hamilton – Jacobi equation for optimal
control problems with endpoints constraints . . . . . . .
Egorov A. I., Znamenskaya L. N.
Controllability of the distributed and concentrated parameters objects net with free boundary oscillations . . .
Zhelonkina N. I., Sesekin A. N.
Necessary conditions of optimality for one class of mechanical systems . . . . . . . . . . . . . . . . . . . . . . .
Il’in A. V., Korovin S. K., Fomichev V. V.
Synthesis of minimal linear stabilizers . . . . . . . . . . .
Il’in A. M., Khachay O. Yu.
Solution asymptotics of the confluent system of differential equations with a small parameter . . . . . . . . . . .
Kim A. V.
Limit sets of functional differential equations . . . . . . .
Kleimenov A. F., Kuvshinov D. R., Osipov S. I.
Numerical construction of solutions in nonantagonistic
differential two-person game . . . . . . . . . . . . . . . .
Kolesov A. Yu., Mishchenko E. F., Rozov N. Kh.
Multifrequency auto-oscillations in bidimensional lattices
of connected oscillators . . . . . . . . . . . . . . . . . . .
Kostousova E. K.
On boundedness and unboundedness of polyhedral estimates for reachable sets of linear control systems . . . . .
Krasovskii A. A., Tarasyev A. M.
Construction of nonlinear regulators in the economic growth
model with exhausting energy resources . . . . . . . . . .
Krasovskii N. A., Tarasyev A. M.
Decomposition methods for finding the maximum points
of vector criterion . . . . . . . . . . . . . . . . . . . . . .
Krasovskii N. N., Kotel’nikova A. N.
On a differential game of preventive capture . . . . . . .
Kruglikov S. V.
On hierarchical model of circumstances for optimal route
problem . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
70
72
75
76
79
82
84
86
89
91
93
95
98
Kryazhimskiy A. V., Osipov Yu. S.
Problems of positional control with incomplete information and a method of program packages . . . . . . . . . .
Kurzhanski A. B.
On problems of control for multiagent motion . . . . . .
Lukoyanov N. Yu.
On Hamilton – Jacobi formalism in control of hereditary
dynamical systems . . . . . . . . . . . . . . . . . . . . . .
Murzabekova G. Y.
Solution of codifferentiable functions systems . . . . . . .
Nikonov O. I.
Methods of the guaranteed control theory in finance mathematics . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Petrosyan L. A.
Cooperative differential games on networks . . . . . . . .
Pimenov V. G.
Difference schemes in modelling evolutionary control systems with delay . . . . . . . . . . . . . . . . . . . . . . .
Popova S. N.
Variational methods in problems of control of asymptotical invariants . . . . . . . . . . . . . . . . . . . . . . . . .
Proudnikov I. M.
Properties of integral approximation of nonsmooth functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reshmin S. A.
Method of decomposition for the control of underactuated
mechanical systems . . . . . . . . . . . . . . . . . . . . .
Rozanova O. S.
On a possibility of constructing the generalized solution
to the Hamilton – Jacobi equation . . . . . . . . . . . . .
Roublev I. V., Fayzullin D. S.
On one numerical algorithm for solving three-dimensional
reachability problems . . . . . . . . . . . . . . . . . . . .
Ryashko L. B.
Stabilization of invariant manifolds for nonlinear stochastic systems . . . . . . . . . . . . . . . . . . . . . . . . . .
14
100
103
104
106
108
110
111
113
115
117
120
122
124
Serkov D. A.
On a risk optimal control in the case of program disturbance 125
Smirnov R. O., Chistyakov S.V.
Choice of control parameters in a model of taxation . . . 126
Sokolov V. F.
Data-based evaluation of robust performance of nominal
model under measurement noise . . . . . . . . . . . . . . 127
Srochko V. A.
To the numerical solving of multiextremal control problems in linear systems . . . . . . . . . . . . . . . . . . . . 129
Struzhanov V. V., Prosviryakov E. Yu.
Stability of a deformated gradient system . . . . . . . . . 131
Subbotin Yu. N., Chernykh N. I.
Applying of harmonic wavelets for solution of the biharmonic equation in a disk . . . . . . . . . . . . . . . . . . 133
Subbotina N. N., Kolpakova E. A., Tokmancev T. B.,
Shagalova L. G.
A generalized method of characteristics in the theory and
applications of optimal control processes and conservation
laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
Surkov A. V.
Stabilization and speed of response problems for systems
of functional differential equations . . . . . . . . . . . . . 136
Timofeeva G. A., Zavalishchin D. S.
Control problem of traffic flows on crossroads . . . . . . . 137
Tolstonogov A. A.
Extension of optimal control problems with subdifferential operators . . . . . . . . . . . . . . . . . . . . . . . . . 138
Ukhobotov V. I.
The differential games of the same type with a convex goal
function . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
Ushakov V. N., Uspenskii A. A., Matviychuk A. R.
On constructing solutions of game control problems with
linear control of one of the players . . . . . . . . . . . . . 141
15
Filippova T. F.
Estimates of reachable sets of nonlinear dynamical systems with impulse control . . . . . . . . . . . . . . . . . . 143
Finogenko I.
On controlled systems with discontinuous and impulse
controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Chentsov A. G.
Constraints of asymptotic character and extensions in the class
of finitely additive measures . . . . . . . . . . . . . . . . 147
Chernousko F. L., Bolotnik N. N.
Mobile robots controlled by motion of internal bodies . . 149
Shorikov A. F.
Problem of minimax program control for pursuit-stabilization
process in two-level hierarchical discrete-time dynamical
system . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Shcheglova A. A.
Controllability of nonlinear algebraic differential systems 153
Yanulevich M. V., Strekalovsky A. S.
On numerical solving for one optimal control problem . . 155
Botkin N. D., Hoffmann K.-H.
Control design in cryopreservation of living cells . . . . . 158
Burton T .A., Dwiggins D. P.
Perturbed kernels of integral equations . . . . . . . . . . 160
Chikrii A. A.
Guaranteed result in game problems of dynamics . . . . . 161
Dzhafarov V., Büyükköroğlu T., Akyar H.
Common Lyapunov functions for linear switching systems 162
Falcone M., Rorro M.
Numerical approximation of the effective Hamiltonian and
applications . . . . . . . . . . . . . . . . . . . . . . . . . 163
Feichtinger G., Glass D., Tragler G., Caulkins J. P.
Optimal control of “deviant” behavior . . . . . . . . . . . 165
Glizer V. Y., Turetsky V., Shinar J.
Differential game with linear dynamics and multiple information delays . . . . . . . . . . . . . . . . . . . . . . . 166
16
Guseinov Kh. G., Nazlipinar A. S.
Attainable sets of the nonlinear control systems with limited resources . . . . . . . . . . . . . . . . . . . . . . . . .
Korotkii A. I., Kovtunov D. A.
Optimal boundary control of a system describing thermal
convection . . . . . . . . . . . . . . . . . . . . . . . . . .
Ledyaev Yu. S.
Discontinuous feedback in nonlinear control: dynamic observers and stabilizers . . . . . . . . . . . . . . . . . . . .
Pickl S., Lozovanu D.
Stochastic discrete control problems and dynamic programming algorithms for solving them . . . . . . . . . . .
Malanowski K.
Stability and sensitivity analysis for optimal control problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Melnikov N. B., O’Neill B. C., Dalton M. G.
Aggregation in dynamic equilibrium models of economic
growth with CES functions . . . . . . . . . . . . . . . . .
Mordukhovich B. S.
Optimal control and feedback design of state-constrained
parabolic systems under uncertainties . . . . . . . . . . .
Polovinkin E. S.
On strongly convex analysis and its applications . . . . .
Turova V. L.
Modeling the osmotic de- and rehydration of living cells
using Hamilton – Jacobi equations and reachable set techniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Veliov V. M.
Discrete-time approximations to control/uncertain systems
17
168
170
172
174
176
176
178
179
181
183
Некоторые вопросы обработки изображений
для целей навигации
А. Л. Агеев
Институт математики и механики УрО РАН, Екатеринбург
e-mail: ageev@imm.uran.ru
Обсуждаются задачи приведения управляемого автономного объекта в заданную точку пространства. Поскольку реальное движение
неизбежно несколько отличается от запланированного, то возникает
задача ориентирования (для целей навигации), т. е. уточнения положения объекта во время движения. В настоящее время широко
используются системы спутниковой навигации. Другим реализованным на практике способом уточнения положения является навигация по рельефу местности (математическая постановка см., например, в [1]). Каждый из этих способов имеет свои достоинства и ряд
недостатков.
В докладе обсуждается задача уточнения положения объекта
на основе активных или пассивных датчиков изображений местности
(например, на основе радиолокационных изображений [2], [3]). Математическая постановка этого способа ориентирования на первый
взгляд родственна навигации по рельефу местности, но при этом наличествуют дополнительные трудности: невозможность во многих
ситуациях получить эталонное изображение с приемлемой точностью, неконтролируемые условия проведения съемки, структурные
искажения и т. д. Поэтому вопросы навигации по изображениям земной поверхности требуют дальнейшего исследования. Обсуждается
некоторая программа действий по разработке способов ориентирования в этих задачах. Основная идея заключается в выделении (локализации) на изображении особенностей и ориентации уже по этим
особенностям.
При локализации особенностей необходимо учитывать, что сами
изображения часто искажены и для повышения точности навигации
необходимо проводить обработку изображений, что обычно сводится
c Агеев А. Л., 2009
°
19
к некорректно поставленным проблемам. Требования локализации
особенностей на изображении приводит к необходимости развивать
методы решения нового класса некорректно поставленных задач [4].
Основное содержание доклада – обсуждение проблем, возникающих при обработке изображений для целей навигации. Отметим,
что в одномерной постановке [4] в настоящее время развиты теоретические подходы к построению регулярных методов локализации
особенностей; в двумерной постановке пока теории нет и ее необходимо создавать.
Работа выполнена при поддержке программы президиума РАН «Математическая теория управления» и программы УрО РАН «Исследование новых задач
математической физики и создание алгоритмов их решения».
[1] Бердышев В.И., Костоусов В.Б. Экстремальные задачи и модели навигации по геофизическим полям. Екатеринбург: УрО
РАН, 2007.
[2] Костоусов А.В., Костоусов В.Б. Высокоточная навигация движущихся объектов по радиолокационным изображениям // Динамические системы и проблемы управления. Тр. ИММ УрО
РАН. 2005. Т. 11, № 1. С. 139–148.
[3] Агеев А.Л., Коршунов М.Е. Регулярные алгоритмы в задачах
анализа радиолокационных изображений // Вычислительные
методы и программирование. 2007. Т. 8. С. 275–285.
[4] Агеев А.Л., Антонова Т.В. О новом классе некорректно поставленных задач // Изв. УрГУ. Математика. 2008. № 58. С. 27–45.
20
Задачи коррекции движения
статистически неопределенных систем
Б. И. Ананьев
Институт математики и механики УрО РАН, Екатеринбург
e-mail: abi@imm.uran.ru
Для модели управляемого возмущенного движения рассматриваются минимаксные задачи коррекции с терминальным функционалом при наличии как случайных, так и детерминированных помех
в системе и канале измерения. Первоначальная цель управления в
указанных задачах заключается в выборе такого воздействия, которое бы обеспечило минимакс величины математического ожидания
отклонения объекта от номинального состояния в конечный момент
времени. Не ограничивая общности, номинальным состоянием считаем нуль. Предполагается, что фазовый вектор объекта недоступен
для непосредственного измерения, но по ходу процесса поступает
некоторая дополнительная измерительная информация, позволяющая уменьшить степень неопределенности фазового вектора. Излагаемые ниже постановки примыкают к исследованиям [1–4]. В данной работе предлагаются некоторые модификации задачи коррекции, которые возникли в связи с возрастанием за последнее время
интереса к проблемам оценивания и управления при коммуникационных ограничениях. Это является следствием развития распределенных сетей управления с единым центром обработки информации,
возможно находящимся на значительном удалении от объектов наблюдения и управления. Поэтому ограниченная мощность канала
передачи данных должна приниматься во внимание. Подобные задачи могут возникнуть при исследовании различных режимов поведения удаленных летательных объектов, при корректировке их движения, в частности, при управлении процессом выставки навигационных приборов в момент старта одного летательного аппарата с
другого. Предполагается, что на объекте имеется вычислительный
комплекс, позволяющий запоминать измеряемую информацию, обрабатывать ее с высокой степенью точности, передавать и принимать
закодированные сигналы по каналам связи. В зависимости от вычислительных возможностей комплекса возникают варианты изучаемой
c Ананьев Б. И., 2009
°
21
задачи. Для замкнутости изложения в докладе приведены основные
результаты о возможных решениях задачи однократной коррекции
без учета коммуникационных ограничений. В последующем эти ограничения принимаются во внимание. Сигналы в центр управления и
обработки информации (ЦУОИ) поступают в дискретные моменты
времени словами ограниченной длины, состоящими из целых чисел.
Канал связи также может допускать шумы и запаздывание. Кодирующее устройство в канале связи используется для передачи информации об измеряемых параметрах объекта в ЦУОИ и управляющего
воздействия из ЦУОИ на объект. В ЦУОИ информация о параметрах декодируется и используется для расчета моментов коррекции
и оптимального управления. Получены соотношения между точностью восстановления измеряемых параметров, оптимальным значением функционала, а также длиной передаваемого слова и частотой
передачи. Ряд результатов проиллюстрирован на примере.
Работа выполнена при поддержке РФФИ, проект 07-01-00341.
[1] Красовский Н.Н. Игровая задача о коррекции движения //
Прикл. математика и механика. 1969. Т. 33, вып. 3. С. 386–396.
[2] Ананьев Б.И., Куржанский А.Б., Шелементьев Г.С. Минимаксный синтез в задачах импульсного наведения и коррекции
движения // Прикл. математика и механика. 1976. Т. 40, вып. 1.
С. 3–13.
[3] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[4] Ананьев Б.И. Многократная коррекция движения статистически неопределенных систем // Проблемы управления и приложения: Тез. докл. междунар. конф., Минск, 16–20 мая 2005 года. Минск: Изд-во Ин-та математики НАН Беларуси. 2005. Т. 1.
С. 97–102.
22
Установление существования
замкнутой траектории динамических систем
методом DN-слежения
А. А. Азамов, О. С. Ахмедов, А. М. Тилавов
Институт математики и информационных технологий АН РУз,
Ташкент, Узбекистан
e-mail: abdulla.azamov@gmail.com, axmedov_o@mail.ru
Изучение предельных циклов составляет одну из важных задач
теории динамических систем [1]. Ее исследование, как правило, опирается на предположение существования цикла. Доклад посвящается методу дискретно-численного слежения (DN-слежения), позволяющему при определенных условиях доказать наличие цикла у динамических систем с полиномиальной правой частью [2]. Ранее он был
применен к системам на плоскости:
ẋ = ax + by + x2 , ẏ = cx + dy
(простейшая система с предельным циклом и гомоклинической петлей [3]),
ẋ = a − (1 + b)x + x2 y, ẏ = bx − x2 y
(брюсселятор Пригожина [4]). Оказывается, методом DN-слежения
возможно построение отображения Пуанкаре многомерных систем.
Например, имеет место
Теорема. Система
ẋ = −y − z + x2 − y 2 − z 2 ,
ẏ = x − z − x2 ,
ż = y
имеет замкнутую траекторию.
c Азамов А. А., Ахмедов О. С., Тилавов А. М., 2009
°
23
[1] Аносов Д.В. и др. Динамические системы с гиперболическим
поведением // Динамические системы – 9, Итоги науки и техн.
Сер. Соврем. пробл. математки. Фундам. направления. Т. 66.
М.: ВИНИТИ, 1991. С. 5–247.
[2] Азамов А.А. Метод DN-слежения для доказательства существования предельных циклов // Дифференциальные уравнения и топология: Международная конференция, посвященная
100-летию со дня рождения Л.С. Понтрягина: Тезисы докладов.
М.: Издательский отдел факультета ВМиК МГУ; МАКС Пресс,
2008. С. 87–88.
[3] Азамов А.А., Тилавов А.М. Простейшая динамическая система
с предельным циклом // Узбекский Математический Журнал.
2009. № 2. С. 35–41.
[4] Азамов А.А. Доказательство существования предельного цикла брюсселятора Пригожина методом DN-слежения. (в печати)
24
Стратегия параллельного сближения:
аналогии и обобщения
А. А. Азамов, А. Ш. Кучкаров
Институт математики и информационных технологий АН РУз,
Ташкент, Узбекистан
e-mail: abdulla.azamov@gmail.ru, kuchkarov1@yandex.ru
Б. Т. Саматов
Наманганский Государственный Университет, Наманган,
Узбекистан
e-mail: samatov57@inbox.ru
В дифференциальных играх преследования с простыми движениями одной из эффективных стратегий является стратегия параллельного сближения (π-стратегия, характеризующаяся тем, что
прямые, проходящие через преследующую и убегающую точки,
в процессе игры остаются параллельными), которая эффективно
применялась Л. А. Петросяном [1] и другими авторами при решении различных задач преследования в дифференциальных играх.
Стратегия параллельного сближения в игре простого преследования
с геометрическими ограничениями дала толчок к разработке метода
преследования в играх со многими преследователями [2, 3].
При наличии других ограничений на управления или фазовых
ограничений на движение объектов построение π-стратегии и ее применение не является простой задачей.
В первой части доклада рассматривается модельная дифференциальная игра, описываемая уравнением
ż = kz + Bu + Cv,
z(0) = z0 ,
(1)
где z, u, v, ∈ Rn , n ≥ 1; B, C – невырожденные квадратные матрицы
порядка n × n; k – неположительное число; z0 – начальное состояние
c Азамов А. А., Кучкаров А. Ш., Саматов Б. Т., 2009
°
25
игры и z0 6= 0; u, v – параметры управления преследователя и убегающего соответственно. Параметры управления выбираются в виде
измеримых функций u(·) и v(·), удовлетворяющих ограничениям
||u(·)||2 ≤ ρ,
ρ > 0,
||u(·)||∞ ≤ α,
α > 0,
(2)
||v(·)||2 ≤ σ,
σ > 0,
||v(·)||∞ ≤ β,
β > 0,
(3)
где || · ||p – норма пространства Lp [0, ∞). Преследование считается завершенным, как только z(t∗ ) = 0 при некотором t∗ > 0. Измеримая функция, удовлетворяющая ограничениям (2), называется допустимым управлением класса Uαρ , а удовлетворяющая ограничениям (3) – класса Vβσ . Введение таких пар классов допустимых
управлений преследователя и убегающего определяет девять вариантов игры: (Uα , Vβ ), (U ρ , V σ ), (U ρ , Vβ ), (Uα , V σ ), (U ρ , Vβσ ), (Uαρ , Vβ ),
(Uαρ , V σ ), (Uα , Vβσ ) и, наконец, (Uαρ , Vβσ ). До сих пор, в основном, изучены первые два случая. В докладе обсуждаются π-стратегии и их
применение для других случаев.
Во второй части работы рассматривается дифференциальная игра простого преследования-убегания со многими преследователями [5] на n-мерном компактном римановом многообразии положительной кривизны. При этом предполагается, что динамические возможности всех игроков равны. Доказывается, что возможно завершить преследование в том и только в том случае, если число преследователей больше, чем n. Кроме того, существует такое число T ,
что при любых начальных положениях игроков преследование можно завершить на отрезке времени [0, T ]. Это доказывается с помощью
аналога π-стратегии, которая строится с использованием геодезических линий.
[1] Петросян Л.А. Дифференциальные
Л.: Изд-во ЛГУ, 1977.
игры
преследования.
[2] Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры.
Киев: Наукова Думка, 1992.
[3] Мищенко Е.Ф., Никольский М.С., Сатимов Н.Ю. Задача уклонения от встречи в дифференциальных играх многих лиц // Тр.
Математического института АН СССР. 1977. Т. 143. С. 105–128.
26
Достаточные условия оптимальности
для задач оптимального управления
с траекториями ограниченной вариации
А. В. Баенхаева, О. Н. Самсонюк
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: ayunab2000@mail.ru, samsonuk.olga@rambler.ru
Доклад посвящен исследованию нелинейной задачи оптимального импульсного управления с траекториями ограниченной вариации
при наличии промежуточных фазоограничений в конечном числе
фиксированных моментов времени. Для этой задачи формулируются
достаточные условия оптимальности, базирующиеся на применении
множеств сильно монотонных функций типа Ляпунова — решений
обобщенного неравенства Гамильтона – Якоби.
Рассматриваются обобщенные траектории нелинейной динамической системы
ẋ = f (t, x, V, u) + G(t, x, V )v,
(1)
u(t) ∈ U,
v(t) ∈ K
п. в. на T := [t0 , t1 ].
(2)
Здесь x(·), V (·) — абсолютно непрерывные, u(·), v(·) — измеримые существенно ограниченные вектор-функции; V̇ (t) = ||v(t)||, V (0) = 0;
U ⊂ Rd(u) — компактное множество, K ⊂ Rd(v) — выпуклый заd(v)
X
мкнутый конус; ||v|| =
|vi |; d(z) — размерность вектора z. Функi=1
ции f (t, x, V, u), G(t, x, V ) непрерывны по совокупности переменных,
локально липшицевы по x и удовлетворяют условиям не более чем
линейного роста по x равномерно относительно t, V , u; множество
f (t, x, V, U ) выпуклое ∀(t, x, V ).
Траектории¡ системы¢ (1), (2), соответствующие допустимой паре управлений u(·), v(·) , будем называть регулярными. Множество
обобщенных траекторий — непрерывных справа на (t0 , t1 ] векторфункций ограниченной вариации — определим путем замыкания
в слабой∗ топологии множества регулярных. Импульсным
процес¡
¢
сом системы (1), (2) будем называть набор x(·), V (·), u(·), dw ,
c Баенхаева А. В., Самсонюк О. Н., 2009
°
27
¡
¢
в котором ¡x(·), V (·)
— обобщенная траектория, соответствую¢
щая паре u(·), dw ; u(·) ∈ L∞ (T, U ) — обычное управление,
dw ∈ C ∗ (T, K) — импульсное
управление.
Заметим, что регулярный
¡
¢
процесс системы x(·), V (·), u(·), v(·) описывается как импульсный
при dw = v(t)dt.
Пусть t0 = θ0 < θ1 < · · · < θN = t1 — заданные моменты времени.
Обозначим через b вектор, составленный из векторов односторонних
пределов траекторий в моменты θj :
³
´
b := x(θ0 −), {x(θj −), V (θj −), x(θj ), V (θj )}j=1,N −1 , x(θN ), V (θN ) .
На множестве импульсных процессов системы (1), (2) рассматривается задача P :
l(b) → inf,
b ∈ C.
Рассмотрим систему дифференциальных неравенств относительно локально липшицевых функций ϕ(t, x, V ), определенных при
t ∈ ∆, где ∆ ⊂ T — заданный отрезок,
ϕt + max (ϕx , f (t, x, V, u)) 6 0,
u∈U
max
ω∈K, ||ω||=1
(ϕx , G(t, x, V )ω) + ϕV 6 0.
(3)
Система (3) представляет собой обобщение неравенства Гамильтона – Якоби для импульсных процессов. Функции ϕ (функции типа
Ляпунова), удовлетворяющие (3) при t ∈ ∆j = [θj−1 , θj ], обладают
свойством монотонного невозрастания вдоль импульсных процессов
системы (1), (2) на ∆j . Следовательно, наборы таких функций при
j = 1, N будут давать внешние оценки множества достижимости
управляемой импульсной системы, оценки снизу для функционала
задачи P и, соответственно, достаточные условия глобальной и локальной оптимальности импульсных процессов [1].
Рассматривается возможность использования составных (разрывных) функций типа Ляпунова ϕ, что позволяет лучше учесть
импульсную структуру процессов и присутствие в задаче промежуточных фазоограничений. Применение достаточных условий иллюстрируется на ряде примеров, в том числе с управляемыми системами, не удовлетворяющими условию корректности перехода к импульсным процессам.
Работа выполнена при поддержке РФФИ, проект 07-01-00741, и УралоСибирского интеграционного проекта № 85.
28
[1] Дыхта В.А. Инвариантность, достижимость и оптимальность
в управляемых динамических системах // Методы оптимизации и их приложения: Труды XIV Байкальской международной
школы-семинара, Иркутск, Байкал, 2–8 июля 2008 г. Иркутск:
Изд-во ИСЭМ СО РАН, 2008. Т. 2. C. 35–46.
Конфликтное взаимодействие
групп управляемых объектов
А. С. Банников, Н. Н. Петров, Д. В. Сахаров
Удмуртский государственный университет, Ижевск
e-mail: npetrov@udmnet.ru
Рассматриваются различные задачи конфликтного взаимодействия групп управляемых объектов при равных возможностях всех
участников.
1. Нестационарная задача конфликтного взаимодействия
Рассматривается дифференциальная игра Γ(n, m) n + m лиц:
n преследователей и m убегающих с законами движения и начальными условиями
ẋi = A(t)xi + ui ,
xi (t0 ) =
x0i ,
ẏj = A(t)yj + vj ,
yi (t0 ) = yj0 ,
ui , vj ∈ V,
где A(·) — измеримая матричная функция, V — выпуклый компакт.
Цель преследователей — переловить всех убегающих, цель убегающих — хотя бы одному из них избежать поимки. В стационарном
случае задача рассматривалась в [1].
Определение 1. Будем говорить, что в дифференциальной иг0
)
ре Γ(n, m) из начального состояния z 0 = (x01 , . . . , x0n , y10 , . . . , ym
разрешима локальная задача уклонения, если существуют такие
управления v1 (t), . . . , vm (t) убегающих, что при любых управлениях u1 (t), . . . , un (t) преследователей найдется номер s ∈ {1, . . . , m},
такой, что ys (t) 6= xi (t) для всех i ∈ {1, . . . , n} при всех t ≥ t0 .
c Банников А. С., Петров Н. Н., Сахаров Д. В., 2009
°
29
Получены достаточные условия разрешимости локальной задачи
уклонения.
В случае, если A(t) = a(t)E, где a(t) — измеримая вектор-функция, E — единичная матрица, получены достаточные условия разрешимости глобальной задачи уклонения.
2. Конфликтное взаимодействие инерционных объектов
В пространстве Rk (k ≥ 2) рассматривается дифференциальная
игра Γ(n, m) n+m лиц: n преследователей P1 , . . . , Pn и m убегающих
E1 , . . . , Em с законами движения и начальными условиями
(l)
xi = ui ,
(l)
y j = vj ,
ui , v ∈ V,
(s)
(s)
0
xi (0) = x0is , yj (0) = yjs
,
где i = 1, . . . , n; j = 1, . . . , m; s = 0, . . . , l − 1; V — выпуклый компакт.
Определение 2. Будем говорить, что в игре Γ(n, 1) происходит поимка, если существуют момент T > 0 и квазистратегии Ui (t, z 0 , vt (·))
преследователей Pi такие, что для любой измеримой функции v(·),
v(t) ∈ V, t ∈ [0, T ], существуют момент времени τ ∈ [0, T ] и номер q,
(s)
такие, что xq (τ ) = y (s) (τ ) для всех s.
Определим функцию [2] f : N → N вида f (n) = min{m : в игре Γ(n, m) происходит уклонение от встречи из любых начальных
позиций}.
Теорема 1. Пусть V — строго выпуклый компакт с гладкой границей. Тогда существуют c1 > 0, c2 > 0 такие, что для всех n 6= 1
справедливо неравенство c1 n ln n ≤ f (n) ≤ c2 n ln n.
Теорема 2. Пусть l = 1, V — выпуклый компакт с непустой внутренностью. Тогда существует константа c > 0 такая, что для
всех n 6= 1 справедливо неравенство f (n) ≤ c2 n ln n.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления».
[1] Чикрий А.А. Конфликтно управляемые процессы. Киев: Наукова думка, 1968.
[2] Петров Н.Н., Петров Н. Никандр. О дифференциальной игре «казаки-разбойники» // Дифференц. уравнения. 1983. Т. 19,
№ 8. C. 1366–1374.
30
Относительная видимость
движущегося объекта для группы наблюдателей
В. И. Бердышев
Институт математики и механики УрО РАН, Екатеринбург
e-mail: bvi@imm.uran.ru
Пусть наблюдаемый объект t движется в R3 . Задано замкнутое множество G ⊂ R3 , препятствующее видимости. Имеется наблюдатель f , местоположение которого задано с погрешностью
h = h(f ) > 0. Для наблюдателя
предпочтительна
ситуация, когда из
©
ª
точек шара Vh (f ) = v : |v − f | ≤ h видны все точки шара Vr (t) при
некотором r > 0, точнее, когда Kr,h ∩ G = ∅, где
¡
¢
Kr,h = Kr,h (t, f ) = conv Vr (t) ∪ Vh (f ) \Vh (f ),
conv — выпуклая оболочка множества, | · | — евклидова норма.
Функции
r(t, f, G) = min{r : Kr,h ∩ G 6= ∅},
A(t, f, G) = r(t, f, G)/|t − f |
характеризуют видимость объекта t для наблюдателя f и относительную видимость. Функция r(t, f, G) введена в [1] в частном случае
h(f ) = 0.
Пусть выбрано направление e
t, |e
t| = 1, движения точки t. Естественно предположить, что, когда наблюдаемый объект окажется
в точке tλ = t + λ e
t (λ ≥ 0), наблюдатель, стремясь сохранить tλ
в зоне видимости, переместится в точку fλ = f +c(λ) (tλ −f ) / |tλ −f |,
при этом погрешность в определении положения наблюдателя может
измениться: hλ = h(fλ ). Пусть функции hλ и cλ = c(λ) дифференцируемы, c(0) = 0, h(0) = h.
При выборе маршрута движения объекта t важно знать величину
производной по направлению
∂A
A(tλ , fλ , G) − A(t, f, G)
= lim
.
λ→+0
λ
∂e
t
c Бердышев В. И., 2009
°
31
Пусть g ∈ V|t−f | (t) \ conv{Vh (f ) ∪ t}, R = R(t, f, g) =
= min{r : g ∈ Kr,h }. Граница bd Kr,h множества Kr,h есть объединение трех поверхностей: конической kr,h и двух сферических
sr (t) ⊂ Sr (t), sh (f ) ⊂ Sh (f ), где Sr (t) = {v : |t − v| = r}. В случае
g ∈ kR,h обозначим: Lg — образующая поверхности kR,h (g ∈ Lg ),
p(g) = SR (t) ∩ Lg , tg ∈ [t, f ] — точка, для которой отрезок [tg , g]
ортогонален прямой Lg .
С использованием теоремы В. Ф. Демьянова (см. [2]) о дифференцировании функции максимума устанавливаются следующие
теоремы.
Теорема 1. Функция r = r(t, f, G) дифференцируема по любому направлению e
t, |e
t| = 1, и
n ∂R(t, f, g)
o
∂r
= min
: g ∈ G(t) ,
∂e
t
∂e
t
где
G(t) = {g ∈ G : R(t, f, g) = r(t, f, G)},
∂R
1)
= − cos ξ при g ∈ sR (t),
∂e
t
¢
|t − f | − |tg − f | d ¡
∂R
= − cos ξ +
2)
cλ − hλ λ=0 при g ∈ kR,h ,
e
|t
−
f
|
dλ
∂t
g
ξ – угол между векторами g − t, e
t в случае 1) и угол между векторами (p(g) − t), e
t в случае 2).
Теорема 2. Имеет место равенство
∂A(t, f, G)
1
∂r(t, f, G) r(t, f, G)
=
+
e
|t
−
f
|
|t − f |2
∂t
∂e
t
µ
¶
dc(0)
+ cos γ ,
dλ
где γ — угол между векторами f − t, e
t.
Для компактного множества F = {f } наблюдателей определены
функции
R(t) = max r(t, f, G),
A(t) = max A(t, f, G).
f ∈F
f ∈F
С помощью теорем 1, 2 решается вопрос о существовании направлений e
t, вдоль которых в окрестности точки t функции R(t), A(t)
убывают.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления».
32
[1] Бердышев В. И. Два способа характеризации видимости двигающейся точки // Тр. ИММ УрО РАН. 2008. Т. 14, № 3. С. 67–81.
[2] Демьянов В. Ф., Малоземов В. Н. Введение в минимакс. М.: Наука, 1972.
Нелинейная задача последовательного управления
с элементами противодействия
Ю. И. Бердышев
Институт математики и механики УрО РАН, Екатеринбург
e-mail: berd@imm.uran.ru
Управляемая нелинейная система третьего порядка (преследователь), описывающая простейшую модель движения автомобиля (самолета) в горизонтальной плоскости, имеет своей целью за кратчайшее время поочередно сблизиться с двумя точками (убегающими),
каждая из которых движется в горизонтальной плоскости по своей
прямой. Начальные состояния преследователя и убегающих заданы.
При этом убегающий считается пойманным, если местоположения
его и преследователя в некоторый момент времени совпадут.
Временем поимки считается время сближения с последним убегающим. Целью убегающих является максимизация времени поимки.
Для достижения этой цели они могут в начальный момент времени
выбрать направления движения, однозначно определяемые углами
β1 и β2 . Предполагается, что этот выбор осуществляется в начальный момент времени и о нем мгновенно становится известно преследователю, который в зависимости от этих углов выбирает очередность сближения с убегающими и управление своим движением,
доставляющими минимум времени поимки. При этом рассматривается также случай, когда очередность сближения задана.
Задачей убегающих является определение таких углов β1 и β2 ,
которые бы максимизировали время поимки убегающих при оптимальном поведении преследователя.
Идейной основой работы являются принцип максимума
Л. С. Понтрягина [1] и общий принцип двойственности, установленный Н. Н. Красовским, сформулированный им в виде
c Бердышев Ю. И., 2009
°
33
проблемы моментов [2, гл. 5], а также результаты применения
принципа двойственности при решении линейных задач управления
при стесненных фазовых координатах [3, 4]. Следует отметить,
что задачи последовательной оптимизации в игровой постановке
рассматривались в работах [5, 6]. Исследуемая нелинейная система
третьего порядка использовалась Р. Айзексом [7] при постановке
задачи «шофер-убийца».
Решение поставленной задачи при заданной очередности сближения основано на необходимых условиях оптимальности управления преследователя [8] и оптимальности векторного параметра
β = (β1 , β2 ) [9]. При незаданной очередности сближения указано дополнительное условие, которому должен удовлетворять параметр β.
Разработан алгоритм построения траектории преследователя и выбора направления движения убегающих.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ, проект 09-01-00436.
[1] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.:
Физматгиз, 1961.
[2] Красовский Н.Н. Теория управления движением. М.: Наука,
1968.
[3] Куржанский А.Б., Осипов Ю.С. К задаче об управлении с ограниченными фазовыми координатами // Прикл. математика и
механика. 1968. Т. 32, вып. 2. С. 196–203.
[4] Куржанский А.Б., Осипов Ю.С. К задаче об управлении при
стесненных ограничениях // Прикл. математика и механика.
1969. Т. 33, вып. 4. С. 705–719.
[5] Krasovskii A.N., Krasovskii N.N. Control under lack of information.
Basel: Birkhäuser, 1995.
[6] Красовский Н.Н., Лукоянов Н.Ю. Задача конфликтного управления с наследственной информацией // Прикл. математика и
механика. 1996. Т. 60, вып. 6. С. 885–900.
[7] Айзекс Р. Дифференциальные игры. М.: Мир, 1967.
34
[8] Бердышев Ю.И. О одной задаче последовательного сближения
нелинейной управляемой системы третьего порядка с группой
движущихся точек // Прикл. математика и механика. 2002.
Т. 66, вып 5. С. 742—752.
[9] Бердышев Ю.И. Об одной нелинейной задаче последовательного управления с параметром // Изв. РАН. Теория и системы
управления. 2008. Вып. 3. С. 58–63.
О динамической реконструкции
в системах с последействием
М. С. Близорукова, А. М. Кадиев, В. И. Максимов
Институт математики и механики УрО РАН, Екатеринбург
e-mail: msb@imm.uran.ru, kadiev@imm.uran.ru, maksimov@imm.uran.ru
В теории дифференциальных уравнений хорошо известна задача о нахождении параметров дифференциального уравнения, имеющего в качестве решения заданную функцию. Неизвестные параметры (вообще говоря, не постоянные и зависящие от времени) могут быть управлениями, динамическими возмущениями, коэффициентами, какими-либо характеристиками системы и т. д. Как правило, эта задача является некорректной. Во-первых, заданному решению может соответствовать неединственный параметр. Последнее часто приводит к новой задаче выбора параметров. Например,
для задачи восстановления управления обычно интересуются нахождением управления с экстремальным (максимальным или минимальным) энергетическим ресурсом. Во-вторых, отображение «решение → параметр», вообще говоря, является разрывным. Таким
образом, это отображение нельзя использовать для вычисления искомого параметра, если вместо точного решения задано возмущенное решение. Трудности возрастают, если вместо возмущенного решения уравнения задана некоторая функция, не являющаяся решением. В этих условиях «аппроксимативное» свойство должно обеспечиваться некоторыми регуляризирующими процедурами. Кроме
того, существует проблема конструктивного описания и построения
отображения «решение → параметр».
c Близорукова М. С., Кадиев А. М., Максимов В. И., 2009
°
35
Отмеченную выше задачу нахождения соответствующих параметров по решениям уравнений часто называют задачей реконструкции (идентификации). При этом, как правило, предполагается, что
входная информация (результаты измерения текущих фазовых состояний системы) поступает по ходу процесса и неизвестные параметры должны восстанавливаться также по ходу процесса. Один из
подходов к решению подобного типа задач был предложен в работах Ю. С. Осипова. Указанный подход, основанный на принципах позиционного управления и методах решения некорректных задач, фактически сводит задачу идентификации к задаче управления
вспомогательной динамической системой, часто называемой моделью. При этом регуляризация рассматриваемой задачи осуществляется локально на этапе выбора в дискретные моменты времени позиционного управления в модели. Сформулированный метод
был реализован для ряда задач, описываемых некоторыми классами
обыкновенных дифференциальных уравнений, дифференциальнофункциональными уравнениями, а также уравнениями и вариационными неравенствами с распределенными параметрами. При этом
восстанавливались различные переменные характеристики систем:
неизвестные разрывные входные воздействия, начальные и граничные данные, распределенные возмущения, коэффициенты эллиптического оператора и т. д.
Цель настоящего сообщения заключается в подведении итогов исследований, проведенных за последние годы. Мы укажем некоторые
новые алгоритмы реконструкции, причем коснемся только исследований, связанных с задачами реконструкции для дифференциальнофункциональных уравнений, не затрагивая обыкновенных дифференциальных уравнений, а также уравнений математической физики и механики. При этом покажем роль априорной информации (т. е.
информации о структуре системы, свойствах множества допустимых
управлений, свойствах восстанавливаемых величин, характере измерений и т. д.) при выборе того или иного алгоритма. Основное
внимание уделим проблемам реконструкции негладких и «неограниченных» управлений; рассмотрим случаи измерения (с ошибкой) как
всех, так и «части» координат; остановимся на некоторых оценках
скорости сходимости соответствующих алгоритмов.
Работа выполнена в рамках программы Президиума РАН «Математическая теория управления», а также при поддержке РФФИ, проект 09-01-00378,
и Урало-Сибирского интеграционного проекта.
36
Задачи оптимальной терапии
в биологических моделях
А. С. Братусь, Е. С. Чумерина
Московский государственный университет путей сообщения
e-mail: applmath1miit@yandex.ru, chumerina@mail.ru
А. В. Антипов
Московский государственный университет
Рассматриваются математические модели химиотерапии однородных и неоднородных несосудистых опухолей. В случае неоднородной опухоли предполагается, что она состоит из клеток двух типов:
клеток, поддающихся воздействию химиотерапии, и клеток, не чувствительных к нему. Однородная опухоль состоит только из клеток
первого типа. Их рост описывается логистическим законом или законом Гомперца. Степень воздействия химиотерапевтического средства на клетки опухоли определяется функцией терапии. Исследуются два вида функции терапии: всюду монотонно возрастающая и
возрастающая до некоторого порогового значения, а затем убывающая. В первом случае, чем больше в опухоли химиотерапевтического средства, тем сильнее воздействие на нее. В случае немонотонной
функции терапии действенность препарата уменьшается при достижении заданной величины. Решается задача оптимального управления с целью минимизации числа клеток к фиксированному моменту
времени при двух видах ограничений: на величину количества химиотерапевтического средства, вводимого в опухоль в единицу времени, и на его суммарное количество, используемое за указанный
промежуток.
В случае математических моделей химиотерапии однородных
опухолей решена задача синтеза оптимального управления методом динамического программирования [1,2]. В случае неоднородных
опухолей найдены необходимые условия оптимальности с помощью
c Братусь А. С., Чумерина Е. С., Антипов А. В., 2009
°
37
принципа максимума Понтрягина, на основании которых получены
выводы о характере оптимальной стратегии терапии.
[1] Братусь А.С., Чумерина Е.С. Cинтез оптимального управления в задаче выбора лекарственного воздействия на растущую
опухоль // Журн. вычислительной математики и математической физики. 2008. Т. 48, вып. 6. C. 946–966.
[2] Чумерина Е.С. Выбор оптимальной стратегии химиотерапии в
модели Гомперца // Изв. РАН. Теория и системы управления.
2009. № 2. С. 170–176.
Непрерывная обратная связь
в задачах уклонения от окружности
С. А. Брыкалов, Я. А. Латушкин
Институт математики и механики УрО РАН, Екатеринбург
e-mail: brykalov@imm.uran.ru, yarlat@mail.ru
В теории позиционных дифференциальных игр [1–3] представляют существенный интерес вопросы, относящиеся к структуре и свойствам различных классов стратегий. При этом принципиальным является вопрос [2–6] о свойствах непрерывных стратегий и их связи с
программными управлениями. Этот вопрос подробно изучен [4–6]
для линейных управляемых систем в предположении выпуклости
терминального множества.
Рассматриваются три примера дифференциальных игр с невыпуклым терминальным множеством, иллюстрирующие свойства непрерывных стратегий.
Во всех случаях игра происходит на плоскости, причем терминальным множеством является окружность с центром в начальной
точке, которая совпадает с началом координат x21 + x22 = 1. Во всех
примерах динамика задается одной и той же системой двух дифференциальных уравнений
ẋ = 2(1 − t)u + v.
c Брыкалов С. А., Латушкин Я. А., 2009
°
38
Примеры различаются геометрическими ограничениями на управления игроков.
В первой из рассматриваемых игр геометрические ограничения
задаются двумя перпендикулярными отрезками равной длины
P = {u = (0, u2 ) : −1 ≤ u2 ≤ 1} , Q = {v = (v1 , 0) : −1 ≤ v1 ≤ 1} .
Во второй игре ограничения имеют вид отрезка и квадрата
P = {u = (u1 , u2 ) : −1 ≤ u1 ≤ 1, −1 ≤ u2 ≤ 1} ,
Q = {v = (v1 , 0) : −2 ≤ v1 ≤ 2} .
В третьей задаче используются два совпадающих отрезка
P = {u = (u1 , 0) : −1 ≤ u1 ≤ 1} , Q = {v = (v1 , 0) : −1 ≤ v1 ≤ 1} .
Поэтому третий пример фактически является одномерным, и терминальное множество можно считать двухточечным.
Исследования первого из авторов выполнены при поддержке РФФИ, проект
09-01-00313.
[1] Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970.
[2] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[3] Красовский Н.Н. Управление динамической системой. Задача о
минимуме гарантированного результата. М.: Наука, 1985.
[4] Барабанова Н.Н., Субботин А.И. О непрерывных стратегиях
уклонения в игровых задачах о встрече движений // Прикл.
математика и механика. 1970. Т. 34, вып. 5. С. 796–803.
[5] Барабанова Н.Н., Субботин А.И. О классах стратегий в дифференциальных играх уклонения от встречи // Прикл. математика
и механика. 1971. Т. 35, вып. 3. С. 385–392.
[6] Красовский Н.Н. Дифференциальные игры. Аппроксимационные и формальные модели // Мат. сб. 1978. Т. 107, № 4.
С. 541–571.
39
Преобразование моделей
в динамике систем и их свойства
С. Н. Васильев
Институт проблем управления РАН, Москва
e-mail: vassilyev_sn@mail.ru
В задачах аналитической механики, теории устойчивости и
управления движением нередко исходные модели (например, в форме уравнений Лагранжа) преобразуются к некоторым другим видам. Вместе с тем известно, что даже такие модельные преобразования, как замена переменных в форме гомеоморфизмов или диффеоморфизмов, могут не сохранять требуемую динамику, хотя бы
даже лишь в одном из направлений (в сторону преобразования или
обратную). В частности, может не сохраняться устойчивость решений обыкновенных дифференциальных уравнений, что отмечалось
еще А. М. Ляпуновым.
В докладе рассматриваются модельные преобразования двух видов: 1) координатные и некоторые другие преобразования типа траекторных морфизмов (гомеоморфизмы, диффеоморфизмы, гомоморфизмы, динаморфизмы в смысле М. Арбиба и Е. Мейнса и др.),
2) преобразования, введенные разными авторами в развитие аппарата функций Ляпунова (см. ниже).
Как известно, функции Ляпунова оказались полезны не только
в задачах устойчивости, но и во многих областях анализа: в оптимальном управлении и теории дифференциальных игр, в теории
нелинейных колебаний, в оценках точности численных методов интегрирования и т. д. Развитие второго метода Ляпунова в динамике
систем, задачах стабилизации, оптимальном управлении, дифференциальных играх выполнено в основополагающих работах Н. Г. Четаева, Н. Н. Красовского и других ученых.
Смысл модельного преобразования функция Ляпунова приобрела в 60-е гг. (W. Hahn, C. Corduneanu, В. М. Матросов и др.) Путем
синтеза идей второго метода Ляпунова с теорией дифференциальных неравенств Чаплыгина – Важевского В. М. Матросов предложил метод сравнения в терминах вектор-функций Ляпунова (ВФЛ)
c Васильев С. Н., 2009
°
40
как преобразований, сводящих изучение исходных моделей (вообще
говоря, в банаховых пространствах) к изучению конечномерных систем обыкновенных дифференциальных уравнений (ОДУ). Обобщением конструкции ВФЛ являются вектор-функции сравнения (ВФС;
В. М. Матросов, С. Н. Васильев, 1974), которым, по существу, аналогичны преобразования, используемые и в других методах, аналогичных методу сравнения. Аналогами ВФС являются: матричнозначные функции Ляпунова (А. А. Мартынюк, Р. Гутовский и др.),
отображения, «сохраняющие устойчивость», (A. Michel и др.), «нелинейные отображения» в задачах оптимального управления (предложенные А. И. Москаленко в развитие работ В. Ф. Кротова) и др.
Модельные преобразования типа морфизмов могут возникать
в более широком контексте, чем в случае метода сравнения, так
что вопрос может состоять не в отыскании преобразования ВФС,
а об условиях корректности уже имеющегося преобразования с точки зрения сохранения (в ту или иную сторону) динамики, интересующей исследователя. Ранее был предложен метод редукции (С. Н. Васильев, 2006) для получения таких условий применительно к разным
модельным преобразованиям и разного вида исследуемой динамике.
В основе этого метода применена техника решения уравнений
в исчислении предикатов с некоторым требованием взаимной согласованности известных членов этих уравнений. Метод редукции был
использован для исследования корректности преобразований систем
ОДУ с применением в динамическом анализе одной задачи группового управления движущихся объектов (С. Н. Васильев, Р. И. Козлов,
С. А. Ульянов, 2009).
В докладе развивается качественная теория гибридных и дискретно-событийных систем, интенсивно изучаемых в литературе.
Рассмотрены преобразования этих динамических систем в форме
морфизмов и ВФС. Развит метод редукции (в том числе в направлении снятия ранее упомянутых требований согласованности) и получены условия сохранения устойчивости и достижимости при этих
преобразованиях. Развитие метода редукции выполнено с привлечением идей метода синтеза условий логической выводимости первопорядковых формул (С. Н. Васильев, 1997).
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ (проекты 08-08-90026-Бел-а,
08-08-90425-Укр-а) и Программы государственной поддержки ведущих научных
школ (НШ-1676.2008.1).
41
О стабилизации движущихся формаций
в условиях неопределенности
С. Н. Васильев, С. А. Ульянов
Институт проблем управления РАН, Москва
e-mail: vassilyev_sn@mail.ru, noodles777@gmail.ru
Р. И. Козлов
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: kozlov@icc.ru
Под формацией понимается совокупность движущихся объектов,
связанных попарно отношениями «лидер-ведомый» со связным орграфом. Ведомые управляют своим движением на основе измерения каких-то из параметров собственного движения, а также движения своих лидеров относительно них, стремясь удовлетворять некоторым соотношениям между относительными положениями, скоростями и др., определяющим желаемую конфигурацию группировки.
Один из объектов, не будучи ведомым ни в одной паре, является
лидером всей формации и задает ее движение в целом. Его маневры, ограниченные некоторыми пределами, являются первопричиной
непрерывного нарушения желаемой конфигурации, которое призваны отрабатывать ведомые. Другая причина — начальные отклонения конфигурации от желаемой, которые должны быть устранены
(уменьшены) в течение некоторого начального отрезка времени.
В предположении, что управление каждого объекта является автономным, в докладе дается формализация желаемого поведения
формации. В отличие от большинства известных постановок задач
устойчивости формаций, с целью большего соответствия реальности, помимо начальных возмущений и возмущений, обусловленных
маневрами лидера, учитываются также параметрические и иные возмущения (в частности, погрешности измерителей и других элементов
c Васильев С. Н., Козлов Р. И., Ульянов С. А., 2009
°
42
рассматриваемой децентрализованной системы управления, а также
возможная неполнота измерений). Поэтому ставится задача стабилизации только до свойства диссипативности.
В качестве примера рассматривается отряд (platoon of vehicles)
в форме вереницы (string of vehicles) движущихся друг за другом
объектов, каждый из которых, кроме лидера отряда, управляет своим вектором скорости, стараясь поддерживать дистанцию до предыдущего объекта и направление движения на него. Предполагается,
что это управление осуществляется без оглядки на идущего следом,
а лидер отряда может совершать ограниченные по скоростям и ускорениям линейные и угловые маневры.
Расчеты выполнены с использованием программного комплекса
ВФЛ-РЕДУКТОР, предназначенного 1) для алгоритмического получения критериев наличия требуемой динамики и 2) для их применения в анализе и синтезе систем управления. Охвачены классы непрерывных, дискретных (включая автоматные) и непрерывнодискретных (с цифровым управлением) динамических систем, в том
числе с учетом неопределенностей и постоянно-действующих возмущений, погрешностей элементов, а также ограничений на управления. В основе комплекса лежат метод редукции [1] и метод исследования нелинейных динамических систем с неопределенностями
в классе сублинейных вектор-функций Ляпунова [2].
В отличие от [3], задача решается при более широких предположениях относительно угловых маневров лидера, рассматриваются
различные варианты формирования стабилизирующих управлений,
в том числе с дискретной по времени реализацией управления при
дискретных же измерениях. В последнем случае из-за распределенности управления квантование получается асинхронным, что является особенностью подобных непрерывно-дискретных систем.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ (проекты 08-08-90026-Бел-а,
08-08-90425-Укр-а, 08-08-92208ГФЕН-а) и Программы государственной поддержки ведущих научных школ (НШ-1676.2008.1).
[1] Васильев С.Н. Метод редукции и качественный анализ динамических систем, I, II // Изв. РАН. Теория и системы управления.
2006. № 1. С. 21–29; № 2. С. 5–17.
43
[2] Козлов Р.И. Сублинейные ВФЛ в исследовании нелинейных систем управления с неопределенностями и структурными возмущениями // Оптимизация, управление, интеллект. 2001. T. 5 (2).
C. 268–277.
[3] Васильев С.Н., Козлов Р.И., Ульянов С.А. Анализ координатных и других преобразований моделей динамических систем методом редукции // Тр. ИММ УрО РАН. (в печати)
Итерационные процессы фейеровского типа
и их приложения
В. В. Васин, И. И. Еремин
Институт математики и механики УрО РАН, Екатеринбург
e-mail: vasin@imm.uran.ru, eremin@imm.uran.ru
Многие содержательные задачи могут быть сформулированы
в виде проблемы нахождения неподвижной точки некоторого отображения T, т. е. решения уравнения
x = T (x),
(1)
где оператор T : X → X, X — гильбертово пространство. Исследованию существования (принцип неподвижной точки) и сходимости
итерационных процессов типа метода последовательных приближений
xk+1 = T (xk )
(2)
и его модификаций посвящена огромная литература.
В докладе рассматриваются два нетрадиционных класса отображений T [1] и соответствующий им итерационный процесс (2).
Определение 1. Оператор T : X → X называется M -фейеровским
(M -строго нерастягивающим), если F ix(T ) = M 6= ∅
и ||T (x) − z|| < ||x − z|| ∀x ∈
/ M, ∀z ∈ M ; обозначим класс таких
операторов через FM .
c Васин В. В., Еремин И. И., 2009
°
44
Определение 2. Оператор T : X → X называется сильно M фейеровским (M -псевдосжимающим), если F ix(T ) = M 6= ∅ и существует κ > 0 такое, что выполнено соотношение
||T (x) − z||2 6 ||x − z||2 − κ||x − T (x)||2
∀x ∈
/ M, ∀z ∈ M ;
обозначаем класс через PM .
Эти классы обладают замечательным свойством, заключающимся в их замкнутости относительно суперпозиции определенного типа.
Теорема. Пусть T : X → X, Ti ∈ FMi (Ti ∈ PMi ) и
m
T
Mi = M 6= ∅. Тогда
i=1
T =
m
X
αi Tin11 Tin22 . . . Tinmi ∈ FM (T ∈ PM ),
i=1
n
X
αi = 1, αi > 0.
i=1
Это открывает широкие возможности естественной декомпозиции задачи (1) и сборки алгоритмов из некоторой совокупности более
простых.
В докладе обсуждается история вопроса, излагаются принципы
конструирования фейеровских операторов, которые генерируют итерационные последовательности, аппроксимирующие решения широкого круга собственных и несобственных задач математического программирования, корректных и некорректных проблем, стесненных
дополнительными априорными ограничениями.
Эффективность предлагаемого аппарата фейеровских процессов
иллюстрируется на примере решения обратных задач, возникающих
в структурных исследованиях материалов, обработке изображений,
радиолокации ионосферы, термическом зондировании атмосферы и
тестировании продуктивности скважин.
Работа поддержана РФФИ, проект 09-01-00053, и грантом Президента РФ,
проект НШ 2081.2008.1.
[1] Васин В.В., Еремин И.И. Операторы и итерационные процессы
фейеровского типа. Теория и приложения. Москва – Ижевск:
ИКИ, НИЦ, «РХД», 2005.
45
Задачи оптимального управления
с подвижной целью
Р. Габасов, Е. И. Поясок
Белорусский Государственный университет, Минск, Беларусь
e-mail: elena_pojasok@mail.ru
Н. М. Дмитрук, Ф. М. Кириллова
Институт математики НАН Беларуси, Минск, Беларусь
e-mail: dmitruk@im.bas-net.by, kirill@nsys.by
На промежутке T = [t∗ , t∗ ] функционируют: объект управления
ẋ = A(t)x + b(t)u + M (t)w, t ∈ T ; x(t∗ ) = x0
(1)
и подвижная цель
x̃˙ = Ã(t)x̃ + b̃(t)v + M̃ (t)w, t ∈ T ; x̃(t∗ ) = x̃0 .
(2)
Здесь x = x(t) ∈ Rn , x̃ = x̃(t) ∈ Rn – состояния объекта управления
и цели; u = u(t) ∈ R – управляющее воздействие; v = v(t) ∈ R –
маневрирующее усилие цели; w = w(t) ∈ Rnw – возмущение.
Если b̃(t) = 0, t ∈ T , то будем говорить о неманеврирующей цели,
в противном случае цель маневрирующая.
Доступными управляющими воздействиями
u(·) = (u(t) ∈ U, t ∈ T )
считаются дискретные функции [1].
Неизвестные маневрирующие усилия v(t), t ∈ T , и возмущения
w(t), t ∈ T , представимы в виде
v(t) = v1 (t) + v2 (t), w(t) = w1 (t) + w2 (t), t ∈ T,
где
v1 (t) = Kv (t)v, v ∈ V1 ; w1 (t) = Kw (t)w, w ∈ W1 , t ∈ T,
– регулярные компоненты,
v2 (t) ∈ V2 ; w2 (t) ∈ W2 , t ∈ T,
c Габасов Р., Дмитрук Н. М., Кириллова Ф. М., Поясок Е. И., 2009
°
46
– нерегулярные компоненты (V1 , W1 , V2 , W2 ; Kv (t), Kw (t), t ∈ T , –
известны; v, w; v2 (t), w2 (t), t ∈ T , – произвольны).
В случае, когда M (t) = 0, M̃ (t) = 0, b̃(t) = 0, t ∈ T ; x0 , x̃0 –
фиксированные векторы, модели (1), (2) детерминированные, иначе
они недетерминированные (модели с неопределенностью).
Пусть Xρ (x̃) = {x ∈ Rn : ρg∗ ≤ H(x − x̃) ≤ ρg ∗ } – ρ-окрестность
точки x̃, где
H ∈ Rm×n ; g∗ , g ∗ ∈ Rm , −∞ < g∗ < 0 < g ∗ < ∞; ρ ≥ 0.
Задача оптимального сближения состоит в выборе u0 (·), при котором (1) в момент t∗ попадает на множество Xρ0 (x̃(t∗ )) с минимальным ρ0 . Задача оптимального наведения – попасть на X ∗ =
R t∗
X1 (x̃(t∗ )) с минимальным J(u) = t∗ |u(t)|dt. Функции u0 (·) называются программными решениями.
Управляющие воздействия формируются по сигналам измерительных устройств:
yx (t) = C(t)(x(t) − x̃(t)) + ξx (t),
ξx (t) ∈ Ξx = {ξ ∈ Rq : ξx∗ ≤ ξ ≤ ξx∗ };
yx̃ (t) = C̃(t)x̃(t) + ξx̃ (t), ξx̃ (t) ∈ Ξx̃ = {ξ ∈ Rq̃ : ξx̃∗ ≤ ξ ≤ ξx̃∗ };
yw (t) = Cw (t)z(t) + ξw (t),
∗
ξw (t) ∈ Ξw = {ξ ∈ Rqw : ξw∗ ≤ ξ ≤ ξw
}, t ∈ Th ,
ż = Aw (t)z + Mw (t)w, t ∈ T ; z(t∗ ) = z0 ,
где
yx (t) ∈ Rq , yx̃ (t) ∈ Rq̃ , yw (t) ∈ Rqw , t ∈ Th ; z = z(t) ∈ Rnz .
Пусть
y0xτ (·) = (y0x (t), t ∈ Th ∩ T+τ ), yx̃τ (·) = (yx̃ (t), t ∈ Th ∩ T+τ ),
ywτ (·) = (yw (t), t ∈ Th ∩ T+τ ), T+τ = [t∗ , τ ],
– «очищенные» от вклада управляющих воздействий сигналы измерительных устройств; Y0xτ (·), Yx̃τ (·), Ywτ (·) – множества всех возможных таких сигналов. Положим
yτ (·) = {y0xτ (·), yx̃τ (·), ywτ (·)}, Yτ (·) = {Y0xτ (·), Yx̃τ (·), Ywτ (·)}.
47
Обозначим через (τ, yτ (·)) позицию системы управления.
Функцию
u = u(τ, yτ (·)), yτ (·) ∈ Yτ (·), τ ∈ Th ,
назовем связью (комбинированной); ее сужение на множество входных (по отношению к (1)) сигналов yx̃τ (·), ywτ (·) – прямой связью;
сужение на множество выходных сигналов y0xτ (·) – обратной связью. Оптимальные связи определяются по классическому принципу.
Используется и другая классификация связей. Если связь определяется с помощью препостериорного анализа [1], то она называется
замыкаемой (замкнутой) связью, иначе она размыкаемая.
Оптимальная связь – позиционное решение задачи. В докладе
предлагается метод синтеза оптимальных систем по принципу управления в режиме реального времени.
Для задач оптимального сближения и наведения исследованы
следующие ситуации: 1) детерминированная постановка; 2) маневрирующая цель; 3) неманеврирующая цель с не вполне определенным движением, несовершенные измерения; 4) маневрирующая
цель, несовершенные измерения; 5) модели с неопределенностью,
несовершенные измерения.
[1] Габасов Р., Кириллова Ф.М., Поясок Е.И. Оптимальное управление линейными системами в условиях неопределенности //
Тр. ИММ УрО РАН. 2009. Т. 15, № 3.
48
Приложение алгоритма
Чебышёва – Маркова – Крейна
для численного решения задачи управления
микрофизическими процессами
в градовых облаках
З. С. Гаева
Кабардино-Балкарский научный центр, Нальчик
e-mail: gaevaz@yandex.ru
А. А. Шананин
Вычислительный центр РАН, Москва
e-mail: alexshan@yandex.ru
Предложен алгоритм численного решения задачи управления
микроструктурой градового облака, эволюция которого описывается системой интегро-дифференциальных уравнений Смолуховского
для функций распределения капель и кристаллов по массе или размеру [1].
Управление осуществляется с целью предотвращения образования крупных градин в облаке, которые могут достигнуть поверхности Земли и нанести ущерб. Поэтому минимизируется функционал,
определяющий количество градин в облаке, бо́льших определенного критического размера. Известно, что даже расчет интегральных
характеристик функции распределения частиц в облаке, для определения которых решается система кинетических уравнений, является
сложной задачей, не говоря о задаче управления.
Для решения задачи управления предлагается воспользоваться методом Галеркина, что позволяет задачу управления сложной
системой интегро-дифференциальных уравнений свести к задаче
управления системой обыкновенных дифференциальных уравнений.
Кроме того, за счет удачного выбора в качестве базиса полной ортонормированной системы функций Дмитриева, можно значительно
сократить объем вычислений.
При использовании метода Галеркина возникает проблема контроля точности вычислений, связанная с тем, что интегральные
характеристики, описывающие эволюцию облака, не могут быть
c Гаева З. С., Шананин А. А., 2009
°
49
вычислены точно по конечному числу коэффициентов Галеркина.
Для решения этой проблемы по коэффициентам Галеркина на основе теории проблемы моментов Чебышёва – Маркова – Крейна
был разработан алгоритм [2] вычисления точных верхней и нижней границ, в которых может лежать интегральная характеристика
функции распределения. С этой целью по коэффициентам Галеркина строится точная верхняя граница функционала. Функционал,
определяющий количество градин, бо́льших определенного размера,
заменяется точной верхней границей.
Таким образом, сложная задача управления заменяется оценочной задачей оптимального управления. Функционал в этой задаче
и, следовательно, его производные не задаются явными формулами,
их значения в каждой точке могут быть вычислены по алгоритмам,
разработанным в теории проблемы моментов Чебышёва – Маркова –
Крейна.
В докладе предложен алгоритм вычисления производных точных
оценок, который является модификацией алгоритма построения точных верхней и нижней оценок Чебышёва – Маркова – Крейна [3].
Алгоритмы вычисления точных оценок и их производных позволили адаптировать основанный на принципе максимума Понтрягина
метод последовательных приближений для решения задачи управления микрофизическими процессами в облаке [4].
Работа выполнена при поддержке Программы государственной поддержки
ведущих научных школ (НШ-2982.2008.1).
[1] Ашабоков Б.А., Гаева З.С., Калажоков Х.Х. Численная модель
управления формированием микроструктуры градовых облаков
// Труды 11-го Всесоюзного симпоз. по матем. модел. атмосферной конвекции и искусственному воздействию на конвективные
облака, г. Долгопрудный, 26–29 мая 1986 года. М.: Гидрометеоиздат, 1989. С. 66–72.
[2] Гаева З.С., Шананин А.А. Проблема Маркова – Чебышёва и исследование галеркинских приближений в одной задаче агрегации // Математическое моделирование. 1995. Т. 7, № 9. C. 35–54.
[3] Гаева З.С., Шананин А.А. Численный метод решения задачи
управления микроструктурой градового облака // Математическое моделирование. 2004. Т. 16, № 12. C. 69–84.
50
[4] Гаева З.С., Шананин А.А. Алгоритм Чебышёва – Маркова –
Крейна для анализа микрофизических процессов в градовых облаках // Журн. вычислительной математики и математической
физики. 2007. Т. 47, № 9. C. 1616–1635.
Экстремальное управление
в задачах с неизвестным уровнем
динамической помехи
С. А. Ганебный, С. С. Кумков, В. С. Пацко
Институт математики и механики УрО РАН, Екатеринбург
e-mail: ganebny@imm.uran.ru, kumkov.jr@imm.uran.ru,
patsko@imm.uran.ru
В настоящее время теория антагонистических дифференциальных игр — развитая математическая дисциплина [1, 2]. Особенно хорошо теория и численные методы разработаны для задач с фиксированным моментом окончания, терминальной функцией платы и
геометрическими ограничениями на управляющие воздействия игроков. Множества уровня (множества Лебега) функции цены для
таких задач представляют собой в пространстве время × фазовая
переменная упорядоченную систему вложенных друг в друга трубок — максимальных стабильных мостов. Первый (минимизирующий) игрок при помощи экстремальной стратегии [1] гарантированно удерживает движение в трубке, которой принадлежит начальная
позиция. Если второй (максимизирующий) игрок по ходу процесса действует «неоптимально», то движение переходит на некоторую
внутреннюю трубку, соответствующую меньшему значению функции цены. При этом, однако, первый игрок использует «крайние»
значения ограничений на свое управление. Во многих практических
задачах такое поведение первого игрока не очень разумно: на слабое
воздействие противника он отвечает жестко, полностью используя
ресурс своего управления.
Идеология системы стабильных трубок легко переносится
на задачи с фиксированным моментом окончания, в которых
c Ганебный С. А., Кумков С. С., Пацко В. С., 2009
°
51
по постановке задачи оговорено ограничение на управление первого
игрока, а уровень ограничения на динамическую помеху (управление
второго игрока) заранее не задан. В этом случае каждая стабильная
трубка соответствует некоторому ограничению на управление второго игрока и некоторому ограничению на управление первого, вложенному в ограничение, заданное по постановке задачи. Если тем
или иным способом удалось создать такую упорядоченную систему
вложенных друг в друга трубок, то справедливо следующее свойство: при слабой или «неразумной» помехе движение переходит на
трубку с меньшим индексом, соответственно экстремальное управляющее воздействие первого игрока берется из меньшего ограничения.
Если уровень помехи растет, то движение уходит на трубку с большим индексом; при этом увеличивается ограничение на управление,
используемое первым игроком. Рост ограничения продолжается пока
не будет достигнуто максимально широкое допустимое ограничение.
Тем самым управление первого игрока «подстраивается» под текущий уровень помехи, и его можно назвать адаптивным.
Выделен [3] класс задач, для которого конструирование такой системы стабильных трубок может быть сделано эффективно на основе предварительного вычисления всего лишь двух вспомогательных
максимальных стабильных мостов. К этому классу относятся управляемые системы с линейной динамикой и фиксированным моментом
окончания. Любая трубка из системы может быть найдена с использованием заготовленных заранее мостов. По ходу процесса на основе
текущей позиции строится соответствующая трубка, на которую и
производится экстремальное прицеливание.
Предложенный метод адаптивного управления применен к задаче
о посадке самолета в условиях ветрового возмущения, задаче о преодолении самолетом препятствия по высоте, а также к линеаризованной задаче перехвата одного слабо маневрирующего объекта другим.
Приводятся результаты моделирования.
Работа выполнена в рамках программы Президиума РАН «Математическая теория управления» и при поддержке РФФИ (проекты 07-01-96085 и
09-01-00436).
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
52
[2] Bardi M., Capuzzo-Dolcetta I. Optimal Control and Viscosity
Solutions of Hamilton – Jacobi – Bellman Equations. Boston:
Birkhauser, 1997.
[3] Ганебный С.А., Кумков С.С., Пацко В.С. Экстремальное прицеливание в задачах с неизвестным уровнем динамической помехи // Прикл. математика и механика. 2009. Т. 73, вып. 3.
С. 573–586.
Условия минимальности второго порядка
в задачах векторной оптимизации
с ненаправленным отношением предпочтения
В. В. Гороховик
Институт математики НАН Беларуси, Минск, Беларусь
e-mail: gorokh@im.bas-net.by
Пусть X и Y — банаховы пространства, причем пространство Y
упорядочено отношением предпочтения ≺ таким, что y1 ≺ y2 ⇐⇒
y2 − y1 ∈ P, где P ⊂ Y — асимметричный выпуклый конус.
В докладе рассматривается общая задача векторной оптимизации
≺ −Min {F (x) | x ∈ Q},
(V OP )
где F : X → Y — отображение из X в Y, а Q — подмножество из X.
Под решениями (V OP ) понимаются такие точки x0 ∈ Q, которые
доставляют локальный ≺-минимум отображению F на множестве Q,
т. е. такие точки x0 ∈ Q, для которых F (x) 6≺ F (x0 ) при любом
x ∈ Q ∩ N (x0 ), где N (x0 ) — некоторая окрестность точки x0 .
В большинстве работ, в которых исследуется (V OP ), предполагается, что конус положительных элементов P пространств Y является
телесным (intP 6= ∅). В данном докладе, напротив, рассматривается
случай, когда intP = ∅. При этом предполагается, что линейная оболочка P, т. е. векторное подпространство Z = P − P, является собственным (Z 6= Y ) топологически дополняемым подпространством
в Y и, кроме того, riP 6= ∅, где riP — внутренность конуса P относительно подпространства Z. Заметим, что если пространство Y
c Гороховик В. В., 2009
°
53
конечномерно, то сделанным предположениям удовлетворяет любой
нетелесный выпуклый конус P .
(Так как P − P 6= Y, то отношение предпочтения ≺ не является
направленным на Y, т. е. не для всякой пары y1 , y2 ∈ Y существует
точка y ∈ Y такая, что y1 ≺ y, y2 ≺ y. Именно эта особенность
рассматриваемой в докладе задачи векторной оптимизации отмечена
в названии доклада.)
Основная цель доклада — представить необходимые, а также достаточные условия локальной ≺-минимальности первого и второго порядков для решений задачи векторной оптимизации (V OP )
при сделанных выше предположениях об отношении предпочтения ≺. Следуя методике, впервые предложенной в [1], исходная
задача векторной оптимизации сначала «скаляризуется», при этом
теоретико-множественное по своему содержанию определение точек
≺-минимума отображения F на множестве Q сводится к скалярному функциональному неравенству на пересечении Q с множеством
точек, удовлетворяющих операторному равенству, а затем из этих
функциональных соотношений с помощью вариационного анализа
выводятся условия локального минимума.
При выводе необходимых условий ≺-минимальности вариационный анализ операторного равенства, возникающего при скаляризации (V OP ), основывается на теореме о неявной функции (или ее
обобщениях), условия применения которой обеспечиваются дополнительным предположением о регулярности исследуемой точки локального ≺-минимума, имеющим следующий вид:
π(F 0 (x0 )X) = Imπ,
где F 0 (x0 ) — производная Фреше отображения F в точке x0 ,
а π : Y → Y — непрерывный проектор в Y , такой, что ker π = P − P.
Данное условие регулярности распространяет на задачу (V OP )
классическое условие регулярности Люстерника.
В докладе представлены также необходимые условия ≺-минимальности для точек локального ≺-минимума, которые не удовлетворяют сформулированному выше аналогу условия регулярности
Люстерника. В этом случае вывод данных необходимых условий ≺-минимальности основан на идеях, впервые предложенных
Е. Р. Аваковым [2] при исследовании операторных ограничений типа
равенства.
54
Работа выполнена при поддержке Белорусского республиканского фонда
фундаментальных исследований, проект Ф08Р-014.
[1] Гороховик В.В. Выпуклые и негладкие задачи векторной оптимизации. Минск: Наука и техника, 1990.
[2] Аваков Е.Р. Условия экстремума для гладких задач с ограничениями типа равенств // Журн. вычислительной математики и
математической физики. 1985. Т. 25, № 5. С. 680–693.
Об одном классе нелинейных задач управления
с дисконтированием
Н. Л. Григоренко, Д. В. Камзолкин,
Л. Н. Лукьянова, Д. Г. Пивоварчук
Московский государственный университет
e-mail: grigor@cs.msu.su, kamzolkin@cs.msu.su,
lln@cs.msu.su, dpivovartchuk@gmail.com
Рассматриваемые в докладе задачи оптимального управления
возникают при оптимизации показателей эффективности производственного процесса добычи и переработки полезных ископаемых [1, 2]. В случае квадратичной зависимости концентрации минерала от глубины залегания задача имеет вид

ẋ = u, x(0) = 0, x(T ) = x1 ,


 P ≤ u ≤ Q,
(1)
£
¤
RT


 J[u] = e−νt k − u − u1 + P3 u12 dt −→ max ,
u(·)∈[P,Q]
0
где параметры ν, x1 , k, P, Q считаются известными, ν > 0, x1 > 0.
Ограничения на величину параметра k не накладываются.
При исследования задачи оптимального управления (1) использованы необходимые условия оптимальности процессов с параметрами
c Григоренко Н. Л., Камзолкин Д. В., Лукьянова Л. Н., Пивоварчук Д. Г.,
°
2009
55
Рис. 1: u∗ (t) для параметров
ν = 0.1, P = 0.2, k = 6, x1 = 10,
Q = 0.5.
Рис. 2: J1∗ (Q) для параметров
ν = 0.1, P = 0.2, k = 4, x1 = 10.
в форме принципа максимума Понтрягина для задач с нефиксированным моментом времени [3, 4]. Найдено решение в форме программных управлений с двусторонними ограничениями на управление.
Рассмотрены основные варианты соотношений между параметрами, от которых зависит форма оптимального управления. Приводятся результаты расчетов оптимального управления для тестовых
и реальных параметров модели. В частности, на рис. 1 представлен
график оптимального управления для варианта параметров ν = 0.1,
P = 0.2, k = 6, x1 = 10, Q = 0.5. На рис. 2 показан график зависимости оптимального значения функционала J ∗ (Q) от параметра Q ∈ [P, 10P ] при ν = 0.1, x1 = 10, k = 4, P = 0.2. Три области изменения Q, отмеченные вертикальными линиями, соответствуют разным формам оптимального управления при соответствующих
значениях Q.
В докладе демонстрируются результаты численных расчетов для
различных вариантов параметров модели, оптимального управления, времени окончания процесса, экстремального значения функционала как функции параметров процесса, а также других характеристик задачи.
Работа выполнена при поддержке РФФИ, проект 09-01-00378-a.
56
[1] Григоренко Н.Л., Камзолкин Д.В., Лукьянова Л.Н. Решение одной задачи оптимального управления // Проблемы динамического управления: Сб. научных трудов факультета ВМК МГУ
им. Ломоносова, вып. 1. М.: МАКС Пресс, 2005. С. 137–144.
[2] Аввакумов С.Н., Киселев Ю.Н., Орлов М.В. Закон гиперболического тангенса при синтезировании оптимального управления
в одной нелинейной модели с дисконтированием // Дифференц.
уравнения. 2006. Т. 42, № 11. C. 1490–1506.
[3] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.:
Наука, 1961.
[4] Куржанский А.Б. Дифференциальные уравнения в задачах
синтеза управлений. 1. Обыкновенные системы // Дифференц.
уравнения. 2005. Т. 41, вып. 1. С. 12–22.
Оценки множеств достижимости
многомерных управляемых систем
с нелинейными перекрестными связями
Гусев М. И.
Институт математики и механики УрО РАН, Екатеринбург
e-mail: gmi@imm.uran.ru
Доклад посвящен построению внешних оценок множеств достижимости многомерной управляемой системы. Для описания множеств достижимости могут быть использованы обобщенные решения
уравнений Гамильтона – Якоби – Беллмана [1–3]. Трудоемкость построения точных решений данных уравнений заставляет прибегать
вместо уравнений к соответствующим дифференциальным неравенствам и применению теорем сравнения [2, 4], что позволяет получить приближенные оценки. В данной работе предлагается способ оценивания множеств достижимости для определенного класса управляемых систем при помощи векторных оценочных функций
c Гусев М. И., 2009
°
57
(аналогов векторных функций Ляпунова). Рассматриваемая система
имеет следующий вид
X
ẋ(i) = f i (t, x(i) , u) +
Hij (t, x)x(j) , i = 1, ..., k, t0 ≤ t ≤ θ,
(1)
j6=i
где x(i) ∈ Rni , u ∈ P , x = (x(1) , ..., x(k) ), x(i) (t0 ) = xi0 , i = 1, ..., k.
Система разбивается на k подсистем ẋ(i) = f i (t, x(i) , u) простой
структуры (например, линейных), связанных между собой нелинейными перекрестными связями. Для каждой из подсистем считается известной внешняя оценка области достижимости, представимая
в виде множества уровня функции V i (t, xi ), удовлетворяющей дифференциальному неравенству вида
>
Vti (t, x(i) ) + max Vxi f (t, x(i) , u) ≤ g i (t, V i (t, x(i) )).
u∈U
(2)
На основе оценок для подсистем строится оценка для области достижимости объединенной системы. Например, при условии, что функции Hij (t, x) ограничены, а функции V i (t, x(i) ) и их производные
по x(i) удовлетворяют неравенствам, характерным для квадратичных функций, показано, что множество достижимости G(θ) удовлетворяет включению
G(θ) ⊂ {x : V (θ, x) ≤ U (θ)},
здесь U (t) – решение системы сравнения V̇ = F (t, V ) с начальным
условием U (t0 ) ≥ V (t0 , x0 ). Правая часть системы сравнения строится по функциям g i и оценкам для Hij и V i . Метод получения оценок
основан на конструкциях, аналогичных соответствующим построениям для векторных функций Ляпунова [5].
Если функции g i линейны по V i :
g i (t, V i ) = −αi (t)V i + µi (t), αi (t) > 0,
(3)
то в качестве системы сравнения можно выбрать линейную систему
F = A(t)U + µ(t). Если составляющие подсистемы ẋ(i) = f i (t, x(i) , u)
линейны и ограничения на управления заданы при помощи эллипсоидов, то квадратичные по x(i) функции V i , задающие эллипсоидальные оценки на множества достижимости подсистем [3, 4], будут
удовлетворять системе (2), (3). В данном случае система сравнения
линейна.
58
Предлагаемый метод оценивания распространен также на случай
линейных оценочных функций.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ, проект 09-01-00589.
[1] Krasovskii N.N., Subbotin A.N. Game-Theoretical Control Problems. N.Y., Berlin, Heidelberg: Springer-Verlag, 1988.
[2] Kurzhanski A.B., Varaiya P. Dynamic optimization for reachability
problems // JOTA. 2001. V. 108, № 2. P. 227–251.
[3] Kurzhanski A. B., Valyi I. Ellipsoidal Calculus for Estimation and
Control. Boston: Birkhäuser, 1997.
[4] Куржанский А.Б. Принцип сравнения для уравнений типа Гамильтона – Якоби в теории управления // Тр. ИММ УрО РАН.
2006. Т. 12, № 1. C. 173–183.
[5] Матросов B.M., Анапольский Л.Ю., Васильев С.Н. Метод сравнения в математической теории систем. Новосибирск: Наука,
1980.
Асимптотика оптимального граничного
управления сингулярным эллиптическим
уравнением в круге
А. Р. Данилин
Институт математики и механики УрО РАН, Екатеринбург
e-mail: dar@imm.uran.ru
А. П. Зорин
Уральский государственный педагогический университет,
Екатеринбург
В круге Ω = {(x1 , x2 ) : x21 + x22 6 1} рассматривается следующая
задача граничного оптимального управления [1, гл. 2, (2.41), (2.9)]:
½ 2
ε ∆z − α2 z = f (x), x ∈ Ω, zε ∈ H 1 (Ω),
∂z
ε2 ∂n
= g(x) + u,
x ∈ Γ = ∂Ω,
c Данилин А. Р., Зорин А. П., 2009
°
59
Z
Z
z 2 (x) dx + ν −1
J(u) =
Ω
u2 (x) dl → inf,
u ∈ U,
Γ
1
где ν > 0, H (Ω) — соболевское пространство функций, ∂z/∂n —
производная по внешней нормали Γ к границе области Ω,
f (·) ∈ C ∞n
(Ω),
g(·) ∈ C ∞ (Γ) 0 <oε ¿ 1,
U = u(·) ∈ L2 (Γ) : |||u||| 6 1 .
Здесь через ||| · ||| обозначена норма в пространстве L2 (Γ).
Методами, характерными для сингулярных задач [2, 3], cтроится
асимптотическое разложение оптимального управления uε и соответствующего ему состояния системы zε .
В частности, при |||g||| > 1 в полярных координатах (r, ϕ) имеем
uε (cos ϕ, sin ϕ) = −
zε (r cos ϕ, r sin ϕ) = ε−1
g(cos ϕ, sin ϕ)
+ O(ε),
|||g|||
ε → 0,
1 + |||g|||
g(cos ϕ, sin ϕ) + O(1),
α|||g|||
ε → 0.
Работа выполнена при поддержке РФФИ, проект 08-01-00260, и программы
поддержки научных школ НШ-2215.2008.1.
[1] Лионс Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. М.: Мир, 1972.
[2] Вишик М.И., Люстерник Л.А. Регулярное вырождение и пограничный слой для линейных дифференциальных уравнений
с малым параметром // Успехи мат. наук. 1957. Т. 12, вып. 5.
С. 3–122.
[3] Ильин А.М. Пограничный слой // Современные проблемы математики. Фундаментальные направления. (Итоги науки и техн.
ВИНИТИ АН СССР). М.: ВИНИТИ, 1988. Т. 34. С. 175–214.
60
О физической реализуемости
теории быстрых управлений
А. Н. Дарьин, Ю. Ю. Минаева
Московский государственный университет
e-mail: daryin@cs.msu.su, aura_j@mail.ru
В работах [1, 2] доказано, что вполне управляемая линейная система ẋ(t) = A(t)x(t) + B(t)u размерности n может быть переведена из произвольного одного состояния в любое другое на фиксированном
Pk промежутке времени с помощью импульсного управления
u(t) = i=1 ui δ(t − τi ), где число импульсов k ≤ n.
В статье [3] предложено использовать управления, включающие помимо дельта-функций их производные высших порядков, что
позволяет расширить возможности управления. В частности, при
m ≥ n − 1 вполне управляемая линейная система может быть переведена из одного состояния в другое за нулевое время управлением
Xm
u(t) =
uj δ (j) (t − τ ).
(1)
j=0
Управление (1) является математической абстракцией. Ограниченные функции, приближающие (1), называются быстрыми управлениями, поскольку они позволяют переводить систему в заданное
состояние за произвольно малое время [4]. Такие управление можно,
например, искать в виде
Xm
(j)
u∆ (t) =
uj ∆hj (t − τ ),
(2)
j=0
(j)
где ∆h (t) — аппроксимации производных дельта-функции:
(0)
∆h (t) =
1
1[0,h] (t),
h
(j)
∆h (t) =
´
1 ³ (j−1)
(j−1)
∆h
(t) − ∆h
(t − h) .
h
При этом возникает проблема выбора параметров управления (2) —
чисел hj и векторов uj . Указанные параметры должны выбираться
исходя из физических требований к реализациям управления.
c Дарьин А. Н., Минаева Ю. Ю., 2009
°
61
В докладе исследуются и сравниваются быстрые управления, отвечающие различным ограничениям:
1. ограничение по времени управления: maxj {(j + 1)hj } ≤ H;
2. геометрическое ограничение: ku∆ (t)k ≤ µ;
3. раздельные геометрические ограничения на аппроксимации
обобщенных функций каждого порядка, составляющих в сумме
управление:
ku∆,j (t)k ≤ µj ,
(j)
u∆,j (t) = uj ∆hj (t − τ ).
Работа выполнена при поддержке РФФИ, проект 09-01-00589, и программы
государственной поддержки ведущих научных школ (НШ-4576.2008.1).
[1] Красовский Н.Н. Об одной задаче оптимального регулирования
// Прикл. математика и механика. 1957. Т. 21, № 5. С. 670–677.
[2] Neustadt L.W. Optimization, a moment problem, and nonlinear
programming // SIAM Journal on Control. 1964. V. 2, No. 1.
P. 33–53.
[3] Куржанский А.Б., Осипов Ю.С. К управлению линейной системой обобщенными воздействиями // Дифференц. уравнения.
1969. Т. 5, № 8. С. 1360–1370.
[4] Daryin A.N., Kurzhanski A.B. Impulse control inputs and the theory of fast controls // Proc. 17th IFAC Congress. IFAC, Seoul, 2008.
62
Негладкие задачи вариационного исчисления
В. Ф. Демьянов, Г. Ш. Тамасян
Санкт-Петербургский государственный университет
e-mail: vfd@ad9503.spb.edu, grigoriytamasjan@mail.ru
В докладе описывается развитие прямых методов [1] решения задач вариационного исчисления и оптимального управления.
Рассматриваемые методы основаны на сведении с помощью теории точных штрафных функций [2] исходной задачи минимизации интегрального функционала при наличии ограничений (краевые условия, дифференциальные или интегральные связи и т. п.)
к задаче безусловной минимизации некоторого функционала. Этот
функционал является существенно негладким, даже если исходный
функционал и ограничения были гладкими. Для построенного функционала находится субдифференциальное отображение, и с его помощью вычисляется направление наискорейшего спуска. Известно,
что субдифференциальное отображение является, в общем случае,
разрывным в метрике Хаусдорфа, но метод наискорейшего спуска
удается модифицировать таким образом, чтобы обеспечить сходимость минимизирующей последовательности к стационарной точке.
Кроме того, разработан метод гиподифференциального спуска [1],
который является непрерывным в метрике Хаусдорфа. Произведено
сравнение с методами Галеркина, Ритца, Эйлера, Канторовича и т. п.
Новые методы оказались достаточно эффективными на рассматриваемых примерах. Предлагаемый подход может оказаться полезным
для практического решения задач управления и вариационного исчисления при наличии ограничений.
Работа выполнена при поддержке РФФИ, проект 09-01-00360.
[1] Демьянов В.Ф. Условия экстремума и вариационные задачи.
М.: Высшая школа, 2005.
[2] Еремин И.И. Метод «штрафов» в выпуклом программировании
// Докл. АН СССР. 1967. Т. 143, № 4. С. 748–751.
c Демьянов В. Ф., Тамасян Г. Ш., 2009
°
63
О синтезе управлений
при коммуникационных ограничениях
И. А. Дигайлова
Московский государственный университет
e-mail: digailova_ira@mail.ru
Задача синтеза управления по доступным измерениям при наличии шумов — одна из центральных в теории управления. Ее изучение
восходит к основополагающим статьям Н. Н. Красовского [1, 2], где
были предложены как стохастические, так и детерминированные постановки.
В данной работе обсуждаются вопросы решения указанной задачи в случае, когда допустимые управляющие воздействия принадлежат либо классу релейных функций, либо классу импульсных управлений (дельта-функций) или их ограниченных аппроксимаций.
Рассмотрен подход решения указанной задачи, опирающийся
на понятие «информационного состояния» [3]. Под информационным состоянием понимается множество фазовых векторов, совместимых с априорными данными и поступившими измерениями.
Модели наблюдения рассмотрены либо как стохастические, дискретные, поступающие через коммуникационный канал связи в виде
пуассоновского потока, с помехами, равномерно распределенными
на заданном множестве, либо как непрерывные, с «неопределенными» помехами, для которых статистическое описание отсутствует.
В первом случае получены условия разрешимости задачи за конечное время с наперед заданной вероятностью, а также исследованы вопросы зависимости скорости сходимости математического ожидания диаметра информационных множеств от длины интервала наблюдения при различной размерности вектора состояния [4].
Во втором случае описаны наихудшая и наилучшая помехи с точки зрения наблюдения [5].
Обсуждаются вычислительные схемы. Приведены примеры численного моделирования.
Работа выполнена при поддержке РФФИ, проект 09-01-00589, и программы
государственной поддержки ведущих научных школ (НШ-4576.2008.1).
c Дигайлова И. А., 2009
°
64
[1] Красовский Н.Н. К теории управляемости и наблюдаемости линейных динамических систем // Прикл. математика и механика.
1964. Т. 28, № 1. С. 3–14.
[2] Красовский Н.Н. Теория оптимальных управляемых систем //
Механика в СССР за 50 лет. Т. 1. М.: Наука, 1968. С. 179–244.
[3] Куржанский А.Б. О синтезе управлений по результатам наблюдений // Прикл. математика и механика. 2004. Т. 68, № 4.
С. 547–563.
[4] Ustyuzhanin A.M. On the problem of matrix parameter identification // Problems of Control and Information Theory. 1986. V. 15,
No. 4. P. 265–273.
[5] Kurzhanski A.B. Identification: a theory of guaranteed estimates //
From Data to Model. Berlin etc: Springer-Verlag, 1989. P. 135–214.
Квадратичные функционалы Ляпунова в задаче
устойчивости линейной системы с последействием
Ю. Ф. Долгий
Институт математики и механики УрО РАН, Екатеринбург
e-mail: Yurii.Dolgii@usu.ru
Рассматривается линейная система дифференциальных уравнений с последействием
dx(t)
=
dt
Z0
dη(t, s)x(t + s), t ∈ R+ = (0, +∞),
(1)
−r
где x : [−r, +∞) → Rn , матричнозначная функция η измерима по
Лебегу на множестве R+ × [−r, 0], при фиксированном t ∈ R+ функция η(t, ·) имеет ограниченную вариацию на [−r, 0], отображение
t → Var η(t, ·) является локально интегрируемым по Лебегу на R+ .
c Долгий Ю. Ф., 2009
°
65
В функциональном пространстве состояний C = C ([−r, 0], Rn )
системе (1) ставится в соответствие уравнение [1]
dxt
= A(t)xt , t ∈ R+ ,
dt
(2)
где


Z0


D(A(t)) = xt (·) : xt ∈ C1 ([−r, 0], Rn ) , dxt (0)/dϑ = dη(t, s)xt (s) ,


−r
(A(t)xt ) (ϑ) = dxt (ϑ)/dϑ, ϑ ∈ [−r, 0], t ∈ R+ .
При нахождении условий экспоненциальной устойчивости уравнения (2) можно использовать второй метод Ляпунова, разработанный для систем с последействием Н.Н. Красовским [1, 2]. Согласно
предложенной им теории для решения проблемы экспоненциальной
устойчивости линейной системы достаточно ограничиться применением квадратичных функционалов. Для выбранного пространства
состояний операторы, порождающие квадратичные функционалы,
действуют в пространстве мер C∗ [3]. Сложная форма их аналитического описания создает дополнительные трудности при практическом использовании второго метода Ляпунова. Поэтому будем рассматривать уравнение (2) в гильбертовом пространстве Hµ со скаR0
лярным произведением (x(·), y(·))µ = −r y > (s)x(s)dµ(s). Функционал V и его производная V̇ определяются формулами
V (t, xt (·)) = (M (t)xt (·), xt (·))µ , V̇ (t, xt (·)) = − (N (t)xt (·), xt (·))ν
с линейными самосопряженными отображениями M (t) : Hµ → Hµ ,
N (t) : Hν → Hν , t ∈ R+ , Hν ⊆ Hµ , которые на Hν удовлетворяют
равенству [4]
Ṁ (t) + M (t)A(t) + A∗ M (t) = −N (t), t ∈ R+ .
(3)
Здесь положительные операторы M (t), N (t), t ∈ R+ , удовлетворяют дополнительным условиям, обеспечивающим экспоненциальную
устойчивость уравнения (2) [1]. Использование явных представлений
этих операторов позволяет записать для коэффициентов представления операторов M (t), t ∈ R+ , систему дифференциальных уравнений. Методы нахождения решений этой системы предложены в
66
работах Ю. М. Репина, Г. Н. Мильштейна, Е. Ф. Царькова, А. В. Кима, T. A. Burton, W. B. Castelan, E. F. Infante, J. C. F. de Oliveira и
других авторов.
В докладе будут обоснованы условия разрешимости уравнения (3) в классах ограниченных, компактных и конечномерных операторов.
[1] Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Физматгиз, 1959.
[2] Колмановский В.Б., Носов В.Р. Устойчивость и периодические
режимы регулируемых систем с последействием. М.: Наука,
1981.
[3] Царьков Е.Ф., Энгельсон Л.Е. Функционал Ляпунова для периодических линейных дифференциальных уравнений с последействием // Топологические пространства и их отображения.
Рига: ЛГУ, 1983. С. 117–136.
[4] Мильштейн Г.Н. Строго положительные функционалы Ляпунова для линейных систем с последействием // Дифференц.
уравнения. 1987. Т. 23, № 12. C. 2051–2060.
[5] Долгий Ю.Ф. Вычисление квадратичных функционалов Ляпунова для систем дифференциальных уравнений с запаздыванием // Тез. докл. Всесоюзной конференции «Управление в механических системах». Свердловск, 1990. С. 37–38.
67
Исследование задачи
оптимального вывода полезной нагрузки
на заданную эллиптическую орбиту
Т. Д. Думшева, В. Б. Костоусов, Е. К. Костоусова
Институт математики и механики УрО РАН, Екатеринбург
e-mail: dtd@imm.uran.ru, vkost@imm.uran.ru, kek@imm.uran.ru
В. И. Починский
НПО Автоматики, Екатеринбург
Рассматривается задача оптимального программного управления
ракетой-носителем (РН) типа Союз-2 с целью вывода максимальной полезной нагрузки на околоземные эллиптические орбиты, задаваемые параметрами: наклонением плоскости орбиты i, долготой
восходящего узла Ω, максимальной hmax и минимальной hmin высотами орбиты и, при необходимости, аргументом перигея ω. Исходная постановка характеризуется сложной нелинейной динамикой и
наличием дополнительных фазовых ограничений. Для учета внешних изменяющихся факторов (в первую очередь, ветра, замеренного по данным метеозондирования) программное управление должно
определяться оперативно перед стартом. С использованием методологии из [1], модельной задачи и принципа максимума Понтрягина
было построено базовое управление ubase (t), t ∈ [0, tbase
], удовлетвоf
ряющее всем заданным ограничениям и реализуемое на штатной аппаратуре.
Далее исследовался вопрос о возможности улучшения этого
управления на активном участке [t0 , tf ] (0 < t0 < tf ≤ tbase
) и, как
f
следствие, получения оценки эффективности базового управления.
Уравнения движения центра масс РН на этом участке могут быть
записаны в виде
ẋ = v,
v̇ = W (t) h(ϑ, ψ) + g(x),
ϑ̇ = u1 ,
ψ̇ = u2 .
Здесь x, v ∈ R3 — координаты и скорости центра масс; W (t) — известное ускорение, включающее аэродинамическую и реактивную составляющие; h(ϑ, ψ) = (cos ϑ cos ψ, sin ϑ cos ψ, − sin ψ)> ; g(x) ∈ R3 —
c Думшева Т. Д., Костоусов В. Б., Костоусова Е. К., Починский В. И., 2009
°
68
гравитационное ускорение (задано явными формулами); ϑ и ψ —
углы тангажа и рыскания; uj (t) — управления, |uj (t)| ≤ umax
. Заj
даны момент t0 , начальные условия, желаемые значения параметров орбиты ī, Ω̄, h̄max , h̄min , ω̄ и допустимые отклонения от них
¯ i . Масса m = m(t) — известная монотонно убыватипа |i − ī| ≤ ∆
ющая функция, что сводит исходную задачу максимизации m(tf )
к задаче 1 минимизации tf (задаче быстродействия).
Проведены предварительные исследования, связанные с большой
чувствительностью hmax , hmin и ω. Предложен способ борьбы с эффектом скачкообразного изменения ω в базовом алгоритме.
Разработаны алгоритмы улучшения базового управления, основанные на исследовании чувствительности параметров орбиты по отношению к специальным вариациям управления. Параметры этих
алгоритмов позволяют обеспечить требуемые ограничения задачи.
Другой подход основан на решении вспомогательной задачи 2 оптимального управления. Условия на параметры орбиты заменяются
на |F (x(tf ), v(tf ))−p| ≤ δ, где p, δ ∈ R5 известны (вычислены), а компоненты
F1 = cos i, F2 = tg Ω, F3,4 = hmax,min ,
F5 = cos ω = cos u cos θ + sin u sin θ
(здесь u — аргумент широты, θ — истинная аномалия) заданы явными нелинейными формулами от x, v, полученными на основе [2].
Задача 2 состоит в минимизации, при фиксированном tf ≤ tbase
,
f
функционала
J[u(·)] =
K
X
2
(Fk (x(tf ), v(tf )) − pk ) (δk )−2 , K = 4 или 5.
k=1
Выведены аналитические формулы для сопряженной системы задачи 2. Для численного решения задачи 2 опробованы несколько методов спуска в пространстве управлений, использующие сопряженную
систему. Наилучшие результаты дал метод сопряженных градиентов.
Оба подхода дали близкие, сравнимые между собой выигрыши
по величине выводимой массы РН не более 0.2% по сравнению с базовым управлением. Вместе с тем, временны́е затраты на их реализацию на порядок превышают затраты на построение ubase (t). Поэтому,
на настоящий момент времени, они могут использоваться для оценки
69
максимальной полезной нагрузки и, следовательно, эффективности
базового управления.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ, проект 09-01-00523, и программы интеграционных фундаментальных исследований УрО РАН, СО РАН и
ДВО РАН.
[1] Аппазов Р.Ф., Сытин О.Г. Методы проектирования траекторий
носителей и спутников Земли. М.: Наука, 1987.
[2] Охоцимский Д.Е, Сихарулидзе Ю.Г. Основы механики космического полета. М.: Наука, 1990.
Полурешения уравнения Гамильтона – Якоби
в задачах оптимального управления
с концевыми ограничениями
В. А. Дыхта, С. П. Сорокин
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: dykhta@gmail.com, sorsp@mail.ru
Рассматриваются необходимые и достаточные условия глобального и сильного минимума, основанные на использовании суб- и
суперрешений уравнения Гамильтона – Якоби, т. е. решений неравенств
½
≥ 0,
γ[ϕ] := ϕt + h(t, x, ϕx )
(1)
≤ 0.
Здесь h(t, x, ψ) = min{ψ · f (t, x, u) : u ∈ U } — нижний гамильтониан
управляемой системы
ẋ = f (t, x, u), u ∈ U.
(2)
Оператор γ[ϕ] считаем определенным на локально липшицевых
функциях почти всюду в области, зависящей от исследуемой задачи (класс функций ϕ также может сужаться до полувыпуклых или
c Дыхта В. А., Сорокин С. П., 2009
°
70
даже почти везде по t гладких суперпозиционно абсолютно непрерывных функций). Множество L0 всех решений уравнения γ[ϕ] = 0
можно рассматривать как подмножество множеств L+ и L− суб- и
суперрешений уравнения Гамильтона – Якоби.
С общей точки зрения все решения неравенств из (1) можно трактовать как функции типа Ляпунова управляемой системы (2), которые потенциально могут оказаться эффективными при изучении
вопросов стабилизации, достижимости, инвариантности и оптимальности. Конечно, до полной ясности еще далеко в теоретическом и,
тем более, в конструктивном плане. В частности, если речь идет
о теории оптимального управления, то можно считать достаточно
ясной роль субрешений для обоснования методов Беллмана и Кротова (по крайней мере, для задач без фазовых и совместных концевых ограничений на траекторию). Например, нам представляется,
что наиболее гибкие условия оптимальности такого типа получаются не только в направлении ослабления свойств непрерывности и
гладкости искомого субрешения, но и в оперировании множеством
(или последовательностью) таких функций. В то же время суперрешения применялись лишь фрагментарно, и их значение вскрыто
отнюдь не полно. (Это обстоятельство несколько странно, поскольку
в теории дифференциальных игр функции из L− достаточно систематично используются для построения субоптимальных стратегий.)
Именно применению суперрешений для получения необходимых условий оптимальности и методу последовательного улучшения
управления (как программного, так и позиционного) уделено основное внимание в докладе.
Для построения метода улучшения номинального процесса σ̄ =
(x̄(·), ū(·)), допустимого в задаче терминального управления со свободным правым концом траектории и функционалом J(σ) = l(x(t1 )),
вводится возмущенный функционал
Jωη (σ) = J(σ) + ηω(σ),
зависящий от параметра η > 0 и функционала-порядка ω(σ) > 0
при σ 6= σ̄, ω(σ̄) = 0 (в типичном случае ω(σ) = |x(t1 ) − x̄(t1 )|2 +
||x(·) − x̄(·)||L2 ). Для вспомогательной задачи минимизации функционала Jωη (σ) находится суперрешение соответствующего уравнения
γωη [ϕ] = 0 с краевым условием
ϕ(t1 , x) ≥ l(x) − l(x̄(t1 )) + ηq(x),
71
где q(x) > 0 — терминальная часть ω. Свойство слабой инвариантности надграфика ϕ позволяет обосновывать существование позиционного управления u(t, x) ∈ U , для которого все решения Эйлера
удовлетворяют оценке
¡
¢
l(x(t1 )) − l(x̄(t1 )) ≤ −ηω x(·), u(·, x(·)) + ϕ(t0 , x0 ).
При нормировке ϕ(t0 , x0 ) = 0 это позволяет гарантированно улучшить неэкстремальное управление ū(·). Разработаны конкретные реализации этой схемы в классе линейно-квадратичных суперрешений.
Работа выполнена при поддержке РФФИ, проект 07-01-00741, и УралоСибирского интеграционного проекта № 85.
Управляемость колебаний сети
из связанных объектов с распределенными
и сосредоточенными параметрами
со свободными концами
А. И. Егоров, Л. Н. Знаменская
Московский физико-технический институт, Долгопрудный
e-mail: egorov@4unet.ru, lznam@lznam.pereslavl.ru
Рассматриваются колебания сети, описываемые следующей краевой задачей:
uitt (x, t) = a2i uixx (x, t),
ui (x, 0) = ϕi (x),
uix (`, t)
= 0,
(x, t) ∈ Q,
uit (x, 0) = ψi (x),
1
i = 1, . . . , m,
(1)
0 6 x 6 `,
(2)
2
m
u (0, t) = u (0, t) = . . . = u (0, t),
ÿ(t) + c2 y(t) = µ(t) +
m
X
bi ui (0, t),
(3)
(4)
i=1
m
X
ri uix (0, t) = y(t),
y(0) = y 0 ,
i=1
c Егоров А. И., Знаменская Л. Н., 2009
°
72
ẏ(0) = y 1 ,
(5)
для t > 0 и Q = { (x, t) : 0 < x < `, 0 < t < ∞ }.
З а д а ч а у п р а в л е н и я. Найти момент времени T и функцию
µ(t) такие, что решения ui (x, t) задачи (1)–(5) с начальными значениями (2) в момент времени T принимают нулевые значения
ui (x, T ) = 0,
uit (x, T ) = 0,
0 6 x 6 `,
i = 1, . . . , m.
(6)
Решения краевой задачи (1)–(5) дает следующая теорема.
Теорема 1. Пусть для функций ϕi (x) ∈ C 2 [0, `] и ψi (x) ∈ C 1 [0, `]
выполнены естественные условия согласования i = 1, . . . , m. Тогда каждая функция µ(t) ∈ C[0, +∞) однозначно определяет единственные решения ui (t, x) из C 2 (Q)∩C 1 (∂Q) задачи (1)–(5), которые
представимы в виде ui (x, t) = Ei (x + ai t) + Gi (x − ai t). Здесь Ei (x)
и Gi (x) заданы формулами
Ei (x) =
ϕi (x) ψbi (x)
ϕi (x) ψbi (x)
+
, Gi (x) =
−
2
2ai
2
2ai
при 0 6 x 6 `. Функции Ei (` + z), z > 0, имеют вид Ei (` + z) =
Gi (` − z) + ψbi (`)/ai , а Gi (−ai z) определяются при z > 0 формулами
ϕ1 (0)
1
G1 (−a1 z) =
K(z) +
2
κ
Zz
K (z − τ ) F (τ ) dτ,
0
Gi (−ai z) = G1 (−a1 z) + E1 (a1 z) − Ei (ai z).
Z x
m
m
P
P
b
Здесь ψi (x) =
ψ(s) ds, κ =
ri /ai , β =
bi , а K(t) и F (t) –
0
i=1
i=1
известные функции.
Введем обозначение ti = `/ai , i = 1, . . . , m. Гашение колебаний
рассматриваемой сети возможно лишь при условии соизмеримости
моментов времени ti , i = 1, . . . , m, т. е. при условии существования
таких чисел ni ∈ N, i = 1, . . . , m, что a1 /n1 = . . . = am /nm .
Приведем решение задачи гашения колебаний для одного частного случая m = 3, a1 = a2 /2 = a3 /3 и T = 2t1 = 4t2 = 6t3 .
73
Теорема 2. Пусть a1 = a2 /2 = a3 /3, функции ϕj (x) ∈ C 3 [0, `]
и ψj (x) ∈ C 2 [0, `] для j = 1, 2, 3 таковы, что они удовлетворяют
естественным условиям согласования, ψb1 (`)/a1 = −ϕ1 (0), и равенствам
ϕ2 (x) = 2ϕ1 (0) + ψb1 (x/2)/a1 + ψb1 (` − x/2)/a1 ,
ψ2 (x) = a1 [ϕ01 (x/2) + ϕ01 (` − x/2)] ,
ϕ3 (x) = ϕ1 (x/3) + ϕ1 ((2` − x)/3) − ϕ1 ((2` + x)/3),
ψ3 (x) = ψ1 (x/3) + ψ1 ((2` − x)/3) − ψ1 ((2` + x)/3).
Тогда непрерывная на отрезке [0, T ] при T = 2t1 управляющая
функция µ(t) определяет решения ui (x, t), i = 1, ..., m, краевой
задачи (1)–(5), удовлетворяющие условиям (6). Эта функция имеет вид
µ(t) = κ1 [a31 E1000 (a1 t) + c2 a1 E10 (a1 t)] − βE1 (a1 t) +
+2
3
X
¤
ri £ 3 000
ϕ1 (0)
ai Ei (ai t) + c2 ai Ei0 (ai t) − β
,
a
2
i=2 i
где κ1 = r1 /a1 − r2 /a2 − r3 /a3 .
Заметим, что при T > 2t1 решение задачи управления не является единственным.
Работа выполнена при поддержке РФФИ, проект 07-01-00217, и АВЦП «Развитие научного потенциала высшей школы», проект 2.1.1/500.
74
Необходимые условия оптимальности
для одного класса механических систем
Н. И. Желонкина
Уральский государственный технический университет–УПИ,
Екатеринбург
А. Н. Сесекин
Институт математики и механики УрО РАН, Екатеринбург
e-mail: sesekin@imm.uran.ru
Многие модели механических систем могут быть записаны в виде
ẍ = f (t, x) + B(t, x) v(t), x(t0 ) = x0 ,
(1)
где f (t, x) – n-мерная вектор-функция, B(t, x) – n × m-матрицафункция, заданные на [t0 , ϑ] × Rn . В качестве допустимых импульсных управлений будем рассматривать управления вида
v(t) = u(t) +
k
X
Ci δ(ti − Θi ).
i=1
Здесь u(t) – кусочно-непрерывная вектор-функция, Ci – постоянные
векторы (интенсивности импульсных воздействий), Θi – моменты
приложения импульсов из промежутка [t0 , ϑ]. Будем предполагать,
что u(t) ∈ U для любого t0 ≤ t ≤ ϑ, Ci ∈ Q, где U и Q – некоторые компактные множества. Считаем, что моменты Θi приложения
импульсных воздействий заранее не фиксированы. Особенностью системы дифференциальных уравнений (1) является то, что в правой
части здесь не возникает проблемы умножения обобщенной функции
на разрывную [1], что облегчает формализацию понятия решения системы (1).
Рассматривается задача минимизации функционала
Z ϑ
J[υ] = g(x(ϑ)) +
f0 (s, x(s))ds
t0
c Желонкина Н. И., Сесекин А. Н., 2009
°
75
вдоль траектории системы (1) с помощью управления v(t) из описанного класса. Для этой задачи получены необходимые условия оптимальности.
[1] Zavalichthin S.T., Sesekin A.N. Dynamic Impulse Systems: Theory
and Applications. Dordrecht: Kluwer Academic Publishers, 1997.
Синтез минимальных линейных стабилизаторов
A. В. Ильин, С. К. Коровин, В. В. Фомичев
Московский государственный университет
e-mail: iline@cs.msu.su, korovin@cs.msu.su, fomichev@cs.msu.su
Введение. Постановка задач. Рассматривается задача синтеза стабилизаторов для линейных стационарных управляемых динамических систем, при этом основное внимание уделяется исследованию возможностей по уменьшению порядка таких стабилизаторов.
Рассматриваются две постановки задачи. Первая – о построении
стабилизаторов заданного порядка (в частности, минимально возможного порядка), при этом на спектр замкнутой системы не накладывается каких-либо ограничений.
Вторая задача – задача о синтезе стабилизатора минимального
порядка с заданными динамическими свойствами (спектром, либо
распределенным спектром, в частности, с гарантированной скоростью сходимости замкнутой системы).
1. Синтез минимальных стабилизаторов для скалярных
систем. Пусть задана линейная стационарная система
½
ẋ = Ax + Bu,
(1)
y = Cx ,
где x ∈ Rn — неизвестный фазовый вектор, u ∈ R1 – вход системы;
y ∈ R1 – выход системы; A, B и C – постоянные матрицы соответствующих размеров.
c Ильин А. В., Коровин С. К., Фомичев В. В., 2009
°
76
Для системы (1) определена передаточная функция W (s) =
C(sI − A)−1 B = β(s)/α(s), где α(s) и β(s) – полиномы от комплексной переменной s. Далее считаем, что система (1) находится в общем
положении, тогда полиномы α(s) и β(s) не имеют общих корней.
В терминах передаточных функций стабилизация системы (1)
в нуле означает замыкание системы линейной обратной связью
u = −P (s)y, где P (s) = ϕ(s)/ψ(s) – передаточная функция стабилизатора. При этом ϕ(s) и ψ(s) – полиномы от s, deg ψ(s) = k (т. е. порядок стабилизатора равен k), а deg ψ(s) ≤ k (в соответствии с условием физической реализуемости стабилизатора).
Если система (1) замкнута обратной связью, то устойчивость
замкнутой системы определяется полиномом γ(s) = α(s)ψ(s) +
β(s)ϕ(s). Известно, что если полиномы α(s) и β(s) не имеют общих
корней, то существуют полиномы ϕ(s) и ψ(s) такие, что полином
γ(s) – гурвицев, более того, надлежащим выбором полиномов ψ(s)
и ϕ(s) может быть задана любая степень устойчивости полинома
γ(s) (т. е. вообще любой симметричный в C спектр). Однако размерность стабилизатора P (s) при этом может быть равной (n − 1)
(т. е. k = n − 1).
При отказе от задания спектра полинома γ(s) по произволу, систему (1) в некоторых случаях можно стабилизировать регулятором
более низкого порядка.
Для полиномов α(s) и β(s) рассмотрим матрицу типа Сильвестра
Sn−2 ∈ R(2n−1)×(2n−2) и линейное однородное уравнение F Sn−2 = 0
относительно F ∈ R1×(2n−1) .
В силу полноты ранга Sn−2 это уравнение имеет единственное
(с точностью до нормировки) решение F = (f1 , . . . , f2n−1 ), тогда при
заданном k коэффициенты li полинома γ(s) удовлетворяют системе
линейных неоднородных уравнений
Hk l = −hk ,
(2)
где Hk ∈ R(2n−k)×(k) и hk ∈ Rk×1 целиком определяются fi и имеют
ганкелеву структуру, l = (l1 , ..., lk )> .
Теорема 1. Пусть скалярная система (1) управляема и наблюдаема. Для нее существует стабилизатор порядка k тогда и только
тогда, когда среди решений уравнения (2) есть гурвицев столбец l.
Из теоремы 1 имеем простое
77
Следствие. Пусть k ∗ – минимальное значение k, при котором выполняется условие rank(Hk ) = rank(Hk , hk ). Тогда для системы (1)
не существует стабилизатора порядка меньше k ∗ .
Это условие по сути дела является условием совместности системы (2), его выполнение гарантирует существование у (2) решения,
но не обязательно гурвицева. Таким образом, величина k ∗ доставляет оценку снизу размерности линейного стабилизатора. Для синтеза
стабилизатора минимального порядка требуется осуществить перебор по k (начиная с k ∗ ) с целью определения минимального значения,
при котором уравнение (2) имеет гурвицево решение.
2. Минимальные стабилизаторы с заданными динамическими свойствами. Перейдем теперь к рассмотрению второй из
поставленных выше задач, а именно, к задаче синтеза минимального стабилизатора с любым наперед заданным спектром (с заданной
по произволу скоростью сходимости) замкнутой системы. При этом
будем рассматривать систему (1) с векторными входом и выходом,
т. е. l и m – произвольные числа от 1 до n.
Для решения задачи стабилизации системы (1) в нуле обычно
используется обратная связь по фазовому вектору u = −Kx, где
матрица K ∈ Rm×n выбирается из условия гурвицевости матрицы
AK = A − BK. При управляемости пары {A, B} выбором K спектр
матрицы AK задается по произволу.
Если фазовый вектор x(t) системы (1) не известен, то вместо x(t)
используют оценку x̃(t), вырабатываемую наблюдателем. В частности, для системы (1) такую оценку вырабатывает наблюдатель Люенбергера порядка (n − l). Однако для решения задачи стабилизации
достаточно получить оценку не всего фазового вектора, а только
функционала σ(t) = Kx(t), при этом размерность функционального
наблюдателя, вырабатывающего оценку σ(t), может оказаться меньше (n − l).
Задача о построении функциональных наблюдателей изучалась в работе [1]. Приведем основные результаты. Если система (1) наблюдаема, то для нее определены индексы Кронекера [2],
µ1 ≥ µ2 ≥ . . . ≥ µl , µ1 = µ, где µ – индекс наблюдаемости системы.
Имеет место
Теорема 2. Пусть система (1) находится в общем положении,
rank B = m, rank C = l; µ1 ≥ µ2 ≥ . . . ≥ µl – индексы Кронекера
системы (1), упорядоченные по невозрастанию. Пусть m̄ – мини78
мальное число такое, что среди столбцов матрицы B есть m̄ таких, что для составленной из них матрицы B̄ пара {A, B̄} управляема. Тогда для системы (1) существует стабилизатор порядка


l
i−1
X
X
1
k=
ki , k1 = (µi − 1), ki = max{(µi − 1) − 
kj  , 0},
m̄
i=1
j=1
i = 2, . . . , l, где [·] – целая часть числа.
Работа выполнена при финансовой поддержке РФФИ (проекты 09-07-00375,
09-07-00379).
[1] Коровин С.К., Медведев И.С., Фомичев В.В. Функциональные
наблюдатели для линейных систем с неопределенностью //
Диффеpенц. уравнения. 2006. Т. 42, № 10. C. 1307–1317.
[2] Коровин С.К., Фомичев В.В. Наблюдатели состояния для линейных систем с неопределенностью. М.: Наука, 2007.
Асимптотика решения вырожденной системы
дифференциальных уравнений
с малым параметром
А. М. Ильин, О. Ю. Хачай
Уральский государственный университет, Екатеринбург
e-mail: iam@imm.uran.ru, iam@csu.ru; khachay@mail.ru
В докладе рассматривается построение и обоснование асимптотики решения начальной задачи
dU
= f (t, U, V ),
dt
U (0) = A,
dV
= g(t, U, V ),
dt
V (0) = 0,
ε
c Ильин А. М., Хачай О. Ю., 2009
°
79
(1)
где ε > 0 — малый параметр. Предполагается, что функции f (t, U, V )
и g(t, U, V ) бесконечно дифференцируемы и
∂f
(t, U, V ) < 0,
∂U
g(0, 0, 0) = 0, f (0, 0, 0) = 0,
(2)
∂f
(0, 0, 0) > 0,
∂t
∂f
∂ m−1 f
(0, 0, 0) = 0, . . . ,
(0, 0, 0) = 0,
∂U
∂U m−1
m
∂ f
здесь m > 2 – целое число, ∂U
m (0, 0, 0) < 0.
Для рассматриваемой здесь системы асимптотика значительно
сложнее, чем в стандартной ситуации, когда условие (2) выполнено
всюду при t > 0. Даже вдали от начальной точки правильное асимптотическое разложение — это не ряд по степеням малого параметра
ε. (При m = 2 исследование было проведено в [1].) Из-за этого удобнее начать построение асимптотики с внутреннего разложения в его
естественном виде. В окрестности начальной точки вводится новая
растянутая переменная τ = εt. Если для неизвестных функций ввести обозначения U (ετ, ε) ≡ w(τ, ε), V (ετ, ε) ≡ z(τ, ε), то уравнения
для функций w, z будут иметь вид
dw
dz
= f (ετ, w, z),
= εg(ετ, w, z),
dτ
dτ
w(0) = A > 0,
z(0) = 0.
(3)
Асимптотические ряды функций w и z можно найти в виде
w(τ, ε) =
∞
X
εk wk (τ ), z(τ, ε) =
k=0
∞
X
εk zk (τ ).
(4)
k=1
Разложив функции f (t, u, v) и g(t, u, v) в ряды Тейлора в переменной
точке (0, w0 (τ ), 0) и подставив формальные ряды (4) в систему (3),
нетрудно получить систему рекуррентных соотношений для нахождения функций wk (t) и zk (t), приравняв коэффициенты при одинаковых степенях ε.
Далее необходимо ввести дополнительный промежуточный масштаб независимой переменной и соответствующее ему промежуточное разложение: t = εαm η, u(η, ε) ≡ U (t, ε), v(η, ε) ≡ V (t, ε), где
80
α = 1/(2m − 1). Для того, чтобы получить правильную систему калибровочных функций асимптотических рядов для функций u(η, ε)
и v(η, ε), нужно переписать в переменной η частичные суммы рядов (4).
Далее при переходе от промежуточного масштаба переменной
η к внешнему масштабу t получаются правильные ряды внешнего
асимптотического разложения
U (t, ε) =
∞
X
i=0
εiα
i
X
lnj ε Ui,j (t), V (t, ε) =
j=0
∞
X
i=0
εiα
i
X
lnj ε Vi,j (t).
j=0
Обычным способом (см. [2]) из построенных трех асимптотических
рядов строится составное асимптотическое разложение XN (t, ε),
YN (t, ε).
Теорема. При достаточно малых значениях параметра ε решение
u(t, ε), v(t, ε) задачи (1) существует на отрезке [0, t0 ]. На всем этом
отрезке справедлива оценка
|XN (t, ε) − u(t, ε)| = O(εγN ),
|YN (t, ε) − v(t, ε)| = O(εγN )
при ε → 0, где γ > 0 и N – достаточно большое число.
Работа выполнена при поддержке гранта НШ-2215.2008.1.
[1] Ильин А.М., Хачай О.Ю. Асимптотика решения системы дифференциальных уравнений с малым параметром и с особой начальной точкой // Докл. РАН. 2008. Т. 422, № 4. C. 1–4.
[2] Ильин А.М. Согласование асимптотических разложений решений краевых задач. М.: Наука, 1989.
81
Предельные множества
функционально-дифференциальных уравнений
А. В. Ким
Институт математики и механики УрО РАН, Екатеринбург
e-mail: avkim@imm.uran.ru
Исследование предельного поведения (предельных свойств) решений является одной из важнейших задач качественной теории дифференциальных уравнений [1–3]. В работе представлены результаты исследования предельных свойств функциональнодифференциальных уравнений (здесь и далее используются обозначения из [4, 5])
dx
= f (x, y(·)).
(1)
dt
Предполагается, что отображение f (x, y(·)) : Rn × Q[−τ, 0) → Rn
удовлетворяет условиям, гарантирующим существование и единственность решений x(t) = φ(t, t0 , x0 , y 0 (·)), t ≥ t0 , (называемых
в дальнейшем полутраекториями L+ ) для любых начальных данных {t0 , x0 , y 0 (·)} ∈ R × Rn × Q[−τ, 0). Применение техники и методологии i-гладкого анализа [4, 5], основанных на разделении конечномерных и бесконечномерных составляющих и свойств в структуре функционалов и функционально-дифференциальных уравнений,
позволяет получить для системы (1) ряд результатов, аналогичных
случаю предельного поведения решений обыкновенных дифференциальных уравнений.
Определение 1. Точка a ∈ Rn называется предельной для полутраектории L+ , если существует такая последовательность моментов
tk → +∞, что x(tk ) → a.
Определение 2. Совокупность всех предельных точек называется
предельным множеством при t → +∞ для рассматриваемого решения.
Теорема 1. Предельное множество полутраектории L+ замкнуто
в Rn .
c Ким А. В., 2009
°
82
Определение 3. Полутраектория называется положительно
устойчивой в смысле Лагранжа, если она постоянно остается внутри
некоторой ограниченной области G ⊂ Rn .
Теорема 2. Для того, чтобы решение уравнения (1) имело предельные точки, необходимо и достаточно, чтобы соответствующая
полутраектория была положительно устойчивой в смысле Лагранжа.
Следствие 1. Для того, чтобы предельное множество было пустым, необходимо и достаточно, чтобы полутраектория x(t) при
t → +∞ «уходила в бесконечность», т. е., чтобы kx(t)k → +∞
(t → +∞).
Теорема 3. Для того, чтобы предельное множество состояло из
единственной точки a, необходимо и достаточно, чтобы траектория x(t) входила в эту точку при t → +∞, т. е.
x(t) → a (t → +∞).
Во второй части работы рассматривается несколько типов сходимости полутраекторий к предельным точкам и Λ-предельным циклам функционально-дифференциальных уравнений.
Работа выполнена при поддержке РФФИ, проект 08-01-00141, и программы
Президиума РАН «Фундаментальные науки – медицине».
[1] Пуанкаре А. О кривых, определяемых дифференциальными
уравнениями. М.-Л.: ОГИЗ, 1947.
[2] Петровский И.Г. Лекции по теории обыкновенных дифференциальных уравнений. М.: Изд-во МГУ, 1984.
[3] Хейл Дж. Теория функционально-дифференциальных уравнений. М.: Мир, 1984.
[4] Ким А.В. Прямой метод Ляпунова в теории устойчивости систем с последействием. Екатеринбург: Изд-во Урал. ун-та, 1993.
[5] Ким А.В. i-Гладкий анализ и функционально-дифференциальные уравнения. Екатеринбург: ИММ УрО РАН, 1996.
83
Численное построение решений
в неантагонистической дифференциальной игре
двух лиц
А. Ф. Клейменов
Институт математики и механики УрО РАН, Екатеринбург
e-mail: kleimenov@imm.uran.ru
Д. Р. Кувшинов, С. И. Осипов
Уральский государственный университет, Екатеринбург
e-mail: evetro@2-u.ru, sergei.osipov@usu.ru
Рассматривается линейная неантагонистическая позиционная
дифференциальная игра двух лиц с терминальными показателями
качества и геометрическими ограничениями на управления игроков.
Формализация стратегий игроков и порождаемых ими движений основывается на формализации и результатах теории позиционных антагонистических дифференциальных игр, разработанной Н. Н. Красовским и его научной школой [1]. В качестве решений игры принимаются решения по Нэшу (N -решения) и решения по Штакельбергу
(Si -решения, где i – номер игрока-лидера). В том числе рассматриваются N -решения, оптимальные по Парето относительно показателей игроков (P -решения). Задача нахождения всех этих решений
сводится к решению нестандартных задач (оптимального) управления [2]. Например, для N -решений задача формулируется так: найти такие допустимые программные управления обоих игроков, что
вдоль порождаемой ими траектории оба игрока не ухудшают свой гарантированный выигрыш. Предполагается, что игра сводится к игре
на плоскости, а ограничения на управления игроков задаются в виде
выпуклых многоугольников.
При решении нестандартных задач применяются известные процедуры [3, 4] построения максимальных стабильных мостов в некоторых вспомогательных играх сближения-уклонения. В ходе вычисления используется ряд алгоритмов вычислительной геометрии,
c Клейменов А. Ф., Кувшинов Д. Р., Осипов С. И., 2009
°
84
в частности, объединение и пересечение многоугольников.
Предлагаются численные методы построения N -решений и
Si -решений. Алгоритм приближенного построения множества концов всех траекторий, порождаемых N -решениями (N -траекторий)
и, в частности, тех из них, что порождены P -решениями
(P -траекторий), может быть представлен в виде внешнего и внутреннего циклов, перебирающих определенным образом значения выигрышей игроков. Для каждой фиксированной пары выигрышей находится конец N -траектории, доставляющей заданные выигрыши,
при этом строится множество незапрещенных позиций, которое используется при восстановлении решения игры, порождающего N траекторию, по заданному концу этой траектории. Управления игроков аппроксимируются кусочно-постоянными функциями времени.
Во внешнем цикле происходит одновременный перебор (в сторону
увеличения) выигрышей игрока 1 и игрока 2, заканчивающийся, когда построенные участки границы множества концов N -траекторий
пересекутся. Для каждого выбранного значения выигрыша игрока i производится максимизация выигрыша игрока 3 − i в рамках
нестандартной задачи управления, при этом попутно находится конец N -траектории, на которой достигаются эти выигрыши. При аппроксимации множества концов всех N -траекторий производится перебор выигрышей игрока 3 − i (в сторону уменьшения), начиная
с найденного максимального значения; в процессе перебора находятся концы N -траекторий. При поиске только P -решений из полученной после завершения внешнего цикла границы производится
выборка точек, недоминируемых относительно выигрышей игроков.
Работа выполнена при поддержке РФФИ, проект 09-01-00313.
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[2] Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.
[3] Вахрушев В.А., Тарасьев А.М., Ушаков В.Н. Алгоритмы построения пересечения и объединения множеств на плоскости //
Управление с гарантированным результатом. Свердловск: ИММ
УНЦ АН СССР, 1987. С. 28–36.
85
[4] Исакова Е.А., Логунова Г.В., Пацко В.С. Построение стабильных мостов в линейной дифференциальной игре с фиксированным моментом окончания // Алгоритмы и программы решения
линейных дифференциальных игр (материалы по математическому обеспечению ЭВМ). Свердловск: ИММ УНЦ АН СССР,
1984. С. 127–158.
Многочастотные автоколебания
в двумерных решетках связанных осцилляторов
А. Ю. Колесов
Ярославский государственный университет
e-mail: kolesov@uniyar.ac.ru
Е. Ф. Мищенко
Математический институт РАН, Москва
e-mail: mishch@mi.ras.ru
Н. Х. Розов
Московский государственный университет
e-mail: fpo.mgu@mail.ru
К настоящему времени проблема аттракторов нелинейных гиперболических уравнений в локальной постановке в случае одной
или двух пространственных переменных изучена довольно подробно (см. [1–4]). Анализ различных математических моделей (главным
образом, из радиофизики) показал, что, как правило, даже устойчивые двумерные торы наблюдаются в них весьма редко. Типична
же ситуация, когда имеются устойчивые циклы, количество которых за счет подходящего выбора параметров может быть сделано
сколь угодно большим. Это явление (отмеченное еще А. А. Виттом
в 1934 г.) было названо буферностью. Последние результаты позволяют по-новому взглянуть на природу аттракторов гиперболических
краевых задач. А именно, установлен следующий весьма неожиданный феномен: аттракторы нелинейного волнового уравнения могут
существенно отличаться от аттракторов его конечномерного аналоc Колесов А. Ю., Мищенко Е. Ф., Розов Н. Х., 2009
°
86
га, получающегося в результате замены производных по пространственным переменным соответствующими разностными операторами.
В качестве типового примера рассматривается краевая задача
для нелинейного волнового уравнения ван-дер-полевского типа
utt + ε(u2 − 1)ut + u = a21 uxx + a22 uyy , a1 , a2 = const > 0, 0 < ε ¿ 1
в единичном квадрате. Как известно (см. [2, 3]), в случае нулевых
граничных условий Неймана при некоторой общности положения
упомянутая задача допускает только устойчивые периодические по
времени движения, зависящие от одной пространственной переменной x или y, и таких решений может быть достаточно много.
При стандартной пространственной дискретизации указанного
волнового уравнения получается двумерная решетка связанных осцилляторов Ван-дер-Поля, описываемая аппроксимирующей системой обыкновенных дифференциальных уравнений. Основной результат доклада состоит в том, что подобного рода переход от непрерывной модели к дискретной может принципиально менять динамические свойства системы. Нам удалось показать, что все периодические движения упомянутой аппроксимирующей системы (за исключением одного или четырех) оказываются неустойчивыми, а вместо
них появляются устойчивые инвариантные торы размерностей 2, 3
и 4; эти торы не имеют аналогов в исходной краевой задаче.
Полученные результаты свидетельствуют о том, что аттракторы
гиперболических краевых задач могут существенно отличаться от
аттракторов их дискретных аппроксимаций, так что об аттракторах гиперболических краевых задач, вообще говоря, нельзя судить
по поведению при t → ∞ соответствующих им разностных моделей. Природа обнаруженного феномена, на наш взгляд, заключается в следующем. Для гиперболических краевых задач характерна
ситуация, когда их аттракторы формируются одновременно как на
низких, так и на высоких модах. Однако собственные частоты распределенной модели, отвечающие высоким модам, отнюдь не близки к соответствующим частотам в дискретном случае. Именно это
обстоятельство приводит к тому, что часть аттракторов дискретной
модели (мы назовем их «ложными») будет заведомо отличаться от
соответствующих аттракторов исходной гиперболической задачи.
Казалось бы, наиболее естественный способ борьбы с описанным
феноменом – это повышение точности аппроксимации: уменьшение
87
шага дискретизации и, тем самым, увеличение количества уравнений
в дискретной модели. Однако данный путь не приводит к желаемой
цели, так как не только не устраняет, а зачастую усиливает различия: с ростом числа уравнений аппроксимирующей системы «ложные» аттракторы могут неограниченно увеличиваются в числе.
Полученные результаты свидетельствуют о принципиально важном для математического моделирования выводе: переход от дискретной модели какого-либо физического процесса к непрерывной
правомерен отнюдь не всегда. Связано это с тем, что такая замена
существенно меняет динамические свойства системы.
[1] Колесов А.Ю., Мищенко Е.Ф., Розов Н.Х. Асимптотические методы исследования периодических решений нелинейных гиперболических уравнений // Тр. Математического института РАН.
1998. Т. 222. С. 7–191.
[2] Колесов А.Ю., Розов Н.Х. Инвариантные торы нелинейных волновых уравнений. М.: Физматлит, 2004.
[3] Мищенко Е.Ф., Садовничий В.А., Колесов А.Ю., Розов Н.Х.
Автоволновые процессы в нелинейных средах с диффузией.
М.: Физматлит, 2005.
[4] Колесов А.Ю., Розов Н.Х. Явление буферности в RCLG-автогенераторе: теоретический анализ и результаты эксперимента //
Тр. Математического института РАН. 2001. Т. 233. С. 153–207.
88
Об ограниченности и неограниченности
полиэдральных оценок
линейных управляемых систем
Е. К. Костоусова
Институт математики и механики УрО РАН, Екатеринбург
e-mail: kek@imm.uran.ru
Проблема построения трубок достижимости является одной из
ключевых в математической теории управления [1,2]. Известно много численных методов аппроксимации этих трубок. Один из подходов состоит в оценивании множеств простыми областями фиксированной формы, например, эллипсоидами, параллелепипедами и,
более того, целыми семействами таких областей [2–4]. В частности,
в [5, 6] введено параметризованное семейство P внешних оценок и
выделено подсемейство P1 ∈ P касающихся оценок, обеспечивающих точные представления множеств достижимости линейных дифференциальных систем.
В настоящей работе для систем с устойчивой матрицей исследованы свойства ограниченности и неограниченности на бесконечном
промежутке времени оценок из двух подсемейств Pi ∈ P, i = 1, 2,
внешних трубок P (·) с различными типами динамики матриц ориентации, где P1 упомянуто выше, а P2 ∈ P состоит из трубок оценок
с постоянной матрицей ориентации. Найдены критерии ограниченности и неограниченности оценок из P1 и P2 . Для характеристики
степени роста сечений трубки (оценки) P (t), t ∈ [0, ∞), введен показатель χ = χ(P), который определяется как характеристический
показатель Ляпунова χ[µ] [7] функции µ(P (·)), где µ — некоторый
функционал, определенный на множестве всех параллелепипедов.
Установлено, что показатели всех оценок из P1 ограничены, в то
время как оценки из P2 могут иметь сколь угодно большие показатели. Для двумерных систем даны описание, классификация и сравнение возможных ситуаций ограниченности или неограниченности
оценок обоих типов; найдены критерии ограниченности оценок со
специальными (ортогональными и «квази-ортогональными») постоянными матрицами ориентации; приведены результаты численного
моделирования.
c Костоусова Е. К., 2009
°
89
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ, грант 09-01-00223.
[1] Красовский Н.Н. Теория управления движением. М.: Наука,
1968.
[2] Kurzhanski A.B., Vályi I. Ellipsoidal Calculus for Estimation and
Control. Boston: Birkhäuser, 1997.
[3] Kurzhanski A.B., Varaiya P. On ellipsoidal techniques for reachability analysis. Part I: External approximations. Part II: Internal approximations. Box-valued constraints // Optimiz. Methods
& Software. I. 2002. Vol. 17, № 2. P. 177–206. II. 2002. Vol. 17, № 2.
P. 207–237.
[4] Костоусова Е.К., Куржанский А.Б. Гарантированные оценки
точности вычислений в задачах управления и оценивания //
Вычислительные технологии. 1997. Т. 2, № 1. С. 19–27.
[5] Костоусова Е.К. О внешних полиэдральных оценках для
множеств достижимости систем с билинейной неопределенностью // Прикл. математика и механика. 2002. Т. 66, вып. 4.
С. 559–571.
[6] Kostousova E.K. State estimation for dynamic systems via parallelotopes: optimization and parallel computations // Optimiz.
Methods & Software. 1998. Vol. 9, № 4. P. 269–306.
[7] Демидович Б.П. Лекции по математической теории устойчивости. М.: Наука, 1967.
90
Построение нелинейных регуляторов
в модели экономического роста
с исчерпаемыми энергетическими ресурсами
А. А. Красовский, А. М. Тарасьев
Институт математики и механики УрО РАН, Екатеринбург
e-mail: ak@imm.uran.ru, tam@imm.uran.ru
Рассматривается задача оптимального управления на бесконечном горизонте, возникающая в модели экономического роста с исчерпаемыми энергетическими ресурсами. Исследование базируется на математических моделях оптимального экономического роста [1]. Отличительной чертой рассматриваемой модели является экзогенный рост фактора полезной работы, который показывает влияние доступных энергетических ресурсов на экономическое развитие. Фактор полезной работы учитывается в модели при помощи
линейно-экспоненциальной (LINEX) производственной функции [2].
На основании математической формализации модели рассматривается задача оптимального управления. Решение задачи оптимизации инвестиций строится в рамках принципа максимума Понтрягина [3]. Оно получено с использованием необходимых и достаточных
условий оптимальности для задач с бесконечным горизонтом [4, 5].
В рамках теории оптимальной стабилизации [6–9] разрабатываются
нелинейные регуляторы для стабилизации траекторий рассматриваемой динамической системы. Представлены (см., например, рис. 1)
результаты вычислительных экспериментов и выполнено сравнение
синтезированных модельных траекторий, порожденных нелинейными регуляторами системы, с реальными данными по макроэкономическим показателям экономики США.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект 08-01-00587а), Российского гуманитарного
научного фонда (проект 08-02-00315a), гранта Президента РФ (проект НШ2640.2008.1), программы Президиума РАН «Математическая теория управления», Международного института прикладного системного анализа (IIASA).
c Красовский А. А., Тарасьев А. М., 2009
°
91
Рис. 1. Траектории капитала. Сплошная линия –
стабильная кривая; пунктирная линия – реальные данные.
[1] Интрилигатор М. Математические методы оптимизации и экономическая теория. М.: Айрис-пресс, 2002.
[2] Ayres R.U., Martinás K. On the Reappraisal of Microeconomics:
Economic Growth and Change in a Material World. Edward Elgar
Publishing Ltd., 2005.
[3] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов.
М.: Наука, 1976.
[4] Асеев С.М., Кряжимский А.В. Принцип максимума Понтрягина и задачи оптимального экономического роста // Тр. Математического института РАН. 2007. Т. 257. C. 5–271.
[5] Красовский А.А., Тарасьев А.М. Свойства гамильтоновых систем в принципе максимума Понтрягина для задач экономического роста // Тр. Математического института РАН. 2008.
Т. 262. С. 127–145.
[6] Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Физматгиз, 1959.
92
[7] Летов А.М. Аналитическое конструирование регуляторов IV //
Автоматика и телемеханика. 1961. Т. 22, № 4. С. 425–435.
[8] Малкин И.Г. Теория устойчивости движения. М.: Наука, 1966.
[9] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
Декомпозиционные методы нахождения
точек максимума векторного критерия
Н. А. Красовский, А. М. Тарасьев
Институт математики и механики УрО РАН, Екатеринбург
e-mail: nkrasovskiy@gmail.com, tam@imm.uran.ru
Рассматривается динамическая задача некооперативной игры нескольких участников, в которой игроки принимают решения на основе максимизации индивидуальных функций полезности. В каждом раунде игры производится обмен информацией через механизм,
аналогичный вальрасовскому аукциону. С точки зрения теории игр
повторяющийся аукцион описывает процесс обучения в некооперативной повторяющейся игре в условиях неопределенности [1–4]. Вводится определение рыночного равновесия, комбинирующее свойства
равновесия по Нэшу и максимума Парето. Доказывается теорема существования такого равновесия. Предлагается алгоритм поиска рыночного равновесия, который сдвигает конкурентное равновесие по
Нэшу к кооперативному максимуму Парето. Алгоритм интерпретирован в форме повторяющегося аукциона, в котором аукционер не
имеет информации о функциях полезности игроков. Игроки не имеют информации о функциях полезности других участников. В каждом раунде пошагового аукциона участникам предлагаются индивидуальные ставки, на основании которых они производят максимизацию своих функций полезности. Игроки передают аукционеру
свои наилучшие ответы для пересчета новых ставок. Предлагаются
стратегии [5] аукционера по формированию новых ставок, которые
создают условия достижения рыночного равновесия.
c Красовский Н. А., Тарасьев А. М., 2009
°
93
Алгоритм иллюстрируется в модели для двух участников на реальных данных по снижению эмиссий в странах Европейского Союза
и России. Полученные результаты представлены на рис. 1. Аналитически построены ситуация равновесия по Нэшу (N E), множество
точек максимума Парето (P M ), кривые наилучших ответов игроков
(BR1) и (BR2), ситуация рыночного равновесия (M E) в точке их
пересечения и вычислена траектория (T A), сдвигающая игроков из
начальной точки (IP ) от некооперативного к кооперативному равновесию.
Рис. 1. Поиск рыночного равновесия.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», при поддержке РФФИ (проект 08-01-00587а), РГНФ (проект 08-02-00315a), гранта Президента РФ (проект НШ-2640.2008.1), Международного института прикладного системного анализа (IIASA).
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
94
[2] Кряжимский А.В., Осипов Ю.С. О дифференциально-эволюционных играх // Тр. Математического института РАН. 1995.
Т. 211. С. 257—287.
[3] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[4] Basar T., Olsder G.J. Dynamic Noncooperative Game Theory. London: Academic Press, 1982.
[5] Kryazhimskii A.V., Tarasyev A.M. Equilibrium and Guaranteeing
Solutions in Evolutionary Nonzero Sum Games. Laxenburg: IIASA,
1998. (IIASA Interim Report IR-98-003)
О дифференциальной игре на перехват
Н. Н. Красовский, А. Н. Котельникова
Институт математики и механики УрО РАН, Екатеринбург
e-mail: nnkras@imm.uran.ru, annk222@rambler.ru
Игра формализуется согласно [1]. Уравнение движения:
ẋ = f (t, x, u, v); u ∈ P, v ∈ Q, x = {xj , j = 1, n}, t ∈ [t0 , ϑ].
(1)
Игра сводится к сближению-уклонению {t, x[t]} с множеством
M внутри множества N [C] ; f (·), P, Q, N [C] ⊂ N, C < 0 удовлетворяют условиям из [1], включая условия: minu maxv l0 f (t, x, u, v) =
maxv minu l0 f (t, x, u, v) = ξ(t, x; l). Индекс «штрих» — знак транспонирования. Плата в игре — параметр C.
Игра унифицируется к эквивалентной [2]:
ẏ (i) = ξ (i) (t, y (i) ; q)q + p, i = 1, 2;
ξ (·) = ξ(·), ξ (2) (·; q) = −ξ (1) (·; −q),
|q| = 1, q 0 p ≥ 0, |p| ≤ λH ,
(1)
c Красовский Н. Н., Котельникова А. Н., 2009
°
95
(2)
где λH — достаточно велико, чтобы при |y| < H для любого s, |s| = 1,
выполнялись условия:
max min s0 [ξ (i) (t, y; q)q + p] = ξ (i) (t, y; s),
q
p
(3)
min s0 [ξ (i) (t, y; q)q + p] < ξ (i) (t, y; s), q 6= s, i = 1, 2.
p
Дана история yt∗ (τ ) = {y[τ ], t0 ≤ τ ≤ t∗ }, {τ, y[τ ]} 6∈ M ,
t0 ≤ t∗ < ϑ.
(1)
Задача I. Найти контрстратегию p∗ (t, y (1) ; q (1) ), t∗ ≤ t < ϑ, гарантирующую
n
(1)
C∗ (t∗ , y[t∗ ]) = min C : ∀y (1) [·, t∗ , y[t∗ ]; p∗ (·)]
o
@τ∗ ∈ [t∗ , τ [M ] ] : {τ∗ , y (1) [τ∗ ]} 6∈ N [C] .
(2)
Задача II. Найти контрстратегии {pC (t, y (2) ; q (2) ), C}, t∗ ≤ t < ϑ,
гарантирующие
n
(2)
C ∗ (t∗ , y[t∗ ]) = sup C : ∀y (2) [·, t∗ , y[t∗ ]; pC (·)]
o
∃τ ∗ ∈ [t0 , τ [M ] ] : {τ ∗ , y (2) [τ ∗ ]} 6∈ N [C] .
Здесь величина τ [M ] такова, что {τ [M ] , y (i) [τ [M ] ] ∈ M }, i = 1, 2.
Игра I, II; (2), (3) имеет цену
γ 0 (yt∗ (τ )) = max{max C : {τ, y[τ ]} ∈ N [C] , t0 ≤ τ ≤ t∗ ; C∗ (t∗ , y[t∗ ])},
(2)
(1)
C∗ = C ∗ и седловую точку {p∗ (t, y (1) ; q (1) ), pC (t, y (2) ; q (2) ), C < C∗ },
t∗ ≤ t < ϑ [1, 2].
Имеем C∗ (t∗ , y (1) [t∗ ]) = C∗ (t∗ , y (1) [t∗ ]; t∗ , y[t∗ ]), и
{C(t∗ , y (2) [t∗ ]), Ct∗∗ } = {C(t∗ , y (2) [t∗ ]); t∗ , y[t∗ ]; C < Ct∗∗ },
где y (i) [t∗ ] — решения (2), (3) при искомых p(i) (t, y (i) , q (i) ), q (i) (t, y (i) ),
i = 1, 2.
Условия (2), (3) определяют для γ 0 (·) и C ∗ (·), C∗ (·), C(·) < C∗ соотношения, адекватные определениям верхнего и нижних минимаксных решений А. И. Субботина [3] для краевой задачи для уравнения
Гамильтона – Якоби:
ηt + H(t, w; ηy ) = 0,
H(t, w; l) = ξ(t, w; l).
96
(4)
C данной игрой соединяется краевая задача для уравнения
α
ηww + ηt + ξα (t, w, ηw ) = 0, α > 0,
2
(5)
[α]
которое при α → 0 вырождается в уравнение (4) и lim η(5) (·) = η(4) (·).
К уравнению (1) присоединяется w-поводырь [4]:
dw = f (t, w, u, v)dt + αdWt , u ∈ P, v ∈ Q.
(6)
[α]
На основе η(5) (t, w) строится вероятностный процесс
{wω [t], xω [t]}, такой, что для задачи I для любых ε > 0, β < 1, и для
задачи II для любого β < 1 найдется ε > 0 такое, что гарантируются
решения с точностью до ε с вероятностью P > β, если α > 0
достаточно мало.
Работа выполнена в рамках программы Президиума РАН «Математическая теория управления», а также при поддержке гранта РФФИ
(проект 09-01-00313) и Программы государственной поддержки ведущих научных школ (НШ-2640.2008.1).
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[2] Красовский Н.Н. К задаче унификации дифференциальных игр
// М.: Докл. АН СССР, 1976. Т. 226, № 6. С. 1260–1263.
[3] Субботин А.И. Минимаксные неравенства и уравнения Гамильтона – Якоби. М.: Наука, 1991.
[4] Красовский Н.Н. Игра сближения-уклонения со стохастическим поводырем // М.: Докл. АН СССР, 1977. Т. 237, № 5.
С. 1020–1023.
97
Об одной иерархической модели условий
для задачи прокладки оптимального маршрута
С. В. Кругликов
Институт математики и механики УрО РАН, Екатеринбург
e-mail: svk@imm.uran.ru
Существенной проблемой при создании автоматизированных систем поддержки принятия решений является моделирование движения, в частности, навигации группы объектов в сложных физикогеографических условиях (СФГУ) [1]. В ряде практически важных
задач динамические характеристики и накапливаемые ошибки позиционирования объектов можно полагать существенно малыми по
сравнению с линейными перемещениями. Тогда по аналогии с сетевыми графами [2] возможно описание препятствий и маршрута
движения принципиально подобными моделями, основанными на понятии иерархической управляемой системы [3]. Допустимому маршруту отдельного объекта отвечает трубка прямолинейных звеньев
с конечным количеством поворотов. Изменение сечений звеньев отражает накапливающиеся ошибки. Динамические характеристики
конкретных объектов определяют выбор уровней детализации препятствий, ограничений на углы поворота, а также длин прямолинейных звеньев.
В сообщении рассматривается задача выбора маршрута на плоскости в предположении, что препятствия движению объектов описываются семейством несвязных множеств. Приведено решение задачи
прокладки оптимальных маршрутов, реализованное в ряде процедур:
1) алгоритм стандартизованного описания ситуации на основе
представления картографической информации контурами; выделены метрики, позволяющие априорно определять уровень иерархии
систем, описывающих СФГУ, достаточный для гибкого применения
алгоритмов;
2) алгоритм выделения допустимого маршрута с последующей
оптимизацией по ряду лексикографически упорядоченных критериев при готовом представлении препятствий; оптимизация маршрутов опирается на априорные конструкции теории гарантированного
c Кругликов C. B., 2009
°
98
управления и оценивания;
3) алгоритм динамической коррекции с учетом устаревания информации и комбинирования препятствий; предложенная в работе модель допускает включение стохастически возникающих препятствий и позволяет моделировать согласованное маневрирование
групп объектов.
Пример. Модель условий опробована для препятствий, описываемых звездными множествами. Конструкция оптимального маршрута
основана на комбинации стандартных маршрутов CS2 (K), построенных в предположении, что обход препятствия осуществляется за счет
движения по дуге (возможно некруговой) на терминальных участках $ и перемещения по прямой ω вне препятствий.
Стандартный маршрут:
CS2 (K) = $hL1, LO(K)i(+)[ω{LO, LF }(K)](+)$hLF (K), L2i.
Здесь параметры задаются центрами OY (kY ) и радиусами RY
окружностей S(OY, RY )(kY ), отвечающих условиям начала Y = O
и завершения Y = F конкретного этапа движения;
OY (kY ) = lY + (−1)kY (RY + rY )E− lY.
Структура маршрута полностью определяется четырьмя точками стыков {LO, Oy, F y, LF }, отвечающих y-типу касания прямолинейных звеньев; y = A ∨ B ∨ C ∨ D.
[1] Шлапоберский А.Б., Ляпустина О.В., Николаев А.А., Храмов М.Ю. Разработка комплекса подготовки специальной картографической информации для информационно-управляющих
систем // Информационно-математические технологии в экономике, технике и образовании. Вып. 3: Сб. матер. междунар. науч. конф. Екатеринбург: Изд-во УГТУ-УПИ, 2007. С. 153–157.
[2] Иванов А.О., Тужилин А.А. Теория экстремальных сетей. М.Ижевск: Изд-во Ин-та компьютерных исследований, 2003.
[3] Кругликов С.В. О задаче математического моделирования операций соединения надводных кораблей // Информационноматематические технологии в экономике, технике и образовании. Вып. 3. Проблемы математического моделирования и
99
информационно-аналитической поддержки принятия решений:
Сб. матер. междунар. науч. конф. Екатеринбург: Изд-во УГТУУПИ, 2007. C. 158–163.
Задачи позиционного управления
с неполной информацией
и метод программных пакетов
А. В. Кряжимский
Международный институт прикладного системного анализа,
Лаксенбург, Австрия
e-mail: kryazhim@iiasa.ac.at
Ю. С. Осипов
Президиум РАН, Москва
e-mail: osipov@pran.ru
Предположение о наблюдении неполного фазового вектора динамической системы, с одной стороны, отражает большинство ситуаций, возникающих при управлении реальными объектами, с другой стороны, представляет собой серьезный осложняющий фактор
в исследовании соответствующих математических постановок. Ряд
успешных теоретических исследований задач управления с неполной
информацией проведен в рамках позиционного дифференциальноигрового формализма Н. Н. Красовского (гл. 15 в [1], а также [2–6]).
В анонсируемой здесь работе, также следующей в русле данного
формализма, предлагается подход к поиску конструктивных решений таких задач в достаточно общих предположениях о динамике
системы и о структуре наблюдаемого сигнала. Подход основан на
двух фундаментальных конструкциях теории позиционных дифференциальных игр – методе неупреждающих программных операторов [7, 8] и принципе экстремального сдвига [1]. Подход излагается
применительно к системам, не подверженным действию динамических помех. Цель такого ограничения – наглядно продемонстрировать, что неопределенность, доставляемая неполнотой информации,
c Кряжимский А. В., Осипов Ю. С., 2009
°
100
имеет принципиально иную природу, нежели неопределенность, возникающая вследствие действия на систему динамических помех.
В первой части работы (см. [9]) ставится задача о гарантирующем
позиционном управлении динамической системой в условиях неполной информации (в целях компактности изложения рассматривается
лишь один вариант задачи – задача наведения, в которой управляемую систему требуется в фиксированный момент времени навести на
фиксированное целевое множество). Вводятся в рассмотрение основные инструменты исследования – так называемые пакеты программ.
Пакеты программ суть аналоги классических игровых неупреждающих программных операторов, преобразующих программы динамических помех – программы-«вызовы» – в програмы-«ответы»
управляющей стороны. Роль программ-«вызовов» при этом играют
«внешние» факторы неопределенности, присущие ситуации с неполной информацией – начальные состояния управляемой системы и
реализации (малых) помех в канале наблюдения ее (неполных) фазовых векторов. Устанавливается, что задача о гарантирующем управлении в классе позиционных стратегий разрешима тогда и только тогда, когда она разрешима в классе пакетов программ. Обоснование
этого факта опирается на идею экстремального сдвига.
Нахождение разрешающего пакета программ – сложная, но все
же программная задача; с этой точки зрения полученное утверждение открывает возможности для аналитического описания условий
разрешимости задачи о гарантирующем позиционном управлении в
условиях неполной информации. Во второй части работы делается
шаг по пути такого анализа. При условии конечности априорно заданного множества начальных состояний устанавливается, что разрешимость задачи о гарантирующем управлении в классе пакетов
программ эквивалентна разрешимости такой же задачи в классе значительно более простых программных операторов – так называемых
идеализированных пакетов программ: последние являются преобразователями вида «начальное состояние – программа управления» и
освобождены от необходимости реагировать на помехи наблюдения.
Работа выполнена при поддержке РФФИ, проект 09-01-00624-a.
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
101
[2] Красовский Н.Н., Осипов Ю.С. Задача управления с неполной
информацией // Механ. тверд. тела. 1973. № 4. C. 5–14.
[3] Кряжимский А.В. Дифференциальная игра наведения в условиях неполной информации // Укр. математич. журнал. 1975.
Т. 75, № 4. C. 521–526.
[4] Кряжимский А.В. Альтернатива в линейной игре наведенияуклонения с неполной информацией // Докл. АН СССР. 1976.
Т. 230, № 4. C. 773–776.
[5] Крекнин А.А., Субботин А.И. Игровая задача преследования
в условиях неполной фазовой информации о преследуемой системе // Дифференциальные системы управления. АН СССР,
УНЦ. 1979. С. 21–33.
[6] Ченцов А.Г. Метод программных итераций в абстрактных задачах управления // Прикл. математика и механика. 2004. № 4.
C. 573–585.
[7] Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах
управления. М.: Наука, 1981.
[8] Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.
[9] Осипов Ю.С. Пакеты программ: подход к решению задач позиционного управления с неполной информацией // Успехи математических наук. 2006. Т. 61, № 4 (370). C. 25–76.
102
О задачах управления групповым движением
А. Б. Куржанский
Московский государственный университет
e-mail: kurzhans@mail.ru, kurzhans@cs.msu.su
Доклад посвящен новым классам задач математической теории
процессов управления, мотивированным прикладными проблемами.
А именно, рассматривается «групповое движение», порожденное конечным множеством подсистем с управлениями, подлежащими выбору при том условии, что по ходу движения эти подсистемы попарно
не сближаются, но и не слишком отдаляются друг от друга. Приводятся решения задач целевого управления групповым движением,
синтезированного по результатам доступных наблюдений текущего
состояния совокупной системы в условиях неопределенных помех.
Конструирование синтезированных управлений производится исходя из условий гарантированного достижения целевого множества,
минуя известные препятствия и не нарушая требований, определяющих групповое движение. Предложенные решения опираются на
методы динамического программирования при фазовых ограничениях. Для систем с изначальной линейной структурой предложены
более подробные соотношения, полученные методами теории двойственности нелинейного анализа. Приведены примеры.
Работа выполнена при поддержке грантов НШ-4576.2008.1 и РФФИ, проект
09-01-00589.
[1] Куржанский А.Б. О синтезе управлений по результатам измерений // Прикл. математика и механика. 2004. Т. 68, № 4.
С. 547–563.
[2] Kurzhanski A.B., Mitchell I.M., Varaiya P. Optimization techniques for state-constrained control and obstacle problems // Journal of Optimization Theory and Applications. 2006. Vol. 128, No. 3.
P. 499–521.
[3] Куржанский А.Б. Задача управления групповым движением.
Общие соотношения // Докл. РАН. 2009. (в печати)
c Куржанский А. Б., 2009
°
103
О формализме Гамильтона – Якоби
в задачах управления
наследственными динамическими системами
Н. Ю. Лукоянов
Институт математики и механики УрО РАН, Екатеринбург
e-mail: nyul@imm.uran.ru
Рассматривается задача об управлении в условиях помех динамической системой, движение которой описывается дифференциальными уравнениями с последействием. Промежуток времени управления зафиксирован. Оптимизируемый показатель качества оценивает реализацию движения на этом промежутке, а также содержит
интегральные оценки реализаций управления и помехи. Мгновенные
значения воздействий управления и помехи стеснены геометрическими ограничениями. Предполагается, что уравнения движения удовлетворяют типичным условиям, обеспечивающим существование и
единственность рассматриваемых реализаций процесса управления.
Задача формализуется в русле теоретико-игрового подхода [1, 2].
Оптимальный гарантированный результат управления определяется
в классе стратегий с памятью — неупреждающих отображений реализации движения. Величина этого результата зависит от начальной
истории движения и, таким образом, задает неупреждающий функционал реализации движения — функционал цены. Такая функциональная постановка задачи примыкает к подходу, предложенному
в [3] для исследования задач об устойчивости движения наследственных систем, и развитому, например, в [4] для задач управления такими системами.
В докладе обсуждаются способы описания функционала цены и
оптимальных стратегий управления на основе решения соответствующего уравнения типа Гамильтона – Якоби – Айзекса – Беллмана.
При выводе этого уравнения и обобщающих его неравенств [5] используются элементы инвариантного дифференциального исчисления функционалов [6] и аппарат подходящих производных по направлениям. Определение корректного решения опирается на конструкции унификации дифференциальных игр [7]. При этом расc Лукоянов Н. Ю., 2009
°
104
сматриваются минимаксный [8] и вязкостный [9] подходы к обобщенному решению полученного уравнения.
Материал доклада обобщает результаты автора [10, 11].
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке РФФИ (проект 09-01-00313) и Программы государственной поддержки ведущих научных школ (НШ-2640.2008.1).
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[2] Красовский Н.Н. Дифференциальные игры. Аппроксимационные и формальные модели // Мат. сб. 1978. Т. 107, № 4.
С. 511–571.
[3] Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Физматгиз, 1959.
[4] Осипов Ю.С. Дифференциальные игры систем с последействием // Докл. АН СССР. 1971. Т. 196, № 4. С. 779–782.
[5] Субботин А.И. Обобщение основного уравнения теории дифференциальных игр // Докл. АН СССР. 1980. Т. 254, № 2,
С. 293–297.
[6] Kim A.V. Functional Differential Equations. Application of
i-Smooth Calculus. Dordrecht: Kluwer, 1999.
[7] Красовский Н.Н. К задаче унификации дифференциальных игр
// Докл. АН СССР. 1976. Т. 226, № 6. С. 1260–1263.
[8] Subbotin A.I. Generalized Solutions of First-Order PDEs: the Dynamical Optimization Perspective. Boston etc.: Birkhäuser, 1995.
[9] Crandall M.G., Lions P.-L. Viscosity solutions of Hamilton – Jacobi
equations // Trans. Amer. Math. Society. 1983. Vol. 277, No. 1.
P. 1–42.
[10] Лукоянов Н.Ю. Дифференциальные неравенства для негладкого функционала цены в задачах управления системами с последействием // Тр. ИММ УрО РАН. Екатеринбург, 2006. Т. 12,
№ 2. C. 108–118.
105
[11] Лукоянов Н.Ю. Уравнения Гамильтона – Якоби для наследственных систем: минимаксное и вязкостное решения // Докл. РАН. 2008. Том 418, № 3. С. 300–303.
Решение систем уравнений
кодифференцируемых функций
Г. Е. Мурзабекова
Санкт-Петербургский государственный университет
e-mail: guldenmur07@mail.ru
Задача решения систем уравнений кодифференцируемых функций возникает при исследовании вопроса существования негладких
неявных функций. Поскольку понятие кодифференциала, введенного В.Ф. Демьяновым [1], позволяет выделить подмножество непрерывно кодифференцируемых функций, то для таких функций иногда можно найти значение производной неявной функции.
Пусть X ⊂ Rn – открытое множество и x ∈ X. Будем говорить,
что функция f , заданная и конечная на X, кодифференцируема по
Дини в точке x, если существуют такие выпуклые компакты df ⊂
Rn+1 и df ⊂ Rn+1 , что
f (x + ∆) = f (x) + Φx (∆) + ox (∆),
где
Φx (∆) =
max
[a + (v, ∆)] +
[a,v]∈df (x)
min
[b + (w, ∆)],
[b,w]∈df (x)
ox (α∆)
→ 0 ∀ ∆ ∈ Rn .
α α↓0
Здесь a, b ∈ R1 , v, w ∈ Rn , а co{x, x + ∆} ⊂ X.
Если (3) имеет место равномерно по ∆ ∈ S = {∆ ∈ Rn | ||∆|| = 1},
то будем говорить, что функция f кодифференцируема в x равномерно по направлениям или кодифференцируема по Адамару. Пара
множеств Df (x) = [df (x), df (x)] называется кодифференциалом f в
c Мурзабекова Г. Е., 2009
°
106
точке x, множество df (x) называется гиподифференциалом, а множество df (x) – гипердифференциалом. Если функция f кодифференцируема в некоторой окрестности точки x, то отображение Df
назовем кодифференциальным.
Зафиксируем g ∈ Rm , g 6= 0, и рассмотрим систему уравнений
fi (x0 + αg, y) = 0
∀ i ∈ 1, n.
Будем говорить, что существует неявная функция по направлению g, если существуют α0 > 0 и вектор-функция y(α), заданная на
[0, α0 ], такие, что
y(α) → y0 ,
f (x0 + αg, y(α)) = 0n
α↓0
∀ α ∈ [0, α0 ].
Предположим, что все функции fi (z) непрерывно кодифференцируемы по Дини в точке z0 = [x0 , y0 ] и их производные по Дини
fi0 (z0 , ∆), где ∆ = [g, q], q ∈ Rn , непрерывны как функции q и ограничены сверху. Тогда имеет место следующее разложение
fi (z0 + α∆) = fi (z0 ) +
+
min
[bi ,wi ]∈df (z0 )
max
[ai + α(vi , ∆)]+
[ai ,vi ]∈df (z0 )
[bi + α(wi , ∆)] + oi∆ (α),
где ai , bi ∈ R1 , vi = [v1i , v2i ], wi = [w1i , w2i ] ∀i ∈ 1, n,
oi∆ (α)
→0
α α↓0
∀ ∆ ∈ Rm+n .
Для выяснения вопроса о существовании и свойствах неявной
функции по направлению g следует найти все решения системы вида
max
[ai + (v1i , αg) + (v2i , q(α))]+
min
[bi + (w1i , αg) + (w2i , q(α))] = 0.
[ai ,v1i ,v2i ]∈df (z0 )
+
[bi ,w1i ,w2i ]∈df (z0 )
Работа выполнена при поддержке РФФИ, проект 09-01-00360.
[1] Демьянов В.Ф., Рубинов А.М. Основы негладкого анализа и
квазидифференциальное исчисление. М.: Наука, 1990.
[2] Мурзабекова Г.Е. Теорема о неявной функции для негладких
систем в терминах экзостеров // Изв. РАН. Теория и системы
управления. 2009. № 4. C. 56–62.
107
Методы теории гарантированного управления
в задачах финансовой математики
О. И. Никонов
Институт математики и механики УрО РАН,
Уральский государственный технический университет–УПИ,
Екатеринбург
e-mail: aspr@mail.ustu.ru
Со времени появления работы Г. Марковица [1] развитие теории портфельных инвестиций шло в нескольких направлениях. Одно
из них — динамические постановки задачи. Здесь отметим работы
Р. Мертона [2] и Дж. Моссина [3], относящиеся, соответственно, к моделированию непрерывных и многошаговых стохастических процессов.
В настоящем докладе рассматриваются проблемы динамического управления инвестиционным портфелем в условиях, когда динамика усредненных характеристик доходностей активов описывается детерминированными дифференциальными включениями. Такое
описание неопределенности позволяет применять методы [4, 5].
Инвестиционный портфель мы ассоциируем с N + 1-мерным вектором ŷ = (y0 , y)T , i-ая компонента которого соответствует доле капитала, вкладываемой инвестором в i-ый актив. Доступные
рисковые активы характеризуются случайными доходностями ri ,
i = 1, . . . , N , с математическими ожиданиями xi и среднеквадратичными отклонениями σi . Первая компонента r0 = x0 представляет
собой детерминированную доходность безрисковых вложений.
N
P
Величина µ(x, ŷ) =
xi yi – ожидаемая доходность портфеля,
i=0
p
σ(y) = y T V y – риск портфеля. Здесь символом V обозначена матрица ковариаций случайных величин ri , i = 1, . . . , N .
В отличие от постановок классической финансовой математики
предполагается, что динамика величин xi описывается не стохастическими дифференциальными уравнениями, а дифференциальными
c Никонов O. И., 2009
°
108
включениями. В наиболее простом случае включения имеют вид
dx
∈ A(t)x + Q(t),
dt
(1)
где Q(t) – множество, отвечающее неопределенности в системе, A(t) –
заданная непрерывная матричная функция.
Предполагается также, что интенсивность (скорость) реструктуризации портфеля dŷ/dt = u также ограничена в каждый момент
N
P
времени. Учитывая равенство y0 = 1 −
yi , данное свойство можем
i=1
записать в следующем виде:
dy
= u, u ∈ P (t).
dt
(2)
Множество P (t) определяет возможности инвестора по реструктуризации портфеля. Вектор u трактуется как управляющее воздействие, подчиненное инвестору. Одна из возможных постановок задачи предполагает, что в начальный момент времени портфель инвестора является эффективным в смысле Марковица – Тобина. Цель
управления в этом случае – обеспечить дальнейшую эффективность
портфеля в условиях переменных и неизвестных заранее ожидаемых
доходностей активов.
В докладе формализуются стратегии управления инвестиционным портфелем как функции U = U (t, x, y) ⊆ P (t), которым соответствуют изменяющиеся во времени характеристики риска и доходности портфеля: µ[t] = y0 (t)r0 + (y(t), x(t)), σ[t] = (y T (t)V y(t))1/2 .
Формулируются условия разрешимости указанной выше задачи.
Работа выполнена при поддержке РФФИ, проект 09-01-00223а, РГНФ, проект 08-02-00315а.
[1] Markowitz H. Portfolio selection // J. Finance. 1952. Vol. 7.
P. 77–91.
[2] Merton R.C. Lifetime portfolio selection under uncertainty: the continuous time case // Rev. Econ. Stat. 1969. Vol. 51.
[3] Mossin J. Optimal multiperiod portfolio policies // J. Bus. 1969.
Vol. 41.
[4] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
109
[5] Krasovskii N.N., Subbotin A.I. Game-theoretical control problems.
Berlin: Springer, 1988.
Кооперативные дифференциальные игры на сетях
Л. А. Петросян
Санкт-Петербургский государственный университет
e-mail: spbuoasis7@peterlink.ru
В рассматриваемой неантагонистической дифференциальной игре n лиц игроки связаны сетью N . Обозначим через gij дугу, соединяющую игроков i и j. Пусть xi — позиционная переменная, описывающая состояние игрока i, а ui — его управление. Обозначим через K(i) множество игроков, связанных с игроком i дугой gij , через
uK(i) — совокупность управлений игроков из K(i). Тогда уравнение
движения имеет вид
ẋi = f i (xi , ui , uK(i) ),
xi (t0 ) = xi0 .
Игра развивается на отрезке времени [t0 , T ]. Выигрыши определяются по формуле
K(i)
Ki (xi0 , x0
, ui , uK(i) ) =
X Z
j∈K(i)
T
hi (xi , xj )dt,
hi > 0.
t0
Рассмотрим кооперативный вариант игры. При определении характеристической функции исходим из предположения, что коалиция S ⊂ N есть подсеть сети N без дуг, связывающих S с элементами множества N \ S. Это предположение дает возможность эффективного построения характеристической функции и связанных с ней
принципов оптимальности.
c Петросян Л. А., 2009
°
110
Пусть S ⊂ N . Тогда характеристическую функцию
V (xS0 , T − t0 ; S) можно определить по правилу
X X Z T
V (xS0 , T − t0 ; S) =
max
h` (x` , xj )dt, h` > 0.
uS ={u` ,`∈S}
`∈S j∈K(`)∩S
t0
Соотношение S ⊂ N выполнено при условии
ẋ` = fS` (x` , u` , uK(`)∩S ),
x` (t0 ) = x`0 ,
` ∈ S.
Разностные схемы в моделировании
эволюционных управляемых систем
с последействием
В. Г. Пименов
Уральский государственный университет, Екатеринбург
e-mail: Vladimir.Pimenov@usu.ru
В эволюционных (параболического или гиперболического типов)
управляемых системах часто возникает эффект последействия. Этот
эффект может быть обусловлен как наследственными свойствами
самой системы, так и способом управления, например, задержкой
информации в канале обратной связи. При создании численных моделей дискретного характера адекватное описание эффекта последействия приводит к исследованию разностных схем вида
B
yi+1 − yi
+ Ayi = F (ti , I{yk }i ).
∆
(1)
Здесь ti = i∆, i = 0, 1, . . . , N , – дискретные моменты времени;
∆ > 0 – временной шаг; yi ∈ Rn – вектор состояния дискретной
модели на i-ом временном слое; {yk }i = {yk , i − m ≤ k ≤ i} – предыстория дискретной модели к моменту ti , m = τ /∆; τ > 0 – величина
запаздывания; I{yk }i – оператор интерполяции, т. е. отображение
дискретной предыстории модели в некоторое множество функций
H = H[−τ, a], a ≥ 0; A, B – линейные операторы, F – нелинейный
векторный функционал, липшицевый по второй переменной.
c Пименов В. Г., 2009
°
111
Подобно общей теории разностных схем [1], назовем уравнение (1)
каноническим. Непосредственно результаты этой теории по исследованию устойчивости и сходимости разностной модели к точному решению эволюционного уравнения неприменимы в силу зависимости
модели от предыстории.
Наряду с канонической формой, в случае обратимого оператора
B, рассмотрим явную пошаговую форму разностной схемы
yi+1 = Syi + ∆Φ(ti , I{yk }i ).
(2)
К уравнениям вида (2) можно применить результаты общей
теории численных методов для функционально-дифференциальных
уравнений [2, 3], согласно которой, при условии устойчивости метода, порядок сходимости определяется порядком невязки, порядком
интерполяции и порядком стартовых значений.
Определение 1. Назовем схему устойчивой, если kSk ≤ 1.
Пусть u(t, x) – точное решение исходной эволюционной задачи,
xj = x0 + jh, j = 0, 1, . . . , n − 1, – точки разбиения по пространственной переменной, ui = (u(ti , x0 ), . . . , u(ti , xn−1 )) – вектор точного состояния на i-ом временном слое. Будем считать, что стартовые
значения в схеме точны: {yk }0 = {uk }0 .
Определение 2. Метод сходится с порядком O(∆p1 + hp2 ), если
найдется такая константа C, что для всех i = 1, . . . , I выполняется
kui − yi k ≤ C(∆p1 + hp2 ).
Определение 3. Невязкой метода назовем величину ψ = ui+1 −
Sui + ∆Φ(ti , I{uk }i ).
Теорема. Если метод устойчив, невязка имеет порядок
O(∆p1 + hp2 ), оператор интерполяции липшицев и имеет порядок p3 [2, 3] на точном решении, то метод сходится с порядком
O(∆min{p1 ,p3 } + hp2 ).
Критерии устойчивости устанавливаются с помощью техники [1]
исследования однородного уравнения
yi+1 − yi
+ Ayi = 0.
(3)
∆
Для разных видов разностных схем проведены численные эксперименты на тестовых и модельных примерах.
B
Работа выполнена при поддержке РФФИ, проект 08-01-00141.
112
[1] Самарский А.А. Теория разностных схем. М.: Наука, 1983.
[2] Пименов В.Г. Общие линейные методы численного решения
функционально-дифференциальных уравнений // Дифференц.
уравнения. 2001. Т. 37, № 1. C. 105–114.
[3] Ким А.В., Пименов В.Г. i-Гладкий анализ и численные методы решения функционально-дифференциальных уравнений.
Москва – Ижевск: ИКИ, НИЦ, «РХД», 2004.
Вариационные методы в задачах управления
асимптотическими инвариантами
С. Н. Попова
Удмуртский государственный университет, Ижевск
e-mail: ps@uni.udm.ru
В задачах управления ляпуновскими инвариантами важную роль
играет понятие глобальной достижимости линейной управляемой системы
ẋ = A(t)x + B(t)u, x ∈ Rn , u ∈ Rm , t ∈ R.
(1)
Предполагаем, что коэффициенты A(·) и B(·) кусочно-непрерывны
и ограничены на R. В качестве управлений в системе (1) выбираем
измеримые по Лебегу и ограниченные на своей области определения
функции.
Определение. Система (1) называется глобально достижимой на
отрезке [t0 , t1 ], если для всякой n × n-матрицы H с положительным
определителем найдется матричное управление U : [t0 , t1 ] → Mmn
такое, что матрица Коши XU (t, s) системы
ẋ = (A(t) + B(t)U (t))x
удовлетворяет равенству
XU (t1 , t0 ) = X0 (t1 , t0 )H.
c Попова С. Н., 2009
°
113
Теорема. Система (1) глобально достижима на [t0 , t1 ] в том и
только том случае, когда на [t0 , t1 ] для всякой H ∈ Mnn , det H > 0,
разрешима матричная задача управления
Ẏ = A(t)Y + B(t)V,
Y (t0 ) = E,
Y ∈ Mnn , V ∈ Mmn ,
(2)
Y (t1 ) = X0 (t1 , t0 )H,
(3)
det Y (t) > 0 при всех t ∈ [t0 , t1 ].
(4)
Разрешимость задачи (2), (3) при каждой H гарантируется полной управляемостью системы (1) на [t0 , t1 ] (Н. Н. Красовский [1],
Р. Калман [2]). Но полная управляемость системы (1) не обеспечивает выполнение неравенства (4).
Пример. Система (1) при n = 2, m = 1, A(t) ≡ 0 ∈ M22 ,
B(t) = col(b1 (t), b2 (t)), где b1 (t) ≡ 1 при t ∈ [0, 1] и b1 (t) ≡ 0 при
t ∈ (1, 2], а b2 (t) = 1 − b1 (t), вполне управляема на [0, 2]. Выберем
H = −E и положим V (t) = (v1 (t), v2 (t)). Определитель решения Y (t)
Rt
задачи (2), (3) для t ∈ [0, 1] имеет вид det Y (t) = 1 + 0 v1 (s) ds. При
R1
этом 0 v1 (s) ds = −2. Следовательно, условие (4) не выполняется.
Таким образом, для обеспечения свойства глобальной достижимости требуется длина отрезка времени, вообще говоря, превышающая длину отрезка полной управляемости.
Пусть
Z t1
W (t0 , t1 ) =
X0 (t0 , s)B(s)B T (s)X0T (t0 , s) ds
t0
— матрица Калмана системы (1) на [t0 , t1 ]. Предположим, что система (1) равномерно вполне управляема [2], то есть при некоторых
σ > 0 и α > 0 и всех ξ ∈ Rn и t0 ∈ R выполнено неравенство
ξ T W (t0 , t0 + σ)ξ > αξ T ξ. Свойство равномерной полной управляемости обеспечивает полную управляемость системы (1) на [t0 , t0 +σ] при
всех t0 . Зафиксируем t0 ∈ R, l ∈ N и положим t1 = t0 +lσ. На отрезке
[t0 , t1 ] рассмотрим задачу о нахождении такого матричного управления V (·), которое решало бы задачу (2), (3) и доставляло минимум
функционалу
¶
Z t1 µ
ϕ(t, V )
2
+
kV
(t)k
dt,
kY (t)k2
t0
114
где ϕ — неотрицательная функция. Методами вариационного исчисления получены новые достаточные условия глобальной достижимости системы (1).
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления».
[1] Красовский Н.Н. Теория управления движением. М.: Наука,
1968.
[2] Kalman R.E. Contributions to the theory of optimal control //
Boletin de la Sociedad Matematika Mexicana. 1960. Vol. 5, № 1.
P. 102–119.
Свойства интегральной аппроксимации
негладких функций
И. М. Прудников
Санкт-Петербургский государственный университет
e-mail: prudnikov.08@mail.ru
В докладе приводится новый нелокальный способ аппроксимации негладких функций, в результате которого получаем дважды
дифференцируемые функции, сохраняющие ²(D)-стационарные точки. C помощью таких функций можно строить методы оптимизации
второго порядка, сходящиеся к ²(D)-стационарным точкам. Описан
алгоритм оптимизации, сходящийся к стационарной точке функции
f (·) со сверхлинейной скоростью, т. е. имеющий скорость сходимости
более быструю, чем любая геометрическая прогрессия.
Пусть f (·) : Rn → R – липшицева с константой L функция и
x∗ – ее точка локального минимума (максимума) в Rn . Как известно,
необходимым условием экстремума для липшицевой функции является принадлежность нуля субдифференциалу Кларка. Любая точка, для которой выполняется написанное выше условие, называется
также стационарной.
Возьмем произвольное выпуклое компактное множество D ⊂ Rn
с мерой µ(D) > 0. Введем определение ²(D)-стационарной точки.
c Прудников И. М., 2009
°
115
Определение. Точку x² назовем ²(D)-стационарной точкой функции f (·), если множеству x² + D принадлежит стационарная точка
функции f (·).
Определим функцию ϕ(·) : Rn → R равенством
Z
1
f (x + y)dy.
ϕ(x) =
µ(D) D
Верны следующие свойства функции ϕ(·).
Теорема 1. Если f (·) – конечная выпуклая функция в Rn , то ϕ(·) –
также конечная выпуклая в Rn .
Теорема 2. Функция ϕ(·) – непрерывно дифференцируемая функция
с производной
Z
1
0
ϕ (x) =
f 0 (z + x)dz.
µ(D) D
Замечание. Производная функции f (·) берется в тех точках, где
она существует.
Теорема 3. Все стационарные точки функции ϕ(·) являются ²(D)стационарными точками функции f (·).
Оказывается, что наряду с непрерывностью функция ϕ0 (·) обладает свойством липшицевости с константой L̃, зависящей от D.
Теорема 4. Если f (·) – липшицевая функция в Rn , то ϕ0 (·) – также липшицевая в Rn .
Рассмотрим функцию
φ(x) =
1
µ(D)
Z
ϕ(x + y)dy.
D
Поскольку ϕ(·) – липшицева, то согласно предыдущему будем иметь
Z
1
φ0 (x) =
ϕ0 (z + x)dz.
(1)
µ(D) D
Отсюда следует, что φ(·) – непрерывно дифференцируемая функция.
Можно повторно продифференцировать формулу (1). В итоге будем
иметь
Z
1
φ00 (x) =
ϕ00 (z + x)dz,
µ(D) D
116
т. е. φ(·) – дважды дифференцируемая функция. Если ϕ0 (·) – липшицевая с константой L̃, то kϕ00 (·)k ≤ L̃, т. е. φ(·) – дважды непрерывно
дифференцируемая функция, для которой норма матрицы вторых
производных ограничена константой L̃.
Теорема 5. Все стационарные точки функции φ(·) являются
²(2D)-стационарными точками функции f (·).
Для нахождения ²(2D)-стационарных точек функции f (·) следует применять методы второго порядка к функции φ(·). Если выполнены определенные условия, то численный метод будет сходиться
с квадратичной скоростью. Приводится численный метод оптимизации, сходящийся быстрее любой геометрической прогрессии к стационарной точке функции f (·).
Работа выполнена при поддержке РФФИ, проект 09-01-00360.
Метод декомпозиции
в задачах управления механическими системами
с дефицитом управляющих параметров
С. А. Решмин
Институт проблем механики РАН, Москва
e-mail: reshmin@ipmnet.ru
Рассматривается система, динамика которой описывается дифференциальными уравнениями, имеющими лагранжеву форму
A(q)q̈ = U + S(q, q̇, t).
(1)
Здесь введены следующие обозначения: q = (q1 , . . . , qn ) — вектор
обобщенных координат системы (n — число степеней свободы системы); A(q) — симметрическая положительно-определенная матрица
кинетической энергии системы с элементами ajk , зависящими от q;
c Решмин С. А., 2009
°
117
U = (U1 , . . . , Um , 0, . . . , 0) — n-мерный вектор управляющих обобщенных сил с m ненулевыми компонентами (m < n); S = (S1 , . . . , Sn ) —
вектор-функция
S(q, q̇, t) = Q(q, q̇, t) −
n
X
Γjk q̇j q̇k ,
j,k=1
где Γjk = (Γ1jk , . . . , Γnjk ) — n-мерные векторы с компонентами
Γijk =
∂aij
1 ∂ajk
−
,
∂qk
2 ∂qi
а Q = (Q1 , . . . , Qn ) — n-мерный вектор, включающий все прочие
обобщенные силы и неконтролируемые возмущения.
На ненулевые компоненты управляющего вектора накладываются ограничения
i = 1, . . . , m,
(2)
|Ui | ≤ Ui0 ,
где Ui0 — заданные постоянные. На компоненты вектора неуправляющих сил также накладываются ограничения
|Qi | ≤ Q0i ,
i = 1, . . . , n,
где Q0i > 0 — заданные постоянные.
Начальное состояние системы (1) задано:
q(0) = q 0 ,
q̇(0) = q̇ 0 .
(3)
ẋ = B(q)q̇.
(4)
Введем обозначения
x = L(q),
Здесь L = (L1 , . . . , Lm ) — гладкая m-мерная вектор-функция, зависящая от q; B — матрица размера m × n, причем для ее элементов имеет место выражение Bij = ∂Li /∂qj . Терминальное множество
определяется движением системы (1) вдоль линий уровня функций
Li (q), i = 1, . . . , m:
x = x∗ = const,
ẋ = 0.
(5)
Из равенств (4), (5) получим соотношения для терминального множества по координатам q, q̇ в виде
L(q) = x∗ ,
B(q)q̇ = 0.
118
(6)
Рассматривается следующая задача управления.
Требуется построить управление обратной связи U (q, q̇), удовлетворяющее ограничению (2) и переводящее систему (1) из состояния
(3) на терминальное множество (6), где x∗ — заданный постоянный
m-мерный вектор. Время процесса управления τ конечно и не фиксируется. Без ограничения общности начальный момент времени принят равным нулю.
Получено развитие и обобщение метода декомпозиции [1], который был предложен для построения управления в форме синтеза
лагранжевыми системами в случае, когда число управлений в системе равно числу ее степеней свободы. При построении управления
применяется подход теории дифференциальных игр [2].
Работа выполнена при поддержке РФФИ, проекты 07-01-92109, 08-01-00411,
08-08-00292; Фонда содействия отечественной науке и Программы поддержки
ведущих научных школ, проект НШ-4315.2008.1.
[1] Черноусько Ф.Л. Синтез управления нелинейной динамической
системой // Прикл. математика и механика. 1992. Т. 56, вып. 2.
С. 179–191.
[2] Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970.
119
Об одной возможности
построения обобщенного решения
уравнения Гамильтона – Якоби
О. С. Розанова
Московский государственный университет
e-mail: rozanova@mech.math.msu.su
В работе используется метод стохастических возмущений, примененный ранее для исследования свойств решений задачи Коши для
невязкого уравнения Бюргерса [1, 2]. Рассмотрим задачу
ut + H(Dx u, x) = 0, u : Rn × (0, ∞) → R, u(x, 0) = u0 (x).
(1)
Обозначим v = Dx u, v0 (x) = Dx u0 (x) и рассмотрим систему 2n + 1
СДУ, представляющую собой стохастическое возмущение характеристических уравнений:
dX = Dv H(V, X) dt + σ dW,
dV = −Dx H(V, X) dt,
dU = (V Dv H(V, X) − H(V, X)) dt + σ(V, dW ),
X(0) = x, V (0) = v, U (0) = u,
(x, v, u) ∈ Rn × Rn × R.
Здесь X, V — n-мерные случайные величины, U — одномерная случайная величина, W — n-мерное броуновское движение, σ — положительная константа. Уравнение Фоккера – Планка [3] для функции
P (t, x, v, u) (совместной плотности распределения вероятностей случайных величин (X, V, U )) имеет вид
Pt + Dv H(v, x) Px − Dx H(v, x) Pv + (v Dv H(v, x) − H(v, x)) Pu =
1 2
1
σ Pxx + σ 2 v 2 Puu
2
2
Если поставить начальное условие
=
P (0, x, v, u) = ρ(x) δ(v − v0 (x)) δ(u − u0 (x)),
то функция вида
R
ûσ (x, t) = RR
n ×R
Rn ×R
u P (t, x, v, u) dv du
P (t, x, v, u) dv du
c Розанова О. С., 2009
°
120
(2)
(3)
(4)
(условное математическое ожидание U при фиксированном X) такова, что ûσ (t, x) = u0 (x). Будем называть ρ-обобщенным решением
задачи (1) предел uρ (x, t) функции ûσ (x, t) при σ → 0 в случае, если он существует. Значение этого предела зависит от функции ρ(x)
в (3), имеющей смысл начального распределения случайной величины X.
Для произвольного гамильтониана H(v, x) решить задачу (2), (3)
удается не всегда, однако если зависимость от x отсутствует, то справедливо следующее интегральное представление:
ûσ (x, t) =
|s−x+tHv (v0 (s))|2
R
2tσ 2
ρ(s)(u0 (s) + (v0 (s)Hv (v0 (s)) − H(v0 (s))) t) e−
ds
Rn
=
.
|s−x+tHv (v0 (s))|2
R
2tσ 2
ρ(s) e−
ds
Rn
Нетрудно проверить, что для гладких начальных условий до тех
пор, пока решение сохраняет гладкость, выражение uρ (x, t) совпадает с тем, что дает формула Хопфа – Лакса.
Работа выполнена при поддержке АВЦП «Развитие научного потенциала
высшей школы», проект 2.1.1/1399, и проекта DFG 436 RUS 113/823/0-1.
[1] Albeverio S., Rozanova O. The non-viscous Burgers equation associated with random positions in coordinate space: a threshold for
blow up behaviour // Mathematical methods and models in applied
science. 2009. Vol. 19, No. 5. P. 1–19.
[2] Albeverio S., Rozanova O. Suppression of unbounded gradients in a
SDE associated with the Burgers equation // Proc. AMS. (в печати)
[3] Risken H. The Fokker – Planck Equation: Methods of Solution and
Applications. Second Edition. Springer-Verlag, 1989.
121
Об одном численном алгоритме
для решения трехмерных задач достижимости
И. В. Рублев, Д. С. Файзуллин
Московский государственный университет
e-mail: iroublev@cs.msu.su
Построение множеств достижимости является одной из важных задач математической теории управления. В частности, при
помощи этих множеств можно решить задачу синтеза управления.
Множества достижимости хорошо изучены для линейных управляемых систем. В этом случае разработаны эффективные методы их
вычисления. Однако в случае нелинейных систем задача достижимости является весьма трудной. Известно, что она может быть сведена
к некоторым задачам динамической оптимизации, так что множество достижимости X[t] = X(t, t0 , x0 ) представляется как множество уровня функции цены V (t, x), являющейся обобщенным решением соответствующего уравнения Гамильтона – Якоби [1]. Функция
V (t, x) может быть найдена при помощи численных методов, таких
как, например, методы множеств уровня. Однако в общем случае
эти методы могут быть весьма чувствительными к шагу дискретизации по t и x и даже к выбору соответствующих сеток (особенно
в окрестности точек, где функция V (t, x) не дифференцируема).
Таким образом, имеет смысл рассматривать задачу достижимости для частных классов нелинейных систем управления, для которых есть возможность построить более регулярные и простые численные методы. В данной работе рассматривается численный алгоритм решения задачи достижимости для следующего класса систем,
линейных по управляющим параметрам:
ẋ(t) = G(x(t))u(t), x(t) ∈ Rn , u(t) ∈ P = E(0, P ), t ∈ [t0 , T ].
(1)
Предполагается, что функция G : Rn → Rn×m достаточно гладкая,
P ∈ Rm×m , P = P 0 > 0, E(0, P ) = {u ∈ Rm : hu, P −1 ui ≤ 1}, m > 1
(т. е. ∂P связно). Кроме того, система (1) является локально вполне
управляемой (т. е. X[t] имеет полную размерность), граница ∂X[t]
связна, а также справедливы некоторые дополнительные свойства,
c Рублев И. В., Файзуллин Д. С., 2009
°
122
обеспечивающие регулярность задачи достижимости, выполнение
которых проверяется непосредственно, исходя из уравнений (1).
Алгоритм основан на использовании характеристик Коши для
уравнения Гамильтона – Якоби. При выполнении указанных выше
условий регулярности граница ∂X[t] представляется с точностью до
замыкания как подмножество концов характеристик, соответствующих неособым режимам принципа максимума Л.С. Понтрягина
при x[t] ∈ ∂X[t] и параметризованных вектором α ∈ Rn−1 . Однако
известно, что даже если параметризация x(t, α) является гладкой,
множество ∂X[t] может быть негладким, так как поверхность, полученная при помощи этой параметризации, может быть самопересекающейся, когда несколько характеристик, соответствующих различным значениям α, пересекаются в одной точке. Этот эффект аналогичен понятию точки обрыва (cut locus), известному в вариационном
исчислении. В этом случае для всех последующих моментов времени указанные характеристики будут лежать во внутренности X[t].
Таким образом, ∂X[t] может быть представлено как замыкание множества своих гладких точек, являющихся концами характеристик, не
проходящих через точки обрыва. Алгоритм, рассматриваемый в этой
работе, производит отбор нужных характеристик численно.
В конце доклада предполагается привести примеры работы алгоритма для нескольких трехмерных систем управления, уравнения
которых взяты из [2]. Эти примеры иллюстрируют возможные ситуации, которые успешно обрабатываются рассматриваемым алгоритмом. Здесь точки негладкости ∂X[t] либо являются изолированными, либо образуют несколько разрезов, диффеоморфных отрезкам и
не разделяющих множество гладких точек ∂X[t] на отдельные компоненты, либо составляют замкнутые кривые, разделяющие множество гладких точек на несвязные между собой компоненты.
Работа выполнена при финансовой поддержке РФФИ (проект 06-01-00332), а
также программы «Государственная поддержка ведущих научных школ» (грант
НШ-4576.2008.1) и научной программы «Развитие научного потенциала высшей
школы» (проект РНП 2.1.1.1714).
[1] Kurzhanski A.B., Varaiya P. Dynamic Optimization for Reachability Problems // Journal of Optim. Theory and Appl. 2001. Vol. 108,
No. 2. P. 227–251.
[2] Murray R.M., Li Z., Sastry S.S. A Mathematical Introduction to
Robotic Manipulation. CRC Press, Boca Raton, 1994.
123
Стабилизация инвариантных многообразий
нелинейных стохастических систем
Л. Б. Ряшко
Уральский государственный университет, Екатеринбург
e-mail: Lev.Ryashko@usu.ru
Многие нелинейные явления, недавно обнаруженные в физических, химических и биологических системах, связаны с достаточно
сложными колебательными процессами как регулярными (периодические и квазипериодические), так и хаотическими. В нелинейных
системах даже незначительное изменение параметров часто приводит к качественным изменениям динамических режимов — бифуркациям. Каждому звену в цепи бифуркаций соответствует определенный тип динамики, при котором решения принадлежат соответствующему инвариантному многообразию. Анализ устойчивости соответствующих многообразий к разного сорта возмущениям, в том числе
и случайным, является ключевым моментом в понимании механизма сложных явлений нелинейной динамики. Естественным образом
здесь возникают и соответствующие задачи стабилизации.
Основным методом анализа стохастической устойчивости является метод функций Ляпунова, впервые примененный к исследованию
равновесий в начале 60-х годов Н. Н. Красовским и И. Я. Кацем.
В докладе рассматриваются вопросы теории метода функций Ляпунова в задачах анализа экспоненциальной устойчивости в среднем
квадратичном и синтеза стабилизирующих регуляторов для стохастически возмущенных общих инвариантных многообразий нелинейных дифференциальных уравнений Ито. С помощью конструкций
стохастического линейного расширения и теории положительных
операторов получены спектральные критерии устойчивости и стабилизируемости. Эффективность разработанной теории иллюстрируется на примерах.
Работа выполнена при поддержке РФФИ, проекты 09-01-00026, 09-08-00048,
и ФАО 2.1.1/2571.
c Ряшко Л. Б., 2009
°
124
Об оптимальном по риску управлении
в случае программной помехи
Д. А. Серков
Институт математики и механики УрО РАН, Екатеринбург
e-mail: serkov@imm.uran.ru
Рассматривается задача оптимального управления системой,
описываемой обыкновенным дифференциальным уравнением с геометрическим ограничением на воздействия управления. Показатель качества предполагается терминальным и липшицевым.
Управляемая система подвержена воздействию помехи, которая также стеснена в каждый момент времени геометрическим ограничением. Кроме того, предполагается, что помеха является программной и
«нейтральной» по отношению к рассматриваемому показателю качества. То есть предполагается, что сторона, формирующая помеху, не
реагирует на состояние управляемой системы, значения управления,
случившуюся или будущую величину показателя качества.
Такие предположения о характере помехи дают возможность
«смягчить» критерий оценки управления, применяемый в теории
дифференциальных игр [1,2]. А именно, предлагается воспользоваться критерием Сэвиджа [3] для конструирования оценки стратегии
управления и заменить пучок конструктивных идеальных движений [2, §6] более узким — объединением движений, порожденных
откликами стратегии управления на различные программные помехи [4]. Возникающая при этом функция оптимального риска позволяет описывать оптимальные в таком смысле стратегии. Отдельные
свойства функции оптимального результата приведены в [5]. На основе этих свойств для некоторых классов управляемых систем получены соотношения инфинитезимального характера, позволяющие
строить соответствующие стратегии управления.
Работа выполнена при поддержке РФФИ, проект 09-01-00313-а.
[1] Красовский Н.Н. Дифференциальная игра сближения-уклонения. Ч. 1, 2 // Изв. АН СССР. Техн. кибернетика. 1973, № 2.
С. 3–18. № 3. С. 22–42.
c Серков Д. А., 2009
°
125
[2] Красовский Н.Н., Субботин A.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[3] Savage L.J. The theory of statistical decision // J. Amer. Statist.
Association. 1951. № 46. P. 55–67.
[4] Серков Д.А. Стратегия минимаксного риска (сожаления) для
одного класса задач управления в условиях динамических помех
// Тр. ИММ УрО РАН. 2008. Т. 14, № 2. С. 192–200.
[5] Serkov D.A. On the optimal risk function for the system under dynamic disturbances // IFAC Workshop on Control Applications of
Optimisation (IFAC CAO’09), 6–8 May 2009, University Jvaskyla,
Finland. Preprints. IFAC, 2009.
Решение проблемы выбора
параметров управления
в одной модели налогообложения
Р. О. Смирнов, С. В. Чистяков
Санкт-Петербургский государственный университет
e-mail: rostos63@mail.ru, svch50@mail.ru
Исследуется решение проблемы выбора параметров эластичности
налоговой шкалы, задающих ограничения на управления в модели,
описанной и исследованной ранее в [1]. На основе предлагаемого решения обсуждается возможность построения интерактивной модели
выбора ставок налога.
[1] Чистяков С.В., Ишханова М.В. Математические модели выбора налоговых шкал. СПб.: Изд-во С.-Петербур. ун-та, 1998.
c Смирнов Р. О., Чистяков С. В., 2009
°
126
Оценка робастного качества
номинальной модели по данным измерений
при наличии помех измерений
В. Ф. Соколов
Коми научный центр УрО РАН, Сыктывкар
e-mail: sokolov@dm.komisc.ru
Пусть математическая модель управляемого объекта имеет вид
a(q −1 )y(t) = q −d b(q −1 )u(t) + v(t) ∀t ∈ N .
Здесь y(t) ∈ R – неизмеряемый выход объекта, u(t) ∈ R – управление,
v(t) ∈ R – суммарное возмущение в момент t, a(q −1 ) и b(q −1 ) – полиномы относительно оператора сдвига назад q −1 (q −1 y(t) = y(t − 1)),
a(q −1 ) = 1 + a1 q −1 + . . . + an q −n ,
b(q −1 ) = b0 + b1 q −1 + . . . + bm q −m , b0 6= 0 ,
d – запаздывание в управлении. Суммарное возмущение v имеет вид
v(t) = δw w(t) + δy ∆1 y(t) + δu ∆2 u(t),
где w – неизвестное внешнее возмущение, удовлетворяющее ограничению
sup |w(t)| ≤ 1 ,
t
∆1 , ∆2 – операторные возмущения, удовлетворяющие ограничениям
|(∆1 y)(t)| ≤
sup
|y(s)| ,
t−µ≤s<t
|(∆2 u)(t)| ≤
sup
|u(s)| ∀t ∈ N .
t−µ≤s<t
Параметр µ, характеризующий память возмущений, полиномы
a(q −1 ) и b(q −1 ), характеризующие номинальную модель объекта
управления, и запаздывание в управлении d выбираются конструктором системы управления. Неотрицательные числа δw , δy , δu , называемые весами внешнего и операторных возмущений, подлежат оцениванию по данным измерений. Измеряемый выход объекта управления имеет вид
z(t) = y(t) + δm m(t) ,
c Соколов В. Ф., 2009
°
127
где m – неизвестная нормализованная помеха измерений,
sup | m(t)| ≤ 1 ,
t
и δm ≥ 0 – неизвестная верхняя граница помехи измерений.
Пусть r – ограниченный задающий сигнал и
z0N = (z(0), · · · , z(N )) ,
−1
uN
= (u(0), · · · , u(N − 1))
0
– данные измерений к моменту времени N , полученные при использовании регулятора
α(q −1 )u(t) = β(q −1 )z(t) + γ(q −1 )r(t + d) .
Полиномы α(q −1 ), β(q −1 ) и γ(q −1 ) выбираются конструктором системы управления.
Робастное качество системы управления характеризуется функционалами
sup sup sup lim sup | z(t) − r(t) | ,
∆1 ,∆2
w
m
t→∞
sup sup sup lim sup | y(t) − r(t) | .
∆1 ,∆2
w
m
t→∞
Задача заключается в вычислении как можно меньших верхних границ для этих функционалов, согласованных с данными измерений
−1
(z0N , uN
) и c априорным предположением, что указанная модель
0
правильно описывает объект управления.
Поставленная задача рассматривается в рамках `1 -теории робастного управления [1] и при ее решении используется концепция множественного оценивания неизвестных параметров [2]. Для систем без
помех измерений задача рассматривалась в [3].
[1] Khammash M., Pearson J.B. Analysis and design for robust performance with structured uncertainty // Systems and Control Letters.
1993. Vol. 20. P. 179–187.
[2] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[3] Соколов В.Ф. Робастное управление в `1 -постановке: верификация модели и оценивание весов возмущений // Автоматика и
телемеханика. 2003. № 11. С. 138–151.
128
К численному решению
многоэкстремальных задач управления
в линейных системах
B. А. Срочко
Иркутский государственный университет
e-mail: srochko@math.isu.ru
Определим основные элементы рассматриваемой задачи:
1) t ∈ T = [t0 , t1 ] – время, u(t) ∈ Rm – управление, x(t) ∈ Rn –
фазовое состояние;
2) линейная система
ẋ = A(t)x + B(t)u,
x(t0 ) = x0 ;
3) множество допустимых управлений
−
+
V = {u ∈ Lm
∞ (T ) : u(t) ∈ [u , u ], t ∈ T };
4) терминальный функционал квадратичного типа
Φ(u) =
1
hx(t1 ) − a, C(x(t1 ) − a)i
2
с условием положительной определенности матрицы C.
Сформулируем задачу в пространстве управлений:
Φ(u) → max,
u ∈ V.
Введем множество достижимости (МД) управляемой системы
в конечный момент времени D = {x(t1 )} и переведем задачу в фазовое пространство терминальных состояний:
ϕ(x) =
1
hx − a, C(x − a)i → max,
2
x ∈ D.
(1)
Это задача на максимум нормы конечного состояния, которая в отличие от традиционной задачи минимизации нормы не допускает,
вообще говоря, глобального решения с помощью методов выпуклого
анализа, принципа максимума и градиентных процедур.
c Срочко В. А., 2009
°
129
Задача (1) с различных позиций рассматривалась, например, в [1]
(критерий погружаемости выпуклых множеств), [2] (метод условного градиента), [3] (условия глобальной оптимальности, дискретизация поверхности уровня целевой функции). В докладе с учетом указанных подходов реализуется следующая схема численного анализа
данной задачи [4].
В качестве основных объектов выделяются экстремальные точки МД, которые соответствуют принципу максимума и в рамках
поставленной многоэкстремальной задачи подозрительны на оптимальность. Ключевая проблема на пути глобального решения состоит в разработке процедур гарантированного поиска и возможного
улучшения экстремальных точек. Теоретической основой здесь является достаточное условие оптимальности на множестве экстремальных точек, которое представлено в форме равенства нулю функции
максимума на пересечении границы МД и соответствующей поверхности уровня целевой функции (эллипсоид).
Далее конструктивно используется свойство дифференцируемости опорной функции и для поиска ее нулевого максимума на экстремальном эллипсоиде выделяется траектория подъема. Получена
оценка снизу для приращения определяющей функции на эллипсоиде. В результате решения задачи на максимум этой оценки по
параметру определяется метод скорейшего подъема, который, по существу, оказывается процедурой последовательного проектирования
граничных точек МД на экстремальный эллипсоид. Доказывается
свойство монотонности метода и сходимость итерационного процесса к экстремальным точкам.
Работа выполнена при поддержке РФФИ, проект 08-01-00709.
[1] Габасов Р., Кириллова Ф.М. Оптимизация линейных систем.
Минск: Изд-во Белорус. ун-та, 1973.
[2] Александров В.В., Болтянский В.Г., Лемак С.С. и др. Оптимальное управление движением. М.: Физматлит, 2005.
[3] Стрекаловский А.С. Элементы невыпуклой оптимизации. Новосибирск: Наука, 2003.
[4] Антоник В.Г., Срочко В.А. Метод нелокального улучшения экстремальных управлений в задаче на максимум нормы конечного состояния // Журн. вычисл. матем. и матем. физики. 2009.
Т. 49, № 5. С. 791–804.
130
Об устойчивости одной деформируемой
градиентной системы
В. В. Стружанов, Е. Ю. Просвиряков
Институт машиноведения УрО РАН, Екатеринбург
e-mail: stru@imach.uran.ru, evgen pros@mail.ru
Разрушение конструкций (механических систем) в общем случае
представляет собой глобальное явление того же характера, как явление неустойчивости движения и явление невозможности равновесия. Следовательно, при квазистатическом нагружении разрушение
и неразрушение связаны с устойчивостью равновесия. Если силы,
действующие на систему, консервативны (система градиентна), то
состояния равновесия (устойчивые или неустойчивые) описываются
системой уравнений ∇ψ Π (ψj , ci ) = 0. При этом тип устойчивости
определяется собственными значениями матрицы Гессе H (Π) функции Π. Здесь Π — потенциальная функция, ψj , ci — соответственно параметры состояния и управления, ∇ψ — оператор Гамильтона
в пространстве состояний. Данные уравнения в зависимости от параметров управления могут не иметь решений, иметь одно или более
чем одно решение. Поэтому проблема разрушения сводится к задаче
о том, каким образом состояния равновесия ψj (ci ) потенциальной
функции Π изменяются при изменении управляющих параметров.
В работе рассматривается механическая система, реализующая
двухосное растяжение квадратной пластины, на которую нагрузка
подается через упругие стержни жесткостью λ1 , λ2 . Связь напряжений (σ1 , σ2 ) и деформаций (ε1 , ε2 ) задана отображением p = ∇ε V
пространства деформаций R2e в пространство напряжений R2p (V
— потенциал напряжений). При этом матрица Якоби отображения,
совпадающая с матрицей Гессе H (V ) потенциала V, вырождена на
некоторых кривых в R2e . Таким образом, определяющие соотношения есть отображения с особенностями, что является необходимым,
но недостаточным условием для нарушения устойчивости равновесия всей системы.
Для анализа устойчивости всей системы строится ее потенциальная функция W, зависящая от параметров управления и состояния.
c Стружанов В. В., Просвиряков Е. Ю., 2009
°
131
Пространство состояний — R2e , пространство управлений — R2λ × R2u ,
где R2λ , R2u — соответственно пространства жесткостей и нагрузок.
Критические точки функции W определяет система уравнений
∇ε W = 0, решения которой образуют четырехмерное многообразие
равновесных состояний (многообразие катастроф) в пространстве
R2e × R2λ × R2u . Если зафиксировать параметры λ1 и λ2 , то данные
уравнения определяют отображение χ : R2e → R2u . Из условия вырожденности матрицы Гессе H (W ) функции W в пространстве R2u
находятся критические линии этого отображения (бифуркационные
кривые), разделяющие пространство R2u на области единственности
и неединственности решений уравнения равновесия. Затем определяются вырожденные критические точки функции W, в которых и
происходит смена типа равновесия.
При проектировании многообразия катастроф в пространство
управлений вырожденные критические точки образуют множество меры нуль (сепаратрису). Сепаратриса разбивает пространство
управлений на области, каждая из которых параметризует лишь качественно подобные функции, имеющие одно и то же число положений равновесия. Отметим, что проекция сепаратрисы в пространство
R2u образует линии критических значений отображения χ.
В области, ограниченной сепаратрисой, функция W имеет три
положения равновесия: два морсовских 0-седла (устойчивые положения) и между ними морсовское 1-седло (неустойчивое положение). Вне сепаратрисы функция W имеет одно морсовское 0-седло.
На сепаратрисе функция W имеет одну вырожденную критическую
точку, в которой она структурно неустойчива, и одно морсовское
0-седло.
Наконец, для исследования устойчивости положений равновесия
был применен метод дискриминантных конусов. Компоненты матрицы Гессе H (W ) параметризуют некоторое трехмерное евклидовое пространство, где строится коническая поверхность, в точках
которой матрица H (W ) вырождена. Внутри конуса матрица H (W )
положительно определена. При изменении параметров управления
изображающая точка сначала расположена внутри конуса (устойчивость положений равновесия). Затем изображающая точка пересекает коническую поверхность. При этом путь в R2u пересекает бифуркационную кривую, а путь в R2λ × R2u — сепаратрису. Следовательно, происходит смена типа равновесия и происходит скачкообразный
переход системы из одного положения равновесия в другое (потеря
132
устойчивости процесса деформирования).
По данной схеме рассматривались силовое и кинематическое нагружения градиентной системы. Показано несовпадение моментов
потери устойчивости системы при различных способах нагружения.
Работа выполнена по интеграционному проекту с СО РАН.
Применение гармонических всплесков
при решении бигармонического уравнения в круге
Ю. Н. Субботин, Н. И. Черных
Институт математики и механики УрО РАН, Екатеринбург
e-mail: yunsub@imm.uran.ru, Nikolai.Chernykh@imm.uran.ru
Построенные ранее авторами [1, 2] гармонические всплески использованы при решении первой краевой задачи для бигармонического уравнения. В случае круга используется следующее известное
(см. [3]) представление бигармонических функций u = (r2 −r02 )u1 +u2 ,
где u1 , u2 — функции, гармонические в круге радиуса r0 > 0. В отличие от классического решения, ряд, представляющий разложение
решения по гармоническим всплескам, в случае непрерывных исходных данных равномерно сходится в замкнутом единичном круге.
Получены оценки погрешности аппроксимации решения частичными суммами его разложения в ряд по всплескам.
Работа выполнена при поддержке РФФИ, проекты 08-01-00320, 08-01-00213,
и программы «Ведущие научные школы» НШ-1071.2008.1.
[1] Субботин Ю.Н., Черных Н.И. Гармонические всплески и асимптотика решения задачи Дирихле в круге с малым отверстием //
Математическое моделирование. 2002. Т. 14, № 5. С. 17–30.
[2] Субботин Ю.Н., Черных Н.И. Гармонические всплески в краевых задачах // Теория управления и теория обобщенных решений уравнений Гамильтона – Якоби: Тр. Междунар. семинара,
c Субботин Ю. Н., Черных Н. И., 2009
°
133
Екатеринбург, 22–26 июня 2005 г. Екатеринбург: Изд-во Урал.
ун-та, 2006. С. 38–47.
[3] Тихонов А.Н., Самарский А.А. Уравнения математической физики. М.: Наука, 1966.
Обобщенный метод характеристик
в теории и приложениях
оптимальных процессов управления
и законов сохранения
Н. Н. Субботина, Е. А. Колпакова, Т. Б. Токманцев,
Л. Г. Шагалова
Институт математики и механики УрО РАН, Екатеринбург
e-mail: subb@uran.ru, eakolpakova@gmail.com, tokmancev@imm.uran.ru,
shag@imm.uran.ru
Центральное место в представляемых исследованиях занимают
негладкие и разрывные решения уравнений в частных производных
первого порядка. Такие уравнения возникают в различных областях:
механике, оптимальном управлении, математической физике, экономике, биологии и играют ключевую роль в задачах динамической
оптимизации, моделирования и принятия решений.
Рассматривается краевая задача Коши для уравнения Гамильтона – Якоби – Беллмана с возможными ограничениями на значения
решения:
ut + H(t, x, ux ) = 0,
u(t, x) ≤ σ(t, x),
u(T, x) = σ(T, x).
n
Здесь t ∈ [0, T ], x ∈ R , ux = (ux1 , ..., uxn ). Функция s → H(t, x, s)
предполагается вогнутой.
При достаточно общих предположениях в теории минимаксных/вязкостных решений доказаны теоремы существования и единственности такой задачи. Получена обобщающая метод характеристик Коши репрезентативная формула решения:
u(t, x) = min{σ(t, x), z(t, ξ) : x(t, ξ) = x},
c Субботина Н. Н., Колпакова Е. А., Токманцев Т. Б., Шагалова Л. Г., 2009
°
134
где x(·, ξ), s(·, ξ), z(·, ξ) : [0, T ] → Rn × Rn × R — характеристики
уравнения Беллмана, ξ ∈ Rn — параметр.
На основе этой формулы разработан и обоснован численный метод построения минимаксного решения, который может быть использован для построения функции цены в задачах оптимального
управления «в момент» и «к моменту». Построенная аппроксимация
функции цены используется для построения сеточного оптимального
синтеза.
Предложенный метод решения задач оптимального управления
применим при моделировании макроэкономических систем по заданным статистическим данным. Метод обобщенных характеристик
используется для идентификации параметров модели. Построенный
оптимальный синтез применяется для краткосрочного прогнозирования и планирования.
В случае фазового пространства размерности единица минимаксное решение уравнения Гамильтона – Якоби ut + H(ux ) = 0 с краевым условием u(T, x) = σ(x) можно трактовать как потенциал для
закона сохранения
wτ − (H(w))x = 0, w(0, x) =
∂σ(x)
.
∂x
Здесь τ ∈ [0, T ], x ∈ R. Рассмотрены предположения, при которых
обобщенное (энтропийное) решение закона сохранения существует,
единственно и описывается формулой
w(τ, x) ∈ {s(T − τ, ξ) : x(T − τ, ξ) = x, z(T − τ, ξ) = u(T − τ, x)},
где x(·, ξ), s(·, ξ), z(·, ξ) — решения характеристической системы для
уравнения Гамильтона – Якоби.
Метод характеристик является основой анализа асимптотики при
t → ∞ решения следующей начальной задачи для уравнения Гамильтона – Якоби:
ut −
1 + x 2ux 1 − x −2ux
e
−
e
= f (x) − 1,
2
2
u(0, x) = u0 (x),
возникающей в молекулярной биологии для модели Кроу – Кимуры.
Здесь t ≥ 0, x ∈ R.
Работа выполнена при поддержке РФФИ, проекты 08-01-00410-а,
08-01-00587-а, программы Президента РФ по поддержке ведущих научных
школ, грант НШ-2640.2008.1, и молодежного гранта Президиума УрО РАН.
135
[1] Красовский Н.Н. Теория управления движением. М.: Наука,
1968.
[2] Subbotin A.I. Generalized Solutions of First Order PDEs: the Dynamical Optimization Perspective. Boston: Birkhauser, 1995.
[3] Subbotina N.N. The method of characteristics for Hamilton – Jacobi
equation and its applications in dynamical optimization // Modern
mathematics and its applications. 2004. Vol. 20. P. 2955–3091.
Задачи стабилизации и быстродействия систем
функционально-дифференциальных уравнений
А. В. Сурков
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: surkov.alexander@gmail.com
Пусть Rn – n-мерное векторное пространство с евклидовой нормой k · k, Cτ – пространство всех непрерывных функций ψ(·), определенных на отрезке [−τ, 0] со значениями в Rn с обычной supнормой k · kC = sup−τ ≤θ≤0 kψ(θ)k. Рассматривается функциональнодифференциальное уравнение
ẋ = f (t, xt (·), u),
(1)
где xt (·) ∈ Cτ – непрерывная функция для каждого t, определяемая равенством xt (θ) = x(t + θ), −τ ≤ θ ≤ 0, xt0 = ϕ(·) – начальная функция, u = (u1 , . . . , um ) – вектор управления с ограничением
u ∈ U , U ⊂ Rn – компактное множество, f : R × Cτ × U → Rn –
непрерывная функция.
Под решением системы (1), замкнутой относительно некоторого
управления u(t, xt ), понимается решение в смысле Филиппова или
в смысле Айзермана – Пятницкого, удовлетворяющее начальному
условию xt0 = ϕ(·).
Для системы (1) исследуются задачи стабилизации и быстродействия с использованием управления оптимального по отношению к
c Сурков А. В., 2009
°
136
демпфированию инвариантно дифференцируемого (см. [1]) функционала V : R × Rn × Cτ → R.
Работа выполнена при финансовой поддержке СО РАН (интеграционный
проект № 85 и междисциплинарный интеграционный проект № 107).
[1] Ким А.В. i-Гладкий анализ и функционально-дифференциальные уравнения. Екатеринбург: ИММ УрО РАН, 1996.
Задача управления
транспортными потоками на перекрестке
Г. А. Тимофеева
Уральский государственный университет путей сообщения,
Екатеринбург
e-mail: Gtimofeeva@mail.ru
Д. С. Завалищин
Институт математики и механики УрО РАН, Екатеринбург
e-mail: zav@imm.uran.ru
Вопрос разработки компактного математического описания движения автотранспорта как на автостраде [1], так и в городских условиях является достаточно актуальным.
В работе продолжаются исследования [2], в которых движение
автотранспорта моделируется с помощью марковских цепей с непрерывным временем, в отличие от подхода, применяемого в работе [3],
где используется модель управляемых марковских цепей с дискретным временем. Предполагается, что в качестве управления может
быть выбран режим переключения светофора, который считается
постоянным на достаточно большой промежуток времени. Перекресток рассматривается как совокупность 4-х систем массового обслуживания с переменными интенсивностями. А именно, в период, когда
проезд запрещен (горит красный сигнал светофора), интенсивность
обслуживания в данном направлении равна нулю. Исследована зависимость показателей работы системы в стационарном периодичеc Тимофеева Г. А., Завалищин Д. С., 2009
°
137
ском режиме от входных параметров и управления длиной цикла
светофора.
[1] Куржанский А.Б. Задача управления потоками транспорта на
автостраде // Устойчивость и колебания нелинейных систем
управления: Тез. докл. Х Междунар. сем., Москва: ИПУ РАН,
2008. С. 168–169.
[2] Завалищин Д.С., Тимофеева Г.А. Математическая модель регулируемого перекрестка // Транспорт Урала. 2008. № 2. C. 92–97.
[3] Alvarez I., Poznyak A., Malo A. Urban Traffic Control Problem
Via Game Theory Application // Proc. 46-th IEEE Conference on
Decision and Control, New-Orleans, USA, 2007. P. 2957–2961.
Расширение задач оптимального управления
с субдифференциальными операторами
А. А. Толстоногов
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: aatol@icc.ru
Рассматривается задача минимизации интегрального функционала с невыпуклым по управлению интегрантом на решениях управляемой системы в гильбертовом пространстве с ограничением на
управление, представляющем зависящее от фазовой переменной
многозначное отображение с замкнутыми невыпуклыми значениями.
Система содержит два эволюционных оператора, один из которых
является субдифференциалом зависящей от времени собственной
выпуклой полунепрерывной снизу функции. Другой оператор, действующий на производную искомой функции, является субдифференциалом выпуклой непрерывной функции. Поскольку из-за невыпуклости интегранта и невыпуклозначности ограничения на управление в общем случае задача не имеет решения, то для нее строится
расширение.
c Толстоногов А. А., 2009
°
138
Последнее означает, что находится управляемая система и функционал, для которых задача минимизации имеет решение и inf в исходной задаче совпадает с min в расширенной задаче.
Устанавливаются взаимосвязи между решениями исходной и расширенной задач.
В качестве примера рассмотрена параболическая система с гистерезисным и диффузионным эффектами.
Однотипные дифференциальные игры
с выпуклой целью
В. И. Ухоботов
Челябинский государственный университет
e-mail: ukh@csu.ru
Рассматривается дифференциальная игра [1,2]
ż = a (t) u − b (t) v,
z ∈ Rn ,
t ≤ p,
u ∈ W,
v∈W
(1)
с векторной терминальной платой
f (z (p)) = (f1 (z (p)) , ..., fm (z (p))) .
(2)
Здесь функции fi : Rn → R являются выпуклыми; функции
a (t) ≥ 0 и b (t) ≥ 0 интегрируемы на каждом отрезке; W – выпуклый
компакт в Rn .
Обозначим
Z p
Z p
α (t) = max
(a (r) − b (r)) dr, β (t) = α (t) −
(a (r) − b (r)) dr.
t≤τ ≤p
τ
t
Для набора ² = (²1 , ..., ²m ) ∈ R
m
множество
Z(²) = {z ∈ Rn : fi (z) ≤ ²i ,
i = 1, ..., m}
является выпуклым. Показано, что максимальным стабильным мостом [1] для этого множества является
[ \
F (t, ²) =
(Z(²) − α(t)u + β(t)v).
u∈W v∈W
c Ухоботов В. И., 2009
°
139
©
Обозначим K = ² ∈ Rm : ²i ≤ 0,
i = 1, ..., m,
Pm
2
i=1 ²i
ª
>0 ,
E(t, z) = {² ∈ Rm : z ∈ F (t, ²)} ,
n
o
\
E0 (t, z) = ² ∈ E(t, z) : (² + K) E(t, z) = ∅ .
Зафиксируем начальное положение t0 < p,
z0 ∈ R n .
Теорема. Если ² ∈ E0 (t0 , z0 ), то существует позиционная стратегия u(t, z) ∈ W первого игрока такая, что
fi (z(p)) ≤ ²i ,
i = 1, ..., m ,
(3)
при любом поведении второго игрока.
Для любого набора ² ∈ E0 (t0 , z0 ) + K существует стратегия второго игрока такая, что при любом поведении первого игрока система
неравенств (3) является несовместной.
В случае скалярной терминальной платы (2) функция цены игры
имеет вид
V (t, z) = min max f (z + α(t)u − β(t)v).
u∈W v∈W
Игра (1) со скалярной платой (2) рассматривается и для случая, когда управление первого игрока стеснено дополнительным интегральным ограничением общего вида.
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[2] Ухоботов В.И. Область безразличия в однотипных дифференциальных играх удержания на ограниченном промежутке времени // Прикл. математика и механика. 1994. Т. 58, вып. 6.
С. 56–62.
140
О построении решений
в игровых задачах управления,
линейных по управлению одного из игроков
В. Н. Ушаков, А. А. Успенский, А. Р. Матвийчук
Институт математики и механики УрО РАН, Екатеринбург
e-mail: ushak@imm.uran.ru, uspen@imm.uran.ru, matv@imm.uran.ru
На промежутке [t0 , ϑ] (t0 < ϑ < ∞) задана конфликтно управляемая система:
m
dx
= f (t, x, u, v), x[t0 ] = x0 , u ∈ P, v ∈ Q,
dt
(1)
f (t, x, u, v) = f (1) (t, x, u) + C(t, x)v;
(2)
m
где x ∈ R ; R – евклидово m-мерное пространство; u, v – управления первого и второго игроков; P и Q – компакты в Rp и Rq .
Предполагается, что выполнены следующие условия.
A. f (1) (t, x, u) и C(t, x) определены и непрерывны по совокупности переменных t, x, u и t, x, соответственно на [t0 , ϑ] × Rm × P и
[t0 , ϑ] × Rm , и для любого компакта D ⊂ [t0 , ϑ] × Rm найдутся такие
Lf и LC в (0, ∞), что
kf (1) (t, x∗ , u)−f (1) (t, x∗ , u)k ≤ Lf kx∗ −x∗ k, (t, x∗ , u), (t, x∗ , u) ∈ D×P,
kC(t, x∗ )v − C(t, x∗ )vk ≤ LC kx∗ − x∗ k, (t, x∗ , v), (t, x∗ , v) ∈ D × Q.
Б. Существует такая константа γ ∈ (0, ∞), что
kf (t, x, u, v)k ≤ γ(1 + kxk), (t, x, u, v) ∈ [t0 , ϑ] × Rm × P × Q.
Здесь kf k – евклидова норма вектора f.
Рассматривается игровая задача о сближении в позиционной постановке [1] при наличии фазовых ограничений на систему (1), (2).
Задача о сближении. Первому игроку требуется сформировать
такой позиционный способ управления, который обеспечивает для
движений x[t] системы (1), (2) выполнение включений (t, x[t]) ∈ Φ,
c Ушаков В. Н., Успенский А. А., Матвийчук А. Р., 2009
°
141
t ∈ [t0 , ϑ] и x[ϑ] ∈ M , как бы ни выбирал второй игрок управления v в рамках допустимых ограничений. Здесь Φ и M – компакты
в [t0 , ϑ] × Rm и Rm соответственно, такие, что M ⊂ Φ(ϑ) = {x ∈ Rm :
(ϑ, x) ∈ Φ}.
В докладе обсуждается вопрос о выделении в Φ множества разрешимости задачи о сближении – множества позиционного поглощения W 0 [1]. Даже в относительно простых случаях точное выделение
множества W 0 в Φ при помощи аналитических соотношений затруднительно. В связи с этим встает задача о приближенном вычислении W 0 . Для решения этой задачи используется тот факт, что W 0
есть максимальный u-стабильный мост, т. е. максимальное замкнутое
множество в Φ, обладающее свойством стабильности. Свойство стабильности введено в работах [1–3]. В докладе приводится описание
попятных пошаговых алгоритмов приближенного построения множества W 0 . Приводятся примеры. Обсуждается также вопрос о построении разрешающей позиционной процедуры управления первого
игрока.
Тема доклада примыкает к исследованиям [1–4].
Работа выполнена в рамках программы Президиума РАН «Математическая теория управления», а также при поддержке гранта РФФИ (проект 08-0100587) и Программы государственной поддержки ведущих научных школ (НШ2640.2008.1).
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[2] Красовский Н.Н., Субботин А.И. Экстремальные стратегии в
дифференциальных играх // Докл. АН СССР. 1971. Т. 196, № 2.
C. 278–281.
[3] Красовский Н.Н., Субботин А.И. Альтернатива для игровой задачи сближения // Прикл. математика и механика. 1970. Т. 34,
вып. 6. C. 1005–1022.
[4] Пахотинских В.Ю., Успенский А.А., Ушаков В.Н. Конструирование стабильных мостов в дифференциальных играх с фазовыми ограничениями // Прикл. математика и механика. 2003.
Т. 67, вып. 5. C. 771–783.
142
Оценки множеств достижимости
нелинейных динамических систем
с импульсным управлением
Т. Ф. Филиппова
Институт математики и механики УрО РАН, Екатеринбург
e-mail: ftf@imm.uran.ru
Рассматривается нелинейная динамическая система с импульсным управлением:
dx(t) = (Ax + f (x)d + u(t))dt + Gdv(t), x ∈ Rn , t0 ≤ t ≤ T,
с неизвестным, но ограниченным начальным состоянием
x(t0 − 0) = x0 , x0 ∈ X0 ∈ compRn .
Здесь A — постоянная n×n-матрица; векторы d, G ∈ Rn , u(t) — классическое (измеримое) управление, стесненное геометрическим ограничением
u(t) ∈ U, U ∈ compRm ,
v(t) — скалярная функция ограниченной вариации, непрерывная
справа на отрезке [t0 , T ] и удовлетворяющая ограничению (параметр
µ > 0 задан)
Vart∈[t0 ,T ] v(t) ≤ µ.
В работе предполагается, что нелинейная функция f (x) является
положительно определенной квадратичной формой
f (x) = x0 Bx, x ∈ Rn ,
где B — симметрическая положительно определенная n×n-матрица.
Обозначим символом U класс допустимых измеримых управлений u(·) и символом V класс допустимых управлений-мер v(·). Трубку траекторий рассматриваемой системы из начального состояния
{t0 , X0 } обозначим
X(·) = X(·; t0 , X0 ) =
[
= {x(·; t0 , x0 , u(·), v(·))| x0 ∈ X0 , u(·) ∈ U , v(·) ∈ V}.
c Филиппова Т. Ф., 2009
°
143
Отметим, что сечение X(t) = X(t; t0 , X0 ) трубки траекторий X(·)
в момент времени t ∈ [t0 , T ] совпадает с множеством достижимости
системы в момент t из начального состояния {t0 , X0 }.
В работе рассмотрены схемы построения оценок трубок траекторий X(·) и множеств достижимости X(t), основанные на идеях
и методах теории управляемых систем и теории гарантированного
управления и оценивания [1–3]. При помощи специальной разрывной
замены времени рассматриваемая импульсная система преобразуется в обыкновенное дифференциальное включение, уже не содержащее импульсных составляющих.
Для оценивания множеств достижимости полученного нелинейного дифференциального включения используются результаты теории эллипсоидального оценивания и теории эволюционных уравнений многозначных состояний динамических систем в условиях
неопределенности [4, 5].
Работа выполнена при поддержке гранта РФФИ (проект 09-01-00223) и программы государственной поддержки ведущих научных школ (НШ-4576.2008.1).
[1] Красовский Н.Н. Теория управления движением. М.: Наука,
1968.
[2] Krasovskii N.N., Subbotin A.I. Positional differential games. Berlin:
Springer-Verlag, 1988.
[3] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[4] Kurzhanski A.B., Valyi I. Ellipsoidal calculus for estimation and
control. Boston: Birkhauser, 1997.
[5] Kurzhanski A.B., Filippova T.F. On the theory of trajectory tubes
— a mathematical formalism for uncertain dynamics, viability and
control // Advances in Nonlinear Dynamics and Control: a Report from Russia. Progress in Systems and Control Theory. Boston:
Birkhauser, 1993. Vol. 17. P. 122–188.
144
О регулируемых системах
с разрывными и импульсными управлениями
И. А. Финогенко
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: fin@icc.ru
Рассматривается система дифференциальных уравнений в векторной форме:
Dx = G(t, x, u1 (t, x), . . . , um (t, x)) + p(t).
(1)
Здесь p(t) — обобщенная функция, представляющая собой обобщенную производную Dw(t) от некоторой измеримой и ограниченной
на каждом конечном интервале функции w(t); ui (t, x) — кусочнонепрерывные функции, терпящие разрывы на поверхностях Si =
{(t, x) : φi (t, x) = 0}; G(t, x, u1 , . . . , um ) — непрерывная по совокупности аргументов функция.
Исследование системы проводится на основе доопределения
функции G из правой части (1) на поверхностях разрыва Si и перехода к дифференциальному включению
Dx ∈ F (t, x) + p(t),
(2)
где символом F (t, x) обозначена выпуклая оболочка множества
G(t, x, U1 (t, x), . . . , Um (t, x)); Ui (t, x) — отрезки с концами u+
=
i
−
−
+
−
u+
(t,
x),
u
=
u
(t,
x)
для
(t,
x)
∈
S
;
u
,
u
—
предельные
знаi
i
i
i
i
i
чения функций ui (t, x) с обеих сторон Si (доопределение в смысле
Айзермана – Пятницкого [1]). Вне поверхности Si отрезок Ui (t, x)
состоит из одной точки ui (t, x).
Движение системы (1) по пересечению множеств Si называется скользящим режимом. Перевод системы на устойчивые скользящие режимы позволяет решать ряд задач теории управления, таких как задачи слежения (движение по наперед заданной траектории), управляемости или стабилизации. Функции φi (t, x), задающие поверхности разрыва Si , как правило, предполагаются непрерывно дифференцируемыми. Если же функции φi (t, x) разрывны
c Финогенко И. А., 2009
°
145
по переменой t, то скользящий режим будет возможным только для
разрывных (обобщенных) решений. Тогда в уравнении (1) функция p(t) задает импульсные составляющие управлений с использованием дельта-функций.
Определение. Под решением задачи (1) понимается измеримая функция x(t), для которой существует измеримый селектор
v(t) ∈ F (t, x(t)) такой, что Dx(t) = v(t) + p(t).
Отметим, что к включению (2) можно перейти и от уравнения
Dx = f (t, x) + p(t) с кусочно-непрерывной по совокупности переменных функцией f (t, x), если под множеством F (t, x) понимать выпуклую оболочку всех предельных значений функции f (t, x) в точке (t, x) (доопределение в смысле А. Ф. Филиппова [2, стр. 39]). В
данной работе для включения (2) доказана теорема существования
решения.
Для любых чисел ² > 0, τ и вектора ν = (ν1 , . . . , νn ) введем параметр λ = (², τ, ν) и обозначение pδ (t, λ) = νδ² (t − τ ), где скалярные функции δ² (t) измеримы (в частности, непрерывны или кусочнопостоянны), равны нулю вне интервала (−², ²) и их интегралы по этому интервалу равны единице. Для семейства задач
ẋ ∈ F̃ (t, x, λ) + pδ (t, λ)
доказана теорема о предельном переходе при λ → λ0 = (0, τ 0 , ν 0 ).
Для механических систем, представленных уравнениями Лагранжа второго рода, задача об управлении такими системами релейными позиционными управлениями на принципе декомпозиции
Е. С. Пятницкого рассмотрена для случая, когда движение по целевому множеству реализуется с кусочно-непрерывными обобщенными скоростями. Последнее обеспечивается добавлением в систему
импульсных воздействий.
Работа выполнена при финансовой поддержке СО РАН (интеграционные
проекты № 85 и № 107).
[1] Айзерман М.А., Пятницкий Е.С. Основы теории разрывных систем. I, II // Автоматика и телемеханика. 1974. № 7. С. 33–47.
№ 8. С. 39–61.
[2] Филиппов А.Ф. Дифференциальные уравнения с разрывной
правой частью. М.: Наука, 1985.
146
Ограничения асимптотического характера
и расширения в классе конечно-аддитивных мер
А. Г. Ченцов
Институт математики и механики УрО РАН, Екатерибург
e-mail: Chentsov@imm.uran.ru
В задачах управления нередко возникает потребность в построении расширений и релаксаций с использованием мер в качестве
обобщенных элементов (ОЭ). В частности, это касается постановок,
включающих комбинацию импульсных и моментных ограничений.
В то же время в правой части управляемого дифференциального
уравнения возможно появление разрывных зависимостей, что в сочетании с импульсным характером управлений порождает эффекты,
имеющие смысл произведения разрывной функции на обобщенную.
Для описания этих эффектов оказалось возможным применить ОЭ,
формализуемые в виде конечно-аддитивных (к.-а.) мер. При этом
удается в ряде случаев получить расширение, универсальное в диапазоне ограничений асимптотического характера, возникающих при
последовательном ослаблении стандартных ограничений.
В работах Н. Н. Красовского [1] предложен оригинальный подход
к решению задач импульсного управления, использующий аппарат
обобщенных функций. Этот подход послужил основой многих исследований в области теории импульсного управления.
Излагаемые в докладе конструкции связаны с погружением
обычных управлений в пространство к.-а. мер ограниченной вариации на основе построения неопределенного интеграла по фиксированной неотрицательной к.-а. мере. Процедура погружения имеет
следующий смысл. Пусть E — непустое множество (в задачах управления — конечный промежуток вещественной прямой) с полуалгеброй L подмножеств (п/м) E. Рассматриваем конус (add)+ [L] неотрицательных вещественнозначных (в/з) к.-а. мер на L, порождающий линейное пространство A(L) в/з к.-а. мер на L, имеющих ограниченную вариацию. Замыкание линейного многообразия Bo (E, L)
ступенчатых в смысле (E, L) в/з функций на E обозначаем через
B(E, L). Тогда A(L) (в сильной норме) изометрически изоморфно пространству B ∗ (E, L), топологически сопряженному к банахову
c Ченцов А. Г., 2009
°
147
пространству B(E, L); A(L) в слабой ∗-топологии τ∗ (L) — локально
выпуклый σ-компакт. Фиксируем η ∈ (add)+ [L] (в задачах управления η — след меры Лебега) и сопоставляем f ∈ B(E, L) неопределенный η-интеграл f ∗ η ∈ A(L). Конус
(add)¢+ [L; η]
¡
¡ всех к.-а.
¢ мер
µ ∈ (add)+ [L] со свойством ∀L ∈ L η(L) = 0 =⇒ µ(L) = 0 (слабая абсолютная η-непрерывность µ) порождает компоненту (полосу)
Aη [L] полной векторной решетки A(L) в поточечной упорядоченности. Погружение f 7−→ f ∗ η : Bo (E, L) −→ Aη [L] реализует всюду плотное в τ∗ (L) п/м Aη [L]; это позволяет рассматривать функции f ∈ Bo (E, L) как аналоги реализуемых обычных управлений,
а к.-а. меры µ ∈ Aη [L] как ОЭ и, в случае задач управления, —
как обобщенные управления (ОУ); действие таких ОУ на линейную
систему определено в [2, (6.5.2)]. На выбор f могут накладываться
дополнительные ограничения ресурсного характера; они преобразуются в ограничения на выбор µ ∈ Aη [L]; см., например, в [2, гл. 4] и
в [3, § 3].
Моментные ограничения на выбор f ∈ Bo (E, L) порождают неустойчивые задачи, для которых переформулировка в виде обобщенных задач со стандартными ограничениями на выбор µ ∈ Aη [L]
приводит к корректному расширению, обслуживающему схемы релаксаций с ослаблением моментных ограничений. Это расширение
оказывается универсальным в диапазоне ограничений асимптотического характера. С учетом данной универсальности устанавливается
свойство асимптотической нечувствительности исходной задачи при
ослаблении части ограничений, связанной со свойством ступенчатости компонент матрицианта, участвующего в формулировке моментных ограничений.
Работа выполнена в рамках программы Президиума РАН «Математическая
теория управления», а также при поддержке гранта РФФИ, проект 09-01-00436.
[1] Красовский Н.Н. Теория управления движением. М.: Наука,
1968.
[2] Chentsov A.G. Finitely additive measures and relaxations of extremal problems. New York, London and Moscow: Plenum Publishing Corporation, 1996.
[3] Ченцов А.Г. К вопросу о компактификации пучка траекторий
одной абстрактной управляемой системы // Изв. вузов. Математика. 2006. № 5. С. 55–66.
148
Мобильные роботы,
управляемые движением внутренних тел
Ф. Л. Черноусько, Н. Н. Болотник
Институт проблем механики РАН, Москва
e-mail: chern@immnet.ru, bolotnik@ipmnet.ru
Рассматривается новый класс мобильных механизмов (роботов),
способных перемещаться в сопротивляющихся средах без специальных движителей (колес, ног, гусениц). Такие роботы состоят из корпуса, взаимодействующего с внешней средой, и подвижно соединенных с ним тел. Движение этих тел относительно корпуса характеризует внутренние степени свободы робота. Будем называть упомянутые тела внутренними, хотя конструктивно они могут размещаться и не внутри корпуса. Внутренние тела взаимодействуют с корпусом посредством сил, создаваемых приводами. Приложение силы
к внутреннему телу вызывает силу реакции, которая действует на
корпус, изменяя его скорость, что влечет изменение силы сопротивления среды движению корпуса. Таким образом, управляя движением внутренних тел, можно управлять внешней силой, действующей
на корпус и, как следствие, движением системы как целого. Данный
принцип движения представляется целесообразным для мобильных
мини- и микророботов. Корпус этих роботов может быть сделан герметичным и гладким, не содержащим выступающих деталей, что
позволяет использовать их для неразрушающей инспекции миниатюрных технических объектов, таких как тонкостенные трубопроводы малого диаметра, а также в медицине.
Строятся периодические режимы движения внутренних тел относительно корпуса и соответствующие законы движения корпуса
с периодически изменяющейся скоростью. Данные режимы оптимизируются с целью максимизации средней скорости движения системы как целого. Оптимальные управления найдены для движения
в вязкой среде с кусочно-линейным и квадратичным законами сопротивления, а также по шероховатой плоскости в предположении,
что между плоскостью и корпусом системы действует сухое кулоново трение. Задачи оптимального управления решаются при разc Черноусько Ф. Л., Болотник Н. Н., 2009
°
149
личных ограничениях на скорости и ускорения движения внутренних тел, а также на амплитуду колебаний этих тел относительно
корпуса. Для движения по шероховатой горизонтальной плоскости
рассмотрены системы с одним внутренним телом, движущимся по
горизонтали, и с двумя внутренними телами, одно из которых перемещается по горизонтали, а другое — по вертикали, что позволяет
управлять величиной сухого трения за счет изменения нормального давления корпуса на плоскость. Наличие тела, движущегося по
вертикали, позволяет значительно увеличить скорость движения системы и снизить потери энергии на трение.
Доклад базируется на результатах исследований [1–7], выполненных в Институте проблем механики им. А. Ю. Ишлинского РАН.
Работа выполнена при поддержке РФФИ, проекты 08-01-00411, 08-08-00438.
[1] Черноусько Ф.Л. О движении тела, содержащего подвижную
внутреннюю массу // Докл. РАН. 2005. Т. 405, № 1. С. 56–60.
[2] Черноусько Ф.Л. Анализ и оптимизация движения тела, управляемого посредством подвижной внутренней массы // Прикл.
математика и механика. 2006. Т. 70, вып. 6. С. 915–941.
[3] Болотник Н.Н., Циммерман К., Зейдис И., Яцун С.Ф. Динамика управляемых движений вибрационных систем // Изв. РАН.
Теория и системы управления. 2006. № 5. С. 157–167.
[4] Фигурина Т.Ю. Оптимальное управление движением системы
двух тел по прямой // Изв. РАН. Теория и системы управления.
2007. № 2. С. 65–71.
[5] Соболев Н.А., Сорокин К.С. Экспериментальное исследование
модели виброробота с вращающимися массами // Изв. РАН.
Теория и системы управления. 2007. № 5.
[6] Черноусько Ф.Л. Оптимальные периодические движения двухмассовой системы в сопротивляющейся среде // Прикл. математика и механика. 2008. Т. 72, вып. 2. С. 202—215.
[7] Болотник Н.Н., Фигурина Т.Ю. Оптимальное управление прямолинейным движением твердого тела по шероховатой плоскости посредством перемещения двух внутренних масс // Прикл.
математика и механика. 2008. Т. 72, вып. 2. С. 216—229.
150
Задача минимаксного программного управления
процессом сближения-стабилизации
в двухуровневой иерархической дискретной
динамической системе
А. Ф. Шориков
Институт математики и механики УрО РАН,
Уральский государственный экономический университет,
Екатеринбург
e-mail: shorikov@usue.ru
В работе рассматривается линейная дискретная динамическая
система, состоящая из трех управляемых объектов, в которой выделены два уровня принятия управленческих решений – доминирующий (или первый уровень) и подчиненный (второй уровень), имеющих различные критерии функционирования и объединенных информационными и управленческими связями. Предполагается, что
на заданном целочисленном промежутке времени 0, T динамика
каждого из объектов I, I1 и II этой системы, управляемых преследователем P , подчиненным игроком S и уклоняющимся E, описывается соответствующими векторными линейными дискретными рекуррентными соотношениями и подвержена влиянию как управляемых параметров (управлений), так и неконтролируемых параметров
(помех или ошибок моделирования). Управляющие параметры, фазовые состояния объектов и все априори неопределенные параметры рассматриваемой системы стеснены заданными геометрическими
ограничениями, имеющими вид выпуклых, замкнутых и ограниченных многогранников (с конечным числом вершин) в соответствующих векторных евклидовых пространствах.
Преследователь P образует доминирующий (первый) уровень
рассматриваемого процесса управления и в сфере его интересов находятся значения фазовых состояний объектов I, I1 и II. Игрок S
c Шориков А. Ф., 2009
°
151
образует подчиненный (второй) уровень рассматриваемого процесса управления, в сфере его интересов находятся значения фазовых
состояний только объекта I1 .
Предполагается, что преследователь P знает значения прошлых
реализаций управляющих воздействий на объекты I и I1 , начальные значения фазовых векторов этих объектов и ему известны значения прошлых реализаций информационного сигнала об объекте
II, описываемого линейным дискретным уравнением и измеряемого
с ошибкой. Подчиненный игрок S знает значения прошлых реализаций управляющего воздействия на объект I1 , начальное значение фазового вектора этого объекта, и ему сообщается выбор управляющего воздействия преследователя P . Предполагается также, что выбор
управляющего воздействия игроком S на втором уровне управления,
кроме имеющегося для него ограничения, подчинен также условию,
зависящему от выбора управляющего воздействия преследователем
P на первом уровне управления.
Качество процесса управления на первом уровне управления (т. е.
с позиции преследователя P ) оценивается значением расстояния
между объектами I и II в финальный момент времени T и значением выпуклого функционала, определенного на финальных значениях фазового вектора объекта I1 – основной векторный функционал. Качество управления на втором уровне управления (т. е.
с позиции игрока S) оценивается значением выпуклого функционала
(второстепенный функционал), характеризующим меру отклонения
финального фазового вектора объекта I1 от заданного номинального
значения (меру стабилизации).
Основная цель преследователя P в рассматриваемом процессе
управления – минимизация его основного функционала, второстепенная цель – минимизация второстепенного функционала, а цель
игрока S – минимизация второстепенного функционала. При этом
не исключается возможная реализация самых неблагоприятных для
преследователя P и игрока S значений выбранных функционалов,
оценивающих качество процессов управления на первом и втором
уровнях, в зависимости от реализаций неконтролируемых ими параметров и поведения уклоняющегося E.
Для исследуемого процесса управления в рассматриваемой дискретной динамической системе предлагается (на основе работ [1–3])
математическая формализация в форме реализации задачи двухуровневого иерархического программного минимаксного управления
152
процессом сближения-стабилизации и предложена общая схема ее
решения.
Работа выполнена при поддержке РФФИ, проект 07-01-00008.
[1] Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[2] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[3] Шориков А.Ф. Минимаксное оценивание и управление в дискретных динамических системах. Екатеринбург: Изд-во Урал.
ун-та, 1997.
Управляемость нелинейных
алгебро-дифференциальных систем
А. А. Щеглова
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: shchegl@icc.ru
Рассматривается система нелинейных обыкновенных дифференциальных уравнений
F (t, x(t), x0 (t), u(t)) = 0, t ∈ I = (a0 − ε, a0 + ε),
(1)
где n-мерная вектор-функция F (t, x, y, u) определена в некоторой
окрестности D точки (a0 , 0, 0, 0); x(t) – искомая вектор-функция размерности n; u(t) — l-мерная функция управления; ε = const > 0.
Предполагается, что F (t, 0, 0, 0) = 0 ∀t ∈ I, F (t, x, y, u) имеет
достаточное число непрерывных частных производных по каждому
∂F (t, x, y, u)
из своих аргументов и det
≡ 0 в D. Такие системы на∂y
зывают алгебро-дифференциальными (АДС). Мерой неразрешенности АДС относительно производной искомой вектор-функции служит целочисленная величина r, 0 ≤ r ≤ n, называемая индексом.
c Щеглова А. А., 2009
°
153
В работе сделана первая попытка исследовать локальную нульуправляемость АДС вида (1) по ее первому линейному приближению
A(t)x0 (t) + B(t)x(t) + U (t)u(t) = 0, t ∈ I,
(2)
где
A(t) =
∂F (t, x, y, u)
∂F (t, x, y, u)
(t, 0, 0, 0), B(t) =
(t, 0, 0, 0),
∂y
∂x
∂F (t, x, y, u)
(t, 0, 0, 0).
∂u
Для систем вида (2) с гладкими коэффициентами получены критерии полной управляемости. Показано, что в линейном случае полная управляемость влечет за собой локальную нуль-управляемость.
Для анализа управляемости как линейных, так и нелинейных
АДС привлекается, так называемая, эквивалентная форма, в которой разделены «алгебраическая» и «дифференциальная» подсистемы. В частности, один из критериев полной управляемости в линейном случае формулируется в терминах коэффициентов эквивалентной формы
U (t) =
x01 (t) = J1 (t)x1 (t) +
x2 (t) = J2 (t)x1 (t) +
r
P
j=0
µ
r
P
j=0
Lj (t)u(j) (t),
Gj (t)u(j) (t), t ∈ I,
(3)
¶
x1 (t)
= Q1 x, Q1 — матрица перестановок. Эквивалентность
x2 (t)
означает, что при некоторых ограничениях на коэффициенты системы (2) каждое решение системы (2) является решением системы (3)
и наоборот.
Показано, что при определенных предположениях для нелинейной системы операции линеаризации и перехода к эквивалентной
форме перестановочны. Это позволяет избежать при исследовании
управляемости нелинейной АДС построения для нее эквивалентной
формы. Доказано, что в условиях теоремы существования локальная
нуль-управляемость нелинейной АДС (1) является следствием полной управляемости или локальной нуль-управляемости ее линейного
приближения (2).
где
154
Линейные и нелинейные АДС в данной работе исследуются
в весьма общих предположениях. В частности, индекс неразрешенности системы может быть произвольно высоким. В линейном случае
не требуется, чтобы ранг матрицы при производной искомой векторфункции был постоянен. При исследовании нелинейных АДС предположения теоремы существования являются близкими к условию,
необходимому для регулярного поведения решений.
Работа выполнена при финансовой поддержке СО РАН: интеграционный
проект № 85 и междисциплинарный интеграционный проект № 107; и программы
«Ведущие российские научные школы», проект № 1676.2008.1.
[1] Щеглова А.А. Управляемость нелинейных алгебро-дифференциальных систем // Aвтоматика и телемеханика. 2008. № 10.
С. 57–80.
[2] Щеглова А.А. Нелинейные алгебро-дифференциальные системы // Сиб. мат. журн. 2007. Т. 48, № 4. С. 931–948.
О численном решении
одной задачи оптимального управления
М. В. Янулевич, А. С. Стрекаловский
Институт динамики систем и теории управления СО РАН,
Иркутск
e-mail: massimo@newmail.ru, strekal@icc.ru
Пусть система управления процессом (x(·), u(·)) имеет вид
ẋ(t) = A(t)x(t) + b(u(t), t),
x(t0 ) = x0 ,
u(·) ∈ U = { u ∈ Lr∞ | u(t) ∈ U п. в. на T },
r
(1)
(2)
где T , [t0 , t1 ] и множество U ⊂ IR является компактным. Рассматривается задача минимизации функционала Больца
Z
J(u) = F (x(t1 )) + [F 0 (x(t), t) + f (u(t), t)] dt ↓ min, u ∈ U , (3)
u
T
c Янулевич М. В., Стрекаловский А. С., 2009
°
155
над управляемой системой (1)–(2). В дополнение к обычным предположениям в задаче ОУ (см. [1,3,4]) x 7→ F (x) := g(x) − h(x) и
x 7→ F 0 (x, t) := g 0 (x, t) − h0 (x, t), где функции g(·), h(·) и g 0 (·), h0 (·)
являются выпуклыми и гладкими (см. [1, 2]). Вообще говоря, задача (1)–(3) является невыпуклой, т. е. могут существовать процессы управления, удовлетворяющие принципу максимума Понтрягина (ПМП) и не являющиеся глобально оптимальными (см. [2, 3]).
На основе теории глобального поиска из [1] конструируется алгоритм поиска глобально оптимального процесса управления в задаче
(1)–(3), основными элементами которого являются: i) процедура локального поиска процесса, удовлетворяющего ПМП и ii) процедура
выхода из этого процесса с улучшением по значению целевого функционала.
Процедура локального поиска строится следующим образом.
Пусть заданы последовательность
∞
X
{δs } : δs > 0, s = 0, 1, . . . ,
δs < +∞
s=0
0
0
0
и стартовый процесс (x (·), u (·)), u ∈ U . Далее, если известен процесс (xs (·), us (·)), то в качестве следующего (xs+1 (·), us+1 (·)) выбирается процесс, приближенно удовлетворяющий ПМП (с точностью δs
по невязке ПМП) в выпуклой частично линеаризованной задаче
Is (u) = g(x(t1 )) − h∇h(xs (t1 )), x(t1 )i+
¤
R£
+ g 0 (x(t), t) − h∇x h0 (xs (t), t), x(t)i + f (u(t), t) dt ↓ min, u ∈ U,
u
T
над системой управления (1)–(2). Проведено численное тестирование
специального метода локального поиска на квадратичных задачах
оптимального управления, результаты которого показали эффективность предлагаемого метода.
Для задачи (1)–(3) доказаны новые необходимые и достаточные условия глобальной оптимальности (УГО), позволяющие в случае их нарушения получать процесс, улучшающий значение целевого функционала. Используя предлагаемые УГО для задачи (1)–(3),
осуществляется процедура выхода из процесса, удовлетворяющего
ПМП. Исследован вопрос о сходимости построенного алгоритма глобального поиска (АГП). Для проверки работоспособности и эффективности АГП было проведено его численное тестирование на широком спектре тестовых задач, которые генерировались специальным
156
образом так, чтобы было известны глобальное решение задачи и процессы управления, удовлетворяющие ПМП. Например, в задаче размерностей n = 20, r = 20 количество процессов, удовлетворяющих
ПМП, составляет 59049, в то время как в задаче существует только
один глобально оптимальный процесс. На начальном этапе вычислительного эксперимента результаты тестирования позволяют сказать,
что АГП находит (приближенно) глобально оптимальный процесс,
что свидетельствует об эффективности предлагаемой методики.
Работа
выполнена
проект НШ–1676.2008.1.
при
поддержке
гранта
Президента
РФ,
[1] Стрекаловский А.С. Элементы невыпуклой оптимизации. Новосибирск: Наука, 2003.
[2] Стрекаловский А.С., Янулевич М.В. Глобальный поиск в задаче оптимального управления с целевым терминальным функционалом, представленным разностью двух выпуклых функций //
Журн. вычислительной математики и математической физики.
2008. Т. 48, № 7. C. 1187–1201.
[3] Стрекаловский А.С. Задачи оптимального управления с терминальными функционалами, представимыми в виде разности
двух выпуклых функций // Журн. вычислительной математики и математической физики. 2007. Т. 47, № 11. C. 1865–1879.
157
Control design in cryopreservation of living cells
N. D. Botkin, K.-H. Hoffmann
Technische Universität München, Garching bei Munich, Germany
e-mail: botkin@ma.tum.de, hoffmann@ma.tum.de
Cryopreservation of living cells is a necessary part of many medical
procedures. However, cells and tissues can be damaged by the cryopreservation process itself. One of the most injuring factors of cryopreservation is mechanical damage of cells caused by the volume increase during
the water-to-ice phase change. Remember that cells of a tissue are located
in pores of an extracellular matrix. Each pore contains a solution called
extracellular liquid and a cell. The cell has a membrane that separates
the intracellular liquid from the extracellular one. Note that membranes
have a low heat conductivity, which causes delayed freezing of the intracellular liquid. This effect results in a very large stress exerted on the cell
membrane. To avoid that, the liquids inside and outside the cell must
freeze simultaneously. This can be achieved through lowering the freezing
point of the extracellular fluid and optimization of cooling protocols.
The unfrozen extracellular water content β` in the extracellular matrix can be computed from the following phase field model (see [1]):
µ
¶
Lθ
β` (θ) = φ
,
T0 (T0 + θ)
e(θ) = ρCθ + ρLβ` (θ),
(1)
∂e(θ)
− K∆θ = 0, −K∂θ/∂ν|∂Ω = λ(θ − θc )|∂Ω ,
∂t
where θ is the Celsius temperature, T0 is the freezing point (K), L is
the latent heat, ρ is the density, C is the specific heat capacity, K is
the heat conductivity coefficient. The function φ is recovered from data obtained in experiments with tissue samples. The function e(θ) has
the sense of the internal energy.
Averaging over a pore yields the following coupled system of ordinary
differential equations:
e˙1 = −α(θ1 − θ2 ) − λ(θ1 − θe ),
c Botkin N. D., Hoffmann K.-H., 2009
°
158
e˙2 = −α(θ2 − θ1 ).
Here, e1 and e2 are the densities of the internal energy averaged over the
extracellular and intracellular regions, respectively; θ1 and θ2 are the
analogously averaged temperatures; α is the overall heat conductivity of
the cell membrane; θc is the temperature on the pore boundary (control
parameter).
It is convenient to express the temperatures θ1 and θ2 through the energies e1 and e2 , respectively, using the relation θ = Θ(e), which is
the inverse of relation (1). Therefore,
£
¤
£
¤
£
¤
ė1 = −α Θ(e1 ) − Θ(e2 ) − λ Θ(e1 ) − θc ,
ė2 = −α Θ(e2 ) − Θ(e1 ) .
It follows from the definition of the function β` that exact simultaneous freezing the extracellular and intracellular liquids can be expressed
as the vanishing of the following functional:
Z tf h ³
³ ¡
¡
¢´
¢´i2
J(θc (·)) =
β Θ e1 (t) − β Θ e2 (t)
dt.
0
Therefore, an improved freezing protocol is expected to be won through
the minimization of J over protocols θc (·). Since the function Θ(e) is
recovered with some error, it should be replaced by Θ(e) + v, where
v (|v| ≤ ν) is an unpredictable disturbance interpreted as the control
of an opposite player. Thus, the theory of differential games (see [2])
is appropriate to treat the problem. The outlined differential game is
solved numerically using a grid method (see [3]) for the corresponding
Hamilton – Jacobi equation. Numerical experiments show that the optimal cooling profiles computed in such a way are stable with respect to
realistic measurement errors.
This work is supported by the German Research Society (Deutsche Forschungsgemeinschaft), project SPP 1253.
[1] Frémond M. Non-smooth thermomechanics. Springer, Berlin, 2002.
[2] Krasovskii N. N., Subbotin A. I. Positional differential games. Nauka, Moscow, 1974.
[3] Botkin N. D. Approximation schemes for finding the value functions for differential games with nonterminal payoff functional. In:
Analysis. 1994. Vol. 14, pp. 203–220.
159
Perturbed kernels of integral equations
T. A. Burton
Northwest Research Institute, Port Angeles, WA, USA
University of Memphis, Memphis, TN, USA
e-mail: taburton@olypen.com
D. P. Dwiggins
University of Memphis, Memphis, TN, USA
e-mail: ddwiggns@memphis.edu
We frequently model fading memory processes by means of an integral
Z t
C(t, s)g(x(s))ds
0
and the assumptions on the kernel, going as far back as Volterra, are
typified by e−(t−s) and generalized to
C(t, s) ≥ 0, Cs (t, s) ≥ 0, Cst (t, s) ≤ 0, Ct (t, s) ≤ 0.
These assumptions may be found in mathematical biology, in various
kinds of reactor dynamics, in viscoelasticity, and neural networks, among
many other discussions of real world problems. Volterra himself suggested the conditions and Levin and Nohel worked some wonders with
them.
Yet, any investigator of real-world problems would strongly contest
their applicability. Never could we measure real world conditions closely
enough to verify such mathematically exact requirements.
Here is the problem: can we add perturbations of sufficient size and
generality so that measurements can be made, yet prove that the perturbed problem has the same fundamental solution as the unperturbed
problem? The point of this paper is that we can, indeed, do so. This
gives integrity to those investigations which focused only on the unperturbed equations. The analysis is based on the construction of Lyapunov
functionals for integral equations.
c Burton T .A., Dwiggins D. P., 2009
°
160
Guaranteed result in game problems of dynamics
A. A. Chikrii
Glushkov Institute of Cybernetics, NAS of Ukraine, Kiev, Ukraine
e-mail: chik@insyg.kiev.ua
The quasilinear game problems are studied in the case of dynamics of Volterra type, distributed initial conditions, and integral
control block. In doing so, the technique of set-valued mappings
and the theorem on measurable choice are employed. This problem statement encompasses the systems with fractional derivatives
of Riemann – Liouville, Caputo, Miller – Ross, the integral, integrodifferential, difference-differential equations, and the impulse control systems.
On the basis of Pontryagin’s condition or one of its modifications,
the method is proposed to solve, in the class of quasi-strategies, the game
problem of approach to a cylindrical terminal set in some guaranteed
time. The method of resolving functions [3] assumes the use of the inverse Minkowski functionals, special set-valued mappings with closed images, and its measurable selections. The scheme of the method consists
in constructing certain scalar functions appearing as support functions
in direction to the above-mentioned set-valued mappings and integrally
describing the game course. It should be noted that these functions,
in general, are not the Caratheodori functions. That is why the measurability and superpositional measurability of these functions are required. These properties make it feasible to construct control of the first
player on the basis of the Filippov – Castaing-type theorem on measurable choice. With the goal for more thorough study, the functional form
of the first direct method is provided, expressed in terms of corresponding resolving functions. Conditions for convex-valuedness of the setvalued mappings are given to realize the method of resolving functions
in the class of the Krasovskii [1] counter-controls, prescribed by stroboscopic strategies.
Also a modified scheme which guarantees the desired result without
additional assumptions is constructed. Sufficient conditions for coincidence of the guaranteed times under any initial process state as well as
c Chikrii A. A., 2009
°
161
conditions for their coincidence and difference depending on initial state
in the terms of cones are derived. Analysis of various forms of Pontryagin’s condition [2] is performed with the goal of its weakening. The results are illustrated with the model examples of dynamic game problems. In particular, the classic rule of parallel pursuit is substantiated
for a wide class of problems, including the problems of the group and
by-turn pursuit.
[1] Krasovskii N.N., Subbotin A.I. Positional differential games. Nauka,
Moscow, 1974. (in Russian)
[2] Pontryagin L.S. Selected scientific works, Vol. 2. Nauka, Moscow,
1988. (in Russian)
[3] Chikrii A.A. Conflict-controlled processes. Kluwer Academic Publishers, Boston-London-Dordrecht, 1997.
Common Lyapunov functions
for linear switching systems
Dzhafarov V., Büyükköroğlu T., Akyar H.
Anadolu University, Eskisehir, Turkey
e-mail: vcaferov@anadolu.edu.tr,tbuyukkoroglu@anadolu.edu.tr,
hakyar@anadolu.edu.tr
Consider a switching system with stable matrices {A1 , ..., Ak }. We investigate the problem of existence of a common diagonal Lyapunov function, i.e., the Lyapunov function of the form V (x) = xT Dx, where D is
a positive diagonal matrix. In this report, we suggest an iteration procedure for finding the matrix D if it exists. In each iteration, one has
to solve a game problem of minimax. The algorithm is illustrated by examples.
c Dzhafarov V., Büyükköroğlu T., Akyar H., 2009
°
162
Numerical approximation
of the effective Hamiltonian and applications
M. Falcone
Sapienza – Università di Roma, Rome, Italy
e-mail: falcone@mat.uniroma1.it
M. Rorro
CASPUR, Rome, Italy
e-mail: rorro@caspur.it
The computation of the effective Hamiltonian is a difficult and challenging problem which arises in many applications related to the analysis
of Hamiltonian systems, homogenization and material science, see [1,2,5].
The characterization of the effective Hamiltonian H in the framework of
viscosity solutions has revitalized the efforts to find new methods and
efficient algorithms to compute it. For reader’s convenience let us recall
that for every P ∈ IRn the value H(P ) can be characterized as the unique
value of the right-hand side c for which the cell problem
H(x, Du + P ) = c
in T
In
(1)
has a viscosity solution. Note that the Hamiltonian H : IRn × IRn → IR is
assumed to be periodic with respect to x and convex with respect to Du.
The periodicity assumption allows to set the cell problem in the n-dimensional torus T
I n.
The basic computational effort then is to compute H for every P over
a grid. The amount of the above computations can be huge even for low
dimensional problems (n = 2, 3).
Several methods have been proposed in the last few years to solve
this problem. They rely on different characterizations of the effective
Hamiltonian and on various regularizations of the cell problem. A first
attempt to the numerical approximation of the effective Hamiltonian has
been proposed in [6]. The effective Hamiltonian is computed there via
a discrete version of a min-max representation formula
H(P ) =
inf
sup H(x, Du + P ),
1 (T
u∈Cper
I n ) x∈ T
In
c Falcone M., Rorro M., 2009
°
163
(2)
1
where the space Cper
(T
I n ) is the space of periodic function over T
I n.
Our approach consists in a discretization of (1). In this way we are
able to compute both the effective Hamiltonian and a viscosity solution
of the corresponding equation. In fact, we will use two regularizations
of the cell problem:
δuδ (x) + H(x, Duδ + P ) = 0
ut + H(x, Du + P ) = 0
in T
I n,
in T
I n ×(0, +∞),
(3)
(4)
which are called, respectively, ergodic and evolutive regularization
The above Hamilton – Jacobi equations have a control theory interpretation which will be exploited also for the construction of the schemes,
based on a Discrete Dynamic Programming principle.
There are several connections between the above problems and optimization techniques. The first is that the DP scheme requires specific
tools for the minimization without derivatives to compute the solution,
(2) is solved by an ad-hoc min–max algorithm and the Mather’s variational interpretation is a LP problem in infinite dimensions, see [3].
We will briefly discuss these connections and present some tests.
The work has been supported by PRIN 2007 Project “Modellistica numerica per il
calcolo scientifico ed applicazioni avanzate”. We also thank the CASPUR Consortium
for its technical support.
[1] Achdou Y., Camilli F., Capuzzo Dolcetta I. Homogenization of
Hamilton – Jacobi equations: numerical methods, In: Math. Models
Methods Appl. Sci. 2008. Vol. 18, pp. 1115–1143.
[2] Evans L.C. Periodic homogenization of certain nonlinear partial differential equation. In: Proc. Roy. Soc. Edinburgh. 1992. Vol. 120 A,
pp. 245–265.
[3] Evans L.C., Gomes D.A. Linear programming interpretations of
Mather’s variational principle. In: ESAIM Control Optim. Calc.
Var. 2002. Vol. 8, pp. 693–702.
[4] Falcone M., Rorro M. Preprint, 2009. (in preparation)
[5] Fathi A. Weak KAM Theorem in Lagrangian Dynamics. Cambridge
University Press, in press.
164
[6] Gomes D.A., Oberman A. Computing the effective Hamiltonian using a variational approach. In: SIAM J. Cont. Opt. 2004. Vol. 43,
pp. 798–812.
[7] Rorro M. An approximation scheme for the effective Hamiltonian and applications. In: Appl. Numer. Math. 2006. Vol. 56,
pp. 1238–1254.
Optimal control of “deviant” behavior
G. Feichtinger, D. Glass, G. Tragler
Vienna University of Technology, Vienna, Ausria
e-mail: gustav@eos.tuwien.ac.at, dieter.grass@tuwien.ac.at,
tragler@eos.tuwien.ac.at
J. P. Caulkins
Carnegie Mellon University, Pittsburgh, USA
e-mail: caulkins@andrew.cmu.edu
A survey on applications of optimal control models and nonlinear dynamical systems in the economics of “deviant” behavior is given particularly in illicit drug epidemics, corruption, and terrorism. The initiation
of criminal behavior (as well as of other “deviations”) is inherently influenced by social interactions implying that individual propensities depend
on the size and the structure of reference groups. A crucial consequence
of this paradigm are intrinsic nonlinearities governing the dynamics of
the processes. The purpose of the presentation is to deliver an optimal
control approach including such spillover or external effects.
An essential feature of nonlinear optimal control models in the existence of multiple long-run equilibria and (Skiba-)thresholds separating
their basics attraction. This sensitivity on initial conditions (historydependence) is illustrated by the US cocaine epidemic as well as in a production/inventory example.
c Feichtinger G., Glass D., Tragler G., Caulkins J. P., 2009
°
165
Differential game with linear dynamics
and multiple information delays
V. Y. Glizer
Ort Braude College, Karmiel, Israel
e-mail: valery48@braude.ac.il
V. Turetsky, J. Shinar
Technion – Israel Institute of Technology, Haifa, Israel
e-mail: turetsky@aerodyne.technion.ac.il, aer4301@aerodyne.technion.ac.il
In the presentation, a controlled system, modeling a planar engagement of two objects (pursuer and evader) on a given time interval [0, tf ],
ẋ = Ax + bu + cv,
(1)
is considered. In (1), x = [x1 , x2 , x3 , x4 ]T , x1 is the relative separation
between the objects; x2 is the relative velocity; x3 and x4 are the lateral accelerations of the evader and the pursuer, respectively, all normal
to the initial line of sight; the matrix A and vectors b and c are constant.
The controls u and v are normalized lateral acceleration commands, and
|u(t)| ≤ 1, |v(t)| ≤ 1, 0 ≤ t ≤ tf .
(2)
The differential game with dynamics (1), control constraints (2), and the
cost function
J = |x1 (tf )|
(3)
is studied. In this game, the information set of the pursuer is
W (t) = {x1 (t − ∆1 ), x2 (t − ∆2 ), x3 (t − ∆3 ), x4 t (·)}
where 0 < ∆1 ≤ ∆2 ≤ ∆3 are the information delays; ft (·) = {f (τ ), τ ∈
[t − ∆3 , t]}. The evader has perfect information on current values of all
state variables and also knows that W (t) is the pursuer information set.
The objective of the pursuer is to minimize the miss distance (3), while
the evader intends to maximize it.
The perfect information game (∆1 = ∆2 = ∆3 = 0) was solved in [1]
based on its reduction to a scalar game with a new state variable (zeroeffort miss distance, ZEM) z(t) = dΦ(tf , t)x(t), where Φ(tf , t) is the transition matrix of the unforced system (1); d = (1, 0, 0, 0). The games with
c Glizer V. Y., Turetsky V., Shinar J., 2009
°
166
one delay (∆1 = ∆2 = 0) and with two delays (∆1 = 0) were solved
in [2] and [3], respectively.
At the first stage of the game solution, the ZEM uncertainty set
Z(t) = [Θ1 (t), Θ2 (t)] is constructed, where
Θ1 (t) = min z(t), Θ2 (t) = max z(t).
|v(τ )|≤1
|v(τ )|≤1
The center z 0 (t) = (Θ1 (t) + Θ2 (t))/2 of Z(t) satisfies
ż 0 = h(t)u + F (t, vt (·)),
(4)
where h(t) < 0, t ∈ (0, tf ], F (τ, vt (·)) ≷ 0 for v(τ ) ≷ 0, τ ∈ [t − ∆3 , t].
At the second stage, the new scalar perfect information differential game
for dynamics (4), constraints (2), and the cost function
J 0 = |z 0 (tf )|
is formulated. Note that dynamics (4) depends on the time history vt (·)
of the evader control on [t − ∆3 , t]. Thus, the initial condition for v(·)
should be specified as v(ξ) = ϕ(ξ), −∆3 ≤ ξ < 0, where the initial
function ϕ(ξ) satisfies the constraint |ϕ(ξ)| ≤ 1, −∆3 ≤ ξ < 0.
It is shown that the optimal feedback strategies in the new game
are completely determined by the order and number of the sign changes
of the function R(t) = h(t) + F (t, vt+ (·)), t ∈ [0, tf ], where vt+ (τ ) ≡ 1,
τ ∈ [t − ∆3 , t]. It is established that the optimal pursuer strategy is pure,
while the optimal evader strategy is mixed. Note that the function R(t)
is independent of the delay ∆1 in the relative separation, nevertheless
the optimal triplet {u∗ (·), ϕ∗ (·), v ∗ (·)} depends on this delay.
Observe that J 0 6= J. This creates a dilemma for the evader: either
to use the optimal strategy of the new game, or that of the perfect
information game. Extensive numerical simulation shows that exploiting
the perfect information strategy does not change the game outcome.
The work was supported by Israel Scientific Foundation, grant No. 2009079.
[1] Shinar J. Solution Techniques for Realistic Pursuit-Evasion Games.
In: Advances in Control and Dynamic Systems, C.T. Leondes (ed).
Academic Press, New York. 1981, pp. 63–124.
[2] Shinar, J., Glizer V.Y. Solution of a Delayed Information Linear
Pursuit-Evasion Game with Bounded Controls. In: International
Game Theory Review. 1999. Vol. 1, pp. 197–217.
167
[3] Glizer V.Y., Turetsky V. Differential Game with Two Information Delays. In: Optimal Control Applications and Methods. 2009.
Vol. 30, pp. 135–161.
Attainable sets of the nonlinear control systems
with limited resources
Kh. G. Guseinov
Anadolu University, Eskisehir, Turkey
e-mail: kguseynov@anadolu.edu.tr
A. S. Nazlipinar
Dumlupinar University, Kutahya, Turkey
e-mail: ali.serdar@dumlupinar.edu.tr
Consider the control system which behavior is described by the differential equation
·
x(t) = f (t, x(t), u(t)), x(t0 ) ∈ X0 ,
(1)
where x ∈ Rn is the phase state vector of the system, u ∈ Rm is the control vector,
θ]¢is the time, and X0 ⊂ Rn is a compact set.
¡ t ∈ [t0 , m
By Lp [t0 , θ], R
(p > 1) we denote the space of measurable functions u(·) : [t0 , θ] → Rm with finite ku(·)kp norm, where ku(·)kp =
Ã
! p1
Rθ
p
ku(t)k dt
and k·k denotes the Euclidean norm.
t0
For p ∈ (1, ∞) and µ0 > 0, we set
©
¡
¢
ª
Up = u(·) ∈ Lp [t0 , θ], Rm : ku(·)kp ≤ µ0 ,
where µ0 defines the resource of the control effort.
Every function u(·) ∈ Up is said to be an admissible control function. It is obvious that the set of all admissible control functions
Up¢ is
¡
the closed ball centered at the origin with radius µ0 in Lp [t0 , θ]; Rm .
c Guseinov Kh. G., Nazlipinar A. S., 2009
°
168
Control problems with integral constraints on control arise in various
problems of mathematical modeling. They naturally arise in the applications, such as control problems with bounded Lp norms of the controls,
control problems with prescribed bounded total energy of the trajectories
and control systems with design uncertainties (see, e.g. [1]).
It is assumed that the right hand side of the system (1) satisfies
the following conditions:
A. The function f (·) : [t0 , θ] × Rn × Rm → Rn is continuous;
B. For any bounded set D ⊂ [t0 , θ] × Rn there exist constants L1 =
L1 (D) > 0 , L2 = L2 (D) > 0 and L3 = L3 (D) > 0 such that
kf (t, x1 , u1 ) − f (t, x2 , u2 )k
≤
+
[L1 + L2 (ku1 k + ku2 k)] kx1 − x2 k
L3 ku1 − u2 k
for any (t, x1 ) ∈ D, (t, x2 ) ∈ D, u1 ∈ Rm and u2 ∈ Rm ;
C. There exists a constant c > 0 such that
kf (t, x, u)k ≤ c(1 + kxk)(1 + kuk)
for every (t, x, u) ∈ [t0 , θ] × Rn × Rm .
Let u∗ (·) ∈ Up . The absolutely continuous function x∗ (·) : [t0 , θ] →
Rn which satisfies the equation ẋ∗ (t) = f (t, x∗ (t), u∗ (t)), a.e. in [t0 , θ]
and the initial condition x∗ (t0 ) = x0 ∈ X0 is said to be a solution of system (1) with initial condition x∗ (t0 ) = x0 generated by the admissible
control function u∗ (·). By the symbol x(·; t0 , x0 , u(·)) we denote the solution of system (1) with initial condition x(t0 ) = x0 , which is generated
by the admissible control function u(·). Note that the conditions A – C
guarantee the existence, uniqueness, and extendability of the solutions
up to the instant of time θ for every given u(·) ∈ Up and x0 ∈ X0 .
For given t ∈ [t0 , θ], let us put
Xp (t; t0 , X0 ) = { x (t; t0 , x0 , u(·)) ∈ Rn : x0 ∈ X0 , u(·) ∈ Up } .
The set Xp (t; t0 , X0 ) is called the attainable set of system (1) at
the instant of time t. It is obvious that the set Xp (t; t0 , X0 ) consists of
all x ∈ Rn to which system (1) can be steered at the instant of time
t ∈ [t0 , θ].
In this presentation, various topological properties of the attainable
sets Xp (t; t0 , X0 ), t ∈ [t0 , θ], of the control system (1) are investigated.
An approximation method has been obtained for numerical construction
of the attainable sets.
169
The work was supported by Turkish Scientific and Technological Research Council
(TUBITAK), project No. 106T012.
[1] Krasovskii N.N. Theory of Control of Motion: Linear systems. Nauka, 1968. (in Russian)
Optimal boundary control
of a system describing thermal convection
A. I. Korotkii, D. A. Kovtunov
Institute of Mathematics and Mechanics UrB of RAS, Yekaterinburg,
Russia
e-mail: korotkii@imm.uran.ru, dakovtunov@mail.ru
A controlled system is considered. Its state is a pair of functions
(T, ~v ), T = T (x), ~v = ~v (x), x ∈ Ω, satisfying the following boundary
value problem:
∇ · ( µ [∇~v + (∇~v )t ] ) = ∇p − Ra T ~g ,
∇ · ( k ∇T ) = ~v ∇T − f,
~v = 0, x ∈ Γ;
T = w, x ∈ Γ1 ;
∇ · ~v = 0,
x ∈ Ω,
x ∈ Ω,
∂T /∂~n = u, x ∈ Γ2 .
(1)
(2)
(3)
Boundary value problem (1)–(3) describes the stationary motion
of a high-viscosity inhomogeneous incompressible heat-conducting fluid
in the domain Ω ⊂ Rn , n = 2, 3, with the boundary Γ = Γ1 ∪ Γ2 ,
Γ1 ∩ Γ2 = ∅. This fluid is in an external force field and is affected
by some external and internal thermal actions [1, 2]. In the problem,
x = (x1 , . . . , xn ) is a point of Rn ; ~v = ~v (x) = (v1 (x), . . . , vn (x)) is
the velocity vector of the fluid; p = p(x) is pressure; µ = µ(x) is viscosity; T = T (x) is temperature; k = k(x) is a heat conduction coefficient;
~g = ~g (x) = (g1 (x), . . . , gn (x)) is the density vector of external mass
forces; f = f (x) is the density of internal thermal sources; ~n = ~n(x) is
unit exterior normal at the boundary Γ of the domain Ω; w = w(x) is
the temperature distribution on the part Γ1 of Γ; u = u(x) is the heat
c Korotkii A. I., Kovtunov D. A., 2009
°
170
flux on the part Γ2 of Γ; Ra is the Rayleigh number. The boundary
regimes w and u are considered to be control actions on the system and
subjected to the constraints
w ∈ W ⊆ L2 (Γ1 ), u ∈ U ⊆ L2 (Γ2 ).
(4)
Under specified conditions for admissible controls, the solution
of problem (1)–(3) is understood in the weak sense [2–6] as an element
of the functional space
L2 (Ω) × H(Ω) 3 (T = T [u, w], ~v = ~v [u, w])
satisfying some integral identities.
The problem of optimal control
J = J(w, u, T [u, w], ~v [u, w]) → min : (w, u) ∈ W × U
(5)
is considered. Here, J is the functional on L2 (Γ1 ) × L2 (Γ2 ) × L2 (Ω) ×
H(Ω).
Conditions of weak solvability of boundary value problem (1)–(3)
under condition (4) are specified. Conditions of solvability of optimal
control problem (5) and necessary and sufficient conditions of optimality
in the problem are given. Procedures of approximate numerical solving
of the optimal control are constructed. Results of numerical experiments
are presented.
Problem (5) is considered in the connection with investigation of
inverse boundary problems [6].
The work was supported by the Russian Foundation for Basic Research (grant
No. 08-01-00029) and by the Presidium of Russian Academy of Sciences (program
No. 4 “Fundamental problems of nonlinear dynamics”).
[1] Landau L.D., Lifshits E.M. Hydrodynamics. Fizmatlit, Moscow,
2001. (in Russian)
[2] Ladyzhenskaya O.A. Mathematical Questions in the Dynamics of
a Viscous Incompressible Fluid. Fizmatlit, Moscow, 1961. (in Russian)
[3] Lions J.-L. Optimal Control in Systems Described by Partial Differential Equations. Mir, Moscow, 1972. (in Russian)
[4] Fursikov A.V. Optimal Control of Distributed Systems. Theory and
Applications. Scientific book, Novosibirsk, 1999. (in Russian)
171
[5] Korotkii A.I., Kovtunov D.A. On Solvability of Stationary Problems of Natural Thermal Convection of a High-Viscosity Fluid. In:
Proceedings of the Steklov Institute of Mathematics. 2008. Suppl. 1,
pp. S117–S130.
[6] Korotkii A.I., Kovtunov D.A. Reconstruction of Boundary Regimes
in the Inverse Problem of Thermal Convection of a High-Viscosity
Fluid. In: Proceedings of the Steklov Institute of Mathematics. 2006.
Suppl. 2, pp. S81–S92.
Discontinuous feedback in nonlinear control:
dynamic observers and stabilizers
Yu. S. Ledyaev
Western Michigan University, Kalamazoo, USA
Steklov Institute of Mathematics, Moscow, Russia
e-mail: ledyaev@wmich.edu
It is well known that many control tasks for nonlinear control dynamical system cannot be performed effectively by using only continuous
feedback controls due to some topological obstacles.
In mid 1990s Clarke, Ledyaev, Sontag, and Subbotin [1] introduced
a concept of discontinuous feedback control to demonstrate that any
asymptotically controllable nonlinear system can be stabilized by (possibly discontinuous) feedback control. This feedback concept provided
a convenient and precise mathematical model for digital computer-aided
control and control over networks. Moreover, it was shown that such
discontinuous feedback is robust and insensitive with respect to external
disturbances, actuator and measurement errors [2,3].
In this talk, we illustrate applications of this discontinuous feedback
control concept by discussing derivation of the following results:
(a) asymptotic controllability of nonlinear control system under persistent disturbances implies existence of stabilizing feedback;
(b) existence of dynamic observer with infinite memory implies existence of finite-dimensional dynamic observer with output injection;
c Ledyaev Yu. S., 2009
°
172
(c) design of optimal pursuit feedback controls in differential game
of group pursuit.
We demonstrate also use of nonsmooth analysis methods [4] for design
of discontinuous optimal and stabilizing feedback controls and for design
of nonlinear observers by using nonsmooth Lyapunov functions.
The work was supported by Russian Foundation for Basic Research,
project No. 1111.
[1] Clarke F.H., Ledyaev Yu.S., Sontag E.D., Subbotin A.I. Asymptotic controllability implies feedback stabilization. In: IEEE Trans.
Automat. Control. 1997, No. 42(10), pp. 1394–1407.
[2] Ledyaev Yu.S., Sontag E.D. Lyapunov characterization of robust
stabilization. In: Nonlinear Analysis. 1999. pp. 813–840.
[3] Clarke F.H., Ledyaev Yu.S., Rifford L., Stern R.J. Feedback stabilization and Lyapunov functions. In: SIAM J. Control Optim. 2000.
Vol. 39, pp. 25–48.
[4] Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth
Analysis and Control Theory. Springer-Verlag, New York, 1998.
173
Stochastic discrete control problems
and dynamic programming algorithms
for solving them
S. Pickl
Institut für Theoretische Informatik, Mathematik und Operations
Research, Fakultät fur Informatik, Universität der Bundeswehr,
München, Germany
e-mail: stefan.pickl@unibw.de
D. Lozovanu
Institute of Mathematics and Computer Science Academy of Sciences
of Moldova, Chisinau, Moldova
e-mail: lozovanu@math.md
The paper is concerned with the analysis and solution of stochastic
versions of the classical discrete optimal control problems with finite time
horizon from [1, 2, 5]. In the deterministic control problems from [1, 2],
the variation of the vector of control parameters from the corresponding
feasible set at every moment of time for an arbitrary state is assumed to
be at our disposition, i.e., each dynamical state of the system is assumed
to be controllable.
In this paper, we consider the control problems for which the discrete system in the control process may admit dynamical states where
the vector of control parameters is changing in a random way according to given distribution functions of the probabilities on given feasible
dynamical sets. Such states of the dynamical system are called uncontrollable dynamical states. So, we consider the control problems for which
the dynamics may contain controllable states as well as the uncontrollable ones. We show that in general form these versions of the problems
can be formulated on stochastic networks and new approaches for their
solving based on the concept of Markov processes and dynamic programming from [3, 4] can be suggested. Algorithms for solving the considered
stochastic versions of the problems using the concept mentioned above
and the time-expanded network method from [5, 6] are proposed and
grounded. Some extensions and generalizations of stochastic discrete
optimal control problems with finite time horizon for which the timec Pickl S., Lozovanu D., 2009
°
174
expanded network method and dynamic programming algorithms can be
applied are analyzed. The computational complexity aspects of the proposed algorithms for solving this special class of problems are discussed.
[1] Bellman R., Kalaba R. Dynamic programming and modern control
theory. Academic Press, New York and London, 1965.
[2] Boltjanski W.G. Optimale Steuerung diskreter Systeme. Leipzig
Akademische Verlagsgesellschaft Geest & Portig K.-G., Leipzig,
1976.
[3] Feller W. An Introduction to Probability Theory and its Applications, v. 1, New York, John Wiley, 2nd edition, 1957.
[4] Howard R.A. Dynamic Programming and Markov Processes. Wiley,
1960.
[5] Lozovanu D., Pickl S. Optimization and Multiobjective Control of
Time-Discrete Systems. Springer, 2008.
[6] Lozovanu D., Pickl S. Allgorithms and the calculation of Nash
equilibria for multi-objective control of time-discrete systems
and polynomial-time algorithms for dynamic c-games on networks. In: European Journal of Operational Research, 181, 2007,
pp. 1214–1232.
175
Stability and sensitivity analysis
for optimal control problems
K. Malanowski
Systems Research Institute, Polish Academy of Sciences, Warszawa,
Poland
e-mail: kmalan@ibspan.waw.pl
In stability and sensitivity analysis, a family of parameter dependent optimal control problems is considered and local properties (Lipschitz continuity and directional differentiability) of the solutions treated
as functions of the parameter are investigated. The main difficulty
in such an analysis is the nonsmoothness of the problems connected with
the presence of inequality type constraints. In this survey talk, a short
outline of the methodology used in stability and sensitivity analysis for
abstract cone-constrained optimization problems is presented and its application to optimal control problems for systems described by nonlinear
ODEs, subjected to control and state constraints, is discussed.
Aggregation in dynamic equilibrium models
of economic growth with CES functions
N. B. Melnikov
Central Economics and Mathematics Institute of RAS, Moscow, Russia
e-mail: melnikov@cs.msu.su
B. C. O’Neill
National Center for Atmospheric Research, Boulder CO, USA
M. G. Dalton
National Oceanic and Atmospheric Administration, Seattle WA, USA
In Arrow – Debreu equilibrium theory, it is known that a solution
in a model with several household groups coincides exactly with the one
in the model with a single (aggregated) group only under very restrictive
c Malanowski K., 2009
°
c Melnikov N. B., O’Neill B. C., Dalton M. G., 2009
°
176
assumptions on the structure of the model. We consider a class of infinite horizon dynamic equilibrium models in discrete time with constant
elasticity of substitution (CES) utility and production functions. Exact
aggregation is not assumed.
The aim of the present study is twofold. First, we investigate how
much the total consumption differ in the model with heterogeneous
households (several household groups each with different characteristics) vs. the one with representative household (single group with averaged characteristics). The characteristics of a group can change over
time, the number of groups cannot; no migration of households between
the groups is assumed. Since consumer’s behavior is the solution to an optimization problem, our first research question can be restated as follows:
“What is the difference between ‘optimizing first and averaging next’ vs. ‘averaging first and optimizing next’ ?”
The second task is to construct the representative consumer in such
a way that the margin between the consumer demand computed within
the two approaches is sufficiently small.
The analysis framework is as follows. First, we consider a class of
time-stationary models with a simplified linear-logarithmic structure to
obtain an analytic expression for consumer demand through the dynamic
programming approach. Analyzing these results, we suggest an aggregation technique aimed at creating the representative household for models with a time-variable structure. The application of the technique is
demonstrated on a one-region version of the Population-EnvironmentTechnology (PET) model [1]. Of primary interest here, are the timedependencies due to changes in demographic patterns. Therefore, we
consider three possibilities in PET: only total population changes over
time (scale effect), only population shares of the groups change over time
(compositional change), and both (for details see [2, 3]).
The research was carried out at the International Institute for Applied System Analysis, Laxenburg, Austria. The first author was supported in part by
the RFBR (grant No. 08-01-00685) and RF Ministry of Education and Science
(grant 2.1.1/2000).
[1] Dalton M., O’Neill B., Prskawetz A., Jiang L., Pitkin J. Population
aging and future carbon emissions in the United States. In: Energy
economics. 2008. Vol. 30, pp. 642–675.
177
[2] Melnikov N., O’Neill B., Dalton M. Accounting for the household
heterogeneity in general equilibrium models. In: IIASA Interim Report, 2009.
[3] Melnikov N., O’Neill B., Dalton M. Accounting for the household
heterogeneity in economic growth models. In: Journal of Economic
Dynamics and Control, 2009. (submitted)
Optimal control and feedback design
of state-constrained parabolic systems
under uncertainties
B. S. Mordukhovich
Wayne State University, Detroit, USA
e-mail: boris@math.wayne.edu
The paper is devoted to optimal control and feedback design of stateconstrained parabolic systems under uncertainty conditions. Problems of
this type are among the most challenging and difficult in dynamic optimization for any kind of dynamical systems. We pay the main attention
to considering linear multidimensional parabolic systems with Dirichlet
boundary controls and pointwise state constraints, while the methods developed in this study are applicable to other kinds of boundary controls
and dynamical systems of the parabolic type.
The feedback design problem is formulated in the minimax sense
to ensure stabilization of transients within the prescribed diapason and
robust stability of the closed-loop control system under all feasible perturbations with minimizing an integral cost functional in the worst perturbation case.
Exploiting certain fundamental properties of the parabolic dynamics, we single out the worst perturbations in the minimax control problem and efficiently solve the associated optimal control problems for approximating ODE and the original PDE systems with pointwise state
constraints. In this way, using the transient monotonicity and turnpike
asymptotic properties of the underlying parabolic dynamics on the infinite horizon, we compute optimal (in the minimax sense) parameters
c Mordukhovich B. S., 2009
°
178
of the easily implemented while rigorously justified three-positional suboptimal structure of the feedback boundary controls that ensure robust
stability of the closed-loop and highly nonlinear parabolic control system
under consideration.
This research was partly supported by the USA National Science Foundation
under grants DMS-0304989 and DMS-0603846.
On strongly convex analysis and its applications
E. S. Polovinkin
Moscow Institute of Physics and Technology, Moscow, Russia
e-mail: polovinkin@mail.mipt.ru
According to [1], a closed convex set M in a Banach space
T E called
(M + x)
a generating set if for any non-empty set A of the form A =
there is a closed convex set B ⊂ E such that
x∈X
A + B = M,
where X + Y = {x + y | x ∈ X, y ∈ Y } is Minkowski sum of subsets
X and Y , the closure of a set X is denoted by X. Correspondingly, for
every generated set M a non-empty set A of the written upper form is
called an M -strongly convex set. We proved [2] that a set M in a Banach
space is the generating set if and only if there is a strengthen duality.
It means that a subset A is a M -strongly convex set if and only if for
any pair points
T a, b ∈ A the intersection of following sets M + x by all
x ∈ (a − M ) (b − M ) is involved to the set A. We studied the common
properties of the M -strongly convex sets.
We make some attempts constructing and describing new classes of
generating sets.
We introduced the concept of an M -strongly convex hull of a set and
have got its properties. We proved that the operator of taking the M strongly convex hull was the Lipschitz continuous in Hausdorff metric.
It is shown that when a generating set M ⊂ Rn is a compact and strictly
convex there is an analogue of Caratheodory’s theorem.
c Polovinkin E. S., 2009
°
179
In the case when M is the ball BR (0) in a Hilbert space for an arbitrary compact set, we introduce the concepts of the sets of M -strongly
extreme points. We obtain an analogue of the Krein – Milman theorem
in which classical extreme points are replaced by M -strongly extreme
points and the convex hull is replaced by the M -strongly convex hull.
We applied the M -strongly convexity to studying existence theorem
for convex bodies of constant width d > 0 which contain a given bounded
set of the same diameter d. Now we have solved this problem. We suggest [3, 4] the algorithms for constructing bodies of constant width containing a given bounded set in a reflexive Banach space where the unit
ball is a generating set.
The work was supported by Russian Foundation for Basic Research,
project No. 07-01-00156.
[1] Polovinkin E.S. New classes of generating sets. In: Some Problems of
Fundamental and Applied Mathematics. Moscow Physics-Technical
Inst., Moscow. 1998, pp. 81–93. (in Russian)
[2] Polovinkin E.S., Balashov M.V. Elements of convex and strongly
convex analysis. Izd. Fizmatlit, Moscow, 2004.
[3] Polovinkin E.S. Convex bodies of constant width. In: Doklady
Mathematics. 2004. Vol. 70, No. 1, pp. 560–562.
[4] Polovinkin E.S., Sidenko S.V. Addition of subsets to constant
width bodies. In: Uchenye Zapiski Kazanskogo Universiteta. 2006.
Vol. 148, No. 2, pp. 132–143. (in Russian)
180
Modeling the osmotic de- and rehydration
of living cells using Hamilton – Jacobi equations
and reachable set techniques
V. L. Turova
Technische Universität München, Garching b. Munich, Germany
e-mail: turova@ma.tum.de
The increased usage of living cells in medical and biological applications stimulates the development of cryopreservation procedures as
the most effective methods for preserving cell viability and functionality.
However, these processes may cause dangerous cell changes like excessive
shrinkage and swelling due to the osmotic dehydration and rehydration
occurring during freezing and, respectively, warming phase. The paper
is related to the mathematical modeling of cell shrinkage and swelling
induced by alterations of the osmotic pressure in the extracellular and
intracellular liquid.
The mechanism of the osmotic effect in the freezing phase is the following. Ice forms initially in the extracellular solution. Transition of water to ice results in an increased concentration (cout ) of solutes in the remaining liquid. The intracellular osmotic pressure forces the osmotic
outflow to balance the intracellular (cin ) and extracellular solute concentrations. Modeling the cell shrinkage is based on free boundary problem
techniques. The main relation here is the so called Stefan condition:
Vn = α(cout − cin ), where Vn is the normal velocity of the cell boundary,
and the right-hand side represents the osmotic flux that is proportional to
the difference of the concentrations. The extracellular solute concentration cout depends on the unfrozen extracellular water content β` defined
from the following phase field model [1]:
µ
¶
∂θ
∂β`
Lθ
ρC
+ ρL
− K∆θ = 0, β` = φ
,
∂t
∂t
T0 (T0 + θ)
where θ is the Celsius temperature, T0 is the freezing point (K), L is
the latent heat, ρ is the density, C is the specific heat capacity, K is
the heat conductivity coefficient. The function φ is recovered from experimental data.
c Turova V. L., 2009
°
181
In the thawing phase, the osmotic effect results in the inflow, which
forces swelling the cells.
The cell region Σ(t) is searched as a level set of a function Ψ(x, t):
Σ(t) = {x : Ψ(x, t) ≤ 1},
x ∈ R3 (or R2 ).
The function Ψ(x, t) satisfies the following Hamilton – Jacobi equation:
Ψt − α(cout − cin )|∇Ψ| = 0
with Ψ(x, 0) = inf{γ > 0 : x ∈ γ · Σ(0)}. This equation is solved numerically both in 3D and 2D using the method of vanishing viscosity [2]
and monotony preserving grid methods for finding viscosity solutions of
Hamilton – Jacobi equations [3], respectively.
The problem is also treated using conflict control setting within
the framework of [4] with the cell region Σ(t) being either the complement to the reachable set of the control problem
ẋ = α(cout − cin ) · u,
x ∈ R2 ,
|u| ≤ 1,
in the case of freezing or the reachable set itself in the case of thawing. Here, u is the control variable. Starting from the complement of
the initial cell shape Σ(0) or from Σ(0) itself, we compute a sequence
of reachable sets using a very fast numerical method similar to that one
developed in [5]. Generalized variants of the Stefan condition (with curvature) are also considered to account for tension effects in cell membranes.
Simulation results showing the time evolution of the cell shape are
presented.
The work is supported by the German Research Society (Deutsche Forschungsgemeinschaft), project SPP 1253. This paper includes joint results with N. D. Botkin.
[1] Frémond M. Non-smooth thermomechanics. Springer, Berlin, 2002.
[2] Crandall M.G., Lions P.L. Viscosity solutions of Hamilton – Jacobi
equations. In: Trans. Amer. Math. Soc. 1983. Vol. 277, pp. 1–47.
[3] Botkin N.D. Approximation schemes for finding the value functions
for differential games with nonterminal payoff functional. In: Analysis. 1994. Vol. 14, pp. 203–220.
[4] Krasovskii N.N., Subbotin A.I. Positional differential games. Nauka,
Moscow, 1974. English edition: Game-theoretical control problems.
Springer, New York, 1988.
182
[5] Patsko V.S., Turova V.L. Level sets of the value function in differential games with the homicidal chauffeur dynamics. In: Int. Game
Theory Review. 2001. Vol. 3, No. 1, pp. 67–112.
Discrete-time approximations
to control/uncertain systems
V. M. Veliov
Institute of Mathematical Methods in Economics, Vienna University
of Technology, Vienna, Austria
e-mail: veliov@tuwien.ac.at
The numerical solution of problems of optimal control or of state estimation requires (i) approximation of the admissible controls by a finitely
parameterized set of controls; (ii) discretization of the underlying differential equation. The second issue is quite well developed, while the error
analysis in the first issue is still in a rudimentary phase. The talk is devoted to some new ideas and results in this area. In particular, we investigate the relation between the information pattern of the approximations
in (i), the manner of accumulation of the local errors, and the accuracy
of approximation. The focus is on higher than first order approximations.
c Veliov V. M., 2009
°
183
Список авторов
Ильин А. В. . . . . . . . . . . . . . . . . 76
Ильин А. М. . . . . . . . . . . . . . . . 79
Кадиев А. М. . . . . . . . . . . . . . . 35
Камзолкин Д. В. . . . . . . . . . . . 55
Ким А. В. . . . . . . . . . . . . . . . . . . 82
Кириллова Ф. М. . . . . . . . . . . 46
Клейменов А. Ф. . . . . . . . . . . . 84
Козлов Р. И. . . . . . . . . . . . . . . . 42
Колесов А. Ю. . . . . . . . . . . . . . 86
Колпакова Е. А. . . . . . . . . . . 134
Коровин С. К. . . . . . . . . . . . . . 76
Костоусов В. Б. . . . . . . . . . . . . 68
Костоусова Е. К. . . . . . . . 68, 89
Котельникова А. Н. . . . . . . . . 95
Красовский А. А. . . . . . . . . . . 91
Красовский Н. А. . . . . . . . . . . 93
Красовский Н. Н. . . . . . . . . . . 95
Кругликов C. B. . . . . . . . . . . . 98
Кряжимский А. В. . . . . . . . .100
Кувшинов Д. Р. . . . . . . . . . . . . 84
Кумков С. С. . . . . . . . . . . . . . . 51
Куржанский А. Б. . . . . . . . . 103
Кучкаров А. Ш. . . . . . . . . . . . 25
Латушкин Я. А. . . . . . . . . . . . 38
Лукоянов Н. Ю. . . . . . . . . . . 104
Лукьянова Л. Н. . . . . . . . . . . . 55
Максимов В. И. . . . . . . . . . . . . 35
Матвийчук А. Р. . . . . . . . . . . 141
Минаева Ю. Ю. . . . . . . . . . . . .61
Мищенко Е. Ф. . . . . . . . . . . . . 86
Мурзабекова Г. Е. . . . . . . . . 106
Никонов O. И. . . . . . . . . . . . . 108
Осипов С. И. . . . . . . . . . . . . . . . 84
Осипов Ю. С. . . . . . . . . . . . . . 100
Пацко В. С. . . . . . . . . . . . . . . . . 51
Агеев А. Л. . . . . . . . . . . . . . . . . 19
Азамов А. А. . . . . . . . . . . . 23, 25
Ананьев Б. И. . . . . . . . . . . . . . . 21
Антипов А. В. . . . . . . . . . . . . . 37
Ахмедов О. С. . . . . . . . . . . . . . 23
Баенхаева А. В. . . . . . . . . . . . . 27
Банников А. С. . . . . . . . . . . . . 29
Бердышев В. И. . . . . . . . . . . . . 31
Бердышев Ю. И. . . . . . . . . . . . 33
Близорукова М. С. . . . . . . . . . 35
Болотник Н. Н. . . . . . . . . . . . 149
Братусь А. С. . . . . . . . . . . . . . . 37
Брыкалов С. А. . . . . . . . . . . . . 38
Васильев С. Н. . . . . . . . . . 40, 42
Васин В. В. . . . . . . . . . . . . . . . . 44
Габасов Р. . . . . . . . . . . . . . . . . . 46
Гаева З. С. . . . . . . . . . . . . . . . . . 49
Ганебный С. А. . . . . . . . . . . . . 51
Гороховик В. В. . . . . . . . . . . . . 53
Григоренко Н. Л. . . . . . . . . . . 55
Гусев М. И. . . . . . . . . . . . . . . . . 57
Данилин А. Р. . . . . . . . . . . . . . 59
Дарьин А. Н. . . . . . . . . . . . . . . 61
Демьянов В. Ф. . . . . . . . . . . . . 63
Дигайлова И. А. . . . . . . . . . . . 64
Дмитрук Н. М. . . . . . . . . . . . . 46
Долгий Ю. Ф. . . . . . . . . . . . . . .65
Думшева Т. Д. . . . . . . . . . . . . . 68
Дыхта В. А. . . . . . . . . . . . . . . . .70
Егоров А. И. . . . . . . . . . . . . . . . 72
Еремин И. И. . . . . . . . . . . . . . . 44
Желонкина Н. И. . . . . . . . . . . 75
Завалищин Д. С. . . . . . . . . . 137
Знаменская Л. Н. . . . . . . . . . . 72
Зорин А. П. . . . . . . . . . . . . . . . . 59
184
Филиппова Т. Ф. . . . . . . . . . .143
Финогенко И. А. . . . . . . . . . . 145
Фомичев В. В. . . . . . . . . . . . . . 76
Хачай О. Ю. . . . . . . . . . . . . . . . 79
Ченцов А. Г. . . . . . . . . . . . . . . 147
Черноусько Ф. Л. . . . . . . . . . 149
Черных Н. И. . . . . . . . . . . . . . 133
Чистяков С. В. . . . . . . . . . . . 126
Чумерина Е. С. . . . . . . . . . . . . 37
Шагалова Л. Г. . . . . . . . . . . . 134
Шананин А. А. . . . . . . . . . . . . 49
Шориков А. Ф. . . . . . . . . . . . 151
Щеглова А. А. . . . . . . . . . . . . 153
Янулевич М. В. . . . . . . . . . . . 155
Петров Н. Н. . . . . . . . . . . . . . . . 29
Петросян Л. А. . . . . . . . . . . . 110
Пивоварчук Д. Г. . . . . . . . . . . 55
Пименов В. Г. . . . . . . . . . . . . . 111
Попова С. Н. . . . . . . . . . . . . . .113
Починский В. И. . . . . . . . . . . . 68
Поясок Е. И. . . . . . . . . . . . . . . . 46
Просвиряков Е. Ю. . . . . . . . 131
Прудников И. М. . . . . . . . . . 115
Решмин С. А. . . . . . . . . . . . . . 117
Розанова О. С. . . . . . . . . . . . . 120
Розов Н. Х. . . . . . . . . . . . . . . . . 86
Рублев И. В. . . . . . . . . . . . . . . 122
Ряшко Л. Б. . . . . . . . . . . . . . . 124
Саматов Б. Т. . . . . . . . . . . . . . . 25
Самсонюк О. Н. . . . . . . . . . . . 27
Сахаров Д. В. . . . . . . . . . . . . . . 29
Серков Д. А. . . . . . . . . . . . . . . 125
Сесекин А. Н. . . . . . . . . . . . . . . 75
Смирнов Р. О. . . . . . . . . . . . . 126
Соколов В. Ф. . . . . . . . . . . . . 127
Сорокин С. П. . . . . . . . . . . . . . 70
Срочко В. А. . . . . . . . . . . . . . .129
Стрекаловский А. С. . . . . . 155
Стружанов В. В. . . . . . . . . . .131
Субботин Ю. Н. . . . . . . . . . . 133
Субботина Н. Н. . . . . . . . . . . 134
Сурков А. В. . . . . . . . . . . . . . . 136
Тамасян Г. Ш. . . . . . . . . . . . . . 63
Тарасьев А. М. . . . . . . . . . 91, 93
Тилавов А. М. . . . . . . . . . . . . . 23
Тимофеева Г. А. . . . . . . . . . . 137
Токманцев Т. Б. . . . . . . . . . . 134
Толстоногов А. А. . . . . . . . . 138
Ульянов С. А. . . . . . . . . . . . . . . 42
Успенский А. А. . . . . . . . . . . 141
Ухоботов В. И. . . . . . . . . . . . 139
Ушаков В. Н. . . . . . . . . . . . . . 141
Файзуллин Д. С. . . . . . . . . . . 122
Akyar H. . . . . . . . . . . . . . . . . . . 162
Büyükköroğlu T. . . . . . . . . . . 162
Botkin N. D. . . . . . . . . . . . . . . 158
Burton T .A. . . . . . . . . . . . . . . 160
Caulkins J. P. . . . . . . . . . . . . . 165
Chikrii A. A. . . . . . . . . . . . . . . 161
Dalton M. G. . . . . . . . . . . . . . . 176
Dwiggins D. P. . . . . . . . . . . . . 160
Dzhafarov V. . . . . . . . . . . . . . . 162
Falcone M. . . . . . . . . . . . . . . . . 163
Feichtinger G. . . . . . . . . . . . . . 165
Glass D. . . . . . . . . . . . . . . . . . . 165
Glizer V. Y. . . . . . . . . . . . . . . . 166
Guseinov Kh. G. . . . . . . . . . . . 168
Hoffmann K.-H. . . . . . . . . . . . 158
Korotkii A. I. . . . . . . . . . . . . . . 170
Kovtunov D. A. . . . . . . . . . . . 170
Ledyaev Yu. S. . . . . . . . . . . . . 172
Lozovanu D. . . . . . . . . . . . . . . 174
Malanowski K. . . . . . . . . . . . . 176
Melnikov N. B. . . . . . . . . . . . . 176
Mordukhovich B. S. . . . . . . . 178
Nazlipinar A. S. . . . . . . . . . . . 168
O’Neill B. C. . . . . . . . . . . . . . . 176
185
Pickl S. . . . . . . . . . . . . . . . . . . . 174
Polovinkin E. S. . . . . . . . . . . . 179
Rorro M. . . . . . . . . . . . . . . . . . . 163
Shinar J. . . . . . . . . . . . . . . . . . . 166
Tragler G. . . . . . . . . . . . . . . . . . 165
Turetsky V. . . . . . . . . . . . . . . . 166
Turova V. L. . . . . . . . . . . . . . . .181
Veliov V. M. . . . . . . . . . . . . . . . 183
186
List of authors
Egorov A. I. . . . . . . . . . . . . . . . . 72
Eremin I. I. . . . . . . . . . . . . . . . . . 44
Falcone M. . . . . . . . . . . . . . . . . 163
Fayzullin D. S. . . . . . . . . . . . . .122
Feichtinger G. . . . . . . . . . . . . . 165
Filippova T. F. . . . . . . . . . . . . 143
Finogenko I. . . . . . . . . . . . . . . .145
Fomichev V. V. . . . . . . . . . . . . . 76
Gabasov R. . . . . . . . . . . . . . . . . .46
Gaeva Z. S. . . . . . . . . . . . . . . . . . 49
Ganebny S. A. . . . . . . . . . . . . . . 51
Glass D. . . . . . . . . . . . . . . . . . . 165
Glizer V. Y. . . . . . . . . . . . . . . . 166
Gorokhovik V. V. . . . . . . . . . . . 53
Grigorenko N. L. . . . . . . . . . . . .55
Guseinov Kh. G. . . . . . . . . . . . 168
Gusev M. I. . . . . . . . . . . . . . . . . . 57
Hoffmann K.-H. . . . . . . . . . . . 158
Il’in A. M. . . . . . . . . . . . . . . . . . . 79
Il’in A. V. . . . . . . . . . . . . . . . . . . 76
Kadiev A. M. . . . . . . . . . . . . . . . 35
Kamzolkin D. V. . . . . . . . . . . . .55
Khachay O. Yu. . . . . . . . . . . . . 79
Kim A. V. . . . . . . . . . . . . . . . . . . 82
Kirillova F. M. . . . . . . . . . . . . . . 46
Kleimenov A. F. . . . . . . . . . . . . 84
Kolesov A. Yu. . . . . . . . . . . . . . .86
Kolpakova E. A. . . . . . . . . . . . 134
Korotkii A. I. . . . . . . . . . . . . . . 170
Korovin S. K. . . . . . . . . . . . . . . . 76
Kostousov V. B. . . . . . . . . . . . . 68
Kostousova E. K. . . . . . . . 68, 89
Kotel’nikova A. N. . . . . . . . . . . 95
Kovtunov D. A. . . . . . . . . . . . 170
Kozlov R. I. . . . . . . . . . . . . . . . . 42
Ageev A. L. . . . . . . . . . . . . . . . . 19
Akyar H. . . . . . . . . . . . . . . . . . . 162
Ananiev B. I. . . . . . . . . . . . . . . . 21
Antipov A. V. . . . . . . . . . . . . . . 37
Axmedov O. S. . . . . . . . . . . . . . 23
Azamov A. A. . . . . . . . . . . .23, 25
Büyükköroğlu T. . . . . . . . . . . 162
Baenkhaeva A. V. . . . . . . . . . . 27
Bannikov A. S. . . . . . . . . . . . . . 29
Berdyshev V. I. . . . . . . . . . . . . . 31
Berdyshev Yu. I. . . . . . . . . . . . . 33
Blizorukova M. S. . . . . . . . . . . . 35
Bolotnik N. N. . . . . . . . . . . . . . 149
Botkin N. D. . . . . . . . . . . . . . . 158
Bratus A. S. . . . . . . . . . . . . . . . . 37
Brykalov S. A. . . . . . . . . . . . . . . 38
Burton T .A. . . . . . . . . . . . . . . 160
Caulkins J. P. . . . . . . . . . . . . . 165
Chentsov A. G. . . . . . . . . . . . . 147
Chernousko F. L. . . . . . . . . . . 149
Chernykh N. I. . . . . . . . . . . . . 133
Chikrii A. A. . . . . . . . . . . . . . . 161
Chistyakov S.V. . . . . . . . . . . . 126
Chumerina E. S. . . . . . . . . . . . . 37
Dalton M. G. . . . . . . . . . . . . . . 176
Danilin A. R. . . . . . . . . . . . . . . . 59
Daryin A. N. . . . . . . . . . . . . . . . 61
Demyanov V. F. . . . . . . . . . . . . 63
Digailova I. A. . . . . . . . . . . . . . . 64
Dmitruk N. M. . . . . . . . . . . . . . 46
Dolgii Yu. F. . . . . . . . . . . . . . . . .65
Dumsheva T. D. . . . . . . . . . . . . 68
Dwiggins D. P. . . . . . . . . . . . . 160
Dykhta V. A. . . . . . . . . . . . . . . . 70
Dzhafarov V. . . . . . . . . . . . . . . 162
187
Reshmin S. A. . . . . . . . . . . . . . 117
Rorro M. . . . . . . . . . . . . . . . . . . 163
Roublev I. V. . . . . . . . . . . . . . . 122
Rozanova O. S. . . . . . . . . . . . . 120
Rozov N. Kh. . . . . . . . . . . . . . . . 86
Ryashko L. B. . . . . . . . . . . . . . 124
Sakharov D. V. . . . . . . . . . . . . . 29
Samatov B. T. . . . . . . . . . . . . . . 25
Samsonyuk O. N. . . . . . . . . . . . 27
Serkov D. A. . . . . . . . . . . . . . . .125
Sesekin A. N. . . . . . . . . . . . . . . . 75
Shagalova L. G. . . . . . . . . . . . 134
Shananin A. A. . . . . . . . . . . . . . 49
Shcheglova A. A. . . . . . . . . . . 153
Shinar J. . . . . . . . . . . . . . . . . . . 166
Shorikov A. F. . . . . . . . . . . . . . 151
Smirnov R. O. . . . . . . . . . . . . . 126
Sokolov V. F. . . . . . . . . . . . . . . 127
Sorokin S. P. . . . . . . . . . . . . . . . .70
Srochko V. A. . . . . . . . . . . . . . 129
Strekalovsky A. S. . . . . . . . . . 155
Struzhanov V. V. . . . . . . . . . . 131
Subbotin Yu. N. . . . . . . . . . . . 133
Subbotina N. N. . . . . . . . . . . . 134
Surkov A. V. . . . . . . . . . . . . . . 136
Tamasyan G. Sh. . . . . . . . . . . . 63
Tarasyev A. M. . . . . . . . . . 91, 93
Tilavov A. M. . . . . . . . . . . . . . . 23
Timofeeva G. A. . . . . . . . . . . . 137
Tokmancev T. B. . . . . . . . . . . 134
Tolstonogov A. A. . . . . . . . . . 138
Tragler G. . . . . . . . . . . . . . . . . . 165
Turetsky V. . . . . . . . . . . . . . . . 166
Turova V. L. . . . . . . . . . . . . . . .181
Ukhobotov V. I. . . . . . . . . . . . 139
Ulyanov S. A. . . . . . . . . . . . . . . .42
Ushakov V. N. . . . . . . . . . . . . . 141
Uspenskii A. A. . . . . . . . . . . . .141
Vasin V. V. . . . . . . . . . . . . . . . . . 44
Krasovskii A. A. . . . . . . . . . . . . 91
Krasovskii N. A. . . . . . . . . . . . . 93
Krasovskii N. N. . . . . . . . . . . . . 95
Kruglikov S. V. . . . . . . . . . . . . . 98
Kryazhimskiy A. V. . . . . . . . 100
Kuchkarov A. Sh. . . . . . . . . . . . 25
Kumkov S. S. . . . . . . . . . . . . . . . 51
Kurzhanski A. B. . . . . . . . . . . 103
Kuvshinov D. R. . . . . . . . . . . . . 84
Latushkin Y. A. . . . . . . . . . . . . 38
Ledyaev Yu. S. . . . . . . . . . . . . 172
Lozovanu D. . . . . . . . . . . . . . . 174
Lukianova L. N. . . . . . . . . . . . . 55
Lukoyanov N. Yu. . . . . . . . . . 104
Maksimov V. I. . . . . . . . . . . . . . 35
Malanowski K. . . . . . . . . . . . . 176
Matviychuk A. R. . . . . . . . . . 141
Melnikov N. B. . . . . . . . . . . . . 176
Minaeva J. J. . . . . . . . . . . . . . . . 61
Mishchenko E. F. . . . . . . . . . . . 86
Mordukhovich B. S. . . . . . . . 178
Murzabekova G. Y. . . . . . . . . 106
Nazlipinar A. S. . . . . . . . . . . . 168
Nikonov O. I. . . . . . . . . . . . . . . 108
O’Neill B. C. . . . . . . . . . . . . . . 176
Osipov S. I. . . . . . . . . . . . . . . . . . 84
Osipov Yu. S. . . . . . . . . . . . . . . 100
Patsko V. S. . . . . . . . . . . . . . . . . 51
Petrosyan L. A. . . . . . . . . . . . .110
Petrov N. N. . . . . . . . . . . . . . . . . 29
Pickl S. . . . . . . . . . . . . . . . . . . . 174
Pimenov V. G. . . . . . . . . . . . . 111
Pivovarchuk D. G. . . . . . . . . . . 55
Polovinkin E. S. . . . . . . . . . . . 179
Popova S. N. . . . . . . . . . . . . . . 113
Potchinskii V. I. . . . . . . . . . . . . 68
Poyasok E. I. . . . . . . . . . . . . . . . 46
Prosviryakov E. Yu. . . . . . . . 131
Proudnikov I. M. . . . . . . . . . . 115
188
Vassilyev S. N. . . . . . . . . . . 40, 42
Veliov V. M. . . . . . . . . . . . . . . . 183
Yanulevich M. V. . . . . . . . . . . 155
Zavalishchin D. S. . . . . . . . . . 137
Zhelonkina N. I. . . . . . . . . . . . . 75
Znamenskaya L. N. . . . . . . . . . 72
Zorin A. P. . . . . . . . . . . . . . . . . . 59
189
Научное издание
Актуальные проблемы
теории устойчивости и управления
Тезисы докладов Международной конференции
Рекомендовано к изданию Ученым советом
Института математики и механики УрО РАН
Ответственный за выпуск А. Г. Иванов
НИСО УрО РАН N 51(09)
Подписано в печать 25.07.09. Формат 60 × 84/16.
Бумага типографская. Печать офсетная.
Усл. печ. л. 12. Тираж 150. Заказ 168.
Отпечатано в типографии
«Уральский центр академического обслуживания»
620219, Екатеринбург, ул. Первомайская, 91
Скачать