ПРОЦЕССЫ УПРАВЛЕНИЯ М. А. Александров, Н. В. Смирнов

реклама
Сер. 10. 2011. Вып. 2
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
ПРОЦЕССЫ УПРАВЛЕНИЯ
УДК 517.977+519.71
М. А. Александров, Н. В. Смирнов
АСИМПТОТИЧЕСКИ УСТОЙЧИВЫЙ ГИБРИДНЫЙ
ИДЕНТИФИКАТОР В ЗАДАЧЕ МНОГОПРОГРАММНОЙ
СТАБИЛИЗАЦИИ
1. Введение. Постановка задачи. Стабилизация программных движений управляемых динамических систем является по сути центральной в современной математической теории управления. Наиболее распространенный подход при ее решении состоит
в построении управлений вида обратной связи [1, 2]. Задача многопрограммной стабилизации была впервые сформулирована В. И. Зубовым в работах [3, 4]. В них предложено представление правых частей систем дифференциальных уравнений, имеющих
наперед заданное конечное семейство решений, а также рассмотрена задача синтеза управлений, которые реализуют заданную совокупность программных движений
и обеспечивают их асимптотическую устойчивость по Ляпунову.
Допустим, что движение объекта управления описывается линейной системой
ẋ = Px + Qu + f (t),
(1)
где x ∈ Rn – вектор фазового состояния; u ∈ Rr – вектор управлений; P и Q – постоянные, вещественные матрицы соответствующих размерностей; f (t) – вещественная,
непрерывная вектор-функция, заданная при t ∈ [0, +∞).
Задача 1 [4] (многопрограммная стабилизация). Требуется построить управление
u = u(x, t),
(2)
которое реализует заданные программные движения xj = xj (t) при программных
управлениях uj = uj (t), j = 1, N . Кроме того, необходимо, чтобы программные движения xj (t) при управлении (2) были асимптотически устойчивы по Ляпунову.
Александров Михаил Александрович – аспирант кафедры моделирования экономических систем факультета прикладной математики–процессов управления Санкт-Петербургского государственного университета. Научный руководитель: доктор физико-математических наук, проф. Н. В. Смирнов. Количество опубликованных работ: 2. Научное направление: математическая теория управления. E-mail:
tenebrarum118@gmail.com.
Смирнов Николай Васильевич – доктор физико-математических наук, профессор кафедры моделирования экономических систем факультета прикладной математики–процессов управления СанктПетербургского государственного университета. Количество опубликованных работ: 81. Научные направления: теория устойчивости, математическая теория управления, управление макроэкономическими системами. E-mail: nvs v@mail.ru.
c М. А. Александров, Н. В. Смирнов, 2011
81
Конструктивное решение задачи 1 предлагает
Теорема 1 [4]. Пусть выполнены следующие условия: 1) система ẋ = Px + Qu
при u = Cx может иметь сколь угодно большой запас устойчивости, получающийся
путем выбора постоянной матрицы C; 2) программные движения xj (t) различимы
при t t0 0, иначе говоря, inf t0 xi − xj > 0, i = j. Тогда существует управление (2), реализующее программные движения xj (t), при этом каждое из них будет
асимптотически устойчиво по Ляпунову.
В общем случае число N не связано с размерностью системы (1) и размерностью
пространства управлений. Управление (2) имеет следующее представление:
u(x, t) =
N N
(xj − xi )(x − xj )
uj + C(x − xj ) − 2uj
pj (x, t),
(xj − xi )2
j=1
(3)
i=1,i=j
где
pj (x, t) =
N
9
i=1,i=j
(x − xi )2
,
(xj − xi )2
j = 1, N.
(4)
Функция (3) – это интерполяционный полином Эрмита, в котором узловые точки –
программные движения xj (t), а значения – программные управления uj (t). По построению управление (3), (4) обладает такими очевидными свойствами: pj (xj , t) ≡ 1;
pj (xi , t) ≡ 0, i = j; u(xj (t), t) = uj (t), j = 1, N . Выражения вида (xj − xi )(x − xj ),
(xj − xi )2 представляют собой скалярные произведения соответствующих векторов.
В формулах (3), (4) и далее по тексту, где это не мешает пониманию сути, не будем
указывать аргумент t у векторных функций xi , xj , uj , . . . . Кроме того, зависимость
функций pj (x, t) от времени является неявной, лишь через xi (t), xj (t), поэтому имеет
смысл обозначение pj (x) в левой части (4).
Система (1), замкнутая управлением (3), (4), представляет собой многопрограммный автомат, способный реализовать произвольное программное движение xj (t) из заданного семейства и обеспечить его асимптотическую устойчивость. В [5] задача 1 была
рассмотрена для билинейных систем, а в [6, 7] – для линейных и билинейных систем
в случае неполной обратной связи. В них предложены алгоритмы построения непрерывных идентификаторов полного порядка и Люенбергера [8], позволяющих, в конечном
− xj .
итоге, заменить векторы отклонений x − xj в (3) на их оценки x
Практическая реализация управления (3), (4) в конкретной прикладной задаче требует непрерывного получения информации о векторах отклонений yj (t) = x(t) − xj (t)
для всех программных движений xj (t). Эта проблема отпадает, если построить дискретный регулятор вместо непрерывного.
Отметим, что при решении задачи 1 векторы отклонения от программных режимов
x − xj считались доступными для измерения. Изменим постановку задачи. Предположим, что задано уравнение измерительного прибора
zj (t) = Ryj (t),
j = 1, N,
(5)
где zj (t) ∈ Rm – вектор измерений; R – постоянная, вещественная (m × n)-матрица.
Уравнение (5) называют уравнением выхода [9], а вектор zj (t) – выходом системы. Зная
j (t) вектора yj (t), чтобы она обладала
выход zj (t), требуется построить такую оценку y
свойством [9]
j (t) → 0, t → +∞.
yj (t) − y
(6)
82
Если такая оценка существует, то ее можно было бы использовать для синтеза управления, аналогичного управлению (3), (4). В этом и состоит задача многопрограммной
стабилизации линейной системы (1) в случае неполной обратной связи.
Определение 1. Многопрограммным управлением с неполной обратной связью
будем называть управление вида (3), (4), в котором вектор фазового состояния x(t),
(t), понедоступный для прямого измерения, заменяется соответствующей оценкой x
строенной с применением асимптотического идентификатора.
Многопрограммное управление с неполной обратной связью построим в виде [6]
u(
x, t) =
N N
(xj − xi )(
x − xj )
x − xj ) − 2uj
x),
uj + C(
pj (
(xj − xi )2
j=1
(7)
i=1,i=j
x) =
pj (
N
9
i=1,i=j
(
x − xi )2
,
(xj − xi )2
j = 1, N.
(8)
Замкнем систему (1) управлением (7), (8) и рассмотрим некоторое ее программное движение xk (t) из данного семейства. Здесь и в дальнейшем индексом k будем
обозначать некоторое конкретное движение семейства, относительно которого ведутk (t) = x
(t) − xk (t), построим систему
ся рассуждения. Полагая yk (t) = x(t) − xk (t), y
в отклонениях
yk + Hk (
yk ).
ẏk = Pyk + QC
(9)
Здесь
N
Hk (
yk ) = Q C
yk − 2uk
i=1,i=k
(xk − xi )
yk
(xk − xi )2
N
+ Quk hk (
yk ) + Q
N
2
i=1,i=k
(xk − xi )
yk
+
h
(
y
)
+
k
k
(xk − xi )2
yk + xk − xj ) −
uj + C(
j=1,j=k
− 2uj
N
(xj − xi )(
yk + xk − xj )
yk + xk ),
pj (
(xj − xi )2
(10)
i=1,i=j
k не меньше
hk (
yk ) – скалярная функция, порядок которой по компонентам вектора y
двух.
По построению нелинейную систему (9) можно рассматривать как систему, замкнуyk . В этом случае ее можно записать в форме
тую управлением вида vk = C
ẏk = Pyk + Qvk + Hk (
yk , vk ).
(11)
Идентификатор состояния для системы (11) предлагается строить в таком виде:
˙ k = P
y
yk + Qvk + L(zk − R
yk ) + Hk (
yk , vk ),
(12)
где L – (n × m)-матрица параметров идентификатора, подлежащая определению. Слагаемое L(zk − R
yk ) в правой части (12) учитывает качество оценки состояния. Поk ), то в идеальной ситуации при y
k ≡ yk
yk = R(yk − y
скольку с учетом (5) zk − R
система (12) с точностью до обозначений совпадает с исходной системой (11).
Перед формулировкой задачи введем еще несколько понятий.
83
Определение 2. Управление vk будем называть допустимым дискретным управлением, если оно имеет вид кусочно-постоянной векторной функции
yk (sh),
vk = C
t ∈ [sh, (s + 1)h[ ,
s = 0, 1, . . . ,
(13)
k (0) = y
k0 – вектор начальных данных для идентификатогде h – шаг дискретности; y
ра (12).
Определение 3. Идентификатор (12), замкнутый дискретным управлением (13),
будем называть гибридным идентификатором полного порядка.
Идентификатор полного порядка позволяет оценить весь вектор yk в отличие
от идентификатора Люенбергера [8, 9].
Определение 4. Гибридным многопрограммным управлением будем называть управление вида (3), (4), в котором только первые слагаемые uj (t), отвечающие за реализацию программных движений xj (t), являются известными непрерывными и ограниченными функциями времени, а все остальные слагаемые и сомножители, отвечающие
за стабилизацию программных движений, вычисляются в дискретные моменты времени t = sh, s = 0, 1, . . . .
Задача 2 (многопрограммная стабилизация при неполной обратной связи с применением гибридного идентификатора). Выяснить, при каких коэффициентах усиления
в виде матриц C, L и при каком выборе шага h существуют гибридный идентификатор
полного порядка и допустимое дискретное управление (13), обеспечивающие асимптотическую устойчивость нулевому решению системы (11).
Решение этой задачи позволит указать алгоритм построения гибридного многопрограммного управления с неполной обратной связью, что и является конечной целью
данной работы. В заключение п. 1 отметим, что задача синтеза гибридного идентификатора с целью обеспечения технической устойчивости многопрограммного регулятора
рассматривалась в [10].
2. Синтез многопрограммного регулятора на основе асимптотически устойчивого гибридного идентификатора состояния системы. Перейдем к решению поставленной задачи. Прежде всего построим непрерывное стабилизирующее
управление в системе (11), (12). Для этого рассмотрим (11), (12) как одну систему, учитывая уравнение измерителя (5) и вид допустимого непрерывного управления
yk :
vk = C
%
yk + Hk (
yk , C
yk ),
ẏk = Pyk + QC
(14)
˙ = P
k ) + Hk (
y
yk + QC
yk + LR(yk − y
yk , C
yk ).
k
В системе (14) сделаем неособую замену переменных:
%
yk (t) = yk (t),
k (t).
yk (t) = yk (t) − y
(15)
Переменная yk (t) отражает качество оценки состояния и может быть использована
для анализа ее асимптотики (6). В новых переменных система (14) примет вид
ẏk
P + QC
−QC
yk
Hk (yk − yk , C(yk − yk ))
=
+
.
(16)
yk
O
P − LR
O
ẏk
Система (16) состоит из двух подсистем. Первая представляет собой систему (11),
yk , выраженным через новые переменные (15), а втозамкнутую управлением vk = C
рая, по yk , описывает качество оценки отклонения yk по измерениям (5). В результате
84
задача сводится к выбору матриц C и L таким образом, чтобы нулевое решение системы
(16) было асимптотически устойчиво по Ляпунову.
Перейдем к формулировке основного результата.
Теорема 2. Пусть выполнены условия теоремы 1 и существуют матрицы C и L,
при которых система линейного приближения в (16) асимптотически устойчива
по Ляпунову. Тогда существует гибридное многопрограммное управление, построенное с применением гибридного идентификатора (12), (13), которое реализует заданные программные движения xj (t), j = 1, N , и обеспечивает их асимптотическую
устойчивость.
Д о к а з а т е л ь с т в о. Условия теоремы означают, что существуют непрерывное
yk для системы (14) и построенное на его основе
стабилизирующее управление vk = C
непрерывное многопрограммное управление с неполной обратной связью (7), (8), где
k – выход идентификатора (12).
=y
k + xk , а y
x
Рассмотрим теперь дискретное управление (13) с той же матрицей C и соответствующее гибридное многопрограммное управление
u(
x(sh), t) =
N
j=1
uj (t) + C(
x(sh) − xj (sh)) −
$
N
(xj (sh) − xi (sh))(
x(sh) − xj (sh))
− 2uj (t)
x(sh)),
pj (
(xj (sh) − xi (sh))2
(17)
i=1,i=j
где
pj (
x(sh)) =
N
9
i=1,i=j
(
x(sh) − xi (sh))2
.
(xj (sh) − xi (sh))2
(18)
Построим оценки отклонений решений замкнутой системы (1), (17), (18) от программных движений xj (t). Повторяя для нее вывод системы в отклонениях (11), получим
ẏk = Pyk + QC
yk (sh) + Hk (
yk (sh), C
yk (sh)).
(19)
Соответствующий гибридный идентификатор имеет вид
˙ k = P
y
yk + QC
yk (sh) + L(zk − R
yk ) + Hk (
yk (sh), C
yk (sh)).
(20)
Объединим (19), (20) в одну систему, учитывая уравнение измерителя (5), и выполним замену переменных (15):
ẏk
ẏk
=
P
O
O
P − LR
Введем обозначения
yk
k =
y
,
yk
yk
yk
QC −QC
yk (sh)
+
yk (sh)
O
O
Hk yk (sh) − yk (sh), C(yk (sh) − yk (sh))
+
. (21)
O
+
=
P
P
O
,
O P − LR
=
Q
QC −QC
.
O
O
85
Тогда система (21) примет вид
yk + Q
yk (sh) + Gk (
˙ k = P
y
yk (sh)),
(22)
где Gk (
yk (sh)) – обозначение вектора нелинейности в (21).
yk (sh)) состоит
нелинейных слаВектор Gk (
из двух блоков, построенных на основе
гаемых в (21). Функция Hk yk (sh) − yk (sh), C(yk (sh) − yk (sh)) имеет вид полинома
(см. (10)), максимальная степень которого конечна и зависит только от параметра N ,
а порядок по компонентам векторов yk (sh), yk (sh) не меньше второго. Следовательно,
k (sh) справедлива оценка
при достаточно малых по норме отклонениях y
Gk (
yk (sh)) a
yk (sh)b ,
(23)
где b 2; a – положительная константа, зависящая от норм матриц Q, C и функций
uj , xj .
k (t) − y
k (sh) при t ∈ [sh, (s + 1)h] в системе (22). Применяя
Оценим норму разности y
формулу Коши, запишем
k (t) − y
k (sh) =
y
e
P(t−sh)
−E+
t−sh
e
P(t−sh−τ
)
0
$
k (sh) +
dτ Q y
+
0
t−sh
eP(t−sh−τ ) dτ Gk (
yk (sh)).
Используя (23) и очевидные вспомогательные оценки
t−sh
eP(t−sh−τ ) dτ hePh ,
eP(t−sh) − E ePh − 1, 0
справедливые при t ∈ [sh, (s + 1)h], получим
k (sh) m(h, y
k (sh))
yk (t) − y
yk (sh),
(24)
+ ahePh
k (sh)) = ePh − 1 + hePh Q
m(h, y
yk (sh)b−1 .
k (sh)) > 0
Для любого допустимого дискретного управления (13) функция m(h, y
k (sh)) → 0 при h → 0 и yk (sh) ω, s = 0, 1 . . . ,
при h > 0 и обладает свойством m(h, y
где ω – некоторая положительная постоянная.
k (sh) m(h, y
k (sh))
k (t)+ y
k (t), то при достаточно
Поскольку yk (t)− y
yk (sh)− y
k (sh)) < 1, имеет место окончательная оценка
малом h, когда m(h, y
k (sh) yk (t) − y
k (sh))
m(h, y
yk (t).
k (sh))
1 − m(h, y
(25)
Запишем систему (22) в эквивалентной форме
+ Q)
yk + Q(
yk (sh) − y
˙ k = (P
k ) + Gk (
y
yk (sh)).
Рассмотрим систему
86
+ Q)
yk ,
˙ k = (P
y
(26)
(27)
которая совпадает с системой линейного приближения в (16). По условию теоремы
существуют матрицы C и L, при которых (27) асимптотически устойчива. Тогда суkT V
ществует квадратичная форма v(
yk ) = y
yk такая, что dv(
yk )/dt|(27) = −
yk 2 .
Матрицу V квадратичной формы v(
yk ) можно найти, решая матричное уравнение
Ляпунова.
Продифференцируем теперь v(
yk ), в силу системы (26):
dv(
yk ) 2
yk (sh) − y
k ) + grad v(
yk + grad v(
yk ), Q(
yk ), Gk (
yk (sh)) . (28)
= − dt (26)
Для оценки сверху модуля второго слагаемого в (28) используем (25) и неравенство
Коши–Буняковского
yk (sh) − y
grad v(
k ) A1
yk ), Q(
k (sh))
m(h, y
yk (t)2 ,
k (sh))
1 − m(h, y
(29)
где A1 = 2VQ.
Построим аналогичную оценку для третьего слагаемого в (28), применяя неравенство Коши–Буняковского и (23):
grad v(
yk ), Gk (
yk (sh)) A2 yk yk (sh)b , A2 = 2aV.
Поскольку
yk (sh)−
yk +
yk yk (sh)
yk (sh) = b
b−1
1+
k (sh))
m(h, y
k (sh))
1 − m(h, y
yk (sh)b−1 ,
yk то окончательно получим
grad v(
yk (sh)) A2 1 +
yk ), Gk (
k (sh))
m(h, y
k (sh))
1 − m(h, y
yk 2 .
yk (sh)b−1 (30)
Объединяя оценки (29), (30), найдем
dv(
yk ) 2
yk − dt (26)
1 − A1
k (sh))
m(h, y
−
k (sh))
1 − m(h, y
$
k (sh))
m(h, y
− A2 1 +
yk (sh)b−1 . (31)
k (sh))
1 − m(h, y
Для доказательства асимптотической устойчивости нулевого решения системы (26)
приведем несколько вспомогательных оценок.
k (sh)), существуют положительные числа
В силу основного свойства функции m(h, y
Δ и h0 такие, что при h ∈ (0, h0 ), yk (sh) < Δ выполнено
k (sh)) m(h, y
1
,
2
k (sh))
k (sh))
m(h, y
1
m(h, y
A1
+ A2 1 +
yk (sh)b−1 .
k (sh))
k (sh))
1 − m(h, y
1 − m(h, y
2
(32)
(33)
87
Пусть для некоторого s0 0 и δ < Δ выполнено yk (s0 h) < δ, тогда, в силу (24),
(32), справедлива оценка
1
k (s0 h) δ + δ < 2δ.
yk ((s0 + 1)h) yk (s0 h) + yk ((s0 + 1)h) − y
2
Будем считать, что 2δ < Δ. В этом случае имеем
1
k ((s0 + 1)h) 2δ + 2δ < 4δ.
yk ((s0 + 2)h) yk ((s0 + 1)h) + yk ((s0 + 2)h) − y
2
Пусть теперь 2 δ < Δ, тогда аналогичные рассуждения позволяют получить оценку
yk ((s0 + )h) 2 δ.
(34)
Далее, в силу оценки (31) и неравенства (33), имеем
dv(
yk (t))
1
2
− yk (t) .
dt
2
(35)
Вместе с тем положительно-определенная квадратичная форма удовлетворяет неравенствам
yk 2 v(
yk ) a2 yk 2 ,
(36)
a1 где a1 > 0, a2 > 0. Из (35), (36) следует
1
dv(
yk (t))
−
v(
yk (t)).
dt
2a2
(37)
Оценки (34), (37) позволяют сделать вывод о том, что на решениях системы (26), удовлетворяющих условию yk (s0 h) < δ, выполнены неравенства
1
v(
yk (s0 + )h) v(
yk (s0 h))e− 2a2 h .
(38)
Далее, в силу (35), (36) и (38), имеем
:
yk ((s0 + )h) a2
− h
yk (s0 h)e 4a2 .
a1
Пусть число l выбрано так, чтобы было справедливо соотношение
:
h
a2 − 4a
e 2 < 1.
a1
Тогда имеют место оценки
yk ((s0 + )h) < δ.
Получаем, что решения системы (26), начинающиеся в области y < δ, при возрастании времени остаются в области y < Δ. Значит, для таких решений при всех
t ∈ [t0 , +∞) выполняются неравенства (35) и (37). Cледовательно, нулевое решение
системы (26) асимптотически устойчиво. Теорема доказана.
3. Заключение. В работе предложен метод построения гибридного многопрограммного управления с неполной обратной связью. Реализация данного класса управлений возможна при наличии соответствующего идентификатора. С этой целью доказана теорема о достаточных условиях существования асимптотически устойчивого
88
гибридного идентификатора. Доказательство теоремы конструктивно. Оно основано
на втором методе Ляпунова и содержит алгоритм построения указанного идентификатора. Таким образом, изложен конструктивный метод синтеза многопрограммных
гибридных управлений для класса линейных систем, обеспечивающий заранее прогнозируемую точность и асимптотическую устойчивость по Ляпунову программных движений из наперед заданного семейства.
Литература
1. Зубов В. И. Лекции по теории управления. М.: Наука, 1975. 496 с.
2. Зубов В. И. Математические методы исследования систем автоматического регулирования. Изд.
2-е, перераб. и доп. Л.: Машиностроение, 1974. 336 с.
3. Зубов В. И. Интерполяция систем дифференциальных уравнений // Докл. АН СССР. 1991.
Т. 318, № 1. С. 28–31.
4. Зубов В. И. Синтез многопрограммных устойчивых управлений // Докл. АН СССР. 1991. Т. 318,
№ 2. С. 274–277.
5. Смирнов Н. В., Смирнова Т. Е. Синтез многопрограммных управлений в билинейных системах // Прикл. математика и механика. 2000. Т. 64, № 6. С. 929–932.
6. Смирнов Н. В. Многопрограммная стабилизация линейных и билинейных систем в случае неполной обратной связи // Изв. РАН. Теория и системы управления. 2001. № 3. С. 40–44.
7. Smirnov N. V. Synthesis of multiprogrammed stable controls using the Luenberger observer // Proc.
of 11th IFAC Workshop: Control Appl. Optim. 2000. Vol. 1. P. 327–330.
8. Luenberger D. G. Observers for multivariable systems // IEEE Trans. Automat. Control. 1966.
Vol. AC–11, N 2. P. 190–197.
9. Андреев Ю. Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 424 с.
10. Смирнов Н. В. Синтез гибридного идентификатора полного порядка в задаче многопрограммной стабилизации // Автоматика и телемеханика. 2006. № 7. С. 41–52.
Статья рекомендована к печати проф. А. П. Жабко.
Статья принята к печати 16 декабря 2010 г.
Скачать