МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ) (МАИ) Кафедра № 703 УДК 621.391.268: 62 - 50 Дисциплина МЕТОДЫ СТОХАСТИЧЕСКОГО УПРАВЛЕНИЯ АВИАЦИОННЫХ КОМПЛЕКСОВ И СИСТЕМ ЧАСТЬ 3 по РПД Курс лекций (3 курс, 6 семестр) Лектор Колосовская Т.П. Москва 2018 1 ЛЕКЦИЯ № 17 Для эргодических случайных процессов можно заменить среднее по числу наблюдений усреднением по времени. При этом математическое ожидание и дисперсия могут быть выражены через пределы: mx (t ) lim T 1 T T 2 x(t )dt ; T 2 ∫ Рассмотрим усредненные значения сигнальных произведений для алгоритма оценки (3)(IIa ) : ̂ ∫ ̂ ̂ ∫ ̂ ̂ ̂ При будем полагать, что предел интегрирования (время наблюдения Т) много больше интервала корреляции сигнала кор кор где корреляционная функция, ∫ дисперсия процесса. B( ) 𝐵 𝜎𝜏 kop Проведем замену пределов интегрирования. Замена нижнего предела ничего существенно не изменит в выражении, т.к. все реальные временные процессы 2 начинаются с нуля. Замена верхнего предела предел , т.к. при кор для процесса будет оставаться стремящимся к бесконечности. В этом случае воспользуемся выражением статистического усреднения по времени через предел 1 = lim T T T 2 1 T ...dt T 2 T 2 dt . T 2 Тогда усредненные значения сигнальных произведений будут определяться ^ ^ ^ ^ ̂ ( ) T S ( x , t ) S ( x , t ) S ( x , t ) ( t ) S ( x , t ) S ( x , t ) ^ (TB(x)) 0 ^ x x где последнее слагаемое равно нулю, т.к. в силу свойств сингулярных процессов производная корреляционной функции в нуле равна нулю . ̂ = В задаче оценивания временной задержки, где параметр есть временной ) (временной параметр), мы получали аналогичное выражение параметр ^ S (t ) S (t ) ^ B( ) , или с учетом интервала наблюдения: ̂ ( ). Таким образом, не учитывая предположение о неэнергетичности параметров в алгоритме (3)(IIа ) , мы определили систему таким же образом, что и при оценивании временной задержки, с дискриминационной характеристикой, определяющей решающую или целевую функцию системы, пропорциональной производной ВКФ между текущим ^ принятым значением полезного сигнала и его эталонным значением S ( x, t ) (в оценочном значении параметра). 3.3.8. Анализ скалярных уравнений Риккати для дисперсий ошибок оценок Рассмотрим усредненные значения сигнальных произведений для вторых моментов апостериорной плотности вероятности алгоритма (4)(IIб ) 〈 ̂ ̂ 〉 〈 ̂ ̂ 〉 〈 ̂ ̂ 〉 ( ̂ ) Известно, что усредненные значения произведения второй производной сигнала в оценочном значении на сам сигнал или процесс равны взятой с обратным знаком второй производной ВКФ. При рассмотрении уравнений Риккати для дисперсий в форме Стратоновича (4)(IIa ) с учетом ряда преобразований можно получить аналогичные результаты. 3 В уравнении для дисперсии ошибок оценивания фильтра Калмана 4 I не содержится слагаемого с множителем, пропорциональным произведению второй производной сигнала на сам процесс или сигнал, а содержится квадрат первой производной сигнала по оценке. ^ При малых ошибках оценок x(t ) x(t ) x(t ) можно с определенной точностью приравнять усредненные значения квадрата первой производной по оценке и среднее значение произведения второй производной сигнала по оценке на сам сигнал или процесс: ̂ ̂ 〈 * + 〉 〈 ̂ 〉 ̂ ( ̂ ) То есть в достаточном приближении, а иногда и в грубом приближении, алгоритмы Калмана и Стратоновича можно считать совпадающими при малых ошибках оценивания x (t ) . Это можно показать, разложив первую производную B`(x(t )) и вторую производную ВКФ B``(x(t )) в ряд Тейлора в окрестности нуля и учесть свойства сингулярных процессов: ̂ ̂ Замечание. Предположение о малости ошибок оценивания при решении задач фильтрации является некорректным, т.к. при нормальном гауссовском распределении апостериорной плотности вероятности ошибки могут быть большими (Рис.3.3.8(a)). Однако, при больших ошибках линеаризация в виде разложения в ряд Тейлора несправедлива (для систем с детерминированной структурой). Изобразим графически эволюцию плотности вероятности и ее второго момента (дисперсии) (Рис.3.3.8). 4 x2 (t ) ps ( x, t ) x2 (t ) 𝜎𝑥 𝑡 𝑎 𝜎𝑥 𝑡 𝑏 𝜎𝑥 𝑡 𝑐 𝜎𝑥 𝑡 t 𝜎𝑥 𝑡 𝑥 𝑡 t t' 𝑥 𝜎𝑥 𝑡 𝑡 𝑥 𝑡 Рис.3.3.8. ЛЕКЦИЯ № 18 3.3.9. Алгоритм экстраполяции Когда полезный сигнал , несущий информацию об оцениваемом процессе , из суммарного текущего сигнала не поступает в систему, и система продолжает вырабатывать оценку процесса параметра с некоторой степенью достоверности, могут быть использованы следующие уравнения экстраполяции справедливые для всех приведенных выше алгоритмов нелинейной фильтрации (в форме Калмана и в форме Стратоновича). Дифференциальное уравнение оценки экстраполяции марковского процесса имеет вид: ̂̇ э ̂ э ̂( ф ) ̂ф где начальными условиями является оценка на момент окончания фильтрации ̂( ф ), ф . Дифференциальное уравнение оценки экстраполяции марковского процесса с учетом управления имеет вид: 5 ̂̇ ̂ э (̂ э э ) ̂( ф ) ̂ф Замечание. В уравнении оценки экстраполяции правая сигнальная часть отсутствует. Дифференциальное уравнение дисперсии ошибок оценки экстраполяции (частный случай скалярного уравнения Риккати): ̇ ̂ э э ( ф) э где начальными условиями является дисперсия ошибок оценки на момент окончания фильтрации ( ф ), ф . Дифференциальное уравнение экстраполяции для модели состояния ̇ ф э э ̂ э Риккати для дисперсии ошибок оценки ( ф) э Решение задачи экстраполяции осуществляется на интервале экстраполяции ф э. Определение: Экстраполяция есть процесс определения будущих значений оцениваемого процесса по известным прошлым значениями процесса. (В данном случае известны статистические характеристики процесса на момент окончания фильтрации ф : ̂( ф ) ( ф ), которые являются начальными условиями для загрузки экстраполятора). Допустим, в какой-то момент времени полезный сигнал, несущий информацию об оцениваемом процесс-параметре, в силу естественных или искусственных помех не поступает в систему. В этом случае наша система субоптимального (в силу нелинейностей) типа продолжает выдавать оценку ̂ э параметра-процесса с э некоторой степенью достоверности, т.е. экстраполирует значение процесса-параметра. Достоверность экстраполяции определяется интервалом корреляции сигнала, и прошлой оценкой процесса-параметра, а именно ее точностью. Эволюция дисперсий оценок фильтрации и экстраполяции представлена на Рис. 3.3.9. 6 𝜎э 𝑡 𝜎ф 𝑡 𝜎э 𝑡 𝜎э1 𝑡 э2 𝜎ф 𝑡 t 𝑄 t* - время достоверной экстраполяции. t t' э2 - отклонение точности экстраполяции от точности фильтрации. Рис.3.3.9. В практических задачах экстраполирующее свойство оптимальных (линейных) и субоптимальных (нелинейных) фильтров используется, когда степень достоверности выделения полезного сигнала (ТИ) от объекта, цели или ориентира, падает ниже допустимой (для систем с детерминированной структурой). Допустимая степень достоверности задается обычно тактико-техническими требованиями (ТТТ) на систему или датчик поля и определяется типом помехи и видом средств поражения. Например, чем больше мощность БЧ, тем с меньшей степенью достоверности можно согласиться для достижения заданной эффективности. Оптимальные и субоптимальные фильтры-экстраполяторы широко применяются при решении задач обработки информации в системах навигации, наведения, противоспутниковых системах, робототехнических системах (в том числе работающих в химически-активных или радиоактивных средах. Часто используются упрощенные модели фильтров как с меньшей размерностью вектора состояния, так и с точки зрения самих методов решения задач фильтрации (особенно на этапе проектирования). При этом многие коэффициенты и параметры считаются постоянными величинами, в том числе вместо дифференциальных уравнений Риккати для дисперсии решаются скалярные алгебраические уравнения: ̇ ̂ с ̂ ̂ (в векторном случае – система алгебраических уравнений). 7 ЛЕКЦИЯ № 19 3.4. Векторные алгоритмы нелинейной фильтрации и экстраполяции временных сигналов 3.4.1. Постановка задачи нелинейной фильтрации для векторных моделей состояния и наблюдения Модель состояния СДС Пусть динамика вектора фазовых координат представляет собой эволюцию марковского процесса ‖ где . ‖ , описываемую СДУ типа I(1) вектор фазовых координат, векторный марковский процесс размерности ̇ случайный вектор начальных условий или начального состояния. Если модель состояния содержит детерминированную функцию управления (которая во многих случаях является функцией оценки компонент вектора состояния процесса ̂ ), то СДУ нелинейной модели с управлением имеет вид ̇ (̂ ) I*(1)-нелинейная модель состояния, где координат состояния СДС и времени: (̂ ) – детерминированная вектор-функция f1 ( x1 ,..., xn , t ) F ( x, t ) f 2 ( x1 ,..., xn , t ) . Замечание. Необязательно каждая из компонент вектор... f n ( x1 ,..., xn , t ) ̅̅̅̅̅ зависит от всех компонент вектора состояния функции . W(t) - векторный процесс типа векторного БГШ возмущения состояния системы, размерности [ . Необязательно его компоненты присутствуют во всех уравнениях состояния I (1) , I *(1) . матрица усиления (или изменения) шумов возмущения состояния системы размерности [ ‖ Векторный БГШ нулевым вектором математического ожидания интенсивностей [ 8 . ‖ векторный случайный процесс с и с диагональной матрицей 1 ‖ ‖ ‖ . ‖ Замечание. Необязательно матрица интенсивности белых шумов возмущения состояния системы диагональная. Возможны взаимные интенсивности составляющих компонентов вектора шумов , стоящие вне диагонали . Вектор функция во многих задачах представляет собой кинематические соотношения динамики объекта. Модель наблюдения – нелинейная, представляет собой аддитивную смесь полезных сигналов и шумов и описывается векторным уравнением: где m n вектор-функция сигналов датчиков полей различной - физической природы, несущая информацию об оцениваемых процессах виде нелинейных зависимостей: ̅̅̅̅̅ в S1 ( x1 ,..., xn , t ) S ( x, t ) S2 ( x1 ,..., xn , t ) ... Sm ( x1 ,..., xn , t ) . Замечание: необязательно все компоненты вектор-функции сигналов наблюдения ̅̅̅̅̅̅) зависят от всех компонент вектора состояния ̅̅̅̅̅ . ( Тем самым предполагается возможность неполной наблюдаемости вектора фазовых координат. ‖ ‖ , векторный случайный процесс типа БГШ представляющий собой помехи или ошибки измеренной модели наблюдений с матрицей интенсивностей или спектральной плотности размерности , которая, в частности, является диагональной: 1 ‖ ‖ ‖ . ‖ Необходимо решить задачу фильтрации в гауссовском приближении АПВ, определив оценку вектора состояния ̂ и ковариационную матрицу ошибок оценивания . 9 3.4.2. Задача комплексного наблюдения Размерность вектора состояния ( ) определяется числом фазовых координат, подлежащих оцениванию в процессе наблюдения, в том числе параметров и различных характеристик объектов (геометрические размеры, форма, тепловые характеристики, магнитометрические и др.). Размерность вектора сигналов наблюдений определяется числом каналов наблюдения за объектом. Под каналами наблюдения понимают число датчиков сигналов различной физической природы, используемых для осуществления наблюдения (слежения) за объектом. Определение: Одновременное использование датчиков полей различной физической природы для осуществления наблюдения за объектом или ориентиром называется комплексным наблюдением, а системы наблюдения – комплексными системами наблюдения. В частности, такие системы бывают корреляционноэкстремальными, в которых реализуется принцип корреляционно-экстремальной обработки. Примером комплексного наблюдения за объектом является одновременное использование: - РЛС с фазированной антенной решеткой (ФАР) (содержащей до 200 500 приемно-передающих модулей с лучом в диапазоне от 20 70, имеющих возможность сопровождать до 200 500 различных целей); - датчиков оптико-электронных систем (включая датчики ИК-диапазона); магнитометрических систем, позволяющих определять магнитный курс ЛА и корректировать инерциальные навигационные системы (ИНС) при полете над акваториями и участками суши с малоинформативным рельефом. Задача комплексного наблюдения - получить наилучшую, с точки зрения выбранного критерия оптимальности, оценку вектора фазовых координат на основе ̅̅̅̅̅̅ . наблюдений с учетом действующих в каждом канале шумов Отличительной и замечательной особенностью линейной и нелинейной фильтрации является возможность в результате оценивания получать оценки, не только наблюдаемых компонент векторов фазовых координат (вектора состояния), но и восстанавливать на основе наблюдений в течение определенного времени ненаблюдаемые компоненты вектора фазовых координат, на основе сигналов наблюдений с учетом действующих в каждом канале шумов, т.е. их интенсивности и др. характеристик, что возможно при выполнении достаточных условий точного оценивания в случае нелинейного сигнала (см. дальнейшие лекции). 10 ЛЕКЦИЯ № 20 3.4.3 Векторные алгоритмы нелинейной фильтрации в гауссовском приближении АПВ в форме Стратоновича (Фоккера-Планка-Колмогорова-Стратоновича в общем виде В основе решения задачи синтеза данных алгоритмов лежит дифференциальное уравнение для эволюции АПВ рs ( X , t ) для векторного процесса (в частности, марковского векторного процесса) (3) рs ( X , t ) t 1 div K1 ( x, t ) рs ( X , t ) T K 2 ( x, t )``рs ( X , t ) Фс ( X , t ) Фc ( X , t ) рs ( X , t ) 2 (3) где 0 ( x0 , t0 ) - начальная плотность вероятности распределения начального состояния, дивергенция, 3.4.4 след матрицы. Понятие дивергенции применительно к плотности вероятности. Рассмотрим точку в n-мерном пространстве, где задан случайный процесс. Окружим эту точку замкнутой поверхностью ( x ) с достаточно малым объемом V ( x) , внутри нее (Рис. 3.4.11). Количество вероятности, выходящие из малого объема V ( x) через поверхность ( x ) за малое время t вычисляется по формуле (А): ∬ где единичный вектор внешней нормали к поверхности скалярное произведение вектора внешней нормали и вектора 11 , в скобках стоит . Вектор в частном случае является вектором плотности потока вероятности : для частного случая, когда в модели состояния отсутствуют возмущающие процессы типа БГШ (( w(t ) 0 ), а следовательно, 𝐾 𝑋 𝑡 ω𝑝𝑠 𝑋 𝑡 𝐾 𝑋 𝑡 ω𝑝𝑠 𝑋 𝑡 n0 ΔV 𝑥 𝑋 𝑡 Δ𝑡 𝐾 𝑋 𝑡 ω𝑝𝑠 𝑋 𝑡 𝐾 𝑋 𝑡 ω𝑝𝑠 𝑋 𝑡 𝑋 𝑥 𝑥 𝑥 𝑥𝑛 𝑡 ΔΣ 𝑥 Рис.3.4.11. Поток вероятности из объема V ( x) через поверхность приводит к изменению вероятности в объеме за малое время t . Это изменение определяется следующим образом выражением (В): [ ] Примечание: Функция плотности вероятности деформируется и смещается в пространстве и изменяется во времени. Однако, общее количество вероятности при отсутствии ее стоков и источников остается неизменным во всей области существования случайного процесса ∫ Это можно интерпретировать, как закон сохранения вероятности, а уравнение ФП-К-С (3) – как уравнение непрерывности. (Аналогичное уравнению в физике, при отсутствии двух последних слагаемых, описывает закон сохранения массы (например, для потока жидкости)). Приравняем выражения (A) и (B) и перейдем к пределу при t 0 и V 0 , разделив [ на V , а изменение вероятности в объеме ∬ ] на t : 12 ∬ [ ] Очевидно, что правый предел есть производная АПВ рs ( X , t ) t , а левый – дивергенция (уравнение (4) div( K1 ( x, t ) рs ( x, t )) =), т.е. [ ] рs ( X , t ) t ∬ [ ] Тогда будем иметь дифференциальное уравнение (4) для частного случая эволюции АПВ [ Так как ] меняется, то дивергенция представляет собой скалярное поле, а выражение в числителе ∬ интеграл скалярный поверхностный есть скалярный поток векторного поля через замкнутую поверхность ( x ) . Таким образом, получено дифференциальное уравнение для АПВ распределения марковского процесса для частного случая, когда в модели состояния I (1) отсутствуют шумы возмущения системы , следовательно, отсутствует второе слагаемое в уравнении (3) и отсутствует полезный сигнал наблюдения II (2) , т.е. отсутствует информационная функция Стратоновича в (3), представляющая третье слагаемое. Примечание: Данные уравнения Ф-П-К-С (3) и (4) справедливы для любых случайных процессов, необязательно марковских. 3.4.5. Вектор сноса (вектор локальной скорости), матрица диффузии (матрица диффузионной скорости), вектор плотности потока вероятности По определению, коэффициент сноса выражается через предел как: коэффициент сноса, характеризующий условное математическое ожидание или среднее локальной скорости приращения -ой компоненты непрерывного векторного марковского процесса при его смещении из данной точки за малое время t , и являющийся -ой составляющей вектора сноса (вектора локальной скорости) . Коэффициент диффузии выражается через предел как: 13 xi (t t ) xi x j (t t ) x j (t ) x, t ; K 2ij ( x, t ) lim M t 0 t где -коэффициент диффузии, характеризующий скорость изменения условного момента связи приращений ой и ой компонент непрерывного векторного марковского процесса при его смещении из данной точки за малое время t , и являющийся компонентом матрицы диффузии (матрицы диффузионной скорости) . В общем случае вектор плотности потока вероятности складывается из систематического потока сноса, характеризуемого вектором локальной скорости с компонентами K2ij ( x, t ) и случайного диффузионного потока, характеризуемого матрицей диффузионной скорости с компонентами [ ] Компоненты вектора плотности потока вероятностей по координатным осям фазового пространства будут иметь вид: ∑ * + ̅̅̅̅̅ Замечание. Так как дифференциальное уравнение для АПВ ФПКС содержит информацию случайных сигналов наблюдений, заключенных в третьем слагаемом уравнения (3), то уравнение ФПКС называется стохастическим дифференциальным уравнением для апостериорной плотности вероятности. 3.3.6. Векторные алгоритмы нелинейной фильтрации в форме Стратоновича для первых двух моментов АПВ уравнения ФПКС (3) Рассмотрим два случая алгоритмов фильтрации в форме Стратоновича при постановке задачи оценивания : - Общий случай при отсутствии предположения о неэнергетичности параметров (IA), - При учете предположения о неэнергетичности параметров марковского процесса (IB). Векторный нелинейный алгоритм фильтрации в форме Стратоновича в гауссовском приближении АПВ представлен дифференциальными уравнениями эволюции первых двух моментов АПВ: уравнения оценки вектора состояния марковского процесса (уравнение для математического ожидания состояния вектора фазовых координат); уравнения ковариационной матрицы ошибок оценивания вектора состояния. 14 (IA) Векторный алгоритм нелинейной фильтрации в форме Стратоновича при отсутствии предположения о неэнергетичности параметров Дифференциальное уравнение оценки вектора состояния ̂ ̂̇ (̂ ) (̂ ) ( ̂ )] [ ̂ Уравнение оценки вектора состояния состояния: ̂̇ (̂ ) (̂ ) ̂ ̂ с учетом управления в модели ( ̂ )] [ : ̂ ̂ где управление может быть функцией оценки компонент вектора состояния (̂ ) ( ̂ ). Дифференциальное уравнение для ковариационной матрицы оценивания вектора состояния: ̇ (̂ ) где (̂ ) * (̂ ) ошибок ( ̂ )]+ [ начальное значение ковариационной матрицы (начальные условия) Данное уравнение есть уравнение Риккати с нелинейным элементом, который представлен третьим слагаемым * (̂ ) ( ̂ )]+ [ . Если уравнение состояния содержит матрицу при векторе шумов и представляет собой модель , то уравнение для ковариационной матрицы ошибок оценивания вектора состояния имеет вид: ̇ (̂ ) (̂ ) * (̂ ) Матрица диффузионной скорости определяется четвертыми слагаемыми: , ля ур н ния ля ур н ния ( ̂ )]+ [ для уравнений ковариаций ля мо ли состояния ля мо ли состояния Замечание. Производная от вектора по вектору есть матрица. В выражениях , и , матрицы ( ̂ ) представляют собой матрицы Якоби размерности ̂ ̂ (̂ ) и и , соответственно, то есть матрицы частных производных n- и m-мерных функций и относительно переменных компонент вектора состояния (вектора фазовых координат) . 15 В качестве -ой строки матрицы Якоби выступает градиент функций (градиент поля относительно вектора ): ̂ ‖ ‖ ‖ ‖ ‖ ‖ и ̂ ̅̅̅̅̅̅ ̂ ‖ ‖ ‖ ‖ ‖ ‖ ̂ ̅̅̅̅̅̅ Матрица вторых частных производных для функции Стратоновича есть матрица Гессе: ̂ ‖ ‖ ‖ ‖ ‖ ‖ ̂ ̂ где ̂ * (̂ ) ( ̂ )]+ [ определяется множителем в нелинейном слагаемом в уравнении Риккати для ковариационной матрицы. В качестве примера, ковариационная матрица для двухкомпонентного векторного ‖ ‖ имеет вид процесса 16 ‖ 1 1 ‖ 1 ЛЕКЦИЯ № 21 (IB) Векторный алгоритм нелинейной фильтрации в форме Стратоновича с учетом предположения о неэнергетичности параметров марковского процесса Если рассмотреть дополнительное усреднение в системе типа введения сглаживающего фильтра ( в примере об оценивании временной задержки), то уравнения алгоритма нелинейной фильтрации , и , упрощаются и принимают вид уравнений, совпадающих с уравнениями фильтрации при предположении о неэнергетичности параметров, которые имеют следующий вид: Дифференциальное уравнение оценки вектора состояния ̂ ̂̇ (̂ ) (̂ ) ̂ Уравнение оценки вектора состояния состояния: ̂̇ (̂ ) ̂ : ̂ с учетом управления в модели (̂ ) ̂ ̂ Дифференциальное уравнение для ковариационной матрицы оценивания вектора состояния: ̇ (̂ ) где (̂ ) [ (̂ ) ошибок ] начальное значение ковариационной матрицы (начальные условия) Уравнение есть уравнение Риккати с нелинейным элементом, который представлен третьим слагаемым [ (̂ ) ] . Для уравнения состояния с модель , содержащего матрицу при векторе шумов , уравнение для ковариационной матрицы ошибок оценивания вектора состояния имеет вид: ̇ (̂ ) (̂ ) (̂ ) [ ] Если провести усреднение для функции Стратоновича и соответствующей матрицы Гессе Фc ``( x, t ) ^ x x , то в предположении о неэнергетичности параметра матрица Гессе с учетом усреднения может быть представлена в виде: 17 ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ‖ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ‖ ̅̅̅̅̅̅̅̅̅̅̅ ̂ ‖ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ‖ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ‖ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ‖ ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ ̂ где [ ̂ (̂ ) ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ (̂ ) (̂ ) ] , ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ (̂ ) Таким образом, каждый -ый элемент матрицы Гессе пропорционален второй производной ВКФ между текущим принятым изображением (сигналом) и его ̂ эталонным изображением ( ): 〈 ̂ где (̂ ) 〉 – ошибка оценки –ой компоненты. II. Векторный нелинейный алгоритм фильтрации Калмана (или калмановского типа) Алгоритм нелинейной фильтрации Калмана в гауссовском приближении АПВ представлен следующими дифференциальными уравнениями (в виде эволюции 2-х первых моментов). Дифференциальное уравнение оценки вектора состояния ̂ ̂̇ (̂ ) (̂ ) ( ̂ )] [ Уравнение оценки вектора состояния состояния: ̂̇ (̂ ) (̂ ) ̂ ̂ ̂ с учетом управления в модели ( ̂ )] [ : ̂ Дифференциальное уравнение для ковариационной матрицы оценивания вектора состояния: ̇ где (̂ ) (̂ ) (̂ ) ̂ ошибок (̂ ) начальное значение ковариационной матрицы (начальные условия) 18 Данное уравнение есть уравнение Риккати для ковариационной матрицы фильтра Калмана с нелинейным элементом, который представлен третьим слагаемым (̂ ) (̂ ) . Если уравнение состояния содержит матрицу при векторе шумов (модель ), то уравнение для ковариационной матрицы ошибок оценивания вектора состояния имеет вид: ̇ (̂ ) (̂ ) (̂ ) (̂ ) Замечание. Уравнения оценки вектора состояния совпадают с уравнениями оценок , фильтрации предположения о неэнергетичности параметров. , фильтра Калмана в форме Стратоновича без Сравнение уравнений для ковариационных матриц алгоритмов в форме Калмана и в форме Стратоновича и Уравнения для ковариационной матрицы ошибок оценивания вектора состояния различаются нелинейными слагаемыми уравнения Рикатти. Уравнение Риккати для ковариационной матрицы ошибок оценивания в гауссовском приближении в форме Стратоновича содержит перед нелинейным слагаемым знак "+", а в уравнении Риккати калмановской фильтрации стоит знак "– ", т.к. вторая производная функции Стратоновича , представленная матрицей Гессе, пропорциональна второй производной ВКФ с учетом усреднения: ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ (̂ ) которая (вторая производная) всегда отрицательна, следовательно, сама функция Стратоновича пропорциональна ВКФ: (̂ ) и имеет максимум (и та и другая) при аргументе - ошибке оценивания равном нулю , в соответствии с достаточным условием существования экстремума функции. B(x) 𝐵 x B '(x) 19 𝑥𝑡 Поэтому в уравнениях ковариаций в форме Стратоновича перед нелинейным слагаемым стоит знак "+", а в форме Калмана стоит знак "–",так как в в качестве множителя в нелинейном слагаемом имеем произведения матриц Якоби(̂ ) ( ̂ )- частных производных нелинейных функций сигналов (в скалярном случае имеем квадрат производной сигнала), что дает всегда положительный элемент, который не может быть отрицательным. Таким образом, уравнение Риккати в классической матричной и скалярной формах для фильтра Калмана сохраняется в своем традиционном виде. 1.4.12. Достаточные условия точного оценивания в случае нелинейного сигнала В практических задачах важное значение условий точного оценивания состоит в том, что при их выполнении при достаточно точном измерении одного или не нескольких компонентов вектора состояния (вектора фазовых координат) в течение определенного времени можно восстановить весь вектор фазовых координат (то есть достаточно точно оценить все компоненты вектора состояния) на том же интервале наблюдения. Эти условия выполняется, если функции, характеризующие состояние динамики системы (уравнения состояния) и функции системы наблюдения (уравнения наблюдения) достаточно точно известны, заданы, являются детерминированными, гладкими, дифференцируемыми функциями своих аргументов. Именно в навигационных и прицельно-навигационных задачах эти функции и , являются достаточно известными, т.к. функции, характеризующие динамику состояния системы , представляют собой кинематические соотношения эволюции вектора фазовых координат, и практически точно известны, и считаются достоверными. Достаточные условия точного оценивания играют исключительно важную роль в комплексных системах наблюдения. Условия (критерий) полной наблюдаемости для нелинейного случая Условия (критерий) полной наблюдаемости для нелинейного случая состоит в том, что ранг блочной матрицы следующего вида равен : ‖( ) ( ( )) ( ( )) ‖ Замечание. Предполагается, что функции и гладкие, дифференцируемые векторные функции по времени и фазовому пространству вектора состояния (т.е. фазовыми координатами) и имеют производные до -ого порядка включительно. Достаточные условия сходимости нелинейного фильтра 20 Достаточные условия сходимости нелинейного фильтра состоят в том, что ранг блочной матрицы следующего вида равен (эти условия похожи на условия (8), но переставлены местами операции дифференцирования): ‖( ) ( ( )) ( ( )) ‖ Достаточные условия точного оценивания в случае нелинейного сигнала – условия (8) и (9) понимаются в том смысле, что для (8) - начальные приближения для получения оценки ̂ вектора состояния (на основании постановки задачи ) считаются достаточно близкими к начальным значениям в итерационном процессе, то есть ошибка оценивания в начальный момент времени достаточно мала ̂ . для (9) – начальные значения ковариационной матрицы достаточно малы, чтобы не было расходимости процесса оценивания (Рис.3.4.12). 𝑃 𝑡 𝑃 𝑄 𝑡 𝑡 Рис.3.4.12. интенсивность фона возмущения состояния СДС. ЛЕКЦИЯ 22 3.4.13 Расширенный дискретный фильтр Калмана (РДФК). Некоторые особенности. 21 В данном случае алгоритмы РДФК рассматривается как с матрицей усиления интенсивности шума модели состояния, так и с переменной матрицей усиления при шумах модели наблюдений. Математическая модель динамики состояния системы имеет вид I. ⏟ где – недоступный непосредственному наблюдению фазовый вектор – столбец, характеризующий динамику оцениваемого процесса. – н ч льно зн ч ни оц ни мого случ йный проц сс с м т м тич ским ожи м триц й ̅ компон нт ф зо ого ктор ни м ̅̅̅ руг с ктор случ ругом ктор озмущ ний сист мы м т м тич ским ожи ст ля т собой ̅̅̅ и ко ри ционной н корр лиро я ляющ йся и гон ли которой стоят исп рсии компон нт ф зо ого – случ йный проц сс тип пр нности и гон льной по ктор искр тного б лого шум х р кт ризующий Мож т ни м им ть р зм рность о , с г сим ол рон к р { – ко ри ционн я м триц инт нси ности или сп ктр льной плотности случ йного проц сс . – м тричн я функция х р кт ризующ я с язь м ж у ф зо ым ктором II. и шумом озмущ ния этого проц сс Модель измерения: – векторный сигнал наблюдений. Представляет собой сумму полезной информации о состоянии процесса, заключенной в сигнале, и шума. – белый гауссовский шум с математическим ожиданием ковариационной матрицей V и , – положительно определенная ковариационная матрица интенсивности процесса (в отличие от неотрицательно определенной матрицы 22 ). – переменная матрица при шумах модели наблюдений (измерений), обновляющаяся на каждом шаге. Предполагается, что начальное состояние системы системы и ошибки измерений III. ̂ где ̂ некоррелированы Алгоритм оценивания вектора состояния ̂ ̂ ̂ IV. , шум возмущения прогноз оц нки н ̂ йш г Ковариационная матрица прогноза оценки вектора состояния на k+1-й шаг ̂ ̂ ̂ ̂ ̂ ̂ есть априорная ковариационная матрица ошибок оценивания. V. Ковариационная матрица ошибок оценивания вектора состояния ̂ ̂ * ̂ ̂ ̂ ̂ + ̂ ̂ VI. Матрица коэффициентов усиления ̂ ̂ VII. Ошибка оценивания вектора состояния ̂ Матрицы Якоби, характеризующие динамику системы в каждой точке, где каждая строка представляет собой градиент поля: 23 ̂ ̂ ̂ ̂ вычисляются соответственно в точках оценки ̂ ̂ . и прогноза оценки на шаг – сложные нелинейные функции вектора состояния, что характерно для большинства задач навигации и наведения, являются дифференцируемыми по компонентам вектора состояния и в качестве i-й строки матрицы Якоби имеют градиенты функций относительно вектора . Особенности нелинейных преобразований случайных процессов рассматриваются в работе [2]. Субоптимальной оценкой, выдаваемой на выходе с учетом наблюдений , поступающих на вход фильтра, является условное математическое ожидание на интервале наблюдения ⁄ ̂ Как отмечалось выше, нелинейный фильтр Калмана формирует оценку лишь приближенно, с приближенным уравнением ковариаций в силу нелинейной постановки задачи оценивания. Уравнение ковариационной матрицы ошибок оценивания зависит от производных нелинейных функций уравнений состояния системы и производных нелинейных функций полезных сигналов наблюдений от одношагового предсказания по соответствующим оценкам. Нелинейный фильтр Калмана есть дискретный позволяющий пересчитывать оценку вектора состояния ̂ итерационный фильтр, в итерационном процессе любое желаемое число раз. Оценка вектора состояния является наилучшей и с точки зрения максимума ⁄ апостериорной плотности вероятности . Алгоритм РДФК есть алгоритм в гауссовом приближении, представляемый первыми двумя моментам: 1) оценкой вектора состояния; 2) ковариационной матрицей ошибок оценивания. Задача максимизации апостериорной минимизации следующего критерия: 24 плотности вероятности сводится к ‖̂ ‖ ‖ ̂ ‖ ∑‖ Замечание. ∑ ‖ Для курсовой работы необходимо составить структурную схему РДФК соответственно приведены уравнениям (I) – (VI) (Рис. 6). Особенностью структурной схемы РДФК, приведенной на рисунке 6, является предложенное в работе использование сглаженного значения состояния, сигнала и оценки с коррекцией оценки в реальном времени. Обозначения на схеме к рисунку 6: Априорная ковариационная матрица на шаге ̂ ̂ ̂ ̂ ̂ ̂ Апостериорная ковариационная матрица на ̂ ̂ * ̂ ̂ ̂ ̂ Матричный коэффициент усиления на ̂ ̂ * шаге ̂ ̂ + шаге ̂ ̂ ̂ ̂ 25 +