МИНОБРНАУКИ РФ Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет» Факультет математики, механики и компьютерных наук Рассмотрено и рекомендовано на заседании кафедры высшей математики исследования операций ЮФУ Протокол №_1___________ "__30___"___августа_______2011г. Зав. кафедрой ________________ УТВЕРЖДАЮ Декан факультета (зам. декана по учебной работе) ___________________ "____"____________2011 г. УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС учебной дисциплины "Задачи оптимального управления"вузовского компонента цикла ОПД по специальности 010501прикладная математика и информатика Семестр 6 Всего часов –68 , из них – лекции-34, –самостоятельная работа- 34 час. Отчетность по курсу – зачёт Составитель: профессор Рохлин Д.Б. Утвержден Советом Южного федерального университета Протокол №_____ от «______» _________ 2011г. Ростов-на-Дону 2011 Пояснительная записка к рабочей программе по дисциплине «Задачи оптимального управления» Курс, читается в 6-ом. Форма занятий: лекции и практические занятия 34 часа. Виды отчетности: индивидуальные задания и зачет. Цели и задачи курса: ознакомить студентов с постановками и методами решения задач управления динамическими системами. Рассматриваются следующие вопросы: принцип максимума Понтрягина, различные версии уравнения Беллмана (дискретное и непрерывное время, конечный и бесконечный горизонт, стохастические системы), концепции управляемости и наблюдаемости, оптимальная остановка. Курс носит прикладной характер и ориентирован на решение задач. РАБОЧАЯ ПРОГРАММА КУРСА «Задачи оптимального управления» 34 часа Тема 1. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА Вывод принципа максимума Понтрягина при помощи метода множителей Лагранжа. 2 часа Уничтожение насекомых. Пчелы как оптимизаторы. Задача о быстродействии. Простейшая задача преследования. Успокоение маятника. 5 часов Тема 2. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ: НЕПРЕРЫВНОЕ ВРЕМЯ Вывод уравнения Беллмана в случае конечного горизонта. 2 часа Планирование расходов. Оптимальный режим снижения мощности ядерного реактора. 3 часа Вывод уравнения Беллмана в случае бесконечного горизонта. Задачи об оптимальном отлове рыбы и планировании расходов в случае бесконечного горизонта. 3 часа Тема 3. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ: ДИСКРЕТНОЕ ВРЕМЯ Вывод уравнения Беллмана в случае конечного и бесконечного горизонта. 2 часа Оптимальное потребление. Задача о покупке пакета акций большим инвестором. Оптимальный отлов рыбы. 4 часа Тема 4. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ В ЛИНЕЙНЫХ СИСТЕМАХ Определение и критерии управляемости и наблюдаемости в дискретного и непрерывного времени. Игра в чехарду. Управление спутником в окрестности круговой Наблюдаемость популяций. Радиоактивный распад. случае 3 часа орбиты. 3 часа Тема 5. СТОХАСТИЧЕСКИЕ СИСТЕМЫ: ДИСКРЕТНОЕ ВРЕМЯ Условное математическое ожидание. Марковские процессы. Метод динамического программирования. Азартные игры. Динамическая оптимизация портфеля. 4 часа Задача об оптимальной остановке. Оптимальная реализация американского опциона. Выбор с отбрасыванием. 3 часа ЛИТЕРАТУРА Основная 1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.:Наука, 1979. 2. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.:Высш. шк., 1998. 3. Bertsekas D.P. Dynamic programming and optimal control, vol.1, Athena Scientific, Massachusetts, 1995. 4. Пантелеев А.В., Бортаковский А.С., Летова Т.А. Оптимальное управление в примерах и задачах. М.:МАИ, 1996. 5. Калихман И.Л. Войтенко М.А. Динамическое программирование в примерах и задачах. М.:Высш.шк., 1979, 125 с. Дополнительная 6. Weber R. Optimization and control. Cambridge University, 2001. (http://www.statslab.cam.ac.uk/~rrw1/oc/index.html) 7. Жак С.В. Задачи оптимального управления. Мет. указ. для студ. веч. отд. мехмата РГУ, Ростов-на-Дону, 1983. 8. Де Гроот Оптимальные статистические решения. М.:Мир, 1974. 9. Ширяев А.Н. Вероятность. М.:Наука, 1980. 10.Дыхта В.А., Самосюк О.Н. Оптимальное импульсное управление с приложениями. М.:Физматлит, 2000. Примеры индивидуальных и контрольных заданий 1. Решить с использованием принципа максимума. 4 (u 0 2 x)dt min, x u, | u | 1, x(4) 0. 6 (u 2 x)dt min, x u, | u | 1, x(0) 0. 0 2 (u 1) dt x(2) min, x u 1, u 2, x(0) 1. 2 0 5 (u 5) dt 2 x 2 2 (5) min, x u, u 3, x(0) 1. 0 2. Найти функцию Беллмана и оптимальное управление. 2 x ux, u 2 dt 2 ln( x(2)) min 0 1 u x x u, 2 dt 2 x 2 (1) min 0 1 x1 x2 u, x 2 x1 , u 2 dt x12 (1) min 0 2 x 2t u, u 2 dt ( x(1) 4) 2 min 0 3. Найти функцию Беллмана V (t , x) , оптимальное управление u t (x) и оптимальную траекторию xt . 3.1. xt 1 ( xt u t ) 2 , h 1 u 0 u t xt , t t 0 1/ 2 t max, x0 1, h 2, 1 / 2. 3.2. xt 1 xt u t , 0 u t xt , h 1 t 0 t ln u t max, x0 1, h 2, 1 / 2. 3.3. xt 1 2 xt yt , yt 1 xt ut , xh2 y hh min x0 1, y 0 2, h 2 4. При каких значениях параметров , система x Ax Bu , 1 0 1 A 2 1 0 , 0 1 0 является управляемой. 0 B 0 0 5. При каких значениях параметров , система x Ax, y Cx 1 0 1 A 2 1 0 , 0 1 0 C 0 0 0 является наблюдаемой. 6. Решить задачу об оптимальной остановке EX 2 min, X i 1 X i i , i 0,1,2; X 0 1; P( i 1) 1 / 4, P( i 0) 1 / 4, P( i 1) 1 / 2. 7. Сформулировать оптимизационную задачу и наметить путь ее решения. 7.1. Колода карт тщательно перетасована и положена на стол. Можно переворачивать карты одну за другой, подсчитывая количество красных и черных. В точности один раз можно сделать ставку, что следующая карта будет красной. Максимизировать вероятность выигрыша. 7.2. Бабочка летает между цветущими деревьями. Ветер начинает дуть, когда она находится между деревьями A и B на расстоянии x 0 от A . Бабочка может регулировать свою скорость. Скорость появившегося ветра постоянна и направлена от B к A . 7.3. На интервале времени [0,1] цена золота составляет s (t ) фунтов за унцию. В начальный момент времени инвестор имеет x1 (0) фунтов и x2 (0) унций золота. Покупка, (но не продажа) золота облагается налогом фунтов за унцию. Пусть u (t ) – скорость, с которой инвестор продает золото в момент времени t и | u | 1 . Отрицательные значения u соответствуют покупке. Цель состоит в том, чтобы максимизировать количество фунтов при t 1 . 7.4. Прямая река течет со скоростью c( y ) , где y – расстояние от берега, который покинула лодка. Направлением скорости лодки можно управлять, а величина скорости постоянна и равна v . Лодочник хочет достичь заданной точки на противоположном берегу за минимальное время. Программа зачета 1. Вывод принципа максимума Понтрягина. 2. Уничтожение насекомых. 3. Пчелы как оптимизаторы. 4. Задача о быстродействии. 5. Простейшая задача преследования. 6. Формальный вывод уравнения Беллмана в случае непрерывного времени (конечный горизонт). 7. Связь между уравнением Беллмана и исходной оптимизационной задачей. 8. Задача о планировании расходов (конечный горизонт). 9. Оптимальный режим снижения мощности ядерного реактора. 10. Вывод уравнения Беллмана в случае непрерывного времени (бесконечный горизонт). 11. Оптимальный отлов рыбы (непрерывное время). 12. Задача о планировании расходов (бесконечный горизонт). 13. Вывод уравнения Беллмана в случае дискретного времени (конечный горизонт). 14. Инвестирование в строительную фирму. 15. Задача о покупке пакета акций большим инвестором. 16. Управляемость и ее критерий (дискретное время), игра в чехарду. 17. Наблюдаемость и ее критерий (дискретное время), игра в чехарду. 18. Управляемость и ее критерий (непрерывное время). 19. Управление спутником в окрестности круговой орбиты. 20. Наблюдаемость (непрерывное время). Задачи о популяциях и радиоактивном распаде и спутнике. 21. Метод динамического программирования при наличии случайных факторов. Азартная игра. 22. Задача об оптимальной остановке. Выбор с отбрасыванием.