Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Достаточные условия оптимальности в задачах управления Ананьев Виктор Владимирович

Достаточные условия оптимальности в задачах управления
<
Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления Достаточные условия оптимальности в задачах управления
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Ананьев Виктор Владимирович. Достаточные условия оптимальности в задачах управления : ил РГБ ОД 61:85-1/2287

Содержание к диссертации

Введение

Глава I. Неавтономные управляемые системы 13

1.1. Поднятие экстремалей в Т'ИР 14

1.2. Поток на лагранжевом грассманиане А (И), Основные результаты 21

1.3. Исследование потока на ЛМ . 25

1.4. Семейства латранжевых многообразий . 37

1.5. Аналог необходимого условия оптимальности Якоби 44

1.6. Вариационные задачи с линейными ограничениями на скорость .50

1.7. Доказательство теоремы І.І 56

Глава II. Автономные управляемые системы . 59

2.1. Гамильтонов фазовый поток и аналог уравнения в вариациях 60

2.2. Кусочно гладкие лагранжевы многообразия и достаточные условия оптимальности . 64

2.3. Траектории с самопересечениями . 76

2.4. Исследование потока w Доказательство теоремы 2.2 77

2.5. Поток у и лагранжевы конусы. Доказательство теоремы 2.3 85

2.6. Задача оптимального управления с функционалом Лагранжа 96

2.7. Пример .101

2.8. Доказательство теоремы 2.Г . 104

2.9. Оптимальность траекторий, удовлетворяющих принципу максимума с постоянной 109

Глава III. Особые оптимальные траектории 117

3.1. Подмногообразие Гамильтонов поток в окрестности X П7

3.2. Построение кусочно гладкого лагранжева многообразия 124

3.3. Достаточные условия оптимальности . 133

3.4. Пример 138

Литература

Введение к работе

В работе построен аналог теории Якоби достаточных условий оптимальности управляемых процессов, описываемых обыкновенными дифференциальными уравнениями. Теория сопряженных точек по Якоби обобщается на задачи оптимального управления, в которых не выполняются классические предположения этой теории.

В настоящее время можно выделить 3 основных подхода к построению достаточных условий оптимальности в теории оптимального управления: обобщение метода Beйерштрасса [16,17], основанного на использовании поля экстремалей, метод динамического программирования [13-15,29,39] и основанный на нем метод регулярного синтеза [l4,I5J и достаточные условия 2-го порядка, полученные в рамках принципа Лагранжа [30,36,1] . В данной работе предлагается новый геометрический подход, основанный на привлечении теории лагранжевых многообразий и симплектической геометрии. Для иллюстрации предлагаемого метода и его связи с методами поля экстремалей и динамического программирования рассмотрим два примера.

Если гладкую кривую V\ [о,У - ( можно включить в поле экстремалей (2) , т.е. (-b)-V( (b)yb)7 то кривая доставляет локальный минимум функционалу (i) [ 0, ki\ . Достаточные условия Якоби есть не что иное, как условия, при которых кривая f может быть включена в поле экстремалей. В данной работе мы поступаем аналогично, но в качестве исходного объекта, вместо поля экстремалей, мы используем лагранжевы многообразия. Фактически лагран-жевы многообразия уже использовались неявно Л.Янгом [ о]. Необходимые сведения о лагранжевых многообразиях и связанных с ними понятиях содержатся в [3,1/, і , 33, 23). Некоторые из них мы будем приводить по ходу изложения в удобной для нас форме.

Будем для простоты считать, что произвольное решение системы (Y) может быть продолжено на всю вещественную ось. Обозначим через ср : Т - 7 1 двухпараметрическое семейство диффеоморфизмов, порожденное системой Of) , т.е. при произвольных фиксированных Sejo 2є 7" / кривая у (41 = $ есть решение задачи Коши для системы (Ь) с начальным условием у (s) = 2 [%] . Отметим, что отображения ср5 симплектические, т.е. сохраняют симплектическую структуру [3] , (ф& ) °°1 = ш - 8 Предположим теперь, что кривую у можно включить в поле экстремалей (I) для некоторого поля направлений v(x3i). Определим подмногообразие L = Г Р формулой

I. Построен аналог теории сопряженных точек по Якоби в терминах свойств некоторого потока на лагранжевом грассманиане для задач оптимального управления, в которых не выполняются классические предположения этой теории, и на этой основе получены достаточные условия оптимальности в задаче Лагранжа и в задаче оптимального быстродействия.

2. Получены необходимые условия Якоби в задаче Лагранжа с фиксированными концами незакрепленным временем для неавтономных управляемых процессов.

3. Найдены достаточные условия локальной единственности решения двухточечной задачи управления.

4. Выделен один класс скользящих режимов и получены достаточные условия оптимальности экстремалей, содержащих участки скользящих режимов этого класса.

При дополнительных предположениях на управляемый процесс полученные достаточные и необходимые условия оптимальности превращаются в классические условия Якоби вариационного исчисления. В случае отсутствия переключений построенные в главе II достаточные условия согласуются с условиями, полученными в работе [іо] в рамках принципа Лагранжа.

Проверка полученных в работе достаточных условий представляется более простой, чем условий регулярного синтеза [I4,I5J . Кроме того условия регулярного синтеза не выполняются для рассматриваемых в главе III особых экстремалей. В случае же локальной единственности /и следовательно, оптимальности/ решения двухточечной задачи управления названные выше методы не работают.

Основные результаты диссертации опубликованы в работах [44-47].  

Поток на лагранжевом грассманиане А (И), Основные результаты

В работе построен аналог теории Якоби достаточных условий оптимальности управляемых процессов, описываемых обыкновенными дифференциальными уравнениями. Теория сопряженных точек по Якоби обобщается на задачи оптимального управления, в которых не выполняются классические предположения этой теории.

В настоящее время можно выделить 3 основных подхода к построению достаточных условий оптимальности в теории оптимального управления: обобщение метода Beйерштрасса [16,17], основанного на использовании поля экстремалей, метод динамического программирования [13-15,29,39] и основанный на нем метод регулярного синтеза [l4,I5J и достаточные условия 2-го порядка, полученные в рамках принципа Лагранжа [30,36,1] . В данной работе предлагается новый геометрический подход, основанный на привлечении теории лагранжевых многообразий и симплектической геометрии. Для иллюстрации предлагаемого метода и его связи с методами поля экстремалей и динамического программирования рассмотрим два примера.

Рассмотрим задачу минимизации функционала в классе С -кривых И; ло,Ч] " 1\ с фиксированными концами принадлежит классу С f о? { фиксированы. Для простоты будем предполагать, что f0(x,u.7i) выпукла по (Л при фиксированных (х74) и матрица вторых частных производных д 10/д(сдсс положительно определена при всех (x}eiy4).

Теория Якоби достаточных условий минимума функционала () основывается [1,11, 12., 22\ на привлечении понятия поля экстремалей. Поле экстремалей определяется как семейство решений задачи для некоторой окрестности W0 с {R точки х0 и некоторой функции V : W - fP , где множество W IE l открыто и ДО0 х-ЩсгЦ/ На функцию V накладывается дополнительное требование, состоящее в том, что интеграл Гильберта зависит только от концов X(ij? X(i") кривой Условие Вейерлтрасса выполняется в рассматриваемом случае автоматически, поскольку функция $0 (ос, и., У выпукла

Если гладкую кривую V\ [о,У - ( можно включить в поле экстремалей (2) , т.е. (-b)-V( (b)yb)7 то кривая доставляет локальный минимум функционалу (i) [ 0, ki\ . Достаточные условия Якоби есть не что иное, как условия, при которых кривая f может быть включена в поле экстремалей. В данной работе мы поступаем аналогично, но в качестве исходного объекта, вместо поля экстремалей, мы используем лагранжевы многообразия. Фактически лагран-жевы многообразия уже использовались неявно Л.Янгом [ о]. Необходимые сведения о лагранжевых многообразиях и связанных с ними понятиях содержатся в [3,1/, і , 33, 23). Некоторые из них мы будем приводить по ходу изложения в удобной для нас форме.

Пользуясь терминологией механики, будем называть кокасатель-ное расслоение T fR 1 фазовым пространством. Через % будем обозначать координаты в Г Й?к , двойственные к координатам х. в Рч /в этих координатах значение и/1/ кокасательного вектора Vf е Г Ц? 1, с координатами ( ,..,, ) на касательном векторе

Определим гамильтониан Н / Р х """ U { + j Буцем предполагать, что функция п конечна на Т Q . Тогда И принадлежит классу С . Пусть С -кривая V: [КЛЇІ удовлетворяет уравнениям Эйлера-Лагранжа р/0] . Определим поднятие : [0,У Т кривой V формулой

Тогда, как хорошо известно [ /0] , кривая 7 удовлетворяет уравнениям Гамильтона и обратно, если С -кривая является решением уравнений Гамильтона ( /) , то ее проекция У=7Г

Будем для простоты считать, что произвольное решение системы (Y) может быть продолжено на всю вещественную ось. Обозначим через ср : Т - 7 1 двупараметрическое семейство диффеоморфизмов, порожденное системой Of) , т.е. при произвольных фиксированных Sejo 2є 7" / кривая у (41 = $ есть решение задачи Коши для системы (Ь) с начальным условием у (s) = 2 [%] . Отметим, что отображения ср5 симплектические, т.е. сохраняют симплектическую структуру

Вариационные задачи с линейными ограничениями на скорость

В этом параграфе гладкий означает класса С 5 .

Пусть на задано гладкое поле касательных плоскостей х.с 7 х. И? 1 и гладкая функция f0 : N- К на векторном расслоении /1/= U Д4 . Абсолютно непрерывную кривую V: l o,tJ " Я? назовем допустимой, если для почти всех є

Рассмотрим следующую вариационную задачу: среди всех допустимых кривых : [lo, ij] - PN переводящих точку х0 є ( - в точку еР , найти такую, для которой функционал имеет наименьшее значение. Эта задача легко интерпретируется, как задача оптимального управления (і),(). Именно, в окрестно -біоти каждой точки л є /Р поле /\/х порождается некоторыми гладкими векторными полями ,.,,, АҐ r = oiiw\ Nx = co?ibfcf и можно положить U = R 7 (х}и.) = 2Z u,L лс (х), f0 (Уі и ) = Относительно функции f о мы будем предполагать, что і) о выпукла на кавдом слое Nx и ) матрица Э о/ бсОм. положительно определена при всех XjU. . очевидно, последнее свойство не зависит от выбора конкретных векторных полей X; . Такую функцию f0 будем называть "правильной" .

Определим гамильтониан

Будем предполагать, что функция И конечна на Г Pn . Тогда // - гладкая функция на Tr Р . Согласно 1.1 оптимальные допустимые кривые нужно искать в этом случае среди проекций на 0? траекторий гамильтоновой системы на Т /Р = /J? с гамильтонианом И . При этом не рассмотренными останутся лишь те допустимые кривые, которые удовлетворяют принципу максимума с постоянной Чо-0 . Обозначим через X-IdH гамильтоново векторное поле с гамильтонианом И и через р : 1 (Р порожденную л однопараметрическую группу диффеоморфизмов. Вообще говоря, поле л порождает лишь локальную однопараметрическую группу преобразований 1 /некоторые траектории могут уходить на бесконечность за конечное время/, однако все наши рассмотрения будут локальны, и поэтому, не умаляя общности, мы можем считать, что л порождает "глобальную" группу преобразований пространства И? .

Найдем условия, при которых для всякой траектории 7 : [ 0, } " потока cpt и всякой точки «- є [і0і і] /В0 ( ХУ) - ( . В этом случае будут справедливы необходимые и достаточные условия Якоби оптимальности кривой X - Ttf в их классическом виде, хотя усиленное условие Лежандра, очевидно, не выполняется. Положим 0(&)= { є Тг Riyt [ Т# J є Aj7"fe) \ . Пусть - модуль гладких векторных полей У на ft? 24 , та ких, что Определим последовательно расширение dj L7 »i,i,... модуля Ф , как модуль, порожденный всевоз можными векторными полями 7 где Т К, У\ - скобка Пуассона векторных полей У, У . Положим

Для открытого множества О с IP обОЗНа чим через 7Т0/ модуль всех гладких векторных полей на О . Предложение 1.12« Пусть замкнутое множество М с IP таково, что для всяких геі/ и 0 существует є СО, .) , такое, что (р в ф JU .

Предположим, что ($[рдч.чп. = T(fc Р). Тогда для всякой траектории : [h0j Ls] - (Ауг- потока ср и всякой точ: ки Доказательство. Предположим противное. Пусть для некоторой траектории потока qp и некоторого таково, что

Заменив, если нужно, а на рекоторое а е(азв)у мы можем считать, что %(& ) ф М- Поскольку, то существует алгебраическая I-форма а на слое 7" /Р 4 # 0, равная нулю на Заметим теперь, что где множество, определенное в 1.2 для кривой . Следовательно

Таким образом, для всякого векторного поля У є Q xифференцируя это равенство по і , получим [ 2V] Следовательно в формуле (JS) можно заменить условие У є (Q на условие У є (1. Повторяя этот процесс, получим, что &3J верно для всех У (Q , и следовательно, сх - 9 ц.то противоречит предположению. П

Для некоторых полей плоскостей N утверждение предложения 1.12 справедливо для всех "правильных" функций \0 . Именно/ пусть!гладкие дифференциальные I-формы d, ..., я д..г на ! - таковы, что Nx = { % є Тх fi? \ «г С 5) = 03 1-і,..., к-г "\ . Обозначим через Р модуль дифференциальных 2-форм, порожденный 2-формами d t , L- 4,..., -Ґ. Пусть JM = е ( Vu

Предложение 1.13. Предположим, что для всех X е feK 2-формы da. t = i м-г линейно независимы в точке х и для всякой 2-формы 01 є /Р «Т Dh. 0 ограничение х на Лд, невырождено, т.е. для є /. из равенства х(, ty) =0 для всех h6 /. следует =0. Тогда, какова бы ни была правильная функция (R и соответствующие ей гамильтониан Н и поток ср" , имеет место равенство

Исследование потока w Доказательство теоремы 2.2

Тогда существует регулярное кусочно гладкое лагранжево многообразие Ж, , удовлетворяющее условиям (О -($) предложения 2.6.

Теорема 2.3. Предположим, что существует регулярное лагранжево многообразие об , удовлетворяющее условиям (і) ( ) предложения 2.6 и ослабленному условию (5") , в котором строгое неравенство заменено на нестрогое. Тогда (1) га,кк }0Щ - неубывающая функция на отрезке сужение квадратичной формы QA Qs на подпространство (2) неотрицательно определено. D

Как следствие из теоремы 2.2 и предложения 2.6 получаем следующие достаточные условия оптимальности. Теорема 2.4. Предположим, что семейство лагранжевых плоскостей Х0 (і) удовлетворяет условиям теоремы 2.2. Тогда траектория tf = 7i tf системы (4) локально оптимальна. О

В частном случае, когда подмногообразие Mt вырождается в точку, условие U) теоремы 2.2 выполняется автоматически.

Теорема 2.5. Предположим, что (1) гамМ У±Щ - невозрастающая функция на ["0,7], &) сужение квадратичной формы Q0(p Q0 (%) на подпространство отрицательно определено. Тогда существует регулярное лагранжево многообразие С , удовлетворяющее условиям (i) (s) предложения 2.6.

Аналогично переформулируются для Jj. (Ь) теоремы 2.3 и 2.4. Доказательство приведенных теорем будет проведено в 2.4 и 2.5. Мы покажем также, что лагранжевы плоскости )0) \± и сужения А А квадратичных форм #i #А на подпространство (Я) и Q.0- Q0 на подпространство (9) не зависят от произвола в выборе отобра жений ? и производящих семейств Пусть траектория У ["О, Г] - IR5 системы (4) имеет самопересечения. Определим накрывающую окрестность кривой у как тройку (W,p, ), где W/ - С -многообразие размерности без края, отображение О : U/ — Wс ! - - локальный С-диффеоморфизм, l# = p(U/) - открытое множество в непрерывное поднятие кривой у в \)(/ , =f$ , и кривая не имеет самопересечений.

Цусть траектория у системы (1) допустима. Тогда подмногообразия Д), Mi допускают /по крайней мере в окрестности то Л Л А

Определение 2.5. Допустимую траектории у [ОД] системы (L) будем называть локально оптимальной, если существует такая ее накрывающая окрестность (W, P, f), что для всякой допу стимой траектории jf± : [о, Т±] - W= f (W), имеющей допустимое поднятие в № , выполняется неравенство Т± Т} и локально строго оптимальной, если равенство имеет место только при = . о

Предположим, что для некоторого 0 из условий ( j = =ЦН") ж \і -ї"\ $ , ± Л"е. [о,Т], следует, что W". Тогда, как легко показань, существует накрывающая окрестность (W,fJ) кривой л . Если (lU,pd,J/J и fl .p Jt) -две накрывающие окрестности кривой % , то они изоморфны в окрестно-сти . Именно, существуют окрестности № с U . t-(fO,rj)c с w/} С = 1,2У и диффеоморфизм р(: 1 4 -» $ » такой, что Пусть У: [0,П - IR 1, - траектория системы (і) и ( И/, f, ее накрывающая окрестность. Управляемая система &) индуцирует на W управляемую системр где Кривая является траекторией системы (4 0) . При этом траектория У локально оптимальна в обычном смысле тогда и только тогда, когда яраектория v локально оптимальна в смысле определения 2.5.

Поскольку р - локальный диффеоморфизм, то отсюда следует, что утверждение теоремы 2.4 остается справедливым и для траекторий системы (4) с самопересечениями, если локальную оптимальность понимать в смысле определения 2.5.

Построение кусочно гладкого лагранжева многообразия

Если гладкую кривую V\ [о,У - ( можно включить в поле экстремалей (2) , т.е. (-b)-V( (b)yb)7 то кривая доставляет локальный минимум функционалу (i) [ 0, ki\ . Достаточные условия Якоби есть не что иное, как условия, при которых кривая f может быть включена в поле экстремалей. В данной работе мы поступаем аналогично, но в качестве исходного объекта, вместо поля экстремалей, мы используем лагранжевы многообразия. Фактически лагран-жевы многообразия уже использовались неявно Л.Янгом [ о]. Необходимые сведения о лагранжевых многообразиях и связанных с ними понятиях содержатся в [3,1/, і , 33, 23). Некоторые из них мы будем приводить по ходу изложения в удобной для нас форме.

Пользуясь терминологией механики, будем называть кокасатель-ное расслоение T fR 1 фазовым пространством. Через % будем обозначать координаты в Г Й?к , двойственные к координатам х. в Рч /в этих координатах значение и/1/ кокасательного вектора Vf е Г Ц? 1, с координатами на касательном векторе

Буцем предполагать, что функция п конечна на Т Q . Тогда И принадлежит классу С . Пусть С -кривая V: [КЛЇІ удовлетворяет уравнениям Эйлера-Лагранжа р/0] . Определим поднятие Т кривой V формулой

Тогда, как хорошо известно [ /0] , кривая 7 удовлетворяет уравнениям Гамильтона и обратно, если С -кривая а является решением уравнений Гамильтона ( /) , то ее проекция удовлетворяет уравнениям Эйлера-Лагранжа.

Будем для простоты считать, что произвольное решение системы может быть продолжено на всю вещественную ось. Обозначим через ср : Т - 7 1 двупараметрическое семейство диффеоморфизмов, порожденное системой Of) , т.е. при произвольных фиксированных Sejo 2є 7" / кривая у (41 = $ есть решение задачи Коши для системы (Ь) с начальным условием у (s) = 2 [%] . Отметим, что отображения ср5 симплектические, т.е. сохраняют симплектическую структуру [3] , (ф& ) 1 = ш - 8 Предположим теперь, что кривую у можно включить в поле экстремалей (I) для некоторого поля направлений v(x3i). Определим подмногообразие L = Г Р формулой

Мы будем рассматривать и также, как семейство подмногообразий Li= L(\ Т {h) с T , іє/R. Подинтегральное выражение в (3) есть не что иное, как значение I-формы = усіх -- /% ,# і на векторе поднятие кривой X в

Из инвариантности интеграла (3) нетрудно тогда вывести, что LfduOH 07 где L : L Т х IR - вложение, и следовательно, подмногообразия Lj_cT fc лагранжевы и, если (2, s)6 L , то при і близких к s cf s г є Lj. [і] ,

Обратно, предположим, что существует (ft +4)-мерное С -подмногообразие і cT IR x R? такое, что і) сужение - диффеоморфизм на некоторое открытое множество U/ = JR xIfr, A) tf(h),h)el дая всех Тогда кривая включается в поле экстремалей, задаваемое полем направлений сужение W на слой t = cond.

Теперь рассмотрим, как интерпретируется условие Якоби /отсутствие сопряженных к і о точек в интервале и как из. него можно вывести существование требуемого семейства лагранжевых многообразий. Предположим, что мы уже построили подмногообразие if , удовлетворяющее условиям &) и Ь) , Подмногообразия L± =-с: /R лагранжевы. Обозначим через Л касательное пространство к і,± в точке f(l)} 1±=Т щі,. Тогда Л -.лагранжева плоскость линейного симплектического пространства Туш & к = Ргк, Обозначим через p=dy -dx координаты в этом пространстве, проекцию обозначим тем же символом f\ . Для произвольной лагранжевой плоскости я - lf\ положим галОС. А = = dim (ТХ). Поскольку Заметим теперь, что, если для всех г є [i0,"J ffrtt/k Л; = , то для некоторой окрестности Vа I il\ Хи\ множества Г() ={ff ),i) і [К Щ многообразие Lfl V будет удовлетворять условиям i), 2), з). Следовательно, достаточно доказать существование семейства лагранжевых плоскостей такого, что В этом случае можно по где гиперплоскость в проходящая через точку 7 (г0) и параллельная

Семейство линейных симплектических диффеоморфизмов как легко убедиться, порождено гамильтоновой системой с квадратичным гамильтонианом К (fyh) - у это дифференциальные уравнения Якоби для 7 40J , и из определения сопряженной точки следует, что сопряженные к т0 точки - это те точки re(R , для которых Ъ к Х П-1, где = 1 , ) 1 =0}.

Похожие диссертации на Достаточные условия оптимальности в задачах управления