Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Условия оптимальности и управляемости для вырожденных управляемых систем Павлова Наталья Геннадьевна

Условия оптимальности и управляемости для вырожденных управляемых систем
<
Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем Условия оптимальности и управляемости для вырожденных управляемых систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Павлова Наталья Геннадьевна. Условия оптимальности и управляемости для вырожденных управляемых систем : диссертация ... кандидата физико-математических наук : 01.01.02 / Павлова Наталья Геннадьевна; [Место защиты: Моск. гос. ун-т им. М.В. Ломоносова]. - Москва, 2008. - 139 с. РГБ ОД, 61:08-1/208

Содержание к диссертации

Введение

1 Условия 2-регулярности и 2-нормальности 21

1.1 Условия 2-регулярности и 2-нормальности 21

1.2 Условия 2-регулярности и 2-нормальности для систем с импульсными управлениями 29

1.2.1 Постановка задачи

1.2.2 Условие 2-регулярности 34

1.2.3 Условие 2-нормалыюсти 37

2 Управляемость 43

2.1 Локальная управляемость нелинейных систем 43

2.1.1 Постановка задачи 43

2.1.2 2-регулярность и управляемость 45

2.1.3 2-нормальность и управляемость 48

2.2 Локальная управляемость линейных систем 50

2.3 Локальная управляемость систем с импульсными управлениями 57

3 Необходимые и достаточные условия экстремума для 2- нормальных процессов 62

3.1 Необходимые условия экстремума 62

3.2 Близость необходимых и достаточных условий экстремума для 2-нормальных процессов 67

4 Условия оптимальности второго порядка 70

4.1 Необходимые условия экстремума для нелинейных систем . 70

4.1.1 Постановка задачи 70

4.1.2 Решение соответствующей абстрактной задачи . 71

4.1.3 Необходимое условие локального минимума 77

4.2 Необходимые условия экстремума для задач с импульсными управлениями 105

4.2.1 Постановка задачи 105

4.2.2 Решение соответствующей абстрактной задачи 106

4.2.3 Необходимое условие локального минимума 113

Литература 134

Введение к работе

В настоящее время математический аппарат теории оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями, разработан достаточно полно. Фундаментальным результатом, полученным в этой области является принцип максимума Л.С. Понтрягина.

Одним из важных разделов теории оптимального управления является исследование задач оптималыюго импульсного управления, где изучаются динамические процессы с разрывными траекториями и обобщенными управлениями импульсного типа - векторными мерами. Это обусловлено в частности тем, что многие задачи оптимального управления, первоначально поставленные как классические, не имеют решения в традиционном классе абсолютно непрерывных траекторий и измеримых ограниченных управлений. Если в классической задаче оптимального управления множество допустимых значений управления неограни-чено, то в общем случае нельзя ожидать, что эта задача имеет решение в классе обычных управлений с разрывными траекториями.

Первые прикладные задачи, имеющие подобные особенности, возникли в ракетодинамике. Наиболее ярким примером является широко известная задача Лоудена о переводе космического корабля с одной орбиты на другую при минимальном расходе топлива. Следующий пример (см. [21]) в упрощенной форме моделирует особенности этой задачи.

Здесь и интерпретируется как скорость сжигания топлива, за счет которого создается сила тяги, а х - положение движущейся материальной точки. Задача состоит в переводе системы из точки ж(0) = 0 в точку х(1) = 1 с минимумом расхода топлива. Заметим, что существуют ракетные двигатели, способные расходовать топливо с очень высокой скоростью, развивая громадную тягу в течение коротких отрезков времени. Поэтому допущение о неограниченности управления сверху достаточно реалистично. Покажем, что в этой задаче обычное оптимальное управление не существует.

 

Условия 2-регулярности и 2-нормальности для систем с импульсными управлениями

Для получения достаточных условий локальной управляемости системы (1.1)-(1.3), а также при выводе необходимых условий первого и второго порядка для задачи оптимального управления, заключающейся в минимизации некоторого функционала на множестве допустимых процессов системы (1.1)-(1.3), большую роль играют понятия регулярности, 2-регулярности и 2-нормальности в рассматриваемой точке (хі,й(-), / ()) Перед тем, как ввести строгие определения этих понятий для системы (1.1)-(1.3), поясним суть этих определений для абстрактного отображения Ф, действующего из заданного банахова пространства Z п Шк.

Пусть z — заданная точка из Z, и отображение Ф дважды непрерывно дифференцируемо в окрестности z. Определение 1.1. Отображение Ф называется регулярным (нормальным) в точке z, если ітФ (г) = М.к, (1.4) где іт— образ линейного оператора. Известно, что если отображение Ф регулярно в точке 2, то для него справедлива теорема о неявной функции. Кроме того, для задачи минимизации (p(z) - тгщ Ф( ) = 0, (1.5) где tp — заданная гладкая функция, справедлив принцип Лагранжа (при А0 = 1), а также необходимые условия второго порядка. Если же точка z является анормальной, то есть ітФ (г) ф Жк, то утверждение классической теоремы о неявной функции, как известно, может не выполняться. Аналогично, в задаче минимизации (1.5) принцип Лагранжа является неинформативным, то есть выполняется при А0 = 0 (независимо от минимизируемой функции ср), а классические необходимые условия второго порядка могут не выполняться.

Таким образом возникает проблема нахождения условий, более тонких, чем условие (1.4), но которые бы гарантировали локальную разрешимость уравнения Ф(г) = у для всех z, близких к точке у = Ф(), а также наличие содержательных необходимых условий первого и второго порядка в задаче (1.5). Эти условия известны и называются условиями 2-регулярности (они были получены в [1]) и 2-нормальности ([8]). Приведем эти условия. Положим T(z) = {heZ: Ф (г)Л = 0, $"(z)[h, /г] Є ітФ (г)} . Возьмем h Є Т(г). Определим линейный оператор G(z, h) : хКегФ (г) — Kk по формуле G(z, Л)[Єі,6] - Ф (Жі + ф"( ,6]. Определение 1.2. Отображение Ф называется 2-регулярным в точке z по направлению h, если ітС(г,/і) = Rfc. (1.6) Как известно ([5]), существование вектора h Є T(z), вдоль которого отображение Ф 2-регулярно в точке z, гарантирует разрешимость уравнения Ф(-г) = у для всех у, достаточно близких к у = Ф(і). Кроме того, в задаче (1.5) для любого такого h справедливы некоторые необходимые условия первого и второго порядка, содержательные и в анормальном случае (то есть когда ігпФ (і) ф Шк). Обозначим через Р2(.г) конус, состоящий из таких А Є Kfc, А ф О, что Ф (г) А = 0 и в Z существует подпространство П = П(А): П С КегФ (г), сосіітП к; (А,Ф(1))[г,г] 0УгеП. Сразу же отметим, что конус F2(z) может оказаться пустым. Он, например, заведомо пуст, ести отображение Ф нормально в точке z, т.к. из (1.4) вытекает, что Ф (2) Х ф О V А Ф 0. Кроме того, после присоединения к этому конусу нуля он становится замкнутым, но вовсе не обязан стать выпуклым.

Считаем, что n-мерная вектор-функция / удовлетворяет следующим предположениям: при почти всех фиксированных t f(x,u,t) — дважды непрерывно дифференцируемая по (х, и) функция; для любых фиксированных (х,и) функции f(x,u,t), df(x,u,t)/d(x,u), d2f(x,u,t)/d(x,u)2 измеримы по t и на любом ограниченном множестве ограничены и непрерывны по (х, и) равномерно по t.

В качестве класса допустимых управлений рассматривается множество измеримых существенно ограниченных функций и Є L [ti,t2]. Рассмотрим допустимое управление й(-) и предположим, что соответствующее ему решение задачи (2.1), (2.2) существует на [ii,t2]. Согласно теореме единственности, это решение, которое обозначаем через x(t), t Є [i,t2], единственно и в силу теоремы существования для каждого допустимого управления м(-), близкого к й(-) в метрике пространства 1[ , ]) решение задачи (2.1), (2.2) существует. Пару вектор-функций (x(t),u(t)),t Є [іі, ], будем называть допустимым процессом, если и(-) — допустимое управление, а х(-) — соответствующее ему решение уравнения (2.1), удовлетворяющее начальному условию (2.2):

Сформулируем критерий управляемости системы (2.3)([54]): система (2.3) полностью управляема на [ti, t2] из точки xi, тогда и только тогда, когда detD Ф 0. 1 Система (2.3) называется полностью управляемой на [t\, ti\ из точки х\ Є М",если для любого x-z Є Еп существует управление и Є U такое, что решение x{t) системы (2.3), соответствующее этому управлению, удовлетворяет условию ж( ) = #2 Заметим, что если В = 0, то линеаризованная система (2.3) не является полностью управляемой из точки хх и вопрос о принадлежности точки x(t2) внутренности Dt2 открыт. Поставленная задача в случае, когда В = 0 исследуется в [11]. В частности получены достаточные условия локальной управляемости системы (2.1), (2.2):

Отсюда следует, что 2-нормальность задачи (2.1), (2.2) в точке (х\, й(-)) означает ни что иное как 2-нормальность введенного нами отображения F в точке "},(), а именно, конус convF является острым, т. е. не содержит никакого ненулевого линейного подпространства (здесь conv обозначает выпуклую оболочку множества). Отсюда следует, что процесс (хі,й(-)) является локально управляемым (в смысле определения 2.4) в точке x(t2) тогда и только тогда, когда отображение F(x(ti), и(-)) в точке х{Ц) удовлетворяет условию разрешимости (см. [7]). Теорема об обратной функции из [7] утверждает, что при выполнении условий 2-нормальности процесса (х,й) отображение F(x(ti), и(-)) в точке xfa) удовлетворяет условию разрешимости тогда и только тогда, когда выполняется условие (2.9). Теорема доказана. 2.2 Локальная управляемость линейных систем Исследуем поставленную задачу в случае, когда закон движения объекта записывается в виде линейной системы ОДУ, а множество допустимых управлений есть выпуклый замкнутый конус. Будем рассматривать объект, закон движения которого записывается в виде линейной системы обыкновенных дифференциальных уравнений: х = A(t)x + B(t)u(t), t Є [ і; t2] (2.11) с начальным условием x(ti) - 0. (2.12) . Здесь х = (xi,x2,... ,хп) ЄШп — n-мерный вектор фазового состояния системы, и = (щ, щ,..., ит) Є Mm — m-мерный вектор управления ( означает транспонирование). Для каждого I A(t) - матрица пхп, a B(t) - матрица п х т. Матрицы-функции А(-) и В(-) определены на отрезке ti t ti и являются аналитическими.

Локальная управляемость линейных систем

Фундаментальным результатом, полученным в этой области является принцип максимума Л.С. Понтрягина. Одним из важных разделов теории оптимального управления является исследование задач оптималыюго импульсного управления, где изучаются динамические процессы с разрывными траекториями и обобщенными управлениями импульсного типа - векторными мерами. Это обусловлено в частности тем, что многие задачи оптимального управления, первоначально поставленные как классические, не имеют решения в традиционном классе абсолютно непрерывных траекторий и измеримых ограниченных управлений. Если в классической задаче оптимального управления множество допустимых значений управления неограни-чено, то в общем случае нельзя ожидать, что эта задача имеет решение в классе обычных управлений с разрывными траекториями.

Первые прикладные задачи, имеющие подобные особенности, возникли в ракетодинамике. Наиболее ярким примером является широко известная задача Лоудена о переводе космического корабля с одной орбиты на другую при минимальном расходе топлива. Следующий пример (см. [21]) в упрощенной форме моделирует особенности этой задачи.

Здесь и интерпретируется как скорость сжигания топлива, за счет которого создается сила тяги, а х - положение движущейся материальной точки. Задача состоит в переводе системы из точки ж(0) = 0 в точку х(1) = 1 с минимумом расхода топлива. Заметим, что существуют ракетные двигатели, способные расходовать топливо с очень высокой скоростью, развивая громадную тягу в течение коротких отрезков времени. Поэтому допущение о неограниченности управления сверху достаточно реалистично. Покажем, что в этой задаче обычное оптимальное управление не существует.

Рассмотрим траекторию x(t), которая исходит из конечной точки (Т;х(Т)) = (1; 1) с управлением й = 0. Тогда x(t) = et_1, х(0) = е-1, так что x(t) не является допустимой траекторией. Однако, пара (х,й) задает границы возможного: для нее расход топлива "идеален— J (и) = 0, а ограничиваемая траекторией х площадь Ji(u) — 1 — е-1, как нетрудно увидеть, является верхней оценкой J\. J\{u) J І (и) для любого допустимого управления u(t).

Отсюда следует, что оптимального управления не существует: мы не можем получить значение критерия J\ = 1 — е-1, так как оно достигается только на недопустимой траектории х, и в то же время это число является точной верхней гранью J\(u) в силу (В.З).

Поскольку функция ж» "хорошо"аппроксимируется допустимыми траекториями, то ее естественно назвать обобщенной оптимальной траекторией в дайной задаче. Соответствующее импульсное управление представляет собой функцию е_1 5(0). Предельная картина (при п — об) оказывается такой: в начальный момент і = 0 мгновенно сжигается 1/е единиц топлива и управляемая материальная точка скачком перебрасывается на "магистраль" ж () = е -1, по которой движется в пассивном режиме до конечной точки.

Наглядным примером импульсного воздействия в макроэкономике могут служить так называемые монетарные импульсы — резкие изменения денежной массы в обращении. Они вызывают скачкообразное изменение ценовых уровней — важнейших показателей функционирования экономической системы. При попытке описать динамику цен с учетом монетарных импульсов мы вновь сталкиваемся с необходимостью рассматривать разрывные траектории (см. [60], [58]).

Многочисленные примеры моделирования скачкообразных процессов возникают при решении технических задач (см. [26, 35, 62]). Например, реакция опоры при ударном столкновении с нею ног шагающего робота или лазерное излучение в квантовой электронике являются импульсными по своей природе. Поэтому их моделирование также невозможно без введения обобщенных траекторий.

Близость необходимых и достаточных условий экстремума для 2-нормальных процессов

Траекторные компоненты минимизирующих последовательностей в таких нерегулярных, вырожденных задачах сводятся к разрывным функциям, а управляющие функции характеризуются наличием дельтообразных составляющих и сходятся в смысле распределений. Поэтому возникает проблема расширения этого класса задач, направленная на включение предельных элементов в множество допустимых процессов. На этом пути и возникают задачи импульсного управления.

В становление и развитие теории оптимального импульсного управления важнейший вклад внесли работы [20, 22-24, 26-34, 48, 51]. Вопросам оптимизации динамических систем, описываемых дифференциальными уравнениями с управляющими функциями импульсного типа, посвящено большое число исследований, в том числе работы [14, 27-29, 45]. Нелинейные управляемые системы являются важной и актуальной темой исследования. Ими описываются реальные процессы, многие прикладные задачи (в области экономики и техники). Несмотря на то, что исследования в этой области ведутся давно, до сих пор остаются малоизученными многие аспекты.

Для получения достаточных условий локальной управляемости динамической системы, а также при выводе необходимых условий первого и второго порядка для задачи оптимального управления, заключающейся в минимизации некоторого функционала на множестве допустимых процессов управляемой системы, большую роль играют понятия регулярности, 2-регулярности и 2-нормальности в рассматриваемой точке. Поясним суть этих определений для абстрактного отображения Ф, действующего из заданного банахова пространства Z в M.fc. Пусть z — заданная точка из Z, и отображение Ф дважды непрерывно дифференцируемо в окрестности z. Определение В.1. Отображение Ф называется регулярным (нормальным) в точке 2, если ітФ (г) = M.h, (В Л) где im— образ линейного оператора. Известно, что если отображение Ф регулярно в точке z, то для него справедлива теорема об обратной функции. Кроме того, для задачи минимизации ip(z) - min, (z) = О, {В.Ъ) где р — заданная гладкая функция, справедлив принцип Лагранжа (при А0 = 1), а также необходимые условия второго порядка. Если же точка z является анормальной, то есть ітФ (г) ф Жк, то утверждение классической теоремы о неявной функции, как известно, может не выполняться. Аналогично, в задаче минимизации (В.5) принцип Лагранжа является неинформативным, то есть выполняется при Ао = 0 (независимо от минимизируемой функции ср), а классические необходимые условия второго порядка могут не выполняться. Таким образом возникает проблема нахождения условий, более тонких, чем условие (В.4), но которые бы гарантировали локальную разрешимость уравнения Ф(г) = у для всех z, близких к точке у = Ф(), а также наличие содержательных необходимых условий первого и второго порядка в задаче (В.5). Эти условия известны и называются условиями 2-регулярности (они были получены в [1]) и 2-нормальности ([б]). Приведем эти условия.

Сразу же отметим, что конус F2(z) может оказаться пустым. Он, например, заведомо пуст, ести отображение Ф нормально в точке В, т.к. из (В.4) вытекает, что Ф (2) Х ф О V А ф 0. Кроме того, после присоединения к этому конусу нуля он становится замкнутым, но вовсе не обязан стать выпуклым. Определение В.З. [8] Отображение Ф называется 2-нормальным в точке z, если конус convF2(z) является острым, т.е. не содержит ненулевых подпространств (случай 2(2) = 0 не исключается, т.к. пустой конус острый по определению). В настоящей работе условия 2-регулярности и 2-нормальности расшифровываются применительно к управляемым системам. Перейдем к изложению результатов работы. Диссертация состоит из четырех глав, каждая из которых разделена на параграфы. Нумерация теорем, предложений, лемм, определений, замечаний, а также ссылок на формулы сквозная в пределах каждой главы. В первой главе диссертации рассматривается управляемая динамическая система dx{t) = f(x{t),u{t),t)dt + G{L)dfi{t), t Є [ti,t2], {ВЛ) x(tt) = хъ x(t2) = x2, (B.8) W(xux2) = 0, fiGK. (B.9) Здесь t Є [ti,t2] — время, ti t2 заданы, x — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве Жп, и = (щ,и2,..., ит) 6Rm - управление, / — н-мерная, G —п х -мерная, а W — ги-мерная вектор-функции (n, т, w — натуральные числа). Функция W предполагается дважды непрерывно дифференцируемой, а функция / — кусочно-гладкой, т.е. отрезок [ti, t2] представим в виде конечного числа отрезков [Ti,Tj+i] так, что сужение / на Жп х Rm х [тг-,ті+і] бесконечно дифференцируемо.

Решение соответствующей абстрактной задачи

Для произвольных (хі,и(-),ц(-)) Є Шп х L[ti,t2] х К, достаточно близких к (xi,u(-),/!()), в силу теорем о существовании и непрерывной зависимости решения задачи Копти от начальных условий и правой части существует единственное решение х(-) задачи Копій dx(t) = f(x(t),u(t),t)dt + G(t)dfi(t),x(tl) = x1, te[tut2], (В.10) Для указанных (хі,и(-), ц(-)) было определено отображение Ф : Rn х I&[ii, t2] х С - W" по формуле Ф(хь«(),/ ()) = W(xux(t2; хи и(-), //())). Здесь ж(і;жі,гі(-),д(-)), і Є [t\,t2] — решение задачи Коши (В.10). Для расшифровки понятия 2-регулярности и 2-нормальности применительно к системе (В.7)-(В.9), были получены формулы для вычисления производных отображения Ф по (u(-),/i(-)). Глава 2 посвящена исследованию локальной управляемости динамических систем. Рассматривается управляемая динамическая система x = f(x,u,t), є[ і, 2], (B.ll) x{t1)=xl. (В.12) Здесь і Є [ti,t2] — время, t\ t2 заданы, x — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве Шп, и = (щ,и2,..., ит) GRm — управление (n, т — натуральные числа). n-мерная вектор-функция / удовлетворяет следующим предположениям: при почти всех фиксированных t f(x,u,t) — дважды непрерывно дифференцируемая по (х, и) функция; для любых фиксированных (х, и) функции f(x,u,t), df(x,u,t)/d(x,u), d2f{x,u,t)/d{x,u)2 измеримы по t и на любом ограниченном множестве ограничены и непрерывны по (х, и) равномерно по t.

В качестве класса допустимых управлений рассматривается множество измеримых существенно ограниченных функций и Є L[t\,t2]. Рассматривается допустимое управление й(-) и предполагается, что соответствующее ему решение задачи (В.11), (В.12) существует на [ii, ]. Согласно теореме единственности, это решение, которое обозначаем через x(t), 4 Є [ti, t2], единственно и в силу теоремы существования для каждого допустимого управления и(-), близкого к «() в метрике пространства L[4i,42], решение задачи (В.11), (В.12) существует.

Через X обозначим линейное подпространство X = Rn х L[ibf2] х С , состоящее из всех тех (С, 5м, 5/х), что решение системы (В.25) Sx удовлетворяет граничным условиям (В.26). Для произвольного целого неотрицательного числа г через Лг = А.г(х,й, р) обозначим множество тех Л Є А(х,й,р), для которых индекс сужения формы Г2д на подпространство X не превышает г.

Пусть экстремаль (ж, й, Д) анормальна (т.е. d 0). Тогда если com; Л — выпуклая оболочка конуса Ad — содержит ненулевое подпространство, то условие (В.27) выполняется автоматически, так как максимум зависящей от переменной Л линейной функции по множеству, содержащему одновременно два вектора Л и (—А), неотрицателен. Таким образом, если конус conv Ad не является острым, то условие (В.27) содержательной информации не несет. Приведенная ниже теорема показывает, что в 2-нормальном случае это не так. Оказывается, что в этом случае "за-зор"между необходимыми условиями из теоремы 3.1 и достаточными условиями локального минимума в некотором смысле неулучшаем: Предположим, что концевые ограничения регулярны, т.е. rank lfdw , (х

Теорема 3.2. Предположим, что допустимый процесс (ж, и, р) является 2-нормальным для задачи (В.19)-(В.22) и для него выполняются необходимые условия второго порядка из теоремы 3.1.

Предположим также, что матрица df(x(t),u(t),t)/du имеет ранг т при почти всех t и существует непрерывная г-мерная функция такая, что (t)G(t) = 0 и ()((), и (і), ) = 0 для п.в.і Є [гь2].Тогда существуют такие вектор v Є №w и вектор-функция /3(t) Є 1/ ( ,г], что для любого є 0 тройка (ж, й, р) доставляет строгий конечномерный минимум в следующей возмущенной задаче:

Похожие диссертации на Условия оптимальности и управляемости для вырожденных управляемых систем