Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Левченко Николай Михайлович

Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления
<
Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Левченко Николай Михайлович. Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления : ил РГБ ОД 61:85-1/977

Содержание к диссертации

Введение

Глава. 1. Разрывные смстеш с параметрами 14

1. Предварительные результаты 14

1. Исходные посылки 14

2. Условия единственности решения 18

2. О кусочной гладкости решения 20

1. Предположения 20

2. Лемма о составной системе 22

3. Доказательство теоремы 26

4. Следствия теоремы 33

3. Применения теоремы 38

1. Производная решения по направлению 38

2. Анализ краевой задачи 40

Глава 2. Необходимые условия оптимальности разрывных систем 44

1. Формулировка задачи 44

2. Вариация допустимого процесса 48

3. Необходимые условия оптимальности 55

4. Обсуждение результатов. Примеры 64

Глава 3. Локальный синтез оптимального управления . 76

1. Формулировка задачи 76

2. Анализ нормальной экстремали Понтрягина 80

1. Дифференцируемость экстремали по начальным значениям 80

2. Вспомогательные леммы 84

3. Решение системы уравнений в вариациях 87

4. Об оптимальности номинального процесса 101

3. Локальный синтез 109

1. Регулярный случай 109

2. Особый случай 114

3. Частные случаи. Примеры 117

4. Оубоптимальный локальный синтез 121

1. Регулярный случай 121

2. Особый случай 126

Заключение 129

Литература 130

Введение к работе

I. Системы обыкновенных дифференциальных уравнений с разрывной правой частью (разрывные системы) привлекают внимание математиков уже длительное время. Интерес к таким системам во многом объясняется многочисленными важными приложениями в космонавтике, энергетике, радиотехнике, механике, теории автоматического регулирования и оптимального управления и других областях науки и техники.

Исследование разрывных систем ведется по многим направлениям. В ряду других важное место занимают вопросы качественной теории [2,3,13,29,31,46,53,54,57,58,64,69] и оптимального управления [5,7,12,19,27,31,36,39,40,48,49,50,52,55,56,59]. Несмотря на обилие работ полученные результаты не являются исчерпывающими. Известно, что свойства решения разрывной системы зависят от характера расположения интегральной кривой относительно поверхностей разрыва правой части системы. Недостаточно изучены следующие особые случаи: касание интегральной кривой поверхности разрыва, пересечение интегральной кривой нескольких поверхностей разрыва одновременно, скольжение интегральной кривой по пересечению поверхностей разрыва.

Предмет исследования в первых двух главах диссертации составляют вопросы качественной теории и теории оптимального управления разрывных систем. В главе I выясняются свойства зависимости решения разрывной системы от параметров. В главе її устанавливаются необходимые условия оптимальности в задаче оптимального управления разрывной системой. В главе Ш результаты качественной теории разрывных систем применяются для решения проблемы локального синтеза в задаче оптимального управления непрерывной системой.

Характеристику полученным результатам дадим позже. Прежде сделаем краткий обзор работ, примыкающих к тематике диссертации.

2. Начало качественной теории разрывных систем положено Каратеодори [64]. Большой вклад в ее развитие внесли М.А.Айзер-ман, Е.А.Барбашин, Е.Е.Викторовский, Л.С.Понтрягин, Е.С.Пятницкий, А.Ф.Филиппов и многие другие. Изложение известных точек зрения по некоторым принципиальным вопросам теории, а также обширная библиография содержатся, например, в [3,46,57J.

Среди отмеченных работ важное место занимает статья А.Ф.Филиппова [57]. Здесь дано понятие решения разрывной системы. При достаточно общих предположениях доказаны аналоги классических теорем о существовании, продолжаемости, единственности, непрерывной зависимости от начальных значений и правой части решений дифференциальных уравнений. Вытекающее из определения решения правило доопределения правой части разрывной системы на поверхности разрыва позволяет единственным образом продолжить решение, если интегральная кривая, попав на поверхность разрыва, уже не может с нее сойти. Результаты [57] находят широкое применение, например, в теории автоматического регулирования и оптимального управления.

М.А.Айзерманом и Ф.Р.Гантмахером показано [2], что производная решения разрывной системы по начальным значениям допускает разрыв I рода в момент пересечения интегральной кривой поверхности разрыва правой части системы. Позже этот результат был обоснован В.Б.Балакиным [13], Б.Н.Шеничным и Ю.М.Данилиным [53], У.Де Бакером [29]. В работах [54,69] установлено, что таким свойством обладает и производная решения по параметрам, от которых зависят правая часть системы и начальные данные. Свойство дифференцируемости решения по начальным значениям нарушается [31], если интегральная кривая пересекает одновременно две поверхности разрыва. Тем не менее сохраняется дифференцируемость решения по любому направлению [31], причем производная также разрывна в момент пересечения.

Обобщение выводов [2,13,29,53,54,69] на тот случай, когда на поверхности разрыва правой части системы должно претерпевать разрывы и ее решение, проведено в [17,60,61].

Примечательно то, что вопрос о дифференцируемости решения разрьшнои системы по начальным значениям и параметрам рассматривался, как правило, в связи с конкретными приложениями: здесь и исследование устойчивости периодического решения разрывной системы 12], изучение встречающегося в механике сплошных сред уравнения в частных производных [13], определение функций чувствительности [69] и получение необходимых условий оптимальности [Зі] в задачах оптимального управления, решение краевой задачи принципа максимума [53].

Задачи оптимального управления разрывными системами рассматривались Л.Т.Ащепковым [5], В.В.Величенко [19], М.И.Зелики-ным [31], Н.Н.Красовским [36], Е.И.Кугушевым [39,40], С.Ф.Морозовым и М.И.Суминым [48,49], Л.С.Понтрягиным и Р.В.Гамкрелидзе [52], Н.Х.Розовым [55], В.А.Троицким [56] и другими математиками. Наиболее обстоятельно исследован случай пересечения интегральной кривой (траекторией) поверхности разрыва правой части системы без односторонних касаний [19,27,36,50,52,55,56]. Необходимые условия оптимальности имеют форму принципа максимума [52] с дополнительными условиями скачка для сопряжения переменных в моменты пересечения.

Случаи пересечения с касанием интегральной кривой поверхности разрыва изучались в работах [5,59], Результатами [59] служат видоизмененные условия скачка для сопряженных переменных, результатами [5] - уточненные условия скачка и новый критерий оптимальности, связывающий решение сопряженной системы со скачком фазовой скорости в момент касания. Интересным оказалось то, что тривиальность этого критерия служит предварительным условием выполнения принципа максимума и в этом смысле он предшествует принципу максимума.

В работах [39,40,48] разобран случай скольжения оптимальной интегральной кривой по поверхности разрыва и сформулированы некоторые аналоги принципа максимума. Методы их доказательства (предельный переход [39-,40], вариационный принцип Экланда [48]) существенно используют предположение о выпуклости векто-граммы разрывной системы. Более естественные предположения типа усиленных условий скольжения приняты в [49]. С помощью метода игольчатого варьирования управления здесь установлено локальное необходимое условие оптимальности.

Случай пересечения интегральной кривой одновременно двух поверхностей разрыва рассмотрен в [31]. Итогом [31] оказались два необходимых условия оптимальности типа принципа максимума, каждое из которых действует на своем подмножестве области управления.

Достаточные условия оптимальности получены в работах [5,8, 9,19,21,36].

Вопросы оптимизации параметров разрывных систем являются предметом исследования, в частности, в статье [7] и диссертации [12].

Проблеме синтеза оптимального управления в форме обратной связи посвящено огромное количество исследований. Тем не менее общей теории синтеза до сих пор не создано. Проблема оказывается чрезвычайно сложной и полно изучена лишь в некоторых простейших случаях. Основные результаты получены при использовании принципа максимума Л.С.Понтрягина [15,23,52], метода динамического программирования [14,33,37,44], близко примыкающего к последнему метода В.Ф.Кротова [38] и метода, основанного на применении аппарата функций A.M.Ляпунова [32,41]. Анализ современного состояния проблемы дан в обзорной работе [24].

При проектировании систем автоматического управления актуален локальный синтез, т.е. синтез в окрестности номинальной (программной) траектории. Известные подходы к решению проблемы локального синтеза в задачах стабижзации номинальной траектории изложены в монографиях [32,37,41,44,47]. Методы локального синтеза в задачах оптимального управления рассмотрены', например, в работах [16;41,66,67,68,70]. Более обстоятельно изучен случай, когда область управления не ограничена и номинальное управление непрерывно [16*41,67,70]. В случае релейного номинального управления в [66,68] предложены методы синтеза точек переключения. Основной недостаток работ [16,66,67,68,70] видится в отсутствии должного внимания к вопросам, связанным с существованием решения проблемы и его свойствами. Ясно, что решение этих вопросов может составить реальную основу для построения методов лоального синтеза и их обоснования.

3. Остановимся кратко на содержании диссертации.

В главе I рассматривается вопрос о зависимости решения разрывной системы от параметров правой части и начальных данных.

Рассмотрение носит локальный характер: оно ведется в окрестности номинальных значений параметров для случая, когда соответствующая им интегральная кривая залегает на одной из поверхностей разрыва правой части системы на некотором отрезке времени и пересекает несколько поверхностей разрыва в концах этого отрезка.

Центральным результатом главы I является теорема о непрерывной, кусочно-гладкой зависимости решения разрывной системы от времени и параметров. Указаны способ построения локальных дифференцируемых продолжений решения и правило вычисления их производных по параметрам. Установлено, что свойство дифференци-руемости решения по параметрам нарушается при тех значениях параметров, которым отвечают интегральные кривые, имеющие точки на пересечениях поверхностей разрыва, и, в частности, при номинальных значениях. Последнее отличает данный случай от рассмотренного в [2,13,29,53,54,69]. Вместе с тем анализ отмеченных результатов позволяет легко получить выводы [2,13,29,53,54,69] и некоторые другие в ряде частных случаев. На основе теоремы решен вопрос о дифференцируемости решения по направлениям при номинальных значениях параметров. В итоге обобщены соответствующие выводы [ЗІ]. В заключение показана возможность использования результатов для исследования разрывной краевой задачи.

О кусочной гладкости решения

Задачи оптимального управления разрывными системами рассматривались Л.Т.Ащепковым [5], В.В.Величенко [19], М.И.Зелики-ным [31], Н.Н.Красовским [36], Е.И.Кугушевым [39,40], С.Ф.Морозовым и М.И.Суминым [48,49], Л.С.Понтрягиным и Р.В.Гамкрелидзе [52], Н.Х.Розовым [55], В.А.Троицким [56] и другими математиками. Наиболее обстоятельно исследован случай пересечения интегральной кривой (траекторией) поверхности разрыва правой части системы без односторонних касаний [19,27,36,50,52,55,56]. Необходимые условия оптимальности имеют форму принципа максимума [52] с дополнительными условиями скачка для сопряжения переменных в моменты пересечения. Случаи пересечения с касанием интегральной кривой поверхности разрыва изучались в работах [5,59], Результатами [59] служат видоизмененные условия скачка для сопряженных переменных, результатами [5] - уточненные условия скачка и новый критерий оптимальности, связывающий решение сопряженной системы со скачком фазовой скорости в момент касания. Интересным оказалось то, что тривиальность этого критерия служит предварительным условием выполнения принципа максимума и в этом смысле он предшествует принципу максимума.

В работах [39,40,48] разобран случай скольжения оптимальной интегральной кривой по поверхности разрыва и сформулированы некоторые аналоги принципа максимума. Методы их доказательства (предельный переход [39-,40], вариационный принцип Экланда [48]) существенно используют предположение о выпуклости векто-граммы разрывной системы. Более естественные предположения типа усиленных условий скольжения приняты в [49]. С помощью метода игольчатого варьирования управления здесь установлено локальное необходимое условие оптимальности. Случай пересечения интегральной кривой одновременно двух поверхностей разрыва рассмотрен в [31]. Итогом [31] оказались два необходимых условия оптимальности типа принципа максимума, каждое из которых действует на своем подмножестве области управления. Достаточные условия оптимальности получены в работах [5,8, 9,19,21,36]. Вопросы оптимизации параметров разрывных систем являются предметом исследования, в частности, в статье [7] и диссертации [12].

Проблеме синтеза оптимального управления в форме обратной связи посвящено огромное количество исследований. Тем не менее общей теории синтеза до сих пор не создано. Проблема оказывается чрезвычайно сложной и полно изучена лишь в некоторых простейших случаях. Основные результаты получены при использовании принципа максимума Л.С.Понтрягина [15,23,52], метода динамического программирования [14,33,37,44], близко примыкающего к последнему метода В.Ф.Кротова [38] и метода, основанного на применении аппарата функций A.M.Ляпунова [32,41]. Анализ современного состояния проблемы дан в обзорной работе [24]. При проектировании систем автоматического управления актуален локальный синтез, т.е. синтез в окрестности номинальной (программной) траектории. Известные подходы к решению проблемы локального синтеза в задачах стабижзации номинальной траектории изложены в монографиях [32,37,41,44,47]. Методы локального синтеза в задачах оптимального управления рассмотрены , например, в работах [16;41,66,67,68,70]. Более обстоятельно изучен случай, когда область управления не ограничена и номинальное управление непрерывно [16 41,67,70]. В случае релейного номинального управления в [66,68] предложены методы синтеза точек переключения. Основной недостаток работ [16,66,67,68,70] видится в отсутствии должного внимания к вопросам, связанным с существованием решения проблемы и его свойствами. Ясно, что решение этих вопросов может составить реальную основу для построения методов локального синтеза и их обоснования.

Производная решения по направлению

Рассмотрение носит локальный характер: оно ведется в окрестности номинальных значений параметров для случая, когда соответствующая им интегральная кривая залегает на одной из поверхностей разрыва правой части системы на некотором отрезке времени и пересекает несколько поверхностей разрыва в концах этого отрезка.

Центральным результатом главы I является теорема о непрерывной, кусочно-гладкой зависимости решения разрывной системы от времени и параметров. Указаны способ построения локальных дифференцируемых продолжений решения и правило вычисления их производных по параметрам. Установлено, что свойство дифференци-руемости решения по параметрам нарушается при тех значениях параметров, которым отвечают интегральные кривые, имеющие точки на пересечениях поверхностей разрыва, и, в частности, при номинальных значениях. Последнее отличает данный случай от рассмотренного в [2,13,29,53,54,69]. Вместе с тем анализ отмеченных результатов позволяет легко получить выводы [2,13,29,53,54,69] и некоторые другие в ряде частных случаев. На основе теоремы решен вопрос о дифференцируемости решения по направлениям при номинальных значениях параметров. В итоге обобщены соответствующие выводы [ЗІ]. В заключение показана возможность использования результатов для исследования разрывной краевой задачи. Глава П посвящена необходимым условиям оптимальности в задаче оптимального управления разрывной системой. Исследование ведется в предположениях главы I о характере расположения (оптимальной) интегральной кривой относительно поверхностей разрыва. Методика вывода необходимых условий оптимальности основывается на традиционной технике игольчатого варьирования управления [52] и указанном в [4,6] приеме редукции вариационной задачи к конечномерной задаче математического программирования, в которой независимыми являются параметры вариации оптимального процесса. В итоге дело сводится к применению известного правила множителей Лагранжа с последующей его расшифровкой в терминах исходной задачи и обоснованием существования "универсальных" множителей Лагранжа.

Установлено, что оптимальный процесс отвечает конечному набору условий типа принципа максимума. Эта особенность обусловлена кусочной гладкостью решения разрывной системы по параметрам. Вместе с тем на интервале скольжения условие максимума гамильтониана имеет локальный характер. Существенность последнего подтверждена примером. Глобальное необходимое условие оптимальности установлено для частного случая задачи. Как следствие результатов при соответствующих предположениях получены выводы [19,27, ЗГ,49,52,55!,561.

По сравнению с [39,40,48] проведенное исследование не предполагает наличие одной поверхности разрыва и выпуклости гектограммы системы. Кроме того, на интервале скольжения сопряженная система не содержит характерного для [39,40] слагаемого с мерой. Благодаря этому подученные необходимые условия оптимальности более приемлемы для практического применения.

Необходимые условия оптимальности

По сравнению с [39,40,48] проведенное исследование не предполагает наличие одной поверхности разрыва и выпуклости гектограммы системы. Кроме того, на интервале скольжения сопряженная система не содержит характерного для [39,40] слагаемого с мерой. Благодаря этому подученные необходимые условия оптимальности более приемлемы для практического применения. В главе Ш рассматривается проблема локального синтеза в задаче оптимального управления непрерывной системой. Предполагается, что: I) точка максимума гамильтониана по управлению есть кусочно-непрерывная функция времени, фазовых и сопряженных переменных; интегральная кривая краевой задачи принципа максимума при номинальных начальных значениях последовательно пересекает поверхности разрыва в различные моменты времени без односторонних касаний. Результаты качественной теории разрывных систем позволяют изучить свойства зависимости решения краевой задачи принципа максимума от начальных значений в окрестности номинальной точки. На этой основе, используя теорию поля экстремалей [20,21, 22,28], можно выяснить условия существования оптимального управления и его свойства в малой окрестности номинальной экстремали. Получены конструктивные достаточные условия существования кусочно-непрерывного, кусочно-гладкого оптимального управления.

Описан алгоритм вычисления производных оптимального управления и нормалей к поверхностям разрыва его значений вдоль номинальной экстремали. На этой основе с использованием кусочно-линейной аппроксимации оптимального управления построен метод субоптимального локального синтеза и проведено его обоснование. Результаты главы I позволяют рассмотреть и тот случай, когда интегральная кривая краевой задачи принципа максимума пересекает несколько поверхностей разрыва одновременно. Схема рассмотрения сохраняется. Ее реализация и конечные результаты имеют ряд специфических особенностей, обусловленных недифференцируемостью решения краевой задачи по начальным значениям в номинальной точке, и выходят за рамки настоящей диссертационной работы. 4. В диссертации используются следующие обозначения. Символом Е обозначается П -мерное евклидово пространство. Все векторы считаются столбцевыми, штрих используется как знак транспонирования. Тогда по правилам векторной алгебры 6L v скалярное произведение векторов d j WOW-ic C) 2, евклидова норма вектора С } Вб(С)-{Х:ЦХ-СЦ } -открытый шар радиуса S с центром в точке С .

Окрестностью множества и с h называется любое открытое множество Е , содержащее (г . Символами l t /г , и обозначаются ядро и замыкание /г . В (-) = (/ В (ж) -шаровая 8 -окрестность (г , со/гі/ (г - выпуклая оболочка /г . Пусть f(&) - функция аргумента сеє Е . Условие J? 6 означает, что функция f непрерывна в области определения вместе со всеми частными производными к -го порядка. Если (&) - векторная функция, то fx, ) - матрица Якоби (&) . Если $( ь) - скалярная функ ция, то &№) - градиент Для обозначения скалярных и векторных величин более высокого порядка малости, чем , используется символ о (6) .По определению 0&yt —О при — о . Система ссылок следующая. Формулы, предложения; леммы, утверждения и теоремы внутри каждой главы имеют автономную нумерацию. При ссылках на результаты другой главы используется двойная нумерация, где первая цифра означает номер главы, двойная нумерация используется и при ссылке на пункт друтого параграфа; здесь первое число указывает номер параграфа. Для указания пункта другой главы применяется тройная нумерация: первое число обозначает номер главы, второе - номер параграфа-, третье - номер пункта. Список цитированной литературы приводится в алфавитном порядке. В том же порядке даются ссылки на первоисточники.

Дифференцируемость экстремали по начальным значениям

Под разрывными системами всюду далее понимаются системы обыкновенных дифференциальных уравнений, правые части которых в области определения имеют разрывы I рода на некоторых заданных поверхностях. Эти поверхности называются поверхностями разрыва. Основное внимание в главе I сконцентрировано на вопросах качественной теории разрывных систем и, прежде всего, - на вопросе зависимости решений от параметров, входящих в правые части уравнений и уравнения поверхностей разрыва. Предполагается, что на некотором отрезке времени интегральная кривая разрывной системы при номинальных значениях параметров залегает на одной из поверхностей разрыва и в концах отрезка имеет общие точки с несколькими такими поверхностями. Показано, что при значениях параметров, близких к номинальным, решение разрывной системы существует, единственно и кусочно гладким образом зависит от времени и параметров. Даны правила построения локальных дифференцируемых продолжений решения и вычисления их производных. Отмечены следствия и указаны некоторые применения результатов. В данном параграфе конкретизировано понятие разрывной системы и ее решения, приведены некоторые известные свойства решения и доказана его единственность. I. Исходные посылки.

Пусть п , , к. - натуральные числа, "К" = { 1,..., К- } - индексное множество, t - скалярная переменная (время), = ( 1,...,2 ), =(/ ,..., ) -векторы фазовых переменных и параметров. Пусть R ,.. . , Рк ( + 9,) - мерные гладкие поверхнос- ти евклидова пространства Е переменных ("t, х 7у ), обладаю- щие таким свойством: для почти всех i0 Е и всех у Еv сечение каждой поверхности v-x и - мерной плоскостью (i )- ({0,JK) либо пусто, либо, в свою очередь, является (fb-1) -мерной гладкой поверхностью в Ь v . Полагаем, что каждая поверхность Р задана скалярным уравнением p.(7?/O=0 с функцией 0. класса С . Пусть ± : h — t - вектор-функция класса ( во всей области определения, кроме поверхностей г± 7..., Рк , на которых она может иметь разрывы I рода. Более того, полагаем, pt 0 7 ієТ\І } f 0 , то существует продолжение У функ- ции і с ІІ на с % принадлежащее классу Ь вместе с частными производными по последним га- о, аргументам.

Введем в рассмотрение систему обыкновенных дифференциальных уравнений Систему (I) назовем разрывной системой, а поверхности 17 разрыва ее правой части - поверхностями разрыва. Далее в этом параграфе параметры jx, считаем фиксированными. Следуя А.Ф.Филиппову [58] под решением разрывной системы (I) понимаем абсолютно-непрерывную вектор-функцию :( , ) Е , которая почти всюду на (і0,і) удовлетворяет включению x(0Fft,xft),/O . (2) Здесь F(t, ()T/b ) - наименьшее выпуклое замкнутое множество, содержащее все предельные значения функции он- ll,X-,jb) в точке Х(1) . Символом Г (Л) обозначаем (обобщенную) интегральную кривую разрывной системы (I) на промежутке А с (i0l±±) : В силу свойств Pi,.. -, Рк множество F(7 M ) определе-но для почти всех Ь Ё . Если точка (-т#7уО принадлежит Dx для некоторого Г К , то ft? &ij ) - единственный элемент Jr(ixZ,ji) # ЕСЛИ же точка (-;ж-тіО лежит на одной или нескольких из поверхностей Pi, .. . 7 Рк , то FU , ) - выпуклая оболочка всех тех векторов і (, ,у ) , для каждого из которых область Dj имеет непустое пересечение с любой окрестностью точки (-fcT#Tw) в плоскости (tT М )= сопві . В любом случае

Похожие диссертации на Вопросы зависимости решений разрывных систем от параметров и их применение в задачах оптимального управления