Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Хлопин Дмитрий Валерьевич

Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики
<
Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Хлопин Дмитрий Валерьевич. Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики : диссертация ... кандидата физико-математических наук : 01.01.02.- Екатеринбург, 2006.- 172 с.: ил. РГБ ОД, 61 06-1/988

Содержание к диссертации

Введение

1 Отслеживание скользящих режимов 27

1.1 Управляемая система 27

1.2 Метод экстремального сдвига 32

1.3 Характеризация предельных траекторий. Нацеливание на квазидвижение 37

1.4 Нацеливание на траекторию 41

2 Отслеживание квазистратегии в условиях неопределенности 48

2.1 Постановка задачи 48

2.2 Решение в классе допустимых управлений 52

3 Корректность задачи управления 55

3.1 Содержательные постановки исследуемых оптимизационных задач 55

3.2 Исходная и возмущенная динамические системы. Формулировка исходных оптимизационных задач 65

3.3 Скользящие режимы 72

3.4 Стратегии. Экстремальный сдвиг 77

3.5 Особенности пошаговых процедур для систем с разрывной по времени правой частью 8G

3.6 Предельные теоремы 98

3.7 Устойчивость по функционалу снизу 118

3.8 Устойчивость по функционалу сверху 128

Приложение 141

Введение к работе

Общая характеристика работы

Представленная диссертация посвящена конструкциям управления на основе метода экстремального сдвига Н.Н.Красовского и А.И.Субботина в системах с нелипшицевой правой частью, а также исследованию для таких систем вопросов устойчивости решений к малым помехам.

Предыстория и актуальность темы

Развитие теории экстремальных задач привело в середине 50-х годов к созданию теории оптимального управления, центральным результатом которого стал принцип максимума Л.С.Понтрягина. Этот принцип [84], разработанный Л.С.Понтрягиным и его учениками ( А.В. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мишенко) дает необходимые условия оптимальности первого порядка.

В теории дифференциальных игр использование подобных принципу максимума экстремальных методов для построения оптимальных (или близких к оптимальным) стратегий привело к созданию Н.Н.Красовским метода экстремального прицеливания [37-39]. В этом методе управление строилось по принципу обратной связи решением вспомогательных задач прогнозируемого программного управления. В 1970 году Н.Н.Красовским и А.И.Субботиным были опубликованы работы [40, 45, 46], в которых было введено несколько иное условие экстремальности, а именно, для построения движения вдоль стабильного моста на каждом шаге выбиралось управление, обеспечивающее максимальный сдвиг в сторону этого моста. Этот метод позже стал называться методом экстремального сдвига. С помощью этого метода Н.Н.Красовским и А.И.Субботиным была установлена фундаментальная теорема об альтернативе [47] в дифференциальной игре общего вида. При этом вариант, связанный с прицеливанием на стабильный мост (см. [47], [46]) и используемый в доказательстве теоремы об альтернативе, не обладал устойчивостью к информационным помехам, т.е. к помехам канала измерения. Однако модификация правила экстремального сдвига, реализованная Н.Н.

Красовским и А.И. Субботиным в схеме управления с поводырем (см. [47], [41]), уже обладает требуемым свойством устойчивости к информационным помехам. При этом происходило отслеживание уже не стабильного моста, а некоторого идеально управляемого объекта, двигающегося, в свою очередь, по некоторой идеальной траектории. Экстремальное управление с моделью (поводырем) широко использовалось в процедурах на основе стохастического программного синтеза, концепция которого предложена Н.Н. Красовским; см. [43]. Таким образом, в теории дифференциальных игр при помощи метода экстремального сдвига осуществлялась аппроксимация предельных (конструктивных) движений, в терминах которых формулировались условие успешной разрешимости соответствующих игровых задач.

Для систем с нелипшицевой по фазовой переменной правой частью, для получения соответствующего варианта теоремы об альтернативе, А.В.Кряжимским был разработан вариант метода экстремального сдвига, в котором нацеливание производилось не на траекторию, а на некоторое квазидвижение [48], [49]. Такая конструкция затем использовалась в [58] для получения условий, имеющих смысл альтернативной разрешимости, но в предположениях, не требующих обобщенной единственности.

Позже А.В.Кряжимским и Ю.С.Осиповым на основе идеи отслеживания модели был создан principle of guided models. Этот метод используется для решения некорректных задач динамической оптимизации [205], [55], [76], [77], [183], [184]; для решения задач математического программирования [56], [181], [182]. В связи с этим методом отметим также работы [19], [67], [68], [69], [78], [193].

Метод экстремального сдвига Н.Н.Красовского и А.И.Субботина применялся и в теории программного управления для отслеживания траекторий. В работе [134] была построена процедура приближения конкретной траектории, порожденной конечно-аддитивной мерой, при помощи допустимых траекторий. Этот метод используется для приближения оптимального решения также в [103].

На сегодняшний момент математическая теория динамических систем и оптимальных процессов хорошо разработана. Это результат работы

многих отечественных и зарубежных математиков - Н.Н.Красовского [37]-[47], [180], Л.С.Понтрягина [83], R.Bellman [145]. Существенный вклад в ее развитие внесли А.А.Аграчев, Э.Г.Альбрехт, В.Д.Батухтин, В.Г.Болтянский, Р.Ф.Габасов Р.В.Гамкрелидзе, Ф.М.Кириллова, А.Ф.Клейменов, А.В.Кряжимский, А.Б.Куржанский, Н.Ю.Лукояиов, В.И.Максимов, А.А. Меликян, Е.Ф.Мищенко, Ю.С.Осипов, В.С.Пацко Л.А.Петросян, Б.Н.Пшеничный, Ю.Л.Сачков, А.Н.Сесекин, А.И.Субботин, Н.Н.Субботина, А.М.Тарасьев, В.М.Тихомиров, А.А.Толстоногов, В.Е.Третьяков, В.Н.Ушаков, А.Г.Ченцов, Ф.Л.Черноусько, А.А.Чикрий, J.P.Aubin, W.H.Fleming, A.Friedman, R.Isaacs, E.Roxin, H.J.Sussmann, RVaraiya, J.Warga и другие, см. [2-4,7-10,12,17,20,22,23,25,32,33,48-50, 57,58,61,64,65,69,73,80,82,84-86,89,90,92,101,102,123-128,133,135,136, 141,150-153,161-164,184,211,214,217,219-222]

В прикладных задачах управления нередко присутствуют помехи канала наблюдения, различные искажения в цепи формирования управляющих взаимодействий, могут возникать помеховые управления и неконтролируемые управления, формируемые целенаправленно для достижения цели, отличной от цели в основной задаче. Вопросы такого рода традиционно рассматриваются в рамках теории дифференциальных игр с неполной фазовой информацией; см. [47], [43]). В задачах теории управления, осложненных воздействием помех, наиболее естественным способом формирования управляющих воздействий является обратная связь. Последовательная реализация идеи гарантированного управления в условиях неконтролируемых факторов привела, однако, к существенному изменению взгляда на сам характер законов управления по принципу обратной связи. Упомянутое радикальное изменение представлений можно связать с формализацией Н.Н. Красовского [39], [47], [43], [44], которая, с одной стороны, позволяла проводить глубокие теоретические исследования, а с другой, - определяла широкие возможности инженерной реализации существенно нерегулярных законов управления по принципу обратной связи. Существенность таких (нелинейных, разрывных) законов была убедительно показана Н.Н.Субботиной и А.И.Субботиным [8], [7]. Другая формализация в теории дифференциальных игр связана

с понятием "квазистратегия", см. работы [160, 214, 215, 221, 222]. Многозначные квазистратегии использовались в [58,123,125,130,131,133, 178,179]. Отметим также формализацию дифференциальной игры в классе є— стратегий Б.Н.Пшеничного [85], [211].

Задачи управления с неполной информацией исследовались в работах Н.Н.Красовского, А.В.Кряжимского, А.Б.Куржанского, Ю.С.Осипова, А.И.Субботина, Ф.Л.Черноусько [47], [180], [204], [60], [50], [13G]. (в частности, отметим конструкции дифференциальных игр с неполной информацией [47] и важное понятие информационного множества в [60]). Дальнейшее развитие решения задач с неполной информацией связано с работами А.Б.Куржанского, Т.Ф.Филипповой, Б.И.Ананьева, М.И.Гусева, С.И.Кумкова, О.И.Никонова, В.С.Пацко, I.Valyi и других, см. [75,80,106, 139,169,185-187].

В данной работе помимо теории динамических систем и оптимальных процессов, качественной теории дифференциальных уравнений используется также и элементы теории некорректных задач, применяемые к решению неточно заданных задач. Методы устойчивых приближенных решений некорректно поставленных задач получены А.Н.Тихоновым, В.К.Ивановым, М.М.Лаврентьевым, а также А.Л.Агеевым, В.Я.Арсениным, В.В.Васиным, Ф.П.Васильевым, А.С.Леоновым, В.А.Морозовым, В.П.Танана, А.Г.Яголой и другими (см., например, [31,96,97], [29,30,62,63,94,95], [1,6,14,18,74,93,223]).

Направление, связанное с корректностью постановки экстремальных задач, устойчивостью их решений к малым регулярным возмущениям получило большое развитие во многих работах (см., например, обзор А.Дончева [27]). В настоящее время основная масса работ посвящена вопросам устойчивости к сингулярным возмущениям или в системах, порожденных дифференциальными включениями, здесь необходимо отметить работы А.И.Булгакова, А.Дончева, В.Гайцгори, А.А.Толстоногова Z. Artstein, J.-P. Aubin, A. Cellina, F. Clarke и других, (см. [15, 16, 21, 100, 154, 157, 220]). Аппроксимации решений дифференциальных включений посвящены работы [142], [99].

Для нелипшицевых систем работ, посвященных вопросам устойчивости

в задачах управления, крайне мало, отметим исследование А.В. Болтянского [13] и работы А.В.Кряжимского с учениками [51] [52], [53], [54].

Для придания экстремальной задаче хороших свойств исходное множество допустимых элементов погружается в подходящий компакт: реализуется принцип расширения. Такие расширения строятся в задачах оптимального управления [23], [17], [138], вариационного исчисления [32], [138]. В теории управления наибольшее распространение в качестве таких обобщенных элементов получили скользящие режимы, управления Р.В.Гамкрелидзе, несколько реже конечно-аддитивные меры [127-129].

В дифференциальных играх (идеализированные) конструктивные движения обычно вводятся (согласно формализации Н.Н.Красовского) как пределы пошаговых движений (см. также "K-mothionsnB [3], [175]). Метод экстремального сдвига Н.Н.Красовского и А.И.Субботина позволяет отслеживать конструктивное движение ломаными Эйлера (см. [47]). Целесообразно развить подобные конструктивные процедуры для построения идеальных элементов в системах с нелипшицевой правой частью.

В различных задачах с импульсным управлением возникает разрывность и негладкость движений системы, отсутствует непрерывная зависимость от начальных данных, возможна неединственность решений. Более того, такие сложности возникают в реальных физических задачах (см. обширную библиографию в [172]), например в робототехнике [207], [195], [168]. Обсуждение и исследование такого рода задач смотрите, например, [79,147,148,194,196,21G]

Перечисленные выше особенности в механических системах возникают не только в задачах с импульсным управлением. Так, например, в работах [70], [71], [72] разработана модель, разрешающая известный в механике парадокс Пенлеве. Правая часть уравнения динамики, возникающего в этой модели, помимо имеющейся разрывности по фазовой переменной, в области непрерывности не является липшицевым несмотря на ограниченность правой части. В работах [158], [159] иследуется задача двух тел из классической электродинамики; правая часть уравнения динамики в этой задаче не удовлетворяет условию Липшица по фазовой

переменной.

Различные критерии единственности решений задачи Коши разрабатывались в теории дифференциальных уравнений с конца девятнадцатого века (см., например, [36,81,146,155,173,174,189,202,206], обзоры [107, 188, 191, 208]). Необходимое и достаточное условие единственности [200, 201], полученное в терминах функций Ляпунова, послужило толчком для исследования множеств достижимости (выживаемости) (см. [190], [149, 170, 197, 224]). Отметим работы, проясняющие структуру пучка решений [105,140,156,166,171,177,198,212, 213,218], "малость"множества точек неединственности [192,199,203,209].

В [5, с.5-10] для повседневных физических задач В.И.Арнольдом обсуждаются вопросы неединственности траекторий и отсутствия непрерывной зависимости от начальных условий (см. также обсуждение одной физической задачи Х.Уитни в [167]).

Все сказанное выше мотивирует изучение систем с нелипшицевой правой частью, а именно вопросов построения обобщенных элементов и вопросов корректности задач оптимизации.

Цель работы:

Целью работы является аппроксимация идеальных элементов методом экстремального сдвига Н.Н.Красовского и А.И.Субботина в динамических системах с нелипшицевой правой частью, а также исследование вопросов устойчивости к малым помехам в задачах теории управления при помощи разработанных методов аппроксимации.

Методы иследования

Представленные в диссертации исследования опираются на методы из теории позиционных дифференциальных игр, качественной теории дифференциальных уравнений, теории управления. Используются результаты из топологии, функционального анализа, теории меры.

Научная новизна

Основные результаты диссертации являются новыми.

Получены условия применимости метода экстремального сдвига Н.Н.Красовского и А.И.Субботина для аппроксимации обобщенных траекторий в управляемых системах с нелипшицевой (по фазовой переменной) правой частью, а именно:

установлено, что у построенных в рамках метода экстремального сдвига Н.Н. Красовского и А.И.Субботина последовательностей допустимых траекторий все предельные точки удовлетворяют экстремальному свойству почти всюду;

при выполнении условия обобщенной единственности показана универсальность нацеливания на квазидвижение: если обобщенная траектория аппроксимируется допустимыми траекториями, то это можно сделать при помощи нацеливания на квазидвижение;

отмечено, что в некоторых управляемых системах существуют обобщенные траектории, не отслеживаемые при помощи нацеливания на квазидвижение; более того приведен пример управляемой системы, в которой, с одной стороны, существует однозначная зависимость траектории от допустимого управления, а с другой, существуют такое обобщенное управление и порожденная им траектория, что нацеливание на эту траекторию не позволяет отследить никакой траектории из пучка, порожденного этим обобщенным управлением;

найдены ряд условий, достаточных для того, чтобы все обобщенные траектории (или конкретную обобщенную траекторию) можно получить отслеживанием на траекторию.

В нелинейной задаче управления с неполной информацией одной из взаимодействующих систем о поведении другой построена принципиально реализуемая схема отслеживания пучка траекторий, порожденных квазистратегией. Таким образом, установлена принципиальная возможность реализации решения в классе квазистратегий при помощи последовательности пошаговых движений, формируемых с использованием принципа экстремального сдвига, в задаче

гарантированного сближения в течение заданного промежутка времени до момента с функцией из заданного пучка.

Построены модифицированные пошаговые конструкции метода экстремального сдвига Н.Н.Красовского и А.И.Субботина для управляемых систем с разрывной по времени правой частью, а именно, в условиях на правую часть, близких к условиям Каратеодори:

приведен пример, в котором для успешной аппроксимации конкретной траектории необходимо подбирать измельчающую последовательность разбиений промежутка времени, более того, для осуществления такого выбора недостаточно знать правую часть уравнения динамики почти всюду, в частности, для этого выбора измельчающей последовательности недостаточно выбирать моменты времени среди точек Лебега (или даже точек непрерывности) правой части;

предложен метод выбора "подходящей" измельчающей

последовательности по известной правой части уравнения динамики управляемой системы.

В рамках упомянутых выше условий для метода экстремального сдвига при нацеливании на траекторию или квазидвижение установлена устойчивость

к малым помехам правой части уравнения динамики (с метрикой равномерной сходимости);

к малым возмущениям начального положения системы;

к малым вычислительным ошибкам, допущенным при нацеливании.

Предложены два варианта оптимизационной задачи, в зависимости от того, в чьей власти находится выбор конкретной траектория из пучка, порождаемого данным управлением. Исследуется устойчивость этих задач к малым возмущениям: начальных условий и уравнения динамики.

Для одной из таких задач приводится пример, в котором использование позиционных стратегий вместо программных управлений может

существенно улучшить оптимальное значение задачи. В условиях, существенно более общих, нежели условие обобщенной единственности, для такой задачи при помощи различных вариантов метода экстремального сдвига построена позиционная стратегия, гарантирующая близкое к оптимальному решение, нечувствительное к малым возмущениям, трактуемым как возмущения-помехи.

Исследован случай, когда аддитивное возмущение правой части уравнения динамики является союзником полезного управления (такая ситуация может возникнуть при ослаблении геометрических ограничений на управление). Показано, что ненулевого, но сколь угодно малого (в равномерной метрике) аддитивного возмущения-союзника вполне достаточно для скачкообразного улучшения значения оптимизационных задач, вне зависимости от того, контролируется союзником выбор траектории из пучка или нет. Теоретическая и практическая значимость

Работа носит теоретический характер. Разработан единый подход для аппроксимации идеальных элементов при помощи метода экстремального сдвига Н.Н.Красовского и А.И.Субботина. Развитый в работе математический аппарат и полученные результаты позволяют исследовать 'задачи теории управления для управляемых систем с иелипшицевой правой частью.

Публикации

Основной материал диссертации опубликован в работах [108]- [122], [176]. Из совместных с А.Г.Ченцовым работ [112], [ИЗ] в диссертацию вошли только постановки задач и результаты автора.

Апробация работы.

Результаты диссертации обсуждались на семинарах отдела управляемых систем Института математики и механики УрО РАН, на семинаре кафедры вычислительной математики Уральского государственного университета; докладывались па заседаниях Ученого совета Института математики и

механики УрО РАН; были представлены в докладах на всероссийских и международных конференциях, в том числе на

конференции "Демидовские чтения на Урале. Екатеринбург, 2-3 марта 2006 года";

37-й региональной молодежной конференции "Проблемы теоретической и прикладной математики, 30 января - 3 февраля 2006 года", Екатеринбург;

IV Всероссийской конференции "Математика, информатика, управлеиие'05", 2-5 ноября 2005 года, Иркутск;

конференции "Современные математические методы и информационные технологии в образовании, 14-15 апреля 2005 года", Тюмень;

36-й региональной молодежной конференции "Проблемы теоретической и прикладной математики, 31 января - 4 февраля 2005 года", Екатеринбург;

The IFAC Workshop on generalized solutions in control problems (GSCP-2004), September 22 - 26, 2004, Pereslavl-Zalessky, Russia;

35-й региональной молодежной конференции "Проблемы теоретической и прикладной математики, 26-30 января 2004 года", Екатеринбург;

Воронежской весенней математической школе "Понтрягипские чтения -XIV, 3 мая - 9 мая 2003 года";

34-й региональной молодежной конференции "Проблемы теоретической и прикладной математики, 27 января - 31 января 2003 года", Екатеринбург;

XXIII конференции молодых ученых, Москва, 9-14 апреля 2001 года.

Структура и объем работы

Диссертация состоит из введения, 3 глав, приложения и списка литературы. Главы разбиты на параграфы. Нумерация глав, параграфов в работе сквозная. Нумерация формул и утверждений тройная и однозначно указывает ссылку, сообщая главу, параграф и соответствующий номер. Общий объем работы — 172 страницы. Библиография содержит 225 наименований.

Основное содержание работы

Первая глава состоит из четырех параграфов. Она посвящена вопросам применения метода экстремального сдвига Н.Н.Красовского и А.И.Субботина для отслеживания предельных траекторий (скользящих режимов) при помощи допустимых траекторий. Здесь исследуются вопросы отслеживания наиболее распространенного типа обобщенных элементов - скользящих режимов в управляемых системах, описываемых системой обыкновенных дифференциальных уравнений. Но поскольку в предположениях на правую часть системы не требуется такое традиционное условие как липшицевость по фазовой переменной, то может отсутствовать и свойство единственности обобщенного решения.

В первом параграфе описываются накладываемые на управляемую систему условия, производится компактификация множества управлений путем введения "скользящих режимов" как стратегических борелевских мер с лебеговской проекцией. При этом от управляемой системы требуется только непрерывность правой части уравнения динамики по всем переменным, существование обычных траекторий, продолжимых на весь рассматриваемый промежуток времени, равномерная ограниченность всех допустимых траекторий и условие пеупреждаемости таких траекторий по управлению.

Указанных выше условий оказывается достаточно, чтобы ввести множество всех скользящих режимов, множество обобщенных траекторий, показать непустоту и компактность как множества всех обобщенных траекторий, так и множества траекторий, порожденного заданным "скользящим режимом". Соответствующие формулировки и доказательства вынесены в Приложение.

Параграф 1.2 посвящен методу экстремального сдвига, а именно: приведены пошаговые схемы для метода экстремального сдвига Н.Н.Красовского и А.И.Субботина [47] и предложенной А.В.Кряжимским в [49] модификации, в которой нацеливание производится не на траекторию, а на квазидвижение. Показывается, что при наложенных на систему условиях обе схемы могут быть реализованы в виде некоторой пары управление-траектория (вообще говоря ни управление, ни траектория

однозначно могут не определяться).

В параграфе 1.3 вводится некоторая общая экстремальная пошаговая схема, включающая в себя как частный случай пошаговые конструкции [47] и [49]. Для этой схемы показана Теорема 1.3.1, дающая удобную характеризацию тех траекторий, которые можно аппроксимировать при помощи конкретного экстремального правила. А именно: всякий предел последовательности траекторий (zi)ieN > порожденной данным экстремальным правилом при все более мелких разбиениях (A;)jn, удовлетворяет условию нацеливания почти всюду.

Параграф 1.3 посвящен исследованию пошаговой процедуры из [49]. Установлено, что для любого обобщенного управления существует какая-либо порожденная этим управлением траектория, которую можно приблизить последовательностью допустимых траекторий, построенных нацеливанием на квазидвижение. При этом некоторые траектории не могут быть приближены нацеливанием на квазидвижение, приводится соответствующий пример, восходящий еще к [210]. Замечено также, что при выполнении условия обобщенной единственности (любое обобщенное управление порождает единственную траекторию) всякая кривая, поточечно аппроксимируемая при помощи обобщенных траекторий управляемой системы, может быть приближена в равномерной метрике посредством нацеливания на квазидвижение.

В параграфе 1.4 исследуется пошаговый вариант метода экстремального сдвига Н.Н.Красовского и А.И.Субботина. Сконструирован пример (Пример 1.4.1), показывающий, что даже если всякому измеримому управлению соответствует единственная траектория, управляемая система может обладать таким обобщенным управлением и порожденной им (обобщенной) траекторией, что при нацеливании на эту обобщенную траекторию невозможно отслеживание никакой траектории из пучка порожденного заданным обобщенным управлением.

В настоящее время для этой схемы в условиях обобщенной единственности вопрос об аппроксимируемости всякой обобщенной траектории остается открытым. В параграфе приведено несколько достаточных условий такой аппроксимируемости. Самое общее из них

условие (Теорема 1.4.1) сформулировано в терминах функций Ляпунова и включает в себя большинство известных признаков единственности.

Еще одно условие (не связанное с условием обобщенной единственности) дано в Теореме 1.4.2. Оказывается, аппроксимируемы все "внутренние траектории". (Внутренняя траектория - эта траектория, производная которой в любой момент времени находится "внутри "годографа возможных скоростей). Показано также, что для скалярных управляемых систем при выполнении условия обобщенной единственности все траектории аппроксимируемы.

Метод экстремального сдвига

Пусть дано обобщенное управление \х Є U вместе с пучком обобщенных траекторий Ф[/І] , порожденных этим управлением. Рассмотрим задачу приближения обобщенных траекторий из пучка Ф[д] при помощи допустимых траекторий х Є Ф .

В теории дифференциальных игр при доказательстве теоремы об альтернативе Н.Н.Красовским был предложен метод экстремального сдвига для создания последовательности конструктивных движений, сходящихся к мосту. Идея метода экстремального сдвига состоит в том, чтобы в определенные моменты времени г корректировать управление, пытаясь минимизировать расхождение \\x(t) — (т) , а точнее минимизировать "мгновенную скорость" (1И0-5(1-)112,)1.-,+0 сближения точки x(t) с х(т). Процедуру построения пошаговых движений, предложенную в [47] для задачи отслеживания моста, будем применять к задаче отслеживания конкретной траектории из Ф . Для всякого п Є N через Dn условимся обозначать множество всех кортежей таких, что (то = to)$z(Tn = Т)к,{ті гг+і \/г Є 0,m — 1). Для каждых п Є N и кортежа А = (ТІ)ІЄО Є Dm полагаем dn(A) = max {ті+і - т{ \ і Є 0, п - і}.

Далее, через D обозначаем объединение всех множеств Dn, п Є N. Заметим, что D П Dj = 0 при любых і Є N, j Є N\{z}. Стало быть, (Dfc eN есть счетное разбиение множества D . Мы полагаем теперь, что для каждого А Є D число т(А) Є N по определению таково, что А Є Dm(A); в этом случае, конечно, А : 0, т(А) — IQ. Стало быть, определено отображение m: D — N такое, что А Є Dm(A) VA Є D С учетом последнего свойства вводим отображение d: D — ]0, оо[, для которого d(A) = dm(A)(A). Если 5 є]0,оо[, то через D[ 5] обозначаем множество всех А Є D таких, что d(A) 6. Кроме того, через D00 обозначим семейство всех таких последовательностей (Aj)j-eN Є DN , что имеет место (d(Aj));N - 0. Каждую такую последовательность будем называть измельчающей последовательностью разбиений.

Каждому элементу А = (гг)гєо m(A) - соответствует представление промежутка [fo, Т[ в виде объединения непересекающихся промежутков ([rt-,Tj+i[)iGOm(A), далее для краткости именно элементы D мы будем называть разбиениями множества IQ , хотя более правильным было бы называть каждый такой элемент множеством моментов переключения программного управления. Отметим также, что любое разбиение А = (ті)іе0 т/Дч Є D однозначно определяется при помощи множества {ТІ і Є 0,m(A)} Є (Fin)(Io). Поэтому мы примем соглашение, что А Є (Fin)(Io).

Таким образом множество (ЫМ)\(х, (Д;) ) - всевозможные предельные траектории, построенные при помощи правила [47] (при заданной (Aj)iN Є D00 ). Будем говорить, что траектория х Є Ф всегда экстремально аппроксимируема, если для любого є є]0, со[ можно подобрать такое 5 Є ]0, oo[, что для любого разбиения Д Є D[], для любого х Є (АІМ)і(х, А) имеет место \\х — x\\cm(i0) Вопрос о том, в каких условиях траектории экстремально аппроксимируемы, будет исследоваться в параграфе 1.4. Кратко опишем еще одну вариацию метода экстремального сдвига Н.Н.Красовского и А.И.Субботина. Эта вариация (см. [49])была предложена А.В.Кряжимским для создания последовательности конструктивных движений, сходящихся к мосту, в дифференциальных играх с правой частью уравнения динамики, не удовлетворяющей условию Липшица по фазовой переменной. В этой главе подобная конструкция будет использоваться для отслеживания каких-либо траекторий из пучка, порожденного заданным обобщенным управлением /І Є Ч.

Пусть нам дано обобщенное управление /І U, нужно отследить траектории из пучка Ф. Будем строить допустимые управление и Є IX и траекторию х Є Ф. Вновь зафиксируем разбиение А = (тг)іЄо,т(д) Є D. Вместе с собственно управлением и Є Ч и траекторией х Є Ф[и ] пошагово строится некоторое квазидвижение-фантом z є Cm(Io), на который и будет производиться нацеливание.

Обозначим через (А1М)2(ц, А) множество всех таких пар х Є Ф, для которых существует управление и Є IX удовлетворяющее следующим условиям: 1) движение х порождено управлением и Є Ч , то есть х Є Ф[и ]; 2) управление и Є IX является кусочно-постоянным, более того, для любого t Є h и {t) — и (тд()); 3) для любого т Є А \ {Т} управление и (т) удовлетворяет свойству: (o;(r)-H((a;)(A\/i)(r))7(r,a;(r), (r)) = min(a;(r)-H(W ,rt(r))7(r,a;(r),p). Непустота этого множества показывается так же, как и доказательство непустоты х Є (АІМ)і(х, А), смотрите, например, [ПО]. Пусть даны некоторые обобщенное управление /І Є Ч и измельчающая последовательность разбиений (AJ)JN Є D. Введем множество (иМ)г(/л, (Аг-)іЄк) С Ф, а именно: обобщенная траектория х Є Ф содержится в (ЫМ)2(ц, (Лг)іЄк) если существует сходящаяся (в равномерной метрике) к х последовательность траекторий (Яг)іЄК Є П( 2&іДі) МнОЖеСТВО (ЫМ)2{х, (A»)iN) " всевозможные предельные траектории, построенные при помощи правила [49] (при заданной (Aj),-eN Є D ). Будем говорить, что управление д Є 1С порождает пучок траекторий, всегда экстремально аппроксимируемый нацеливанием на квазидвижение, если для любого є Є]0, оо[ можно подобрать такое S є]0, оо[, что для любого разбиения А Є D[ S], для любого х Є (AIM)2(fJ., А) существует такая обобщенная траектория х Є Ф[/І] , что имеет место \\х—х\\ст{10) є Будем говорить, что траектория х Є Ф всегда аппроксимируема нацеливанием на квазидвижение, если для любого обобщенного управления ц Є U (со свойством х Є Ф[/х]) и любой измельчающей последовательности разбиений (AJ)JGN Є D00 имеет место {5} = (ЫМ)2(ц, (AJ),-GN)

Нацеливание на траекторию

Применим теорему 1.3.2 для экстремального сдвига на траекторию. Следствие 1.4.1. В условиях 1)-111) на систему (1-1.1) для любой обобщенной траектории х Є Ф , для любой измельчающей последовательности разбиений (At)teN Є D, если х Є (LIM)i(x, (AJ)JN) І то 1) x Є Ф, в частности функция х абсолютно непрерывна. 2) для почти всех t Є Іо имеет место: (x(t) — x(t)) x(t) = тгпиЄр (x(t) — x(t)) f(t, x(t), u). Для доказательства достаточно в теорему 1.3.2 подставить уі = х, у = х и воспользоваться Замечанием 1.3.1. Напомним, что как показывает пример 1.3.1, в условиях 1)-Ш) равенство с1Ф = Ф может не иметь места. Тогда могут существовать и не аппроксимируемые траектории, траектории, которые не могут даже поточечно быть приближены при помощи последовательности траекторий, порожденных какими-либо допустимыми управлениями. Итак, в примере 1.3.1 существует такая траектория х Є Ф, что {х} $. (ЫМ)\(х, (Аг-)г-е] ) для любой измельчающей последовательности (Ai)ieN Є D. Однако в данном примере, хотя предельная траектория не совпадает с нацеливаемой, они могут быть порождены одним управлением, то есть существует такое fi Є U, что х Є Ф[/л], (LIM)i(x, (Дг-)гЄк) С Ф[д] для любой измельчающей последовательности (Aj)ieN Є D00, таким образом решается задача нацеливания на пучок.

Приведем пример, в котором для некоторой обобщенной траектории х Є Ф для любых \І Є U, для любой измельчающей последовательности (Ai)ieN Є D00 (x є Ф[/х]) = (ФМ П (L/M)i(5, (A0 N) = 0)- (1.4.1) Пример 1.4.1. х\ = щ, х2 = (1-и2/2)у/Щ + хІ, {xhX2)(0) = (0,0), t Є /о = [0,1], (zb rr2) Є R2, (ui, it2) Є P = {-1,1} x [-1,1]. Пусть стоит задача нацеливания на пучок траекторий, порожденных нулевым управлением й = ((ui,U2)(i) = (0,0) Є Іо). В качестве траектории, на которую будет производиться нацеливание, возьмем траекторию f (0,0), Є [0,1/2] \(0,( -1/2)2/4), Є]1/2,1] Эта траектория может быть порождена только обобщенным управлением й. Пусть для некоторой измельчающей последовательности разбиений, какая-либо построенная последовательность траекторий сходится к некоторой траектории х. Подобно предыдущему примеру, в этой системе любая допустимая траектория (2/1,2/2) Є Ф удовлетворяет неравенству y2{t) t2/16 для любого t Є /о Тогда это верно и для предельной траектории х = (х\, Х2), таким образом X2(t) t2/lQ X2(t) на всем отрезке /о С другой стороны, по следствию 1.4.1, эта траектория для почти всех t Є IQ В силу условия X2(t) X2(t) удовлетворяет уравнению: х\хі + х2х2 = тіщиии2)єр(иіхі + ((1 - и2/2)л/Щ + х\)х2), откуда х\х\ = — i, х\ = \J\x2\l2 + xf, но Х\(0) = 0, поэтому х\ — 0 всех t Є h и Х2 = у/\х2\/2. Тогда из условия а М t2/16 (t Є /о) окончательно получаем (xi,X2){t) = (0,2/16) (t Є /о) Для всех t Є /о Таким образом единственно возможной предельной траекторией является траектория х = ((xi,X2)(t) = (0:t2/16)\t Є і"о) Но эта траектория не принадлежит пучку Ф(й), таким образом показано (1.4.1).

Следующая теорема дает достаточное условие в терминах функций Ляпунова экстремальной аппроксимируемости всех траекторий. Это достаточное условие гарантирует также единственность траектории, порожденной данным управлением.

Теорема 1.4.1. Пусть в системе (1.1.1) выполнены условия 1)-111), а кроме того 1). Пусть для некоторого R 0 существует такая функция и Є C{IQ X [0, R ], [0, оо[) со свойствами: для любого г Є [0, R ] ш(г, 0) = 0 и для любого д Є о» ] единственным на [to, ] решением задачи Коши г = w(t,r), r(to) = 0 является функция г = (r(t) = 0\t Є IQ). 2). Пусть такоісе для некоторого D 0 существует функция V Є С(.7о х [О, D]) такая, что 1) V(t, s) — О тогда и только тогда, когда t = t или s = О 2) V(t, s) дифференцируема справа по t и дифференцируема по s во всей области определения, 3) правая производная Vs(t, s) неотрицательна на всей области определения.

Доказательство приведено в работе автора [НО, Теорема 2]. Доказательство пункта 1) в условиях теоремы хорошо известно, см., например, [81, 146, 189, 191]. Для доказательства второго пункта используется та же техника функций Ляпунова, для доказательства невозрастания применяется Следствие 1.4.1.

Отметим, что Теорема 1.4.2 бесполезна в случае, когда размерность множества co{f(t,x(t),u) \ и Є Р} хотя бы при каком-то t Є /о отлична от т, поскольку тогда внутренность этого множества (как подмножества Rm) пуста, и внутренние траектории просто отсутствуют. 2 Отслеживание квазистратегии в условиях неопределенности

Рассматривается задача управления с неполной информацией одной из взаимодействующих систем о поведении другой. Цель управления состоит в гарантированном осуществлении сближения. В отличие от [112] мы будем предполагать, что нам уже известна какая-либо (иеупреждающая) многозначная квазистратегия [130], [152], решающая эту задачу. Зная эту квазистратегию мы будем конструировать реализуемое движение, решающее задачу с любой наперед заданной точностью. Для этого будет применен вариант метода экстремального сдвига Н.Н.Красовского. Уже известное решение в классе многозначных квазистратегий (построенное, например, методом [133], [150]) приближается последовательностью допустимых управлений, построенной с помощью предложенного А.В.Кряжимским ( [49]) варианта метода экстремального сдвига.

Решение в классе допустимых управлений

При помощи метода программных итераций ( [150], [130], [131]), [132, с. 149-153] в случае разрешимости задачи в классе квазистратегий соответствующую квазистратегию VQQ можно построить, как неподвижную точку некоторого оператора. Конкретное построение этой мультифупкции применительно к нашему случаю можно посмотреть в [112,133]. При этом, так построенная квазистратегия будет наибольшей среди всех мультифупкции, удовлетворяющих условиям (2.2.1)-(2.2.3).

Пусть v - некоторая многозначная квазистратегия, гарантирующая па своих траекториях у осуществление этого же события, то есть решающая идеальную задачу. В качестве такой квазистратегии можно взять v , ее неупреждающий мультиселектор, или даже однозначную квазистратегию в ней содержащуюся. (Очевидно такая квазистратегия существует в силу предположения разрешимости задачи).

Итак, пусть нам известна разрешающая задачу неупреждающая квазистратегия v . Построим решение в классе допустимых управлений Если Д = (7г)г-єо т(Д) Є Е) - некоторое разбиение отрезка IQ , a YQ -произвольное подмножество множества 9о то через (Уо Д) обозначим множество всех триплетов (у, /і, ) Є Ст(1о) х U х Ст(1о) таких, что имеет место фц Є Уо» = S(T/, ), и существует кусочно-постоянное и непрерывное справа управление U: IQ — Р такое, что у = срц и, кроме того Vi Є 1, m(A) - 1 {U(t) = U(-n)t\/te[n,n+i[)k &Шп-і) - У(ТІ)) Ї{ТІ,У{ТІ), U(Ti)) = тах((тг--і) - у(п)) /(п,у(п),и)). UuP Для всяких ш Є П и А = (ті)г-є0 т/Ач Є D через Y(w, Д) обозначим множество всех у Є Cm(Io) таких, что существуют мера /І Є U, квазидвижение Є Cm{h) и сигнал а/ Є 1 такие, что: ((у, //, ) Є (v(o/),A)) и (о/[ о, т(Д)-і]) = М[ ь т(Д)-і])-Теорема 2.2.1. Если выполнены условия (2.2.1),(2.2.2), то VWGQVAGD ((v(w),A) 0)& (Y(w,A) 0). Доказательство следует из изложенной в [112, 113] процедуры пошагового управления. Теорема 2.2-.2. Если выполнены условия (2.2.1)-(2.2.3), то Ve є]0, оо[ 35 Є]0, оо[ V Є Z Vw Є Tr(z) VA Є B[5] Vy Є Y(w, A) 3 Є/0:І2/( )- (і)т С + є Доказательство этой теоремы подробно изложено в [112, 113]. При доказательстве используются схема доказательства подобного утверждения из [58], а именно показывается оценка, подобная [58, Лемма 3]. Эта оценка в идейном отношении восходит к полученной в [44], [47] Н.Н.Красовским и А.И.Субботиным экспоненциальной оценке расхождения пошагового движения от стабильного моста. Также как и в [44], [47] показывается оценка расхождения траектории и квазидвижения на каждом шаге и за весь промежуток времени.

Теорема 2.2.2 устанавливает принципиальную возможность реализации эффектов, достигаемых в [133] посредством использования квазистратегий, в классе пошаговых движений, формируемых с использованием принципа экстремального сдвига Н.Н.Красовского в условиях искажений фазовой информации об одной из взаимодействующих систем (см. (2.1.2)), а также и для более общей ситуации, в задаче о сближении с функцией из "пучка" Z не позднее Т. 3 Устойчивость задачи управления

Цель этой главы - исследование вопросов устойчивости решений оптимизационных задач при малых возмущениях. Возмущения, при этом, будут пониматься в игровом смысле: и как игроки-союзники, и как помехи. Рассматриваться будут как возмущение по начальным данным, (что, в свою очередь, можно трактовать как возмущение внешних параметров системы), так и возмущение правой части уравнения динамики. "Мощность"этих возмущений будет оцениваться некоторыми параметрами а,/3 Є [0,оо[. Для а = (3 = 0 мы получим невозмущенную систему. Нас будет интересовать нахождение оптимальных стратегий и оптимального результата при а, (3 — +0, а также их сравнение с оптимальной стратегией и оптимальным результатом в невозмущенной задаче.

В данном параграфе будет рассмотрено несколько примеров оптимизационных задач. Эти примеры выявляют особенности постановки, решения и самого понятия оптимальности в задачах оптимизации с нелипшицевой правой частью.

Пусть наши возможности управления ограничены некоторым классом допустимых управлений VL С В(1о,Р) Множество всех траекторий, порожденных допустимыми управлениями обозначим через Ф . Требуется, управляя и Є U, максимизировать значение функционала 7 па траекториях этой системы, в идеале добившись значения функционала, равным supxe j(x).

В силу возможной некомпактности пучка Ф, наилучшего, максимизирующего управления, на котором достигается Рт может не существовать, но можно поискать управление гарантирующее если не само Pr , то достаточно близкое к нему значение. А именно, для всякого числа 77 є]0,оо[ можно найти управление щ , гарантирующее значение функционала не меньше Рг —г). Назовем такое решение 77-оптимальным. Рассмотрим произвольную, сходящуюся к нулю последовательность ( i)i eN Є]0, оо[ , для каждого г Є N построим такое управление щ = Щ. и порожденную им траекторию Х{ = (р .

Исходная и возмущенная динамические системы. Формулировка исходных оптимизационных задач

Условия 1) и 2) по сути эквивалентны первым двум условиям Каратеодори (см., например, [104]). Третье условие несколько сужает класс управляемых систем, заменяя суммируемость / ее локальной ограниченностью. Последнее условие по сути требует общего для всех t Є IQ модуля непрерывности всех функций вида ((/( , х, и)(х, и) Є К х P))tei0 и необходимо для вложения всех движений системы в компакт (см [104]).

Фактически условие (О) гарантирует невозможность выхода фазового вектора системы за пределы некоторого компакта К , если возмущения не превысят некоторого конечного ао . Далее мы будем рассматривать только а, /З Є [0, ао]. Следовательно далее в качестве управляющих параметров нам будут встречаться только тройки (и, w, ijellx Wao х Xao. (3.2.7)

Заметим, что при любой такой тройке система (3.2.4) становится дифференциальным уравнением, удовлетворяющим условиям Каратеодори. Следовательно существует некоторое локальное его решение, то есть существует такое $ G]to,T], что Ф ,0[м, ги] непусто (см. например, [104, Теорема 1.1] ). В силу теоремы о невыходе из компакта ( [104, Теорема 1.4]), для любого движения х Є Ф [и,и ] имеет место альтернатива: или движение х продолжимо на весь IQ , или существуют такие в\ Є [#,Т], #2 Є [о 0і] что х продолжимо до некоторой х\ Є ФХа[и,у] со свойством #і(#2) & К. Поскольку ни одна траектория системы по условию (О) не может покинуть К, то второй вариант в альтернативе невозможен, следовательно любая траектория из ж Є Ф а[г/,г ] продолжима на весь То- Итак, при любых и Є U, we Wao, х Є XQo Ф?[«,«;] 0, (3.2.8) (аналог свойства (І) первой главы); показано и большее, что любое локальное решение может быть продолжено до Т включительно.

Выбор конкретной траектории системы 3.2.4 осуществляют четыре игрока: u (U), wa (WQ), х.р, v. Каждый из игроков может иметь цель или максимизировать, или минимизировать функционал G8 на реализовавшейся траектории. Тех игроков, что имеют цель максимизировать 7 будем называть союзниками, остальных противниками. Каждую конкретную оптимизационную задачу мы будем обозначать символом ф с несколькими индексами, каждый индекс - это u (U), wQ (Wft ), x/j, v . При этом символы игроков-союзников будут верхними индексами, а символы игроков-противников - нижними. Множество противников может быть и пустым, например в задаче фиу . Для каждой задачи ф с набором индексов через Р с таким же набором индексов мы будем обозначать значение этой задачи, тот результат, который в данной задаче могут себе гарантировать как союзники, так и противники. Например Р" - значение задачи ф" -равно (3.1.10), a P"v равно (3.1.11). Заметим, что если каждому допустимому управлению соответствует единственная траектория, то эти значения совпадают. Всюду далее будем считать, что первым свое управление (стратегию) объявляет игрок u (U), после пего это делает w (W), затем начальную позицию объявляет х , и только после этого конкретный выбор реализовавшейся траектории из пучка делает игрок v . Опишем подробнее возможности каждого игрока. Игрок u (U) всегда будет стремиться максимизировать 7» назначая произвольное допустимое управление и Є IX (или пошаговую стратегию U Є [U], соответствующее определение будет введено в параграфе 3.4). При заданном числе а Є [0, с о] игрок wa (Wa ) назначает возмущение w Є Wa (стратегию W Є [WQ]). В случае, когда а — 0 , в частности в исходных оптимизационных задачах ф",фиу, этот игрок задает лишь нулевое возмущение и фактически в игре не участвует.

При заданном числе (З Є [0,0] игрок х/? может выбрать начальную позицию ж , со свойством Цж — хо\\т (3. В случае, когда /3 = 0, в частности в исходных оптимизационных задачах ф" , фuv , игрок х фактически не участвует, поскольку его выбор сводится к ж = хо .

Последний игрок, игрок v - игрок фиктивный. Он заведует выбором конкретной траектории х из уже определенного остальными игроками пучка траекторий ч/; соответственно если v - союзник u, то на реализовавшейся траектории значение функционала может оказаться сколь угодно близким к sup70c); если v - противник, то на реализовавшейся траектории значение функционала может оказаться сколь угодно близким к inf у(х) .

Если игрок v оказался союзником, то союзники совместно делают свой выбор, и предоставляют его в виде набора пучков траекторий. После этого осуществляется совместный выбор противниками конкретного пучка из этого набора. Теперь союзники могут выбрать из этого пучка произвольную траекторию и объявить ее реализовавшейся.

В следующих двух общих определениях вместо символов А , В нужно подставить символы игроков-союзников, символы игроков-противников соответственно. Введем понятие 77-оптимальных "управлений". Для всякого ц Є ]0, оо[ "управление" а в игре ф будем называть ту—оптимальным, если при любом допустимом "управлении"игроков-противников полученная траектория х обладает свойством у(х) Р в "Л Поскольку все траектории ограничены и равностепенны непрерывны (константой М, см.(3.2.9)), то все траектории могут быть погружены в некоторый компакт (Как показано в Предложении П .2.2 таким множеством станет введенное в следующем параграфе множество Фао,ао) но функционал у па всяком компакте ограничен, в частности ограничены сверху и все Р в , следовательно для всякого 7] є]0, оо[ существуют такие действия союзников, что j(x) Рв — 77. Таким образом множество ту-оптимальных управлений (стратегий) в игре ф непусто для всякого гу є]0,оо[. Последовательность (а,-)г-ек "управлений "игроков А назовем оптимальным приближенным решением задачи фд, если для всякого числа 77 є]0, оо[ существует такое число к, что для всяких г к управление сь{ является ту-оптимальным "управлением"» игре фд. Отметим, что существование оптимального приближенного решения игры Фв следует из существования ту-оптимальных управлений (стратегий) в этой игре ДЛЯ ВСЯКОГО 77 є]0, оо[.

Похожие диссертации на Управляемые системы с нелипшицевым по фазовой переменной уравнением динамики