Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Лукоянов Николай Юрьевич

Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией
<
Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Лукоянов Николай Юрьевич. Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией : Дис. ... д-ра физ.-мат. наук : 01.01.02 : Екатеринбург, 2004 239 c. РГБ ОД, 71:05-1/264

Содержание к диссертации

Введение

I Дифференциальная игра с наследственной информацией. Уравнение для функционала цены 27

1. Постановка задачи 27

2. Коинвариантные производные функционалов 36

3. Уравнение для функционала цены 42

II Минимаксные решения функциональных уравнений типа Гамильтона-Якоби с коинвариантными производными 52

4. Стабильность классических решений 52

5. Характеристические комплексы 58

6. Минимаксное решение функциональных уравнений типа Гамильтона-Якоби для систем с распределенным запаздыванием 67

6.1. Нижняя огибающая верхних решений 69

6.2. Существование и единственность 74

6.3. Примеры. 80

7. Уравнения с однородным гамильтонианом 83

8. Неоднородные уравнения 94

9. Корректность минимаксных решений 107

10. К вопросу приближенного построения решений 111

III Функциональные дифференциальные неравенства . 116

11. Производные по многозначным направлениям 117

11.1. Определение производных по многозначным направлениям 117

11.2. Кусочно-сі-гладкие функционалы 118

11.3. Огибающие семейства сі-гладких функционалов 120

12. Инфинитезимальные условия стабильности негладких функционалов 122

13. Функциональные дифференциальные неравенства для минимаксных решений 127

13.1. Случай однородного гамильтониана. 127

13.2. Общий случай 131

13.3. Примеры 133

14. Вязкостные решения функциональных уравнений типа Гамильтона-Якоби с ci-производными . 139

IV Минимаксное решение уравнения типа Гамильтона-Якоби с ci-производными и функционал цены дифференциальной игры с наследственной информацией 144

15. Стратегии прицеливания в направлении сі-градиентов вспомогательных функционалов 145

16. Стратегии прицеливания на стабильные мосты 159

17. Стратегии экстремального сдвига на сопутствующие точки 176

Приложение:

Введение к работе

Предыстория и актуальность темы. Представляемая диссертация посвящена проблеме развития для экстремальных задач в наследственных динамических системах конструкций и методов, связанных с уравнениями Гамильтона-Якоби. Объектом исследования данной работы являются задача управления наследственными динамическими системами в условиях неконтролируемых помех или конфликта и функциональное дифференциальное уравнение типа Гамильтона-Якоби с коинвариантны-ми производными. Исследования проводятся в рамках теоретико-игрового подхода, разрабатываемого в научной школе Н.Н. Красовского по оптимальному управлению.

Начиная с вариационных принципов классической механики, в современной теории динамических систем и оптимальных процессов сложились два основных, взаимно дополняющих друг друга подхода к решению экстремальных задач. Первый подход связан с непосредственным вычислением экстремального движения при фиксированном начальном состоянии. Фундамент этого подхода составляет принцип максимума Л.С. Понтрягина. В диссертации рассматривается второй подход, связанный с поиском функции цены, которая каждой точке пространства состояний системы ставит в соответствие оптимальный результат (или, в случае наличия неконтролируемых помех, - оптимальный гарантированный результат), достижимый из нее, как из начальной. Этот подход приводит к дифференциальным уравнениям типа Гамильтона-Якоби с частными производными первого порядка. В задачах оптимального управления -это известное уравнение Беллмана [15, 16], в дифференциальных играх -уравнение Айзекса [2]. Аналогичные уравнения возникают в геометрической, оптике - уравнение эйконала [94], в газовой динамике - предельное уравнение Бюргерса-Хопфа [162, 240, 252, 270] и т.д. Эти уравнения также можно интерпретировать в свете решения соответствующих экстремальных задач.

В рамках первого подхода решаются задачи оптимального программного управления (см., например, [3, 20, 23, 27, 28, 41, 72, 156, 255, 295]). В русле второго - на базе функции цены строятся позиционные стратегии оптимального управления по принципу обратной связи, назначающие текущее управляющее воздействие с учетом доступной информации о сложившемся к данному моменту состоянии системы, что особен но важно в приложениях и принципиально в задачах гарантированного управления в условиях неопределенности или конфликта (см., например, [21, 73, 78, 85, 97, 153-155, 157, 199, 201, 239, 243, 246, 261, 287]).

Современная математическая теория динамических систем и оптимальных процессов охватывает широкий круг актуальных задач, включает большое число разнообразных методов управления, наблюдения, оценивания и реконструкции, имеет прочные связи с другими разделами математики и многочисленные приложения. Ее становление относится к середине ХХ-го столетия и связано с именами отечественных и зарубежных математиков Н.Н. Красовского, Л.С. Понтрягина, Р. Айзекса (R. Isaacs), Р. Беллмана (R. Bellman), У. Флеминга (W.H. Fleming). Существенный вклад в ее развитие внесли Э.Г. Альбрехт, В.Д. Батухтин, В.Г. Болтянский, Р.Ф. Габасов, Р.В. Гамкрелидзе, П.Б. Гусятников, А.Я. Дубовиц-кий, СТ. Завалищин, М.И. Зеликин, Ф.М. Кириллова, А.В. Кряжим-ский, А.Б. Куржанский, А.А. Меликян, А.А. Милютин, Е.Ф. Мищенко, Ю.С. Осипов, Н.Н. Петров, Л.А. Петросян, Б.Н. Пшеничный, А.И. Субботин, В.М. Тихомиров, В.Е. Третьяков, А.Г. Ченцов, Ф.Л. Черноусько/ А.А. Чикрий, В.А. Якубович, J.P. Aubin, М. Bardi, E.N. Barron, Т. Basar, P. Bernhard, A.E. Bryson, F.H. Clarke, M.G. Crandall, R.J. Elliot, L.C. Evans, A. Friedman, Ho Yu-Chi, R.E. Kalman, N.J. Kalton, G. Leitman, P.L. Lions, G.J. Olsder, E. Roxin, P. Varaiya, J. Warga и многие другие ученые ( см. книги и обзоры [2, 3, 16, 19-21, 23, 27, 28, 38, 41-46, 49, 56, 57, 72-78, 85, 87, 97, 103, 104,121, 124, 130, 131, 148, 149, 152-159, 168, 172, 183, 188-190, 197-201, 207, 212, 217-219, 226, 236, 245, 246, 254, 261, 265, 281, 285, 295] и библиографию к ним).

Тематика диссертации примыкает к той части этой теории, в которой изучаются качественные свойства функций оптимального результата и способы построения оптимальных позиционных стратегий управления в связи с конструкциями динамического программирования и уравнениями Гамильтона-Якоби.

Классическое уравнение Гамильтона-Якоби имеет источником аналитическую механику (см., например, [8]), где искомая функция, как правило, является гладкой (непрерывно дифференцируемой) и удовлетворяет этому уравнению во всех точках области определения. Известное в теории оптимальных процессов и дифференциальных игр уравнение Гамильтона-Якоби-Айзекса-Беллмана выводится для функции цены в предположении, что она также является гладкой. Однако, в действитель ности, эта функция напротив, как правило, таковой не является и названное уравнение не имеет подходящего классического решения. С другой стороны, во всех тех точках, где функция цены дифференцируема, она удовлетворяет данному уравнению и в этом смысле может рассматриваться как его обобщенное (негладкое) решение. Одна из основных трудностей при этом состоит в том, что только этого свойства, без дополнительных условий, характеризующих функцию цены в точках негладкости, не достаточно для ее однозначного определения. Поэтому требуется соответствующее уточнение понятия обобщенного решения.

Аналогичная ситуация имеет место в задачах математической физики, например, при описании поверхности кристаллов, растущих в насыщенном растворе [240], негладкого фронта распространения световой волны в неоднородной, композитной среде [137, 228] и т.д. Здесь содержательные негладкие решения удовлетворяют естественным физическим закономерностям, строгая формализация которых также приводит к задаче корректного определения обобщенного решения соответствующих уравнений типа Гамильтона-Якоби.

Все это стимулировало активные исследования в области построения теории обобщенных решений уравнений Гамильтона-Якоби и других типов нелинейных дифференциальных уравнений с частными производными первого и второго порядка. С математической точки зрения вопрос заключался в том, чтобы ввести понятие такого обобщенного решения этих уравнений, которое бы, во-первых, было корректно (то есть существовало, было единственным и непрерывно зависело от начальных данных) для широкого круга начальных и краевых задач; во-вторых, естественным образом согласовывалось с классическим понятием решения (в том смысле, что, с одной стороны, обобщенное решение должно удовлетворять уравнению всюду, где оно дифференцируемо, а с другой - классическое решение, если оно существует, должно удовлетворять всем требованиям, определяющим обобщенное решение); и наконец, в-третьих, которое бы отвечало содержательному смыслу этих уравнений, выявленному на конкретных примерах вышеупомянутых задач из теории оптимального управления, дифференциальных игр и математической физики.

В 1950-1970 годы в работах Н.С. Бахвалова, И.М. Гельфанда, С.К. Годунова, О.А. Ладыженской, О.А. Олейник, Б.Л. Рождественского, А.А. Самарского, С.Л. Соболева, А.Н. Тихонова, L.C. Evans, W.H. Fleming, Е. Hopf, P. Lax и многих других известных математиков (см. [13, 31, 32, 47, 48, 88, 101, 137, 162, 164, 178, 236, 240, 244, 252, 270, 273] и далее по ссылкам) интенсивно изучались слабые решения квазилинейных уравнений с частными производными. Эти исследования в основном опирались на интегральные методы и интегральные свойства обобщенных решений.

В то же время, уже в этот период закладываются основы целенаправленного привлечения к исследованию обобщенных решений инфините-зимальных конструкций выпуклого и негладкого анализа. В этой связи отметим результаты С.Н. Кружкова (см., например, [88, 89]), устанавливающие для уравнений Гамильтона-Якоби с выпуклым по импульсной переменной гамильтонианом корректность обобщенного решения задачи Коши-Дирихле в классе локально слабо вогнутых функций. Позднее было показано [193], что применительно к задачам оптимального управления такое решение уравнения Беллмана однозначно определяет функцию оптимального результата. В это же время F.H. Clarke предложил (см. [223]) использовать для исследования негладких решений уравнения Беллмана обобщенные производные по направлениям.

Дальнейшее развитие субдифференциального аппарата выпуклого анализа и инфинитезимальных конструкций негладкого и многозначного анализа [39, 56, 130, 158, 163, 207, 208, 225, 226, 286] позволило применять к исследованию негладких задач динамической оптимизации и обобщенных решений уравнений типа Гамильтона-Якоби новые подходы и методы, основанные на гладких аппроксимациях и обобщениях понятия дифференцируемое™ (см. [10, 37, 98-100,102,131,151,167-177, 220, 222, 230-235, 245, 247, 248, 264-266, 269, 271, 274, 295]).

Своеобразный подход к определению обобщенного решения уравнений Гамильтона-Якоби-Беллмана, развивается в работах В.П. Маслова и его сотрудников на базе идемпотентного анализа (см., например, [61, 123]).

Существенное продвижение в построении современной теории обобщенных решений уравнений Гамильтона-Якоби связано, с одной стороны, с понятием вязкостного решения (viscosity solution), которое в начале 1980-х годов ввели M.G. Crandall и P.L. Lions [230], а с другой - с понятием минимаксного решения, которое было предложено примерно в это же время А.И. Субботиным [167, 168].

Понятие вязкостного решения идейно восходит (см. [230, 273]) к методу "изчезающей вязкости" из математической физики, ранее последовательно применявшемуся для изучения уравнений Гамильтона-Якоби, например, в упомянутых выше работах С.Н. Кружкова. Этот метод пер воначально использовался при доказательстве существования вязкостного решения. Однако само определение этого решения не содержит сингулярных предельных переходов в соответствующих параболических уравнениях и по своей сути основано (см. [234]) на замене уравнения парой неравенств относительно суб- и суперградиентов рассматриваемого решения. В точках дифференцируемости решения эти неравенства эквивалентны уравнению. В рамках теории вязкостных решений были сформулированы и доказаны теоремы единственности и существования для различных типов начальных и краевых задач и различных типов уравнений с частными производными первого и второго порядка (см. [211, 230-235] и обзор [236]). Была изучена связь понятия вязкостного решения с условиями оптимальности в задачах детерминированного и стохастического управления (обзор этих результатов можно найти в работах [212, 245]). В частности, в ряде работ (см., например, [215, 216, 241, 274]) для различных типов задач управления и дифференциальных игр было показано, что функция цены совпадает с вязкостным решением соответствующего уравнения Айзекса-Беллмана. С другой стороны, уравнения с частными производными первого порядка достаточно общего вида рассматривались как уравнение Айзекса-Беллмана для подобранной подходящим образом дифференциальной игры. Такие конструкции были описаны еще в ранних работах W.H. Fleming (см., например, [244]) и использовались позднее для доказательства существования вязкостных решений краевых задач и задач Коши (см., например, [232, 241]). В последнее время большое внимание уделяется вопросам разработки аналитических и численных методов построения вязкостных решений (см. в этой связи [126, 173, 213, 214, 242, 265, 281, 290, 291]).

Истоки минимаксного решения уравнений Гамильтона-Якоби лежат в теории позиционных дифференциальных игр, развитой в научной школе Н.Н. Красовского [68-79, 82-86, 260, 261] и базирующейся на минимаксных (максиминных) оценках и операциях. Фундаментальный вклад в труды этой школы по теории позиционного управления, наблюдения и восстановления динамики внесли А.Б. Куржанский [36, 97, 265], Ю.С. Осипов [92, 140, 285], А.И. Субботин [85, 167, 172], А.В. Кряжимский [90, 92, 285], В.Е. Третьяков [86, 181, 182], А.Г. Ченцов [172, 195, 196]. Активная роль в этих исследованиях принадлежит Э.Г. Альбрехту, Б.И. Ананьеву, В.Д. Батухтину, Ю.И. Бердышеву, С.А. Брыкалову, В.Л. Гасилову, М.И. Гусеву, Х.Г. Гусейнову, С.Н. Завалищину, А.В. Киму, А.Ф. Клей менову, А.И. Короткому, А.Н. Красовскому, В.И. Максимову, О.И. Ни-конову, B.C. Пацко, В.Г. Пименову, А.Н. Сесекину, И.Ф. Сивергиной, Н.Н. Субботиной, A.M. Тарасьеву, В.Н. Ушакову, Т.Ф. Филипповой, Г.И. Шишкину, А.Ф. Шорикову и их ученикам (см. [4, 5, 14, 18, 22, 24, 34, 37, 43, 53, 57, 64-67, 93, 98-100, 121, 135, 144-146, 170, 171, 174-177, 185, 186, 204, 260-263, 284, 288, 293]).

В теории позиционных дифференциальных игр было введено понятие и- и -стабильных функций (см., например, [78, 85, 261]), которые соответственно мажорируют и минорируют функцию цены. При этом последняя оказывается единственной непрерывной функцией, одновременно являющейся и- и и-стабильной и удовлетворяющей естественному краевому условию, которое указывает показатель качества дифференциальной игры. В точках дифференцируемости она удовлетворяет уравнению Айзекса-Беллмана. Таким образом, свойства и- и -стабильности однозначно определяют корректное обобщенное решение соответствующей задачи Коши для этого уравнения, совпадающее с функцией цены дифференциальной игры. Это решение является, с одной стороны, минимальной u-стабильной функцией, а с другой - максимальной v-стабильной. Поэтому, в частности, такое решение уравнений типа Гамильтона-Якоби было позднее названо минимаксным, а и- и и-стабильные функции стали соответственно называть верхними и нижними решениями. В рамках конструкций унификации дифференциальных игр (см., например, [76, 77]), было показано, что свойства и- и -стабильности могут быть выражены только в терминах гамильтониана управляемой системы. Были получены инфинитезимальные критерии и- и -стабильности негладких функций, сначала [167, 170] - в форме неравенств для их производных по направлениям, а затем [37] - в терминах конусов Булигана для сечений (по времени) их множеств Лебега. Были также указаны [171] неравенства для сопряженных производных и- и и-стабильных функций.

На этой основе в дальнейшем было показано (см., например, [168, 169]), что данный подход может быть применен не только к уравнениям Айзекса-Беллмана, возникающим в задачах управления и дифференциальных игр, но и к другим уравнениям с частными производными первого порядка. Для уравнения Гамильтона-Якоби общего вида были построены семейства характеристических обыкновенных дифференциальных включений (характеристические комплексы) и через свойства стабильности относительно этих включений введено понятие его минимаксного решения.

Были даны различные способы определения минимаксного решения, в том числе, в инфинитезимальной форме, при помощи производных по направлениям, конусов касательных направлений, суб- и супердифференциалов, сопряженных производных и других средств негладкого анализа.

Развитые конструкции и методы минимаксного решения уравнений Гамильтона-Якоби оказались естественным образом связанными с широким кругом разнообразных задач современной теории динамических систем и математической физики. В частности, определение минимаксного решения можно интерпретировать (см. [169, 292]) как естественное обобщение классического метода характеристик Коши. Отметим в этой связи, что метод характеристик является одним из основных способов конструктивного исследования и построения решений уравнений с частными производными. Обобщения этого метода применительно к различным задачам рассматривались в работах многих авторов (см., например, [103, 126, 127, 175, 208, 215, 222, 226, 281, 283]). Условия стабильности минимаксного решения по отношению к характеристическим дифференциальным включениям можно переписать (см. [169]) в терминах слабойч инвариантности его надграфика и подграфика относительно этих включений. Слабо и сильно инвариантные множества и их приложения изучались, например, в работах [37, 100, 135, 207, 223, 226, 248, 264, 271].

В теории минимаксных решений уравнений с частными производными первого порядка доказаны достаточно общие теоремы существования, единственности и непрерывной зависимости решения от начальных данных (обзор результатов можно найти в [168, 169]). Обоснована содержательность понятия минимаксного решения. В частности, показано, что минимаксное решение определяет функцию цены в обобщенной позиционной дифференциальной игре для характеристических комплексов. Разработаны конструктивные и численные методы построения минимаксных решений, в том числе - итерационные и сеточные методы (см. [135, 173, 176, 177]). В приложении к задачам управления и дифференциальных игр отличительная особенность данных методов состоит в том, что они не только направлены на построение функции цены (как минимаксного решения соответствующего уравнения Айзекса-Беллмана), но и на эффективное построение соответствующих оптимальных стратегий управления. В этой связи отметим также работы [24, 33, 66, 67, 78, 84, 146, 184-186, 260, 262, 263]. Результаты теории минимаксных решений активно развиваются и применяются в приложении к различным задачам во многих работах (см., например, [29, 30, 34, 51, 102, 145, 174, 175, 293]).

Отдельно отметим, что именно в рамках теории минимаксных решений был доказан принципиальный для современной теории обобщенных решений уравнений в частных производных первого порядка факт эквивалентности понятий вязкостного и минимаксного решений (см. [168]).

Таким образом в настоящее время можно говорить о единой теории обобщенных решений уравнений Гамильтона-Якоби, которая имеет прочные связи со многими областями математики и механики и многочисленные приложения в различных прикладных задачах. Инициированная актуальными проблемами теории управления и математической физики, она в свою очередь во многом способствовала существенному продвижению в развитии адекватного математического аппарата и создании единообразных методов и подходов для их корректного исследования и эффективного решения.

Возвращаясь к непосредственной тематике представляемой диссертации, заметим, что упомянутые выше результаты этой теории в части приложения к экстремальным задачам в динамических системах касаются, в основном, тех систем, движение которых описывается обыкновенными дифференциальными уравнениями. Принципиальным свойством таких систем является то, что их поведение в будущем однозначно определяется их текущим мгновенным состоянием и никак не зависит от их поведения в прошлом, то есть от того, каким образом сложилось данное текущее состояние.

Однако многие реальные процессы протекают согласно более сложным закономерностям, когда будущее зависит не только от настоящего, но и от прошлого. Математическое моделирование таких процессов приводит к понятию наследственных динамических систем, движение которых описывается при помощи дифференциальных уравнений с последействием, называемых также уравнениями с запаздыванием, дифференциально-разностными или функционально-дифференциальными уравнениями.

Наследственная природа характерна, например, для процессов деформации упругопластичных материалов, процессов развития биологических сообществ,- процессов распространения эпидемий или последствий экологических катастроф. В химико-технологических и теплоэнергетических процессах, космонавтике имеют место транспортные, технологические и информационные запаздывания, учет которых также приводит к уравнениям с последействием. Аппарат дифференциальных уравнений с no следействием привлекается для описания экономических, социально- и эколого-экономических процессов и т.д. Соответствующие примеры и библиографию можно найти, например, в работах [1, 7, 11, 26, 35, 59, 122, 192, 209, 259]. К наследственным динамическим системам приводят исследования процессов с неполной и недостоверной информацией, которую приходится восстанавливать по наблюдаемой истории движения (см., например, [72, 79, 97]). Отметим также, что информацию об истории движения часто оказывается целесообразно использовать в цепи обратной связи для улучшения качества управления динамической системой (пусть даже исходно обыкновенной) (см. в этой связи [70, 80, 85, 93, 96, 138— 142, 196, 260]). Чтобы подчеркнуть это обстоятельство в настоящей работе используется термин дифференциальные системы (задачи управления, дифференциальные игры) с наследственной информацией.

Первые примеры дифференциальных уравнений с последействием были уже у Бернулли, Эйлера, Лапласа, позднее у Вольтера, но целенаправленное исследование таких уравнений началось в 1950-х годах и связано с именами Н.Н. Красовского, А.Д. Мышкиса, R. Bellman, K.L. Cook, J.К. Hale. Большой вклад в становление и развитие качественной теории наследственных динамических систем внесли Н.В. Азбелев, Р.Ф. Габа-сов, A.M. Зверкин, Г.А. Каменский, Ф.М. Кириллова, В.Б. Колмановский, А.В. Кряжимский, А.Б. Куржанский, А.А. Мартынюк, В.М. Марченко, Г.И. Марчук, Ю.А. Митропольский, СБ. Норкин, В.Р. Носов, Ю.С. Осипов, Б.С. Разумихин, А.Л. Скубачевский, С.Н. Шиманов, Г.Л. Харати-швили, Л.Э. Эльсгольц, Н.Т. Banks, Т.А. Burton, С. Corduneanu, М.С. Del-four, R.D. Driver, A. Halanay, H.J. Kushner, V. Lakshmikantham, V. Volterra, T. Yoshizawa и многие другие авторы (см., например, книги и обзорные статьи [1, 6, 17, 26, 27, 42, 44, 50, 54, 59, 63, 69, 121, 125, 132-134, 160, 165, 190, 192, 194, 205, 206, 210, 221, 227, 229, 237, 238, 249, 251, 257, 259, 268, 297] и библиографию к ним).

Эти исследования показали, что уравнения с последействием обладают существенными особенностями и к ним неприменимы напрямую результаты, полученные для обыкновенных дифференциальных уравнений. С другой стороны, было показано, что при должном осмыслении поведение наследственных систем можно характеризовать на основе методов и конструкций, во многом аналогичных наработанным в теории обыкновенных дифференциальных систем.

Принципиальным шагом в построении качественной теории наслед ственных динамических систем стал функциональный подход Н.Н. Кра-совского, предложившего [68, 69] рассматривать эволюцию таких систем в пространстве историй движения. Тогда можно перейти к описанию этих систем при помощи обыкновенных дифференциальных уравнений, но уже в подходящем функциональном фазовом пространстве. Такой подход позволил перенести на наследственные системы основные классические результаты теории устойчивости по Ляпунову [120]. Был развит второй метод Ляпунова с использованием в качестве функций Ляпунова подходящих функционалов от истории движения [68, 69]. Были разработаны способы построения квадратичных функционалов Ляпунова (см., например, [128, 161], а также [59, 297]). Была построена спектральная теория линейных систем с последействием [202, 203] (см. также [132, 192]), а на ее основе - и соответствующая теория устойчивости и стабилизации по линейному приближению [138, 139]. Эти и другие результаты, посвященные различным аспектам теории устойчивости для различных типов функционально-дифференциальных уравнений, развивались и обобщались в работах многих авторов (соответствующие обзоры и библиогра фию можно найти, например, в [54, 63, 125, 134, 160, 192, 194, 221, 229, 249, 259, 268]).

Функциональный подход к задачам управления движением наследственных динамических систем во многом способствовал эффективному построению стратегий с памятью, учитывающих в цепи обратной связи историю движения (см. [70], а также [6, 237, 259, 267] и многие другие работы). Задачи конфликтного управления системами с последействием рассматривались в работах [82, 96, 136, 250]. В том числе, в работах Ю.С. Осипова и его сотрудников (см., например, [91, 140-144]) для таких задач были развиты основные конструкции и результаты теории позиционных дифференциальных игр. Рассматривались также (см., например, [256]) вопросы, связанные с развитием для задач управления наследственными системами подходов и методов так называемой теории Н (см. для случая обыкновенных дифференциальных систем, например, [217]).

В рамках теории программного управления для дифференциальных систем с последействием исследовались необходимые условия оптимальности в форме принципа максимума Л.С. Понтрягина. Первые результаты в этом направлении были получены Г.Л. Харатишвили (см., например, [190], а также [156], разд. 27). В дальнейшем, принцип максимума и его обобщения были сформулированы и доказаны для различных классов за дач оптимального управления с запаздыванием для систем как с гладкой, так и с негладкой динамикой (см. работы [9, 23, 25, 27, 130, 191, 210, 227, 247] и приведенную в них библиографию), а также, для систем, описываемых функционально-дифференциальными включениями (см., например, [131, 224, 282]).

Таким образом, построение единой теории обобщенных (минимаксных, вязкостных) решений уравнений Гамильтона-Якоби и эффективность ее приложения к исследованию экстремальных задач в обыкновенных дифференциальных системах - с одной стороны, и развитие качественной теории дифференциальных систем с последействием и их активное применение в математическом моделировании реальных эволюционных процессов - с другой, обусловили актуальность и подготовили необходимый фундамент для развития теории Гамильтона-Якоби в наследственных динамических системах. Требовалось осмыслить, какие уравнения являются для наследственных систем естественным аналогом обычных уравнений Гамильтона-Якоби, в какой форме эти уравнения могут быть записаны, что понимать под их решением, какую пользу из них можно извлечь. Эти вопросы и определили направление исследований, представленных в диссертации. Логика развития теории обобщенных решений уравнений Гамильтона-Якоби подсказывала искать ответы на них в изучении качественных свойств величины цены и соответствующих конструкций ди-намического программирования в задачах управления с наследственной информацией.

Первые результаты по методу динамического программирования в системах с последействием были получены в работе [70] и затем развиты в работах [6, 53, 54, 58, 237, 267, 288] (см. также библиографию к этим работам) для задач оптимального управления линейно-квадратичного типа, составляющих один из тех немногих классов задач теории оптимальных процессов, в которых функция цены (а для рассматриваемого случая систем с последействием - соответствующий функционал от истории движения) обладает подходящими свойствами гладкости. Обобщения этих результатов для задач оптимального управления с негладким функционалом цены рассматривались в работах [289, 296]. В исследованиях дифференциальных игр систем с последействием [82, 85, 91, 96, 140-143] были установлены нелокальные свойства и- и -стабильности функционала цены.

В перечисленных работах прослеживается два подхода к формализа ции принципов динамического программирования для наследственных систем и выводу соответствующих функциональных аналогов уравнений Гамильтона-Якоби-Айзекса-Беллмана. Один из них непосредственно опирается на переход к описанию наследственных динамических систем при помощи обыкновенных дифференциальных уравнений в подходящем функциональном фазовом пространстве, в которое укладываются возможные истории движения системы. Этот подход приводит к функциональным уравнениям Гамильтона-Якоби с частными производными Фре-ше. Такие уравнения изучались в связи с задачами оптимального управления бесконечномерными дифференциальными системами во многих работах (см., в частности, работы [211, 231-233, 272] и библиографию к ним). Эти исследования были в основном посвящены развитию соответствующей техники вязкостных решений. Приложения полученных в рамках этого направления результатов к задачам оптимального управления системами с последействием рассматривались в работе Н.М. Soner [289], а также в работах [253, 269]. В связи с обсуждаемым здесь подходом отметим работу P. R. Wolenski [296], в которой для экстремальных задач в наследственных динамических системах проведены достаточно подробные исследования качественных свойств функционала цены, и в том числе, получены необходимые и достаточные условия оптимальности в форме уравнения для нижних производных Дини этого функционала.

Следует однако заметить, что подход, основанный на описании эволюции историй движения наследственной системы посредством обыкновенных дифференциальных уравнений в функциональных пространствах, связан, с одной стороны, с сужением множества допустимых начальных историй до достаточно гладких функций, а с другой, наоборот - с подходящим расширением функционального фазового пространства до, например, суммируемых функций, что влечет определенную потерю общности и ограничивает область корректного применения данного подхода. Это отмечалось, например, в работе [40], посвященной методу функционалов Ляпунова, в работах [12,180] по локальным достаточным условиям выживания движений наследственных систем в функциональном множестве. Это видно из результатов работ [289, 296].

В диссертации последовательно развивается другой подход, восходящий к работам [68-70]. Он также опирается на функциональную интерпретацию наследственных динамических систем, но не использует явного перехода к их описанию при помощи обыкновенных дифференциальных уравнений в функциональном пространстве, что позволяет избежать упомянутых выше осложнений, связанных с таким переходом, и охватить более широкий класс систем и более широкий круг задач, включая задачи управления в условиях неконтролируемых помех или конфликта, рассматриваемые в теории дифференциальных игр. Этот подход основан на изучении свойств функционала цены при сдвиге вдоль возможных траекторий движения наследственной динамической системы. При выводе соответствующих такому подходу уравнений динамического программирования в форме Гамильтона-Якоби классический аппарат функциональных производных оказывается неудобным. Поэтому приходится рассматривать специальные понятия дифференцируемости функционалов от истории движения и использовать адекватные этим понятиям производные, такие как инвариантные и коинвариантные производные, используемые в работах А.В. Кима (см., например, [52-54, 257]), или, например, близкие к ним Clio-производные, введенные в недавней работе J.P. Aubin и G. Haddad [209]. Таким образом, данный подход приводит к новому классу функциональных уравнений типа Гамильтона-Якоби. Согласованность этого подхода с конструкциями теории дифференциальных игр систем с последействием позволяет естественным образом развить для таких уравнений теорию минимаксных решений.

Цель работы. Целью работы является построение теории минимаксных решений функциональных уравнений типа Гамильтона-Якоби с коинва-риантными производными и ее приложение к задачам управления наследственными динамическими системами, включая задачи управления в условиях неконтролируемых помех или конфликта. Методы исследования. Представленные в диссертации исследования опираются на подходы и методы из качественной теории дифференциальных уравнений, теории позиционных дифференциальных игр и теории обобщенных (минимаксных, вязкостных) решений дифференциальных уравнений с частными производными первого порядка в сочетании с подходящей функциональной трактовкой процесса управления в наследственных динамических системах. Используются результаты из функционального анализа, аппарат дифференциальных включений с последействием, конструкции негладкого анализа и аппарат инвариантного дифференциального исчисления функционалов.

Научная новизна. В работе в связи с вопросами формализации и обоснования для задач управления наследственными динамическими систе мами метода динамического программирования рассмотрен новый класс функциональных дифференциальных уравнений типа Гамильтона-Якоби с коинвариантными производными и развита теория обобщенных (минимаксных) решений таких уравнений: дано определение минимаксного решения через нелокальные свойства стабильности относительно подходящего семейства характеристических дифференциальных включений с последействием; обоснована согласованность данного понятия обобщенного решения с содержательным смыслом рассматриваемых уравнений и с определением их решения в классическом смысле; сформулированы и доказаны теоремы существования, единственности и непрерывной зависимости минимаксного решения от начальных данных для задач Коши с условием на правом конце; введено понятие производных функционала по многозначным направлениям и дано эквивалентное определение минимаксного решения, основанное на замене уравнения парой функциональных дифференциальных неравенств для таких производных; показано, что данные неравенства являются инфинитезимальной формой выражения свойств стабильности минимаксного решения; получены формулы производных по многозначным направлениям для кусочно коинвариант-но гладких функционалов, а также, для огибающих семейств коинвари-антно гладких функционалов и приведены соответствующие уточнения вида указанных неравенств в этих типичных для обобщенного решения случаях; показано также, что инвариантные суб- и суперградиенты минимаксного решения удовлетворяют неравенствам, определяющим его как вязкостное решение рассматриваемых уравнений.

Приведена формализация задачи управления динамическими системами с последействием в условиях неконтролируемых помех как дифференциальной игры с наследственной информацией. Функционал цены этой игры указывает оптимальный гарантированный результат управления, достижимый в классе стратегий с памятью - детерминированных функций истории движения. Показано, что если этот функционал оказывается коинвариантно гладким, то он удовлетворяет уравнению типа Гамильтона-Якоби-Айзекса-Беллмана с коинвариантными производными, причем соответствующие стратегии экстремального прицеливания в направлении его коинвариантного градиента являются оптимальными. В общем случае показано, что функционал цены совпадает с минимаксным решением данного уравнения и развиты соответствующие методы построения по этому решению оптимальных стратегий управления: метод экс тремального прицеливания в направлении коинвариантных градиентов вспомогательных функционалов типа Ляпунова, подходящие модификации метода экстремального прицеливания на стабильные мосты и метода экстремального сдвига на сопутствующие точки.

Как следствие этих результатов, установлено существование цены и седловой точки в дифференциальной игре с наследственной информацией, получены новые условия оптимальности в задачах управления наследственными системами, в том числе - инфинитезимальные критерии и- и -стабильности негладких функционалов, определяемые дифференциальными неравенствами для их производных по многозначным направлениям и эффективно проверяемые в указанных выше типичных случаях.

По аналогии с положениями теории динамических систем, описываемых обыкновенными дифференциальными уравнениями, полученные результаты дают основание заключить, что рассмотренный класс функциональных дифференциальных уравнений с коинвариантными производными естественно трактовать как обобщение уравнения Гамильтона-Якоби для наследственных динамических систем.

Теоретическая и практическая ценность. Работа носит теоретический характер. Развитый в ней математический аппарат и полученные результаты открывают перспективы эффективного исследования экстремальных задач в наследственных динамических системах и дальнейшего развития теории минимаксных решений для новых типов функциональных дифференциальных уравнений. Эти результаты могут также быть положены в основу анализа конкретных задач управления эволюционными системами с последействием, они могут служить фундаментом для разработки и обоснования алгоритмов построения управлений, разрешающих эти задачи.

Апробация работы. Результаты диссертации обсуждались на семинарах отдела динамических систем Института математики и механики Уральского отделения РАН, расширенных семинарах кафедры теоретической механики Уральского государственного университета; докладывались на заседаниях Ученого совета Института математики и механики УрО РАН, на научной сессии общего собрания Уральского отделения РАН (Екатеринбург, 2002); представлялись в докладах на всероссийских и международных конференциях по теории дифференциальных уравнений, динамической оптимизации и их приложениям к задачам механики, оптимального управления и дифференциальных игр, в том числе - на международной конференции, посвященной 90-летию со дня рождения Л.С. Понтрягина (Москва, 1998), IFAC International Conference "Nonsmooth and Discontinuous Problems of Control and Optimization" (Челябинск, 1998), 11h IFAC International Workshop "Control Applications of Optimization" (Санкт-Петербург, 2000), 10h International Symposium "Dynamic Games and Applications" (Санкт-Петербург, 2002), IFAC International Workshop "Time-Delay Systems" (INRIA, Rocquencourt, France, 2003), на Всероссийской конференции "Алгоритмический анализ неустойчивых задач" (Екатеринбург, 2004).

Публикации. Основной материал диссертации опубликован в работах [81, 110-113, 115-119, 276-280]. Работы автора [80, 105-109, 114, 275] не вошли в диссертацию, но имеют к ней непосредственное отношение. Структура, объем и краткое содержание работы. Диссертационная работа состоит из настоящего введения, четырех глав, объединяющих семнадцать разделов, приложения и списка литературы. Общий объем диссертации составляет 239 страниц, библиографический список включает 297 наименований, иллюстративный материал насчитывает 14 рисунков. Нумерация разделов сквозная. Нумерация формул двойная: в первой позиции указывается номер раздела, в котором приведена формула, во второй - порядковый номер формулы в этом разделе. Такая же нумерация принята для определений, утверждений, лемм, теорем, следствий, замечаний, примеров и рисунков. Нумерация условий тройная: в первой позиции указывается заглавная буква латинского алфавита, закрепленная за рассматриваемой группой условий, во второй - номер раздела, в котором приведена эта группа условий, в третьей - порядковый номер условия в группе. Все используемые обозначения объяснены в тексте работы там, где впервые встречаются.

В приложение вынесены используемые в работе результаты, касающиеся вопросов существования, единственности и непрерывной зависимости от начальных данных решений дифференциальных уравнений и дифференциальных включений с последействием. Эти, вообще говоря, известные факты получаются, например, путем естественного развития (в соответствии с [95, 179, 192]) конструкций и построений, используемых при обосновании аналогичных утверждений для обыкновенных дифференциальных систем (см., например, [19, 187]).

Глава I состоит из трех разделов. В разделе 1 рассматривается задача управления динамической системой, описываемой нелинейными диф ференциальными уравнениями с последействием (уравнение (1.1)). Наряду с воздействием управления, система подвержена также действию неконтролируемых помех. Известны геометрические ограничения на мгновенные значения воздействий управления и помехи. Задан промежуток времени управления. Показатель качества процесса управления (равенство (1.4)) оценивает реализацию движения системы на этом промежутке, а также содержит интегральные оценки соответствующих реализаций управления и помехи. Цель управления - доставить этому показателю как можно меньшее значение. Действия помехи непредсказуемы и, в частности, могут быть нацелены на максимизацию этого показателя. Задача формализована как антагонистическая дифференциальная игра с наследственной информацией, в классе чистых стратегий с памятью - детерминированных функций истории движения. В литературе известны различные формализации дифференциальных игр (см., например, [2, 38, 62, 129, 147-149, 153-155, 157, 199, 201, 217, 239, 243, 246, 287, 294]). В основном, они оказываются эквивалентными в смысле совпадения величины цены игры. Предлагаемая формализация дифференциальной игры с наследственной информацией следует позиционному подходу [65, 78, 85, 97, 140, 260, 261], в сочетании с подходящей функциональной интерпретацией рассматриваемого процесса управления [69, 70, 80]. Приведены основные условия (условия (А.1.1)-(А.1.5), см. также замечание 1.1), описана дискретная по времени схема формирования движения системы под действием избранной стратегии управления, даны определения оптимальной стратегии управления и контр-оптимальной стратегии помехи (соотношения (1.16)-(1.20), см. также (1.24)), составляющих седловую точку игры, и определение величины цены игры (соотношения (1.22)), которая здесь представляет собой функционал от возможных начальных историй движения, рассматриваемых в пространстве непрерывных функций с переменной областью определения (история накапливается с течением времени).

В разделе 2 дано определение коинвариантной (сі-) дифференцируемое™ таких "функционалов от историй" и их сі-производной по времени и сі-градиента по пространственной переменной (определение 2.3). Обоснована формула для полной производной сі-гладких функционалов в силу уравнений движения системы (лемма 2-ій следствие из нее). Понятие инвариантных и коинвариантных производных функционалов было введено ранее в работах [52, 53]. Техника инвариантного исчисления функциона лов и ее приложения к исследованию задач устойчивости, стабилизации и оптимального управления в системах с последействием изложены в книгах [54, 257]. В работах [55, 150, 258] эта техника применялась для разработки и обоснования численных методов интегрирования функционально-дифференциальных уравнений. В силу определенной специфики рассматриваемых в диссертации задач ci-производные функционалов от историй вводятся здесь формально несколько иначе, чем в этих работах. Однако содержательный смысл и основные свойства этих производных остаются прежними, поэтому используется ранее предложенная терминология (см., например, [54]).

В разделе 3 для функционала цены рассматриваемой дифференциальной игры с наследственной информацией выписано дифференциальное уравнение типа Гамильтона-Якоби-Айзекса-Беллмана с сі-производ-ными (уравнение (3.1)). Показано (теорема 3.1), что в случае, когда этот функционал оказывается сі-гладким, он является решением этого уравнения в классическом смысле, причем оптимальные стратегии управления и помехи в данном случае могут быть построены экстремальным (минимаксным, максиминным) прицеливанием в направлении его сі-градиента. Приведены простые иллюстрирующие примеры.

Исследование общего случая дифференциальной игры с наследственной информацией, не предполагающего какой-либо гладкости функционала цены, проведено в главе IV на базе результатов, полученных в главах II и III, которые посвящены развитию для функциональных дифференциальных уравнений типа Гамильтона-Якоби с сі-производньїми теории обобщенных (а именно, минимаксных) решений. Рассмотренное в главе I уравнение Гамильтона-Якоби-Айзекса-Беллмана служит содержательным примером таких уравнений..

Глава II объединяет разделы 4-10. В разделе 4 для функционального уравнения типа Гамильтона-Якоби с ci-производными выписано характеристическое дифференциальное включение с последействием (включение (4.3)), описывающее характеристики этого уравнения. Показано (утверждения 4.1, 4.2), что рассматриваемое уравнение по сути выражает стабильность (определение 4.1) своих классических решений относительно множества характеристик. В отличие от уравнения, данное свойство стабильности корректно не только для ci-дифференцируемых, но и для лишь непрерывных функционалов. Поэтому его естественно положить в основу определения обобщенного решения. При этом автоматически обес печивается согласованность обобщенного решения с понятием решения в классическом смысле. По аналогии с положениями теории обобщенных решений уравнений с частными производными первого порядка такой подход приводит к понятию минимаксного решения [168, 169].

В разделе 5 описаны верхние и нижние характеристические комплексы - параметризованные семейства дифференциальных включений с последействием, удовлетворяющие определенным требованиям (условия (С.5.1)-(0.5.3)). Показано (теорема 5.1), что установленное в разделе 4 свойство стабильности решений уравнения типа Гамильтона-Якоби с ci-производными относительно его характеристик может быть выражено посредством пары минимаксных неравенств (неравенства (5.28), (5.29)) относительно траекторий таких дифференциальных включений. В общей схеме построения минимаксных решений данные неравенства определяют верхние и нижние решения рассматриваемого уравнения, а само минимаксное решение представляет собой функционал, одновременно являющийся как верхним, так и нижним решением. Такая схема восходит к конструкциям из теории позиционных дифференциальных игр. Она удобна для обоснования существования и единственности минимаксных решений. При этом, в зависимости от конкретных условий, проводится подходящее уточнение множества допустимых характеристических комплексов.

В разделах 6—8 последовательно рассмотрены случай распределенного запаздывания, случай однородного гамильтониана и общий случай неоднородных функциональных уравнений типа Гамильтона-Якоби с ci-производными. Даны соответствующие определения минимаксного решения задачи Коши с условием на правом конце (определения 6.1-6.3, 7.1-7.3 и 8.1-8.3). Показана их согласованность между собой. Доказаны соответствующие теоремы существования и единственности (теоремы 6.1, 7.1 и 8.1). Приведены иллюстрирующие примеры.

В разделе 9 доказана непрерывность зависимости минимаксного решения от вариаций гамильтониана и краевого функционала (теорема 9.1).

В разделе 10 показано, что рассматриваемое минимаксное решение задачи Коши для функционального уравнения типа Гамильтона-Якоби с ci-производными можно аппроксимировать минимаксными решениями подходящих задач для уравнений с частными производными первого порядка относительно функций конечномерного аргумента возрастающей размерности. Из результатов раздела 10 также следует, что в вырожденном случае отсутствия последействия минимаксное решение рассматри ваемого уравнения с ci-производными (функционального в данном случае лишь формально) однозначно определяется минимаксным решением соответствующего обычного уравнения Гамильтона-Якоби с частными производными.

Результаты главы II, обосновывающие для исследуемого класса функциональных уравнений типа Гамильтона-Якоби с ci-производными корректность минимаксного решения, базируются на нелокальных конструкциях его определения. Глава III посвящена исследованию инфинитези-мальных свойств этого решения, которые часто оказываются более удобными для проверки. Эта глава состоит из разделов 11-14.

В разделе 11 для функционалов от историй введено понятие верхних и нижних производных по многозначным направлениям (соотношения (11.1)-(11.3)), пояснена их связь с коинвариантными производными (утверждение 11.1), получены формулы таких производных для кусочно-сі-гладких функционалов (утверждение 11.2) и для огибающих семейств сі-гладких функционалов (утверждение 11.3). Отметим, что данные случаи типичны для негладких минимаксных решений.

В разделе 12 показано (теорема 12.1 и следствие 12.1), что стабильность минимаксного решения относительно характеристик функционального уравнения типа Гамильтона-Якоби с ci-производными, на которой и основано определение этого решения, может быть выражена в инфини-тезимальной форме при помощи пары функциональных дифференциальных неравенств для введенных производных по многозначным направлениям (неравенства (12.2) и (12.3)). Для ci-дифференцируемых функционалов эти неравенства эквивалентны уравнению (утверждение 12.1). Таким образом, переход от классического понятия решения к обобщенному (минимаксному) решению эквивалентен здесь замене исходного уравнения с ci-производными парой неравенств для производных по подходящим многозначным направлениям.

Полученные в разделе 12 функциональные дифференциальные неравенства определяют минимаксное решение непосредственно в случае распределенного последействия. В разделе 13 дано уточнение этих неравенств для случая однородного гамильтониана (теорема 13.1 и следствие 13.1) и общего случая неоднородных уравнений типа Гамильтона-Якоби с ci-производными (теорема 13.2 и следствие 13.2). Отметим, что благодаря формулам, полученным в разделе 11, данные неравенства эффективно проверяются для кусочно-сі-гладких функционалов и для оги бающих семейств сі-гладких функционалов. Отметим также, что в вырожденном случае отсутствия последействия данные неравенства аналогичны неравенствам, определяющим минимаксное решение обычных уравнений Гамильтона-Якоби с частными производными первого порядка (см. [167-170]). Раздел 13 завершают примеры, иллюстрирующие применение разработанных инфинитезимальных конструкций определения минимаксного решения функциональных уравнений типа Гамильтона-Якоби с ci-производными при обосновании репрезентативных формул таких решений в конкретных задачах.

В разделе 14 рассмотрены инвариантные суб- и супердифференциалы и инвариантные суб- и суперградиенты функционалов от историй (соотношения (14.2), (14.3)), обобщающие понятия инвариантного дифференциала и коинвариантных производных. Показано (утверждение 14.1), что такие суб- и суперградиенты минимакснго решения исследуемых функциональных уравнений с ci-производными удовлетворяют паре неравенств (неравенства (14.6) и (14.7)), определяющих его как вязкостное решение этих уравнений (определение 14.1). Результаты данного раздела касаются вопроса развития для рассматриваемого класса функциональных уравнений техники вязкостных решений (см. [230-235]).

Глава IV состоит из разделов 15-17. В ней показано (теоремы 15.1, 16.1 и 17.1), что в общем случае уравнение типа Гамильтона-Якоби-Айзекса-Беллмана с ci-производными, выписанное в главе I для функционала цены дифференциальной игры с наследственной информацией, однозначно определяет этот функционал как свое минимаксное решение. При этом результаты по существованию и единственности минимаксных решений, полученные в главе II, устанавливают существование цены и седловой точки рассматриваемой дифференциальной игры, а функциональные дифференциальные неравенства, полученные для минимаксных решений в главе III, доставляют инфинитезимальные условия оптимальности негладкого функционала цены. Ключевым в обосновании данных утверждений является построение на базе минимаксных решений экстремальных стратегий (или є-стратегий) и доказательство их оптимальности. Рассмотрены различные, взаимно дополняющие друг друга конструкции экстремального прицеливания или сдвига, даны иллюстрирующие примеры их реализации, приведены результаты численного моделирования, подтверждающие работоспособность получаемых процедур управления.

В разделе 15 применительно к случаю управления системами с рас пределенным последействием развита конструкция экстремального прицеливания в направлении сі-градиентов вспомогательных функционалов типа Ляпунова. Эту конструкцию можно рассматривать как подходящий функциональный аналог метода прицеливания в направлении квазиградиентов, известного [29, 30] для задач управления обыкновенными дифференциальными системами.

В разделе 16 на материале дифференциальной игры с однородным гамильтонианом реализован метод экстремального прицеливания на стабильные мосты [85].

В разделе 17 для общего случая дифференциальной игры с неоднородным гамильтонианом дана и обоснована конструкция построения оптимальных є-стратегий, базирующаяся на методе экстремального сдвига на сопутствующие точки [78, 140].

Правило экстремального прицеливания в задачах позиционного управления восходит к работам [71-75, 83]. Подходящие конструкции экстремального прицеливания и экстремального сдвига используются в разных задачах для доказательства существования искомых решений ш эффективного построения разрешающих законов управления по принципу обратной связи [14, 29, 30, 57, 65, 76-78, 85, 90, 97, 99, 140-143, 166, 172, 184, 225], применяются в процедурах управления с поводырем [75, 85, 260, 261, 264], стабилизирующих оптимальное движение, в динамических методах решения обратных задач динамики [64, 92, 121, 285]. Результаты главы IV примыкают к этим исследованиям.

Завершая обзор содержания и основных результатов представляемой диссертационной работы, заметим, что среди возможных направлений дальнейших исследований, которые лишь коротко затронуты в данной работе (см. разделы 10 и 14), можно отметить вопросы, связанные с развитием для рассматриваемых функциональных уравнений типа Гамильтона-Якоби с ci-производными соответствующего аппарата вязкостных решений [230-236], а также вопросы, связанные с разработкой процедур приближенного построения обобщенных решений этих уравнений, включая итерационные процедуры, восходящие к методу программных итераций (см. [93, 172, 173, 195, 196]), который был предложен А.Г. Ченцовым [195] для построения функции цены в теории дифференциальных игр.

Работа выполнена при частичной поддержке грантов Российского фонда фундаментальных исследований (в рамках проектов 97-01-00160, 99-01-00144, 00-01-00367, 03-01-00228), грантов Президента РФ в рамках программы государственной поддержки ведущих научных школ (96-15-96245, 00-015-96057, НШ-791.2003.1), Фонда содействия отечественной науке (грант для молодых кандидатов наук, 2001-2003), Президиума Уральского отделения РАН (грант для молодых ученых, 2001).

Автор глубоко благодарен Николаю Николаевичу Красовскому за постоянное внимание, помощь и поддержку.

Коинвариантные производные функционалов

В теории дифференциальных игр обыкновенных дифференциальных систем для функции цены хорошо известно уравнение типа Гамильтона-Якоби с частными производными, именуемое уравнением Айзекса-Бел-лмана. Это уравнение выводится в рамках метода динамического программирования при предположении, что функция цены как минимум непрерывно дифференцируема. Чтобы получить аналогичное уравнение для функционала цены рассматриваемой дифференциальной игры с наследственной информацией (1.1), (1-4), также требуется сделать предположение об определенной гладкости этого функционала. Подчеркнем, что его аргумент - пара д = {t, #[ []]}, при этом значение переменной t задает отрезок, на котором должна быть определена функция а;[ []], так что переменные t и #[(.[]], вообще говоря, нельзя варьировать независимо. Отметим еще, что по смыслу задачи #[ []] - история движения, и следовательно, из позиции {,#[ []]} Є G с течением времени могут, вообще говоря, реализоваться только такие позиции {t + 5, y[t [-]t + S]} Є G, S Є [0,T — t], которые удовлетворяют равенству 2/[М"ЭД = Ж[ ["М« Поэтому и в контексте преследуемой цели, с одной стороны, здесь представляется затруднительным применение классических функциональных производных, а с другой - оказывается оправданным использование специального понятия коинвариантной (сі-) гладкости [52-54]. Рассмотрим функционал Определение 2.1 Будем говорить, что функционал р является полунепрерывным снизу, если для любых д = {t , x [t [-]t ]} Є G и є О найдется такое S 0, что для всех д = {t,x[t [-]t}} Є G, удовлетворяющих условию р(д,д ) S, справедливо неравенство Ая ) р(д) + є; полунепрерывным сверху, если функционал —(f является полунепрерывным снизу; непрерывным, если он является полунепрерывным снизу и сверху одновременно. Определение 2.2 Будем говорить, что функционал ip непрерывен справа по д Є G при t = t Є [to, T), если для любого числа є 0 и любой позиции д = {t , x[t [-]t ]} Є G существует 5 О такое, что для всех дт = {г, 2/[ [-]т]} Є G, где t т Г, удовлетворяющих условию р(дт, д ) , имеет место неравенство Если при этом для выполнения неравенства (2.1) не требуется дополнительное условие t г, то функционал р непрерывен по д Є G при t = t .

Функционал ip будем называть кусочно-непрерывным, если он непрерывен по д Є G при любых t Є [to,T), за исключением быть может лишь конечного числа значений tj, при которых он непрерывен только справа. Символом Lip(p), где д = {,#[ []]} Є G, t Т, по-прежнему будем обозначать множество функций у[-] Є С([ ,Т],КП), продолжающих #[i.[-]t] и липшицевых на [t,T]. Определение 2,3 Функционал ср является коинвариантно дифференцируемым в точке g = {t, x[t [-]t]} Є G, t T относительно Lip(#) (ci-дифференцируемым в g), если существуют такие число dt p(g) Є Ж и вектор Vcp(g) = {Viy (0),V2?(0),...,V„y (flO} Є К, что для любой функции у[-] Є Lip(g) имеет место равенство где Oy[.](5) зависит от выбора y[-] Є Lip(g), oy (5)/8 -» 0 при 5 4- 0. Величины df(p(g) и V (#) называются соответственно коинвариант-ной производной (сі-производной) по t и коинвариантным градиентом (сі-градиентом) функционала у? в точке д. Соотношение (2.2) определяет ci-производные dt p(g) и Vy?( ) однозначно. Действительно, пусть существуют аі, аг Є К и &і, 62 Є Мп, такие, что для всех у[-] Є Lip(#) одновременно выполняются равенства где 5 Є (О, T — t]. Подставим в эти равенства функцию У/Н := Ыт1 = Ф] ПРИ г є [ ]» 2//М = ЖМ + /(г - 0 при т Є [і, Т]}, где І Є Жп, вычтем из первого второе, разделим результат на 6 и перейдем к пределу при 6 I 0. В итоге получим При I = 0 из (2.3) следует, что а\ = а2. Учитывая это и подставляя в (2.3) значение I = Ь\ — Ь2, заключаем, что и Ъ\ = Ь2. Определение 2.4 Функционал ір будем называть сі-гладким, если он является непрерывным, сі-дифференцируемым и его ci-производные dt(f(g) и V /?(#) непрерывны (там, где определены, то есть при g = {t, #[„[]]} Є G, t T). Для примера рассмотрим следующий функционал: где функция a : [t»,T x R" н Ш является непрерывной, а функция b : [to,T] x Rn h- E - непрерывно дифференцируемой. Ясно, что данный функционал является непрерывным. Для любых g = {t,x[t [-]t]} Є G, t T и y[-] Є Lip(p), 5 (0, T — t] справедлива цепочка равенств Так как y[-] Є Lip(g), то з/[ + 6} — x[t]\\ Кб при некотором К 0, стало быть, о (\/52 + (;?/[ + 5] — я[])2) /5 —ї 0 при 4- 0. Таким образом, функционал (2.4) является ci-дифференцируемым, причем Данные величины непрерывны, так что функционал (2.4) - сі-гладкий. С другой стороны, рассмотрим функционал Этот функционал не является ci-дифференцируемым. Непосредственно проверяется, что он сі-дифференцируем в точках д = {t, x[t [-]t]} Є G, t T, таких, что max ж[г]2 ж[ ]2 или #[ [] ] = О, при этом t T t dtfig) — 0, V(p(g) = 0. Однако, в остальных точках он не имеет ci-производных. Для того, чтобы в этом убедиться, предположим противное, то есть, что для некоторой пары д = {t, x[t [-]t]} -Є G, t T, такой, что max ж[т]2 = #M2 Ф 0, существуют dt p(g) Ж и Vcp(g) Є Жп, для которых при любом выборе функции у[-] Є Lip(p) справедливо равенство Тогда, выбирая у[] : у[т] = x[t] при т Є [t,T], получаем, что dt(p(g) — 0. Учитывая это и подставляя в (2.5) функцию у[-] : у[т] = x[t] — x[t](r—t) = x[t](l — т + t) при т Є [t,T], получаем, что (Vip(g),x[t]) = 0. Подставляя теперь в (2.5) функцию у[-] : у[т] = x[t] -f х[і\(т — t) = x[t](l + r — t) при r Є [t,T], приходим к равенству аф]2 = 0, которое противоречит предположению. Далее, рассматривая значения какого-либо функционала ip : G н- Ж вдоль фиксированной функции х[-] Є С([ ,Т],ЖП), будем использовать следующее обозначение: (Здесь ж[ []] - сужение на [t , t] заданной на [ , Т] функции х[-], которая указывается в нижнем индексе). Коинвариантные производные удобны тем, что в их терминах полная производная сі-гладкого функционала вдоль движений системы (1.1) [в силу системы (1.1)] записывается в привычной для обыкновенного случая форме. Лемма 2.1 Пусть р : G н- Ж - сі-гладкий функционал, заданы позиция g = {t , x [t l]t ]} Є G, t T, функция x[-] Є Lip(# ) и значение

Минимаксное решение функциональных уравнений типа Гамильтона-Якоби для систем с распределенным запаздыванием

Рассмотрим для функционального уравнения с сі-производньїми (4.1) задачу Коши с условием на правом конце: при следующих предположениях относительно гамильтониана Н и краевого функционала а: (D.6.1) выполняются условия (В.4.1)-(В.4.3) (см. выше, стр. 53); (D.6.2) для любого компакта D С C([ ,T],]Rn) существует такое число Л = A(D) 0, что при всех t Є [to, Т], # [], # [] Є D и s Є Rn выполняется следующее условие Липшица по (D.6.3) функционал сг(ж[ о[-]Т]) определен и непрерывен на C([to, Т], Rn). Условия (D.6.1), (D.6.2) выполняются, например, для гамильтониана (1.10) системы управления (1.1), (1.4) с распределенным запаздыванием, а именно, удовлетворяющей условиям (А. 1.1), (А. 1.2), (А. 1.3 ) и (А. 1.4). Условие (D.6.3) является стандартным. Определение 6.1 Верхним решением задачи (6.1) назовем полунепрерывный снизу функционал ср : G ь-»- R, удовлетворяющий неравенству и, при некотором верхнем характеристическом комплексе {Q, Е } Є (Н), условию (5.28). Определение 6.2 Нижним решением задачи (6.1) назовем полунепрерывный сверху функционал ip : G И- R, удовлетворяющий неравенству и, при некотором нижнем характеристическом комплексе {Р, Е } Є (Н), условию (5.29). Определение 6.3 Минимаксным решением задачи (6.1) назовем функционал ip : G н- R, который одновременно будет верхним и нижним решением этой задачи. Из определения 6.3 и теоремы 5.1 вытекает, что минимаксное решение задачи (6.1) совпадает с непрерывным функционалом ip, который удовлетворяет требуемому условию на правом конце и является при этом стабильным относительно ХДВ (4.3). В силу утверждения 4.1 отсюда следует, что классическое сі-гладкое решение задачи (6.1) (если оно существует) является минимаксным, а в силу утверждения 4.2 - что в тех точках g = {t, x[t []]} Є G, t T, где минимаксное решение сі-дифференцируемо, оно удовлетворяет уравнению. Таким образом, определенное минимаксное решение согласуется с понятием решения в классическом смысле.

Как уже отмечалось, задача (6.1) может не иметь классического решения. Покажем, что в противовес этому минимаксное решение данной задачи всегда существует и единственно. Для этого, следуя в основном схеме, предложенной ранее (см., например, [168]) для минимаксных решений уравнений с частными производными первого порядка, сначала установим, что минимальное верхнее решение не превосходит максимального нижнего решения и эти решения задачи (6.1) существуют, а затем докажем, что любое нижнее решение не превосходит любого верхнего решения. 5.4 любое верхнее решение задачи (6.1) в частности удовлетворяет неравенству (5.1), а любое нижнее решение - неравенству (5.2). Обозначим через Ф и Ф множества функционалов tp : G - [—00,+00], удовлетворяющих соответственно условиям (5.1), (6.3) и (5.2), (6.4). Рассматриваемые здесь функционалы могут принимать несобственные значения +оо и —оо. Предполагается, что если для некоторого д Є G имеем р(9) = +00, то р(д) + а (р(д) для любых д Є G, а Є К, а если ір(д) = —00, то соответственно ср(д) — а tp(g). В частности предполагается, что +оо + а = +оо и —оо + а = —оо для любого аЄІ. Отметим еще, что для функционалов из Ф и Ф не требуется, чтобы они были полунепрерывны снизу или, соответственно, сверху. Множество всех возможных верхних решений задачи (6.1) является подмножеством множества Ф , а множество всех нижних решений этой задачи - подмножеством множества Ф . Лемма 6.1 Для любых ір Є Ф и г Є Жп справедлива оценка: Доказательство. Учитывая сначала (5.1), затем (6.3) и то, что краевой функционал a : 7(( , ), R") Н- R непрерывен, а множество СН(д,0,г) Доказательство. Так как ср удовлетворяет (6.3), это условие выполняется и для ip ,г. Осталось проверить, что (р г удовлетворяет условию (5.1). Прежде всего заметим, что в силу леммы 6.1 из (6.5) следует, что / гЫ -оо Для любого д Є G. Возьмем t Т,д = {t, х[Ц-]г0]} Є G и t Є (t, Т], s Є Кп. Требуется показать, что для любого є 0 существует такая характеристика (# [], z [-]) Є CH(g,0,s), для которой Возможны три случая. Случай 1: t Є [tf,T), Є (t,T].

В этом случае / r(#) = (p{g), p ,r(t,x[U[-]t\) = (p(t,x[ []]). Так как /? удовлетворяет (5.1), отсюда заключаем, что в данном случае (6.6) справедливо. Случай 2: t [to, ), t Є (,$]. Рассмотрим дифференциальное включение с последействием В силу (4.7) и отмеченных свойств многозначного отображения Е(д, s) из (4.2) многозначное отображение G(U,t0,T;Rn х R) Э { , (ж[ 4\М , [ №])} М(М[ №1) Cl"xR удовлетворяет условиям (F.1)-(F.3) (см. приложение, стр. 205). Поэтому в согласии с теоремой Р2.1 данное дифференциальное включение имеет по крайней мере одно решение (# [], []), удовлетворяющее начальному условию Отсюда заключаем, что и в этом случае требование (6.6) выполняется, при этом здесь можно взять є = 0. Случай 3: t Є [to, і?), t 6 (#,Т]. Как было показано выше (см. соответственно случай 2 и случай 1), найдутся такие характеристики ( [], []) Є CH(g ,0,s) и ( "[], "[]) Е СН({#,х [ЦЩ},0,з), что

Корректность минимаксных решений

Покажем, что минимаксное решение задачи Коши для функционального уравнения типа Гамильтона-Якоби с ci-производными непрерывно зависит от исходных данных. Теорема 9.1 Пусть ao,o k : C([to, T],Rn) - Ж. - непрерывные функционалы, Ho,Hk : Gxl" ь- Ш - гамильтонианы, удовлетворяющие условиям (G.8.1)-(G.8.4), HQ,H определены по Щ,Нк согласно (8.2), к = 1,2,... Предположим, что при к — со компакта D С С([ ,Т],К?) равномерно на множестве Пусть ifk : G »- К. - минимаксные решения задач Коши Тогда tpk — PQ при к — сю длл любого компакта D С C([t ,T],Rn) равномерно на G(D). Предельный функционал щ : С? н- Ж. будет минимаксным решением задачи Коши Доказательство. Положим где Л(, #[ []]) - из условия (G.8.3). Обозначим символом X(g,z), где g = {t, x[t [-]t0]} Є G, z Є Ш, множество решений дифференциального включения с последействием которые удовлетворяют начальному условию По исходным гамильтонианам Щ И Нк определим согласно (8.3) вспомогательные гамильтонианы HQ И Нк, к = 1,2,... По Но и Нк согласно (8.10) определим характеристические комплексы {Q,F0} Є Т (Но), {Р, F,0} Є (Яо) и {Q,Тк} є :Г(#іО, {Р, F } Є f (Hk), к = 1,2,... Рассмотрим задаваемые этими комплексами дифференциальные включения (8.12), (8.13) при начальном условии (9.3). Множества их решений обозначим соответственно XQ(g, z,q), X о(д, z,р), Xk(g,z,q), X k(g z0,p)- Гамильтонианы Но и Нк удовлетворяют условию (G.8.3), поэтому (9.4) Положим (9.5) неравенство Зафиксируем дт = {Т, х\Ь [-]Т]}. Согласно (9.5) существуют подпоследовательность (fi последовательности рк и последовательность ді Є G (і = 1, 2,...) такие, что Так как срк - минимаксные решения задач (9.1), то, в частности, они удовлетворяют условию (8.19) при X = Хк- Поэтому, для произвольно взятого q Є Q, найдутся такие функции будут выполняться соотношения В силу (9.4) имеем х г [-] Є Х(ді,0). Отсюда и из (9.7) согласно теореме Р2.2 (см. приложение, стр. 210) вытекает, что существует подпоследовательность последовательности х г [], которая равномерно сходится к функции х[-] = {х[-], z[-]) 6 Х(дт,0). Члены этой подпоследовательности по-прежнему будем обозначать х [-] = {x [-]jZ [-]).

Отметим, что единственным элементом множества Х(дт = {Т, ж [„[] Т]},0) является функция (х[-] = я;[ [-И,2г[-] = 0), так что х[] = х[] и z[T] = 0. Рассмотрим множество Do := { [ о[ ] П} :і U {а оН?1]}. Оно компактно в Сфо Т],1 ). По условиям теоремы т& — его при к —у со равномерно на DQ. Учитывая это и непрерывность сто, при і — со выводим \ п(хЫ-]Т\) о(хЫШ ЫхЫ.]Т\) - а0(х«Щ]Т])\ + Ых Ы-]Т]) - о(хЫШ - о Таким образом, с учетом (9.7), переходя к пределу в (9.8) при г — со, получаем доказываемое неравенство (9.6). Покажем теперь, что для любых д = {t, x[U[-]t0]} Є G, t T, t Є (t, T] и q = (s, r) Є Q = Rn xl имеет место неравенство В согласии с (9.5) возьмем подпоследовательность iff и соответствующую последовательность gf = {tf,x%)[t [-]ti]} G, г = 1,2,..., для которых будут выполняться равенства Так как t t , можно считать, что t t , і — 1,2,... Функционалы (fi удовлетворяют условию (8.19) при X = Xi. Следовательно, существуют функции такие, что Согласно (9.4), (9.11) (а [-], [-]) Є Х{д?,0), так что в силу (9.10) и теоремы Р2.2 приложения без ограничения общности можно принять, что последовательность (ж [ ], [-]) равномерно сходится к (# [], z [-]) Є Х(д,0). Таким образом, вспоминая лемму 1.1, имеем Откуда, переходя в (9.12) к пределу при і — оо и учитывая при этом определение (9.5) функционала »_ и первое равенство в (9.10), выводим Рассмотрим множество D := {# [-]} U {# []}. Оно компактно в С([ ,Т],МП). При условиях теоремы Hk(-,s,r) — Ho(-,s,r) равномерно на G(D ). Учитывая это, включения (9.11) и то, что многозначные отображения Fk и F0 были выбраны по Н и HQ согласно формулам (8.10), имеем где ЄІ — 0 при г — оо. Отсюда и из второго равенства в (9.10) на основании теоремы Р2.3 (см. приложение, стр. 211) заключаем, что справедливо включение (х [], z [ ]) Є Х0(д, 0, q), которое вместе с (9.13) доказывает неравенство (9.9). Из (9.6), (9.9) для любого д Є G имеем Рассмотрим далее функционал Повторяя с понятными изменениями рассуждения, приведенные выше при доказательстве неравенств (9.6) и (9.9), получаем, что этот функционал удовлетворяет неравенству и неравенству Из (9.5) и (9.15) также следует, что функционал if- : G н» R полунепрерывен снизу, а у + : G н R - сверху. Суммируя приведенные выше факты, согласно определениям 8.1 и 8.2 заключаем, что /?_ - верхнее, а р+ - нижнее решения задачи (9.2). По лемме 8.3 эти решения связаны неравенством р-(д) р+(д), д Є G. Отсюда и из (9.17) получаем где, согласно определению 8.3 и теореме 8Л, ро - единственное мини максное решение задачи Коши (9.2). При этом в соответствии с опре делением функционалов _ и ср+ из равенств (9.18) вытекает, что по следовательность (fk сходится при к — оо к сро для любого компакта D С C([t , Т], W1) равномерно на G{D). Теорема доказана. Для обычных уравнений Гамильтона-Якоби с частными производными известны (см., например, [176, 177, 214, 242, 290]) различные численные схемы приближенного решения задачи Коши. Численное решение задачи (8.1) для функционального уравнения типа Гамильтона-Якоби с ci-производными сопряжено с дополнительным вопросом корректного перехода от бесконечномерного аргумента к конечномерному. В данном разделе приведем один из способов такого перехода и покажем, что решения рассматриваемого функционального уравнения с ci-производными можно аппроксимировать при помощи решений подходящих уравнений с частными производными относительно функций конечномерного аргумента, правда, возрастающей размерности. Сначала, установим следующее свойство минимаксного решения задачи (8.1). Предположим, что в добавление к требованиям теоремы 8.1, обеспечивающим существование и единственность минимаксного решения

Инфинитезимальные условия стабильности негладких функционалов

Как было установлено в разделе 4 (см. утверждения 4.1 и 4.2), функциональное уравнение типа Гамильтона-Якоби с ci-производными (4.1) по своей сути является инфинитезимальной формой выражения свойства стабильности сі-гладких функционалов относительно характеристического дифференциального включения (4.3). В этом разделе покажем, что стабильность негладких функционалов может быть выражена в инфинитезимальной форме посредством дифференциальных неравенств для производных по многозначным направлениям. Пусть Я : G х М ну 1 - удовлетворяющий условиям (В.4.1)-(В.4.3) - из гамильтониан уравнения (4.1), (,#[ []]) = с ( 1 + max #[т] ) условия (В.4.2) (см. стр. 53). Обозначим Рассмотрим следующие дифференциальные неравенства относительно функционала G Э д = {t, #[ []]} - ФІя) = / ( » #[»№]) є : Отметим, что для сі-дифференцируемых функционалов данные неравенства эквивалентны уравнению (4.1). Утверждение 12.1 В тех точках д = {,#[ []]} Є G, в которых функционал ср является с\-дифференцируемым, пара неравенств (12.2) и (12.3) эквивалентна равенству (4.1). Доказательство. Пусть функционал р(д) = (p(t,x[t [-]t]) сі-дифферен-цируем в точке д = {t , x [U[-]t ]} Є G, t Т. Тогда функционал Фв(я) = p(t,x[U[-]t]) - {s,x[i\) - тоже, при этом дгф3(д ) = dt p(g ) и \?ф3(д ) = Vip(g ) — s. Используя формулы (11.4), с учетом (12.1) вычисляем dT W) - «, [ ] I В(д )} = dtiptf) qp L(g )\\S/v(g ) - s\\. (12.4) Пусть при д = д выполняются неравенства (12.2), (12.3). Тогда, учитывая (12.4) и рассматривая эти неравенства для s = Vy?(p ), приходим к равенству (4.1) для д = д . Пусть, наоборот, функционал р удовлетворяет уравнению (4.1) в точке д = д . Тогда в силу (12.4) и условия (В.4.2) имеем то есть в этой точке выполняется неравенство (12.2). Аналогично про веряется, что также будет выполняться неравенство (12.3). Утверждение доказано. Теорема 12.1 Пусть выполняются требования (В.4.1)-(В.4.3). Тогда для полунепрерывных снизу функционалов ip : G t- R условия (5.1) и (12.2) эквивалентны.

Соответственно условия (5.2) и (12.3) эквивалентны для полунепрерывных сверху функционалов. Доказательство. Докажем первое утверждение теоремы. будут выполняться следующие соотношения: Возьмем Уе[.] Є ОД 0 + бо, х [и[-]1? + ад}, B{g), є). Тогда %[ ] = x [t] при Є [ », + fo], согласно (11.2), (12.6) ує[] Є П(д,В(д),є) и в силу (12.7) при всех S Є (0, Jo] справедливо равенство Отсюда, учитывая (12.5) и непрерывность Я, в согласии с (11.1), (11.3) заключаем что и требовалось показать. Доказательство импликации (12.2) = - (5.1). Чтобы доказать эту импликацию достаточно показать, что из (12.2) вытекает неравенство где CHv(g, 0, s) - множество всех решений дифференциального включения с последействием (5.5) (при є = rj), которые удовлетворяют начальному условию (5.6) (при z = 0). Действительно, если имеет место неравенство (12.8), то, так как функционал р полунепрерывен снизу, для любых д = {t, х[ []t0]} Є G, t Т, t Є (t, Г], s Є Rn и последовательности гц \. 0 (г = 1, 2,...) существует последовательность функций (#(i)[-], ( )[]) Є СНт(д,0,з), таких, что В силу теоремы Р2.3 (см. приложение, стр. 211) эта последовательность имеет равномерно сходящуюся подпоследовательность, предел дифференциальные неравенства относительно функционала G Э д = {t, #[ []]} - ФІя) = / ( » #[»№]) є : Отметим, что для сі-дифференцируемых функционалов данные неравенства эквивалентны уравнению (4.1). Утверждение 12.1 В тех точках д = {,#[ []]} Є G, в которых функционал ср является с\-дифференцируемым, пара неравенств (12.2) и (12.3) эквивалентна равенству (4.1). Доказательство. Пусть функционал р(д) = (p(t,x[t [-]t]) сі-дифферен-цируем в точке д = {t , x [U[-]t ]} Є G, t Т. Тогда функционал Фв(я) = p(t,x[U[-]t]) - {s,x[i\) - тоже, при этом дгф3(д ) = dt p(g ) и \?ф3(д ) = Vip(g ) — s. Используя формулы (11.4), с учетом (12.1) вычисляем dT W) - «, [ ] I В(д )} = dtiptf) qp L(g )\\S/v(g ) - s\\. (12.4) Пусть при д = д выполняются неравенства (12.2), (12.3). Тогда, учитывая (12.4) и рассматривая эти неравенства для s = Vy?(p ), приходим к равенству (4.1) для д = д . Пусть, наоборот, функционал р удовлетворяет уравнению (4.1) в точке д = д . Тогда в силу (12.4) и условия (В.4.2) имеем то есть в этой точке выполняется неравенство (12.2). Аналогично про веряется, что также будет выполняться неравенство (12.3). Утверждение ко

Похожие диссертации на Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией