Игровые задачи сближения-уклонения: обратная связь и стабильность множеств Латушкин Ярослав Александрович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Латушкин Ярослав Александрович. Игровые задачи сближения-уклонения: обратная связь и стабильность множеств : диссертация ... кандидата физико-математических наук : 01.01.02 / Латушкин Ярослав Александрович; [Место защиты: Ин-т математики и механики УрО РАН].- Екатеринбург, 2008.- 142 с.: ил. РГБ ОД, 61 09-1/348

Содержание к диссертации

Введение

1 Свойства некоторых классов стратегий на примере дифференциальных игр с окружностью в качестве целевого множества 30

1 Введение 30

2 Задача с перпендикулярными отрезками 32

3 Ограничения в виде квадрата и отрезка 42

4 Случай совпадающих отрезков 55

2 Дефект стабильности множеств в дифференциальных играх 58

1 Введение 58

2 Постановка задачи конфликтного управления 61

3 Стабильность множеств в пространстве позиций игры . 65

4 Дефект стабильности множеств в пространстве позиций игры 72

5 Позиционная процедуры управления с поводырем первого игрока 78

6 Оценка рассогласования между движениями z(t) и x(t) в момент 88

3 Критерии совпадения максимальных стабильных мостов в двух игровых задачах о сближении 100

1 Введение 100

2 Постановка задач о сближении 102

3 Оператор стабильного поглощения и стабильные мосты в задаче о сближении в момент 104

4 Оператор стабильного поглощения и стабильные мосты в задаче о сближении к моменту 127

5 Критерии совпадения стабильных мостов для стационарных управляемых систем 129

Заключение 135

Литература 136

Задача с перпендикулярными отрезками
Случай совпадающих отрезков
Постановка задачи конфликтного управления
Оператор стабильного поглощения и стабильные мосты в задаче о сближении в момент

Введение к работе

Данная работа посвящена некоторым задачам теории дифференциальных игр на конечном промежутке времени. Рассматриваются конфликтно-управляемые системы достаточно общего вида, стесненные геометрическими ограничениями на управления.

В работе изучаются в основном две игровые задачи управления: задача об уклонении и задача о сближении конфликтно-управляемой системы с компактным целевым множеством в евклидовом пространстве.

Для задач об уклонении исследуются вопросы, связанные с построением гарантирующего управления второго игрока и выяснением структуры этого управления.

Для задач о сближении исследуется свойство u-стабилыюсти множеств, содержащихся в пространстве позиций игры, введенное в работах Н.Н. Красовского и А.И. Субботина [18,19,28,29].

Известно несколько основных подходов к формализации дифференциальных игр.

Одной из первых методик исследования дифференциальных игр явилась методика, предложенная Р. Айзексом в середине ХХ-ого столетия, базирующаяся на использовании так называемого «основного уравнения» теории дифференциальных игр. Монография Р. Айзекса «Дифференциальные игры», переведенная в 1968 году на русский язык, сыграла определенную роль в становлении теории дифференциальных игр в нашей стране.

В 60-е годы Л.С. Понтрягиным для решения линейных дифференциальных игр была введена конструкция альтернированного интеграла [41], выделяющая в пространстве позиций игры множество разрешимости — множество всех тех позиций, из которых разрешима задача о сближении. Концепция альтернированного интеграла получила развитие в рабо тах M.C. Никольского, Е.С. Половинкина, Н.Х. Розова, А.И. Пономарева. В настоящее время усиленно продолжается разработка теории и методов вычисления альтернированного интеграла Л.С. Понтрягина, оставаясь в центре внимания специалистов по теории дифференциальных игр. Здесь отметим, работы А.Б. Куржанского и его учеников [14,29], посвященные задачам синтеза управлений в системах с линейной структурой. В этих работах решение задач конфликтного управления достигается соединением модифицированных конструкций экстремального прицеливания Н.Н. Кра-совского и альтернированного интеграла Л.С. Понтрягина.

В 60-е годы ХХ-ого столетия Н.Н. Красовским была предложена концепция позиционной дифференциальной игры [18,19], которая затем последовательно развивалась им и его сотрудниками. В рамках этой концепции была разработана позиционная формализация дифференциальных игр, базирующаяся на понятии позиционных стратегий. Основным элементом разрешающих конструкций, ориентированных на решение нелинейных дифференциальных игр, являются стабильные мосты — множества в пространстве позиций дифференциальной игры, оканчивающиеся на целевом множестве и слабо инвариантные относительно некоторого набора дифференциальных включений, связанных с динамикой конфликтно-управляемой системы. Разрешающая позиционная стратегия в игровой задаче о сближении может быть построена как экстремальная к стабильному мосту стратегия.

В 70-е, 80-е годы ХХ-ого столетия теория дифференциальных игр развивалась особенно интенсивно; здесь отметим монографии Н.Н. Кра-совского [19,24], Н.Н. Красовского и А.И. Субботина [29], А.И. Субботина и А.Г. Ченцова [45]. Концепция экстремального прицеливания была перенесена на различные классы дифференциальных игр, в том числе Ю.С. Осиповым и А.В. Кряжимским на дифференциальные игры с запаздыванием [31,38]. В 80-е годы появилась возможность (развивающаяся вычислительная техника) разрабатывать методы и алгоритмы приближенного вычисления стабильных мостов и функции цены и реализовывать их на ЭВМ для некоторых классов игровых задач.

В середине 70-х годов были опубликованы работы Н.Н. Красовско-го [20,23] по унификации в дифференциальных играх. В настоящей работе используется унификационное определение стабильности [20,23]. В середине 80-х годов А.И. Субботин предложил [44] понятие обобщенных решений уравнений Гамильтона-Якоби-Беллмана-Айзекса в теории дифференциальных игр, которое позволило ему рассмотреть функцию цены дифференциальной игры как такое решение и доказать существование и единственность ее при общих предположениях на конфликтно-управляемую систему. При этом использовались инфинитезимальные конструкции негладкого анализа. Эти конструкции также используются в настоящей работе.

Целью данной работы было теоретическое исследование некоторых задач об уклонении и о сближении с целью на конечном промежутке времени; изучение структуры разрешающих стратегий в задачах об уклонении и свойства стабильности в задачах о сближении.

Перейдем к краткому описанию содержания диссертации:

В теории дифференциальных игр представляют существенный интерес вопросы, относящиеся к структуре и свойствам различных классов стратегий. При этом принципиальным является вопрос [4,5,7-9,17,24,29,45, 64] о свойствах непрерывных стратегий PI ИХ связи с программными управлениями. Некоторым аспектам этой тематики посвящена первая глава диссертации. Этот вопрос подробно изучен [4, 5,17, 24, 29, 45, 64] для линейных управляемых систем в предположении выпуклости терминального множества. Можно ослабить это предположение до ацикличности (вырожденности группы гомологии) некоторых связанных с задачей объектов, см. [9] .

Непрерывные по фазовому вектору стратегии образуют естественный класс законов управления, который удобен как в теоретических построениях, так и при работе с конкретными управляемыми объектами. Одно из хороших свойств этого класса состоит в том, что вопрос о наличии решений начальной задачи для системы с обратной связью решается с помощью хорошо известных из теории обыкновенных дифференциальных уравнений стандартных теорем существования.

Вместе с тем, имеются примеры несложных по своей постановке задач, разрешить которые в классе непрерывных стратегий невозможно в принципе. В таких задачах складывается в определенном смысле парадоксальная ситуация: обеспечить уклонение от терминального множества можно только с помощью разрывных стратегий. Гарантировать уклонение посредством непрерывных стратегий не удается, несмотря на доступность всей текущей информации о движении объекта. Необходимость обрабатывать данные с помощью непрерывной функции обесценивает всю эту информацию.

Использование разрывных стратегий в теории дифференциальных игр есть принципиальное обстоятельство. Имеются дифференциальные игры, в которых невозможно построение непрерывной стратегии уклонения, являющейся компонентом седловой точки. Достаточно типична ситуация, в которой седловую точку необходимо строить в более широком классе стратегий, допускающем разрывы по фазовому вектору.

В работе [5] для линейно-выпуклого случая (линейная динамика и выпуклое целевое множество) рассматриваются однозначные позиционные стратегии, удовлетворяющие условиям Каратеодори или свойству непрерывности, получены глубокие теоремы о невозможности уклонения в классе таких стратегий.

В примере речь идет о преследовании безинерционной точки материальной точкой. В работе [4] в линейно-выпуклом случае исследуются возможности многозначных позиционных стратегий, обладающих свойством полунепрерывности по включению, доказаны соответствующие теоремы, рассмотрены многозначные стратегии для примера из [5]. Доказательства из [4,5] опираются на принцип неподвижной точки типа теоремы Какутани (а именно, на теорему Карлина и Боненбласта). При этом рассуждения существенно используют выпуклость терминального множества, из которой следует выпуклость рассматриваемого многозначного отображения. Теоремы этого типа для нелинейных дифференциальных игр без требования выпуклости целевого множества были получены в [9]. Работа [9] опирается на соответствующие свойства функционально-дифференциальных включений [8]. Эти свойства основаны на теореме Эйленбсрга и Монтгомери о неподвижной точке, в которой, в отличие от теоремы Какутани, не требуется выпуклости значений рассматриваемого многозначного отображения.

Результаты работы [9] позволили построить пример [7] обсуждаемого типа с невыпуклым терминальным множеством. Здесь приходится опираться на гомологические методы, что не всегда удобно в теории дифференциальных игр.

В первой главе диссертации рассматриваются три примера дифференциальных игр с невыпуклым терминальным множеством, иллюстрирующие свойства непрерывных стратегий.

Во всех случаях игра происходит на плоскости, причем терминальным множеством является окружность с центром в начальной точке, которая совпадает с началом координат

Во всех примерах динамика задается одной и той же системой двух дифференциальных уравнений

х = 2(1 )u + v.

Примеры различаются геометрическими ограничениями на управления игроков.

В первой из рассматриваемых игр (§2) геометрические ограничения задаются двумя перпендикулярными отрезками равной длины Р = {и= (0,u2) : -1 п2 1}, Q = {v = (yli0): -1 гл 1} . Во второй игре (§3) ограничения имеют вид отрезка и квадрата р = {и = (щ, и2) : -1 Щ 1, -1 и2 1}, Q = {v = (yu0): -2 Vl 2}. В третьей задаче (§4) используются два совпадающих отрезка Р = {и=(ии0): -l ui l}, Q = {v = (vlt0): -1 иі 1}.

Поэтому третий пример фактически является одномерным, и терминальное множество можно считать двухточечным.

Можно непосредственно проверить, что в рассматриваемых в трех примерах дифференциальных играх программные управления не позволяют гарантировать уклонение от терминального множества. Также указаны способы уклонения с помощью управления по принципу обратной связи. В примерах, содержащихся в §2, §3, уклонение от терминального множества гарантируется с помощью одного замера фазового вектора, причем соответствующие способы управления задаются разрывными отображениями. Указаны некоторые семейства таких способов управления, зависящие от параметра. Проведена оптимизация по этому параметру. В задаче из §4 можно обеспечить уклонение с помощью простой непрерывной стратегии.

В связи с этим возникает вопрос, можно ли в первых двух примерах гарантировать уклонение посредством непрерывных стратегий. Ответ на этот вопрос оказывается отрицательным. Показано, что удовлетворяющие условиям Каратеодори стратегии с отклонением аргумента не могут обеспечить уклонение от терминального множества в первой и второй играх. При этом в доказательстве удалось обойтись без использования понятий и результатов алгебраической топологии. Рассуждения используют лишь очень хорошо известную теорему Шаудера о неподвижной точке, которая применяется в пространстве траекторий системы, снабженном равномерной нормой.

Во второй главе рассматривается конфликтно-управляемая система достаточно общего вида на конечном промежутке времени. Управления игроков, как и в предыдущей главе, стеснены геометрическими ограничениями. Исследуются вопросы, относящиеся к одному из центральных понятий теории позиционных дифференциальных игр — свойству стабильности. Свойство стабильности было введено в работах Н.Н. Красовского и А.И. Субботина [18,19,28].

В течение последующих десятилетий, начиная с 1970 года, имела место эволюция в описании этого свойства.

В [4,5,8,17] стабильность была представлена как свойство слабой инвариантности множества в пространстве позиций игры относительно некоторого семейства дифференциальных включений, связанных с динамикой конфликтно-управляемой системы. Эти дифференциальные включения содержат в качестве параметра векторы управлений второго игрока.

В середине 1970-х годов появляется новая формулировка стабильности и постепенно выкристаллизовывается новое направление, базирующееся на этой формулировке — унификация дифференциальных игр.

В 1971 г. в журнале "Прикладная математика и механика" была опубликована статья Н.Н. Красовского [22], посвященная минимаксному поглощению в играх сближения. В ней рассматривалась конфликтно-управляемая система без традиционного предположения о существовании седловой точки в так называемой маленькой игре. В предложенной формализации игры не исключалось, что выбор значения v[t] второго игрока может опираться на информацию о значении управления u[t] первого игрока. Тем самым при рассмотрении игры сближения к управлению второго игрока допускались функции V(t,u) — так называемые контр-управления [22]. В статье было дано обоснование правила минимаксного прицеливания первого игрока в регулярном случае. Для обоснования этого правила были введены функции Vs(t,u), экстремальные на направлениях s (s — векто ры сопряженного пространства к фазовому пространству). Введение этих функций явилось той точкой отсчета, с которой началось развитие методов унификации в дифференциальных играх. В появившихся чуть позже работах Н.Н. Красовского [20, 23] было дано определение унификацион-ных моделей, изучены их свойства и указаны перспективы применения в различных классах игровых задач динамики. Суть унификации заключается в том, что свойство стабильности выражается в терминах векторов s сопряженных переменных и гамильтониана конфликтно-управляемой системы. Исследования, проведенные в последующие годы, прояснили, что одна из важных направленностей унификации состоит в выражении свойства стабильности на языке анализа, в том числе выпуклого анализа. Унификация играет важную роль и при сравнении конфликтно-управляемых систем. Так, например, совершенно прозрачным становится тот факт, что две конфликтно- управляемые системы, имеющие одинаковые гамильтонианы, эквивалентны с точки зрения решения дифференциальной игры. Отметим, что тематика второй главы достаточно сильно близка к вопросам сравнения возможностей конфликтно-управляемых систем. Разным аспектам унификации, в том числе, вычислительным аспектам посвящены работы [2,51].

Следующий этап, связанный с представлением свойства стабильности, относится к началу 1980-х годов. К этому времени было рассмотрено несколько конкретных дифференциальных игр, в которых свойство стабильности можно было выразить, используя лишь конечное число дифференциальных включений и, кроме того, для некоторых из этих игр дифференциальные включения уже не ассоциировались к конкретным вектором управления второго игрока.

В первой половине 1980-х годов появилась довольно общая формулировка свойства стабильности [48,49], вобравшая в себя некоторые известные формулировки. В этой формулировке так же, как и в унификационной схеме [20,23], присутствует явно гамильтониан конфликтно-управляемой системы.

Вслед за этим, в середине 1980-х годов было получено инфинитези-мальное представление свойства стабильности [63], выраженное в терминах конусов Булигана или правых производных соответствующего множества. Как было показано А.И. Субботиным [65], это представление оказалось полезным не только при рассмотрении теоретических вопросов в дифференциальных играх, но и при исследовании обобщенных (минимаксных и вязкостных) решений уравнения Гамильтона-Якоби. Несколько позже инфи-нитезимальные конструкции, связанные с конусами Булигана, были применены при исследовании более общих уравнений в частных производных первого порядка.

Во второй главе данной диссертации показано, что конструкции, участвующие в инфинитезимальном определении свойства стабильности, удобно использовать РІ для некоторого расширения понятия стабильности. Это влечет расширение сферы применимости метода экстремального прицеливания Н.Н. Красовского [24,29].

Как правило, при работе с конкретной дифференциальной игрой приходится заменять стабильный мост некоторым приближением. Стабильный мост может иметь весьма изощренную форму, не допускающую удобного аналитического описания. Кроме того, погрешности неизбежны при реализации алгоритма управления на ЭВМ. Ниже приведена математическая конструкция, использующая понятие дефекта стабильности и позволяющая работать с необязательно стабильным множеством в пространстве позиций, решая при этом менее жесткую задачу о сближении — задачу о сближении с некоторой окрестностью цели. Дефект стабильности множества есть величина, оценивающая, в какой степени для используемого приближенного множества нарушается свойство стабильности.

В §2 второй главы приводится задача конфликтного управления, которой посвящены последующие параграфы второй главы.

Задана конфликтно-управляемая система, поведение которой на промежутке времени [о?$] о $ со, описывается векторным дифференциальным уравнением х — f(t,x,u,v), x(t0) = х°, и Є Р, v Є Q. (0.1)

Здесь х — m-мерный фазовый вектор из евклидового пространства Rm: и — управление первого игрока, v — управление второго игрока, Р и Q — компакты в евклидовых пространствах Rp и Rq соответственно. Предполагается, что выполнены условия:

(А) Вектор-функция /(, а;, и, v) определена и непрерывна по совокупности переменных (t, х, и, v) на множестве [0, Щ х Rm х Р х Q и удовлетворяет условию: для любого компакта D С [o,t9] х Rm найдется такое L = L{D) є (0,оо), что

f{t,x{1\u,v)-f(t,x(-2\u,v) L х -х® (0.2)

для любых (, х г\ u,v) 6 D х Р х Q, г = 1, 2.

(Б) Существует такое число \і Є (0, со), что

\\f{t,x,u:v)\\ fi{l + \\x\

для любых (t, х, и, v) Є [tQ, $] x Rm x P x Q.

Здесь 11/11 — норма вектора f в соответствующем евклидовом пространстве.

Рассматриваемая во второй главе дифференциальная игра является антагонистической и складывается из двух задач — задачи о сближении и задачи об уклонении [29]. В задаче о сближении, стоящей перед первым игроком, требуется обеспечить попадание движения x(t),t Є [о?$] системы (0.1) в момент д на заданный компакт М в Rm, каковы бы ни были при этом допустимые управления второго игрока. Решение задачи требуется обеспечить в классе позиционных процедур управления первого игрока.

Здесь для системы (0.1) не предполагается выполнение условия сед-ловой точки в маленькой игре.

Задача об уклонении, стоящая перед вторым игроком, заключается в том, чтобы выбрать допустимую стратегию Vе, обеспчиваюшую уклонение движений x(t):t Є [to, ] системы (0.1) в момент д от некоторой замкнутой е-окрестпости МЕ компакта М, каковы бы ни были при этом допустимые управлеїшя первого игрока.

Для сформулированной дифференциальной игры справедлива альтернатива [29]: существует такое замкнутое множество W0 С [о, ] х Rm — максимальный n-стабильный мост, что для всех исходных позиций ( , ) Є W° разрешима задача о сближении, и для всех исходных позиций ( , я ) Є ([to, ] х Rm) \W° разрешима задача об уклонении.

Согласно принципу экстремального прицеливания [18, 28, 29], разрешающая процедура управления первого игрока для исходных позиций (і , ж ) Є W° может быть реализована как процедура управления с поводырем, нацеливающая движение x(t) системы (0.1) на поводыря, идущего по мосту И 0.

Весьма часто при построении разрешающих управлений мы имеем не мост W°: а некоторое, может быть, не сильно отличающееся от него множество W С [to, ] х Rm, удовлетворяющее краевому условию W (&) = W0 ) = М, где обозначено W(t) = {х Є Rm : {t,x) Є W}. Для точек ( , ) множества W разрешима, вообще говоря, не исходная задача о сближении с М, а менее жесткая задача о сближении с некоторой є-окрестностью множества М.

Одна из основных задач, рассматриваемых во второй главе — задача аккуратной оценки є-окрестности в этой менее жесткой задаче о сближении. Эта оценка проводится в предположении о выполнении некоторых условий на множество W .

§3 второй главы является вспомогательным.

В нем даются определения, связанные с центральным понятием теории позиционных дифференциальных игр — стабильностью множеств.

Исходя из условия (Б), наложенного на систему (0.1), и, считая, что задан некоторый компакт W в [to, ] х Rm, можем выбрать компактную область

D = {(t,x) : t Є [to,0], N Ь + К - to)) - } ,

7 Є (0, оо) настолько большой, что в ней содержатся множества ($, М) — {{&, х) : х Є М}, W и все стабильные мосты W, включая максимальный стабильный мост

В §3 вводится в рассмотрение семейство С отображений

(t,x) н- Fi(t,x) С Rm, (t,x) Є D,

отвечающих векторам I из единичной сферы

S = {І є Rm : l Z = 1}сйт (см. стр. ).

Заметим, что по определению, все множества Fi(t, х), (t, х,1) Є DxS, есть выпуклые компакты в Rm, содержащиеся в некотором достаточно большом шаре G = {д Є Rm : р г} в пространстве Rm.

Далее вводятся в рассмотрение

Xi(t ]t ,x ) — множество достижимости в момент t Є ( ,#] (to t t г?) дифференциального включения

Xf1 ; , ) - { Є Дт : ЗДі ;і»,і )ПГ 0} , X С Rm.

Приводятся определения 3.1 и 3.2 оператора стабильного поглощения 7Г в задаче о сближении и ii-стабильного моста в задаче о сближении, выраженные в терминах множеств Xfl(t ;t ,X ): (t ;t ,X ) Є А X 2Rm, / Є S, ще А = {( , t ) : to t t $} — треугольное множество в [t0, #] х [і0, т9]. Здесь во введении мы не приводим эти определения, поскольку ниже приводятся соответствующие определения в более общей форме.

Следующее утверждение, важное в теории дифференциальных игр, перебрасывает мостик от свойства стабильности к вводимому ниже в этой главе понятию дефекта стабильности множеств в пространстве позиций. При этом в рассуждениях, сопутствующих этому переходу, принимается во внимание следующее важное утверждение из работы Х.Г. Гусейнова, А.И. Субботина и В.Н. Ушакова [63].

Теорема 0.1 Замкнутое множество W С D является и-стабилъным мостом в задаче о сближении тогда и только тогда, когда

1. W($) С М;

2. DW(t, х) П Fi(t, х) ф: te [t0, tf), (, х, І) Є dW x S.

Здесь

DW(t,x) = \dRm:d= lim Wk x;

{{tk,u)k)} С W, tk 11 при k — oo, lim wk = x \ ,

k— oo )

dW — граница множества W.

Для максимального ІІ-стабильного моста W° условие 1 в теореме 0.1 превращается в равенство W°($) = М. Из свойств моста W0 вытекает

W°(t ) П Э{г-и)т{х ) ф 0, ( , ) Є W°.

Здесь 07(:с ) = {х Є Rm : \\х — ж 7І 7 0 Последнее условие означает, что многозначное отображение і н-э- W°(), Є [о,$] меняется в некотором смысле не очень быстро в точках ( , а; ) Є И 0, Є [to, ) при увеличении .

В §4 второй главы рассматривается множество W С -D, упомянутое в §3, удовлетворяющее условию W ($) = М.

Предполагается, что множество W , подобно мосту ТУ0, удовлетворяет условию

(В) W (t ) П 0(t._t.)r(a: ) 0, ( ,а; ) Є ТУ ,0 •&.

Условие (В) представляется нам вполне естественным. Из него следует

M (i ,iJnG ф / ,( , О edW\ U Є [t0, ) Пусть (t„z ) Є dW\ t Є [t0,tf).

e(U,x ) = supp(L W (t ,a; ),Fj(t ,re )) 0

назовем дефектом стабильности множества W в точке ( , ).

Можно сказать, выражаясь не очень строго, что дефект стабильности множества W в точке (і ,ж ) Є dW , t Є [іо,і9) выражает степень неинвариантности множества W в точке (і ,ж ) относительно динамики конфликтно-управляемой системы в этой же точке (і , ж ).

В §4 показывается, что множество )1У( ,ж ) в формуле для є(і+,ж ) можно подменить более удобным — компактным множеством D W(U, ж ) = DW{U, ж ) П 3G, где 3G = {3g : # Є G}, так что

— • e(t , ж ) = supp(Dviy(t , ж ), i (t , ж )).

Пусть Г . = {(t, ж) : ж Є Ят} , Л(і ) = dW П Г\. є (і ) = sup є( ,ж ), t Є [to, #),

(і,,о;,)єЛ(і )

назовем дефектом стабильности множества W в момент Є [to,1 ).

Так определяемая неотрицательная функция e(t), t Є [to, $), рассматривается нами как некоторая характеристика нестабильности (неинвариантности) множества W .

Стабильность множества W эквивалентна согласно теореме 0.1 равенству є (і) Е 0 на [to,$). Отсюда следует, что в случае e(t) = 0 на [to, ), правило экстремального прицеливания на поводыря, идущего по W , гарантирует приведение движения x(t) системы (0.1) на М, если

(U,x(U)) = (UtXt) W .

Естественно ожидать, что малость функции є(і) на [to, в) позволяет правилу экстремального прицеливания на поводыря, идущего по W , обеспечивать приведение движения x(t) системы (0.1)в малую -окрестность множества М. Также, по-видимому, є может быть выражено через инте грал f s(t)dt

Для обоснования этих положений вводятся условия на множество W и функцию s(t), t Є [to, $):

(С) Существует неубывающая скалярная функция

(/? : (0, со) — [0, со), (р (5) і 0 при 5 10, такая, что

h(x + 5 D W (t„re ), W (U + 5)) 5- tp (5),

(і ,я ) edW , 5 Є (0, #- );

(E) Функция e(t) интегрируема no Римачу на [ o3 ] Здесь обозначено

ж + 5 • X = {х + 5 / : / Є X } ;

h(x + 5 • X , X ) = sup р(ж + (5-/, X ), I и I - множества из Лт;

р( + 5./,Х )= inf 11( + 5./)- 11.

х ЄЛ В §5 вводится позиционная процедура управления с поводырем (W -процедура управления с поводырем), отвечающая конечному разбиению Гп промежутка [ ,$] из [о,#] и исходной позиции ( ,# ). Эта процедура отличается от известных позиционных процедур управления тем, что она сконструирована для множества W в пространстве позиций, не являющегося -u-стабильным мостом. Это обстоятельство вносит некоторую специфику в определение ТУ -процедуры управления. При этом учитываются условия, наложенные на систему (0.1), в частности, условие (С). Сама процедура управления детально описана в §5.

В §6 второй главы выводится оценка рассогласования lls№ll — \\ZW XW\\ между движением x(t) конфликтно-управляемой системы (0.1)и вспомогательным движением z(t), порожденными W -процедурой управления первого игрока, отвечающей разбиению Гп. В силу упомянутых выше особенностей 1У -процедуры управления оценка выводится не традиционным путем суммирования традиционных локальных оценок квадрата рассогласования, а с использованием нестандартных рассуждений.

Она имеет вид

г=0

(0.3) Здесь (f°(5), х( ) — неотрицательные функции переменной S 0,

монотонно стремящиеся к нулю при 5 [ 0; А — диаметр разбиения Гп. Переходя к пределу при п — со, Д(п) —» со от пошаговых движений

x(t) и z(t), отвечающих разбиениям Гп, к конструктивным движениям x(t),

в итоге получаем

р{х{д),М) eL u) fe(r)dr. (0.4)

Иными словами (конструктивное) движение, порожденное W -процедурой управления с поводырем первого игрока, удовлетворяет включению

х(#) Є Мє, є = ew = еь{?-и) • I e(r)dr. (0.5)

Число є — єцг (0.5) мы трактуем как меру нестабильности множества W .

Замечание 0.1 Требование интегрируемости по Римаиу функции s(t) является достаточно жестким. Поскольку речь идет о верхней оценке, в определении дефекта стабильности моснсно заменить интеграл Римана верхним пределом интегральных сумм для функции e(t) при диаметре разбиения, стремящемся к нулю.

В третьей главе рассматривается та же самая, что и во второй главе, конфликтно-управляемая система (0.1) на конечном промежутке времени [to, $].

Изучаются и сравниваются две игровые задачи о сближении с терминальным множеством М в фазовом пространстве [19,29]. В первой из них первому игроку требуется обеспечить с помощью позиционного управления попадание фазового вектора системы (0.1) на М в конечный момент времени -д. Во второй задаче требуется обеспечить с помощью позиционного управления попадание фазового вектора на М не позже момента -д. Эти задачи являются наиболее важными в теории дифференциальных игр.

Постановка первой задачи — задачи о сближении с М в момент я?, выглядит, на наш взгляд, несколько проще, чем постановка второй задачи, и поэтому естественно ожидать, что алгоритмы построения ее решения проще, чем алгоритмы построения решения второй задачи - задачи сближения с М не позже момента (или, что одно и то же, — задачи сближения с М к моменту $). Имеющийся опыт разработки алгоритмов подтверждает это. Один из первых вопросов, возникающих при сравнении этих двух задач — вопрос о выделении тех условий на систему (0.1) и терминальное множество М, при которых решения обеих задач совпадают. Решения в этих задачах мы идентифицируем с максимальными ii-стабильными мостами Wa и W0 в них. При выполнении условий, обеспечивающих совпадение W° и W0, можно использовать для решения второй задачи алгоритмы построения решения более простой первой задачи.

При том позиционном подходе, который предложен в [19,29], максимальные п-стабильные мосты WD и W0 являются центральными элементами разрешающей конструкции. В §3 даются определение оператора стабильного поглощения и n-стабильного моста (определение 3.1-3.4) в задаче о сближении с М в момент д в достаточно общей форме (аксиоматической форме, базирующейся на системе условий A.I, А.2, А.З). Следует отметить, что эта форма записана на языке соответствующих дифференциальных включений, отвечающих "обратному" времени.

Приведем эти определения (см. [49]).

Пусть [to,fl] х Rm Э (t,x) ь-» G(t,x) С Rm — непрерывное в хаусдор-фовой метрике многозначное отображение; G(t, х) — выпуклые компакты в Rm, удовлетворяющие включению

F(t,x) zG(t,x), (t,x) С А

F(t,x) = co{f(t,x,u,v) : и Є P, v Є Q}; coA — выпуклая оболочка множества A.

Пусть также задано некоторое множество Ф элементов ф и семейство {Fjp : ф Є Ф} отображений

Яр : (t,a;) і я) С Rm, {t,x) Є Д

удовлетворяющее условиям

А.1 Для любых (t, х,ф) Є D х Ф множество F (t, х) выпукло, замкнуто в Rm uF (t,x) С 3( ,ж);

А.2 Для любых (t,x,l) Є D х 5 выполняется

nun/ ( )(0 = H(t,x,l);

А.З Существует такая скалярная функция и {5), (ш (5) 0 прг/ (5 j. 0 ); что

d(F ,z ),i (t , )) w (t - Г + Ця - гс )

для ( , а? ) гг ( , ) из D, ф Є Ф.

Здесь Л-І?(/) = sup I, f — опорная функция множества F С Rm]

d(F(D,F(2)) = - max I sup inf /(1) - f® II, sup inf /(1) - /(2) II I

{fWeFWfi2)F(2) /(2)eF(2)/W6FW "J

— хаусдорфово расстояние между F и F из Rm.

Приведем определение оператора стабильного поглощения в задаче о сближении с М в момент -#.

Пусть to t t $. Полагаем Хф{р \ t ,x ) — множество достижимости в момент t дифференциального включения

х Є F,i,(t,x), x[tJ = ж , фе Ф;

(0.6)

X (U; t , Я ) = {x Є Ят : Я П X t ; t , x ) ф 0} , здесь Я С Rm.

Определение 0.1 (см. [49]) Оператором стабильного поглощения 7г в задаче о сблиоюении с М в момент $ назовем отображение 7г : Л х 2Rm і— 2Rm, заданное соотношением

тг(Ь; ,# ) = ПХ ;ЛЯ );

ЄФ

Здесь А = {( , ) Є [t0,ti] х [t0j#] : U t }.

Определение 0.2 (см. [49]) Замкнутое множество W С D назовем и-стабильным мостом в задаче о сблиоюении с М в момент д, если

W( &) С М;

W(U) с тг (t ; t , W( )), (t+, t ) є Д.

Наряду с дифференциальными включениями (0.6), участвующими в определении тх-стабильного моста W и отвечающими "прямому" времени, в третьей главе рассматриваются дифференциальные включения

Z[T] Є ФФ(Т, Z[T}), Z[T ] = г\фЄ Ф, (0.7)

отвечающие "обратному" времени г Є [to,$], где

{r,z) = -F {t,z), r = tQ + -d, t€[t0,tf].

Полагается при этом т = Ц + її — t , т = to + ti — t .

Соответственно "обратному" времени, введем в рассмотрение Z-фіт г , z ) — множество достижимости дифференциального включения (0.7) в момент т .

Полагаем также

z eH Справедливо равенство

тг(Ь; , Я ) = f Хф\и t\ Я ) = f Z (r,; г , Я ) (0.8)

Учитывая введенное выше "обратное" время т, множество W С [to, г?] х i?m, рассматриваемое ранее в пространстве позиций (і, х), будем обозначать в терминах "обратного" времени т символом W С [о,$] х - т и трактовать как множество в пространстве позиций (т, z). При этом временные сечения в пространствах позиций (, х) и (т, г) множеств I HW связаны равенством

W(t) = W{r), i + r = t0 + ,

так что W(t0) = W(i?) и W(tf) = W(t0).

Запишем определение w-стабильного моста в задаче о сближении с М в момент $ в терминах множеств достижимости Z (-7V, т , Я ), Я С Ят, отвечающих "обратному" времени.

Определение 0.3 (см. [60]) Оператором стабильного поглощения 7г в задаче о сближении с М в момент •& назовем отображение 7г : А х 2Rm і— 2Rm, заданное соотношением

тг(т ;т ,Я ) = р (т ;т ,Я ); т/ єФ

здесь {т ,п) Є Д, Я Сйт

Определение 0.4 Замкнутое множество W С D назовем и-стабилъным мостом в задаче о сближении с М в момент її, если

W(t0) С М; W(r0C7r(r ;r , W(T )): (Т ,Т )ЄА.

Из определения 0.4 следует, что максимальный «-стабильный мост WD С D в задаче о сближении с М в момент $ есть максимальное замкнутое множество из .D, удовлетворяющее условиям

Wn{t0) = М;

(0.9)

Wn{n) С тг(т ;т ,МЯ(7- )), (г , г ) Є А.

В соотношениях (0.9), характеризующих максимальный «-стабильный мост WD, участвуют наряду с начальным моментом to пары моментов (т ,т ) Є А.

Оказывается возможным перейти от этих соотношений к характери-зации моста WD при помощи инфинитезимальных соотношений, в которых пары {т ,т ) Є А подменены моментами т Є [toj ) (т0 есть как бы слиты в один момент г ), а пары сечений (УУп(т ), WD(r;t:)) — точками (r ,z ), содержащимися в Wn(r ). При этом представляется целесообразным выявить и инфинитезимальные свойства произвольного «-стабильного моста W, а не только моста WD.

Инфинитезимальные конструкции «-стабильных мостов, которые рассматриваются в §§3, 4, 5 третьей главы, тесно связаны с понятием контингентного конуса, введенным Булиганом в начале тридцатых годов предыдущего века [37]. Имеется несколько определений контингентного конуса Th(х) непустого множества ft из RN в точке жеП.

Определение 0.5 Множество

%м = ПП U (ка-х)+ев")

е 0а 0/іє(0,а] называется контингентным конусом к Q в точке х.

Здесь BN = [Ь 6 RN : \\Ъ\\ l}; bjj — евклидова норма вектора Ъ Є RN.

В §3 третьей главы приводится еще одно определение тангенциального конуса TQ(X), удобное в рассуждениях, касающихся «-стабильных мостов.

Лемма 0.1 TQ(X) — Р СІ con(Q(x;a) —x).

a 0

Здесь con (Г2(ж; a) — x) — {Xg : X 0, g Є (0(ж; a) — x)} — конус в RN: натянутый на множество (Q(x; a) — x); clA — замыкание множества A.

С помощью этого определения тангенциального конуса становится более прозрачной связь между данными ранее неинфинитезимальными определениями u-стабильных мостов и следующим необходимым условием и-стабильности, выраженным в инфинитезимальной форме (Теорема 0.2).

Предварительно введем производное множество

VW{w ) = {deRm: (l,d) Є Ttf(w )}

отображения г і— W(T), Т Є [т , Щ в точке ги — (т , z ) Є W. Здесь VV = W П {(r, z) : r Є [т , #], z Є Rm}.

Теорема 0.2 Если замкнутое мнозісество W С D является и-стабилъным мостом в задаче о сближении с М в момент її, то необходимо выполняется

ЪЩт\ z ) С f (rw(T.)(2 ) + Ф (т , z )) (0.10)

для всех т Є [ о,#), (т , я ) Є V.

Для ii-стабильного моста W, записанного в переменных t: х, можно также ввести производные множества, отвечающие возрастанию и убыванию "прямого" времени t. Такие производные множества рассматривались в работах [50,52,63]. Обозначим их соответственно символами DW(t ,x ) nDW(t ,x ).

Для одного и того же -стабильного моста справедливы равенства для точек (і ,х ) GW ((r ,2 ) = (tQ + $ ,x ) Є W) DW(t ,x ) = Ш(г ,/), 6w(t\x ) = VW{T ,Z ).

Учитывая первое равенство, запишем теорему 0.2 в виде

Теорема 0.3 Если замкнутое множество W С D является и-стабильным мостом в задаче о сблиэтении с М в момент її, то необходимо, чтобы

DW(t\x )d П (Тщг)(х )-Рф(Г,х )),

Ф (0.11)

(Г, re ) Є W, t G ( о,#].

Именно в такой форме теорема 0.2 была сформулирована и доказана в работах [48,49]. Доказательство теоремы 0.2, приведенное здесь в диссертации в терминах "обратного" времени, повторяет с некоторыми изменениями доказательство из [48,49].

В §4 третьей главы определяются оператор стабильного поглощения и w-стабильный мост в задаче о сближении с М к моменту її.

Приведем эти определения.

Полагаем, что М — то же самое, что и в задаче о сближении с М в момент її. Пусть {U,t ) Є А, Я С Rm.

Введем обозначение

М(я) = ( м te[t"n

[мин, t = t .

Определение 0.6 Оператором стабильного поглощения х в задаче о сближении с М к моменту її назовем отображение % : А х 2Rm і— 2Rm, заданное соотношением

x(Uit ,H)=f} U X (U;t,Mt(H)).

Определение 0.7 Замкнутое множество W С D назовем и-стабильным мостом в задаче о сближении с М к моменту її, если

/{її) С М;

W(QcX(U;t ,W(t )): ( , ) Є Д.

Можно показать , что как в этой задаче о сближении, так и в задаче о сближении с М оператор стабильного поглощения определен корректно.

А именно, можно показать, что семейства {i : D і— 2ят}, отвечающие различным множествам Ф и удовлетворяющие условиям А.1 — А.З, эквивалентны в том смысле, что соответствующие операторы выделяют одни и те же -м-стабильные мосты W в D.

Точно так же, как в задаче о сближении с М в момент $, здесь можно записать определения оператора стабильного поглощения и г -стабильного моста в терминах "обратного" времени т.

Определение 0.8 Оператором стабильного поглощения х в задаче о

сближении с М к моменту $ назовем отображение % : 2Rm \— 2Rm, заданное соотношением

х(т ;т ,Я)=р (J Z (T T,MT(H)) •0ЄФ Т&[Т ,т„]

здесь (т ,п) Є А, #С Rm.

Определение 0.9 Замкнутое мнооїсество W С D назовем и-стабильным мостом в задаче о сближении с М к моменту д, если

W( o) С М;

W(n) с х Ы г , W(T )) , (г , п) є А.

В §5 третьей главы изучается вопрос о выделении тех условий на систему (0.1) и множество М, при которых решения обеих задач о сближении совпадают. Основной результат третьей главы составляют критерии совпадения максимальных -стабильных мостов Wu и W0 в задачах о сближении с М для стационарных конфликтно-управляемых систем (0.1).

Приведем эти критерии.

Пусть система (0.1) имеет вид

— = /(, ж, щ v), xeRm, иєР, ve Q. (0.12)

Введем в рассмотрение множество WM = [to, ]xM CD.

Теорема 0.4 Для того, чтобы в двух задачах о сблиоісении с М, сформулированных для системы (0.12), выполнялось равенство Wu = W°,

необходимо и достаточно, чтобы замкнутое мноэюество WM С D было и-стабилъным мостом в задаче о сближении с М в момент д.

Определение 0.10 Будем говорить, что максимальный и-стабильный мост Wn в задаче о сближении с М в момент в является монотонным, если для любых двух моментов t , t , ( , ) Є А верно

Wn(U) э Wn(t ). (0.13)

Теорема 0.5 Для того, чтобы в двух задачах сближении с М, сформированных для системы (0.12), выполнялось равенство Wa = W°, необходимо и достаточно, чтобы мост Wn был монотонным.

Замечание 0.2 При доказательстве теорем 0.4 и 0.5 используются теорема 0.1 и теорема 0.3, сформулированная и доказанная в §3 третьей главы.

Основные результаты диссертации опубликованы в работах [10-13,34,

35,53-58,66,67].

Задача с перпендикулярными отрезками

Для задач об уклонении исследуются вопросы, связанные с построением гарантирующего управления второго игрока и выяснением структуры этого управления. Для задач о сближении исследуется свойство u-стабилыюсти множеств, содержащихся в пространстве позиций игры, введенное в работах Н.Н. Красовского и А.И. Субботина [18,19,28,29]. Известно несколько основных подходов к формализации дифференциальных игр. Одной из первых методик исследования дифференциальных игр явилась методика, предложенная Р. Айзексом в середине ХХ-ого столетия, базирующаяся на использовании так называемого «основного уравнения» теории дифференциальных игр. Монография Р. Айзекса «Дифференциальные игры», переведенная в 1968 году на русский язык, сыграла определенную роль в становлении теории дифференциальных игр в нашей стране.

В 60-е годы Л.С. Понтрягиным для решения линейных дифференциальных игр была введена конструкция альтернированного интеграла [41], выделяющая в пространстве позиций игры множество разрешимости — множество всех тех позиций, из которых разрешима задача о сближении. Концепция альтернированного интеграла получила развитие в работах M.C. Никольского, Е.С. Половинкина, Н.Х. Розова, А.И. Пономарева. В настоящее время усиленно продолжается разработка теории и методов вычисления альтернированного интеграла Л.С. Понтрягина, оставаясь в центре внимания специалистов по теории дифференциальных игр. Здесь отметим, работы А.Б. Куржанского и его учеников [14,29], посвященные задачам синтеза управлений в системах с линейной структурой. В этих работах решение задач конфликтного управления достигается соединением модифицированных конструкций экстремального прицеливания Н.Н. Кра-совского и альтернированного интеграла Л.С. Понтрягина.

Случай совпадающих отрезков

Для достижения поставленной цели используются позиционный подход и конструкции, разработанные в рамках этого подхода. Основными элементами этих конструкций являются стабильные мосты, унификацион-ные схемы стабильности и процедуры управления с поводырем, наряду с которыми можно рассматривать и схемы, базирующиеся на экстремальном прицеливании. Перейдем к краткому описанию содержания диссертации: В теории дифференциальных игр представляют существенный интерес вопросы, относящиеся к структуре и свойствам различных классов стратегий. При этом принципиальным является вопрос [4,5,7-9,17,24,29,45, 64] о свойствах непрерывных стратегий PI ИХ связи с программными управлениями. Некоторым аспектам этой тематики посвящена первая глава диссертации. Этот вопрос подробно изучен [4, 5,17, 24, 29, 45, 64] для линейных управляемых систем в предположении выпуклости терминального множества. Можно ослабить это предположение до ацикличности (вырожденности группы гомологии) некоторых связанных с задачей объектов, см. [9] .

Постановка задачи конфликтного управления

Можно непосредственно проверить, что в рассматриваемых в трех примерах дифференциальных играх программные управления не позволяют гарантировать уклонение от терминального множества. Также указаны способы уклонения с помощью управления по принципу обратной связи. В примерах, содержащихся в 2, 3, уклонение от терминального множества гарантируется с помощью одного замера фазового вектора, причем соответствующие способы управления задаются разрывными отображениями. Указаны некоторые семейства таких способов управления, зависящие от параметра. Проведена оптимизация по этому параметру. В задаче из 4 можно обеспечить уклонение с помощью простой непрерывной стратегии.

В течение последующих десятилетий, начиная с 1970 года, имела место эволюция в описании этого свойства.

Оператор стабильного поглощения и стабильные мосты в задаче о сближении в момент

Исследования, проведенные в последующие годы, прояснили, что одна из важных направленностей унификации состоит в выражении свойства стабильности на языке анализа, в том числе выпуклого анализа. Унификация играет важную роль и при сравнении конфликтно-управляемых систем. Так, например, совершенно прозрачным становится тот факт, что две конфликтно- управляемые системы, имеющие одинаковые гамильтонианы, эквивалентны с точки зрения решения дифференциальной игры. Отметим, что тематика второй главы достаточно сильно близка к вопросам сравнения возможностей конфликтно-управляемых систем. Разным аспектам унификации, в том числе, вычислительным аспектам посвящены работы [2,51].

Таким образом, можно констатировать, что к началу 1980-х годов налицо имелось несколько представлений, используемых при описании свойства стабильности, столь важного в дифференциальных играх. Хотя эти представления различны по форме, они выделяют одни и те же стабильные мосты и, значит, эквивалентны по существу. В первой половине 1980-х годов появилась довольно общая формулировка свойства стабильности [48,49], вобравшая в себя некоторые известные формулировки. В этой формулировке так же, как и в унификационной схеме [20,23], присутствует явно гамильтониан конфликтно-управляемой системы.

Похожие диссертации на Игровые задачи сближения-уклонения: обратная связь и стабильность множеств

Аналитические и приближенные методы решения задач сближения-уклонения в дифференциальных играхОстапенко, Валентин Владимирович

Уравнение эволюции невыпуклых множеств в задаче достижимости и управление потокамиМазуренко, Станислав Сергеевич

Некоторые вариационные задачи, определенные на множестве почти периодических функцийВоронецкая Марина Александровна

Задача Дирихле на двумерных стратифицированных множествахКовалева Лидия Александровна

Краевые задачи для лапласиана со сменой типа граничного условия на множествах, стягивающихся к кривой Планида Марина Юрьевна

Бифуркационное множество задачи о движении твердого тела вокруг неподвижной точки в случае Ковалевской-ЯхьиРябов, Павел Евгеньевич

Эффективные алгоритмы, основанные на вычислении оценок, с прямоугольными опорными множествами, для задач распознавания изображенийНефёдов Алексей Валентинович

Методы отсечений с обновлением аппроксимирующих множеств для задач нелинейного программированияЯруллин Рашид Саматович

Информационные множества в модельных задачах наблюдения за движением самолета в горизонтальной плоскостиФедотов Андрей Анатольевич

Некоторые маршрутные задачи последовательного обхода множеств Ченцов Алексей Александрович