Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Кирилин Михаил Николаевич

Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях
<
Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кирилин Михаил Николаевич. Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях : Дис. ... канд. физ.-мат. наук : 01.01.02 Москва, 2005 103 с. РГБ ОД, 61:05-1/1207

Содержание к диссертации

Введение

1 Достижимость управляемых систем без неопределенности 20

1.1 Введение 20

1.2 Постановка задачи 22

1.3 Внешние и внутренние эллипсоидные аппроксимации для суммы эллипсоидов 25

1.4 Внутренняя эллипсоидальная аппроксимация 27

1.5 Тугая внутренняя аппроксимация и рекуррентные уравнения 30

1.6 Внешняя е-окрестность множества достижимости 34

1.7 Внешняя эллипсоидальная е-аппроксимация 36

1.8 Тугая внешняя е-аппроксимация и рекуррентные уравнения 38

2 Достижимость управляемых систем при неопределенности с управлением без обратной связи при конечном числе точек коррекций 43

2.1 Введение 43

2.2 Постановка задачи 44

2.3 Эллипсоидальная внешняя е-аппроксимация множества достижимости типа max min 48

2.4 Множество достижимости типа max min 50

2.5 Множество достижимости типа min max с А; точками коррекции . 54

2.6 Множество достижимости типа max min с А; точками коррекции . 56

2.7 Алгоритм построения внешней аппроксимация для множества достижимости с к точками коррекции 58

2.8 Примеры 58

2.9 Алгоритм построения е-касательных эллипсоидов для произвольного выпуклого множества 63

3 Достижимость управляемых систем при неопределенности и управ лении с обратной связью 66

3.1 Введение 66

3.2 Постановка задачи 68

3.3 Эволюционное уравнение 70

3.4 О непрерывности сверху и снизу решения эволюционного уравнения . 71

3.5 окрестность множества достижимости 73

3.6 Внешние и внутренние эллипсоидальный аппроксимации для симметричного невырожденного многогранника 75

3.7 Внешние и внутренние аппроксимации исходной задачи 76

3.8 Внешние эллипсоидальные аппроксимации, находящиеся в /^-окрестности исходной задачи 77

3.9 Внутренняя эллипсоидальные аппроксимации, находящиеся в //-окрестности исходной задачи 85

3.10 Примеры 92

Заключение 97

Список литературы

Введение к работе

Вопросы, рассматриваемые в настоящей диссертации, относятся к математической теории процессов управления движением: задачам вычисления областей достижимости управляемых систем. Подобные проблемы возникают в задачах автоматизации процессов реального времени, оценивания состояния управляемых систем и верификации гибридных систем.

Изучаемые системы описываются линейными дифференциальными уравнениями, в которых наряду с управлением присутствуют также возмущение или неопределенное воздействие. Предполагается, что начальное состояние, управление и неопределенное воздействие стеснены "жесткими" геометрическими ограничениями. В рамках данных ограничений можно выделить три основные постановки задачи достижимости, рассмотренные в данной работе: достижимость без неопределенности; достижимость в условиях неопределенности с управлением без обратной связи и конечным числом точек коррекции траектории; достижимость с неопределенностью и управлением с обратной связью. Несмотря на линейность системы дифференциальных уравнений, задача построения области достижимости при неопределенности и управлении с обратной связью является нелинейной. Последнее объясняется тем, что управление принадлежит классу многозначных отображений, зависящих от траектории системы, после подстановки которой в исходные уравнения система принимает вид нелинейного дифференциального включения.

К настоящему времени разработан широкий спектр методов для решения задач достижимости, разрешимости и синтеза управления.

Альтернированный интеграл, введенный Л. С. Понтрягиным в работах [35, 36], рассмотренный в обратном времени, позволяет свести вычисление множества дости-

жимости к интегрированию многозначных отображений [37]. Этот подход был продолжен в работах Е. Ф. Мищенко, М. С. Никольского, Е. С. Половинкина, Н. X. Розова.

Эффективным методом исследования управляемых систем послужил функциональный подход, разработанный Н.Н. Красовским и его сотрудниками [8], [11] - [19], [17, 57]. В монографии [12] предложена формализация дифференциальных игр и подробно исследована их структура. В частности, указано, каким образом можно построить синтезирующую стратегию управления, удерживающую траекторию внутри "стабильного моста", несмотря на действия второго игрока, и обеспечивающую выполнение фазовых ограничений и попадание на целевое множество в заданный момент времени.

Одним из самый общих подходов в теории управления является метод Динамического программирования, предложенный Р. Беллманом [2] и примененный к игровым задачам Р. Айзексом [1]. Данный метод заключается в погружении исходной задачи в параметризированный класс задач. Оптимальные значения функционала, вычисленные для каждого значения параметров, образуют функцию цены. При этом набор параметров, образующих позицию системы, должен быть достаточным для того, чтобы можно было сформулировать принцип оптимальности, выраженный в полугрупповом свойстве для функции цены. Тогда последняя является решением дифференциального уравнения в частных производных, называемого уравнением Гамильтона-Якоби-Белл-мана-Айзекса ( HJBA), а множество достижимости находится, как множество линий данной функции. Так как функция цены может быть не всюду гладкой, вводят различные понятия обобщенного решения уравнения Беллмана, например, вязкостные решения [52] или минимаксные решения [43, 44]. Если взять в качестве критерия оптимальности квадрат расстояния между начальным множеством и концом траектории в начальный момент времени и проминимизировать критерий оптимальности по управлению для всех траекторий, попадающих в точку х в момент времени t, мы определим соответствующую функцию цены V(t, х), и тогда искомое множество достижимости — есть множество уровня данной функции {х : V(t, х) <= 0}.

Одним из возможных методов построения внутренних и внешних аппроксимаций для множеств достижимости и разрешимости и нахождения и построения синтезирующей стратегии является метод эллипсоидальных аппроксимаций. Впервые эллипсоидальная техника рассматривалась в работах А.Б. Куржанского [20], 12, Ф. Швеппе

[69], Ф. Черноусько [47]. В работах А.Б. Куржанского [59, 22, 23, 62, 61, 65, 63] построена конструктивная теория, объединяющая метод динамического программирования, альтернированный интеграл и функциональный подход, предложенный Н.Н. Красовским, направленная на решение задач до конца, то есть до конечного численного алгоритма. Для этого используется аппарат эллипсоидальных аппроксимаций [59, 62, 63, 64], позволяющий строить тугие внутренние и внешние эллипсоидальные аппроксимации для множеств достижимости и разрешимости. Объединение тугих внутренних и пересечение внешних эллипсоидных аппроксимаций позволяют построить множество достижимости и его границу. Каждая тугая внутренняя аппроксимация для множества разрешимости является слабоинвариантной системой множеств, поэтому она может быть использована в качестве синтезируещей стратегии управления. При этом синтез может быть представлен в явном виде, через параметры аппроксимации и задача синтеза сводится фактически к интегрированию системы обыкновенных дифференциальных уравнений для параметров эллипсоидальной аппроксимации.

Настоящая работа расширяет материал монографии [59]. В данной теории предполагается, что динамика системы описывается линейными дифференциальными уравнениями, а начальное состояние системы, управление и возмущения принадлежат геометрическим ( жестким или мгновенным ) ограничениям. Эти ограничения означают, что соответствующая величина в каждый момент времени должна находиться в заранее заданном непустом множестве. В качестве класса ограничивающих множеств взяты невырожденные эллипсоиды.

Однако на практике возникают ситуации, когда на управление и возмущение наложены вырожденные, негладкие, ограничения, например, в виде коробок или многогранников. Подобная постановка задачи была рассмотрена в работах Костоусовой Е.К. [54, 55] и для систем без неопределенности получении аппроксимации в виде параллелотопов.

Настоящая работа имеет целью развить эллипсоидальные методы аппроксимации областей достижимости на специфический круг объектов - линейные управляемые системы с "жесткими" неэллипсоидальными ограничениями на начальное состояние, управление и помеху, заданными в виде симметричных многогранников.

В первой главе диссертации рассматривается задача достижимости для линейной системы без неопределенности при ограничениях на начальное состояние системы и управление в форме симметричных многогранников.

В разделе 1.2 в общем виде описывается задача, которой посвящена первая глава.

Управляемая система задается дифференциальными уравнениями

x(t) = A(t)x(t) + B(t)u, teT= [t0, U]. (1)

Здесь x(t) eP — положение системы, и Є Rp — управление. Матрицы A(t), B(t) являются известными параметрами и обладают достаточной гладкостью.

Предполагается, что управление стеснено "жесткими" ограничениями, то есть принимает значение только из определенного множества:

и Є V(t). (2)

При этом используются два класса управлений: программные управления Иоь (измеримые функции u(t)) и позиционные стратегии Ucl(многозначные отображения U(t,x) полунепрерывные сверху по фазовым переменным).

Предпологается, что множество V(t) является симметричным многогранником следующего вида

7>(0 = М(р, Р) = {х:х = р + ^р{аи а Є [-1,1]}. (3)

Начальное состояние системы ограниченно включением x(to) Є Л4(х,Х).

В данной главе преследуются следующие цели: построить семейство внутренних эллипсоидальных аппроксимаций для области достижимости, объединение которых дает точное представление для множества достижимости; построить семейство внешних эллипсоидальных аппроксимаций для є-окрестности области достижимости, пересечение которых находится во внешней є-окрестности множества достижимости; выделить внутреннее подсемейство эллипсоидальных трубок, касающихся трубки достижимости вдоль семейства "хороших" кривых и удовлетворяющих рекуррентным

уравнениям, независящим друг от друга; выделить внешнее подсемейство эллипсоидальных трубок, касающихся некоторой е-окрестности трубки достижимости вдоль семейства "хороших" кривых и удовлетворяющих рекуррентным уравнениям, независящим друг от друга.

В разделе 1.3 рассмотрены основные конструкции и положения из теории эллипсоидального исчисления [59|.

Внешние и внутренние эллипсоидные аппроксимации для суммы эллипсоидов

Тугие эллипсоидальные аппроксимации для задач с эллипсоидальными ограничениями были рассмотрены в работах [62, 63]. Будем говорить, что эллипсоид (q (t), Q-(t)) С X[t] является внутренней тугой аппроксимацией для множества достижимости вдоль направления І Є К", если выполнено равенство /0 1, ]) = p(±l\(q-(t),Q_(t))) и не существует никакого другого эллипсоида , удовлетворяющего свойству S(q-(t), Q-{t)) С С X[t].

Очень важно построить численный алгоритм таким образом, чтобы вычисление аппроксимации трубки достижимости происходило посредством некоторой рекуррентной процедуры. Под рекуррентностью понимаем следующее свойство: если построена внешняя тугая аппроксимация множества достижимости в момент времени t, то для построения тугой аппроксимации в любой последующий момент времени t нет необходимости заново проделывать вычисления на отрезке времени [to,t]. На рис. 1.2 представлен пример тугой аппроксимации в различные моменты времени

Рассмотрим теперь вопрос построения внешней эллипсоидальной аппроксимации множества достижимости. В данном разделе построена внешняя эллипсоидальная аппроксимация множества достижимости по аналогии со схемой, предложенной в работе А. Б. Куржанского и И. Вальи [59]. Ограничения на начальное состояние исходной системы и на управление представлены в виде суммы вырожденных эллипсоидов. В силу вырожденности данных эллипсоидов не представляется возможным напрямую воспользоваться данной схемой доказательства. Поэтому, вначале, вводится е-регуляризация исходной задачи, множество достижимости которой будет находиться в є-окрестности искомой области достижимости.

Тугие внешние эллипсоидальные аппроксимации для задач с эллипсоидальными ограничениями были рассмотрены в работах [62, 63]. Будем говорить, что эллипсоид (q+(t), Q+(t)) является внешней тугой аппроксимацией для множества достижимости X[t\ вдоль направления / Є R", если выполнено равенство /э(±/Д И) = p(±l\(q+(t),Q+(t)) и не существует никакого другого эллипсоида с матрицей kQ+(t),0 к 1, удовлетворяющему данному свойству.

Аналогично внутренним аппроксимациям важно построить численный алгоритм таким образом, чтобы вычисление аппроксимации трубки достижимости происходило посредством некоторой рекуррентной процедуры

Таким образом, показано, что для любого фиксированного направления І К." можно построить внешнюю эллипсоидальную трубку {(q+(t),Q+(t)), t to}, которая будет касаться є-окрестности трубки достижимости вдоль кривой l (t) = X (to, t)l в каждый момент времени t. При этом, указанные вычисления можно проводить ре-куррентно. В силу касательного свойства (1.34) справедливо следующее утверждение

Для фиксированного вектора І Є Rn обозначим xf(t) кривую касания эллипсоидов (q+(t),Q+(t)) с трубкой Xe[t]. В фиксированный момент времени t точка x\{t) лежит в опорном множестве множества достижимости Xe[t] в направлении l (t). Для всех t to выполнено равенство

Внешняя е-окрестность множества достижимости

Эта глава посвящена нахождению внешней аппроксимации для областей достижимости управляемых систем, в которых наряду с управлением присутствует неопределенность, которую можно интерпретировать как помеху или действие противника в игровой задаче.

Будем рассматривать линейную управляемую систему отличающуюся от (1.1) наличием зарание неизвестной помехи, стесненной геометрическим ограничением

Как и в предыдущей главе, управление удовлетворяет геометрическому ограничению и Є V{t) С Rp и принадлежит классу программных управлений UOL —множеству измеримых функций Т — Кр, гарантирующих существование, единственность, продолжаемость на весь отрезок времени решения системы дифференциальных уравнений (2.1).

Рассматриваются два типа областей достижимости:

1. Область достижимости типа min max — множество всех состояний, достижимых в силу системы (2.1) из начального множества при помощи всех возможных управлений и Є V(-), выбираемых в момент времени 0 для всего отрезка времени Г из условия, что поступила информация о значении неизвестного возмущения veV{-).

2. Область достижимости типа maxmin — множество всех состояний, достижимых в силу системы (2.1)из начального множества при помощи всех возможных управлений и Є V{-) и отсутствии какой либо информации о значении неизвестного возмущения v Є Q(-) Так же рассматриваются задачи, в которых в некоторые фиксированные моменты времени возникает информация о состоянии системы. Это приводит к проблемам достижимости при неопределенности с антисипативным (maxmin) и неантисипативным (min max) управлении без обратной связи с конечным чилом точек коррекции.

Целью данной главы является нахождение алгоритмов эллипсоидальных аппроксимаций для областей достижимости при неопределенности с антисипативным и неанти-сипативными управлении без точек коррекции и с конечным числом точек коррекции.

Постановка задачи

В данном разделе вводятся основные определения, используемые в настоящей главе. Рассматриваются различные постановки задач для управляемых систем с неопределенностью при управлении без обратной связи, а также задачи, в которых присутствует информация о состоянии системы в фиксированные моменты времени. Данная информация позволяет корректировать управление в заданные моменты времени. Рассмотрим управляемую систему линейных дифференциальных уравнений с непрерывными матричными коэффициентами A(t), B(t), C(t). Здесь х Є Rn — состояние системы, и Є Rp — управление без обратной связи, любая измеримая функция, удовлетворяющая геометрическим ограничениям

В системе присутствует неизвестное возмущение v(t) Є К9, ограниченное включением здесь V(t) и Q(t) — непрерывные многозначные функции с компактными выпуклыми значениями. Начальное состояние системы ограниченно включением здесь множество Х — выпуклый компакт.

Класс управлений без обратной связи и(-), ограниченных включением (2.3), обозначим символом Uoc i класс возмущений, ограниченных включением (2.4), обозначим символом Voc Можно выделить два вида множеств достижимости без обратной связи: множества достижимости типа maxmin и типа minmax.

Определение 2.1. Множеством достижимости тина maxmin X+(t,to,X) системы (2.2), (2.3), (2.4) в момент времени t to из начального множества Х называют объединение всех состояний х, таких что для любого v(t) Є Q(t) существует начальное состояние x(to) = х Є Х и управление без обратной связи u(t) Є V{t), приводящие данную систему из точки х в х на отрезке времени [to,t]. Обозначим x(t, to,x\u(-),v(-)) — единственную траекторию системы (2.2), соответствующую начальному состоянию ж0, управлению и(-) и возмущению v(-). Тогда при фиксированной неопределенности у(-) множество достижимости X(t, to, X\v(-)) имеет вид ( , о, ()) = U{x{t,to,x0\u(-),v( ))\x Є Х\и{-) Є Uo}, а множество достижимости типа minmax

Воспользовавшись определением геометрической разности Минковского V—Q = {с : с + Q С Р], множество достижимости типа minmax можно представить в виде X+{t,t0,X) = (x(t0,t)X + f X{s,t)P{s)ds\ - f X(s,t){-Q(s))ds (2.6) Определение 2.2. Множеством достижимости типа minmax X (t,to,X) системы (2.2), (2.3), (2.4) в момент времени t to из начального множества Х называют объединение всех состояний х, для каждого из которых существует управление u(t) V{t), такое, что для любой помехи v(t) Є Q(t) существует начальное состояние x(to) = х Є Х и соответствующая траектория системы x(t,to,x\u(-),v(-)) на отрезке времени [t0, t] попадает в точку х.

Множество достижимости типа min max с А; точками коррекции

Теперь добавим точку коррекции в момент времени t = 7. Трубка достижимости типа min max данной системы с одной точкой коррекции (рис. 2.5) не сильно отличается от трубки достижимости без коррекции (рис. 2.3). На отрезке [0,7] они совпадают, а после точки коррекции выполнено включение

При добавлении точки коррекции в момент времени t = 7 множество достижимости не вырождается в момент времени t . Данное множество также не вырождается на всем отрезке времени [0,14]. Хотя при некотором 14 оно также равно пустому множеству. На рис. 2.5 представлена трубка достижимости типа minmax с одной одной точкой коррекции (t = 7) на точкой коррекции (t — 7). Данная трубка совпадает с трубкой для множества достижимости без коррекции до момента времени первой коррекции, а после выполнено включение Множества достижимости с одной точкой коррекции связаны включением

Если на отрезке [0,14) рассмотреть 4 точки коррекции, тогда трубки достижимости типа max min и minmax примут вид показанный на рис. 2.7 и 2.8, соответственно. При увеличении количества точек коррекции сохраняется включение Причем уже при 4 коррекциях множество находится в некоторой окрестности Множество достижимости типа maxinin с четырьмя точками коррекции на отрезке времени [0,14]

Алгоритм построения е-касательных эллипсоидов для произвольного выпуклого множества

Вернемся к вопросу нахождения эллипсоидальной аппроксимации после прохождения точки коррекции. Предположим, что is конечномерном к ростр аист не задано выпуклое симметричное относительно начала координат множество X. Будем считать, что известим опорная функция р{1\Х), а также для каждого вектора I 6 S задан элемент a?j, Принадлежащий опорному гипермпожеетну в направление I.

Пусть естественный ортонормированный базис. Зафиксируем вектор / Є S. Построим новый нормированный базис. Возможны три случая: 1. Вектор I ортогонален вектору xi. Тогда в опорном гипермножестве X в направлении / лежит начало координат и само множество X принадлежит ортогокаль ному дополнению к вектору І. В данном случае выберем /j = / и переобозначим xi = 0. 2. Если xi есть начало координат, тогда выберем j\ =1. 3. Если xi не является началом координат и вектор ж; не ортогонален I, тогда выберем Д = А. Оставшиеся вектора базиса /2,..., /„ выберем произвольным образом так, чтобы они представляли собой ортонормированный базис ортогонального дополнения к вектору Обозначим Afe — матрицу перехода от базиса е к /, / = Ajee. В новом базисе / рассмотрим эллипсоид с диагональной матрицей

Таким образом, семейство эллипсоидов Піє$(0, Yi) является искомым.

Настоящая глава посвящена построению внешних и внутренних е-аппроксимаций для множеств достижимости управляемых систем, в которых наряду с управлением присутствует неопределенность. В предыдущей главе были рассмотрены задачи достижимости при неопределенности и программном управлением при конечном числом точек коррекций. Эти задачи подразумевали, что управление на отрезках между коррекциями не зависело от состояния системы и выбиралось заранее. В данной главе рассматривается более сложная постановка задачи — управление выбирается из класса позиционных стратегий. Наличие в системе управления с обратной связью приводит к тому, что управление системы зависит не только от времени, но и от состояния системы и это привносит нелинейность в постановку задачи.

Будем рассматривать линейную управляемую систему здесь U(t,x) принадлежит классу позиционных стратегий UCL, то есть U(t,x) есть многозначное отображение /(-, ) : Т х К" -4 convRp, гарантирующее существование и продолжаемость на весь отрезок времени решений дифференциального включения (3.1), стесненное геометрическим ограничением U(t,x) Є V(t).

При выполненных условиях регулярности область достижимости при неопределенности и управлении с обратной связью может быть представлена как предел областей достижимости задач программного управления с конечным числом точек коррекции, рассмотренных в предыдущей главе. Пользуясь свойством непрерывности области достижимости по начальным данным, управлению и помехе, можно построить численный алгоритм, аппроксимирующий є-окрестность множества достижимости сверху, основанный на схеме предложенной в предыдущей главе. Увеличивая количество точек коррекции, мы будем приближать аппроксимацию к искомой области достижимости. Основным недостатком данного подхода является наличие трудоемких вычислений, связанных с поиском внешних аппроксимаций для геометрической разности Минков-ского. Кроме того, предложенный в предыдущей главе алгоритм не позволяет найти внутреннюю аппроксимацию для множества достижимости.

В данной главе будет предложен другой подход к поиску внешних и внутренних аппроксимаций для задач достижимости с ограничениями на управление и неопределенность в виде симметричных многогранников. Воспользовавшись свойством непрерывности множества достижимости от ограничений на управление и погрешность будут введены внешние и внутренние е-аппроксимирующие задачи достижимости с ограничениями на управление и неопределенность в виде суммы невырожденных эллипсоидов.

О непрерывности сверху и снизу решения эволюционного уравнения .

В заключение кратко сформулируем основные результаты работы:

1. Построена внешЕїяя и внутренняя эллипсоидальная аппроксимация области достижимости для линейных управляемых систем без неопределенности с ограничениями на управление и начальное состояние системы в виде симметричных многогранников.

2. Для линейных систем с неопределенностью и управлением без обратной связи с конечным числом точек коррекции траектории предложен алгоритм построения внешних эллипсоидальных аппроксимаций для множеств достижимости типа maxmin и minmax с ограничениями на управление, неопределенное возмущение и начальное состояние системы в виде симметричных многогранников.

3. Построена внешняя и внутренняя эллипсоидальная аппроксимация области достижимости для линейных управляемых систем с неопределенностью и управлением с обратной связью с ограничениями на управление и помеху в виде симметричных многогранников, а на начальное состояние системы в виде невырожденного эллипсоида.

Одним из самый общих подходов в теории управления является метод Динамического программирования, предложенный Р. Беллманом [2] и примененный к игровым задачам Р. Айзексом [1]. Данный метод заключается в погружении исходной задачи в параметризированный класс задач. Оптимальные значения функционала, вычисленные для каждого значения параметров, образуют функцию цены. При этом набор параметров, образующих позицию системы, должен быть достаточным для того, чтобы можно было сформулировать принцип оптимальности, выраженный в полугрупповом свойстве для функции цены. Тогда последняя является решением дифференциального уравнения в частных производных, называемого уравнением Гамильтона-Якоби-Белл-мана-Айзекса ( HJBA), а множество достижимости находится, как множество линий данной функции. Так как функция цены может быть не всюду гладкой, вводят различные понятия обобщенного решения уравнения Беллмана, например, вязкостные решения [52] или минимаксные решения [43, 44]. Если взять в качестве критерия оптимальности квадрат расстояния между начальным множеством и концом траектории в начальный момент времени и проминимизировать критерий оптимальности по управлению для всех траекторий, попадающих в точку х в момент времени t, мы определим соответствующую функцию цены V(t, х), и тогда искомое множество достижимости — есть множество уровня данной функции {х : V(t, х) = 0}.

Одним из возможных методов построения внутренних и внешних аппроксимаций для множеств достижимости и разрешимости и нахождения и построения синтезирующей стратегии является метод эллипсоидальных аппроксимаций. Впервые эллипсоидальная техника рассматривалась в работах А.Б. Куржанского [20], 12, Ф. Швеппе Черноусько [47]. В работах А.Б. Куржанского [59, 22, 23, 62, 61, 65, 63] построена конструктивная теория, объединяющая метод динамического программирования, альтернированный интеграл и функциональный подход, предложенный Н.Н. Красовским, направленная на решение задач до конца, то есть до конечного численного алгоритма. Для этого используется аппарат эллипсоидальных аппроксимаций [59, 62, 63, 64], позволяющий строить тугие внутренние и внешние эллипсоидальные аппроксимации для множеств достижимости и разрешимости. Объединение тугих внутренних и пересечение внешних эллипсоидных аппроксимаций позволяют построить множество достижимости и его границу. Каждая тугая внутренняя аппроксимация для множества разрешимости является слабоинвариантной системой множеств, поэтому она может быть использована в качестве синтезируещей стратегии управления. При этом синтез может быть представлен в явном виде, через параметры аппроксимации и задача синтеза сводится фактически к интегрированию системы обыкновенных дифференциальных уравнений для параметров эллипсоидальной аппроксимации.

Настоящая работа расширяет материал монографии [59]. В данной теории предполагается, что динамика системы описывается линейными дифференциальными уравнениями, а начальное состояние системы, управление и возмущения принадлежат геометрическим ( жестким или мгновенным ) ограничениям. Эти ограничения означают, что соответствующая величина в каждый момент времени должна находиться в заранее заданном непустом множестве. В качестве класса ограничивающих множеств взяты невырожденные эллипсоиды.

Однако на практике возникают ситуации, когда на управление и возмущение наложены вырожденные, негладкие, ограничения, например, в виде коробок или многогранников. Подобная постановка задачи была рассмотрена в работах Костоусовой Е.К. [54, 55] и для систем без неопределенности получении аппроксимации в виде параллелотопов.

Настоящая работа имеет целью развить эллипсоидальные методы аппроксимации областей достижимости на специфический круг объектов - линейные управляемые системы с "жесткими" неэллипсоидальными ограничениями на начальное состояние, управление и помеху, заданными в виде симметричных многогранников.

Похожие диссертации на Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях