Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Долгалева Ольга Евгеньевна

Особые экстремали в задачах оптимального управления, определяющих распределение Гурса
<
Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса Особые экстремали в задачах оптимального управления, определяющих распределение Гурса
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Долгалева Ольга Евгеньевна. Особые экстремали в задачах оптимального управления, определяющих распределение Гурса : диссертация ... кандидата физико-математических наук : 01.01.09.- Москва, 2005.- 89 с.: ил. РГБ ОД, 61 05-1/1248

Содержание к диссертации

Введение

Глава 1. Распределения Гурса 18

1.1. Векторные поля и распределения векторных полей на многообразии . 18

1.2. Распределения Гурса 19

1.3. Особенности распределений Гурса 22

1.4. Задача о тягаче с п прицепами 25

Глава 2. Движение тягача с двумя прицепами 29

2.1. Постановка задачи о движении тягача с двумя прицепами 29

2.2. Движение тягача с прицепами в системе координат, жестко связанной с тягачом 31

2.3. Особенности распределения Гурса в задаче движения тягача с двумя прицепами 43

2.4. Принцип максимума Понтрягина и особые траектории 44

2.5. Особые траектории в задаче движения тягача с двумя прицепами 46

2.6. Исследование многообразия {Мі П Г+} 49

2.7. Локальная оптимальность особых траекторий первого порядка, идущих по особенности распределения Гурса 51

Глава 3. Движение тягача с прицепами 59

3.1. Постановка задачи о движении тягача с п прицепами 59

3.2. Нахождение особого многообразия 60

3.3. Особенности распределения Гурса в задаче движения тягача с п прицепами . 65

3.4. Исследование многообразия {М*Г\Г+} 68

3.5. Локальная оптимальность особых траекторий первого порядка, идущих по особенности распределения Гурса 70

3.6. Задача о движении тягача с п прицепами в случае управления угловым ускорением тягача 77

Литература 86

Введение к работе

Во введении мы изложим основные результаты работы, предварительно сообщив необходимые сведения, относящиеся как к классической теории оптимального управления, так и к теории распределений Гурса.

Стандартная постановка задач оптимального управления относится к управляемой системе і = f(z,u), z Є Zt где Z — гладкое m-мерное многообразие. Задача состоит в отыскании траекторий этой системы, которые доставляют оптимальное значение заданному функционалу. Широкий круг задач в теории оптимального управления решается с помощью известного принципа максимума Понтрягина — необходимого условия оптимальности траектории. Но в некоторых задачах из этого принципа однозначно определить оптимальное управление нельзя, например, когда оно входит в задачу линейно и в функции Понтрягина коэффициент при нем оказывается равным нулю. Существенную роль играет возникающее при этом понятие особых траекторий, что приводит к необходимости специальных дополнительных построений, которые являются предметом изучения в настоящей диссертации.

Задача о движении тягача с п прицепами является одной из важных задач в теории оптимального управления. В качестве управляющего параметра можно рассматривать угловую скорость или угловое ускорение тягача. Эта задача, интересная и сама по себе, является универсальной с точки зрения взаимосвязи двух независимых математических теорий — теории особых режимов (одной из важнейших частей теории оптимального управления) и геометрической теории распределений Гурса.

Распределения Гурса. В задаче оптимального управления управляемая система естественным образом ассоциируется с распределением линейных подпространств касательного пространства в каждой точке z многообразия 2", которое определяется линейной оболочкой множества допустимых

векторов скоростей. Одним из важных случаев распределений на гладком многообразии является так называемое распределение Гурса.

Флагом Гурса (длины т к) на многообразии Z размерности т > 4 называется последовательность

>(*) с (*+!) С ... С Г>(т-1) С >м = TZ, т~к>2 (1)

распределений на многообразии Z (набором подпространств касательного пространства TZ постоянной размерности), где

D(i) = Dd-i) + p(*-D f д «-D], (2)

dimw = dimD^1) + 1, і = ку к + 1,... ,m. (3)

Под k-распределением Гурса (или просто распределением Гурса) мы будем понимать распределение >(fc) размерности fc, порождающее флаг Гурса (1).

Идея таких цепочек распределений появилась в работах Э. Картана в связи с операцией продолжения систем Пфаффа. Само название "распределение Гурса"(Goursat distribution) относится к работе [22], в которой Э. Гурса исследовал эти распределения. Его предшественниками были Ф. Энгель и Э. Картан [15]. Изучению условия (3) (иногда это условие называют условием Гурса — Картана) были посвящены две основные работы [28] и [19], в которых изучались дифференциальные системы Пфаффа с аннигилятором, удовлетворяющим условию Гурса. В конце XX века распределения Гурса стали объектом пристального изучения геометров, среди которых Р. Монтгомери, Р. Л. Брайан, М. Житомирский, П. Мормул и многие другие.

В проблеме изучения и классификации распределений Гурса важную роль играет понятие их эквивалентности. Два глобальных распределения на многообразии Z называются эквивалентными^ если существует глобальный диффеоморфизм Z на себя, переводящий одно распределение в другое. Естественным путем (с использованием

ростков распределений) определяется локальная эквивалентность распределений.

Диффеоморфность распределений Гурса определяется их особенностями. Ф. Энгель, Э. Гурса и Э. Картан изучали флаги Гурса и установили их каноническую форму, которую они имеют в неособых точках многообразия Z. Не так давно А. Кум пера, К. Руиз и П. Мор мул обнаружили, что у распределений Гурса могут быть особенности и их число довольно быстро растет с ростом размерности исходного пространства.

В ряде работ [34, 35] наряду с последовательностью распределений D^ рассматривалась последовательность распределений, построенная несколько иным образом:

д = д.і + [ДД-і].

В этом случае особенности распределений Гурса определяются в терминах векторов роста. Малым вектором роста распределения D в некоторой точке z Z называется последовательность [пі,П2,пз,...] размерностей в точке z Є Z растущего флага Dni С Д2 С Д3 С ... (щ = к). Точки многообразия, где малый вектор роста имеет вид [А;, к + 1, к + 2,..., т], называются неособыми точками распределения Гурса. Точки, в которых это условие не выполнено, называются особыми, их множество — особенностью распределения Гурса.

Возникло предположение о том, что малый вектор роста вполне определяет особенность распределения Гурса, то есть два ростка распределения Гурса в некоторой точке z эквивалентны тогда и только тогда, когда они имеют одинаковые малые векторы роста в этой точке z. П. Мормул показал, что эта гипотеза справедлива для s < 6, но неверна для s > 6. Тем не менее, если два распределения Гурса в некоторой точке z Z локально эквивалентны, то они имеют в этой точке одинаковые малые векторы роста. Обратное неверно.

Число gr(s) всевозможных малых векторов роста для распределений Гурса фиксированной коразмерности s ~ т — к является конечным. П. Морму-лом была получена следующая таблица для сравнения gr(s) с числом or(s) неэквивалентных ростков в пространстве всех ростков распределения Гурса той же коразмерности а:

s 2345678 9

or{s) 1 2 5 13 34 93 со со gr{s) 1 2 5 13 34 89 233 610

П. Мормулом [34] было доказано, что gr(s) для всех s является числом Фибоначчи с номером (2s — 3).

Хорошей моделью для изучения распределений Гурса является задача об управлении движением тягача с п прицепами. Оказалось, что управляемая система этой задачи, имеющей простой и важный механический смысл, порождает распределение, являющееся распределением Гурса, более того, она порождает универсальный набор, моделирующий все возможные особенности абстрактных распределений Гурса. Результаты в этом направлении были получены Ф. Жаном [23], О. Сордаленом [36], Ф. Люка и Дж.-Дж. Райслером [31], а также Р. Монтгомери и М. Житомирским [33], для распределений Гурса, соответствующих кинематической модели движения тягача с прицепами.

В работе [23] Ф. Жаном было доказано, что распределение, порожденное задачей о тягаче с прицепами, удовлетворяет условию Гурса. Следующий важный результат был сформулирован в работе [33]: локальная классификация распределений Гурса, соответствующих кинематической модели движения тягача с п прицепами, и локальная классификация произвольных флагов Гурса длины (п + 1) — это одна и та же задача.

Дадим общую постановку задачи о движении тягача с п прицепами.

В плоскости хОу с постоянной по модулю линейной скоростью v движется тягач L, к которому последовательно присоединены с помощью жестких тяг п прицепов Р\,...,Рп ("поезд"). Обозначим x(t), y(t) координаты последнего прицепа в момент времени t. Положения тягача и всех остальных прицепов однозначно определяются координатами x(i), y{t), длинами тяг и следующими углами: 0n{t) — угол между вектором линейной скорости тягача и осью Ox, 9n-i(t) — угол между тягой PiL, и осью Ox, On-k{t) — угол между тягой Pjt-iPfc и осью Ох. Управление осуществляется заданием угловой скорости u{t) тягача, управляющий параметр и удовлетворяет ограничению \и\ ^ а, где а — константа, причем а > 1. Длины всех тяг считаются равными 1.

Движение поезда описывается следующей системой (n + 3) дифференциальных уравнений:

ж — и cos бо П cs(0j — 0j-i);

у = v sin #o П cos(#j ~ 0j-i);

вк = v sin(0A+1 — 0*) П cos{6j — tf/-i), к = 0, ... , n — 2;

0n-i = vsm(en-9n-i);

9n = u. v

Ставится задача управления: найти управляющую функцию u(t), с помощью которой вся система перейдет из заданного начального состояния на некоторое многообразие цели за кратчайшее время.

Кинематическая модель движения тягача с п прицепами может быть описана при помощи 2-распределения Гурса на Ш? х Т"1"1, где Т"4"1 — (n + 1)-мерный тор, порожденного двумя векторными полями [18, 36, 23]:

л? = (>о,о, 0,..м1);

лу = (cosад, sinад, віп(0і - ад/Г, - .sin(0" - ft.-0#).

где//1 = ft cos(ffj - 0,-_i), i

В работе [33] был получен следующий важный результат: в модели тягача с п прицепами появляются все ростки распределения Гурса коразмерности (п+1). А именно, любой росток D произвольного 2-распределепия Гурса на Еп+3 эквивалентен ростку распределения, натянутого на (X, Х$) в некоторой точке р = p(D) из К2 х Т"+1. Более общо, любой росток произвольного к-распределения Гурса на Efc+n+1 эквивалентен ростку распределения span{Xr, Х%} ф Rk'2 на Е2 х T"+1 х Е*"2.

Более наглядно этот результат выглядит так: любая особенность распределения Гурса коразмерности (n + 1) соответствует некоторой конфигурации, в которую могут выстроиться тягач и его п прицепов.

Исследование задачи об оптимальном управлении движением тягача с прицепами естественно начинать с помощью принципа максимума Понтрягина.

Принцип максимума. В середине 1950-х годов Л. С. Понтрягин сформулировал необходимое условие оптимальности для задач оптимального управления с произвольными ограничениями на значения управляющей функции. В случае линейных систем принцип максимума впервые был доказан Р. В. Гамкрелидзе в 1957 году. Общая теорема была доказана В. Г. Болтянским (в рамках семинара Л. С. Понтрягина) и опубликована в 1976 году в книге [И].

Для задачи быстродействия принцип максимума формулируется следующим образом.

Будем считать, что допустимые управления u(t) — измеримые функции со значениями из Жг, допустимые траектории z(t) — абсолютно непрерывны.

Пусть оптимальное управление й(і) за наименьшее время переводит точку тп-мерного пространства z(t) вдоль траекторий системы

= /(*.«) (4)

из положения zq на многообразие В = {z : F{z) — 0}. Введем функцию Понтрягина H(z,= v?/(z,«). Тогда для пары функций (u(f),i()) выполнено следующее условие: существует нетривиальная функция ф(і), удовлетворяющая системе

йф _ дН(т,ф(*)М*)) /чч

dt - dz ' {Ъ)

и условиям трансверсальности

^^Т%[Т)В 5>**(Г) = 0, (6)

»=1

такая, что

ff(i(*),0(t)Itt(*)) = maxff(l(t)I^(t),u). (7)

«Єї/

Здесь i(t) — оптимальная траектория, max Я называется гамильтонианом.

u.U

Допустимое управление u(t),to < * < *i и соответствующую ему траекторию 2((),г(іо) = zq назовем экстремалью Понтрягина, если существует такая функция — решение системы (5), что они все вместе удовлетворяют условию (7). Принцип максимума гласит, что каждое оптимальное управление является экстремалью Понтрягина. Поэтому задача оптимального управления сводится к нахождению экстремалей Понтрягина и выделению среди них оптимальной. Если в задаче оптимизации оптимальное управление существует, а экстремаль Понтрягина единственна, то она и дает решение задачи оптимизации.

Вычисление оптимальных управлений с помощью принципа максимума Понтрягина можно проводить следующим образом. Из условия максимума для произвольных 2,у>,t находится функция и ~ u(z,которая подставляется в систему (4)-(5). Таким образом получается система из 2тг дифференциальных уравнений с краевыми условиями. Описанная

процедура легко реализуется, если в условии (7) максимум в правой части достигается в единственной точке и Є U. Может, однако, случиться, что функция J7(i(),<(), и,<) совсем не зависит от параметров и или же ее максимум достигается в нескольких точках. Если единственность максимального значения нарушается в изолированных точках траектории z(t), то они называются точками переключения. Если же этот эффект имеет место на некотором отрезке кривой z(t)t то управления «(i), to < t < ti, вдоль которых они реализуются, и соответствующие им траектории называются особыми на этом отрезке.

Ситуации, в которых были обнаружены особые управления, встречаются в задачах ракетодинамики, космической навигации, электротехники, металлургии, математической экономики и т. д.

В работах А. Миеле [10] были исследованы особые экстремали двумерных задач, относящихся к динамике движений ракет. Д. Ф. Лоуден, исследуя задачу полета тела переменной массы в Ньютоновском поле тяготения одного притягивающего центра, обнаружил особые экстремали Понтряги-на — траектории промежуточной тяги или "спирали Лоудена" [9]. В связи с практической важностью такого рода траекторий многие авторы сосредоточили усилия на вопросе об их оптимальности. В 1964 году Г. Келли [24] нашел необходимое условие оптимальности второго порядка для особых экстремалей. Но оказалось, что для спиралей Лоудена условие Келли выполнено и вопрос об их оптимальности по-прежнему оставался открытым. Условия Келли были обобщены целым рядом авторов: Р. Е. Коппом — Г. Дж. Мойером [26], X. М. Роббинсом [12], К. Маршалом [32] и другими. В результате было установлено, что для автономных задач спирали Лоудена неоптимальны, а для задач с фиксированным временем среди особых экстремалей есть оптимальные (например, так называемая обратимая дуга Маршала).

Важную роль в вопросах оптимальности особых экстремалей играет понятие их порядка. Поясним, что имеется в виду.

Пусть имеется экстремальная задача со скалярным аффинно входящим управлением и:

z = fo(z) + ufi(z).

Здесь функция Поптрягина Н — H(z,ipyu) зависит от одномерного управления и Є U С П, \и\ ^ ito, Н\ — коэффициент при и в функции Н. В этом случае, если Ні ф 0, то условие максимума Поптрягина й = maxН(z,ip,u), определяет управление и как функцию от переменных z,

по формуле: и = uq sgn#i.

Если же Hi = 0 на некотором интервале времени t Є ІУиТг) траектории (z(),y?(i)), то максимум по и (нестрогий) достигается при любом и Є [—uq,uq], то есть условие максимума функции Понтрягина однозначно не определяет значение оптимального управления. При этом траектории y(t) = (z(t),(p(t)), для которых Hi = 0 на некотором интервале времени (ті, тг), называются особыми на этом интервале.

В [25] было доказано следующее необходимое условие оптимальности особых траекторий — условие Келли:

* МО) = l-Wi&HlM)) - -Пусть 7(0 особая на интервале (гі,гг) траектория. Если существует такое к, что в точках траектории 7(0 на (ГЬГ2) выполняются следующие условия:

( д dk

#1(7)= О, * = 0,1,...,2д-1;

dudtk

#1(7) Ф o,

д d2q I cbdt^

то к ~ 2g, где q Є Z. Тогда число q называется порядком особой траектории (local order). Если же эти условия выполняются не только в точках траекто-

рий, но и для всех 7 из некоторой открытой окрестности этой траектории, то говорят, что траектория 7() имеет существенный порядок q (intrinsic order).

Экстремали, обладающие счетным числом точек переключения управления на конечном интервале времени, называются экстремалями с учащающимися переключениями, или четтеринг-экстремалями, а соответствующие управления — четтеринг-режимами. Впервые такой пример был приведен А. Т. Фуллером в 1960 году [13]. В случае особых траекторий второго порядка стыковка особых экстремалей с-неособыми происходит ,с.чсттеринг-режимом. Теория четтеринг-режимов развивалась в работах И. Купки [29] и более подробно в работах М. И. Зеликина и В. Ф. Борисова [4]—[7]. Позднее вопрос об условиях оптимальности высшего порядка на особых экстремалях оторвался от породившей его задачи космической навигации и превратился в самостоятельный раздел математической теории оптимального управления.

В работах Б. С. Гоха [21] техника, аналогичная конструкциям Г. Келли, Р. Коппа — Г. Мойера, была перенесена на системы с многомерным управлением. В работах А. Кренера [27], Р. В. Гамкрелидзе — А. А. Аграчева [2], А. А. Милютина — Е. С. Левитина — Н. П. Осмоловского [8] примерно в одно и то же время для оптимальности были сформулированы (хотя и в разных терминах) общие условия высших порядков. При этом в работах Кренера и Гамкрелидзе — Аграчева развивалась геометрическая теория особых экстремалей, в работах Милютина — Левитина — Осмоловского использовались, в основном, методы функционального анализа.

В работах М. И. Зеликина (см., например, [5]) развивался геометрический подход к задачам оптимального управления. Исследовались аффинные по управлению задачи, которые были сведены к геометрической форме, а именно к задаче минимизации интеграла от дифференциальной формы и) на траекториях, удовлетворяющих дифференциальным включениям z K(z), где K(z) — распределение конусов в касательных плоскостях

фазового пространства. Необходимые условия оптимальности были сформулированы как условия обращения в нуль дифференциальной формы dw. Этот метод позволял явно выделять особые экстремали Понтрягина, на которых выполняется условие типа условия Гоха. В работах М. И. Зеликина — В. Ф. Борисова (см., например,[7]) было показано, что особые экстремали являются аттракторами окрестных оптимальных траекторий.

Краткое содержание диссертации. Целью данной работы является установление связей между геометрической теорией распределений Гурса и условиями оптимальности особых траекторий.

Работа состоит из введения и трех глав.

В первой главе для удобства и замкнутости изложения приводятся формулировки основных понятий, фактов, теорем, касающихся теории распределений Гурса и их особенностей. Формулируется постановка задачи оптимального управления движением тягача с произвольным числом прицепов.

Вторая глава является основной, В ней подробно изучается задача о тягаче с двумя прицепами. Построены фазовые портреты управляемой системы. Найдены все особенности распределения Гурса — поверхность Г = Г+ [J Г_. Даны определения особых траекторий задачи оптимального управления, их порядка, особых многообразий. Исследована геометрия особого многообразия Mi первого порядка: доказано существование особых траекторий первого порядка, найдена размерность особого многообразия, доказана его гладкость, изучены свойства проекции этого многообразия на фазовое пространство.

Теорема 2. 1) Поверхность Mi является С^-гладким многообразием с естественной гладкой структурой в расширенном фазовом пространстве. При этом codim М\ = 2.

2) Сужение па Mi отображения 7г : Е > Z, проектирующего точку (z,Є Е в точку z = {х, у, 9q, a, /3) Z> является сюръективным отображением тгщ : Mi —f Z с ненулевым якобианом.

Исследовано многообразие траекторий, которые являются особыми тра-

екториями первого порядка и одновременно лежат на многообразии особенностей распределения Гурса.

Теорема 3. Поверхность Мі П Г+ является С~гладким многообразием с естественной гладкой структурой, индуцированной из расширенного фазового пространства. При этом codira Мі П Г+ = 4.

Следуя работам Зеликина — Борисова, приведены определения кусочно-гладкого лагранжева многообразия, кусочно-гладкого поля экстремалей. Приведена формулировка достаточного условия оптимальности в терминах поля экстремалей, порожденного кусочно-гладким лагранжевым многообразием. Изучается произвольная особая траектория первого порядка, которая целиком лежит на многообразии особенностей Гурса. Рассмотрены кусочно- гладкие лагранжевы многообразия с поверхностями разрыва производных. Доказано, что поверхность разрыва сама является гладким многообразием. Построено кусочно-гладкое поле экстремалей, содержащее данную траекторию. Доказана следующая теорема о локальной оптимальности особых траекторий:

Теорема 7. Любая особая траектория первого порядка j(t) в задаче о движении тягача с двумя прицепами, идущая по особенности распределения Гурса, является локально оптимальной.

Третья глава посвящена обобщению результатов, полученных во второй главе, на случай произвольного числа прицепов. Найдены некоторые особенности распределения Гурса. В этом случае доказано существование особых траекторий первого порядка, установлена гладкость особого многообразия М" первого порядка, изучены свойства проекции этого многообразия на фазовое пространство.

Теорема 8. 1) Поверхность М" является С^-гладким многообразием с естественной гладкой структурой в расширенном фазовом пространстве. При этом codim MJ1 = 2.

2) Сужение на М" отображения 7Г : Е —» Z, проектирующего точку [z;ip) Є Е в точку z = (х,у,^0)аь-* *»an) Є Z, является сюрьективным

отображением пм» ' Mf - Z.

Исследовано многообразие траекторий, которые являются особыми траекториями первого порядка и одновременно лежат в многообразии особенностей Гурса.

Теорема 10. Поверхность М" П Г+ является С-гладким многообразием с естественной гладкой структурой, индуцированной из расширенного фазового пространства. При этом со dim М П Г+ ~ 4.

Доказана теорема о локальной оптимальности особых траекторий:

Теорема 13. Любая особая траектория первого порядка j(t) задачи движения тягача с п прицепами, идущая по особенности распределения Гурса, является локально оптимальной.

В последнем параграфе коротко рассмотрена задача об управлении угловым ускорением тягача с прицепами. Для этой задачи доказано существование особых траекторий второго порядка, доказана гладкость особого многообразия второго порядка, изучены свойства проекции этого многообразия на фазовое пространство. Система принципа максимума Понтрягина сведена к полу канонической форме в смысле Зеликина — Борисова, которая дает теорему существования экстремальных четтеринг-режимов:

Теорема 16. В задаче о движении тягача с п прицепами в случае быстродействия и управления угловым ускорением тягача, существуют экстремали с накоплением переключений и выход на особый режим может осуществляться лишь посредством режима с накоплением переключений.

Особенности распределений Гурса

Экстремали, обладающие счетным числом точек переключения управления на конечном интервале времени, называются экстремалями с учащающимися переключениями, или четтеринг-экстремалями, а соответствующие управления — четтеринг-режимами. Впервые такой пример был приведен А. Т. Фуллером в 1960 году [13]. В случае особых траекторий второго порядка стыковка особых экстремалей с-неособыми происходит ,с.чсттеринг-режимом. Теория четтеринг-режимов развивалась в работах И. Купки [29] и более подробно в работах М. И. Зеликина и В. Ф. Борисова [4]—[7]. Позднее вопрос об условиях оптимальности высшего порядка на особых экстремалях оторвался от породившей его задачи космической навигации и превратился в самостоятельный раздел математической теории оптимального управления.

В работах Б. С. Гоха [21] техника, аналогичная конструкциям Г. Келли, Р. Коппа — Г. Мойера, была перенесена на системы с многомерным управлением. В работах А. Кренера [27], Р. В. Гамкрелидзе — А. А. Аграчева [2], А. А. Милютина — Е. С. Левитина — Н. П. Осмоловского [8] примерно в одно и то же время для оптимальности были сформулированы (хотя и в разных терминах) общие условия высших порядков. При этом в работах Кренера и Гамкрелидзе — Аграчева развивалась геометрическая теория особых экстремалей, в работах Милютина — Левитина — Осмоловского использовались, в основном, методы функционального анализа.

В работах М. И. Зеликина (см., например, [5]) развивался геометрический подход к задачам оптимального управления. Исследовались аффинные по управлению задачи, которые были сведены к геометрической форме, а именно к задаче минимизации интеграла от дифференциальной формы и) на траекториях, удовлетворяющих дифференциальным включениям z K(z), где K(z) — распределение конусов в касательных плоскостях фазового пространства. Необходимые условия оптимальности были сформулированы как условия обращения в нуль дифференциальной формы dw. Этот метод позволял явно выделять особые экстремали Понтрягина, на которых выполняется условие типа условия Гоха. В работах М. И. Зеликина — В. Ф. Борисова (см., например,[7]) было показано, что особые экстремали являются аттракторами окрестных оптимальных траекторий.

Краткое содержание диссертации. Целью данной работы является установление связей между геометрической теорией распределений Гурса и условиями оптимальности особых траекторий. Работа состоит из введения и трех глав. В первой главе для удобства и замкнутости изложения приводятся формулировки основных понятий, фактов, теорем, касающихся теории распределений Гурса и их особенностей. Формулируется постановка задачи оптимального управления движением тягача с произвольным числом прицепов. Вторая глава является основной, В ней подробно изучается задача о тягаче с двумя прицепами. Построены фазовые портреты управляемой системы. Найдены все особенности распределения Гурса — поверхность Г = Г+ [J Г_. Даны определения особых траекторий задачи оптимального управления, их порядка, особых многообразий. Исследована геометрия особого многообразия Mi первого порядка: доказано существование особых траекторий первого порядка, найдена размерность особого многообразия, доказана его гладкость, изучены свойства проекции этого многообразия на фазовое пространство. Теорема 2. 1) Поверхность Mi является С -гладким многообразием с естественной гладкой структурой в расширенном фазовом пространстве. При этом codim М\ = 2. 2) Сужение па Mi отображения 7г : Е — Z, проектирующего точку (z, p) Є Е в точку z = {х, у, 9Q, a, /3) Z является сюръективным отображением ТГЩ : Mi —f Z с ненулевым якобианом. Исследовано многообразие траекторий, которые являются особыми траекториями первого порядка и одновременно лежат на многообразии особенностей распределения Гурса. Поверхность Мі П Г+ является С гладким многообразием с естественной гладкой структурой, индуцированной из расширенного фазового пространства. При этом codira Мі П Г+ = 4. Следуя работам Зеликина — Борисова, приведены определения кусочно-гладкого лагранжева многообразия, кусочно-гладкого поля экстремалей. Приведена формулировка достаточного условия оптимальности в терминах поля экстремалей, порожденного кусочно-гладким лагранжевым многообразием. Изучается произвольная особая траектория первого порядка, которая целиком лежит на многообразии особенностей Гурса. Рассмотрены кусочно- гладкие лагранжевы многообразия с поверхностями разрыва производных. Доказано, что поверхность разрыва сама является гладким многообразием. Построено кусочно-гладкое поле экстремалей, содержащее данную траекторию. Доказана следующая теорема о локальной оптимальности особых траекторий: Любая особая траектория первого порядка j(t) в задаче о движении тягача с двумя прицепами, идущая по особенности распределения Гурса, является локально оптимальной. Третья глава посвящена обобщению результатов, полученных во второй главе, на случай произвольного числа прицепов. Найдены некоторые особенности распределения Гурса. В этом случае доказано существование особых траекторий первого порядка, установлена гладкость особого многообразия М" первого порядка, изучены свойства проекции этого многообразия на фазовое пространство. 1) Поверхность М" является С -гладким многообразием с естественной гладкой структурой в расширенном фазовом пространстве. При этом codim MJ1 = 2. 2) Сужение на М" отображения 7Г : Е —» Z, проектирующего точку [z;ip) Є Е в точку z = (х,у, 0)аь- »an) Є Z, является сюрьективным отображением пм». Исследовано многообразие траекторий, которые являются особыми траекториями первого порядка и одновременно лежат в многообразии особенностей Гурса. Любая особая траектория первого порядка j(t) задачи движения тягача с п прицепами, идущая по особенности распределения Гурса, является локально оптимальной. В последнем параграфе коротко рассмотрена задача об управлении угловым ускорением тягача с прицепами. Для этой задачи доказано существование особых траекторий второго порядка, доказана гладкость особого многообразия второго порядка, изучены свойства проекции этого многообразия на фазовое пространство. Система принципа максимума Понтрягина сведена к полу канонической форме в смысле Зеликина — Борисова, которая дает теорему существования экстремальных четтеринг-режимов:

Движение тягача с прицепами в системе координат, жестко связанной с тягачом

В задачах оптимального управления нередко возникают ситуации, когда движение объекта происходит под действием кусочно-постоянного управления. В связи с этим мы сейчас в качестве иллюстрации рассмотрим компоненты такого процесса, а именно, движения тягача с двумя прицепами при постоянном управлении и 0 (случай и 0 сводится к нашему изменением на противоположное направления одной из координатных осей). В 2.6 будет показано, что значение управления и, равное 1, соответствует траектории, идущей по многообразию особенностей Гурса. Будем здесь интересоваться только относительным расположением тягача и прицепов. Оно определяется в каждый момент времени двумя углами: а = в\ — 6Q, /3 = 62 — 9\. Здесь а — угол между тягами, /? — угол между направлением движения тягача и направлением первой тяги. Как следует из (16), эти углы, как функции от времени, удовлетворяют системе дифференциальных уравнений.

Поскольку каждый из углов a, /? можно трактовать, как точку на окружности, фазовым пространством этой системы естественно считать прямое произведение двух окружностей, т.е. тор, при этом числа а, /3 (понимаемые по модулю 2л-) — координаты точки на этом торе. Таким образом, мы приходим к системе (17) дифференциальных уравнений на торе. Исследование этой системы мы проводили обычными классическими приемами, описанными, например, в [3]. При изучении решений системы полезно учесть ее симметрии. Так, правые части системы (17) переходят в себя при подстановке {а — —а, /? —7Г — р] и при подстановке {а - 2л- — а, /? — 7г — /3}. Заметим также, что изоклина со (т.е. линия, на которой а = 0) с уравнением tg/3 = sin а не зависит от величины и, а нулевая изоклина (линия, на которой 0 — 0) представляет собой, в зависимости от и, либо пару окружностей ("параллелей") тора, либо одну такую параллель, либо пустое множество. Отсюда видно, как располагаются особые точки этой системы (точки пересечения названных изоклин).

Качественное поведение решений системы (17), характер ее особых точек, естественно, зависит от значения константы и. Разобьем множество значений управления {и 0} на 6 зон. Первая зона состоит из одной точки и = 0. Вторая — интервал и Є (0, -г-). Третья — точка и — ——. Четвертая — интервал и (-т-, 1)- Пятая — точка и = 1. Последняя, шестая зона — {и 1}. Первая зона, и 0. Элементарная выкладка показывает, что в этом случае наша система (17) имеет на торе 4 особых точки: две из них находятся на координатной линии /3 = 0, это точки А\ = (0,0) и Лг = (IT, 0), две другие — на линии /3 = тг — точки В\ = (0,7г) и Вг = (я-, 7г). Все эти особые точки — простые. При этом Ai,B\ — вырожденные узлы с направлением входа к = 0, а точки Ач и В — седловые, с направлениями входа к\ = О и 2 = 2. Единственной устойчивой при t —» +00 особой точкой является точка А\. К ней стремятся все траектории, кроме тех, которые начинаются (и неустойчивым образом остаются) в других особых точках. Физическая интерпретация этого явления такова: если тягач идет по прямой (угловая скорость и равна нулю), то прицепы тянутся за ним и в пределе выстраиваются в прямую линию. Исключениями являются неустойчивые состояния: а) особая точка At — первый прицеп идет за тягачом и толкает перед собой второй прицеп; б) особая точка В\ — тягач толкает перед собой первый прицеп, который толкает перед собой второй прицеп; в) особая точка . — тягач толкает перед собой первый прицеп, который тянет за собой второй прицеп. Семейство интегральных кривых этой системы изображено на рис, 2. Вторая зона, и Є (0,-г-). Наша система, как и в первой зоне, имеет четыре особых точки: При этом особые точки А\ и Ві являются простыми узлами с направлениями входа к\ = 0 и fo = и2 1 + -\/(1 — 2и2)(1 — и2), а точки А% и 7 — седловые, с направлениями входа к\ = 0 и кч — и2 — 1 — д/(1 — 2и2)(1 — и2). Направления входа в точки А\ и В\ в этом случае равны к\ = 0 и &2 = а для точек Л2 и В ± равны соответственно к\ = 0 и / = . При каждом значении и из второй зоны, как и при и — О, имеется единственная особая точка, устойчивая при t — +оо — это точка А\. Физический процесс, соответствующий этой точке, представляет собой движение тягача по дуге окружности, за которым следуют прицепы по окружностям меньших радиусов. Третья зона, и = ——. В этом случае наша система (17) имеет на торе всего две особых точки: А = (—, —), В — (—, -—). Изоклины 0 и оо в этих точках касаются друг друга. В отличие от предыдущих случаев, эти особые точки являются сложными состояниями равновесия системы. Тип их обеих — "седло-узел". Окрестность каждой из этих точек делится сепаратрисами на три сектора, два из которых — седловые, а третья — вырожденный узел. Две сепаратрисы, выходящие из точки А в противоположных направлениях с угловым коэффициентом к = — -, отделяют узловую зону от седловых. Третья, разделяющая окрестность точки на две седловые зоны, имеет нулевой наклон. Такая же картина в точке В. Наличие седловых зон делает эти точки неустойчивыми (как при t - +оо так и при t —У —со).

Локальная оптимальность особых траекторий первого порядка, идущих по особенности распределения Гурса

При каждом значении и из второй зоны, как и при и — О, имеется единственная особая точка, устойчивая при t — +оо — это точка А\. Физический процесс, соответствующий этой точке, представляет собой движение тягача по дуге окружности, за которым следуют прицепы по окружностям меньших радиусов.

Третья зона, и = ——. В этом случае наша система (17) имеет на торе всего две особых точки: А = (—, —), В — (—, -—). Изоклины 0 и оо в этих точках касаются друг друга. В отличие от предыдущих случаев, эти особые точки являются сложными состояниями равновесия системы. Тип их обеих — "седло-узел". Окрестность каждой из этих точек делится сепаратрисами на три сектора, два из которых — седловые, а третья — вырожденный узел. Две сепаратрисы, выходящие из точки А в противоположных направлениях с угловым коэффициентом к = — -, отделяют узловую зону от седловых. Третья, разделяющая окрестность точки на две седловые зоны, имеет нулевой наклон. Такая же картина в точке В. Наличие седловых зон делает эти точки неустойчивыми (как при t - +оо так и при t —У —со).

Интересно следующее явление. Если бы мы изучали устойчивость этих особых точек на плоскости, утверждением об их неустойчивости мы могли бы и закончить. На торе ситуация иная. Если, например, некоторая интегральная кривая проходит вблизи особой точки А в одном из ее седловых секторов, она начинает удаляться от этой точки, но, сделав оборот по тору, появляется снова около этой же точки, но уже в ее узловом секторе, т.е. секторе устойчивости, и при t — +00 интегральная кривая входит в эту точку. Это свойство относится ко всем интегральным кривым, за исключением особой точки В. В этом смысле точку А можно назвать аттрактором при t — +00. Аналогичным свойством обладает точка В при t — —00.

Физический процесс, соответствующий в этом случае аттрактору А, представляет собой следующую любопытную картину. Второй прицеп стоит неподвижно, а тягач и первый прицеп вращаются вокруг него с угловыми скоростями, равными соответственно -— и 1. Соответствующая фазовая картина изображена на рис.4.

Заметим, что при возрастании величины управления и от нуля до -—-все четыре точки Лі, Л2 у В\ и Дг непрерывным образом перемещаются по поверхности тора. При достижении управлением значения и — точки Ах и А 2 сливаются в точку А, а точки В\ и Вч — в точку В. При дальнейшем росте величины управления и, как мы сейчас увидим, особые точки исчезают. л/2 Четвертая зона, и Є { w , !) Особых точек в системе (17) нет. Действи тельно, если в этом случае правая часть второго уравнения в (17) обраща ется в нуль, то snip —-, отсюда ] cospj —-, и, следовательно, правая часть первого уравнения в (17) не может равняться нулю. Характерная особенность поведения интегральных кривых в этом случае — два предельных цикла, "параллели"на торе с "широтами" /? = arcsinu и /3 = 7Г — arcsinw. Первый цикл устойчив при t - +00 , второй — при t — —00. Все интегральные кривые на торе, кроме неустойчивого цикла, при t —» -fco стремятся к устойчивому циклу. На рис.5 в качестве примера изображена фазовая картина этого процесса для одного значения управления из этой зоны, а именно, для и = 0, 85. Пятая зона, и = 1. Особых точек в системе (17) нет. Имеется единственный предельный цикл на широте /? — —. Если широта точки траектории "немного меньше" этой величины, в дальнейшем траектория асимптотически приближается к этому предельному циклу. Если же широта точки траектории немного больше, чем —, в дальнейшем движении эта широта растет, и траектория начинает удаляться от предельного цикла. Если бы мы рассматривали нашу систему не на торе, а на плоскости, то расстояние от траектории до цикла со временем только увеличивалось бы. На торе же интегральная кривая с увеличением t совершает оборот по тору и начинает "снизу" приближаться к нашему предельному циклу. Таким образом, единственный предельный цикл оказывается глобально устойчивым, так что вообще любая интегральная кривая при t — +оо асимптотически приближается к нему (рис.6). Движение точки по самому циклу физически означает, что тягач механической системы движется по дуге круга радиуса 1, а первый, а значит и второй прицепы в это время неподвижны. Шестая зона, и 1. В этой зоне значений управления и нет ни особых точек, ни предельных циклов. Угловая переменная /? с течением времени монотонно возрастает со скоростью, не меньшей, чем и — 1. Физически это означает движение тягача по окружности радиуса, меньшего 1 (т.е. меньше длины первой тяги), при этом первый и второй прицепы колеблются в пределах некоторых окрестностей исходного положения.

Локальная оптимальность особых траекторий первого порядка, идущих по особенности распределения Гурса

Доказательство. Разобьем доказательство теоремы на два этапа. Пер вый этап. Сначала докажем, что в некоторой окрестности точки О много образия 9Я+ и ffl регулярно проектируются на фазовое пространство Z. Для этого построим базисные векторы касательного пространства к много образию SOT4" в точке О. Два вектора у нас уже есть — это введенные выше векторы ui и иа. Осталось выбрать (п + 1) линейно независимых векто ров из пространства TQ(SO). Сделаем это следующим образом. Мы имеем (п + 5) векторов из ортогонального дополнения к То (So) — gi gn+5- За пишем условие ортогональности некоторого вектора w=(wlt...,w2n+6) ко всем этим векторам. Условия wl g& для к — 2,..., п + 4 влекут up = 0 при j = п + 4,..., 2n + 6. Остается два условия: Для определения первых (n + 3)-х координат вектора w мы имеем два уравнения с (п+3)-мя неизвестными. Минор, соответствующий переменным wn+2 и wn+3, равен [ Pn+2)2 a стало быть, отличен от нуля, поэтому в качестве свободных неизвестных мы можем взять гу1,..., wn+l. Полагая поочередно {wx,w2,...,wn+l) = (1,0,...,0), ..., ( ,..., 1) = (0,...,0,1) и выражая для каждого из этих случаев значения для wn+2 и ш"+3, получим (п + 1) векторов:

Эти (n + 1) векторов линейно независимы, ортогональны всем градиентам gi,... ,g„+5 иі следовательно, образуют базис в пространстве TQ(SQ). Ранее было доказано, что вместе с векторами ui, ua они образуют линейно независимую систему ранга (n + З). Поскольку ЙЛ+ является гладким многообразием, то эти (п+3) вектора можно взять в качестве базисных векторов касательного пространства к 2Л+. Для доказательства факта, что многообразие $Я+ регулярно проектируется в фазовое пространство, выпишем следующую матрицу, строками которой являются первые (п+3) компоненты базисных векторов касательного пространства к ЗЯ+: Звездочками здесь заменены величины, вид которых несуществен. Нетрудно убедиться в том, что определитель этой матрицы максимален. Таким образом, в силу теоремы о гладкой зависимости от начальных данных, в некоторой окрестности U{0) точки О многообразие 9Я+ регулярно проектируется на фазовое пространство Z. Аналогично доказывается факт регулярной проектируемости на фазовое пространство Z многообразия ЗЛ . Теперь, чтобы убедиться в регулярной проектируемости на фазовое пространство Z многообразия 2Jt, достаточно проверить, что проекции векторов скоростей на пространство Z, соответствующих управлениям и = аии = —а лежат по разные стороны от проекции многообразия 971. Для этого наряду с матрицей (45), соответствующей случаю 9Я+ рассмотрим аналогичную матрицу для VJX": Определители матриц (45) и (46) равны Ді = а — 1 и Аг = —а — 1 соответственно и противоположны по знаку, а следовательно, векторы 7г(иа) и тг(и_а), а стало быть, 7г(ЯЯ+) и тт(Ш ), лежат по разные стороны от 7г(9Л).П

При достаточно малом t линейная независимость векторов сохраняется, таким образом, в некоторой окрестности V(z) мы определили кусочно-гладкое поле экстремалей. В нашем случае H(z, ц?) = f +2 0. Как было доказано в [4], отсюда следует оптимальность достаточно малого участка особой экстремали [2"(TO),;?(TJ)], который целиком лежит в V(z) р)тг(ШЇ), причем z(t)(ТЇ) 7 z. Поскольку многообразие S можно выбрать так, чтобы оно проходило через любую точку траектории 7(0) то отсюда следует, что любой достаточно малый участок траектории 7(0 является оптимальным. Таким образом, доказана следующая теорема:

В этом параграфе мы проведем небольшое исследование задачи о тягаче с п прицепами, рассмотрев в качестве управления не угловую скорость тягача, как это было в предыдущих параграфах, а его угловое ускорение [41]. Это изменение подхода приводит к появлению особых траекторий второго порядка и возникновению режимов с накоплением переключений оптимального управления (четтеринг). Вопросы, связанные с четтерингом, рассматривались в [42]. Пусть в плоскости хОу с постоянной скоростью v движется поезд, состоящий из тягача и п прицепов Р$, пронумерованных, считая от тягача, натуральными числами г от 1 до п. Для единообразия обозначений будем считать тягач "прицепом с нулевым номером". Для каждого момента времени t обозначим через x(t), y(t) координаты тягача и через Oo(i) Угол между его вектором скорости и осью Ох. Положение прицепов определяется координатами тягача и величинами Ri, где Щ — длина тяги, соединяющей (г — 1)-Й и г-й прицепы, а также углами 9i(t), которые образуют эти тяги с осью Ох. Без ограничения общности будем считать линейную скорость, равной единице. В дальнейшем считаем, что все i% = 1. Управление движением поезда осуществляется заданием углового ускорения u(t) тягача, управляющий параметр и удовлетворяет ограничению \и\ 1. В системе уравнений движения поездом мы используем обозначение щ = ві-і — ві- Фазовым пространством Z этой задачи будем называть евклидово пространство размерности (n + 4) с координатами (w, во, ai,..., а„,х,у)} задающими угловую скорость тягача и положение поезда в плоскости хОу. Заметим, что в этом параграфе функции x(t),y(t) обозначают не координаты последнего прицепа, а координаты тягача. Принципиального изменения постановки задачи в этом нет, поскольку координаты всех компонент поезда однозначно связаны между собой через длины тяг и углы 9{. Просто здесь это приводит к несколько более простому виду формул. Движение этого объекта описывается системой из (п + 4) уравнений: Ставится задача управления: перевести поезд из начального состояния на некоторое многообразие цели за кратчайшее время. Необходимым этапом решения задачи является установление наличия или отсутствия в ней особых экстремалей, нахождение их порядка и изучение свойств связанного с ними особого многообразия. Основные результаты доказаны для п 2.

Похожие диссертации на Особые экстремали в задачах оптимального управления, определяющих распределение Гурса