Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Применение теории точных штрафных функций к задачам управления Фоминых Александр Владимирович

Применение теории точных штрафных функций к задачам управления
<
Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления Применение теории точных штрафных функций к задачам управления
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Фоминых Александр Владимирович. Применение теории точных штрафных функций к задачам управления: диссертация ... кандидата Физико-математических наук: 01.01.09 / Фоминых Александр Владимирович;[Место защиты: ФГБОУ ВО Санкт-Петербургский государственный университет], 2017.- 103 с.

Содержание к диссертации

Введение

1 Предварительные сведения 11

2 Полиномы от интегральных функционалов 16

2.1 Постановка задачи 16

2.2 Необходимые условия минимума 18

2.3 Метод наискорейшего спуска 22

2.4 Случай ограничения на правом конце 24

2.5 Дифференциальные свойства функционала tp 25

2.6 Метод гиподифференциального спуска 27

2.7 Некоторые приложения 29

3 Программное управление 33

3.1 Постановка задачи 33

3.2 Сведение к вариационной задаче 34

3.3 Необходимые условия минимума 34

3.4 Метод субдифференциального спуска 38

3.5 Метод гиподифференциального спуска 39

3.6 Численные примеры 41

4 Оптимальное управление 46

4.1 Постановка задачи 46

4.2 Сведение к вариационной задаче 47

4.3 Необходимые условия минимума 48

4.4 Метод субдифференциального спуска 53

4.5 Метод гиподифференциального спуска 58

4.6 Численные примеры 66

5 Дифференциальные включения 74

5.1 Постановка задачи 74

5.2 Эквивалентная постановка задачи 75

5.3 Дифференциальные свойства функционалов р и / 76

5.4 Необходимые условия минимума 78

5.5 Численные примеры 79

6 Задача Коши 83

6.1 Постановка задачи 83

6.2 Сведение к вариационной задаче 84

6.3 Необходимые условия минимума 84

6.4 Метод наискорейшего спуска 85

6.5 Метод сопряжённых направлений 86

6.6 Численные примеры 87

6.7 Случай неразрешённости относительно производных 88

Заключение 90

Список обозначений 92

Литература 94

Введение к работе

Актуальность темы исследования. Одной из актуальных задач, исследуемых в данной диссертации, является построение метода решения задачи оптимального управления в форме Лагранжа с интегральным ограничением на управление. Отметим, что при фиксированной начальной точке к данной задаче может быть сведена и более общая задача оптимального управления в форме Больца. Изначальный оптимизационный подход позволяет считать предложенный в диссертации метод в достаточной степени универсальным. Общая схема этого метода может быть описана следующим образом. При помощи аппарата точных штрафных функций исходная задача минимизации интегрального функционала качества при наличии ограничений в виде нелинейной системы дифференциальных уравнений, начального и конечного положения объекта и при интегральном ограничении на управление сводится к задаче безусловной минимизации некоторого функционала. Далее формулируются необходимые условия минимума данного функционала. Заметим, что известный интегральный принцип максимума Л. С. Понтрягина получается из этого условия как следствие. Для поиска стационарных точек этого функционала используются методы недифференцируемой оптимизации, в частности, метод субдифференциального спуска и метод гиподифференциального спуска.

В данной работе отдельно исследуется задача нахождения программного управления, целью которого является перевод объекта из заданного начального положения в заданное конечное состояние за фиксированное время. В силу более простой постановки задачи по сравнению с задачей Лагранжа удаётся упростить и применяемый алгоритм решения задачи. В диссертации также были рассмотрены полиномы произвольной конечной степени от различных интегральных функционалов, построены методы их минимизации для задачи как со свободным, так и закреплённым правым концом, показаны некоторые приложения данных конструкций. Задача Коши как вариационная рассмотрена с помощью описанного подхода отдельно в силу её важности. Наконец, с помощью аппарата точных штрафных функций и опорных функций при некоторых дополнительных предположениях выведен принцип максимума для дифференциальных включений, впервые полученный В. И. Благодатских.

Таким образом, настоящая работа продолжает исследование методов негладкой оптимизации в вариационных задачах, развиваемых в научной школе В. Ф. Демьянова. Более конкретно, идея применения точных штрафов в оптимальном управлении развивается и используется в данной диссертации для построения конструктивных методов решения задач оптимального управления и исследования дифференциальных включений.

Целью диссертации является разработка единого оптимизационного подхода к реше-

нию задач оптимального управления на основе теории точных штрафных функций и методов негладкого анализа, построение прямых методов решения данных задач, изучение задачи нахождения оптимального решения дифференциального включения с применением точных штрафов.

Теоретическая значимость работы состоит в том, что в ней развивается общий подход применения аппарата точных штрафных функций и методов негладкой оптимизации к задачам управления, а также задачам, содержащим дифференциальные включения. В диссертации показано, как с помощью данного аппарата можно получить некоторые фундаментальные результаты, такие как линеаризованный интегральный принцип максимума Понтрягина для задач управления, принцип максимума для дифференциальных включений, полученный Бла-годатских, а также новые конструктивные условия оптимальности для данных задач. Заметим, что использование гладкой штрафной функции не позволило бы получить данные фундаментальные результаты, поскольку задача безусловной минимизации этой штрафной функции не была бы эквивалентна исходной задаче ни при каком конечном значении штрафного параметра. Эти факторы оправдывают использованный в диссертации негладкий подход.

Практическая значимость работы определяется тем, что в ней разработан общий оптимизационный подход к решению задач оптимального управления. Кроме того, в диссертации строятся прямые методы решения данных задач, получены некоторые конструктивные условия оптимальности в задаче с дифференциальными включениями. Также в диссертации реализация построенных методов демонстрируется на конкретных примерах, многие из которых возникают в реальных задачах. К практическим преимуществам предложенного в диссертации метода гиподифференциального спуска стоит также отнести отсутствие необходимости поиска множителей Лагранжа, а также обеспечение точного соблюдения ограничений (в данном случае краевых условий), которое принципиально важно в прикладных задачах.

Научная новизна. Все основные научные результаты диссертации являются новыми.

Методы исследования. В диссертации применяются современные методы теории экстремальных задач, выпуклого анализа и недифференцируемой оптимизации.

Основные результаты, полученные в диссертации и выносимые на защиту:

получены необходимые условия минимума полинома от интегральных функционалов;

построен прямой метод минимизации полинома от интегральных функционалов, опирающийся на метод наискорейшего спуска;

на основе теории точных штрафных функций получены необходимые (а в случае линейности системы и выпуклости минимизируемого функционала и достаточные) условия

минимума в задаче оптимального управления;

построен прямой метод решения задачи оптимального управления, опирающийся на метод гиподифференциального спуска;

с помощью теории точных штрафных функций и опорных функций получен принцип максимума для дифференциальных включений;

построен прямой метод решения задачи Коши, опирающийся на метод наискорейшего спуска и метод сопряжённых направлений;

Апробация работы. Результаты, изложенные в диссертации, докладывались и обсуждались на XV Всероссийской конференции «Математическое программирование и приложения» (г. Екатеринбург, 2-6 марта, 2015 г.), XVI Байкальской международной школе-семинаре «Методы оптимизации и их приложения» (г. Иркутск, 30 июня - 6 июля, 2014 г.), III Международной конференции «Устойчивость и процессы управления», посвященной 85-ти летию со дня рождения В. И. Зубова (г. Санкт-Петербург, 5-9 октября, 2015 г.), XLVI международной научной конференции аспирантов и студентов «Процессы управления и устойчивость» (г. Санкт-Петербург, 6-9 апреля, 2015 г.) и семинаре по конструктивному негладкому анализу и недифференцируемой оптимизации (факультет прикладной математики-процессов управления, СПбГУ).

Публикации. По результатам исследований опубликовано 11 печатных работ, из которых 2 в соавторстве и 5 в изданиях, рекомендуемых ВАК.

Работы [3, 10] написаны в соавторстве. В них соавторам принадлежат постановки задач, автору диссертации — формулировки и доказательство результатов.

Структура и объём диссертации. Диссертация состоит из введения, шести глав, заключения, списка обозначений и списка литературы. Леммы, теоремы, следствия, замечания, примеры и таблицы нумеруются в соответствии с главой, параграфом, в которых они находятся. Формулы нумеруются в соответствии с главой, в которой они находятся. Объём работы составляет 103 страницы. Список литературы включает 125 наименований.

Случай ограничения на правом конце

Пусть X — вещественное линейное пространство. Отображение /: X — Ж называется вещественным линейным функционалом, если для любых ж, у Є X и а, /З Є R будет f(ax + (Зу) = af(x) + [if {у). Будем обозначать dom/ = {х Є X \ f(x) ф —со, f(x) ф +оо} — эффективное множество функции /. Напомним, что производной функции / в точке х Є dom/ по направлению д Є X называется предел если данный предел существует. Функция / называется дифференцируемой по направлениям в точке х, если f (x, g) существует для любого g Є X. Везде далее будем писать а \, 0, вместо а - +0. Функция / называется дифференцируемой по Гато в точке ж, если она дифференцируема по направлениям в данной точке и отображение g — f (x,g) является линейным непрерывным функционалом, который называется градиентом Гато функции / в точке х и обозначается V f{x). Функционал : X — [0, +оо) называется нормой (в X), если для любых элементов х,у Є X и А єЖ она удовлетворяет следующим условиям: 1. Лж = Лж, 2. \\х + у\\ \\х\\ + \\у\\, 3. \\х\\ 0, \\х\\ = 0 Ф х = 0. Пара (X, ), состоящая из пространства X и нормы в нём, называется нормированным пространством. Функция р(-,-): X х X — [0,+оо) называется метрикой (в X), если для любых элементов x,y,z Є X она удовлетворяет следующим условиям: 1. р(х,у) = 0 х = у, 2- р(х,у) = р(у,х), 3. p(x,z) p(x,z)+p(z,y). Пара (X, р(-,-)), состоящая из пространства X и метрики в нём, называется метрическим пространством. Любое нормированное пространство является метрическим, с метрикой определяемой по формуле р(х,у) = \\х — у\\.

Скалярным произведением в пространстве X называется функция (, ): X х X — Ж, удовлетворяющая для любых элементов x,y,z Є X и для любого числа А Є R следующим условиям: 1 (х, У) = (У,х), 2- (x + y,z) = (x,z) + (y,z), 3. (Хх,у) = Х(х,у), 4. (ж,ж) 0, (х,х) = 0 х = 0. Функция /: X — Ж (если пространство X нормировано) называется непрерывной в точке х Є X, если для любого є 0 существует # 0 такое, что для любого у Є X, \\у - х\\ 6, будет \f(y) - f(x)\ є. Пусть (X,р(-,-)) — метрическое пространство. Функция /: X — Ж называется лип-шицевой на множестве S С X, если существует константа L оо такая, что для любых элементов х,у Є S \f(x)-f(y)\ LP(x,y). Число L называется константой Липшица функции / на множестве S. Пусть X — нормированное пространство. Множество всех линейных непрерывных функционалов на X называется пространством, сопряжённым к X и обозначается через X . Пространство X также можно сделать нормированным, определив в нём норму по формуле /= sup \f(x)\, /еГ, хЄВ(0,1) где В(х, г) = {у Є X \\х — у\\ г}. Пусть X, У — нормированные пространства. Пусть S С X — непустое множество. Напомним, что отображение F, сопоставляющее каждой точке х Є S некоторое, подмножество пространства Y называется многозначным отображением и обозначается F: S =4 У. Пусть А, В С X — непустые замкнутые ограниченые подмножества. Величина Рн(А, В) = max { sup inf р(х,у), sup inf p(x,y)\ хЄА УЄВ уЄВ хЄА называется расстоянием Хаусдорфа между множествами А и В. Расстояние Хаусдорфа является метрикой на множестве всех непустых замкнутых ограниченных подмножеств пространства X.

Многозначное отображение F: 5= Fc ограниченными значениями (т. е. для любого х Є S множество F(x) ограничено) называется непрерывным по Хаусдорфу в точке х Є S, если для любого є 0 существует 8 0 такое, что для любого у Є S, \\у — х\\ 8, будет pH(F(y),F(x)) e.

Пусть X — метрическое пространство, А С X — некоторое множество. Множество А называется компактным, если из всякой бесконечной последовательности {xk} С А можно выбрать подпоследовательность, сходящуюся в X к некоторому пределу. Напомним, что подмножество А пространства X называется выпуклым, если для любых х, у Є А и а Є [0,1] будет ах + (1 — а)у Є А. Для произвольного множества А С X наименьшее (по включению) выпуклое множество, содержащее А, называется выпуклой оболочкой множества А и обозначается со А. Функция /: X — EU {+оо} U {—оо} называется выпуклой, если для любых Х\,х2 Є X и а є [0,1] выполняется неравенство f(axi + (1 - ot)x2) af(xi) + (1 - a)f(x2). Выпуклая функция f:X — 1U {+00} называется собственной, если она не равна тождественно +оо. Линейный функционал р Є X называется субградиентом собственной выпуклой функции /: X — Ж U {+оо} в точке х Є dom/, если для любого у Є X справедливо неравенство f(y) — f(x) р(у) — р(х). Субдифференциалом функции / в точке х называется множество (обозначаемое df(x)), состоящее из всех субградиентов функции / в точке х, т.е. df(x) = {реХ \ f(y) - f(x) Р(У) Р(х) Уу Є X}.

Отображение х — df{x) называется субдифференциальным. Пусть Q є X — некоторое непустое множество нормированного пространства X. Функция /: П — Ж называется гиподифференцируемой на множестве Q, если для любого iefl существует выпуклый компакт df(x) С Rx X такой, что для любого допустимого приращения Ах Є X (т. е. со{ж + Ах} Є П) соответствующее приращение функции представимо в следующем виде f(x + Ax) = f(x)+ max (а +ip(Ax)) + о(Ах,х), [a,(p]edf(x) о(аАх,х)/а — 0 при а — 0. Отображение х — df(x) называется гиподифференциальным.

Метод субдифференциального спуска

В этой главе изучаются условия минимума «полиномиального» функционала. Для «полиномиального» функционала выписан градиент Гато, найдены необходимые условия минимума, которые используются при описании метода наискорейшего спуска для рассматриваемой задачи. Дополнительно исследуется задача минимизации «полиномиального» функционала, когда присутствуют ограничения на правом конце. С помощью теории точных штрафных функций эта задача при наличии ограничений сводится к задаче безусловной минимизации. Полученные условия минимума позволяют описать метод гиподифференциального спуска для решаемой задачи. Приведены численные примеры реализации описанных методов. Задача минимизации произведения степеней интегралов находит широкое применение в аэродинамике. Также даны примеры некоторых интегральных уравнений и задачи теории управления, которые можно свести к задаче минимизации полинома от интегральных функционалов.

Рассмотрим нелинейную систему дифференциальных уравнений y(x,x,u,t) = О (2.1) с заданным начальным условием ж(0) = х0. (2.2) Считаем систему полностью управляемой [34]. Здесь Т 0 — заданный момент времени, у -вещественная гг-мерная вектор-функция, х - гг-мерная вектор-функция фазовых координат, которую будем считать непрерывно дифференцируемой на [О, Т], управление и принадлежит некоторому фиксированному множеству допустимых управлений U={ue Ст[0, Т] u(t) Є V Vi Є [О, Т]}, где V С Rm - компактное множество. Предполагаем y(x,x,u,t) непрерывно дифференцируемой по і, і и и и непрерывной по всем четырём аргументам. Пусть требуется подобрать такое управление и Є U, при котором решение задачи (2.1), (2.2) удовлетворяет следующему условию: т y0(x,x,u,t)dt = L, (2.3) о где s-мерная вещественная вектор-функция у0 может содержать в себе информацию о положении объекта системы, значении его скорости и ограничениях на управление, L - заданный вектор из Rs. Считаем, что г/о непрерывно дифференцируема по і, і и и и непрерывна по всем четырём аргументам. С помощью (2.3) могут быть записаны, например, интегральное ограничение на управление вида / (u(t),u(t))dt= 1 о или ограничение на конечное состояние системы т хо + x(t)dt = хт-о Задачу (2.1)—(2.3) сведём к минимизации следующего функционала на всём пространстве: т т pz= (y(x,z,u,t),y(x,z,u,t))dt + 2( y0i(x,z,u,t)dt-LA , (2.4) о г=1 о где z(t) = x(t), zeCn[0,T], t y(x,z,u,t) = y(x0+ / z(r),z,u,t), t y0(x,z,u,t) = уо(х0+ z(r),z,u,t), а УОІ — і-я компонента вектор-функции y0. Функционал (2.4) содержит линейное слагаемое и сумму квадратов от интегральных функционалов. Таким образом, задача (2.1)—(2.3) свелась к минимизации полинома второй степени от интегральных функционалов. Аналогично можно рассмотреть задачу минимизации полиномов высших степеней.

В этой главе выводятся необходимые условия минимума функционала (далее будем называть его «полиномиальным») Pk[h(x),...,In(x)} (2.5) с заданным начальным условием ж(0) = х0. (2.6) В выражении (2.5) Рк — полином заданной конечной степени к Є N (его общий вид будет выписан в дальнейшем), a Ij, j = l,n, — интегральный функционал т h(x) = I fj{%(t),x(t),t)dt, о рассматриваемый в классической задаче вариационного исчисления [15]. Здесь Т 0 — некоторый фиксированный момент времени, fj — заданная вещественная скалярная функция, непрерывная по всем трём аргументам и непрерывно дифференцируемая по х и х, х — гг-мерная вектор-функция координат, непрерывно дифференцируемая на промежутке [0,Т]. Положим

Требуется найти такую вектор-функцию х Є С [0,Т], удовлетворяющую начальному условию (2.6), которая доставляет минимум функционалу (2.5). Сначала изучим частный случай, когда минимизируемый функционал имеет следующий вид: т t ВД = [ f f(x0+ [ z(r)dr,z(t),t)dt\2 , (2.7) общий случай будет описан далее. Найдём производную P2(z,v) по направлению v Є Сп[0,Т] функционала (2.7). Имеем P2(z + av) = / f(xo+ / Z(T) + av{r)dr, z(t) + av(t), t)dt I f{x0+ f z(r)dr,z(t),t)dt + a {{-, f v(r)dr) + (J ,v(t)) dt + o(a) bo oo T t T t = P2(z) + 2a I {{-7 , Iv(r)dr) + (-,v(t))}dt J f(x0 + f z(r)dr, z(t),t)dt + o(a) = 0 0 0 0 T T T t = P2(z) + 2a /{( [ -dr,v(t)) + ( f ,v(t))\dt [ f(x0+ [ z(T)dT,z(t),t)dt + o(a), dx dz o(a) a ч0приа0. (2 Л Отсюда получаем P2(z + av) - P2(z) a P2(z,v) =lim «4,0 df т т dx dz = 2 / ( / - -dr,v{t)) + (/At)) \dt / f(x0+ / z(r)dr,z(t),t)dt. (2.9) Т. е. функционал P2 дифференцируем по Гато [42] в точке z и его градиент выражается по формуле т т VP2(z) = 2 f(xo+ / z{r)dT,z{t),t)dt. (2.10) [dd д / дх dz Отсюда заключаем, что, для того чтобы вектор-функция z Є Сп[0, Т] была точкой минимума функционала (2.7), необходимо выполнение соотношений T T df, df — rfr + 7— OX oz t f(x0+ [ z (r)dr,z (t),t)dt = On VtG[0,T], (2.11) g/(y,T) Ї f(x0+ [z (r)dr,z (t),t)dt = 0, о 0 в которых 0n — нулевой элемент пространства Сп[0,Т]. Второе равенство в (2.11) вытекает из первого при t = Т и представляет собой условие трансверсальности на правом конце.

Метод гиподифференциального спуска

В этой главе иллюстрируется применение метода субдифференциального спуска и метода гиподифференциального спуска к задаче нахождения программного управления динамикой объекта, которая описывается системой обыкновенных дифференциальных уравнений. В некоторых работах, например [34, 32], представлено аналитическое решение задачи построения программного управления как для линейных систем, так и для нелинейного случая. Однако в этом аналитическом решении используется фундаментальная матрица системы, получить которую даже в случае линейных нестационарных систем, вообще говоря, не представляется возможным.

Постановка задачи Рассмотрим краевую задачу х = f(x,u,t), t Є [0,Т], (3.1) ж(0) = х0, (3.2) х(Т) = хт- (3.3) Считаем систему (3.1) управляемой [34] из начального положения (3.2) в конечное состояние (3.3). Здесь Т 0 — заданный момент времени, f(x,u,t) — вещественная гг-мерная вектор-функция, х — гг-мерная вектор-функция фазовых координат, которую будем считать непрерывной с кусочно-непрерывной на [0,Т] производной, хо, хт Є Rn — заданные векторы. Предполагаем f(x,u,t) непрерывно дифференцируемой по ж и и и непрерывной по всем трём аргументам. Пусть m-мерное управление и принадлежит следующему множеству допустимых управлений U = {и Є Рт[0,Т] \ f (u(t),u(t))dt C}, (3.4) Jo где С — заданная константа. Рассмотрим следующую задачу. Требуется подобрать такое управление, которое принадлежит множеству допустимых управлений (3.4) и переводит систему (3.1) из начального положения (3.2) в конечное состояние (3.3) за время Т. 1pi(z) = \lpi(z)\, ф )=Х0г+ / Zi(t)dt-XTi, г =1,71, Jo а ХОІ — г-ая компонента вектора XQ, ХТІ — г-ая компонента вектора хт, і = 1,п. Нетрудно видеть, что функционал (3.5) неотрицателен для всех z Є Рп[0,Т] и для всех и Є Pm[0,T] и обращается в ноль в точке [г ,и ] Є Рп[0,Т] х Рт[0,Т] тогда и только тогда, когда вектор-функция x (t) = хо + / z (r)dr Jo является программным движением, соответствующим искомому программному управлению и Є U.

Следствие 3.3.1. Если z Є Q, и Є U, то функционал І субдифференцируем, и его субдифференциал в точке [z,u] выражается по формуле dl(z,u) = { [z(t) - f(x,u,t) - jT {дї{Хд Т)]Ш - f(x,u,r))dr + + iei,-(df{x t))\z(t)-f(x,u,t))+2vu\ I e [-1,1], г = Т , (3.6) i=\ v є [0,1], и Є U0, v = 0, и Є U- \. Доказательство. В случае z Є П, и Є U имеем /+ = 0, U+ = 0, и тогда соотношение (3.6) следует из Теоремы 3.3.1. Лемма 3.3.1. Если система (3.1) линейна по фазовым переменным х и по управлению и, то функционал I является выпуклым. Доказательство. Представим функционал (3.5) в виде I(z,u) = -Ii(z,u) + h{u) + I3(z), где Ii(z,u), І2(и), h(z) — соответствующие слагаемые из правой части (3.5). Функционалы І2Іи) и Iz(z) выпуклы как максимумы выпуклых функционалов [24]. Покажем выпуклость функционала І\ в случае линейности системы (3.1). Пусть система (3.1) имеет вид х = A{t)x + B{t)u + w{t), где A(t) — п х гг-матрица, B{t) — п х m-матрица, w(t) — гг-мерная вектор-функция. Считаем A(t), B(t), w{t) вещественными и непрерывными на [0,Т]. Пусть Z\,Z2 Є Рп[0,Т], щ,и2 Є Pm[0,T], а Є (0,1). Имеем h{a(zi,ui) + (1 - a)(z2,u2)) = \\azi(t) + (1 - a)z2(t) — -A(t) [XQ + / (az r) + (1 - a)z2(r))dr] -Jo —B(t)[aui(t) + (l — a)u2(t)]—w(t)\\ = \aip(zi,ui) + (1 - a)tp(z2,u2)\ \ = = a2 {ip(zi,ui),tp(zi,ui))dt + 2a(l-a) ( p(zi,ui), p(z2,u2))dt+ Jo Jo +(l-a) 2 ( p(z2,u2), p(z2,u2))dt = a ( p(z1,u1), p(z1,u1))dt+ Jo Jo +(1 - a) / (ip(zi,ui),ip(z2,u2))dt + 2a(l-a) ( p(zi,ui), p(z2,u2))dt Jo Jo -a(l-a) ((p(z1,u1),(p(z1,u1))dt-a(l-a) (p(z2,u2),p(z2,u2))dt = Jo Jo = a (ip(zi,ui),ip(zi,ui))dt + (l-a) (Lp(z2,u2),Lp(z2,u2))dt -a(l-a) / (tp(zi,ui) - ip{z2,u2),ip{zi,ui) - tp(z2,u2))dt. Jo В силу неотрицательности последнего слагаемого имеем для всех Z\,z2 Є Рп[0,Т], щ,и2 е Pm[0,T\, а е (0,1) Ii(a(zi,ui) + (1 - a)(z2,u2)) ah(zi,ui) + (1 - a)Ii(z2,u2), что и доказывает выпуклость функционала Д.

Теперь остаётся заметить, что функционал / является выпуклым (в случае линейности исходной системы) как сумма выпуклых функционалов [24]. Лемма доказана. Известно, что необходимым, а в случае выпуклости и достаточным условием минимума функционала (3.5) в точке [z ,w ] в терминах субдифференциала является условие [23] Оп+т Є 8I(Z ,U ), где 0п+т — нулевой элемента пространства Рп[0,Т] х Рт[0,Т]. Отсюда и из Леммы 3.3.1 заключаем, что справедлива Теорема 3.3.2. Для того чтобы управление и Є U переводило систему (3.1) из начального положения (3.2) в конечное состояние (3.3) за время Т, необходимо, а в случае линейности системы (3.1) и достаточно, чтобы On+mdI(z ,u ), (3.7) где выражение для субдифференциала dl(z,u) выписано в формуле (3.6). 3.4 Метод субдифференциального спуска Найдём минимальный по норме субградиент

Задача (3.8) представляет собой задачу квадратичного программирования при наличии линейных ограничений и может быть решена одним из известных методов [17], [18]. Обозначим ш , г Е 1о, и её решение. Тогда вектор-функция G{t,z,u) := h = S\(t) + 2.шіег, S2(t) + 2и и іЄІо является наименьшим по норме субградиентом функционала / в точке [z,u]. Если G(z,w) 0, то вектор-функция — iG( i является направлением субдифференциального спуска функционала / в точке [z,u].

Опишем следующий метод субдифференциального спуска для поиска стационарных точек функционала I. Фиксируем произвольную точку [z\, щ] Е Рп[0, Т] х Pm[0, Т]. Пусть уже построена точка [zk,Uk] Е Рп[0,Т] х Рт[0,Т]. Если выполнено необходимое условие минимума (3.7), то точка [zk, ик] является стационарной точкой функционала I, и процесс прекращается. В противном случае положим [zk+i,Uk+i\ = [zk,Uk] - akGk, где вектор-функция Gk = G(t,Zk,Uk) представляет собой наименьший по норме субградиент функционала / в точке [zk,uk], а величина ак является решением следующей задачи одномерной минимизации imnI([zk,Uk] -aGk) = I([zk,uk] - akGk). Тогда I(zk+i,Uk+i) I(zk)uk). Если последовательность {[zfc,Wfc]} конечна, то последняя её точка является стационарной точкой функционала / по построению. Если же последовательность {[zfc,Wfc]} бесконечна, то описанный процесс может и не привести к стационарной точке функционала I, поскольку субдифференциальное отображение dl(z,u) не является непрерывным в метрике Хаусдорфа [24].

Необходимые условия минимума

В этой главе рассматривается дифференциалвное включение с заданными многозначным отображением и началвной точкой. Для этого дифференциалвного включения требуется найти решение, доставляющее минимум интегралвному функционалу. С помощвю аппарата опорнвіх функций и аппарата точнвіх штрафнвіх функций в случае непрервівной дифференцируемое опорной функции многозначного отображения по фазоввім переменнвім по-лученві некоторвіе классические резулвтатві принципа максимума для дифференциалвнвіх включений.

В формуле (5.1) F(x, t) — заданное непрервівное многозначное отображение при t Є [0,Т],х — гг-мерная непрервівная вектор-функция фазоввіх координат с кусочно-непрервівной на [0,Т] производной, Т 0 — заданнвій момент времени. Будем полагатв, что каждому моменту времени t Є [0,Т] и каждой фазовой точке х Є Кга функция F(x,t) ставит в соответствие некоторвій выпуклый компакт из Кга.

Требуется найти такую вектор-функцию х Є Сп[0,Т], являющуюся решением включения (5.1) и удовлетворяющую началвному условию (5.2), которая доставляет минимум функционалу I(x)= [ fo(x,t)dt, (5.3) Jo где /о — заданная вещественная скалярная функция, непрерывная по обоим аргументам и непрерывно дифференцируемая по х.

Далее для краткости будем иногда писать F вместо F(x,t). Поскольку \/t Є [0,Т] и Ух Є Кга многозначное отображение F(x,t) представляет собой выпуклое замкнутое и ограниченное множество, включение (5.1) можно переписать иначе [11] (x,ip) c(F,ip) Уф Є S, Vi Є [0,Т]. Обозначим z(t) = x(t), z Є Рга[0,Т], тогда с учётом (5.2) будет x(t) = хо + / z(r)dr. Jo Введём функции Є(ф,г,і) = (г,ф)-с(Р,ф), (5.4) h(z,t) = maxmax{0,( ,z,t)} (5.5) и составим функционал гТ Ф) = \1 I h2(z,t)dt. (5.6) Введём множество Q = {zePn[0,T] І ф) = 0}. Нетрудно убедиться, что для функционала (5.6) справедливы соотношения (p(z) = 0 (z Є Q), если (х,ф) c(F,V ) W Є 5, Vt є [0,T], /?(z) 0 (z ф П), в противном случае. Запишем функционал bx(z) = I(z) + \ip(z), (5.7) в котором I(z) = I(x0+ / z(r)dr), Jo А — достаточно большое положительное число. Далее будет показано, что при некоторых дополнительных предположениях задачу минимизации функционала (5.3) при наличии ограничений (5.1), (5.2) можно свести к безусловной минимизации функционала (5.7). 5.3 Дифференциальные свойства функционалов ip и I

Считаем, что опорная функция C(F, JJ) многозначного отображения F(x,t) непрерывно дифференцируема по фазовой переменной х. Тогда для любых х,у Є Сп[0,Т] и любого t Є [О, Т] будет c[F{x + ау,і),ф) — c(F(x, t)/tf) = Используя представление для функционала Н, разложение (5.9) и беря классическую вариацию функционала р, получаем следующую лемму. Лемма 5.3.1. Если опорная функция c(F,if)) многозначного отображения F(x,t) непрерывно дифференцируема по фазовой переменной х, то:

Пользуясь известным достаточным условием [23] локальной точности штрафной функции Фд, заключаем, что справедлива Теорема 5.4.1. Пусть точка zo Є П является локальным минимумом функционала I на множестве Q в метрике р. Предположим, что в некоторой окрестности tts = {zePn[0,T] \p(z,z0) 5} точки z0 выполнено соотношение р±(z) -а 0 Vz Є Qs\ Q. Пусть также функционал I является липшицевым на множестве Q$. Тогда существует такое число А , что для любого А А точка zo будет локальным минимумом функционала ФА в метрике р. Теорема 5.4.2. Пусть выполнены условия Теоремы 5.4-1- Предположим, что опорная функция многозначного отображения F(x,t) из (5.1) непрерывно дифференцируема по х. Для того чтобы точка х = хо + / z (r)dr Jo удовлетворяла включению (5.1) и условию (5.2) и доставляла минимум функционалу (5.3), необходимо, чтобы нашлась такая вектор-функция Ф(), что для всех t Є [0,Т] выполняются соотношения ф = _ас№ ,«),ФМ) влм) з) ах ах (x ,4 (t))-c(F(x ,t),4 (t)) = 0, (5.14) Ф(Т) = 0. (5.15)

Доказательство. Теорема 5.4.1 утверждает, что существует такое число Л 0, что для всех Л Л точки локального минимума функционала (5.3) на множестве, задаваемом ограничениями (5.1), (5.2), являются точками локального минимума функционала (5.7) на всём пространстве.

Положим Ф() = \w(t)if)(t), где вектор-функция w(t) берётся из множества W, а вектор-функция ф{ї) — из множества R(t). Поскольку по Лемме 5.3.1 при z Є П функционал ір субдифференцируем, и его субдифференциал выписан в (5.10), а функционал / дифференцируем по Гато, и его градиент выписан в (5.12), то из известного необходимого условия минимума [23] 0п Є дФ(г ) имеем с учётом (5.11), что в точке минимума для всех t Є [О, Т] должно выполняться условие [ dJ dT + m + _тл Щт = (5Лв) где 0га — нулевой элемент пространства Рп[0, Т]. Дифференцируя (5.16) на интервале времени [0,Т], получаем систему дифференциальных уравнений Щі) = dc(F(x ,t),V(t)) , df0(x ,t) дх дх с концевым условием Ф(Т) = 0, и приходим к соотношениям (5.13), (5.15).