Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх Мухтаров Магзум

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Мухтаров Магзум. Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх : ил РГБ ОД 61:85-1/1041

Содержание к диссертации

Введение

Глава 1. Игровые задачи со свободным правым концом

1,1. Постановка задачи 9

1-2. Решение линейной задачи 11

1.3. Метод решения задача I.I.I в случае квазилинейного объекта 22

1.4. Метод, решения задачи, I.I.2 в случае квазилинейного объекта 26

1.5. Итерационная процедура вычисления оптимального управления в квазилинейном случае 35

1.6. Иллюстрирующий пример 38

Глава 2. Согласованное управление динамическими системами при условии минимума энергии

2.1. Постановка задачи 50

2.2. Метод решения линейной задачи 53

2.3. Метод: последовательных приближений решения задачи 2.1.1 57

2.4. Метод решения квазилинейной задачи 64

2.5. Итерационная процедура решения задачи (2-І.I) -(2.1.5) в случае квазилинейного объекта. 69

2.6. Иллюстрирующий пример ,чч. 72

Глава 3. Согласованное управление динамическими системіами при условии минимума квадратичных функционалов на верхнем уровне

3.1. Постановка задачи 78

3.2. Метод решения линейной задачи 79

3.3. Метод решения квазилинейной задачи 85

3.4. Иллюстрирующий пример 90

Заключение 103

Литература 105

Метод решения задача I.I.I в случае квазилинейного объекта
Итерационная процедура вычисления оптимального управления в квазилинейном случае
Метод: последовательных приближений решения задачи 2.1.1
Метод решения квазилинейной задачи

Введение к работе

Теория дифференциальных игр - один из новых интенсивна развивающихся разделов математической теории оптимальных управляемых процессов. Ее появление и развитие в конце пятидесятых - на«» чале шестидесятых годов вызвано различными задачами современной техники. Основополагающие результаты в теории дифференциальных игр принадлежат Л.С.Понтрягину и H..R.Красовскому. Библиография работ, развивающих это направление, содержит около двух тысяч наименований. Отметим монографии в статьи [I, 326, 33, 50, 51, 54, 62, 64] , в которых приведены наиболее важные результаты,дана оценка и характеристика основных направлений развития современной теории дифференциальных игр.

В данной диссертационной работе изучаются некоторые иерархические дифференциальные игры. В теории иерархических игр исследуются задачи управления, в которых игроки обладают¹ различными правами. Мы будем рассматривать двухуровневые иерархические задачи согласованного управления динамическими процессами игроками верхнего и нижнего уровней..

Предполагается, что оба игрока знают динамику управляемого процесса, его начальное состояние и не получают информацию о текущих состояниях процесса вплоть до окончания игры.. Это обстоятельство вынуждает игроков использовать управляющие воздействия, зависящие только от- времени и отвечающие заданной начальной позиции.

Игрок нижнего уровня имеет право первым выбрать свое управляющее воздействие, минимизируя заданный функционал, оценивающий качество процесса управления, и предполагая, что игрок верхнего уровня может использовать в процессе управления произвольные допустимые управляющие воздействия. Свое оптимальное управляющее воздействие игрок нижнего уровня сообщает игроку верхнего уровня. Последний, используя эту информацию, находит оптимальное управляющее воздействие, минимизируя свой функционал качества и в свою очередь сообщает его игроку нижнего уровня. Таким образом, результат рассматриваемой иерархической игры полностью определяется игроком верхнего уровня, который доминирует: в течение всей игры, навязывая решение, отражающее главным образом его, интересы. Игрок нижнего уровня вынужден приспосабливаться к стратегии игрока верхнего уровня иерархии.

Актуальность темы. Иерархические дифференциальные игры составляют одно из новых и интенсивно развивающихся в настоящее время направлений теории дифференциальных игр. Основы теории иерархических систем были заложены в работах Ю.Б.Гермейера [2l] и й.К.Моисеева [43 J в середине шестидесятых годов. Обзор наиболее важных результатов и направлений исследования этой теории содержится в первой главе книги [43в, с.15-63] , написанной большим количеством авторов.

В последние годы к иерархическим задачам управления привлечено внимание многих исследователей: устанавливаются необходимые условия оптимальности управления игроков, изучаются вопросы существования оптимальных решений и разрабатываются алгоритмы их построения при различных предположениях относительно структуры иерархических систем: и характера информированности их различных уровней. Анализу таких вопросов посвящены работы [12, 22, 23, 31, HZ, 43, 47, 59-61, 63] .

Цель работы состоит в изучении некоторых двухуровневых задач иерархического координированного управления процессами, описываемыми квазилинейными дифференциальными уравнениями. При определенных предположениях обосновываются итерационные методы построения оптимальных программных управлений игроков верхнего и нижнего уровней для задач управления со свободным правым концом и с закрепленными концами при условии минимума квадратичных функционалов, оценивающих качество управления.. Указываются эффективно проверяемые достаточные условия существования оптимальных решений.

Общая методика исследования. Работа опирается на принцип максимума І.С.Понтрягина в теории оптимальных управляемых систем 52] , методы классического вариационного исчисления, численные методы в теории оптимального управления, а также на основные факты теории обыкновенных дифференциальных уравнений, интегральных и интегро-дифференциальных уравнений.

Научная новизна и практическая ценность. Разработанный в диссертации метод последовательных приближений для формирования оптимальных программных управлений в иерархических системах является новым и может быть положен в основу практически реализуемых ал горитмов управления в прикладных задачах. Решение задачи получено в завершенном виде: в линейном случае построение оптимальных управлений сведено к решению некоторой системы линейных алгебраических уравнений, в квазилинейном случае оптимальное решение есть равномерный предел последовательности решений систем линейных алгебраических уравнений с переменной неоднородностью, зависящей от нелинейных членов в уравнениях движения и шага итерации. Поэтому алгоритмы иерархического программного управления, разработанные в данной работе, допускают аналитическую и численную реализацию на ЭВМ и могут найти применение в задачах экономики и многокритериальных задачах механики.

Краткое содержание работы. Диссертация состоит из введения, трех глав и списка литературы.

Содержание первой главы включает игровые задачи со свободным о правым концом. Ставится задача построения управлений ІЛ.(ь_?/и) - б - и 'V-Cttju.) , оптимальных по Штакельбергу, минимизирующих соответственно функционалы на движениях системы у-А шу t b(t) и. * Coqv- +juf(t, у) с начальным, условием у(о)~Уо-

Решение линейной задачи (при JU⁼ ) сводится к решению интегрального уравнения Фредгольма второго рода с вырожденным ядром. Из теории интегральных уравнений [чэ] следует, что решение та** кого уравнения существует, если определитель соответствующей ему алгебраической системы уравнений отличен от нуля. В частном случае, когда размерность фазового вектора равна единице, доказывается существование единственного, оптимального в смысле Штакель-берга, решения рассматриваемой линейной иерархической игры при предположении., что квадратичные формы переменных CL и "ZA определенно положительны.

В квазилинейном случае оптимальное управление V~{,m) игрока верхнего уровня иерархии удовлетворяет интегральному урав- нению вида нелинейному относительно искомой функции V-⁰(,/u). Показывается, что это нелинейное интегральное уравнение при достаточно малых значениях параметра jtc имеет единственное решение. Следовательно, существует единственное оптимальное по Штакельбергу реше- ниє квазилинейной иерархической игры. На основе метода простой итерации разработай метод, последовательных приближений для вычисления оптимального управления, т.е. построения последователь-ности аппроксимирующих управлений ill ct,ju),v~ ct,ju)j равномерно

ПО t, СХОДЯЩеЙСЯ К ИСКОМОМУ ОПТИМаЛЬНОМу решеНИЮ {CL Ct₇jiL) _t V~ C,f-)} квазилинейной задачи при достаточно малых значениях параметра ju, .

Во второй главе рассматриваются иерархические игры, когда динамика управляемого процесса описывается квазилинейными, дифференциальными уравнениями, игроки заинтересованы в переводе управляемого объекта из-за данного начального состояния в заданное конечное состояние при условии минимума функционалов, квадратичных относительно управляющих воздействий.

Решение линейной задачи также сводится к решению интегрального уравнения Фредгольма второго ряда с вырожденным ядром. Приводится метод последовательных приближений [2а, 32в] построения оптимального управления CtCt^i) игрока нижнего уровня иерархии на основе проблемы моментов. Для определения оптимального управления V- L,ju.J игрока верхнего уровня выводится интегральное уравнение, нелинейное относительно искомой функции. Показывается существование единственного решения этого уравнения.. Таким образом, обосновывается итерационная процедура формирования оп-> тимальных по Штакельбергу программных управлений, опирающаяся на применение проблемы моментов к решению задач управления.

Третья глава посвящена управлению динамическими системами при. условии, минимума квадратичных функционалов, оценивающих качество процесса управления. Причем функционал, минимизируемый игроком нижнего уровня, квадратичен относительно управляющих воздействий, а функционал, минимизируемый игроком верхнего уровня - относительно управляющих воздействий и фазового вектора уп- равляемой системы. Игроки заинтересованы в переводе управляемого объекта из одного заданного состояния в другое заданное состояние при условии последовательной минимизации функционалов качества.

С помощью методов теории управления и вариационного, исчисления выводится система интегро-дифференциальных уравнений, решение которой определяет оптимальное по Штакельбергу управление iSCty*.) игрока верхнего уровня иерархии;. Указывается итерационная проце-дура построения аппроксимирующих непрерывных управлений ІМ- «j/*v» tr C6,ju)$ , сходящихся равномерно по t при: достаточно малых значениях параметра ju. , к оптимальным управлениям и. (t,juL) и V- (t,ju.) , разрешающим поставленную задачу.

Результаты всех трех глав диссертации иллюстрируются модельным примером об управлении прямолинейным, движением материальной точки, переменной массы, которая движется под действием реактивных сил, вырабатываемых электрическим ракетным двигателем и жид-» костным, реактивным двигателем; и малой силы сопротивления воздуха, пропорциональной квадрату скорости точки.

По основным, результатам диссертации опубликованы пять печатных работ [4Л4]

Результаты диссертации докладывались на семинарах отдела динамических систем ИММ УНЦ АН СССР, лаборатории обыкновенных дифференциальных уравнений ИММ АН КазССР, кафедры дифференциальных уравнений Казахского государственного университета им.С.М.Кирова (г.Алма-Ата), а также на седьмой и. восьмой казахстанской межвузовской научной конференции, по математике и механике (гг.Караганда; Алма-Ата).

Метод решения задача I.I.I в случае квазилинейного объекта

Рассмотрим задачу минимизации функционала (1.1,3) на движениях квазилинейной системы ОС &C :)LLCWl -yu(t,uC), ОСао) СС0- (1.3.1) При достаточно малых значениях параметра su, (lMl±/itDCTJ) эта задача имеет единственное решение ufCt ju, iSCyju)) и -OC(bju,VGj/u)) , если решение иС о,г 0 и)) и й&6,о,гХуО) задачи в первом приближении (т.е. при /и 0 ) таково, что СС(, О, Обуй)) f , Для полноты изложения опишемі итерационный метод построения управления U- (6tjit,W y)) t опирающийся на результаты работ [2,3J . Используя принцип максимума f52j, мы Из (1.3.3) - (1.3.5) следует, что функции. f0(t,ju,iK;ju)) и CcCtrJUi sf1)) непрерывно дифференцируемы по на отрезке [ о, 2 и являются некоторыми линейными функционалами относительно воздействий Ctjju) 9 o,tj]. Для их практического построе-ния можно воспользоваться методом последовательных приближений Пикара [58J , который будет сходиться равномерно относительно Г4?, /J при достаточно малых значениях параметра JU-? Qfui JU0CTJ) . в качестве начального приближения возьмем решение ОС%,г (уи)) и (f feittyt)) системы (1.3.3) при J1 -0 с начальным условием: (1.3.4) и граничным условием (1.3.5). Решение этой линейной системы имеет вид (см.параграф 1.2). держится в области J . Тогда можно построить последовательности СС (t,ju,iK-ya)) и ОС C6 /u,"z/Cvju)) t сходящиеся равномерно относительно 6fo//J при достаточно малых значениях параметра JU 0/ul4/U Cf)) , соответственно к оптимальному управлению tiityttWy)) й оптимальному движению ОС C6-,jufzK-f )j , разрешающим задачу I.I.I.

Вид оптимального управления a_(ttju,iM yu)) определяется формулой (1 3.12). Переходим теперь к решению задачи I.I.2, т.е.к построению оптимального управления V (tyju.) игрока верхнего уровня иерархии, минимизирующего функционал (I.I.4) на движениях системы (1.3.1) при u ct(t,ju,zX-ffj)) „ в СИЛу определенной положительности квадратичной формы иО(,и,іУ) переменных CL и zh в (I.I,4) для минимизации функционала (1.1,4) достаточно удовлетворить необходимому условию экстремума этого функционала. Пусть {u?t )=ci6ty ,z/%yu))y 2 (,ju)} _ оптимальное по Штакельбергу решение задачи 1,1,2. Для вычисления вариации функционала 7Z (I.I.4) при а и г/и Ъ )) и it=&6fyu) , рассмотрим управление где uV-Ct,ju) „ вариация управления If jju.) f которая является произвольной непрерывной функцией, а 6 - малый параметр. Чтобы вычислить вариацию utiCt,ju.) управления CL(,J .) составим вдоль движения ОС квазилинейной системы (1 3.1), порождаемого управлением U. Ct,/u,u6;/t/)J , систему уравнений в вариациях: Воспользуемся теперь тем, что в силу оптимального управления ULCt,( )-( 0-, ,2}% )) следует, что какова бы ни была непрерывная по "& функция (iuCtjJu.) имеет место равенство Первые три слагаемые в этом равенстве не зависят от ouC-6,jtc) t поэтому, чтобы найти вариацию uC/Ctiju) управления CCLt u, 0/j )\ отвечающую вариации uV Ctrju) управления 1/CJM) 9 необходимо минимизировать функционал

Итерационная процедура вычисления оптимального управления в квазилинейном случае

Опишем теперь метод последовательных приближений для пост роения оптимальных по Штакельбергу управлений {и уи и уЧ) иерархической игры (ІД.І) - (I.I.6). При изложении метода бу дем использовать следующие два факта.

Во-первых, при любом фик сированном управлении V-Ct,jU) , непрерывном по 6 , оптималь ное управление U-CtfjUfifCjju)) может быть найдено методом после довательных приближений Пикара по формулам (1.3.10) - (1.3.12). Во-вторых, оптимальное управление V (,ju) игрока верхнего уров ня при выполненим условий теоремы I.4.I существует при достаточ но малых значениях параметра JU. и может быть вычислено как решение интегрального уравнения (1,4.12) методом простой итерации, сходящейся при достаточно малых /и. . Эти обстояте льства позволяют организовать итерационную процедуру построения управления , равномерно.) по сходящих- ся к искомому оптимальному решению задачи (I.I.I) - (I.I.6) и отличающихся от него на величину, имеющую А? -ый порядок малости относительно JU. . 1. Вычисляем решение V- Сб) интегрального уравнения (І.2ЛЛ) и затем по формуле (I.2.IO) находим управление U.ct) cc te,v 6))- Управление является оптимальным; по Штакельбергу решением линейной иерархической игры (I.2.I), (I.I.5), (I.I.6). (о)/. Со) (о) \ Пусть ОС CtjU &),v- 6-а) т оптимальное движение линейной системы, порождаемое парой управлений СС 66J и С6) при заданном начальном условии. ЭССо) э о 2. Составляем систему уравнений в вариациях (1.4.2) и вычисляем необходимые данные для решения интегрального уравнения (1.4.12). 3. Составляем интегральное уравнение (1.4.12): В этом уравнении, все необходимые величины следует найти с точностью до членов первого порядка малости относительно малого параметра у Для этого представляя фундаментальную матрицу 0(ttL,/u,V-oO )) системы уравнений в вариациях (1.4.2) в виде получим интегральное уравнение вида (І.Л.ІЗ): "Co Тогда с точностью до членов первого порядка малости относительно JU. , искомое управление V faj1 ) будет решением: уравнения и, следовательно, с точностью до членов первого порядка по /и. , имеем Причем добавка "V- fe) находится как решение уравнения По формуле (1.3.9) определяем СС Сб/и/и) и вычисляем; с точностью до jU. первой степенш движение ОС Ct,u/U/U Ojjtt) j V (-)ju)) » порождаемое парой управлений сі Ctyu), 1/1(t,ju) . 5. Принимая за исходные управления СС (;/ ) и t/ &,/ ) , повторяем описанный процесс, вычисляя уже все нужные величины с точностью до членов второго порядка малости относительно параметра /LL .

В результате получим последовательность управлений Рассмотрим материальную точку переменной массы тСб) 9 движущуюся по горизонтальной прямой " у " под действием реактивных сил тШа и tn&iv" вырабатываемых соответственно электрическим ракетным двигателем и жидкостным; реактивным двигателе» (53, 63J, и силы сопротивления воздуха, равной по ве- Z личине jutfK-ejy 9 где JU. - постоянный коэффициент сопротивления. Уравнение движения точки имеет- вид или, полагая У Уп У У& , получим систему уравнений Пусть задано начальное состояние и(о) С{,0} . Требуется найти оптимальные по Штакельбергу управления СС fa /1 ) и if(t,ju) минимизирующие, соответственно функционалы Задачу последовательной минимизации функционалов (1.6.2) (1.6.3) можно трактовать следующим образом: интегральная часть функционала (1.6.2) оценивает энергию, истраченную на управле- ниє точкой электрическим, двигателем, а внеинтегральные слагаемые оценивают минимизируемую окрестность начала координат у у О, в которую переводится точка. Функционал (1.6.3) будем трактовать как суммарное количество энергии, затраченное на управление обо » ими двигателями. Батареи, питающие электрический двигатель, могут подзаряжаться с использованием солнечной энергии, запасы жидкого топлива не восполнимы [53]. Поэтому, естественно, пытаться решать задачу перевода ТОЧКИ В минимально возможную окрестьность точки cff u o за счет электрического двигателя, а жидкостный двигатель использовать как вспомогательный и с его помощью избежать больших энергетических затрат.

Метод: последовательных приближений решения задачи 2.1.1

Для полноты изложения метода решения квазилинейной задачи, опишем процесс построения [2а, б, 32а, BJ решения задачи 2.I.I-управляющего воздействия CL0( jJUftK // } Пусть поведение объекта описывается дифференциальным! уравнением; (2.I.I). а качество процесса управления оценивается функционалом (2.1.2): Процесс построения оптимального управления CL Сб,м) t являющегося решением задачи 2.I.I начнем с управления (J, Сб/іЯ-)) , разрешающего эту задачу при f 0 f где & &) - любая непрерывная по 6 [to J функция. Предположим, что функция гК ) такова, что движение J CtjU-Xt/1/(-)),1/( )) линейной системы содержится в области 9" . Вычислим движение системы (2.I.I) при U-U Ctfi/C)) и начальном условии хС) = Х0. для этого, пользуясь формулой Коши 3I6J , запишем уравнение (2.I.I) интегральным уравнением

Воспользуемся теперь методом последовательных приближений Пикара. Начнем его с оптимального движения ОС {t, с/Сб, &()), iXjju)) системы (2.I.I)» Проделав один шаг, то есть, подставив в правую часть 2.3.1 При t=tf движение xUi/UfU fatHj/iXyu)} (2.3.2) приходит в точку Xf+Z L ,ju,tKy )") , отличающуюся от OCj на величину первого порядка малости по /К .Составим вдоль движения (2.3.2) систему уравнений в вариациях где 4 -. отклонение от движения (2.3.2), вызванное вариацией СЛ. управления СС ; элементы матрицы /4 {t/iXif)) определяются равенствами Построим теперь управление Л- {tfjif O Jj = г CL С,гЯ))-LL fa/U/lXyju)) , удовлетворяющее условию fCa J-JfCu -i-cl l-niu iCul и такое, что система (2.3.4) при, CL cL Ct/fu Cyju)) переходит из начального состояния иС )=0 в конечное состояние y(f) -Z- fa,/1 , ;/")} Пусть ( ,с,/и,ъ у 0) « фундаментальная матрица решений системы (2.3.4) при и-О . Тогда управление СС &,/ /, Ху)) будет решением, задачи при условии JfCa0,J -ґЛСКц Для вычисления матрицы у 4 {б,С,Л ,ъ уи)) мы также воспользуемся методом Пикара, начиная его для уравнения (2.3.4) с матрицы Л ( / .Проделав первый шаг и ограничиваясь только членами, первого порядка малости у , получим: ВЫЧИСЛИМ Теперь ДВИЖеНИе СИСТеМЫ (2,1.1) При U=U (t,jU,ZX/Jbi)) и начальном условии Х(0)- ОС0 . Опять воспользуемся методом Пикара, начав его с движения X. fe} &( &)) На первом шаге имеем которое отличается от jcf уже на величину второго порядка малости по JH Найдем управление U? ,jU,tKy))=tI%jit,itty ))+U G,ftfy)), удовлетворяющее условию JfCu(l)J JfCu !+с/ z 1 rfftSltt и такое, что система уравнений в вариациях где у C tjuftM-jju)) - фундаментальная матрица решений системы (2.3.12) при и О 9 причем с точностью до членов третьего порядка малости по JU

Найдем управление U- faj", {/ )) U. faf , Ж-уи)) + ч-сс (6уи,ь { // )) удовлетворяющее условию o7YCuryJ /r?uZct Таким образом, пользуясь описанной выше процедурой, можно построить управление, переводящее систему (2.I.I) из начального состояния Хо в конечное состояние ОС І с точностью до членов любого порядка малости по уч Последовательность управлений при //ы/б/у0 сходится равномерно к функции U-Ct/jtt) [26 1. Зафиксируем; произвольную непрерывную функцию V Ct/Jttj времени .0(f] и рассмотрим задачу 2.Г.І. минимизации функционала (2.1.2) на управлениях tt(t,jU,4 (vju)y , переводящих ква- зилинейную систему (2.I.I) из заданного начального состояния х&б)=Х0 в заданное конечное состояние CC( /J 0 При выполнении условия (2.1 - 2.ІУ) параграфа 2.1 существует [2а, 39J единственное непрерывное по оптимальное управление разрешающее эту задачу. Пусть X(t,j",vTvf )) - соответствующее ему оптимальное движение системы (2.I.I). Функции U?(ttju,V%ju)) и xt,ju,vfy )) могут быть найдены при достаточно малых значениях параметра при помощи итерационных процессов, описанных в [2б] и приведенных в параграфе 2.3. Пусть ЭС fajM, vtyu)) движение системы (2.1.1) при управле-ний а СС С) , разрешающим задачу (2.1 4) пщуг/zO . При ij движение X "(б/уі/, г уе/)) приходит в точку SC. + Z. CtfJ") » где

Метод решения квазилинейной задачи

Переходим к определению оптимальных по Штакельбергу управ- ляющих воздействий LL(t,ju) и V-fyjLL) в квазилинейной задаче, пе реводящих систему (3.1.1) из состояния JcCto) 0Co в состояние X(t) Xi и минимизирующих соответственно функционалы (3.1.2) и (3.1.3). Для этого зафиксируем произвольную непрерывную функцию lJC6,yu.) времени И ПОСТРОИМ решение LL fejU/lK /j"))j разрешающее задачу 2.I.I. Методика построения такого решения приведена в параграфе 2.4. Пусть ОС fe7ju,iKvf )) « движение системы (3.1.1) при управлении U=CC Ct, -)) 9 разрешающем задачу 2.I.I при JU-O .

Составим; вдоль этого движения систему уравнений в вариациях: где производные dfc/Docf вычислены при ЗС-ЭС C6jju,06s/4)), Воспользуясь методами, приведенными в параграфе 2-2, определим управляющее воздействие Предположим теперь, что минимум, функционала «% (3.1.3) достигается при = &(6уи) # Рассуждения и преобразования, проведенные аналогично; в параграфе І.Л приводят к тому, что для определения оптимального, управления V faju.) t разрешающего задачу 2 1.2, необходимо вычислить вариацию функционала на движениях системы (3.3.1) при управлениях U- Ct-Ctjju-), Имеем: Функционал (3.3,3) требуется минимизировать при ограничении Из равенства (3.3.5) получаем зависимость между вариациями fy(bp) движения у%/" и ty) управления V(t,ju.) Далее вводим ҐІ -мерную непрерывно-дифференцируемую вектор-функцию ifte) , и проделав все действия, аналогичные в параграфе 3.2, получим уравнения: Таким образом, для определения оптимального управления 1s Ct,juj получим следующую систему интегро-дифференциальных уравнений: Как было указано выше, решение этой системы штегро-дифференци-альных уравнений можна найтш, опираясь на исследования flO, II, 14, 18, 25j . Из этих рассуждений вытекает следующий итерационный процесс построения управляющих воздействий CICtya) и 0-(t,ju) оптимальных по Штакельбергу и. разрешающих задачу 2.1,2. Сначала определяется оптимальная пара управлений - Ct) & 6) линейной задачи; (3.2Л), (3.1.2), (3.1.3) и вычисляется оптимальное движение xCo)Ctjyj, 0. ), %J при u=u(%)tt vf te) и начальном условии XCt0) X0 . Это движение приходит в точку Вдоль движения X. Ct,jU,cL 0),11 О)J составим; систему уравнений в вариациях (3.3.1) Вариация (rUU,ju) управления определяется при решении задачи 2.1.I с крае выми условиями и(о)-иС{) =-0 . Далее следует решить такую вспомогательную задачу:: найти такие управления CCzUCtt/u,iXjf )J и V- U-Ct,jA)_ t которые переводят систему (3.3.1) из положения в положение при условии мини- мума функционалов (3.1.2), (3.3.3). При этом управляющее воздействие С4=СС ct/jt/, )) игрока нижнего, уровня определяется формулой (3.3.2), а управляющее воздействие "2Л ( ju) игрока верхнего уровня - как решение системы интегро-дифференциальных уравнений 3.3.6). На следующем шаге управления С/- fc/juj и tJ- faj11) берем за исходные и повторяем описанный процесс и так далее. В резуль-тате получим последовательность непрерывных управлений t fef4) и V- Ct,ju) 9 которая при достаточно малых значениях JK , Q/u{-/U0C?)) , сходится равномерно к управлениям С/ fe/ju) и Теорема 3.3.1.

Пусть выполнены условия (2.1 - 2.ІУ). Тогда пара управлений {(jffaju)/IrGtyl} t где CJ Ct,ju.) определяется формулой (3.3.2), a t (t,jLt) - удовлетворяет системе интегро-дифферен-» циальных уравнений (3.3.б), является решением квазилинейной иерархической игры (3.1.Г) - (3.1.3), оптимальным: в смысле Шта-кельберга. Эту задачу можно трактовать так же, как и задачу параграфа 2.6 с той лишь разницей, что функционал (3.4.3), минимизируемый игроком верхнего уровня, содержит ограничение на вторую, координату вектора состояния. I» Решение линейной задачи Полагая в (3.4.1) J O , получим; линейную, систему: с функционалами (3.4.2), (3.4.3). Вычисляем необходимые данные. Имеем: З Показано, что из существования и единственности оптимального решения в линейном случае вытекает существование и, единственность оптимального решения в квазилинейном случае (при достаточно малых значениях параметра). 4. Разработаны итерационные методы построения оптимальных программных управлений игроков. Показано, что оптимальные управления при достаточно малых значениях параметра являются равномерным пределом последовательности оптимальных решений некоторых вспомогательных линейных иерархических задач управления. Для игр типа (I) и (П) эти вспомогательные задачи сводятся к системе ли-» нейных интегральных уравнений Фредгольма второго рода с вырожденным ядром и, следовательно, в конечном итоге к системе линейных алгебраических уравнений с переменной неоднородностью, которая зависит: от нелинейных членов в уравнениях движения и номера итераций. Для игр типа (Ш) эти вспомогательные задачи сводятся к системе линейных интегро-дифференциальных уравнений с переменной неоднородностью. 5 Решение рассматриваемых задач получено в завершенном виде, допускающем em аналитическую или численную реализацию на ЭВМ в конкретных прикладных задачах. Работоспособность методов решения квазилинейных иерархических игр, обоснованных в диссертации, иллюстрируются на модельном примере.

Для двухуровневых иерархически игр, динамика которых на заданном конечном промежутке времени описывается квазилинейными дифференциальными уравнениями, разработаны методы построения оптимальных по Штакельбергу программных управлений. В зависимости от платы и граничных условий рассматриваются игры следующего типа: (I). Иерархическая игра со свободным, правым концом. Задано начальное состояние управляемого процесса, конечное состояние произвольно. Игроки формируют оптимальные управляющие воздействия, последовательно минимизируя квадратичные функционалы, интегральная часть которых зависит: от их управляющих воздействий и не зависит от фазовых координат. (П)- Иерархическая игра с закрепленным; концом. Задано начальное и конечное состояние управляемого процесса. Игроки формируют оптимальные управляющие воздействия, последовательно минимизируя интегральные квадратичные относительно их управляющих воздействий функционалы, которые не зависят от фазовых координат. (Ш). Иерархическая игра с закрепленными концами типа (П), но при условии, что интегральный функционал, оценивающий качество управления игрока верхнего уровня, квадратичен относительно фазовых кооірдинат и управляющих воздействий игроков.

Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх Мухтаров Магзум

Метод решения задача I.I.I в случае квазилинейного объекта

Итерационная процедура вычисления оптимального управления в квазилинейном случае

Метод: последовательных приближений решения задачи 2.1.1

Метод решения квазилинейной задачи

Похожие диссертации на Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх