Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Сергеева Мария Юрьевна

Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности
<
Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Сергеева Мария Юрьевна. Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности : Дис. ... канд. физ.-мат. наук : 05.13.17 Москва, 2005 123 с. РГБ ОД, 61:06-1/415

Содержание к диссертации

Введение

ГЛАВА I. Определение и свойства гарантирующих равновесий 17

1. Постановка задачи 17

2. Определение равновесия 20

3. Свойства равновесия 28

3.1. Максиминные стратегии и гарантии 28

3.2. Устойчивость 31

3.3. Полнота 32

4. Сравнение с равновесием Нэша-Слейтера 35

ГЛАВА II. Достаточные условия существования равновесий 39

5. Существование равновесий с однозначной реакцией игрока верхнего уровня 39

6. Достаточные условия существования в случае однозначного отображения 43

6Л. Основная теорема 43

6.2. Коэффициентные критерии для линейно-квадратичной игры 54

7. Построение структуры множества контрстратегий для неоднозначной реакции Центра 65

8. Достаточные условия существования неоднозначной реакции Центра и GG-гарантирующего равновесия 72

9. Коэффициентные критерии для нетривиальной линейно-квадратичной игры 79

ГЛАВА III. Численная реализация гарантирующих равновесий 92

10. Вычисление гарантирующих равновесий для линейно-квадратичной игры 92

11. Тестирование численного решения 99

Заключение 108

Бибилиографический список

Введение к работе

Актуальность. Многообразные проблемы, возникающие в процессе деятельности человека, требуют их исследования с применением математических методов. И при этом уже на этапе содержательной постановки научной проблемы, связанной с указанными выше сферами деятельности человека, зачастую становится ясно, что в основе этой проблемы лежит некоторое противоречие, конфликт. Например, большинство проблем в социальной и политической жизни возникают из-за конфликтов между начальником и подчинённым, между социальными группами, объединениями, партиями и т.п.

При более глубоком анализе поставленной научной проблемы, как правило, выясняется, что отношения между «участниками» противоречия или конфликта могут быть с той или иной степенью достоверности описаны с использованием средств теории исследования операций. При этом в зависимости о г характера исследуемой проблемы может быть привлечён математический аппарат теории оптимального управления, теории игр, теории вероятностей и статистики. Конечным результатом исследования являются рекомендации для принятия решения ответственным лицом.

В последние годы оформилось общее название научного направления, в рамках которого ведутся исследования по управлению сложными системами -теоретические основы информатики. Такое название обусловлено тем, что одной из ключевых проблем в процессе исследований является проблема информационной неопределённости и её учета.

В указанном только что научном направлении к настоящему времени уже сложилось чёткое понимание общего объект исследования. Таким обьекгом является сложная система управления. В такой системе, как правило, фигурируют несколько активных сторон (активность понимается как наличие реакции на внешнее воздействие), что приводит к конфликтному характеру процесса принятия решения. Кроме того, процесс принягия решения может происходить в условиях неопределённости (неточное знание возможностей сложной системы, нечёткая постановка целей, неточности в передаче информации и т.п.).

Значительное число сложных систем управления характеризуется иерархической структурой. Исследование таких систем начиналось на основе одного из направлений в исследовании операций, связанного с изучением минимаксных задач, которыми занимались В.Г. Болтянский, Т.К. Виноградова, Г.В. Гай-шун, Л.Г. Турин, В.А. Горелик, В.Ф. Демьянов, Б.Ш. Мордухович, Е.М. Перво-званский, И.С. Столярова, В.В.Федоров, А.А. Чеботару и другие.

Важным классом минимаксных задач являются задачи управления со связанными переменными, когда управление одной из систем представляет собой многозначную реакцию на управляющее воздействие другой системы. В этом случае минимакс дает гарантированную оценку за весь период функционирования систем. Эти задачи возникают, в частности, при изучении иерархических

WC НАЦИОНАЛЬНАЯ БИБЛИОТЕКА і

систем и рассмотрены В.А Гореликом, М.А. Гореловым, А.Ф. Кононенко, Н С. Новиковой, А.Ф. Таракановым, В.В. Федоровым.

При изучении иерархических систем применялся и игровой подход. Систематическая разработка вопросов теории иерархических игр начата Ю.Б. Гер-мейером и Н.Н. Моисеевым, которые определили решение иерархической игры, близкое по сути к решению по Штакельбергу. Была установлена структура решений, связанная с так называемыми стратегиями наказания. В дифференциальных играх данный подход активно использовался И А. Вателем, Р.А. Ведерниковым, В.А. Гореликом, Т.Н. Данильченко, Ф.И. Ерешко, А.Ф. Кононенко, Н.С. Кукушкиным, И.С. Меньшиковым, К.К. Мосевичем, Е.З. Мохонько, Н.С. Новиковой, П.В. Фоменко, А.Д. Халезовым, В.В. Чумаковым и другими. Принцип Штакельберга стал основой исследования иерархических систем зарубежными учеными.

Особенностью многих исследований иерархических дифференциальных игр является применение к их решению теорем типа принципа максимума Л.С Понтрягина. Вследствие отого управления игроков ограничиваются в основном только функциями времени.

Дальнейшее исследование иерархических игр связано с рассмотрением на нижнем уровне иерархии не менее двух игроков, что порождает проблемы выбора игроками правил рационального поведения. Эти правила были перенесены из классической теории игр с ненулевой суммой и породили бескоалиционный, коалиционный и кооперативный варианты иерархической игры. В этом направлении следует отметить исследования В.И. Жуковского и Э.М. Вайсборда, которые достаточно полно изучили различные варианты иерархической игры трёх лиц (без неопределённости) с правом первого хода у игрока верхнего уровня. Существенным обстоятельством является зависимость стратегий игроков не только от времени, но и от реализовавшихся значений фазовых координат. Это стало возможным благодаря подходу, основанному на предложенном академиком Н.Н. Красовским объединении динамического программирования с методом функций Ляпунова и позволяющему в ряде случаев указать коэффициентные критерии существования решения и построить их явный вид.

Характерной чертой многих игровых задач является наличие таких параметров управляемой системы, выбором которых игроки распоряжаться не могут. Появление таких задач связано с тем, что сложные системы, как правило, взаимосвязаны с внешним миром, что обязывает учигывать не только механизмы функционирования самих систем, но и их взаимодействие с помехами, возмущениями и другими неопределённостями. Изучением таких систем занимается новое направление теории дифференциальных игр - теория дифференциальных игр в условиях неопределённости

При этом выделилось два подхода к изучению игр в условиях неопределённости, формализованных в виде антагонистической игры с векторной функцией выигрыша. Первый основан на обобщении понятий минимаксной и мак-

симинной стратегий и активно разрабатывается в России В.И. Жуковским и ею учениками А.Е. Бардиным, Г.И. Житомирским, В.А. Матвеевым, В.В. Мухиным, И.В. Чернявским и другими. Независимо от них аналогичные исследования ведутся в Италии и Японии. Второй подход основан на обобщении понятия векторной седловой точки.

Проявление фактора неопределенности в реальных иерархических системах весьма многообразно - неопределенность, связанная с процедурой принятия решения, различная информированность подсистем о внешних параметрах, о параметрах системы и др. Многообразие возникающих здесь ситуаций определяется порядком ходов участников игры, их информированностью друг о друге, характером внешних параметров (неопределённые, случайные) и т.п. Во многих исследованиях по иерархическим играм неопределённость имеет, как правило, локальный характер, что позволяет отдельным игрокам использовать информацию о возможных ее' реализациях. Практически это сводится к следующим моментам: информированный о неопределенности игрок сворачивает свою функцию выигрыша, ориентируясь на наихудшую для себя реализацию неопределённости (то есть минимизирует выигрыш по неопределённому параметру), либо ориентируясь на математическое ожидание неопределённости При передаче информации другому игроку производятся те же свертки.

Однако в случае наличия нескольких критериев (выигрышей) более целесообразным представляется использование векторных гарантий (от неопределённости), то есть аналогов векторного максимина или векторной седловой точки. В рамках же исследования векторных гарантий в дифференциальных играх при неопределённости иерархические игры пока не рассматривались.

Целью работы является построение математического аппарата для исследования бескоалиционного варианта иерархической дифференциальной игры в условиях неопределённости с правом первого хода у игроков нижнего уровня. При формализации векторных гарантий дифференциальной игры в условиях неопределённости используется аналог векторной седловой точки, объединенный с концепцией равновесного решения иерархической игры. Указанная концепция основана на принципе Штакельберга.

Достижению поставленной цели способствует решение следующих задач:

построение принципа равновесного гарантированного результата - гарантирующих равновесий;

изучение свойств гарантирующих равновесий;

построение достаточных условий существования гарантирующих равновесий в случае однозначной и неоднозначной реакции лидера, нахождение коэффициентных критериев для линейно-квадратичного случая;

численное исследование гарантирующих равновесий по коэффициентным критериям.

Таким образом, объект настоящего исследования - бескоалиционный вариант иерархической дифференциальной игры трёх лиц в условиях неопреде-

лённости с правом первого хода у игроков нижнего уровня.

Предметом исследования является принцип равновесного гарантированного результата в этих играх.

Методологическую основу настоящего исследования составляют выпуклый анализ, теория матриц и систем дифференциальных уравнений, методы и подходы теории дифференциальных игр и многокритериальных задач, методы и принципы теории оптимизации и оптимального управления, подход к построению достаточных условий, основанный на объединении метода функций Ляпунова с динамическим программированием.

Научную новизну работы составляют результаты исследования класса дифференциальных игр трёх лиц, где имеет место внешний неконтролируемый неопределённый фактор. Игра является децентрализованной, так как правом первого хода обладают игроки нижнего уровня, действующие каждый в своих интересах. Такая постановка задачи соответствует бескоалиционному варианту игры. Существенным моментом является нетривиальное! ь рассматриваемой игры, то есть учитывается многозначность в контрстратегиях лидера и непредсказуемость его действий для игроков нижнего уровня. Поэтому важной особенностью настоящего исследования является учёт реализации любой контрстратегии лидера из целого множества, что ставит игроков нижнего уровня перед проблемой учета дополнительного неопределённого для них параметра. Именно в отношении такого вида неопределённости следует рассматривать понятие "гарантирующий" в определениях исследуемых равновесий.

Основные результаты диссертации, выносимые на защиту, состоят в следующем:

1) сформулированы принципы гарантированного результата бескоалици
онного варианта иерархической дифференциальной игры трёх лиц в условиях
неопределённости - определения гарантирующих равновесий:

обобщённое определение гарантирующих равновесий,

определение равновесий Штакельберга-Слейтера, Штакельберга-Парето и Штакельберга-Лжоффриона для частного случая исследуемой игры при однозначной реакции лидера,

определение гарантирующего равновесия при неоднозначной реакции лидера;

  1. сформулированы и доказаны свойства гарантирующих равновесий;

  2. выведены достаточные условия существования гарантирующих равновесий и коэффициентные критерии в линейно-квадратичном случае.

Практическая ценность исследования заключается в прикладной актуальности рассмотренного класса игр. Такими играми моделируегся множество реальных ситуаций: управление многоуровневым производством в меняющихся экономических условиях с предоставлением экономической свободы в принятии решений по схеме "снизу-вверх"; осуществление командования военными действиями при неизвестных действиях противника; поддержание экологического баланса в природе при неопределённых природных факторах (напри-

мер, районная администрация следит за эффективным поведением вредного производства и оказывает поддержку сельскому хозяйству, при этом неопределённые природные факторы могут усилить вредное воздействие производства, что повредит всем элементам системы) и др. Настоящее исследование позволяет предложить эффективное решение указанных проблем, а в случае получения соответствующих количественных характеристик в ряде случаев возможно найти и численное решение.

Апробация работы. Результаты докладывались на научно-практических конференциях молодых ученых Балашовского филиала Саратовского государственного университета им. Н.Г.Чернышевского (Балашов, апрель 1999-2001, 2004, 2005 гг.), научно-методических семинарах кафедры информатики, на аспирантском объединении Балашовского филиала филиала Саратовского государственного университета им. Н.Г.Чернышевского (Балашов, 1999-2001, 2004, 2005 гг.), на международной конференции «Компьютерное моделирование 2003» в Санкт-Петербургском государственном политехническом университете (Санкт-Петербург, 2003 г.), научно-практических конференциях Балашовского филиала Саратовского государственного социально-экономического университета (Балашов, 2003-2005 гг.), научно-методических семинарах кафедры прикладной математики и информатики Борисоглебского государственного педагогического института (Борисоглебск, 2005г.). Кроме того, результаты исследования апробированы с помощью численного эксперимента, описанного в диссертации.

Основные результаты диссертации опубликованы в 6 печатных работах.

Структура работы. Работа состоит из введения, трех глав, заключения и списка использованной литературы.

Определение равновесия

Для формулировки равновесия в игре (1.1) рассмотрим вспомогательную иерархическую дифференциальную игру двух лиц (без неопределенности): {1,2},S, {Ми Щ, {JiUbU2,h )}Mfl). (2.1) Управляемая система X описывается дифференциальным уравнением где S- фиксированный момент окончания игры, (tt,x )e[0,&)xR" - начальная позиция.

Множества стратегий игроков имеют вид: Ux={Ux + ufaх, u2)\ux{t,x, u2) = Ql(t)x + P(t)ub ЯШ P(t)eCmxn[0,S\}, U2={U2+u2{t,x)\ u2(t,x) = Q2(t)x, Q2(t)eCmU0,&\}, Выигрыш /-го игрока определен функционалом .7,(U\, U2, ґ ,х„)-В этой игре игрок нижнего уровня иерархии делает первый ход и применяет стратегии U2 из множества (1А2. Игрок верхнего уровня иерархии делает ответный ход и использует контрстратегию U\ из множества U\.

Естественно, что для получения наилучшего результата лидер в ответ на стратегию и2є(ІА2 осуществляет выбор своей контрстратегии из множества контрстратегий ,( 2) = .( 2) ,1 ( ( 2), 2, , ) 7,((7,, , , ) 6}.

В общем случае этот выбор следует считать неоднозначным. Решением по Штакельбергу [41] игры (2.1) называется ситуация {0хфі),и 2) такая, что для любой начальной позиции {tt,x,)&[0,ff)xR 1 выполняется неравенство J2{Ux{Ul),UlJ„x J2{Ux{U2), U2, /., ,), иі(и2)єЩи2), U2eM2.(2.2)

Здесь первым решение принимает игрок нижнего уровня, исходя из неравенства (2.2). При этом он ориентируется на благожелательную поддержку лидера, то есть выбор лидером наилучшей для игрока нижнего уровня контрстратегии. Это позволяет игроку нижнего уровня избавиться от неоднозначности ответной реакции лидера.

Проанализируем решение Штакельберга вспомогательной игры с целью выявления способа его переложения на исследуемую игру (1.1).

Из неравенства (2.2) видно, что стратегия U2 в паре с контрстратегией UX{U 2) доставляет максимальное значение J U U XU J ) функции выигрыша Ji{U\{U2), U2, J,, »), то есть ии,Ф 2іи 2,К,хх) max J2{UX(U2), U2, /., ) = max ЫЩи;),и;,и,хт), (2.3) ((/,( ), )6(((/,((/1), )} где для каждой контрстратегии 0\(U2)e l4](U2) существует "своя" стратегия и 2 eArg max J2(Ui(U2), U2, / , ,). U 2 Є.1І2

Замечание 2.1. Равенство (2.3) устанавливает практический способ нахождения решения по Штакельбергу вспомогательной игры (2.1). Им являются две последовательные операции: 1) для каждой фиксированной контрстратегии U\{U2) находится страте гия U2, удовлетворяющая следующему условию: тахУ2(/,(/2), U2, /.,x.)=J2(I/,(/ )f/2 , , ); в результате получаем множество стратегий U 2; 2) среди всех пар (U\(Ul),U ), полученных на предыдущем этапе, нахо дим такую, чтобы выполнялось условие: max J2(Ui(Ul)iU2,K,x,) = J2(Ul(U;),u;,tlt,x,).

Переходим к формализации решения игры (1.1).

Согласно правилам игры, игрок верхнего уровня обладает достоверной информацией о выборе стратегий игроков нижнего уровня V%uU-n.. На этом основании можно утверждать, что, выбирая контрстратегию для пары стратегий ИГрОКОВ ПИЖНеГО УРОВНЯ (U2\,U22) C -2\X1 22, Центру ВЫГОДНО ИСПОЛЬЗО вать стратегии из подмножества контрстратегий Щи2х,и22)= иу{и и12)єЩ /,( ,(6/2,, 22) 21 22. ) 1( 1 21.. .) (2-4)

Как и в случае со вспомогательной игрой, это множество не обязано состоять из одного элемента.

Формируя подмножество контрстратегий (Li\(U2\ U2i) для каждой пары (ЕУ2і,С/22)є%іХ%2 Центр тем самым создает отображение R: W2lx%2- /,, то есть каждой паре (/2і,6/22)є%іх%2 ставит в соответствие элементы множества %(6 1,6/22) (в общем случае отображение многозначно). Следуя традиции, назовем это отображение реакцией лидера.

Учитывая также полную информированность игроков нижнего уровня о множестве стратегий и функции выигрыша Центра, естественно утверждать, что они обладают информацией о способе формирования Центром подмножества контрстратегий 2 (6 ,,6). Поэтому при выборе своих стратегий игроки нижнего уровня должны учитывать возможность реализации любой контрстратегии лидера уже не из множества (Ы\, а из подмножества Wi(/2i,t/22).

При этом все игроки должны дополнительно учитывать возможность реализации любой неопределенности.

Равенство (2.3) и замечание 2.1 позволяют обобщить решение по Шта-кельбергу вспомогательной игры до решения иерархической игры (1.1). Естественно, необходимо учесть этапы процесса построения любого решения для двухуровневых иерархических систем в условиях неопределенности, описанные в параграфе 1: 1) в качестве отношений между игроками нижнего уровня иерархии рас сматривается бескоалиционный вариант, поэтому в определении решения будем использовать один из принципов бескоалиционных отношений - ана лог равновесия по Нэшу; 2) так как лидеру при выборе контрстратегии из подмножества CU\{U2\,U22) необходимо доставить функциям выигрыша игроков нижнего уровня возможно большие значения, то для этих целей используем максимум по Слейтеру; 3) для определения принципа гарантированного результата для игроков при реализации любой неопределенности используем векторную седловую точку.

Устойчивость

Свойство 3.3. SS-гарантирующее равновесие устойчиво к отклонению от него отдельного игрока (при фиксированной неопределенности) Доказательство. С С С

Лидеру не выгодно отклоняться от стратегии равновесия /, (U 2l,U22), так как согласно (2.4) его выигрыш при этом увеличиться не может. Игрокам нижнего уровня не выгодно использовать стратегии, отличные от равновесных в силу неравенств (2.5)-(2.6).

Свойство 3.4. SS-гарантирующее равновесие динамически устойчиво, то есть четверка (Iff(и21,и22),и 22 ) остается SS-гарантирующим равновесием в игре (1.1) при всех t E[tt;ff\, где начальная позиция заменена новесием в игре (1.1) при всех t(E[t.;3\, где начальная позиция заменена на (/, (0), если -(0, t 3y -решение системы Е. Справедливость свойства 3.4 сразу следует из определения 2.1, где требуется, чтобы одна и та же четверка (Iff (Uf U Mii ii s) удовлетворяла требованиям 1, 2 и 3 определения 2.1 для любых начальных позиций (f,, ,) є [О хД", в частности и для (t, (0), так как (/, Л( ))є[0,«9)хДя.

Таким образом, свойство динамической устойчивости четверки (/ (/1,, 2),t/ ],f/ 2» ) означает, что эта же четверка остается SS-гарантирующим равновесием в течение всей игры (в процессе изменения игры с течением времени).

Аналогичные свойства, очевидно, присущи всем KL-гарантирующим равновесиям, введенным в определении 2.2.

Свойство 3.5. Определение SS-гарантирующего равновесия достаточно полное, так как включает, как частные случаи, понятие седловой точки, равновесие по Нэшу, решение по Штакельбергу, векторной седловой точки по Слейтеру (из теории игр), максимума и минимума по Слейтеру (из теории многокритериальных задач).

Доказательство.

Действительно, понятие седловой точки получаем в случае, когда в игре (1.1) участвует лишь один игрок. Пусть это игрок верхнего уровня, то есть %i=%2=0 и критерии J2\ и У22 отсутствуют. Тогда от определения 2.1 остается лишь требование 3, которое переходит в неравенство HU Zs,t„xa) {U ,Z,t.,x,), VZzZ, а согласно (2.4) при подстановке Z=ZS получаем MU ,ZS, t„x,) J, (UuZs,t„x,l\?Ux = Uh Объединение этих двух неравенств означает, что пара (/j ,Zs) является сед-ловой точкой антагонистической дифференциальной игры I, {«/i,2),J([/,Z,/„x.)), гдеЕ- х = f(t,x,u z),x(Q = x .

Равновесная по Нэшу ситуация получается, если в игре отсутствует неопределенность (то есть 2=0) и участвуют лишь игроки нижнего уровня. Тогда критерий J\ отсутствует, а от определения 2.1 остается только требование 1, которое предстает в виде J2X(U 2X,U 22,t„x,) J2x(Ulu Щг,К,х,\ Vt/2i6%i, MUn.U t.tX.yzMU Un, .Л), Vt/22e%2. Это означает, что пара (V2X,U22) является ситуацией равновесия по Нэшу дифференциальной игры ГДЄ =/( , ) )

Понятие решения по Штакельбергу получаем, если в игре отсутствует неопределенность и один игрок нижнего уровня, то есть (U22=Z=0. Тогда требование 1 определения 2.1 переходит в требование существования для каждой контр стратегии /і(/2і)єЗД/21) стратегии U\x, при любых 1/2Хєї/2Х удовлетворяющей неравенству iM( 2i№V-0 MUx(U2l),U2], /., ). (3.7)

Далее все пары (1//(1/ ),1/ ), удовлетворяющие неравенству (3.7), объединяются во множество {(Ui(U2\),V 2X)}. Требование 2 того же определения переходит в неравенство J2i(Uf(U uK,x,) J2i(Ul{U;i) i x.X (3.8) верное при V(//(/J1),t/Jl)e{(t/J(Uj,),t/;,)}-Объединяя (3.7) и (3.8), получаем: Ыи?(Щх),и%хЛ,х,) (и{{и2{),и2и t.,x.\ VU2ieti2b Ut(U2l)e%(U2l). (3.9) Это означает, что пара (Ut (U XU ) является решением по Штакельбергу иерархической дифференциальной игры (X, {%, С1Л2\), Ji{U,, U2\, К,х.), JifflMu ., .) , где 2 x=f(t,x,ul,u2i),x(tir)=x .

Понятие векторной седловой точки по Слейтеру получаем, если C142\=(U22=0 и отсутствует критерий J\. Тогда требование 1 определения 2.1 исчезает, а требование 2 этого же определения переходит в требование несовместности системы неравенств: MU Zs, tt,x,) J2j{UuZsJ„x.), \/Ute%J=U2, или J2(U?,ZS, t.,x,)j2 (UuZsJ„xt), Vt/,G . (3.10) Требование 3 того же определения переходит в требование несовместности системы неравенств J2j(U?,Z, t.,x,) J2J(U?,Zs,t„xt), VZe0,j=l,2, или J2(C/f,Z, tt,x,)j2 {Uf\Zs,t„xt), VZeZ (3.11) Объединяя (3.10) и (3.11), получаем: J2(U Z, t„xt){.J2 (f/f ,ZSJ.,K) J2 (UuZsX,xt% VC/ie«/lf ZeZ Таким образом, пара {Ux ,Zs) является седловой точкой по Слейтеру антагонистической дифференциальной игры с векторной функцией выигрыша (2, {rl4uZ},J2(UhZ, /., ) , где 5 x = /(/,x,w,,z),x(0 = Понятие максимума по Слейтеру получаем в случае отсутствия неопределенности (0=0), критерия J\, и при (IA1\=14.22=(Z. Тогда от определения 2.1 остается лишь требование 2, которое переходит в требование несовместности системы

Достаточные условия существования в случае однозначного отображения

Конкретизируем игру (1.1). Пусть допустимые стратегии игроков и неопределенность имеют вид С/, - щ (t, x)=Q0 (0 x+Qi, (0 и21 {U х)+ Qn (О «22 О, х), Uy4-Uy{Ux)=Qy{t)x(j=\t2\ Z+z{t,x)=P(f)x, (6.1) где матрицы Qt-(0,(/=0, 11, 12, 21, 22), P{t) є С„хп[0; Я\.

Система S описывается дифференциальным уравнением X —A (t)x+ М+ ІІ2І+ ІІ22+ Z, (6-2) а функции выигрыша игроков определены функционалами: MUMuUnZ, h,xt)=x {S)C, x(S)+ s + \[x {i)Gxx{t)+ u[Du щ+ w[A »21+ «JA u22+z Liz]dt; (6.3) i. Jl\(U \,U2\,U22- ZJ„X,) = = x (S) C2 x(8)+ \[x (0 G2x{i)+ u 2lD22 u2i+ a 22 Аз «22+ sf L2 z] dt; (6.4) Лг( A Ab 22,2, «,X„) = = Xі () C3 x( 9)+ j[x (0 A X(0+ W2i A2 «21 + «22 A3 «22+ z L3 z] (# ,(6.5) 1, где матрицы d, G„ /,,-(/=1, 2, 3), A, A, Ai, A2, Аз, Аг, Аз - размерности мх/7, симметричны и постоянны.

Здесь в функциях выигрыша игроков нижнего уровня явно отсутствуют реализации стратегии Центра, то есть слагаемые типа u\D2\U\ и u\D3\U\ интегральных Частей фуНКЦИОНаЛОВ 2)( 1) 21 »t/22»2,f„X.) И J22(Ui,U2],U22-.Z, t„,xt) соответственно. Объяснение этому будет дано после исследования достаточных условий существования гарантирующих равновесий. Рассматривая неопределенность как четвертого добавленного игрока, введем для него функцию выигрыша J3(Ul,U2uU22,Z ,Xm, =j3iJl(UUU2UU22 tt,Xt)+j32J2l(UUU2iM22 ,tx,X + +frJ22(UiyU2],U22,Z, f.,x„). (6.6) Здесь = (/?„ 2,А),А+А+А = ЬА 0» = Ь2,3.

Достаточные условия построим по определению 5.3 с помощью динамического программирования, объединенного с методом функций Ляпунова. Для этого введем функции: dV W\(t,X,UU М2,М22,2, V) = + дх rdv \ Liv / (A(t)x + U\+ «21+ «22+ Z)+ + x G\x+ u\D\\U]+ u[D\u2i+ u\D2u22+ z L\z; (6.7) + x G2x+ 21 22 21+ u 22D2Zu22+z L2 z; W2]{t,X,R(U2uU22),U2\, U22,Z, K )= + rdV {A{t)x + R(U2\, U22)+U2[+ «22+ z)+ (6.8) 8V, + W22(t, X, R{U2\, U22), «2b «22, 2, V2): дх a (A(t)x +R(u2i, U22)+U2i+U22+ Z)+ (6.9) + x G3x+ u 2lD32it2i+ u 22D33u22+z L3z; dV3 (dV3 l3(t, X, «,, «2b "22, Z, V3, = - + (A(t)x + «i+ «21+ "22+ z) + x G(fi)X+ +д «;D„ «,+ /?, U\DX w21+ /?, «;D2«22+ + H2I Dx{j3)u2X+ u22D2Wu22+ z L{p)z\ (6.10) где G{/3) = ДС,, L{fi) = Р , Dm-№22+ D32, D2(/?)=#D23+#D33, I=I /=1 V, Vj (j=l,2) - функции Ляпунова-Беллмана.

Замечание 6.1. При рассмотрении свойств равновесий не было принципиальной разницы в использовании f/, либо R(U2X,U2\), так как /, =

R(U2t,U22\ н0 ПРИ построении данных функций это различие является принципиальным. Во-первых, одним из аргументов функции W\ является И), а не R(u2l, и22\ потому что отображение R(u2\, и22) не задано априори для Центра, а будет строиться для него, и как раз с помощью W\. Во-вторых, для функций Wi\ и W22 используется в качестве аргумента уже R{u2\, и22), что обусловлено требованием выполнения неравенств (5.3) и (5.4) в определении Штакельбер-га-Джоффриона и утверждением 5.1. В-третьих, для W одним из аргументов снова является щ, так как по правилам игры только лидер осведомлен о выборе игроков нижнего уровня, а неопределенность остается вне обмена информацией.

Перед построением достаточных условий установим одно вспомогательное утверждение. Утвераедение 6.1. Пусть ведение иерархической игры (1.1) возможно и четверка (V7, U2l, 022, ZG) такова, что:

1) для любой начальной позиции х )єі - х удовлетворяет тре бованиям 1 и 2 определения 5.1;

2) существует набор положительных чисел Р = (А, А, А), А + Pi + А = І такой, что min j,{ul,u\vul2 t. ,) = uv; ,vx22,zGlt.,x.,p) (6.11) при ограничениях (6.1) - (6.5) и любом выборе начальной позиции (t„x,)e[0,3)xR\

Тогда четверка (U ,1/ , 1/\2,2 ) является равновесием Штакельберга Джоффриона игры (1.1) и, согласно замечанию 5.2, равновесием Штакель-берга-Парето и Штакельберга-Слейтера.

Доказательство.

Так как требования 1 и 2 определения 5.1. выполнены, то, согласно замечанию 5.1, необходимо лишь показать, что из (6.11) следует минимальность по Джоффриону неопределенности ZG В задаче (5.5). Последнее верно на основании [58, С. 77].

Утверждение доказано.

Таким образом, построение равновесия Штакельберга-Джоффриона сводится, во-первых, к установлению самой возможности ведения иерархической игры (1.1) (игра возможна, если возможно построить однозначное о-тображение R(U2\,U22) для каждой пары (/21, 22) 1 ) и, во-вторых, к нахождению четверки (t/ f/jpt/ » ZG), удовлетворяющей (5.2), (5.3), (5.4) и (6.11).

Далее везде {/[= R(U ,1/ 2% в функции W\ для построения /, используется функция Ляпунова-Беллмана V, а для построения отображения R(U2],U22)-функция V.

Тестирование численного решения

Проверим найденное решение на оптимальность. Для этого нужно убедиться, что стратегии игроков, отличные от равновесия Штакельберга-Джоффриона, ухудшают выигрыши.

Вычислим функциюx(t) из уравнения (ЮЛ), учитывая (10.5). Получаем: х = х + q\(i)x + q2\(t)x + q?i(i)х + p(t)х, х(0) = 1. (П.1) Разделяя переменные, приходим к выражению: dx —=(l+?i {i) + qi\ (0 + qu(t)+p(t)) dU x(0)= 1. Обозначим: і /(0= /О + Ы + ОО + Ы + Ки)) (11-2) Учитывая начальную позицию, получаем решение дифференциального уравнения (11.1): x(t) = en \ (11.3) Обозначив J = J , подставим в функции выигрыша игроков страте \J3j гии (10.8) и это решение. Вычисления в среде MathCAD 2000 Pro дают следующий вектор выигрышей: (11.4) гу = V ) f 14.267 1 -4.856 22.231 10.600

Полученные таким способом значения выигрышей игроков в ситуации равновесия Штакельберга-Джоффриона отличаются от (10.9), что вызвано погрешностью вычислительных методов.

Далее выигрыши игроков находятся по подобной схеме: вычисляется функция (11.3) в конкретной ситуации {U\, Uiu С22» Z), а затем подставляется (11.3) и реализации стратегий из указанной ситуации в вектор выигрышей J. Все следующие ниже результаты получены в среде MathCAD 2000 Pro по этой схеме.

Проверим на оптимальность стратегию Центра / . Так как функционал J\(Uu Uiu U22, Z, t„x.) вогнутый no U\, то достаточно рассмотреть стратегии /i, достаточно близкие к U . В случае оптимальности изменение стратегии должно привести к ухудшению выигрыша Центра. Итак, согласно (6.32), рассмотрим функции вида: 1-і u\(t,x)= D\X (20 {fpc + D\ игх(t,x) + D2 ul2(t,x)% где коэффициенты Pj (j = 0, 1, 2, 3, 4) вычисленной численными методами функции 0 (t) подлежат варьированию для получения стратегий Центра, близких к U .

Далее приведены результаты вычислений. В таблице указаны варьируемые коэффициенты и соответствующие значения функции выигрыша Центра. Жирным шрифтом выделены оригинальные значения коэффициентов и выигрыша, вычисленные в процессе численного эксперимента.

Анализируя результаты тестирования, приходим к следующим выводам: 1) варьирование коэффициента Р0 приводит к заметному уменьшению выигрыша Центра, 2) изменение выигрыша Центра инертно при варьировании коэффициента P[i требуется большое увеличение значения коэффициента для изменения (ухудшения) выигрыша. 3) изменение коэффициентов Р2, Рг, Р$ не меняет выигрыша Центра. Таким образом, стратегия Центра /, реально оптимальна.

При проверке на оптимальность стратегии U первого игрока нижнего уровня в силу вогнутости функционала Jz\{Uu Ль С722, Z, / , ,) по / ! также рассмотрим стратегии U2\, достаточно близкие к U\x. Реализациями таких стратегий являются функции вида: Выводы: 1) даже незначительное варьирование коэффициента PQ резко уменьшает выигрыш первого игрока нижнего уровня; 2) изменение коэффициента Pi также ухудшает выигрыш, но не так значительно; 3) существенные изменения коэффициентов Р2, Рз, РА также приводят к ухудшению выигрыша первого игрока нижнего уровня. Таким образом, найденная стратегия первого игрока нижнего уровня U 1X также оптимальна.

Похожие диссертации на Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности