Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями Кошька Мариан

Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями
<
Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Кошька Мариан. Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями : диссертация ... доктора физико-математических наук : 05.13.01.- Москва, 2001.- 193 с.: ил. РГБ ОД, 71 02-1/124-9

Содержание к диссертации

Введение

Глава 1. Принцип максимума для задач оптимального управления с ограничениями общего вида 33

1. Постановка основной задачи 35

2. Вспомогательная задача. Локальный принцип максимума в ней . 39

3. Лемма об отсутствии сингулярностей 42

4. Семейство присоединенных задач 44

5. Конечнозначный принцип максимума 48

6. Глобальный принцип максимума 49

Глава 2. Применение методов теории управления в жестких системах для обыкновенных дифференциальных уравнений 53

1. Задача Коши для обыкновенных дифференциальных уравнений 62

2. Устойчивость решения задачи Коши 63

3. Разностные схемы 64

4. Жесткие системы 66

5. Метод введения управляющих параметров в скалярном уравнении 68

6. Введение управляющих параметров в системах уравнений . 70

7. Выбор оптимальных весов в методах Рунге-Кутта 71

8. Сингулярно-возмущенные уравнения 72

9. Методы вспомогательного уравнения 74

10. Задачи химической кинетики 77

11. Модельные примеры 79

Глава 3. Методы оценки решений в некорректных задачах линейного и квадратичного программирования 80

1. Различные формы задач линейного программирования 84

2. Двойственность в задачах ЛП 85

3. Устойчивость задач ЛП 88

4. Регуляризация неустойчивых задач 90

5. Обобщенная задача ЛП 90

6. Метод оценки решения задачи ЛП 91

7. Вычисление нормального решения 95

8. Непрерывный аналог метода сопряженных градиентов 96

9. Задача квадратичного программирования 97

Глава 4. Построение модели функционирования банка 100

1. Существующие методы моделирования банковской деятельности 100

2. Основные понятия и определения 102

3. Банковские операции и структура финансового рынка 105

4. Модель функционирования банка 108

5. Методы поиска допустимых решений в задачах оптимального управления 117

5.1. Модель типичного банка 118

5.2. Задачи оптимального управления 119

5.3. Задачи Понтрягина 121

5.3.1. Продолжение решений по параметру в задачах Ац, і = Ї73 121

5.3.2. Продолжение решений в задачах с фиксированным правым концом 123

5.3.3. Существование особых режимов 123

5.4. Метод изоклин в задачах управления 124

5.5. Фазовое ограничение 125

5.5.1. Кусочно-постоянная аппроксимация 126

5.5.2. Кусочно-линейная аппроксимация 127

5.6. Смешанное ограничение 128

5.7. Случай двух ограничений 128

Глава 5. Задачи оптимального управления основными металлопотоками комплекса 129

1. Математическое описание модели 129

2. Задача Ац 131

3. Ограничение по агрегатам 132

4. Ограничение по емкости склада 133

5. Существование нерегулярных траекторий в случае совместных ограничений по емкости склада и по агрегатам 133

Глава 6. Регуляризация вырожденной задачи оптимального управления 136

1. Уравнения движения. Постановка задачи 138

2. Принцип максимума (регулярный случай) 139

3. Регуляризация множителя Лагранжа 142

4. Нерегулярный принцип максимума 142

5. Задача о минимуме максимальной перегрузки 144

6. Вырожденный принцип максимума 144

7. Продолжение решений по параметру 145

8. Метод раскрытия неопределенности 145

Глава 7. Оптимальное движение самолетов в горизонтальной плоскости 147

1. Оптимальный вираж самолета в горизонтальной плоскости . 147

2. Принцип максимума 149

3. Задача А>ц 150

4. Определение геометрии оптимальной траектории 153

5. Нерегулярный принцип максимума 154

6. Особые режимы 156

7. Задача Л72 157

8. Задача Л73 158

9. Задача Л74 159

10. Вираж с постоянной скоростью 160

Приложение

Вспомогательная задача. Локальный принцип максимума в ней

Сначала рассмотрим некоторую вспомогательную задачу, для которой ыпишем необходимое условие слабого минимума, а точнее, необходимое словие стационарности — тт — -" — "» „ „„„„ „„„„,„„„,„5 Задача Б. цесь равенства (1.12), (1.13) — векторные, остальные записаны скалярным эразом. Слева от всех ограничений написаны соответствующие им множи-эли Лагранжа. Предположения. 1) векторы р, Qk Є Lo, q Є L ; остальные функции те же, что и в задаче А (но нет управления w). 2) смешанные ограничения (1-14)—(1.17) регулярны, т.е. для любых x(t), u(t), удовлетворяющих им, наборы вектор функций ще Р(х, и) = (, г/, С, У) суть левые части равенств (1.13), (1-14), (1.16), (1.12), ;го производная Р (х, и-) отображает «на». Локальный принцип максимума для задачи Б: Существует ненулевой набор А = (a,c,ip,fj,,m,h,fi,a), где а Є BrW f1, і 0, с Є R \ ф — функция ограниченной вариации, /is — неубывающие [епрерывные слева функции, /is( o) = 0; rn.h.p,a Є L\, h(t) 0, a(t) 0, акие что на исследуемой траектории (аг, гг) для функций ъшолняютея равенства [апомним, в чем состоит важное понятие стационарности для задач на экс-рему м с ограничениями. Пусть в некотором банаховом пространстве Z рассматривается задача: це g отображает Z в некоторое банахово пространство Y. Определение 1.4. Точка ZQ стационарна в задаче (1.20), если не суще-гвует z такого, что У г 0 F (ZQ, Z) 0 и z касательно в точке ZQ К множе-гву g{z) = 0. Ясно, что если в точке ZQ есть локальный минимум (в топологии, поро-:денной нормой), то она стационарна. Таким образом, стационарность явля-гся необходимым условием локального минимума первого порядка.

Как са-остоятельный объект свойство стационарности систематически выделялось изучалось в работах А.А.Милютина и А.Я.Дубовицкого. Отметим, что эчка ZQ может быть стационарна как при выполнении условия Люстерника /{ZQ)Z — У), так и при его отсутствии. Из сказанного следует, что для задачи Б стационарность есть необходимое шовие слабого минимума первого порядка. Теорема 1.6. Выполнение локального принципа максимума для точки ; , ir) в задаче Б эквивалентно тому, что либо она стационарна, либо для гее не выполнено условие Люстерника: Лок ПМ (стационарность ИЛИ «нет Люстерника»). Поскольку эта теорема не есть центр тяжести данной статьи, и в прин-дапе довольно хорошо известна, мы здесь обрисуем лишь общий план ее до-:азательства. Для нас основной интерес представляет импликация =. Предположим :начала, что на исследуемой траектории выполнено: а) условие Люстерника; б) 1 x0 0 1)1 + 1 (4 1)1 0 V в) \$ sx(x(t)t і) const 0 Vs. Тогда отсюда и из предположения Б2 вытекает, что все ограничения тиa неравенства имеют непустые конусы допустимых направлений [31], и эти юнусы, а также конус касательных направлений к пересечению ограничений іавенств записываются стандартным образом в виде линеаризации ограниче-:ий. В этом случае вьшолнение локального ПМ легко доказывается по схеме Іубовицкого-Милютина [31]. Согласно определению, стационарность означа-т, что конусы, соответствующие ограничениям, не пересекаются. Записы-аем это условие в двойственной форме (теорема Дубовицкого-Милютина): умма элементов из сопряженных конусов равна нулю (это равенство называ-тся уравнением Эйлера). Вид элементов из сопряженных конусов получается :ак обычно, умножением линеаризованных ограничений на соответствующие іножители Лагранжа, см. [31]. Здесь мы подходим к основному опасному моменту, состоящему в том, то a priori m,h,f3,a — элементы пространства !-,. Однако предположение 2 о регулярности смешанных ограничений гарантирует (см. ниже лемму .5) — ив этом и состоит сильнейшая упрощенность регулярной задачи но равнению с нерегулярной — что на самом деле га, h, /?, a — функции из L\. {алее, функционалы hj a priori сосредоточены на каждом из множеств Mf, О6, но т.к. h Є L]_, то, очевидно, hj сосредоточены на множествах М, т.е. ля них выполнены условия дополняющей нежесткости (1.19). Аналогично олучаем (1.19) и для а . Таким образом локальный ПМ получен7. Если же хотя бы одно из условий а), б), в) не выполнено, т.е. некоторые граничения вырождены, то это записывается (опять же стандартным обра-эм) в виде выполнения локального ПМ, в котором ненулевыми могут быть ишь множители при вырожденных ограничениях (так называемый выро-сденный локальный ПМ). Импликация = доказана. Замечание. Так как мы считаем, что x — f(x, и, і) Є L\, то a priori соответ-твующий равенству (1.13) множитель Лагранжа ф Є Loo- Но из уравнения )йлера (1.18) легко получаем, что почти всюду откуда вытекает, что ф на самом деле функция ограниченной вариации. )братную импликацию = мы здесь доказывать не будем. Отметим лишь, [то она, как и вся теорема 1.6, есть частный случай общей теоремы, относящейся к абстрактной задаче вида (1.20): вьшолнение уравнения Эйлера для очки ZQ эквивалентно тому, что либо ZQ стационарна, либо в ней не выполне-:о условие Люстерника. А выше было показано, что для задачи Б локальный Ш это и есть уравнение Эйлера. Докажем обещанную ранее лемму, которая, на наш взгляд, представляет : самостоятельный интерес. Лемма 1.5 (об отсутствии сингулярных составляющих).

Пусть си-тема функций {Ai(t)}, {B it)} ИЗ L равномерно по t линейно-позитивно езависима относительно набора множеств {М/}. Яусть mi, hj Є Lo из них hj 0 и сосредоточены на Mj, и при этом В доказательстве теоремы 1.6 в качестве (1.21) выступает уравнение Эй-ера, а точнее, его компонента по ш Доказательство. Напомним, что любой элемент m Є LJQ предста-ляется в виде m — ma 4- mc, где абсолютно непрерывная составляющая функционала m), a mc — сингуляр-ая составляющая — характеризуется тем, что для нее существует последо-ательность вложенных измеримых множеств п С [to, ]J, mes Zn — 0, таких то Vv Є LQO сосредоточен на каждом из множеств п при этом, зли функционал m был неотрицательным, то ma, тпс также будут неотрица гельными, если т был сосредоточен на некотором множестве М, то и та, тс юсредоточены на М и можно считать, что все п С М. (Теорема Иосиды-Сыоитта [42], в приведенной здесь форме она независимо была установлена также Дубовицким и Милютиным в [32]). Мы должны показать, что при выполнении условий леммы функционалы щ, hj не могут иметь сингулярных составляющих. Предположим противное, [то сингулярные составляющие есть, и сначала будем считать, что у функционала h\. Из РЛПН векторов Ai(t), Bj(t) относительно множеств Mj в силу пределения 26 следует, что существует й Є Lo такая, что )тсюда и из (1-21) получаем г Пусть \\hic\\ = 7 0, и функционал h\c сосредоточен на убывающей по ледовательности множеств п. Тогда для последовательности функций йп = = хе. из (1.22) и неотрицательности функционалов hj вытекает, что левая асть равенства (1.23) (hlc,Xen) = (hie, 1) = ИМ = 7 О, правая очевидно стремится к нулю. Противоречие. Таким образом, у hj ингулярных составляющих быть не может, т.е. все hj Є L\. При этом (1.21) риобретает вид: з Предположим теперь, что функционал ті имеет сингулярную составля щую, и пусть u(t) — такая функция из LQQ, ДЛЯ которой {mic,i/) — 1. В илу РЛПН векторов АІ(І) из определения 26 легко следует, что существует 1 Є Lo такая, что п.в. (Ai(t),ui(t) = v(t), и Vi 2 (Ai(t),ui(t)) = 0. Пусть функционал т\с сосредоточен на убывающей последовательности зюжеств п. Тогда, аналогично предьщущему, для йп — ХЕп Щ левая асть (1.24) стремится к 1, а правая — к нулю. Опять противоречие. Следова-ельно, функционалы гп{ также не могут иметь сингулярных составляющих, .е. все щ Є L\. Лемма доказана. Вместо условия Л Ф 0 в локальном ПМ можно брать такое условие нор-ировки: а + М + ІІ Не + Лі + ki 0, (1.25) .е. не включать в нее множители ф,т,/3 (отметим, что у нас фс =

Метод введения управляющих параметров в скалярном уравнении

Рассмотрим три варианта методов Рунге-Кутта четвертого порядка для эдачи Коши (2.4). Здесь мы ограничимся только одним шагом h г=1 Метод (2.21) называется явным методом Рунге-Кутта четвертого поряд-ц q, bi, a,ij — параметры метода [2, с.43]. Подобно явным методам Рунге-Кутта можно ввести неявные [2, с.43] 3 Если а - = 0 при г j, имеем явный метод типа (2.21). При ац ф 0 для j получаем диагонально неявный метод Рунге-Кутта, если хотя бы одно Наряду с методами (2.21), (2.22) рассмотрим явный метод Рунге-Кутта фядка р с управляющим параметром. Положим ;е щ — управляющий параметр, h — величина шага интегрирования. Для їтода четвертого порядка р = 4. В результате для задачи Коши (2.4) полу гм Здесь ki определяются по формуле (2.21). Из (2.24) следует, что предложен іая разностная схема является согласованной. Последнее означает, что при :тремлении шага h к нулю разностная схема совпадает с дифференциальной. Требование согласованности следует считать наиболее фундаментальным. Кроме того, для схемы (2.24) для умеренных значений щ и при достаточно іальїх h имеем Таким образом, для схемы (2.24) в классическом случае выполнено условие лпроксимации (2.13). Рассмотрим теперь тестовое скалярное уравнение [3, с.52] : применим к нему явный и неявный методы Эйлера Іетод Эйлера на базе схемы (2.24) приводит к соотношению гкуда следует, что при щ = а Этот момент является принципиальным, так как предложенная хема (2.23) на примере (2.24) значительно увеличивает границы рименимости явных схем в случае жестких систем ОДУ.

Разностная явная схема Рунге-Кутта четвертого порядка [2, с.43] приме-ительно к (2.26) дает оответствующее ограничение на шаг интегрирования согласно требовани-я устойчивости имеет вид з неравенства (2.32) следует оценка ha 2.7853, а для чисто мнимого а шучим h\a\ 2\/2 [2, с.54]. Для метода (2.24) получаем оценку накладывает аких-либо ограничений на шаг дискретности h. Рассмотрим теперь нелинейное уравнение [ля данного уравнения можно получить такую же оценку (2.33), положив схема (2.37) переходит в стандартный метод Рунге-Кутта ;твертого порядка. Решения, полученные по формулам (2.37), (2.38), могут служить в каче-ъе первого приближения в неявных схемах. Из схемы (2.37)-(2.38) можно получить все классические теоремы для !ных методов Рунге-Кутта любого порядка [63, с. 166-173, 198-210]. Начальный интервал интегрирования не ограничивает общности наших )ассуждений. Формулы (2.38) можно рассматривать как первое приближение для вы-іора весовых множителей (2.36). Положим щ = щ + v , где v — новое упра-Іление. Для фиксированного шага h можно ставить задачу по выбору v для іинимума локальной ошибки метода. Наиболее употребительным является следующий метод Рунге-Кутта че-вертого порядка [2, с.43] [ри фиксированном шаге интегрирования рассмотрим норму локальной шибки це т/1 — точное решение уравнения (2.4), a yi(ii, h) — решение, полученное аким-либо методом численного интегрирования типа (2.39). Рассмотрим теперь метод Рунге-Кутта, который на каждом шаге зависит г параметров Ъ г = 1,4: цесь / , г = 1,4, определяются по формуле (2.39). Предлагаемый метод (2.41) а, самом деле зависит от трех управляющих параметров. При фиксированном значении h ho рассмотрим задачу о минимуме ло-шьной ошибки \\E(ti, Л) в зависимости от выбора весовых коэффициентов , г = 1,3, при условии (2.41).

Вопрос применения схемы (2.41) сводится к трудоемкости решения задачи ітимального выбора весовых коэффициентов 6 , г = 1,3. Наиболее просто по-?авленная задача решается для тестового скалярного уравнения. Здесь вы- р весов проводится из условий устойчивости явного метода Рунге-Кутта, висящего от параметров. Исследования показывают, что введение управля-щих параметров расширяет область устойчивости явных методов. Решение задачи усложняется для системы нелинейных уравнений. Одна о наличие качественной информации о решении упрощает задачу. Напри-[ер, для диссипативных систем коэффициенты &з и 4 полагают достаточно [алыми. В результате задача сводится практически к выбору одного параме-ра, что в свою очередь позволяет оценить величину шага интегрирования з условий устойчивости метода. Различные модели локальных ошибок рассмотрены в работах [3, 53, 54, 63, 4]. На практике наибольшее распространение по оценке локальной ошибки олучил принцип Рунге-Кутта. Для этой цели вычисляют два решения с іагом h и h/2 и сравнивают норму их разности тметим, что принцип Рунге-Кутта имеет место, вообще говоря, лишь при остаточно малом значении h. Рассмотрим два скалярных уравнения, одно из которых содержит малую малярную функцию при производной редположим, что решение (2.43), (2.44) существует и единственно. Проинтегрируем уравнения (2.43), (2.44) методом Рунге-Кутта четверто-) порядка шись R(f), R(g) означает, что к правым частям (2.43), (2.44) применен зный разностный оператор Рунге-Кутта соответствующего порядка. Уравнение (2.45) представим в виде Іодставляя (3 из (2.50) в (2.48), получим интегрирования определяется из условия (2.46), т.е. из усло-ий устойчивости. Обозначим его через h\. Кроме того, имеется еще условие ипа hR(f). Пусть шаг, полученный в этом случае, будет h i. Положим ри достаточно малом g(/io єр) будет наблюдаться "всплеск" решения у\. На-дчие таких "всплесков" должно мотивироваться качественной информацией решении. В противном случае шаг интегрирования выбираем из условий эинципа регуляризации [62]. Положим h% — а\єо\і а 0) гДе а — параметр регуляризации. Тогда

Метод оценки решения задачи ЛП

Пусть нам дана задача ЛП Предположим, что система (3.26) совместна и функционал задачи (3.25) граничен на допустимых решениях системы (3.26). Рассмотрим строки матрицы А в качестве векторов Ч = ( Чі,аг2 --- Чп) г = 1,т. (3.27) Вообще говоря, векторы щ, і = 1,т, могут быть линейно зависимы. Считая теперь векторы щ, г = 1,гп, в качестве наблюдаемых величин, ы можем рассматривать матрицу А как матрицу наблюдений в факторном нализе [139]. Для целей нашего анализа вначале достаточно ограничиться етодом главных компонент, который дает единственное факторное решение. В результате применения метода главных компонент факторного анализа матрице наблюдений А получим следующую зависимость 1,/г, — факторы (обобщенные переменные). Заметим, что факторы Р некоррелированы между собой и удовлетворяют зловию нормировки Теперь мы постулируем линейную зависимость вектора С от выделенных акторов. Другими словами, разложим вектор С по базису Pj, г = 1,к Условие (3.29) позволяет легко определить коэффициенты разложения по ормуле (3.30) вычисляется по формулам (3.28). В силу единственности факторного решения коэффициенты fa, г = l,fc, іределяются единственным образом. Умножим теперь скалярно левую и правую часть уравнения (З.ЗО)на век-эр X калярное произведение (Р ,Х), г = 1,/г, можно вычислить из ссте ы (3.28). Действительно, В результате получаем оценку Здесь 6j — компоненты вектора В (3.26). Таким образом, доказана теорема. Теорема 3.20. Если в системе (3.26) матрицу А трактовать как матрицу тблюдении в методе главных компонент факторного анализа, то в результате получаем оценку вида (3.34)

Теперь рассмотрим более подробно сделанные нами предположения. . Совместность системы (3.26). Систему АХ = В (3.26) можно сделать совместной за счет возмущения равой части (3.26) де 6 — малый параметр. Кроме того, можно рассматривать нормальную систему для (3.26) ідесь символ означает транспонирование. Известно, что система (3.36) сегда совместна. С точки зрения вычислений форма (3.35) является более предпочтитель-ой в плане обусловленности системы (3.26). В случае (3.36) умножение на ранспонированную матрицу ухудшает обусловленность системы (3.26), ко-орая определяется как отношение модуля максимального собственного зна-ения к модулю минимального. При перемножении матриц число обусловлен-ости возводится в квадрат, т.е. це К — число обусловленности матрицы. . Ограниченность целевой функции. В рамках факторного анализа очень трудно оценить ограниченность ре-іения для задачи (3.25) и (3.26). Это можно сделать по формуле (3.24). . Линейная связь целевой функции с выделенными факторами. Рассмотрим расширенную матрицу наблюдений А\— ( , ). В результа-е применения метода главных компонент к матрице А\ получаем следующее акторное решение це факторы Pj, і = 1, к, в свою очередь являются линейными комбинациями ыбранной системы векторов С, а у j = 1,т: Все коэффициенты в формулах (3.37), (3.38) определяются в результате рименения вычислительных процедур метода главных компонент. Из формул (3.37), (3.38) следует линейность соотношения между вектором ! и выделенными факторами.

Следует заметить, что расширенная матрица наблюдений также позво-яет получить оценку целевой функции типа (3.34). Однако при этом возра-гает объем вычислительной работы. Таким образом, доказана следующая теорема. Теорема 3.21. Для линейной модели факторного анализа в рамках мето-а главных компонент целевая функция задачи (3.25), (3.26) является линей-ой функцией факторов, если рассматривать расширенную матрицу А как атрицу наблюдений. Примечание 1. Линейная зависимость типа (3.30) есть следствие приме-ения линейной модели факторного анализа. Постулирование линейной моде-и факторного анализа вовсе не отрицает наличие нелинейной связи между элевой функцией и векторами а , і = 1,га. Примечание 2. В процессе построения зависимостей типа (3.30) коэффи-иенты Д; (3.31) могут оказаться нулевыми. Последнее означает, что вектор не коррелирует с факторами Р , і = l,m. В рамках модели (3.37), (3.38) го означает, что уравнение для С (3.37) удовлетворяется тождественно, если эдставить РІ, і = 1, к, из системы (3.38) в выражение для С (3.37). В этом гучае вместо вектора С можно рассмотреть новый вектор С\ по формуле п;е индекс і фиксирован. За счет выбора вектора щ мы получим ненулевые ээффициенты РІ, і = 1, k. Примечание 3. Проблема собственных значений для симметричной ма-рицы наблюдений рассмотрена в приложении В. Оценка числа факторов вязана с вычислением собственных векторов указанной матрицы. :то введем сглаживающий функционал для операторного уравнения (3.45) ектор, минимизирующий сглаживающий функционал F(z), обозначим че-ез za. Тогда имеет место оценка [з неравенства (3.48) вытекает, что равнения (3.45) по отношению к малым изменениям исходных данных. Поиск минимума F(z) (3.47) можно проводить методом сопряженных гра-иентов.

Методы поиска допустимых решений в задачах оптимального управления

В теории оптимального управления принцип максимума является един-ъенным аппаратом при помощи которого находится решение задачи или :следуются его свойства, если не учитывать приближенные вычисления. Однако в формулировке принципа максимума для задач с фазовыми и юшанными ограничениями появляется мера и функциональные множите-і Лагранжа. Мера является более сложным объектом, чем функция. Изуче-іе ее свойств позволяет изучить качественные особенности поставленной дачи. Хорошо известно, что принцип максимума сводит первоначальную ютановку к краевой задаче. Трудности краевой задачи усугубляются неходимостью определения геометрии оптимальной траектории — наличие ачков сопряженных переменных и изучение структуры множества актив-IX индексов для ограничений типа неравенств. В настоящей статье на примере модели из банковской системы [20] прово ится качественный анализ принципа максимума, который сформулирован в аботах [129]—[130]. Кроме того, предлагается метод для построения допустимого управления за счет снижения размерности краевой задачи до однопа-аметрического семейства. Если функционал меняется монотонно, то такой одход дает в целом качественную картину оптимальной траектории. Это озволяет проводить многовариантные расчеты поиска "квазиоптимальных" раекторий. При этом можно проверить полученное решение на оптималь-ость с помощью принципа максимума. .1. Модель типичного банка Банк считается типичным [20] если: при проведении кредитно-депозитной эятельности он не зависит от кого-либо, кроме своих владельцев; юридиче-шй статус и множество доступных для проведения операций банка не ме-яются на рассматриваемом периоде; своими действиями банк не оказывает лщественного влияния на финансовый рынок. Количество денег х\(і), стоимость портфеля приобретенных ценных бу-аг Х2ІІ) и объем ценных бумаг размещенных банком я з 00 описывается си-гемой обыкновенных дифференциальных уравнений [20]

В модели банка приняты следующие обозначения: Ф() — доход не завися-ий от объема активов (брокерское обслуживание, проведение гарантийных [ераций, комиссионные за расчетно-кассовое обслуживание и т.п.); Т — го-гзонт планирования; IQ — капитал банка (объем собственных средств); к коэффициент надежности банка; C(t) — скорость расходования банком іедств на содержание аппарата управления, оплату аренды помещения и д.; p{t) — индекс потребительских цен; г — характерное время проведения гатежей (поступления денежных средств); Л — постоянная времени, харак-ризующая степень развития фондового рынка; r(t) — номинальный индекс юта портфеля ценных бумаг, приобретенных банком; qit) — текущий рыбный курс ценных бумаг, приобретенных банком; в (і) — среднее время гашения ценных бумаг, приобретённых банком; r\{t) — индекс роста со-купной задолженности по размещенным ценным бумагам; rj(t) — среднее іемя погашения ценных бумаг эмитированных банком; А і — постоянная фемени, характеризующая степень развития рынка ценных бумаг, эмитированных банком. На величины управляющих функций ЩІЬ), щ{і) щ{і) наложены ограни-гения ідесь щ — скорость проведения дивидендных выплат; щ — скорость скупій ценных бумаг сторонних эмитентов; щ — скорость привлечения банком аемных средств. базовые ограничения. Для сохранения банком ликвидности необходимо, :тобы siW/т - n{t)x3(t) - x3{t)/r){t) -p(t)C(t) 0, te [0,Т]. (4.24) Мы будем считать, что банк не получает "сверхдоходов". Следовательно [аксимальное количество денег, которое он может привлечь и получить в иде прибыли ограничено некоторой константой М Оценку М можно получить исходя из максимального объема заимство-аний /C/Q, соотношения процентных ставок по привлечению и размещению редств, объема доходов не зависящих от суммы активов Ф(). Смешанное ограничение.

После уплаты налогов банк использует оставшеся средства для вложения в собственную инфраструктуру (внутренние нвестиции) — p(t)Ci(t) и для дивидендных выплат. Так как дивидендные ыплаты не могут быть отрицательными, мы приходим в результате к сле-ующему ограничению ie С\ (t) означает скорость проведения реинвестиций в инфраструктуру бан-i в ценах на начальный момент времени. ,2. Задачи оптимального управления. критерий качества. Интересы банка (его владельцев) описывается жела-ЇЄМ максимизировать дисконтированную полезность будущих дивидендных лплат. Будем считать, что полезность получаемая от немедленной выпла-зі представляется в exp(5t) раз больше, чем полезность выплаты того же уьема средств с учетом инфляции, но через время t. Величина 5 называется )эффициентом дисконтирования полезности дивидендных выплат. В этом гучае функционал записывается в виде Т це и[-] — функция полезности дивидендных выплат, C2(t) — скорость про-едения дивидендных выплат в ценах на начальный момент времени. Когда u(t) играет роль полезности потребления, обычно требуется, что-ы она была непрерывной, монотонной, вогнутой и ограниченной сверху с ополнительным условием и(0) = — со. Последнее условие гарантирует поло-:ительность текущего потребления в каждый момент времени. Мы не будем ребовать выполнения этого условия, полагая, что u(t) обладает низким от-ращением к нулевому потреблению (дивиденды могут не выплачиваться в эчение некоторых промежутков времени). В качестве функции полезности примем зависимость вида [20] цесь Р означает относительное отвращение к риску по Эрроу-Пратту [20]. Для системы (4.22) заданы начальные условия Граничные условия имеют вид Функции Ф(), r(), ri(t), q(t), p(t), 9(t), rf(t), C(t), C\(t) считаются заданими неотрицательными функциями времени (их значения обычно прогно-[руют). адача А\. Требуется определить максимум / (4.27) при наличии ограни-ший (4.22)-(4.2б), (4.28)-(4.30). Ряд банков, вообще говоря, не придерживается политики постоянной вы-іатьі дивидендов. Обычно принято выплачивать дивиденды после уплаты ех долгов и налогов. В связи с этим можно сформулировать новую задачу ітимального управления. здача А2. Найти тахх Г) при условиях (4.22)-(4.25), (4.29), (4.30). В даче А2 полагаем щ = 0. В случае постоянной выплаты дивидендов можно сформулировать новую дачу. ідача Аз- Определить maxxi(T), если выполнены условия (4.22)-(4.26), .29), (4.30). Перечисленные задачи также можно рассматривать со свободным правым нцом. Условие (4.30) при этом опускается. В результате получаем новые дачи Ли, Л21, 31

Похожие диссертации на Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями