Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Левочкина Мария Сергеевна

Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин
<
Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Левочкина Мария Сергеевна. Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин : диссертация ... кандидата физико-математических наук : 01.01.05.- Москва, 2006.- 86 с.: ил. РГБ ОД, 61 06-1/1106

Содержание к диссертации

Введение

ГЛАВА 1. Предварительные сведения из теории линейных систем управления и понятие оптимальности почти наверное и по вероятности 20

1. Линейные дискретные системы управления: основные понятия 20

2. Задача оптимального регулирования 27

3. Оптимальность по вероятности и почти наверное в задачах динамического управления 32

ГЛАВА 2. Задача линейного регулятора, возмущенного последовательностью зависимых случайных величин, для случая постоянных параметров 34

1. Постановка задачи 34

2. Основные результаты по стохастической оптимальности 37

3. Вспомогательные утверждения 39

4. Доказательства основных результатов 47

ГЛАВА 3. Задача линейного регулятора, возмущенного последовательностью зависимых случайных величин, для случая переменных параметров 56

1. Постановка задачи 56

2. Основные результаты по стохастической оптимальности 59

3. Доказательства 61

ГЛАВА 4. Применение полученных результатов к задаче пенсионного финансирования 65

1. Оптимальное финансирование пенсий как задача динамического управления 66

2. Стохастическая оптимальность в задаче пенсионного финансирования 74

Заключение 79

Список литературы 82

Введение к работе

Актуальность темы. Диссертация посвящена исследованию стохастической оптимальности в задачах динамического управления, возникающих, в частности, в некоторых экономических приложениях.

Рассматривается линейная динамическая система управления с квадратичным целевым функционалом, возмущенная последовательностью определенным образом зависимых случайных величин.

Для исследования стохастической оптимальности используются вероятностные критерии, с помощью которых определяется более сильное в некотором смысле свойство оптимальности по сравнению с оптимальностью в среднем, когда минимизируется математическое ожидание целевого функционала. Исследованию в этой области посвящены работы П.Мандла, В.Боркара, А.Лейзаровитца и др. В данной работе используется концепция «асимптотической оптимальности почти наверное и по вероятности», предложенная В.И.Ротарем, и развитая затем в работах Ю.М.Кабанова, Э.Л.Пресмана, Т.А.Белкиной и связанная с изучением асимптотического поведения разности значений функционалов для оптимального в среднем и произвольного управления. Положительная часть указанной разности называется процессом дефекта оптимального в среднем управления. Такой подход, обобщая и улучшая многие другие, позволяет также расширить постановку задачи, введя понятие чувствительных вероятностных критериев, и рассматривая оценки скорости роста для процесса дефекта, которые могут иметь порядок стремления к бесконечности гораздо меньший, чем у длины интервала планирования. При этом чувствительность критерия определяется соответствующей (неслучайной) весовой функцией от горизонта управления, при умножении на которую гарантируется стремление процесса дефекта к нулю по вероятности или почти наверное.

Модель линейного регулятора, исследуемая в данной работе, является обобщением классической модели стохастического линейного регулятора. Это обобщение классической модели возникло из потребностей, связанных с экономическими приложениями. В классических задачах возмущения обычно описываются белым шумом, что в случае дискретного времени соответствует

последовательности независимых случайных величин. Однако в ряде экономических приложений наблюдается зависимость возмущающих переменных в разные моменты времени. Например, в рассматриваемой в диссертации модели финансирования пенсионного фонда состояние системы (величина резерва пенсионного фонда) формально описывается линейной управляемой системой, возмущенной последовательностью случайных величин, образующих случайный процесс типа авторегрессионного (этот процесс описывает пенсионные выплаты), и некоторой неслучайной функцией времени. Соответствующую задачу оптимального управления можно охарактеризовать как задачу линейного регулятора, возмущенного последовательностью зависимых случайных величин.

С помощью введения расширенного вектора состояния данная задача сводится к классической задаче линейного регулятора большей размерности. Однако, в общем случае параметры возмущающего процесса могут быть такими, что соответствующая классическая модель обладает некоторой спецификой по сравнению со стандартной ситуацией. Указанная особенность состоит в том, что может не существовать установившейся оптимальный закон управления при стремлении горизонта планирования к бесконечности. Кроме того, ранее для линейного регулятора с дискретным временем исследовалась только стохастическая оптимальность, соответствующая делению процесса дефекта на длину интервала планирования. Таким образом, задача линейного регулятора возмущенного последовательностью зависимых случайных величин, требует отдельного рассмотрения.

Целью диссертации является исследование стохастической оптимальности в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин, а также применение полученных результатов в теории пенсионного финансирования.

В соответствии со сформулированной целью задачи диссертации можно определить следующим образом:

1. Найти управление, оптимальное в среднем в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин;

2. В указанной задаче исследовать условия, при которых управление,
оптимальное в среднем, является оптимальным по вероятности и почти наверное с
различными весовыми функциями;

3. Выяснить возможный порядок стремления к нулю весовых функций;

4. Применить полученные результаты к модели пенсионного
финансирования.

Методы исследования. Используются различные методы теории вероятностей и стохастической теории управления. Для исследования стохастической оптимальности применяется мартингальный подход. В частности, после приведения изучаемой модели к классическому виду дефект целевого функционала представляется как величина, включающая значение некоторого мартингала и его квадратической характеристики. Далее проводится исследование асимптотического поведения этого процесса с применением предельных теорем теории вероятностей.

Новизна полученных результатов.

1. Для классической модели линейного регулятора в дискретном времени:

1.1. Улучшен порядок весовой функции, при которой имеет место
оптимальность почти наверное и по вероятности по сравнению с известными
результатами.

1.2. Для весовой функции Т~ (где Т - горизонт планирования) ослаблены
условия на моменты случайных возмущений, полученные ранее, при которых
соответствующая стохастическая оптимальность имеет место.

2. Результаты, полученные для линейного регулятора, возмущенного
последовательностью зависимых случайных величин, рассматриваемого как
классический линейный регулятор большей размерности, являются новыми как в
силу вышеуказанного п. 1.1, так как и в силу того, что они остаются справедливыми
и в случае, когда не выполнены условия, гарантирующие существование
установившегося при Т —> о оптимального закона управления.

3. Для получения результатов не требуется ограниченность неслучайной
функции времени, входящей в «возмущение», в то время как в полученных ранее
результатах эта ограниченность являлась одним из существенных условий при
доказательстве стохастической оптимальности.

4. В используемой нами постановке модель пенсионного финансирования до сих пор, насколько нам известно, не рассматривалась, при этом исследование стохастической оптимальности по отношению к модели пенсионного финансирования как модели оптимального динамического управления проводилось впервые.

Практическая ценность. Большинство практических задач

оптимального управления составляют задачи, в которых возмущения действуют на систему непрерывно и стремятся вывести систему из нулевого состояния. (Например, в задаче пенсионного финансирования нулевое состояние рассматривается как совпадение реальной траектории с планируемой). При наличии постоянно действующего возмущения решение задачи оптимального регулятора позволяет с максимальным быстродействием снизить начальные отклонения, а также, насколько это возможно, компенсировать воздействие возмущений в установившемся состоянии.

В некоторых экономических приложениях возмущения системы не являются независимыми. При этом одним из способов учета коррелированности возмущающих переменных в разные моменты времени является описание возмущения в виде процесса авторегрессионного типа, что приводит к необходимости рассмотрения модели линейного регулятора, возмущенного последовательностью зависимых величин.

Для традиционного решения задач стохастической оптимизации можно говорить лишь об оптимальных в среднем характеристиках, соответствующих случайному процессу. Результаты работы, связанные со стохастической оптимальностью в таких задачах, позволяют получить при некоторых естественных условиях на параметры управляемого процесса асимптотические вероятностные оценки дефекта оптимального в среднем управления, которые можно рассматривать в определенном смысле как асимптотические оценки риска при использовании указанного управления.

Апробация работы. Основные результаты диссертации опубликованы в восьми работах, в том числе в журналах «Дискретная математика», «Обозрение прикладной и промышленной математики» и сборниках статей ЦЭМИ РАН и МИЭМ. Эти результаты докладывались на Десятой Всероссийской школе-

коллоквиуме по стохастическим методам (2003 г.), Шестой Международной Петрозаводской конференции «Вероятностные методы в дискретной математике» (2004г.), V Международной ферганской конференции «Предельные теоремы теории вероятностей и их приложения» (Ферганском коллоквиуме) (2005г.), а также на ежегодных научно-технических конференциях студентов, аспирантов и молодых специалистов МИЭМ. В 2002 г. научная работа, представленная на научно-технической конференции МИЭМ, посвященной 40-летию МГИЭМ, была признана лучшей в своей секции.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и списка литературы. Объем диссертации - 86 страниц. Список литературы включает 51 наименование.

Оптимальность по вероятности и почти наверное в задачах динамического управления

Методы, используемые при решении поставленных задач, кратко можно охарактеризовать следующим образом.

Прежде всего, исследуемая задача линейного дискретного регулятора, возмущенного последовательностью зависимых случайных величин, приводится к виду классического регулятора. Далее доказательство стохастической оптимальности основывается на представлении (для каждого фиксированного Т) процесса дефекта, включающем некоторый мартингал (точнее, значение некоторого мартингала в момент Т) и его квадратическую характеристику. Указанное представление является дискретным аналогом предложенного в [17] и используемого также в [1] представления для линейного регулятора с непрерывным временем.

Однако исследование асимптотического поведения этого процесса в дискретном случае оказалось в некотором смысле более сложным по сравнению с аналогичным исследованием в случае непрерывного времени. Это потребовало разработки нового подхода, использующего свойства некоторого специального преобразования для мартингалов с равномерно ограниченными мартингал-разностями в сочетании со специфическим методом усечения для мартингала, участвующего в указанном представлении процесса дефекта, и применению предельных теорем для зависимых слагаемых.

Кроме того, следует заметить, что в силу специфики рассматриваемого приложения задача не свелась к исследованию стохастической оптимальности для классической модели линейного регулятора в обычной ситуации, когда существует установившийся оптимальный закон управления.

Это, с одной стороны, является обоснованием того, что в диссертации исследуется стохастическая оптимальность только в рамках схемы серий оптимальных в среднем управлений. С другой стороны, при построении упомянутых выше усечений это потребовало дополнительного изучения свойств некоторых функций от параметров модели в рассматриваемом специфическом случае, в частности, свойств, связанных с параметрами регрессии в исходной постановке. При этом наряду с методами теории мартингалов использовались также методы динамического программирования.

В работе получены следующие основные результаты: 1. Для модели линейного стохастического регулятора, возмущенного зависимыми случайными величинами, описываемой соотношениями (7)-(9), был получен вид оптимального в среднем управления. 2. При исследовании д-оптималыюсти по вероятности и п.н. в модели (7)-(9) с постоянными и с переменными параметрами определен порядок стремления к нулю весовых функций д и тем самым получены оценки скорости роста процесса дефекта оптимального управления. Показано, что эти оценки связаны с параметрами возмущающего процесса. При этом исследованы следующие ситуации: 1) случайные величины "возмущений", входящих в описание процесса авторегрессионного типа, являются независимыми равномерно ограниченными с вероятностью единица случайными величинами с нулевым математическим ожиданием; 2) случайные величины "возмущений", входящих в описание процесса авторегрессионного типа, являются независимыми с нулевым математическим ожиданием и конечными моментами различных порядков. 3. Полученные результаты относительно стохастической оптимальности в задаче линейного стохастического регулятора, возмущенного зависимыми случайными величинами (7)-(9), использованы в модели пенсионного финансирования как задаче оптимального динамического управления (10)-(13). Новизна полученных результатов состоит в следующем: 1. Для классической модели линейного регулятора в дискретном времени: 1) улучшен порядок весовой функции дт , при которой имеет место д-оптималыюсть п.н. и по вероятности по сравнению с известными результатами ( см.[14],[15]). 2) Для дт = Т 1 ослаблены условия на моменты случайных возмущений, полученные ранее в [14]-[15], при которых соответствующая стохастическая оптимальность имеет место. 2. Результаты, полученные для линейного регулятора, возмущенного последовательностью зависимых случайных величин, рассматриваемого как классический линейный регулятор большей размерности, являются новыми как в силу вышеуказанного п. 1, так как и в силу того, что они не опираются на существование установившегося при Т - со оптимального закона управления. 3. Для получения результатов не требуется ограниченность неслучайной функции времени &, входящей в "возмущение", в то время как в полученных ранее результатах (см. [1] для случая непрерывного времени) эта ограниченность являлась одним из существенных условий при доказательстве стохастической оптимальности. 4. В используемой нами постановке модель пенсионного финансирования до сих пор, насколько нам известно, не рассматривалась, при этом исследование стохастической оптимальности по отношению к модели пенсионного финансирования как модели оптимального динамического управления проводилось впервые. 7. Описание содержания диссертации. Диссертация состоит из введения, четырех глав, заключения и списка литературы.

В главе 1 приводятся необходимые сведения из теории линейных систем управления, а также обсуждаются некоторые результаты по стохастической оптимальности для задач линейного регулирования. Рассматриваются линейные дискретные системы в терминах их состояний и их свойства, важные для анализа систем в установившемся состоянии: экспоненциальная устойчивость, управляемость, восстанавливаемость, стабилизируемость, обнаруживаемость, а также равномерная полная управляемость и равномерная полная восстанавливаемость. Заметим, что эти свойства связаны только с матрицами, описывающими систему, поэтому можно говорить одновременно об этих свойствах как для линейной системы, так и для набора матриц, определяющих эту систему (в случае постоянных параметров). Дается общее описание задачи построения линейного оптимального регулятора, описывается ее решение при конечном горизонте планирования, а также рассматривается установившееся решение при стремлении горизонта планирования к бесконечности. Особое внимание в главе 1 уделяется также известным результатам по стохастической оптимальности для задач линейного регулирования.

Основные результаты по стохастической оптимальности

Пенсионное страхование, обычно предлагаемое страховыми компаниями, состоит из страхования на дожитие, договоров отложенных аннуитетов либо может рассматриваться как частный вид страхования жизни, хотя с иными правилами налогообложения и ограничениями на отказ от страхования.

Страхование на дожитие заключается в страховании заданной суммы денег на заданный срок. Страховое событие, влекущее выплату страховой суммы, состоит в дожитии застрахованного до конца указанного срока.

Договор отложенного аннутитета подразумевает осуществление регулярных платежей со сроком начала выплат, привязанным к некоторому возрасту выхода на пенсию.

Страхование жизни позволяет за относительно небольшую плату обеспечить наследникам значительный доход на случай смерти застрахованного. Во многих странах пенсионное обеспечение может осуществляться не только с помощью страховых компаний, но и с помощью других механизмов, а именно: пенсионных схем, учреждаемых в виде пенсионных фондов. Деятельность пенсионного фонда включает аккумулирование пенсионных взносов, размещение пенсионных резервов, учет пенсионных обязательств фонда и выплату пенсий участникам. Одни из них создаются для определенной конкретной группы лиц, обычно для работников одного работодателя или группы работодателей. Другие фонды создаются для людей определенного вида деятельности или профессии, например, фонды, создаваемые профсоюзами в США. В Финляндии же, например, национальная пенсионная схема функционирует децентрализованно, через частные агентства.

Институциональные формы пенсионных схем могут быть различны. Ответственной организацией может быть юридически независимый фонд, хотя бы и учрежденный работодателем или группой работодателей. Возможен вариант, когда работодатель может выплачивать пенсии непосредственно из собственных ресурсов компании. Некоторые части организации - управление инвестициями или выплата пособий - могут быть перепоручены страховой компании.

Для целей актуарного оценивания, описанных ниже, институциональная структура не имеет значения. Поэтому будем рассматривать просто пенсионную схему, которая несет ответственность за обеспечение определенных пособий группе членов и получает взносы. Реальная природа этих взносов также не играет роли; они могут вноситься государством в государственных схемах, работодателем (спонсором) в корпоративных схемах, самими членами и т.д. Однако мы будем предполагать, что схема имеет персонифицированный учет историй взносов своих членов, и в этой связи будем говорить о взносах членов схемы.

Существует большое разнообразие пенсионных схем, различающихся спектром и определением пособий, а также по методам финансирования. Пособия, выплачиваемые пенсионными схемами, могут быть следующими: - пенсия по старости, выплачиваемая остаток жизни с определенного пенсионного возраста; пенсия по нетрудоспособности (инвалидности) в случае инвалидности до достижения пенсионного возраста; - пособия в случае смерти, например, пенсия по случаю потери кормильца; - выходные пособия покидающим схему преждевременно. По методам финансирования схемы делятся на солидарные и накопительные. В солидарных пенсионных схемах пособия финансируются за счет взносов работающих. В накопительных схемах будущие пенсии работников финансируются за счет формирования резервов из их собственных взносов. Взносы обычно осуществляются в форме отчислений от заработной платы, обязательных или добровольных. В мировой практике существует также большое число различных вариантов смешанных пенсионных схем, сочетающих распределительный и накопительный принципы. Различают также пенсионные схемы с определенными выплатами (пособиями), где уровень взносов рассчитывается исходя из будущего уровня пенсий и схемы с определенными взносами, где расчет производится исходя их уровня взносов. Актуарные расчеты представляют собой специфический род деятельности, предметом которой являются финансовые схемы, порождающие те или иные обязательства неопределенного будущего объема. В частности, это страховые и пенсионные обязательства. Необходимость в актуарных расчетах возникает в связи с риском невыполнения этих обязательств. Для накопительных пенсионных схем основными целями актуарных расчетов являются прежде всего определение резервов, оценка инвестиционных схем, норм отчислений от заработной платы, тестирование денежных потоков. Актуарным базисом называют совокупность исходных данных, принимаемых для выполнения актуарных расчетов. При его построении делаются предположения о величинах будущих статистических показателей, необходимых для расчета пенсий (например, о смертности, о заработной плате), а также предположения о будущей отдаче от инвестирования активов. Задачи актуарных расчетов связаны с оцениванием частот случайных событий и поэтому основываются на математических моделях теории вероятностей и статистики. В тематику актуарных исследований для пенсионных схем включается: - сбор и анализ статистической информации, в том числе демографическая статистика, в особенности сбор данных по смертности и инвалидности, статистика заработной платы; - финансовые и инвестиционные исследования для пенсионных схем; - математическое моделирование пенсионных схем. Последнее направление в принципе занимает центральное положение, определяя требования к моделям и данным, получаемым в двух других направлениях.

Оптимальное финансирование пенсий как задача динамического управления

В диссертации было проведено исследование стохастической оптимальности в модели линейного регулятора с дискретным временем, возмущенного последовательностью определенным образом зависимых случайных величин.

Для исследования стохастической оптимальности были использованы вероятностные критерии, с помощью которых определяется более сильное в некотором смысле свойство оптимальности по сравнению с оптимальностью в среднем, когда минимизируется м.о. целевого функционала. Точнее, была использована концепция "асимптотической оптимальности почти наверное и по вероятности", предложенная В.И.Ротарем, и развитая затем в работах Ю.М.Кабанова, Э.Л.Пресмана, Т.А.Белкиной и связанная с изучением асимптотического поведения разности значений функционалов для оптимального в среднем и произвольного управления. Положительная часть указанной разности называется процессом дефекта оптимального в среднем управления. Такой подход, обобщая и улучшая многие другие, позволяет также расширить постановку задачи, введя понятие чувствительных вероятностных критериев, и рассматривая оценки скорости роста для процесса дефекта, которые могут иметь порядок стремления к бесконечности гораздо меньший, чем у длины интервала планирования. При этом чувствительность критерия определяется соответствующей (неслучайной) весовой функцией от горизонта управления, при умножении на которую гарантируется стремление процесса дефекта к нулю по вероятности или почти наверное.

Модель линейного регулятора, исследуемая в данной работе, является обобщением классической модели стохастического линейного регулятора. Однако, в общем случае параметры возмущающего процесса могут быть такими, что соответствующая классическая модель большей размерности, получаемая из исходной введением расширенного вектора состояния, обладает некоторой спецификой по сравнению со стандартной ситуацией. Указанная особенность состоит в том, что может не существовать установившейся оптимальный закон управления при стремлении горизонта планирования к бесконечности. Кроме того, ранее для линейного регулятора с дискретным временем исследовалась только стохастическая оптимальность, соответствующая делению процесса дефекта на длину интервала планирования.

Необходимость рассмотрения такого обобщения классической модели возникла из потребности, связанной с экономическими приложениями. В классических задачах возмущения обычно описываются белым шумом, что в случае дискретного времени соответствует последовательности независимых случайных величин. Однако в ряде экономических приложений наблюдается зависимость возмущающих переменных в разные моменты времени. Например, в рассматриваемой в диссертации модели финансирования пенсионного фонда состояние системы (величина резерва пенсионного фонда) формально описывается линейной управляемой системой, возмущенной последовательностью случайных величин, образующих случайный процесс типа авторегрессионного (этот процесс описывает пенсионные выплаты), и некоторой неслучайной функцией времени. Соответствующую задачу оптимального управления можно охарактеризовать как задачу одномерного линейного регулятора, возмущенного последовательностью зависимых случайных величин.

В общем многомерном случае для исследования стохастической оптимальности был использован мартингальный подход. После приведения исследуемой модели к классическому виду дефект целевого функционала представляется как величина, включающая некоторый мартингал и его квадратическую характеристику. Исследование асимптотического поведения этого процесса в дискретном случае является в некотором смысле более сложным по сравнению с аналогичным исследованием в случае непрерывного времени. Это потребовало разработки нового подхода, использующего с использованием различных приемов и методов теории вероятностей и стохастической теории управления.

В диссертации для модели линейного стохастического регулятора, возмущенного зависимыми случайными величинами были получены оценки скорости роста процесса дефекта и установлена соответствующая оптимальность по вероятности и почти наверное оптимального в среднем управления при больших временных горизонтах. Показано что эти оценки связаны с параметрами возмущающего процесса.

При этом исследованы следующие ситуации: 1) случайные величины "возмущений", входящих в описание процесса авторегрессионного типа, являются независимыми равномерно ограниченными с вероятностью единица случайными величинами с нулевым математическим ожиданием; 2) случайные величины "возмущений"входящих в описание процесса авторегрессионного типа, являются независимыми с нулевым математическим ожиданием и конечными моментами различных порядков Как частный случай, эти полученные оценки скорости роста процесса дефекта включают оценки для классического линейного регулятора с дискретным временем и они имеют лучший порядок по сравнению с известными результатами. Кроме того, указанные оценки остаются справедливыми и в случае, когда не выполнены условия, гарантирующие существование установившегося при стремлении горизонта планирования к бесконечности оптимального закона управления.

Следует также отметить, что в полученных ранее результатах при исследовании стохастической оптимальности одним из существенных условий является ограниченность неслучайной функции времени, входящей в возмущение. Однако, для результатов, полученных в диссертации, эта ограниченность не требуется.

Полученные результаты относительно стохастической оптимальности в задаче линейного регулятора использованы в модели пенсионного финансирования как задаче оптимального динамического управления. В используемой нами постановке модель пенсионного финансирования до сих пор, насколько нам известно, не рассматривалась, при этом исследование стохастической оптимальности по отношению к модели пенсионного финансирования как модели оптимального динамического управления проводилось впервые.

Стохастическая оптимальность в задаче пенсионного финансирования

Однако исследование асимптотического поведения этого процесса в дискретном случае оказалось в некотором смысле более сложным по сравнению с аналогичным исследованием в случае непрерывного времени. Это потребовало разработки нового подхода, использующего свойства некоторого специального преобразования для мартингалов с равномерно ограниченными мартингал-разностями в сочетании со специфическим методом усечения для мартингала, участвующего в указанном представлении процесса дефекта, и применению предельных теорем для зависимых слагаемых.

Кроме того, следует заметить, что в силу специфики рассматриваемого приложения задача не свелась к исследованию стохастической оптимальности для классической модели линейного регулятора в обычной ситуации, когда существует установившийся оптимальный закон управления.

Это, с одной стороны, является обоснованием того, что в диссертации исследуется стохастическая оптимальность только в рамках схемы серий оптимальных в среднем управлений. С другой стороны, при построении упомянутых выше усечений это потребовало дополнительного изучения свойств некоторых функций от параметров модели в рассматриваемом специфическом случае, в частности, свойств, связанных с параметрами регрессии в исходной постановке. При этом наряду с методами теории мартингалов использовались также методы динамического программирования.

В работе получены следующие основные результаты: 1. Для модели линейного стохастического регулятора, возмущенного зависимыми случайными величинами, описываемой соотношениями (7)-(9), был получен вид оптимального в среднем управления. 2. При исследовании д-оптималыюсти по вероятности и п.н. в модели (7)-(9) с постоянными и с переменными параметрами определен порядок стремления к нулю весовых функций д и тем самым получены оценки скорости роста процесса дефекта оптимального управления. Показано, что эти оценки связаны с параметрами возмущающего процесса. При этом исследованы следующие ситуации: 1) случайные величины "возмущений", входящих в описание процесса авторегрессионного типа, являются независимыми равномерно ограниченными с вероятностью единица случайными величинами с нулевым математическим ожиданием; 2) случайные величины "возмущений", входящих в описание процесса авторегрессионного типа, являются независимыми с нулевым математическим ожиданием и конечными моментами различных порядков. 3. Полученные результаты относительно стохастической оптимальности в задаче линейного стохастического регулятора, возмущенного зависимыми случайными величинами (7)-(9), использованы в модели пенсионного финансирования как задаче оптимального динамического управления (10)-(13). Новизна полученных результатов состоит в следующем: 1. Для классической модели линейного регулятора в дискретном времени: 1) улучшен порядок весовой функции дт , при которой имеет место д-оптималыюсть п.н. и по вероятности по сравнению с известными результатами ( см.[14],[15]). 2) Для дт = Т 1 ослаблены условия на моменты случайных возмущений, полученные ранее в [14]-[15], при которых соответствующая стохастическая оптимальность имеет место. 2. Результаты, полученные для линейного регулятора, возмущенного последовательностью зависимых случайных величин, рассматриваемого как классический линейный регулятор большей размерности, являются новыми как в силу вышеуказанного п. 1, так как и в силу того, что они не опираются на существование установившегося при Т - со оптимального закона управления. 3. Для получения результатов не требуется ограниченность неслучайной функции времени &, входящей в "возмущение", в то время как в полученных ранее результатах (см. [1] для случая непрерывного времени) эта ограниченность являлась одним из существенных условий при доказательстве стохастической оптимальности. 4. В используемой нами постановке модель пенсионного финансирования до сих пор, насколько нам известно, не рассматривалась, при этом исследование стохастической оптимальности по отношению к модели пенсионного финансирования как модели оптимального динамического управления проводилось впервые. 7. Описание содержания диссертации. Диссертация состоит из введения, четырех глав, заключения и списка литературы. В главе 1 приводятся необходимые сведения из теории линейных систем управления, а также обсуждаются некоторые результаты по стохастической оптимальности для задач линейного регулирования. Рассматриваются линейные дискретные системы в терминах их состояний и их свойства, важные для анализа систем в установившемся состоянии: экспоненциальная устойчивость, управляемость, восстанавливаемость, стабилизируемость, обнаруживаемость, а также равномерная полная управляемость и равномерная полная восстанавливаемость. Заметим, что эти свойства связаны только с матрицами, описывающими систему, поэтому можно говорить одновременно об этих свойствах как для линейной системы, так и для набора матриц, определяющих эту систему (в случае постоянных параметров). Дается общее описание задачи построения линейного оптимального регулятора, описывается ее решение при конечном горизонте планирования, а также рассматривается установившееся решение при стремлении горизонта планирования к бесконечности. Особое внимание в главе 1 уделяется также известным результатам по стохастической оптимальности для задач линейного регулирования. В главе 2 исследуется -оптимальность п.н. и по вероятности в модели (7)-(9), где параметры R{t, г = l,...,s, qt, «, t = 1,2,..., зависят от времени, а остальные являются постоянными. Основными результатами главы 2 являются теоремы 2.1 и 2.2. Приведем предположения, использующиеся в формулировках теорем. Ниже - обозначает спектральную норму, a Q - такую матрицу, что Q Q = С.

Похожие диссертации на Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин