Численные методы решения задач оптимального управления с использованием дискретной аппроксимации Чекарев Денис Анатольевич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Чекарев Денис Анатольевич. Численные методы решения задач оптимального управления с использованием дискретной аппроксимации : диссертация ... кандидата физико-математических наук : 05.13.18.- Москва, 2005.- 106 с.: ил. РГБ ОД, 61 05-1/865

Содержание к диссертации

Введение

Введение.

1.1. Общее описание проблемы 5

1.2. Место работы в современной науке 5

1.3. Формулировка темы работы. Актуальность . 6

1.4. Цель и задачи исследования. 9

1.5. Научная новизна исследования 9

1.6. Предлагаемый подход к решению 10

1.7. Основное содержание работы , 10

1.8. Практическая значимость. Публикации 12

1.9. Апробация результатов исследования , 12

1.10. Структура и объем работы , 12

1.11. Личный вклад диссертанта , 12

Математическое моделирование линейных динамических систем со смешанными ограничениями,

2.1. Постановка параметрической задачи оптимального управления 13

2.2. Необходимые условия оптимальности для общей задачи оптимального управления. Принцип максимума Понтрягина и формализм Дубовицкого-Милютина 16

2.3. Линейные параметрические модели с ограничениями смешанного типа , 19

2.4. Условия оптимальности для линейных задач 20

2.5. Задачи оптимального управления А и Б 20

Решение линейных задач оптимального управления со смешанными ограничениями методом дискретизации по времени .

3.1. Построение конечно-разностной аппроксимации модели 24

3.2. Схема решения параметрических задач оптимального управления 26

3.2.1. Получение аппроксимации решения прямой задачи 30

3.2.2. Выделение множества активных ограничений 31

3.2.3. Построение аппроксимации решения сопряженной задачи 31

3.3. Сходимость дискретных аппроксимаций 33

3.4. Общая схема решения линейных задач ОУ 41

3.4.1. Случай исключения ограничений типа равенства 41

3.4.2. Схема решения линейной задачи ОУ 42

3.5. Применение схем дискретизации различных порядков точности 42

3.6. Применение схем дискретизации с переменным шагом 44

3.7. Описание нового класса чисел повышенной точности 45

3.8. Анализ устойчивости дискретной аппроксимации на основе критерия оптимальности 51

3.8.1. Определение устойчивости задачи ЛП, основанное на критерии оптимальности 51

3.8.2. Меняются коэффициенты матрицы А 53

3.8.3. Меняется столбец b 54

3.8.4. Меняется столбец с 55

3.8.5. Меняются коэффициенты А нЬ 55

3.8.6. Меняются коэффициенты А и с 55

3.8.7. Меняются коэффициенты Ь и С 56

3.8.8. Обший случай (меняются коэффициенты А, Ь, с) 56

Применение метода дискретной аппроксимации для параметрических динамических моделей обслуживания внешнего государственного долга .

4.1. Содержательное описание особенностей моделируемой системы 58

4.2. Математическая формулировка модели 59

4.2.1. Обозначения для количественных характеристик системы 59

4.2.2. Динамические соотношения системы 60

4.2.3. Ограничения на фазовые переменные и управления системы 60

4.2.4. Целевая функция 61

4.3. Общая формулировка задачи 61

4.4. Решение задачи 62

4.4.1. Построение конечно-разностной аппроксимации 62

4.4.2. Решение дискретной аппроксимации с помощью системы «Баланс-2» 64

4.4.3. Формирование гипотезы о геометрии оптимальной траектории 65

4.4.4. Решение исходной системы 72

4.4.5. Решение сопряженной системы 80

4.4.6. Полное решение задачи 84

4.5. Применение различных схем дискретизации 90

4.5.1. Применение схем дискретизации разных порядков точности 90

4.5.2. Применение схемы дискретизации с переменным шагом дискретизации 91

4.6. Формулировка и решение параметрической задачи ОУ 93

Применение рассматриваемого подхода дли анализа параметрической модели оптимального управления .

5.1. Содержательное описание особенностей моделируемой системы 95

5.2. Теорема о сходимости дискретных аппроксимаций 98

6. Приложение.

6.1. Теорема существования и единственности в рассматриваемой задачи102

7. Литература.

Формулировка темы работы. Актуальность
Необходимые условия оптимальности для общей задачи оптимального управления. Принцип максимума Понтрягина и формализм Дубовицкого-Милютина
Получение аппроксимации решения прямой задачи
Ограничения на фазовые переменные и управления системы

Введение к работе

^2) #3

Актуальность темы

Данная работа посвящена разработке и исследованию свойств методов решения линейных задач оптимального управления (ОУ) со смешанными ограничениями. Предположение о линейности, хотя и сужает область применимости предлагаемого подхода, но, тем не менее, позволяет получать практически значимые результаты при исследовании широкого класса динамических моделей, поскольку во многих случаях такое исследование сводится к решению линейных задач ОУ Для решения задач ОУ в настоящее время широко применяются различные модификации метода «прогонки», а также численные методы решения задач ОУ, использующие сведение к конечномерным задачам нелинейного программирования, наиболее весомый вклад в развитие которых внесли- Ю Г Евтушенко, В Г Жадан, Б Т Поляк, А И. Голиков, В.В. Дикусар, А.Е Умнов, И.И Еремин, В Д Мазуров, Н Н Астафьев, О.Л. Мангасарьян и другие

Эффективность этих методов для задач с ограничениями на управления (класс задач Л.С. Понтрягина) подтверждена экспериментально и не вызывает сомнений. При этом, однако, наличие смешанных ограничений, зависящих как от фазовых переменных, так и от управлений, существенно усложняет структуру задачи, и в ряде случаев приводит к возникновению дополнительных вычислительных затруднений. Можно констатировать, что развитые к настоящему времени практически эффективные схемы решения задач ОУ этого класса либо в основном базируются на использовании специфики их условий (например, на априорном предположении о поведении оптимального управления), либо требуют альтернативных вычислительных подходов. В этой ситуации вопрос построения практически эффективной вычислительной схемы решения задач ОУ со смешанными ограничениями остается актуальным и сегодня.

В общем случае такая система должна

позволять находить приближенное численное решение

задачи ОУ,

допускать проверку допустимости и оптимальности

полученного решения,

кроме того, при необходимости, обеспечивать построение

аналитического решения методом формулировки и

проверки гипотезы о геометрии оптимальной траектории.

Следует отметить, что исследуемая в диссертации методология

решения задач ОУ со смешанными ограничениями позволяет не только

находить оптимальные решения, но и исследовать такие их характеристики

как чувствительность и устойчивость по параметрам Понятно, что это

ЮС НАЦИОНАЛЬНАЯ БИБЛИОТЕКА СПекгвург Л.

существенно улучшает качество и облегчает интерпретируемость получаемых решений Наконец, оказывается возможным ставить и решать задачи поиска оптимальных параметров модели, при которых значение целевого функционала достигает своего экстремума

Цель и задачи исследования

Основная цель исследования состоит в разработке и обосновании методики решения линейных задач ОУ со смешанными ограничениями, в обосновании оптимальности получаемых решений, а также в анализе условий сходимости схем численного решения задачи к точному решению исходной задачи.

Предлагаемый в диссертации подход основан на сведении линейных задач ОУ к задачам линейного программирования (ЛП) в конечномерных пространствах дискретизацией по времени и последующем решении получающихся задач ЛП В работе предлагается схема, позволяющая за счет использования специальных аналитических и программно-вычислительных инструментов преодолевать возникающие вычислительные проблемы, обусловленные недостаточной точностью стандартных схем компьютерных вычислений, вызываемых чрезвычайным ростом размерности возникающих задач ЛП. Кроме того, работа имеет своей целью показать практическую эффективность предлагаемой методики с точки зрения затрат вычислительных ресурсов.

Для контроля оптимальности и исследования свойств исходной задачи ОУ в диссертационной работе применен подход, основанный на одновременном рассмотрении пары задач ОУ- исходной и двойственной к ней задаче ЛП в банаховом пространстве

В соответствии с целью исследования поставлены и решены следующие задачи:

Разработка численно-аналитической схемы решения линейных задач оптимального управления со смешанными ограничениями, основанных на совместном решении пары задач ОУ, сводимых к двойственным задачам ЛП в банаховых пространствах;
Анализ и приведение к виду, удобному для использования, необходимых и достаточных условий экстремума в рассматриваемых задачах;
Обоснование алгоритма решения исходной задачи ОУ, включающего построение и проверку гипотезы о геометрии оптимальных траекторий, возможно, с использованием принципа максимума Л С. Понтрягина;

Компьютерная реализация предлагаемого подхода и исследование его эффективности при решении конкретных задач оптимального управления;
Исследование способов повышения качества численных приближенных решений задачи ОУ, включая разработку компьютерной арифметики повышенной точности;
Анализ сходимости и устойчивости дискретной аппроксимации исходной задачи, включая методы параметрической оптимизации получаемых решений.

Объект исследования

Объектом исследования является линейная математическая модель обслуживания внешнего государственного долга в условиях двухсекторной экономики.

Предмет исследования

Предметом исследования является процесс решения линейной параметрической задачи ОУ со смешанными ограничениями.

Теоретические и методологические основы исследования

Теоретическую и методологическую основу диссертации составляют труды российских и зарубежных ученых-математиков по методам решения задач ОУ, задач ЛП, методам оптимизации, теории машинных вычислений В основном используются результаты исследований В В Дикусара. Ю Г Евтушенко, А.М Тер-Крикорова, схема Дубовицкого-Милютина

Научная новизна исследования

В диссертационной работе предложена схема решения линейных задач ОУ со смешанными ограничениями, основанная на совместном численном решении пары задач, сводимых к задачам ЛП в банаховых пространствах по результатам работ A.M. Тер-Крикорова и схемы Дубовицкого-Милютина Модифицированы достаточные условия оптимальности линейной задачи ОУ

со смешанными ограничениями типа равенства и неравенства, допускающей уменьшение размерности вектора управлений за счет исключения ограничений типа равенства Разработана методика численного решения, позволяющая решать линейные задачи ОУ со смешанными ограничениями, основанная на предложенной схеме Основой предложенного подхода является использование дискретной аппроксимации пары задач ОУ с фазовыми и смешанными ограничениями и последующего решения пары конечномерных задач ЛП Показано, что на основе разработанной схемы возможно обобщение линейной задачи ОУ со смешанными ограничениями путем превращения коэффициентов задачи в параметры Приведено обоснование сходимости численного решения задачи ОУ со смешанными ограничениями к оптимальному

Практическая значимость

Модели, методы и алгоритмы, разработанные в исследовании, применялись для решения различных задач моделирования экономических процессов в Московском физико-техническом институте и в Вычислительном Центре РАН с 1999 по 2004гг

Предложенная методика может эффективно применяться в прикладных задачах Результаты работы могут быть использованы в научных исследованиях и практических решениях задач в таких организациях, как ВЦ РАН, ИММ РАН, МФТИ.

Публикации

Основные результаты исследования опубликованы в десяти работах

Апробация результатов исследования

Основные положения исследования докладывались и обсуждались на XLIII и XLVI научных конференциях МФТИ в 2000 и 2003гг Результаты исследования докладывались на заседаниях научного семинара кафедры высшей математики МФТИ, научного семинара ВЦ РАН под руководством член-корр РАН Ю Г Евтушенко, научных семинарах в отделе проблем моделирования и в отделе методов нелинейного анализа Вычислительного Центра РАН

Структура и объем работы

Диссертация состоит из пяти глав, приложения и заключения Основное содержание диссертации изложено на 99 страницах печатного текста. Список использованной литературы составляет 50 наименований

Формулировка темы работы. Актуальность

Основная цель исследования состоит в разработке методологии решения параметрических линейных задач оптимального управления со смешанными ограничениями, а также в получении условий устойчивости и сходимости численного решения задач, полученных применением метода дискретной аппроксимации к исходной задаче. Кроме того, в работе преследуется цель показать эффективность в вычислительном плане предложенной методологии решения.

В соответствий с целью исследования поставлены следующие задачи: 1. Разработка численно-аналитических схем решения параметрических линейных задач оптимального управления со смешанными ограничениями и их обоснование; 2. Обоснование двухуровневого алгоритма решения исходной параметрической задачи оптимального управления 3. Компьютерная реализация предлагаемых подходов и исследование их эффективности при решении задач оптимального управления; 4. Анализ сходимости и устойчивости дискретной аппроксимации исходной задачи; 5. Анализ схем дискретной аппроксимации и качества получающихся при этом численных решений.

К основным методам решения задач оптимального управления с фазовыми и смешанными ограничениями относятся: прямые методы (спуск в пространстве управлений), метод вариации фазовых переменных; метод штрафных функций; метод приращения функционала; принцип максимума.

В настоящее время теоретически наиболее точным и эффективным методом решения задач указанного класса является принцип максимума. Однако его практическое применение требует разрешения ряда проблем и преодоления затруднений, что требует накопления опыта решения конкретных задач оптимального управления.

Последнее обстоятельство обусловлено, с одной стороны сложностью математического аппарата и формулировки принципа максимума для задач оптимального управления с фазовыми и смешанными ограничениями. С другой стороны, хотя принцип максимума и редуцирует исходную задачу к краевой задаче для обыкновенных дифференциальных уравнений, наличие в таких задачах специфических связей типа равенств и неравенств резко усложняет использование этого подхода на практике.

Как правило, возникающая в этом случае краевая задача требует решения трех основных проблем: - задачи Коши для обыкновенных дифференциальных уравнений; - задачи нелинейного программирования (для каждой расчетной точки /); - поиск нулей трансцендентных функций.

Совокупность информации, получаемой при решении указанных выше задач, определяет для всего временного горизонта геометрию оптимальной траектории, т.е. зависимость от времени t множества индексов активных ограничений типа неравенств.

Важно отметить, что практическое использование принципа максимума также осложняется неединственностью множителей Лагранжа, возможным вырождением принципа максимума, а также проблемой выбора момента схода оптимальной траектории с ограничения типа неравенств. Еще одна проблема связана с нерегулярностью принципа максимума. Это приводит к появлению обобщенных функции в правой части сопряженных дифференциальных уравнений.

Из вышеизложенного следует, что разработка и обоснование комплекса вычислительных процедур и методик решения задач оптимального управления с фазовыми и смешанными ограничениями на базе принципа максимума, является актуальной и важной для практики.

Как известно, принцип максимума для простейшей нелинейной задачи оптимального управления был сформулирован Л.С. Понтрягиным и обоснован В,Г. Болтянским [29,30]. С тех пор появилось значительное число работ, посвященных использованию принципа максимума в различных задачах оптимального управления [1,3,6,9,11,32,36]. Приведем краткое изложение основных, полученных в них результатов.

Наиболее глубокие и серьезные теоретические исследования проблемы были проведены в работах А.А. Милютина и А.Я. Дубовицкого [4,11,16,27]. В этих работах теория принципа максимума была распространена на широкий класс задач с фазовыми и смешанными ограничениями (в том числе и нерегулярными). По существу, теоретическая проблема получения необходимых условий первого порядка для указанных задач в этих работах полностью решена. Однако с практической точки зрения при решении задач Коши в схемах основанных на этих условиях возникают дополнительные проблемы, которые требуют применения специальных методов. Прежде всего это, так называемая, жесткость задачи Коши, являющаяся отражением того факта, что в рассматриваемом объекте протекают разнотемповые процессы. Выделение жестких систем уравнения в отдельный класс вызвано трудностями их численного интегрирования классическими явными методами. Оказалось, что малый шаг интегрирования, используемый для временных интервалов с большими по модулю производными, не может быть увеличен для других интервалов, хотя производные там становятся существенно меньше. Для устранения указанного ограничения были предложены различные методы [2,4,5,7,10,13.14,18,33], однако и в настоящее время проблема численного решения жестких систем остается актуальной. Это связано с увеличением классов решаемых задач, общностью их постановки и разнообразием численных методов.

Необходимые условия оптимальности для общей задачи оптимального управления. Принцип максимума Понтрягина и формализм Дубовицкого-Милютина

На основании предварительной оценки выдвинем гипотезу: существуют моменты времени tx,t2,t3,tA, такие, что на промежутках [0,?J, fo, 2], Vi hi ( з М \U M индексы активных ограничений не меняются. Напомним, что в случае ограничений типа неравенств активным в момент времени t ограничением называется ограничение, которое при t превращается в равенство.

Кроме того, выделим те из ограничений, которые являются активными на всем промежутке интегрирования [0,Т] (по выдвинутой гипотезе). Таких ограничений три: gl{x,u,t)=u6-al{xl-x4) 0, g2(x,u,t)=u7-a2{x2-x5) 0, g4(x,u,t) = с2 + и2 + w4 - и-, - и5 0 . То, что эти ограничения активны, означает, что для всех te [О,Т] данные неравенства превращаются в равенства: gl (х,и, t) = О, g2(x,u,t) = 0, g4(x,u,t) = 0. Также предположим, что ограничение g3(x,u,t) = и2+и4 —Щ 0 активно при ї є [0,Г2] и неактивно при остальных X. Итак, предположим, что на промежутке [OjJ значения управлений н,,,..,», задаются следующим образом: и, =и1важ. «,=«,„„, и4=иАш,, и6=а1{х1-х4), щ =а2{х2 -х5), и2 определяется из активного ограничения иг + и4 — и7 = 0, т.е. и2 = а2(х2 х5)—и4ішх, и5 определяется из активного ограничения с: + м2 + ил иі иь = т-е- us =сг Предположим, что на промежутке (t{,/2] значения управлений м[(...,и7 задаются следующим образом: w,=«lraai, w2=«2 "3 = V« "б =Лі( і-). Щ=аг{х2 х%), и4 определяется из активного ограничения и2 + «4 - и, = 0, т.е. «4 = а2{х2 - х5)— и2тал, и5 определяется из активного ограничения с2 + и2 +и4 -м7 - м5 = 0, т.е. г 5 = с2.

Предположим, что на промежутке {t2,t3\ значения управлений »It,..,H7 задаются следующим образом: щ =и1ша, и2 = и2ішх, и3 = wjmb =0, и4 =w4min =. «в = «i( i - ) и7 =а2(х2—х5), и5 определяется из активного ограничения с2 + м2 +и4 — и7 —и5 =0, т.е. »5=с2+и2ти -аг{хг-х5).

Предположим, что на промежутке (/3, 4] значения управлений и, ы7 задаются следующим образом: u, = »lmin = 0, и3 = u3min = " = и4п = "з = »5, = и6 =Cf]( i 4), и7 = аг(хг х5)- иг определяется из активного ограничения с2 +и2 + и4 -а7 -н5 = 0,т.е. w2 =«2(x2 -xs)-e2.

Предположим, что на промежутке (f4,7 ] значения управлений щ и7 задаются следующим образом; и,=и)тіП=0, м2 = и2пііп =0, и-,=н3т;п=0. Mj=«smta=0 и6 = al(xt—x4), щ = аг(х2 - х5), и4 определяется из активного ограничения с2 +и2 +и4 -щ —иь =0,т.е. н4 = ос2(х2 —х5)—с2. Одновременно на каждом промежутке будем выписывать сопряженную систему. Для этого вводим функцию Гамильтона (2.2.2): Н = , (щ+и2)+ 2(«3+и4)+ ФІІМІХІ +и, + «3+«s- i«6) + (Д«6)+ (А«7 )- (Фь-аі{ -хА))- їиі-а2{х2 ))- (1)іиг+»А-иі) -&Шсг + "г +«4 -и, -и3)-Л1О(0(иго -и,)-Л( Х"і "«л) в которой множители Лагранжа Лу[і),...,Л4{і), Л,0(ї),..., 0(f), ЛіО) -"» л(г) неотрицательны.

Кроме того, на всех промежутках постоянства множеств активных ограничений справедливо: 2 = - 5, а с учетом того, что У2(0 и Wsi ) непрерывны на [О, Г], и у/2 (г) = С21 = - 5{Г), получаем: у2(0 = УЇ(0І ІР ?І- Поэтому, определив на каком-нибудь промежутке 1р2\ч (или ;( )), автоматически получаем 5(f) (или УгО)) на этом промежутке. В общепринятой практике решения задач оптимального управления интегрирование сопряженной системы выполняют с правого конца траектории до левого. Будем действовать согласно этой традиции. Рассмотрим решение сопряженной системы на промежутке ґ є (f4,7j:

Система дифференциальных уравнений для y/2{t) и y/5{t) имеет вид: =-сс2Р2у/5-агу/2, (\ (\ г\ \ . Учитывая, что y/2\t) = -у/, \t), получаем уравнение для у/г \t)\ {фъ=агр2у/5+агу/2 У г -а2Рт.2 агг = аг (1"" Рг V: Уг ) Ce"l(1"A) . Константу С находим из условия: у/2{Т) = С2\ Получаем: С = С21еа )т, 2(r) = С21 1 , ifrs(f)=-CV (1-AX74 Рассмотрим теперь момент времени Л, и два соседних промежутка 03,/4] и (tA,T].На промежутке (f3,f4] рассмотрим множитель Лагранжа ЛЮ{І) = ( -у2 0, а на промежутке (г4, Г] - множитель Я20(ї)= У2 — у/, О. Так как множители Лагранжа неотрицательны, а сопряженные переменные непрерывны, то в точке t4 получаем: у/} [t4) — у/г [t4) = 0 или ySi{t4)= ( )- Таким образом, можно выразить константу С21 через моменты времени Ц и U: У2 {h) - С21еа Хг-" = щ (f4) = Г1 —УА( -" (г-" + g r gft( 4) _

Получение аппроксимации решения прямой задачи

Наряду с применением схем дискретизации разных порядков точности исследовалась разностная схема с переменным шагом дискретизации. Переменный шаг дискретизации использовался в схеме Эйлера второго порядка точности. Сгущения узлов дискретизации делались в окрестности точек переключения управлений. Так, на участках постоянства множеств индексов активных ограничений дискретизация проводилась с шагом ht =0.4, в окрестности точек переключения дискретизация осуществлялась с шагом h2 = 0.02 (использовалась схема Эйлера второго порядка). Хотя при этом общее число шагов составило N = 535, но оценки для времен переключений получены с большей точностью, чем при постоянном шаге дискретизации и N = 100. Точное решение дает: /,=7.689788139, гг =29.73687498, t3 = 45.46140320 , tA =88.31270799. При решении с переменным шагом получаем оценки: 7.68 йґ, 7.7, 29.72 t2 29.14, 45.46 r3 45.48, 88.3 Й t4 88.32. При решении с постоянным шагом (схема Эйлера второго порядка) при N—100: 7.43 ;, 7.71, 29.57 t2 29.71, 45.29 /3 45.43, 88.14 tA 88.29. Как видно из приведенных данных, использование дискретизации с переменным шагом повышает точность определения времен переключения. Кроме того, дискретизация с переменным шагом более адекватно отражает поведение траектории на промежутках скачков управлений или их быстрого роста, Естественно, все это справедливо в предположении, что дискретная задача корректно аппроксимирует исходную непрерывную.

Кроме того, рассматривалась задача, которая является сопряженной к исходной задаче (в соответствии с теоремой 1 гл. 2). Ее формулировка приводится ниже. Все параметры сопряженной задачи берутся из исходной задачи.

Для сопряженной задачи была построена дискретная аппроксимация с использованием тех же схем {использовалась схема Эйлера второго порядка точности) и шагов дискретизации, что и для исходной задачи, сформулирована и решена соответствующая задача ЛП, По утверждению 1, решениями сопряженной задачи являются множители Лагранжа и сопряженные переменные, которые удовлетворяют принципу максимума Понтрягина и формализму Дубовицкого-Милютина. v,(t) v„(t)

Управления vg(t),...,v11(t) тождественно равны нулю на всем промежутке [0,Г], и на рисунке не показаны, чтобы не перегружать рисунок несущественной информацией. Проверка достаточных условий экстремума (2.5.9)-(2.5.11) на паре дискретных задач позволила говорить об оптимальности решения прямой задачи. Конкретно, все соотношения (2.5.9)-(2.5.11) выполнены во всех узлах дискретизации. Кроме того, значения функционала в исходной и сопряженной задачах совпадают с высокой точностью, что еще раз подтверждает оптимальность численного решения. На рисунке 18 приведена зависимость от числа точек разбиения N функционалов прямой задачи и связанной с ней задачи. При этом функционал прямой задачи берется со знаком минус, так как в условиях (2.5.1)-(2.5.4) задачи А ищется максимум функционала, а в исходной задаче ищется минимум функционала (4.3.8). Как указано в 3.2, возможен двухэтапный подход к решению параметрических линейных задач ОУ со смешанными ограничениями, когда на нижнем уровне многократно решается линейная задача ОУ при фиксированных параметрах, а на верхнем уровне решается задача оптимизации функционала на множестве параметров. Для описанной модели (4.3.2)-(4.3.8) проведено исследование задачи по параметру. Для этого рассматривалась некоторая модификация задачи, выражающаяся в том, что коэффициенты к{ и J32 уже не являлись постоянными во времени, а представляли из себя прямоугольные импульсы постоянной длины t = 5. Начала импульсов jk и jb2 являлись параметрами задачи (jk задает начало скачка по коэффициенту АГц jb2 - по коэффициенту Р2). Внутри импульсов коэффициенты л ! и Рг имели значения A"j = 0.99, р2 =0.1, вне импульсов - стандартные значения задачи fc{ = 0.9, /?2 =0.18.

Требовалось найти оптимальные значения параметров задачи, при которых функционал задачи принимал наименьшее значение на множестве параметров 1. Значения целевого функционала при различных значениях параметров приведены на рис. 9. В данном случае численно решался набор задач ЛП, получающихся после дискретизации задач ОУ при изменении начал импульсов jk и jb2 от 1 до 94 с шагом 1. В силу быстрого решения задачи ЛП на нижнем уровне (выбиралось N=100) построение такой сетки значений (т.е. решение такого количества задач) не представляло сложности во временном плане. В случае же трудоемкости решения задачи на нижнем уровне возможно применение итеративных схем, в которых решение, полученное при данных значениях параметров, дает информацию для следующего выбора новых значений параметров.

Ограничения на фазовые переменные и управления системы

Пусть дана задача вида (3.3.1)-(3.3.4). Будем рассматривать каждое допустимое управление и соответствующую ему фазовую переменную как одну траекторию системы. Все такие траектории, удовлетворяющие условиям (2.3.3), образуют допустимое множество G. При дискретизации задачи отрезок [0tT\ разбивается точками /,-, i = 0,N на отрезки меньшей длины. Набор точек разбиения будем обозначать символом w. Если найдены значения управления в точках разбиения w, то можно получить кусочно-постоянное на отрезке [0,Т] управление, положив при г є ( ,_,, fj u(t)=ur

Пусть матрицы A(t), B(t), f{t). С, (t), ,(/), b t) кусочно непрерывны на отрезке /є / = [О, Т]. Пусть допустимое управление u(t) = U Vf = /, где U zRm - выпуклый компакт. Тогда множество V = {и = «(г)е (/): и(і)є С/,С(/).г(г) + ),(г)и(г) b t)}, где условия выполняются почти при всех /є / , будет слабо компактным в / (/)- Доказательство этого факта заключается сначала з доказательстве замкнутости множества V , проверке выпуклости и ограниченности, а затем применении теоремы 4 3 гл. 1 {6], которая утверждает, что всякое ограниченное замкнутое выпуклое множество из рефлексивного банахова пространства В слабо компактно. А по известной теореме о минимизации слабо полунепрерывной функции на слабо компактном множестве: «Пусть V - слабо компактное множество из банахова пространства В, функция J{u) определена, конечна и слабо полунепрерывна снизу на V. Тогда Jt = inf j(u) -, множество Vt = {we V : У(и) =/,,} непусто, слабо компаетно и любая минимизирующая последовательность {и } слабо сходится к V,» получаем слабую сходимость минимизирующих последовательностей.

Теорема. Пусть w a, w" -две последовательности разбиений отрезка [0,Т], причем и/- 0, \w \— 0, w - разбиение для кусочно-постоянного управления, такого, что траектория системы принадлежит 5-сужению допустимого множества G. Пусть wcwfn, w с w . Тогда решения дискретной задачи и„-, соответствующие разбиению w[, слабо сходятся при п — « к и , решения дискретной задачи и№., соответствующие разбиению w", слабо сходятся при /Имко и j(u ) = j{u ). Доказательство. Покажем, что утверждение теоремы выполнено для вложенных разбиений, содержащих разбиение «внутренней» траектории w. Именно, если wcwn с и „ Vrc л0, w„ — 0 (а следовательно, и [iv„[ —»0), решение дискретной задачи uw, отвечающее разбиению wn слабо сходится к и при «—»« , решение дискретной задачи и , отвечающее разбиению wn слабо сходится к » при п — , то J[u J= J[u J.

Так как a xul(t) + b uw(t) c! при te.wn, то Vf є [0,Г] выполняется: a w(f) + b «w(f) Cj+MJivnj с,-+, V« JVf () Возьмем выпуклую комбинацию управления ищ и «внутреннего» управления н: ив =«„,« +(і —аг)и, где егє (ОД). Для такого управления выполняется принцип суперпозиции фазовых переменных (в силу линейности задачи), то есть фазовая переменная, соответствующая данному управлению есть линейная комбинация фазовых переменных, соответствующих управлениям uw и »: ха хл.а + {\ а)х. Следовательно, a xa(t) + b ua(i) ct +ae {l a)S, Vte[o,7]. Выберем є так, чтобы выполнялось сеє — (і - а)5 О. Данное соотношение будет верным при а(є+5) S,umt а -.Выбрав а = -.получим: д ;са(/)+/ »в(ї) с(-, V/є [0,г]. є + о є + о

Полученное управление «ДО является кусочно-постоянным управлением, соответствующим разбиению wn. Кроме того, оно является допустимым управлением для исходной(непрерывной)задачи. Для дискретной задачи с разбиением w„ =) vvn рассмотрим оптимальное управление и» и управление иа, являющееся допустимым. Для значений функционала на этих управлениях справедливо соотношение: 1 ) ./(1 )=0/(11 )+(1-( )./(5). При п—»« справедливо: j(u ) r-j(uT) aJ{uw) + (l-a)j(u) al(u )+(l-a)j(u). То есть у(и ) а/(» )+(1-а)7(й), где а- -, У є 0. Переходя к пределу при е- О, є + о получаем: СС = — — 1 и j[u ) j[u j.

Для доказательства неравенства в обратную сторону необходимо ввести понятие осреднения на разбиении w некоторого управления н(/): ии. Положим значение управления uw в точке /,. (и на промежутке (/,. рг,]) равным: и, =— \н{т)с1т, і = 1,ЛГ. При этом, по At- J доказанному в [6], отличие траектории x{t) от траектории JC„ можно оценить, как JC(/)-JCU,C Со« ги , где Const зависит от коэффициентов задачи (фундаментальной матрицы решений, нормы матриц и столбцов, участвующих в дифференциальных уравнениях, отрезка интегрирования).

Применим осреднение на разбиении w к любому допустимому управлению wff (напомним, что wcvv), получившееся управление будем обозначать как uw. Пусть этому управлению соответствует фазовая траектория xw. Тогда xff—лЛ Ccvwfw, и при стремлении мелкости разбиения к нулю данную величину всегда можно сделать меньше любого числа є 0. Рассмотрим иа = oatw + (l — a)u . В силу допустимости управления и , во всех точках разбиения w выполняются смешанные ограничения типа неравенства: а х-{т) + Ь }и {т) сг j = l,m, VTG W. На всем отрезке [0,Т] нарушения смешанных ограничений будут a}xu{i)+b)u-{t) Cj,+ Cvvj.

Численные методы решения задач оптимального управления с использованием дискретной аппроксимации Чекарев Денис Анатольевич

Формулировка темы работы. Актуальность

Необходимые условия оптимальности для общей задачи оптимального управления. Принцип максимума Понтрягина и формализм Дубовицкого-Милютина

Получение аппроксимации решения прямой задачи

Ограничения на фазовые переменные и управления системы

Похожие диссертации на Численные методы решения задач оптимального управления с использованием дискретной аппроксимации