Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Декомпозиция в задачах оптимального управления с запаздываниями Федько Ольга Сергеевна

Декомпозиция в задачах оптимального управления с запаздываниями
<
Декомпозиция в задачах оптимального управления с запаздываниями Декомпозиция в задачах оптимального управления с запаздываниями Декомпозиция в задачах оптимального управления с запаздываниями Декомпозиция в задачах оптимального управления с запаздываниями Декомпозиция в задачах оптимального управления с запаздываниями Декомпозиция в задачах оптимального управления с запаздываниями Декомпозиция в задачах оптимального управления с запаздываниями
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Федько Ольга Сергеевна. Декомпозиция в задачах оптимального управления с запаздываниями : ил РГБ ОД 61:85-1/198

Содержание к диссертации

Введение

Глава I. Декомпозиция на основании агрегирования переменных в задачах оптимального управления системами с сосредоточенными пара метрами и запаздываниями d6

1.1. Линейные задачи /5

1.2. Выпуклые задачи с непрерывным временем

1.3. Задача дискретного оптимального управления с запаздываниями 39

Глава II. Разложение в управлении системами с распределенными параметрами и запаздываниями

2.1. Итеративная декомпозиция путем агрегирования в управлении системами параболического типа 60

2.2. Редукция к задачам меньшей размерности в модели с параболическими уравнениями и запаздывающими граничными управлениями

Глава III. Эффективность декомпозиции на основании агрегирования переменных для задач управления с запаздываниями

3.1. Линейные системы с квадратичным функционалом, содержащим интегральные по фазовым переменным слагаемые

3.2. Функционал с терминальными по фазовым переменным слагаемыми

Заключение

Выпуклые задачи с непрерывным временем

Программно-целевое планирование и управление предполагает использование системы самых разнообразных экономико-математических моделей, в том числе - формализованных в виде задач оптимального управления (Г.С.Поспелов, В.А.Йриков /I /, Г.С.Поспелов, ВЛ.Вен, В.М.Солодов, В.В.Шафранский, А.Й.Эрлих /2 /). Процессу планирования и функционированию планируемых систем свойственна определенная инерция. Один из способов учета ее -введение в математическую модель запаздывающих аргументов. Так, в экономике широко известны временные лаги, возникающие, в частности, при вводе мощностей х . Их принимают во внимание в процессе формирования программ отраслей производственной сферы /2, гл. У/. Другой важный класс задач с запаздываниями по времени возникает при реализации программ развития сложных технических систем в пятилетних планах.

Здесь использованы следующие вектор-функции: WfeJ - количество изделий по номенклатуре элементов системы в году і ;WftJ- является вектором фазовых переменных; R/i) - закупаемые в году і изделия, которые играют роль управлений; УЮ - вектор убыли изделий. При износе изделий, рассчитан х) Запаздывания, обусловленные продолжительностью строительства и связанные с ними линейные динамические задачи оптимального управления в функциональном пространстве, исследуются в / 8 /.

Важной особенностью используемых при программно-целевом планировании и управлении математических моделей является их многомерность. Последнее обстоятельство связано с тем, что планируемые системы, как правило, состоят из большого числа элементов либо характеризуются значительным количеством параметров -измеряемых сотнями или даже тысячами / -/ /.

Таким образом, при планировании развития сложных технических систем возникают оптимизационные динамические задачи, в которых, с одной стороны, велико число переменных, с другой стороны, эти переменные могут зависеть от запаздывающих по времени аргументов. Декомпозиция (разложение) подобных задач целесообразна с точки зрения более эффективного использования ресурсов ЭВМ и учета их специфики. Эта специфика, в частности, обусловлена блочной структурой задач, которая возникает ввиду иерархии. Важность процедур понижения размерности в реальных процессах планирования и управления подчеркивается в книге

Анализ подобных проблем программно-целевого планирования позволил выделить предмет исследования настоящей работы - двухуровневые многомерные задачи оптимального управления с запаздывающими аргументами (или с последействием). Следует отметить, что значение такого класса задач не ограничивается экономическими приложениями. Их исследование важно и для физики, техни -6 ки, биологии, медицины. Соответствующие постановки могут быть основаны на тех, которые без предположения о блочности приводятся в книгах Х.Гурецкого / /, В.Б.Колмановского, В.Р.Носова / О /, обзорах 0 &cJk //.Г., 7fta/zitiud Я./б6/, a/f №./-/., 4 ?&тал 977. ./67/ Яе оиг 1Я. С, Жа/и&ид #. /&У и других работах. В обширной библиографии по задачам с отклоняющимися аргументами крайне малая ее часть посвящена проблеме большой размерности. В ранних работах этого направления - до 60-х годов (см., например, А.Д.Мышкис I м /, А.М.Зверкин, Г.А. Каменский, С.Б.Норкин, Л.Э.Эльсгольц / , /, Н.Н.Красовский / /) указанная проблема не изучалась (см. также А.Халанай I & /). Мощным аппаратом для исследования задач оптимального управления с запаздывающими аргументами явились необходимые условия оптимальности в форме принципа максимума Понтрягина / / (системы с сосредоточенными параметрами и непрерывным временем - Г.Л.Ха-ратишвили / /, И.А.Ожиганова // /, Р.Габасов, С.ВЛура-кова / 0 /, Р.Габасов, Ф.М.Кириллова / /, $ znfa 77/ Же б2. С7./60,70/ и др.; дискретные задачи - Фам Хыу Шак / 4 з / и др.; системы с распределенными параметрами - Канте Кабине / /, Г.Л.Дегтярев, Т.К.Сиразетдинов / 2&/% Т.С.Цуцунава / /, С.С.Ахиев и др.

Задача дискретного оптимального управления с запаздываниями

Обсуждение результатов опыта его применения можно найти в / ZJ-ЗО / р.Габасова, Ф.М.Кирилловой, / 5/ / Л.Э.Эльсгольца, С.Б.Норкина, / / Т.К.Сиразетдинова, статьях J63, 6 7-73 /, чей не менее, использование принципа максимума для получения численных решений некоторых задач оптимального управления с последействием приводило к двухточечным краевым задачам с опережающими и запаздывающими аргументами, которые, по мнению ряда авторов (Р.Беллман, К.Л.Кук /зз /, -? fccw MM, 4оЄстлл &?.#./6 /. Gqpafa&zU/iaaa /7ta z . /?/t Ma№ Ja mei т. /73/ и др#) чрезвычайно сложны. Альтернативные пути решения были предложены в I 2-7& /. Большинство авторов рассматривали довольно частные постановки: например, в /Є7, 7г - 76 / - без ограничения на фазовые переменные. Чаще всего анализировались линейные дифференциально-разностные уравнения и квадратичные функционалы / 73, 76-70/. В нелинейных случаях, в основном, предлагались процедуры линеаризации / ?о /и аппроксимации (так, в / / / - конечно-разностная, а в / яг / - полиномиальная).. Однако, эффективность указанных методов резко падала при возрастании размерностей задач. Обратимся, например, к одному из наиболее распространенных приемов для решения задач оптимального управления с запаздываниями - методу редукции их к обычным I 7,щм,#з1 . В этом случае размерности вновь получаемых задач оказываются существенно выше, чем исходных. Поэтому для больших размерностей исходных задач указанный метод становится непригодным / 72, 73 /.

В 70-х годах начали появляться работы по задачам с отклоняющимися аргументами большой размерности. Разложение динамических систем с запаздываниями рассматривалось в /34, 76, J 4 J% вычислительные алгоритмы для синтеза управления с обратной связью в многомерных системах с запаздывающими аргументами предлагались в / SS-J? /# Отметим работу Ю.Е.Малашенко /JS /, в которой для линейной дискретной задачи оптимального управления предлагалась декомпозиция по времени.(Постановка вопроса принадлежит Ю.П.Иванилову). Тем не менее, проблемы понижения размерности в задачах оптимального управления с запаздываниями все еще мало -/ изученн. Для решения многомерных задач в последнее время все шире используются различные декомпозиционные методы; достаточно пол ный их обзор приведен в монографии В.И.Цуркова / /. Замечено, что вопросы понижения размерности для блочных задач оптимально го управления исследованы в гораздо меньшей степени, чем для математического программирования / з /. Методов разложе ния двухуровневых задач оптимального управления с запаздываниями, тем более, не предлагалось. Введение же в математические модели запаздывающих аргументов может качественно изменить их свойства и поведение. Так, уже классическими являются примеры задержки сгорания топлива в камере жидкостного ракетного двигателя как причине неустойчивости горения /36 /, запаздывающая обратная связь является принципиальным звеном в системах автоматического регулирования (А.А.Красовский, Г.С.Поспелов / /). В работе А.Н.Дюкалова и др. I s / при рассмотрении магистральных свойств оптимальных траекторий подчеркивается необходимость проведения дополнительных исследований в случае учета запаздываний. Поэтому "автоматический" перенос на задачи с последействием методов, ориентированных на обычные системы, недопустим. Таким образом, представляется актуальной разработка методов декомпозиции для задач с последействием. Целью настоящей работы является обоснование возможности использования для решения блочно-сенарабельных задач оптимального управления со смешанными ограничениями и запаздывающими аргументами как в фазовых координатах, так и в управлениях универсального метода декомпозиции - путем введения агрегированных переменных, развитого В.И.Цурковым /3-? /. Исследуется также возможный подход к проблеме понижения размерности некоторого -9-класса систем с запаздываниями, основанный на предложенном в I 4 I методе редукции для линейно-квадратичных задач оптимального управления. Заметим, что схемы итеративного агрегирования, на которых базируется указанный метод, впервые применялись для специальных блочных задач линейного программирования В.Г.Медницким / 3 s / и И.А.Вателем, Ю.А.Флеровым / 39 /.

Редукция к задачам меньшей размерности в модели с параболическими уравнениями и запаздывающими граничными управлениями

Метод декомпозиции путем введения агрегированных перемен -ных, разработанный В.И.Цурковым /з /, основан на принципах двойственности для экстремальных задач. В настоящей работе также предполагаются выполненными условия, обеспечивающие справедливость теорем двойственности. Как и в /J7 /, используется техника А.М.Тер-Крикорова сведения задач оптимального управления к задачам выпуклого программирования в банаховых пространствах 1-40, 41 /» конкретизированная на случай запаздывающих аргумен -тов. Следует заметить, что условия, гарантирующие выполнение соотношений двойственности для оптимизационных задач, могли бы быть взяты иными - принятыми, например, в работах Б.Ш.Мордухо-вича, А.М.Сасонкина /4г / для систем нейтрального типа или А.И.Дюкалова /43,44 / для обычных систем.

В первой главе дается обоснование применения метода декомпозиции путем агрегирования переменных к решению блочно-сепарабель -10 ных задач оптимального управления с запаздываниями в фазовых координатах и управлениях. Рассматриваются задачи с непрерывным ( I.I - 1.2) и дискретным ( 1.3) временем. Исследование линейных ( I.I) и выпуклых ( 1.2 - 1.3) задач проводится по традиционной для метода /3-ї / схеме. После введения агрегированных управлений как суммы переменных из разных блоков и фиксированных весов агрегирования решается координирующая задача. Она получается в результате подстановки в исходную управляющих переменных, выраженных через макроуправления и веса агрегирования. Решив Л и сопряженную ей, формулируют и решают независимые блочные задачи. Функционалы последних формируются с помощью оптимальных значений двойственных переменных, соответствующих связывающим ограничениям агрегированной задачи. Из блочных и дезагрегированных решений выводится выражение для критерия оптимальности. Если значение этого выражения равно нулю, то дезагрегированное решение оптимально для исходной задачи (теоремы 1,3 I.I - 1.3). В противном случае строятся новые веса агрегирования и осуществляется переход к следующей итерации. Если на верхнем уровне помимо решения пары сопряженных задач в агрегированных переменных проверяется критерий оптимальности и назначаются новые веса, а на нижнем - решаются независимые блочные задачи, то одна итерация метода декомпозиции представляется одним замкнутым циклом на рисунке .

Сравним эту схему с соответствующей из работы М.Месаровича, Д.Мако, И.Такахары /стр.НО/. Между ними имеется принципиальное отличие: в то время как в результате декомпозиции путем агрегирования решением исходной задачи оказывается дезагрегированное (верхнего уровня), стратегии координации в /4?/ направлены на получение в качестве решений блочных. Существенно различна в этих подходах роль связывающих ограничений. Б / 4? / они подвергаются декомпозиции, при этом вводятся некие функции взаимодействия каждой подсистемы с остальными. В / 3- 7- / разложения связывающих ограничений не предпринимаются.

На протяжении всей первой главы настоящей работы сопряженные задачи выписываются с учетом результатов работ //?- $ . В теоремах 2, параграфов I.I - 1.3 устанавливается монотонность по функционалу итеративного процесса решения. При этом используются теоремы двойственности Куна-Таккера и теоремы о маргинальных значениях в параметрическом программировании. Их справедливость обеспечивается выполнением условий из работ А.М.Тер-Кри-корова / 40 / и Е.Г.Гольштейна / /, Е.С.Левитина / /. Посколь ку результаты /40 /по доказательству соотношений двойственности и справедливости принципа максимума Понтрягина в нормальной форме (без мер) относились к задачам оптимального управления со смешанными ограничениями без отклонений аргументов, в прило -жении I доказываются соответствующие теоремы для линейных и выпуклых задач в случав запаздываний. После необходимого теоретического обоснования применения метода декомпозиции для систем с запаздываниями ( I.I - 1.3) в заключительной части первой главы, 1.4, конструкции и возможности подхода демонстрируются ва ряде примеров. Первый из них интересен тем, что допускает аналитическое исследование всех построений метода разложения. Второй пример можно рассматривать как системную постановку оптимизации процессов в химико-технологических объектах из /SO /. В уравнения состояния как фазовые, так и управляющие переменные входят с запаздываниями по времени. Последний пример обладает некоторой спецификой, позволяющей свести его к решению последовательности систем линейных алгебраических уравнений с помощью конструкций из / 4 /. В 1,4 исследуется эффективность применения методов редукции или агрегирования переменных в зависимости от значений параметров задачи (числа подсистем и количества значений запаздываний). Результаты сравниваются с соответствующими у В.И.Цуркова для систем без запаздываний. Устанавливается, что введение запаздывающих аргументов усложняет задачи настолько, что обойтись без их декомпозиции не представляется возможным.

Функционал с терминальными по фазовым переменным слагаемыми

Многомерная задача оптимального управления с запаздываниями для систем с частными производными параболического типа и граничными управлениями исследуется в 2.2. Она возникает при рассмотрении процесса нагрева J пластинок системой нагревателей в условиях ограниченных общих ресурсов на нагревание. Соответствующую модель для »7=1 можно найти в книге А.Г.Бутковского / г /. Там указывается на задержку при передаче тепла, обусловленную скоростью теплопереноса. В силу этого в модель процесса граничное управление входит с запаздывающим аргументом. Аналогичная блочная задача, но без отклонений , исследовалась В.И.Цурковым в /з-s /. При условии одинаковых физических свойств пласззин удалось провести редукцию исходной системы к системам меньших размерностей, причем в отличие от итеративной декомпозиции на основе агрегирования удается сведение к системам линейных алгебраических уравнений небольшой размерности. В 2.2 устанавливается, что указанный подход применим и для систем с запаздываниями.

В третьей главе настоящей работы рассматриваются два конкретных примера использования метода декомпозиции путем агрегирования к оптимальному управлению линейными системами с запаздывающими управлениями и квадратичными функционалами, содержащими: интегральные ( 3.1) и терминальные ( 3.2) по фазовым переменным слагаемые. Следует отметить, что вторая задача возникает при аппроксимации конечным числом членов ряда Фурье решения задачи о нагреве систем пластинок с запаздывающим граничным управлением, как это предложено в книге А.И.Егорова /«$"« / в отсутствии запаздываний. Проведение построений метода декомпозиции и подробное исследование аналитического вида получаемых промежуточных задач - агрегированной и блочных - положены в основу алгоритмов и реализующих их АЛГОЛ-программ.

Обсуждаются результаты численных экспериментов на ЭВМ БЭСМ-б с транслятором АЛГОЛ-Дубна, в том числе - влияние на конечный результат исходных весов агрегирования. В 3.1 выясняется, что непосредственное использование принципа максимума приводит к двухточечной краевой задаче с опережающими и запаздывающими аргументами, решение которой соряжено со значительными трудностями. Задача же из 3.2 сводится, если отказаться от ее декомпозиции, к системе линейных алгебраических уравнений большой размерности. Для рассматриваемых конкретных значений параметров решение последней в реальном времени невозможно ввиду ограниченной оперативной памяти ЭВМ. Блок-схемы программ приводятся: для 3.1 - в приложении 2, для задачи из 3.2 - в приложении 3.

Основные итоги работы подведены в заключении. Результаты настоящей работы докладывались и обсуждались на ХХУП, ХХУШ научных конференциях МФТИ (Долгопрудный, 198I, 1982), совещании "Теория и практика использования методов агрегирования в планирований и управлении" (Казань, 1982 г.), семинаре лаборатории организации и проектирования больших систем ВЦ АН СССР. Основные результаты диссертации опубликованы в статьях / 92-36 / .

Выражаю глубокую благодарность за научное руководство доктору физико-математических наук В.И.Цуркову и члену-корреспонденту АН СССР Г.С.Поспелову за постоянное внимание к работе.

Как показано в работе, степень rjN притяжения, соответствующая физически разумным значениям параметров г/Л7 взаимодействия, недостаточна для образования связанного состояния в трехчастичной системе ijNN. Соответствующий полюс уходит с физического листа в нефизическую область, тем самым свидетельствуя о существовании лишь виртуального уровня в rjNN системе. В то же время, виртуальный полюс оказывается вблизи физической области, и этот факт в решающей степени определяет физические свойства взаимодействия /-мезоиа с двумя нуклонами. В частности, следует ожидать, что низкоэнергетическое TJJVA взаимодействие характеризуется большой длиной рассеяния и, соответственно, большим сечением. В свою очередь, этот факт должен приводить к значительному влиянию взаимодействия в конечном состоянии в реакциях образования //-мезонов вблизи порога. Поиск резонансных полюсов на втором ркмановом листе ниже положительной вещсствешюй оси энергии дает отрицательный результат, в связи с чем следует сделать вывод о невозможности возникновения трехчастичных rjNN резонансов, существование которых рассматривается в некоторых работах. Во второй части главы 2 изучаются реальные физические процессы, связанные с взаимодействием jj-мезонов с двухнуклонньши системами - упругое и неупругое r\d рассеяние, а также рождение -мезонов на этих системах. Для этой цели трехчастичные динамические уравнения решаются для физических r\NN состояний. Как и в предыдущей главе, базовым элементом модели является сепарабельиое представление затравочных А7Л7 и i]N взаимодействий. Для построения матрицы r)N рассеяния используется стандартная изобарная модель. В качестве основного механизма взаимодействия выступает возбуждение резонанса 5 (1535). Соответствующие параметры выбираются таким образом, чтобы, с одной стороны, сохранялось хорошее описание амплитуд "/N — тгЛ7, гЛг — rjN и nfN — rjN вблизи порога рождения -мезона, а с другой стороны, модель предсказывала бы длину rjN рассеяния anN равную (0.5+І0.32) frn. Последнее значение следует рассматривать в качестве усредненной величины а.,;д , даваемой современными анализами. Для включения NN сектора используется сепарабелы-юе представление парижского потенциала, хорошо воспроизводящее не только фазы NN рассеяния по и исходный потенциал во внезиерге-тической области вплоть до значений кинетической энергий Г = 500 МэВ в лабораторной системе отсчета.

Похожие диссертации на Декомпозиция в задачах оптимального управления с запаздываниями