Оптимальное управление и оценивание движения в некоторых задачах динамики Шматков Антон Михайлович

Диссертация - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Шматков Антон Михайлович. Оптимальное управление и оценивание движения в некоторых задачах динамики: дис. ... доктора физико-математических наук: 01.02.01 / Шматков Антон Михайлович;[Место защиты: Институте проблем механики им. А.Ю. Ишлинского РАН].- Москва, 2012.- 280 с.

Содержание к диссертации

Введение

Глава 1. Использование детерминированных моделей для оптимизации систем

1.1. Оптимальное по быстродействию достижение заданной точки с нулевой конечной скоростью 19

1.2. Оптимальное по быстродействию достижение сферы с нулевой конечной скоростью 33

1.3. Влияние вязкой среды 52

1.4. Уклонение от неподвижной сферы с помощью ограни ченной силы 66

1.5. Инерционность при реализации управления 84

Глава 2. Оптимальный по быстродействию манёвр “петля” без потери скорости

2.1. Постановка задачи 98

2.2. Оптимальное управление в трёхмерном случае 106

2.3. Учёт ограничения на знак кривизны траектории...111

Глава 3. Развитие и применение метода эллипсоидов

3.1. Общие положения 118

3.2. Новый способ аппроксимации оценки состояния линей ной системы на основе метода эллипсоидов 124

3.3. Оптимальный выбор ограничений по управлению..133

3.4. Оценивание фазового состояния динамической системы при неточно заданных границах возмущений 139

3.5. Управление матрицей системы 146

3.6. Неточная реализация управления 152

Глава 4. Сопоставление стохастического и эллипсоидального оценивания неопределённости в динамической системе с возмущениями, ограниченными по величине

4.1. Обсуждение проблемы 163

4.2. Системы, близкие к стохастическим 167

4.3. Построение возмущений, одинаково действующих на систему 173

4.4. Сравнение воздействия винеровского и ограниченного процессов 176

4.5. Построение аналога фильтра Калмана для гарантированной оценки состояния динамической системы 182

Заключение 191

Литература 193

Приложение 220

Оптимальное по быстродействию достижение сферы с нулевой конечной скоростью
Оптимальное управление в трёхмерном случае
Новый способ аппроксимации оценки состояния линей ной системы на основе метода эллипсоидов
Построение возмущений, одинаково действующих на систему

Введение к работе

Актуальность исследуемых задач обусловлена тем, что в математической теории оптимального управления сравнительно мало решённых задач, для которых создан алгоритм, позволяющий сравнительно быстро вычислять синтез, и ещё меньше таких, для которых последний построен в аналитической форме. Основная причина состоит в том, что после применения известного принципа максимума Л. С. Понтря- гина в большинстве случаев приходится решать нелинейную краевую задачу вдвое большей размерности, чем исходная. Однако для приложений в связи с необходимостью построения опорных управлений и оценок полезны полные точные решения задач управления движением при упрощающих предположениях относительно структуры объекта, вида и формы наложенных на него ограничений. Поэтому представляют интерес любые математические модели, где решение в указанном виде возможно, если они отражают реальность лучше, чем те, где оно уже найдено, без введения дополнительных переменных или используют минимальное их количество. В особенности это относится к случаям, когда на систему влияют различные неопределённые факторы: внешние возмущающие силы, неконтролируемые вариации параметров, погрешности в измерении начальных условий. Иногда, как это показано в тексте диссертации, можно сделать полезные выводы в рамках строго детерминированных построений, без расширения фазового пространства задачи для включения дополнительных переменных, описывающих такие факторы. К сожалению, такое удаётся редко. Для создания удовлетворительной модели приходится прибегать к различным способам описания указанных факторов.

Самым распространённым подходом к исследованию неопределённых величин является вероятностный (стохастический) метод. В нём каждому неопределённому вектору сопоставляется некоторое распределение вероятностей с заданной плотностью. Соответствующим математическим аппаратом является теория случайных процессов. Отметим, что вероятностный подход требует знания статистических характеристик исходных неопределённых факторов, что далеко не всегда доступно на практике.

Гарантированный (минимаксный) подход оперирует с множествами, в которых лежат неопределённые векторы. При этом предполагается, что неизвестные помехи локализованы в известных множествах, а в остальном произвольны. Наиболее адекватным математическим аппаратом для его описания должна служить теория дифференциальных игр. Однако она весьма сложна, а многие полезные выводы могут быть получены более простыми способами. В частности, при последовательном её применении в результате аффинных преобразований, сложения и пересечения множеств могут получаться многообразия сложной, и, самое главное, трудно предсказуемой формы, даже если исходные множества в начальный момент времени имели геометрическую форму, требующую небольшого числа параметров для обработки и хранения.

Оценки показывают, что даже в линейном случае без создания принципиально новых моделирующих устройств ни сейчас, ни в обозримом будущем достаточно полные поточечные описания в пространствах большой размерности для сколько-нибудь широкого класса реальных систем не найдут материальной базы для воплощения. Очевидность этого обстоятельства вызывает к жизни попытки ввести множества простой (канонической) формы, приближающие настоящие множества достижимости. Под простой понимается такая форма, которая при соблюдении допустимой точности аппроксимации требует приемлемых вычислительных ресурсов. При этом все входящие в задачу множества заменяются на множества канонической формы. Возникает задача построения операций над каноническими множествами, результат которых был бы максимально близок в смысле некоторого критерия к результату соответствующих операций над истинными множествами неопределённости.

Во-первых, это многогранники. Наиболее часто употребляют параллелепипеды, причём их грани во многих случаях параллельны координатным плоскостям, что приводит к интервальному анализу. Во- вторых, это эллипсоиды, использовать которые в качестве канонических множеств предложил F. C. Schweppe в 1968 г.. Метод был развит в [20-24] и др. Используют и более сложные множества.

С точки зрения применения в реальных технических устройствах желательно, чтобы гарантированный способ аппроксимации удовлетворял следующим требованиям.

1. Геометрические фигуры, которыми в конечном итоге приближают множества достижимости в рамках некоторого метода, должны быть понятны специалистам, которые будут им пользоваться, т. е. инженерам.

2. Для достижения удовлетворительной точности аппроксимации должно быть достаточно сравнительно небольших вычислительных ресурсов.

Здесь следует принять во внимание то, что переход от реальных устройств к математическим моделям часто порождает значительную ошибку, по сравнению с которой погрешность аппроксимации при использовании множеств канонической формы может оказаться несущественной.

3. Способ должен допускать сравнение с вероятностным оцениванием.

Дело в том, что реальные неопределённости крайне редко носят чисто случайный или чисто игровой характер. Следовательно, приходится выбирать между гарантированным и вероятностным подходами. Для этого гарантированный способ должен быть "близок" к вероятностному, а последний, как правило, опирается на гауссовы распределения неопределённых величин.

Метод эллипсоидов удовлетворяет всем указанным требованиям.

В диссертации используются эллипсоидальные оценки, основанные на [22], [23] и многих других исследованиях, выполненных в ИПМех РАН под руководством академика РАН Ф. Л. Черноусько за последние тридцать лет.

Отметим, что все рассматриваемые функции времени таковы, что решения дифференциальных уравнений, в которых эти функции используются, существуют, а все случаи наложения дополнительных ограничений оговорены отдельно. Зависимость всех введённых величин от времени явно указана при их определении и далее может быть опущена ради уменьшения громоздкости формул. Через / везде обозначена единичная матрица размерности к х к.

Публикации. Основные результаты диссертации опубликованы в работах [1—19]. Основные результаты, выносимые на защиту и опубликованные в работах [1—10], [18] и [19], получены автором диссертации.

Структура и объём диссертации. Диссертация состоит из введения, четырёх глав, заключения, списка литературы и приложения. В приложении собраны рисунки и таблицы ко всем главам диссертации, а конце приведён список соглашений и обозначений, использованных в тексте диссертации.

Количество страниц в диссертации — 280, в том числе иллюстраций — 60.

Оптимальное по быстродействию достижение сферы с нулевой конечной скоростью

1. Постановка задачи. До сих пор, согласно сказанному в начале 1.1, действовало допущение, что регулятор, сконструированный для компенсации малых отклонений, и подсистема, предназначенная для реакции на резкие скачки возмущающей силы, работают одновременно. Однако может оказаться целесообразным разделить области действия этих устройств. Введём сферу в фазовом пространстве задачи с центром в начале координат так, чтобы внутри неё действовал только линейный регулятор, а вне — устройство, использующее алгоритм оптимального управления. Тогда этот алгоритм должен приводить систему с нулевой скоростью не в начало координат, как в 1.1, а на поверхность указанной сферы. Аналогичным образом может быть поставлена задача о выходе точки за пределы сферы, т. е. о выводе системы из некоторой “запрещённой” области. Исследуем оба случая.

Рассмотрим движение материальной точки постоянной массы т в пространстве произвольной размерности п 1, под действием ограниченной по модулю силы F х = v, тії = F, ж(0) = х , -у(О) = v , F FQ (1.2.1) Ставится задача оптимального по быстродействию приведения на сферу S произвольного радиуса г 0 с нулевой скоростью (“мягкая посадка”) \x(tf) — хо\ = г, v(tf)=0, tf — min (1.2.2) F Ограничения на возможные положения точки х не наложены: она может находиться как внутри сферы, так и вне её, а траектория может пересекать поверхность S. Ситуация, когда сфера “непроницаема”, также представляет значительный интерес и требует отдельного рассмотрения. В этом случае решение задачи попадания на сферу требует предварительного решения задачи уклонения (см. 1.4). Отметим, что для некоторого множества начальных данных решение задачи (1.2.1), (1.2.2) даёт также решение задачи с указанными фазовыми ограничениями (“мягкая посадка” снаружи или изнутри). Случай г = 0 вырожденный и отвечает приведению в геометрическую точку x(tf) = XQ с нулевой скоростью; полный синтез задачи оптимального быстродействия построен в [4]. Поэтому далее считаем, что г 0.

Отметим, что задача наискорейшего приведения точки на цилиндрическую поверхность S х Rn m, т п, сводится к задаче (1.2.1), (1.2.2) при п = т.

Задача оптимального быстродействия содержит Зп + 3 параметров: n-векторы ж0, жо, v и скаляры т, FQ, Г. Посредством переноса системы координат ж, v в точку х = XQ, V = 0, введения единицы длины г и времени (mr/fo)1 получим соотношения типа (1.2.1), (1.2.2), в которых жо=0, r = l, i o = 1, m = 1. В безразмерных переменных задача управления содержит In параметров: n-векторы х иг;0, изменяющиеся в неограниченных пределах. Необходимые условия оптимальности управления и = F/Fo в форме задачи Коши для уравнения Гамильтона-Якоби-Беллмана имеют вид [122] (Т х, v) — \Т \ = — 1, и =—Т Т 1 (1.2.3) Т = Т{х, v) 0, ж Є Sn, v = 0; Т = 0, х Є S , г; = 0 Здесь Т — функция Беллмана, и — оптимальное управление в фор ме синтеза. Неизвестная T{x,v) строится методом характеристик, что в алгоритмическом аспекте эквивалентно решению краевой задачи прин ципа максимума Понтрягина [122]. Из свойства центральной симметрии следует, что при п 2 (случай п = 1 особый и требует отдельного рас смотрения) искомая функция Т определяется тремя автомодельными переменными /, h и с, а задача Коши (1.2.3) принимает вид T[c/l-\ ch — Т — Тд/= —1, T = T(l,h,c) I = \х\, h = \v\, c={x,v) (1.2.4) Т 0, / 1, h = 0; Т = 0, / = 1, h = 0 Это означает, что задача оптимального быстродействия для п 2 эквивалентна случаю п = 2, т. е. плоской задаче. Плоскость, в которой происходит процесс оптимального управляемого движения, определяется двумя ненулевыми векторами ж, v. Очевидно, случай с = ±lh, включающий также случаи х = 0 или (и) v = 0, приводит к вырожденному одномерному движению. Свойство (1.2.4) эквивалентности плоской задаче полезно для построения решения исходной многомерной (п 2) задачи оптимальной по быстродействию “мягкой посадки” на сферу. Оно также проявляется при применении необходимых условий оптимальности в форме принципа максимума Понтрягина [4]. Отметим, что задача управления имеет решение при произвольных значениях векторов і" и о11. В качестве допустимого можно взять постоянное управление M(i) = —v/h, h = \v\ на первом участке, приводящем к полному торможению в момент времени tn\ = h, в точке x(t{1)) = х , где х 1 = х + l/2vh. Из точки покоя затем мож-но двигаться по прямой, проходящей через выбранную точку сферы, в частности, через ближайшую х = х /1 ; расстояние между точками АІ2 = U 1 — 1 . При движении по указанной прямой потребуется І2 = 2Д/2 времени для достижения сферы в точке х 2 с гашением скорости, т. е. имеем оценку сверху t для tf: 1/2 4 4) tf t = h + 2 / + с h -\—h — 1 Как показано ниже, для начальных данных, приводящих к траекториям с возвращением, приближённо реализуется описанный выше режим управления.

Оптимальное управление в трёхмерном случае

1. Постановка задачи. В 1.2 и 1.3 наряду с поиском управления, обеспечивающего возможно быстрый возврат системы в окрестность заданной точки, также были построены алгоритмы, позволяющие покинуть “нежелательную” сферу в фазовом пространстве за кратчайшее время. Как оказалось, при определённых начальных условиях оптимальные траектории могут один или два раза пересекать поверхность последней. Возникает вопрос об определении множества начальных данных, для которых возможно уклонение без пересечения сферы. Исследуем задачу об оптимальном уклонении динамического объекта малых линейных размеров под действием ограниченной силы от такой области сферической формы. Задача уклонения сферического объекта от сферы или точки эквивалентна рассматриваемой.

Рассмотрим некоторую допустимую траекторию движения материальной точки при условиях, описанных ниже. Найдём на траектории такую точку или множество точек, расстояние от которой до начала координат минимально. Для краткости назовём эту точку и соответствующее расстояние критическими. Для каждого набора начальных условий исследуем всё множество возможных траекторий, образующееся перебором допустимых управлений, и среди них найдём имеющую максимальное критическое расстояние. Затем определим такое подмножество начальных условий, для которого это расстояние не меньше радиуса препятствия. Следовательно, невозможно избежать встречи с препятствием, если начальные условия не принадлежат найденному подмножеству. Если уклонение возможно, то не существует траектории, имеющей большее критическое расстояние, чем та, которая может быть найдена по соответствующим формулам. С точки зрения предотвращения попадания на сферу представляется естественным назвать такую траекторию оптимальной, поскольку она проходит на максимально возможном расстоянии от препятствия.

Как и в 1.2, исследуем движение материальной точки массы т в п-мерном евклидовом пространстве (п 1) под действием ограниченной по модулю управляющей силы F при наличии непроницаемой сферы (препятствия) с произвольными фиксированными центром и радиусом R тх = F, \F\ Fo, ж(0) = жо, ж(0) = vo (1.4.1) Sft = {ж : \х — = R} , \хо — С R

Для управляемой системы (1.4.1) рассмотрим задачу уклонения геометрической точки х от препятствия Sft в любой момент времени t О, т. е. \x{t) — Q\ і?, без ограничений на скорость х = v. Естественно, не при всяких начальных данных жо, vo задача имеет решение. Кроме того, она оказывается содержательной, если вектор скорости vo лежит внутри конуса с вершиной в точке х = хо и образующими, которые касаются сферы.

Отметим, что система (1.4.1) определяется совокупностью 3(п + 1) параметров: скалярами m, Fo, R и векторами жо, vo, С. Введём безразмерные переменные и = F/FQ, (Х — C)/R — ж, t/r — t, VT/R — v, т = (mR/Fo)1 2. Тогда вместо системы (1.4.1) получим (см. 1.2) х = v, v = и, х(0) = хо, v(0) = vo] и 1 (1.4.2) S = {х : х = 1}, жо 1

Из центральной симметрии следует, что общая задача при п 2 эквивалентна задаче на плоскости (п = 2). Если векторы хо и vo некол-линеарны, то эта плоскость определяется однозначно, иначе — с точностью до произвольного поворота. Случай п = 1 (движение по прямой, Si — отрезок) достаточно прост и особого интереса не представляет.

Рассмотрим множество достижимости D(t, xo,vo) согласно 3.1 для (1.4.2). Поскольку на скорость точки никаких ограничений не наложено, то будем изучать это множество только в пространстве координат. Задача уклонения имеет решение, если в D существует хотя бы одна траектория, каждая точка которой находится на единичном (или большем) расстоянии от начала координат. Известно [160], что в рассматриваемом случае множество достижимости будет компактным и выпуклым. Тогда можно исследовать только его граничные точки. Для нахождения этих точек нужно решить задачу оптимального управления с функционалом (сх,х(Т)) — min„, м 1 (1.4.3) и системой (1.4.2). Здесь Т — произвольный фиксированный момент времени, а сх — произвольный единичный вектор. Перебрав все возможные сх в соотношении (1.4.3), можно построить искомую границу множества достижимости в момент Т. Для этого момента времени среди всех точек границы следует найти самую далёкую от начала координат: J = х(Т) — тахСх, сх 1 (1.4.4) Решив задачу (1.4.4) для всех Т 0, получим семейство траекторий х (Т), наиболее отклоняющихся от начала координат среди всех воз можных траекторий движения системы. Найдём среди них ту, конечная точка которой ближе всех к началу координат: Ф = ж (Т) — inf , 0 Т оо (1.4.5) Если эта точка не лежит внутри сферы, то, как будет показано ниже, исходная задача имеет решение, и оно найдено. Далее можно решить задачу для любых начальных условий и определить границу О области М допустимых начальных условий. Здесь М = {ж, v : Ф(ж,г;) 1}, О = {ж, у : Ф(ж, v) = 1} (1.4.6) Таким образом, для оптимального уклонения необходимо решить последовательно четыре задачи: 1) определить граничные точки множества достижимости; 2) найти наиболее удалённую от начала координат точку этого множества для каждого момента времени t = Т оо; 3) отыскать ближайшую к началу координат точку на соответствующей траектории; 4) определить границы области допустимых начальных условий.

Решение первых двух задач находится аналитически сравнительно просто. Нахождение минимизирующей траектории х (Т) сопряжено с некоторыми вычислительными затратами. Определение границы допустимой области О, т. е. решение четвёртой задачи, оказывается возможным аналитически.

Новый способ аппроксимации оценки состояния линей ной системы на основе метода эллипсоидов

1. Движение материальной точки по прямой под действием неопределённой силы. Часто бывает так, что начальное положение объекта в фазовом пространстве измеряют с весьма высокой точностью, т. е. матрица Q0 в (3.1.6) вырождена. Положение ещё более осложняется, если матрица G тоже вырождена. Последнее обстоятельство естественным образом возникает, в частности, при рассмотрении тех задач механики, в которых неопределённым фактором служит сила, действующая на систему. Тогда компоненты матрицы B, входящие в уравнения, разрешённые относительно производных координат, могут быть нулевыми, в отличие от компонент, входящих в уравнения, разрешённые относительно производных импульсов. В этих случаях существующие методы выбора q(t) обнаруживают ряд недостатков.

1. Не решён вопрос о существовании и единственности решения задачи Коши (3.1.6). Более того, в [66] относительно уравнения (3.1.6) применительно к локально оптимальной минимизации объёма сказано, что “по-видимому, для большинства вырожденных начальных условий решение задачи Коши для него вообще не существует”.

2. Даже если в каком-либо частном случае и можно решить указанную проблему, то попытка численной реализации соответствующего алгоритма будет затруднена тем, что q(t0) может обратиться в нуль.

3. Может оказаться, что при выборе определённого L(Q) в (3.1.9) существует другое решение (3.1.6) для некоторого другого функционала L(Q) с меньшим значением соответствующей целевой функции и её производной, причём соответствующее отклонение может иметь конечную относительную величину в любой сколь угодно малой окрестности начальной точки.

Для пояснения последнего утверждения рассмотрим движение материальной точки по прямой под действием неопределённой силы. В приведённых переменных соответствующие уравнения для фазовых координат имеют вид Для полноты изложения следует упомянуть глобально оптимальный по площади эллипс, полученный в [102]. Он имеет параметры Qii = Qc t Q12 = t Q22 = Ф Q = 9— (3.2.7) 2 9 (cj — 1/4) где с « 0.56215. Его площадь S « 0.8587t3 меньше площади эллипса (3.2.6) приблизительно на 5%. Это объясняется тем, что соответствующая ему функция q (t) не является аналитической в окрестности t = 0. Точное же множество достижимости, полученное в [160], имеет площадь (2/3)t3. Итак, решение (3.2.6) лучше локально оптимального, но хуже глобально оптимального. На рис. 45 показаны все указанные выше аппроксимации в автомодельных переменных 1 = xi/t2 и 2 = %2/t (см. [160]). В силу симметрии изображена лишь верхняя полуплоскость 2 0. Цифрой 1 обозначен эллипс (3.2.7), глобально оптимальный по площади, 2 — эллипс (3.2.3), локально оптимальный по площади, 3 — эллипс (3.2.4). Штриховой кривой показано решение (3.2.6). Аппроксимируемое множество достижимости а 2 /І л /г. і /г» І/ 2 / J= -і + 2) 4 — 1/2 1 S 1/2 — (52 — 1) 4 , f2 S 1 имеет границу, состоящую из дуг двух парабол и обозначенную цифрой 4. Интересно, что ни один из четырёх эллипсов не содержит другого полностью, но каждый, как это и должно быть, содержит множество достижимости. Его граница включает угловую точку с абсциссой 0.5 и ординатой 1, окрестности которой показаны в крупном масштабе на рис. 46. Видно, что только эллипс (3.2.4) проходит через указанную точку. Все остальные аппроксимации не имеют общих точек с множеством достижимости. 3. “Универсальная” асимптотика. Применим в общем случае тот же подход, что и в предыдущем разделе. Подчеркнём, что соответству 127 ющие эллипсоиды не будут относиться ни к локально, ни к глобально оптимальным. Требуется решить следующую задачу Коши, представляющую частный случай (3.1.6): т Q Q = A{t)Q-\-QA it)-\—— + /(t)G(t), Q(0) = 0 (3.2.8) 1(4 при малых t, выбирая при этом q{t) 0 при t 0 наилучшим, в некотором смысле, способом. Построим приближённое решение уравнения (3.2.8) в окрестности точки t = 0. Пусть существуют представления A(t) = AQ + tA\ + 0(t ), G(t) = Go + tG\ +t G2 + 0(t ) где AQ, A\, GO, GI, G2 — известные постоянные матрицы. Коэффициенты представлении для будем искать, одновременно назначая коэффициенты в q(t) = /о + tq\ + t (/2 + 0(t ) Подставим (3.2.9) в соотношение (3.2.8), перенесем все слагаемые в левую часть уравнения и найдем коэффициенты при различных степенях t. Из условия равенства нулю коэффициента при t получим Q\ = qoGo. Следовательно, целесообразно выбрать /о = 0. Приравняв нулю коэффициент при t1, получим Qi = /i/(2 — q )Go. Выберем qi 0 так, чтобы коэффициент при Go был возможно меньшей положительной величиной. Тогда q\ = 1 и Q2 = GQ. Можно показать, что при /о = 0 и (/1 = 1 матрица Q3 = (AQOO + GQAQ + G\) /2. Она не зависит от членов порядка t2 суммы для функции q(t). Получаем

Построение возмущений, одинаково действующих на систему

1. Постановка задачи. Как известно, в рамках стохастического метода переход от реального возмущения с конечной дисперсией и ма лым интервалом корреляции к белому шуму с постоянной интенсив ностью в общем случае вызывает определённые трудности, связанные, в частности, с необходимостью установить соответствие между дельта функцией и ограниченной функцией, отличной от нуля на конечном ин тервале времени (см. 4.2). Посмотрим, что получится, если реальному процессу с ограниченной дисперсией поставить в соответствие стоха стический процесс, дисперсия которого в любой момент времени тоже ограничена. Составим алгоритм, позволяющий сравнить результаты действия на динамическую систему процесса со случайными неограниченными приращениями и процесса с произвольными (в частности, детерминированными), но ограниченными приращениями. В качестве первого будет выступать вектор v Є Rm, каждая компонента которого — винеровский t процесс, т. е. Vi = J idt, где j — центрированный белый шум с еди о ничной интенсивностью, соответствующий компоненте Vi. В качестве второго возьмём ограниченное возмущение и Є E(0,Imt), где и Є Rm. Для решения поставленной задачи сначала в гарантированной модели заменим инаии получим вероятностную, а потом — наоборот. Как и ранее, для упрощения формул будем полагать, что в (4.1.3) константа а = 1. 2. Построение вероятностной модели. Ограничимся линейным случаем и предположим, что рассматривается система (3.1.4), (3.1.5). Будем считать, что vj{t) = 0 и g{t) = 0, поскольку это не ограничивает общность задачи. Заменим вектор возмущения w новым вектором возмущения и со 176 гласно формуле w = G1 2t 1 2и и при to = 0 представим рассматриваемую систему в виде х = Ах + ВО t и , ж(0) Є Е(ао, Qo), и & Е(0, Imt) (4.4.1) Теперь, как было сказано выше, поставим в соответствие ограниченному вектору и случайный вектор v с некоррелированными компонентами, каждая из которых является винеровским процессом. Тогда, согласно предположению, сделанному в конце 4.1, вектору х будет соответствовать стохастический процесс z, имеющий гауссовское распределение с дисперсией Qo в начальный момент времени и М{ г(0)} = ао. Будем рассматривать все компоненты вектора v в качестве дополнительных фазовых переменных с нулевой дисперсией и нулевым математическим ожиданием в начальный момент времени, расширив тем самым z до вектора у, первые п компонент которого являются вектором z, а остальные т — вектором v. Тогда на основании (4.4.1) получим уравнение

Здесь — белый шум единичной интенсивности, а cov означает вычисление матрицы ковариации. Блочные матрицы Ау и Ву с размерностями (п + т) х (п + т) и (п + т) х т соответственно имеют вид

Применение теории стохастических процессов (см., например, [128]) к полученной модели (4.4.2), (4.4.3) не вызывает никаких трудностей, за исключением обычных, возникающих при решении любой задачи стохастического априорного анализа точности. Имеем Получаемые для вектора у математическое ожидание ру и матрица ко-вариации Ру, а точнее те их составляющие, которые соответствуют части z в у, и являются искомыми величинами. Их следует сопоставить с центром а и матрицей Q эллипсоида, решающего задачу гарантированного оценивания (4.4.1). Можно заметить, что компоненты вектора а тождественно совпадают с первыми п компонентами вектора ру.

Применим разработанный алгоритм к уравнению движения по прямой материальной точки, находящейся под действием ограниченной силы. Пусть начальное состояние системы известно точно. В безразмерных переменных имеем х = и, \и\ 1, х(0) Є Е(0,0) (4.4.5) Воспользуемся эллипсоидами супердостижимости (см. 3.1) в форме (3.2.13). Тогда получим Qn = t /3, Qi2 = t /2, Q22 = t (4.4.6) Решениями уравнений (4.4.4) применительно к составленной для (4.4.5) системе вида (4.4.2) будут функции Р\\ = (7/45)t , Руї = (14/45)t , Р22 = (2/3)t (4.4.7) Сравнивая (4.4.6) с (4.4.7), можно заметить, что оба набора функций одинаковы с точностью до постоянных множителей перед степенями времени, причём в (4.4.7) они меньше, чем в (4.4.6). Итак, в стохастическом случае следует ожидать несколько меньший разброс возможных значений фазового вектора, что соответствует практике. 3. Построение гарантированной модели. Эта задача, т. е. построение модели с ограниченной помехой по исходным уравнениям со стохастическими воздействиями, сложнее, чем обратная, которая была решена выше. Данное обстоятельство связано с тем, что не каждую линейную вероятностную систему можно записать в форме (4.4.2), (4.4.3).

Оптимальное управление и оценивание движения в некоторых задачах динамики Шматков Антон Михайлович

Оптимальное по быстродействию достижение сферы с нулевой конечной скоростью

Оптимальное управление в трёхмерном случае

Новый способ аппроксимации оценки состояния линей ной системы на основе метода эллипсоидов

Построение возмущений, одинаково действующих на систему

Похожие диссертации на Оптимальное управление и оценивание движения в некоторых задачах динамики