Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Оптимальность и устойчивость алгоритмов гарантированного оценивания Гусев Михаил Иванович

Оптимальность и устойчивость алгоритмов гарантированного оценивания
<
Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания Оптимальность и устойчивость алгоритмов гарантированного оценивания
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гусев Михаил Иванович. Оптимальность и устойчивость алгоритмов гарантированного оценивания : Дис. ... д-ра физ.-мат. наук : 01.01.02, 01.01.09 : Екатеринбург, 2002 203 c. РГБ ОД, 71:04-1/79-5

Содержание к диссертации

Введение

1 Устойчивость алгоритмов гарантированного оценивания: оценки погрешности 26

1.1 Сходимость и оценки скорости сходимости областей достижимости при дискретной аппроксимации фазовых ограничений 27

1.2 Сходимость и оценки скорости сходимости областей достижимости при дискретной аппроксимации фазовых ограничений: линейный случай 42

1.3 Оценки погрешности для информационных множеств в абстрактных задачах гарантированного оценивания с нормально разрешимым оператором вход-выход 52

1.4 Регуляризация и вариационное представление информационных множеств в задачах с интегральными ограничениями 76

1.5 Оценки погрешности информационных множеств в задачах гарантированного оценивания с интегральными ограничениями 80

2 Оптимальность линейных алгоритмов гарантированного оценивания и оптимизация наблюдений 88

2.1 Постановка задачи 90

2.2 Оптимальность линейных (аффинных) алгоритмов в задачах гарантированного оценивания 92

2.3 Оценивание векторного параметра и оптимальность линейных алгоритмов оценивания 106

2.4 Управление наблюдениями в задачах гарантированного оценивания 110

3 Оптимизация процесса наблюдения в задачах гарантированного оценивания и идентификации 122

3.1 Управление наблюдениями в задаче гарантированного оценивания для системы с интегральными ограничениями 123

3.2 Управление наблюдениями в задаче гарантированного оценивания для системы с геометрическими ограничениями на помехи 145

3.3 Оптимальные входы при идентификации параметров линейных управляемых систем 157

3.4 Оптимизация расположения стационарных сенсоров в задаче идентификации мощности источников 169

Заключение 181

Литература 184

Введение к работе

Диссертация посвящена исследованию ряда вопросов устойчивости и оптимальности процедур гарантированного оценивания управляемых систем с неопределенными параметрами (возмущениями). Необходимость оценки состояния динамической системы или ее параметров по результатам доступных измерений возникает как при построении математической модели системы, так и при конструировании позиционных алгоритмов управления. Задачи построения оценок состояния (параметров) по результатам неполных измерений составляют предмет теории оценивания (идентификации параметров). Значительная часть теории оценивания основана на статистических методах, базирующихся на предположениях о вероятностной природе возмущений в системе и ошибок измерения. Статистические методы достигли высокой степени завершенности благодаря исследованиям, начатым в работах Н.Винера, А.Н.Колмогорова, Р.Калмана. Результаты Калмана и Бьюси, получивших в задаче оценивания состояния линейной динамической системы с возмущениями типа "белого шума "оптимальную оценку в виде решения обыкновенного дифференциального уравнения ( уравнения фильтра Калмана-Бьюси), вызвали многочисленные публикации и нашли широкое применение в конкретных системах управления.

Ограничения на применение классической теории стохастического оценивания связаны с тем, что процессы , рассматриваемые во многих прикладных задачах, не являются повторяющимися, имеют только ограниченное число наблюдений. Одной из основных причин, ограничивающих область применения статистических методов является неполнота априорной информации о данных задачи и статистических характеристиках возмущений и ошибок измерений. Часто требуется строить оценки, обеспечивающие некоторый гарантированный результат. Требования такого рода возникают в различных задачах меха-

ники, инженерии, биомедицины, проблемах, связанных с изучением окружающей среды. Они типичны для задач навигации и оценивания движения механических систем.

Наряду с вероятностным подходом к задачам оценивания все большее распространение получает гарантированный подход, основанный на представлении априорной информации о неизвестных параметрах (возмущениях) при помощи задания множеств, содержащих эти параметры. Исследования по теории гарантированного оценивания, были инициированы работами Н.Н.Красовского [76, 77]. Эти исследования были посвящены задачам априорного оценивания в линейных системах, для которых операции оценивания призваны были обеспечить гарантированный результат оценивания в расчете на наихудшую для наблюдателя реализацию возмущений и ошибок измерения.

Дальнейшее развитие теория гарантированного оценивания получила в работах [201, 152, 83, 200], в которых были заложены основы теории апостериорного гарантированного оценивания. В рамках данной теории оценки состояний динамических систем с неопределенными возмущениями по данным наблюдений формируются апостериори по ходу процесса наблюдения в виде функций (вообще говоря, многозначных) от наблюдаемого сигнала. Ключевым здесь является понятие информационного множества, определяемого как множество всех возможных состояний системы, совместимых с результатами измерения и априорными ограничениями на неизвестные возмущения и ошибки измерений. В качестве оценки состояния (параметров системы) принимается либо само множество, либо формируемые на его основе точечные минимаксные оценки. Систематическое исследование свойств информационных множеств и минимаксных оценок, описание их динамики, изучение связи с результатами теории статистического оценивания, использование данных конструкций в задачах управления по неполным данным было проведено А.Б.Куржанским [83, 84, 85, 86, 87], эти исследования подытожены в монографии [82]. Различные аспекты теории гарантированного оценивания исследуются в работах [3, 14, 62, 63, 69, 88, 117, 127, 140, 174, 175, 181, 173, 168, 185, 189, 191, 190, 184].

В рамках минимаксного (гарантированного) подхода возможно исследование задач оценивания систем со случайными возмущениями, статистические характеристики которых неизвестны, или известны неточно, данное направление развивается в теории оценивания статистиче-

ски неопределенных систем [6, 68, 126]. Различные подходы к решению задач оценивания состояния и параметров динамических систем, сочетающие элементы минимаксного и статистического оценивания, развиваются в работах [16, 105, 106, 148].

Задача построения информационных множеств в теории гарантированного оценивания представляет из себя сложную вычислительную проблему, особенно в нелинейном случае (см. [2, 87, 27, 79, 81, 93, 95, 127, 172, 205]). В настоящее время интенсивно развиваются методы построения информационных множеств, основанные на эллипсоидальных [142, 178, 121, 179] и полиэдральных [177, 74] аппроксимациях.

В диссертации изучается три круга вопросов, относящихся к теории гарантированного оценивания состояния систем с неопределенными параметрами. Первый из них, рассмотренный в главе 1, связан с устойчивостью процедур гарантированного оценивания. Задачи оценивания (идентификации параметров) относятся к классу обратных задач, для которых характерны неединственность и неустойчивость решений относительно возмущений исходных данных. Эти задачи удобно описывать на языке операторных уравнений в линейных нормированных пространствах. Допустим, что измеряемый выход динамической системы у и неизвестный вход системы w (под входом системы могут пониматься возмущения в правой части системы дифференциальных уравнений, начальные условия, неизвестные параметры уравнений) связаны между собой равенством у = Лги -f- , где А : X —> У -оператор вход-выход, определяемый динамикой системы и уравнениями измерения, - ошибки измерения (X, Y - линейные нормированные пространства). Априорная информация ош,( задается включениями ги Є W, Є Н, где W, Е - известные множества. Задача оценивания состоит в определении (оценке) значения оператора Fw для неизвестного априори входа w EW на, основании измерения выхода (сигнала) у. В качестве подобной оценки берется либо информационное множество

Z(y) = {z = Fw: Aw'+ = y, w eW, Є H},

либо некоторая точка множества z, в определенном смысле наилучшим образом представляющая точки множества. Оператор А, в задачах гарантированного оценивания часто не обратим (см., например, [119, 154, 194, 206], где исследуются вопросы обратимости в задачах наблюдения), либо А-1 существует, но оказывается неограниченным

[92]. Поэтому задача восстановления Fw по у является некорректно поставленной, задачи подобного типа изучаются в теории некорректных задач [137, 60, 99, 116, 24]. Разрабатываемые в рамках теории гарантированного оценивания методы, основанные на сложившихся в рамках теории управления-наблюдения подходах и учитывающие специфику задач оценивания динамики систем, в значительной степени используют результаты теории некорректно поставленных задач. Методы решения задач в рамках теории управления-наблюдения и некорректных задач, разрабатываемые для формально различных задач по существу часто дают близкие решения. Отметим, что на связь теории фильтрации Винера с методом регуляризации Тихонова указывалось в монографии [137]. К настоящему времени вопросы о связи различных процедур регуляризации, развиваемых в теории некорректно поставленных задач, и алгоритмов гарантированного оценивания исследованы достаточно полно. В работах Куржанского и Сивергиной [90, 91] для задач оценивания состояния параболических систем по результатам неполных наблюдений было установлено, что при подходящем задании оператора вход-выход и априорных ограничений минимаксные (гарантированные) оценки совпадают с решениями, получаемыми при помощи метода регуляризации Тихонова, метода квазирешений Иванова, метода невязки, метода квазиобращения Лионса-Латтеса. Вопросы устойчивости минимаксных оценок тесно связаны с общей проблематикой корректности задач оптимального управления и математического программирования, имеющей обширную библиографию (см.,например, [21, 27, 57, 59, 52, 134, 149]), асимптотическими методами в теории оптимального управления и оценивания [4, 53, 79, 80, 123]. Алгоритмы решения обратных задач динамики, сочетающие методы теории некорректных задач и позиционного управления [78, 135] развиваются в рамках теории позиционного моделирования [98, 97, 109, 75, 195].

Различные аспекты устойчивости в задачах оценивания изучались в работах [102, 148, 16, 185, 132].

Наряду с точечными минимаксными оценками в задачах гарантированного оценивания часто оперируют с информационными множествами, поскольку именно информационные множества содержат полную информацию о неизвестных данных, которую можно извлечь из результатов наблюдения. Вопрос об устойчивости информационных

множеств иногда рассматривается в следующей постановке [94, 180]. Определим на W многозначное отображение Y(w) = Aw + Е, тогда равенство У-1 (у) = {w : у Є Y{w)} определяет обратное отображение и информационное множество Z{y) может быть определено как суперпозиция оператора F и Y~1(y). Таким образом, непрерывная зависимость (липшицевость) Z{y) по у определяется свойствами У-1 (у) и может исследоваться путем применения различных обобщений теоремы о неявных функциях, развиваемых в. многозначном анализе [54, 61, 55, 70].

Однако, если иметь в виду устойчивость процедур оценивания относительно ошибок измерения, более соответствующей сложившимся в теории некорректных задач определениям устойчивости отвечает следующая задача, исследуемая в данной работе. Рассмотрим наряду с множеством Z(y) информационное множество Z(y), отвечающее измерениям, проводимым без ошибок. Формально оно определяется так же как и Z(y) с заменой Е на множество {0}, состоящего из нулевого элемента . Вопрос, который изучается в первой главе состоит в выяснении условий, при которых h(Z(y), Z{y)) —> 0, у Є S + у при стремлении уровня ошибок измерения к нулю ( 5 = /г(Е, {0}) —> 0, 0 Є S) и оценкам скорости сходимости в зависимости от величины 6. Отметим, что в отличие от устойчивости минимаксных оценок доказательство устойчивости информационных множеств (и тем более, получение оценок скорости сходимости ) требует гораздо более жестких условий на операторы A, F.

Первая глава разбита на пять разделов (параграфов). В первых двух разделах исследуется вопрос об оценках погрешности областей достижимости управляемых систем, описываемых обыкновенными дифференциальными уравнениями при наличии фазовых ограничений, при дискретизации ограничений. С основной тематикой главы эти разделы связывает тот известный факт, что информационное множество для задачи оценивания состояния динамической системы с неопределенными возмущениями и ошибками измерений представляют из себя область достижимости системы с фазовыми ограничениями, задаваемыми уравнениями измерений. Таким образом, на приводимые оценки можно смотреть с точки зрения обоснования применения дискретных аппроксимаций при построении информационных множеств. Сходимость дискретных аппроксимации и оценки погрешности аппроксима-

ций исследуются во многих работах, посвященных численным методам в теории управления и дифференциальных играх [20, 51,115,118,139]. Особенностью изучаемых в данной работе задач является то, что рассматриваются фазовые ограничения типа равенства, не имеющие внутренних точек. Эти предположения, в свою очередь, вызваны тем, что получаемые оценки ориентированы на возможные применения при анализе устойчивости информационных множеств.

В параграфе 1.1 рассмотривается управляемая система на заданном интервале времени t E[to,ti]

dx/dt = f(x) + g(x)u{t), x(t0) = x, (1)

где x Є Rn,u(t) Є Rr. Ограничения на управление и фазовую траекторию системы заданы в следующем виде

u(t) ЄР, te [*o,*i], Kx{t)) = 0, teT, (2)

где P С Rr -компакт, T - заданное подмножество отрезка [io>^i], h -непрерывно дифференцируемая функция, такая что градиент Vh отличен от нуля в точках множества X = {х : h(x) = 0}. Предполагается, что f,g - непрерывно дифференцируемые функции, удовлетворяющие условиям подлинейного роста, обеспечивающим продолжимость решений системы на весь интервал времени [fo»^i]-

Обозначим через Go(ti) область достижимости системы (1) при ограничениях (2), если в качестве Т взят интервал [^o^i]- Рассмотрим конечное множество моментов времени

Та = {П <Т2< ... < TN] С [t0, ti], Ті = t0, TN - ti,

где о = max (rl+i — тг). Пусть Ga{t\) - область достижимости системы (1), отвечающая Т = Та.

Основной результат данного раздела составляет доказательство оценки

М (3)

в теореме 1.1.1. Здесь h - хаусдорфово расстояние между множествами. Данная оценка получена в предположении выпуклости Р и выполнении условия, что существует б > 0, такое что

l-e,e]cVh(x)T(f(x)+g(x)P) (4)

для любого х Є D, где

D = {х Є Rn : Eu(-) Є /, т Є [t0,*i],

ж(т, ж0, w(-)) = ж, Л(ж(*, ж0, «())) = 0, t0 < t < ti}.

Доказательство теоремы опирается на лемму 1.1.1, в которой устанавливается оценка

\\x{t,u(.))-x{tyATA-))\\ < Кіст, t Є [t0,hl

равномерная по u(t) Є Р, где Атаи{')) - оператор усреднения управления и(і) на промежутках [тг-,Ті+і].

В параграфе 1.2 рассмотрена автономная управляемая система со скалярным входом при линейных фазовых ограничениях типа равенства. Оценка (3) для хаусдорфова расстояния между множествами достижимости доказана здесь без дополнительных предположений вида

(4).

В параграфе 1.3 исследуется вопрос об устойчивости информационных множеств для абстрактных задач оценивания в банаховых пространства: найти z = Fw при ограничении

у = Aw + , w Є W, f Є SE. (5)

A : X —> Y, F \ X -* Z - заданные операторы, W С X, X,Y,Z-действительные банаховы пространства. Рассматриваются

Z5{y) = {z = Fw : у = Aw + ,w Є W, Є 6E}, (6)

- информационное множество, совместимое с реализовавшимся сигналом у, и информационное множество, отвечающее точно наблюдаемому сигналу

Zo(y) = {z = Fw: Aw = y,w Є W}. (7)

Показано, что если W, Н слабо компактные подмножества X Y, 0 Є Н, а операторы A, F слабо замкнуты, и F вполне непрерывен, то

h(Zo(y),Zs[y))->Q

при 5 > 0, у Є у + 8Е. Приведены примеры нелинейных динамических систем, для которых имеет место факт сходимости информационных множеств.

Далее рассмотрены задачи гарантированного оценивания для задач с нормально разрешимым оператором А. Линейный непрерывный оператор А : X — Y называется нормально разрешимым, если множество его значений Н — АХ замкнуто в Y. Для линейного операторного уравнения Aw = у в гильбертовом пространстве известно, что регу-ляризатор Тихонова при соответствующем выборе параметра регуляризации дает решение с ошибкой порядка 5, где S - ошибка в задании правой части уравнения [116, 56]. В работе показано, что оценки'вида

h(Z6(y),Z0(y)) = O(6),

где h- хаусдорфово расстояние между множествами, имеют место и для задач гарантированного оценивания с нормально разрешимым оператором А в гильбертовых и произвольных банаховых пространствах (в последнем случае при условии конечномерности одного из пространств) (теоремы 1.3.2, 1.3.3). Применяемый здесь подход к доказательству основан на использовании теорем двойственности в выпуклом программировании [28, 58, 59] для вычисления опорных функций информационных множеств и последующих оценках возмущений решений двойственных задач. Рассмотрены применения полученных оценок к ряду конкретных задач. Данный класс задач гарантированного оценивания включает, например, важные для приложений системы с конечным числом наблюдений, многошаговые системы, а также некоторые классы задач идентификации параметров в условиях неопределенности.

В этом же разделе предложен подход к получению оценок скорости сходимости информационных множеств в системах с непрерывными измерениями, основанный на дискретных аппроксимациях по времени. Для линейных автономных систем с одним входом и одним выходом приведены оценки вида 0(<5^) для скорости сходимости информационных множеств, где п - размерность вектора фазовых координат системы.

В следующем разделе данной главы для абстрактных задач гарантированного оценивания в гильбертовых пространствах введено понятие регуляризованного информационного множества Zaj(y)} а, є - параметры регуляризации, и дано его вариационное описание в терминах экстремальных задач, связанных с методом регуляризации Тихонова (теорема 1.4.1 ). Именно показано, что опорная функция информаци-

онного множества, зависящего от измеряемого сигнала и параметров регуляризации а, є, имеет вид

p(z*\ZaM) = (^ + а - afl2(z\ FCF*z*) + (z\ z)z,

где не только минимаксная оценка (центр симметрии множества) (?/, є) совпадает с регуляризатором Тихонова (этот факт достаточно хорошо известен), но и самосопряженный оператор С и зависящее от измеряемого сигнала число а = сг(у,є) могут быть найдены из решения некоторых экстремальных задач метода регуляризации.

Данный результат позволяет для получения оценок скорости сходимости информационных множеств в гильбертовых пространствах использовать известные оценки для метода регуляризации. В следующем разделе главы продемонстрировано применение данной техники. Найден предел регуляризованных информационных множеств при стремлении уровня ошибок к нулю, даны оценки скорости сходимости множеств в хаусдорфовой метрике в зависимости от величины погрешности измерений (теорема 1.5.1 и следствия из нее).

Во второй главе диссертации рассматриваются вопросы оптимальности линейных (аффинных) операций в задачах априорного гарантированного оценивания. Класс допустимых оценок в задачах гарантированного оценивания для динамических систем с неопределенными параметрами должен быть достаточно широким, чтобы обеспечить приемлемую точность оценивания. С другой стороны, желательно чтобы выбранный класс оценок позволял формулировать задачу оценивания как экстремальную задачу из некоторого стандартного класса задач, допускающих эффективное решение. В частности, для задач оценивания линейных систем с выпуклыми ограничениями на неопределенные возмущения в качестве допустимых оценок рассматривались линейные непрерывные функционалы от измеряемого сигнала [76, 77]. Это позволяло свести задачу априорного оценивания в минимаксной постановке к решению задачи выпуклого программирования в банаховом пространстве. Однако, возникает вопрос об обоснованности использования данного класса оценок с точки зрения достигаемой в нем точности оценивания по сравнению с нелинейными операциями. Оказывается для достаточно широкого класса задач с выпуклыми симметричными относительно нуля ограничениями на помехи при оценивании скалярного функционала можно ограничиться линейными оцен-

ками, не ухудшая при этом точности оценивания. Этот факт вытекает из доказанного в [82] утверждения о совпадении в наихудшем для наблюдателя случае результатов априорного и апостериорного оценивания (см. следствие 10.5). Так как по определению априорная оценка ищется в классе линейных, а апостериорная в классе произвольных нелинейных оценок,то отсюда вытекает совпадение гарантированных результатов оценивания в этих двух классах. Доказательство в [82] проводится для задачи оценивания состояния линейной динамической системы при условии, что априорные ограничения на возмущения на входе системы и ошибки измерения заданы выпуклыми компактами, симметричными относительно нуля. Отсюда следует, в частности, совпадение результатов априорного оценивания, достигаемых в классах произвольных нелинейных и непрерывных линейных оценок для постановок задач оценивания, рассмотренных в [76, 77].

В работе [ПО] данный результат обобщен для абстрактной постановки задачи гарантированного оценивания значения линейного непрерывного функционала на решениях операторного уравнения в линейных нормированных пространствах. Здесь ослаблены требования к множествам, задающим априорные ограничения: эти множества предполагаются выпуклыми и симметричнымии относительно нуля. Отметим, что близкие по постановке задачи рассматриваются во многих работах по оптимальному восстановлению функций и операторов [131, 107, 10].

В данной главе вопрос об оптимальности линейных (аффинных) оценок рассматривается применительно к следующей абстрактной постановке задачи гарантированного оценивания значения линейного непрерывного функционала в линейных нормированных пространствах без предположений о симметричности ограничений задачи относительно нуля. Пусть X, Y -линейные нормированные пространства, Z -метрическое пространство. Пусть заданы S С X х Y и отображение / : X —> Z. Множество 5 представляет априорную информацию о неизвестном элементе w = (х,у) Є 5, где у известно и трактуется как результат "измерений". Требуется оценить величину f(x) Є Z по доступной информации о у.

Пусть d -метрика в Z. Отображение z : PryS -> Z (PryS -проекция

S на У) назовем оценкой параметра f{x). Обозначим

sup d(z(y),f(x)),

(x,y)S

величина представляет наибольшую ошибку оценивания, отвечающую z. Оценка z* называется оптимальной, если

tp(z*) = M (8)

В указанную схему укладывается большинство априорных задач, рассматриваемых в теории гарантированного оценивания [174, 175, 190, 127, 205].

Обозначим S(y) = {х : (ж, у) Є 5}, S(y) -множество всех х Є X,
совместимых с "измерениями"?/. Тогда ^

sup d(z(y),f(x))= sup sup d(z(y),f(x)).

{x,y)eS yePrYSxS(y)

Определим апостериорную оценку z* как отображение PryS в Z такое, что для любого у Є PryS

sup d(z*(y),f(x)) = inf sup d(z,f(x)).

xS(y) z xeS(y)

Таким образом, z*(y) - решение параметрической экстремальной задачи с функционалом g(z, у) = supa.5(y) d(z, f(x))

g(z,y) -*min.

Для каждого z : PryS —> Z

g(z(y),y) > mfg(z,y) = inf sup d(z,f(x))

z z xeS(y)

и, следовательно, справедливо следующее равенство

p(z*) = inf cp(z) = sup inf sup d(z,f(x)). (9)

z yePrYS z xeS{y)

Из (9) следует, что апостериорная оценка z* доставляет решение задачи (8). Однако нахождение z*{y) даже в линейном случае представляет серьезную вычислительную проблему.

Обозначим множество всех отображений PryS > Z через Z, множество линейных непрерывных отображений Y —> Z как С, и пусть Л

обозначает множество непрерывных аффинных отображений Y -Л Z. В работе рассматривается вопрос о том, при каких условиях

М ф) = М (p(z) (10)

inf p(z) = inf>(z). (11)

Справедливость равенства (11) установлена в случае Z = R,b предположениях выпуклости и слабой компактности S и условии / Є X*. При этих же предположениях получены необходимые и достаточные условия для (10) (теорема 2.2.3), условия слабой компактности несколько ослабляются в теореме 2.2.4. Совпадение результатов оценивания в классах произвольных и аффинных оценок доказано без характерных для подобных задач предположений (типа условий непустоты внутренности априорных ограничений), обеспечивающих достижимость оценок. Отметим, что близкие по постановке задачи рассматривались в [136, 103]. В [136] рассмотрен случай конечномерного пространства "измеряемых сигналов". В [103] задача рассмотрена в линейных пространствах без топологии.

Далее в данной главе обсуждается оптимальность линейных алгоритмов в задачах гарантированного оценивания векторного функционала для различных типов метрик в конечномерном пространстве оценок. Отметим, что для задач оценивания векторного функционала оптимальность линейных минимаксных оценок, является скорее исключением из правила. Здесь приведен ряд примеров, иллюстрирующих данное утверждение. Показано, что оптимальность линейных алгоритмов имеет место при условиях теорем 2.2.3, 2.2.4, если Z = Rn, F- линейный непрерывный оператор, d(x,y) = \\х — t/||. Учитывая, что оценки по норме || ||* достаточно широко используются в приложениях, рассмотрен вопрос об оптимальности линейных оценок при d{x,y) = \\х у\\п и показано, что оптимальность имеет место при п = 2 и, вообще говоря, это не верно при п > 2.

Следующий раздел второй главы посвящен абстрактным задачам управления наблюдениями. Во многих прикладных задачах, связанных с необходимостью восстанавливать неизвестные параметры системы по результатам доступных измерений, имеется возможность управления процессом наблюдения. Применительно к динамическим системам с неопределенными коэффициентами задача выбора наилучшего

входа для идентификации представляет типичный пример подобной задачи. Другой пример относится к проблеме оптимизации измерений, возникающей, в частности, в задачах экологического мониторинга [108, 122]. Управляя процессом наблюдения, можно уменьшить влияние возмущений в системе и ошибок измерения и повысить точность восстановления искомых неизвестных величин.

Вопросы оптимизации измерений в задачах оценивания состояния и выбора оптимальных входов в задачах идентификации применительно к системам со случайными возмущениями имеют обширную библиографию (см., например, [12, 29, 141, 15, 65, 66, 71, 72, 105, 114, 133, 150, 153, 192, 198, 203, 204, 19]).

Первые постановки задач управления наблюдениями в контексте гарантированного оценивания рассмотрены в работах [38, 104]. Абстрактные постановки подобных задач рассматривались в [157, 196, 125]. Минимаксные задачи оптимального сочетания управлений и наблюдений в задачах оптимального управления и дифференциальных играх исследовались в [112, 144, 145]. Различным постановкам задач оптимизации наблюдений и связанным с ними задачам о наихудших и наилучших входах посвящены работы [5, 120, 125, 128, 146, 147, 176].

Задача управления наблюдениями в рамках теории гарантированного оценивания может быть формализована следующим образом. Предположим, что оператор А зависит от некоторого управляющего параметра и Є U, действующего на процесс измерения, так что уравнение измерений имеет вид:

у — A{u)w + ,

и пусть априорные ограничения на неопределенные параметры и величины ошибок измерения заданы в виде w Є W, (GH, причем ограничения на ошибки измерения, вообще говоря, зависят от и: Н = 3(и). Рассматриваются два типа задач оптимизации наблюдений, которые условно можно назвать априорными и апостериорными. Пусть

5« = {(ш,у):у = A{u)w + ,weW,e Щи)}, (12)

и для заданного у Є Y

Su(y) = {w:y = A{u)w + ^ weW^G S(«)}. (13)

Пусть Z(y,u) = F(Su(y)) - информационное множество, отвечающее наблюдениям у, Ф(-) действительная функция, определенная на огра-

ничейных подмножествах Z, такая что величина 4f(Z(y, и)) характеризует точность оценивания. Задача оптимизации наблюдений (апостериорная) может быть в этом случае представлена как задача минимизации функционала от информационных множеств

фг(и) = sup -> inf, (14)

у ul/

где верхняя грань берется по всем возможным значениям выхода, на множестве U.

Пусть задано некоторое множество S отображений из У в Z, которые будем называть априорными операциями оценивания. Уклонение оценки z(y) от неизвестного значения Fw будем характеризовать ве-. личиной d(z(y),Fw), где d{z\,zзаданная функция на Z х Z. Например, d(z(y),Fw) = y(z(y) — Fw), где 7 _ норма или полунорма в Z. Пусть

Ф(,г(-), и) = sup d(z(y), Fw) = sup d(z(A{u)w + )> Fw),

где верхняя грань вычисляется по всем w Є W, ( 6 S. Постановка априорной задачи оптимизации наблюдений выглядит следующим образом

ф2(и) = inf Ф(*(.),и) -+ inf. (15)

Далее во второй главе исследовано соотношение между априорными и апостериорными задачами, показано их совпадение для отдельных критериев.

В стохастической теории оценивания состояний динамических систем по результатам измерений рассматриваются адаптивные (позиционные) задачи оптимизации измерений, в рамках которых при выборе закона наблюдения (наблюдателя) для моментов времени t > т учитывается информация об измеренном сигнале в предшествующие моменты времени. Применительно к задаче управления наблюдениями в гарантированной постановке автором в [39] был анонсирован результат, состоящий в том, что для системы с совместными интегральными квадратичными ограничениями на возмущения в системе и ошибки измерения переход к адаптивным процедурам не обеспечивает лучший результат по сравнению с программным управлением наблюдениями. В работе [125] было показано совпадение гарантированных результатов наблюдения в классах адаптивных и программных процедур для

некоторого класса абстрактных задач гарантированного оценивания в гильбертовых пространствах. В данной главе рассмотрено соотношение между программными и адаптивными процедурами для задачи гарантированного оценивания в абстрактной постановке применительно к операторным уравнениям в банаховых пространствах. Для отдельных классов задач установлено совпадение результатов оценивания в классах адаптивных и программных измерителей. Отметим, что близкие вопросы рассматриваются в работах по теории оптимальных минимаксных алгоритмов [136, 144, 138].

В третьей главе рассмотренные абстрактные постановки конкретизируются для задач управления измерениями в динамических системах с неопределенными параметрами. В разделе 3.1 рассматривается проблема оптимального выбора состава измерений в задаче гарантированного оценивания для линейной системы с интегральными квадратичными ограничениями на неопределенные возмущения и ошибки измерения. Предполагается, что движение управляемой системы на отрезке [o>^i] описывается дифференциальным уравнением

i = A(t)x + B(t)u + C{t)v, x{t0) = x, (16)

где х Є Rn, и Є Rr, v Є Rq, u(t), to < t < ti, — известный вход; v(t) — неизвестное возмущение. Уравнения измерений имеют вид

y(t) = G(t)x(t) + F(t)t(t). (17)

Компоненты возмущений v(t) и (t) считаются принадлежащими L2[to, ti]. Начальное состояние системы (1) х = x(to) точно неизвестно, вся доступная априорная информация о я0 и возмущениях v(-), () исчерпывается условием Є W, где = {x,v('),(-)}:

h
W = {С : х'Мх + f[v'Rv + 'Щ] dt < fi2}. (18)

Здесь M, R(t), H(t), t Є [to, h] — симметричные положительно определенные матрицы; /л — заданное положительное число; элементы матриц R(t), H{t), как функции t, измеримы и ограничены на [o»*i]-

Пусть Q — заданное подмножество конечномерного линейного пространства Мпт матриц т х п, через G обозначим множество всех измеримых ограниченных функций [to, t\] -> Q. Функции G(-) Є G назовем программами наблюдения.

Зафиксируем программу наблюдения G(-) Є G. Информационная область X(ti,y(-)), совместимая с у(-), есть эллипсоид [82]):

х(*1,у{-)) = У + Аь),

Y = {xeRn: х'Р(и)х 2- h2(ti)}, (19)

где вектор x(t), симметричная положительно определенная матрица P(t) и неотрицательная функция h2(t) удовлетворяют дифференциальным уравнениям

Р = -РА - А'Р - PC ВТ1 С Р + <р, P(t0) = М, (20)

х = Ах + Ви + P^G'F^'HF-^y - Gx% x(t0) = 0, (21)

h2 = {Gx - у)'F~vHF~\GxQ - y), h2(t0) = 0,

V? = (p(t, G) = G'F-vHF-lG. (22)

Множество Y = Y(G(-), ) однозначно определяется выбором G(-) и реализацией Є W.

На множестве всех подмножеств Rn определяются отношения частичного порядка а, /3 и 7: АаВ тогда и только тогда, когда А С В; А/ЗВ тогда и только тогда, когда существует ортогональное линейное преобразование Т : Rn —> Rn такое, что ТА С В\ пусть L = {h,... Jk} — заданное подмножество единичных векторов в Rn\ AjB тогда и только тогда, когда p{k\A) < р(1{\В), і = 1,..., к.

При фиксированном G(-) подмножества Y(G(-), ), отвечающие всевозможным Є W линейно упорядочены относительно а, /3, 7, и существует точная верхняя грань (одна и та же для любого из рассмотренных отношений частичного порядка)

F(G(-)) = {х : x'P(ti)x < fi2}. (23)

Программа наблюдения ?*() Є G называется а-неулу читаемой, если не существует G(-) Є G такая, что

F(G(.))*F(G*(.)), -(F(G*(.))aF(G(.))).

Аналогично вводятся определения (3- и 7-неУлУчшаемых программ наблюдения. Далее в разделе 3.1 показано, что задача построения неулучшаемых программ наблюдения может быть сведена к решению

задачи оптимального управления с векторным терминальным фунци-оналом для системы матричных дифференциальных уравнений Рик-кати (20), описывающих динамику оптимальных минимаксных фильтров, и доказаны необходимые условия оптимальности в форме принципа максимума Л.С.Понтрягина имеющие вид

trSV2(t)(p(t,G*(t))SV2(t) =

= maxtrS1/2(t)1/2(t), п.в. t Є [*0,*і], (24)

где S(t) — решение системы

S = {Л + CBrlC'P*)S + S{A + CR-lC'P*)', Sfa) = 5, (25)

tiA — след матрицы А. Соотношения принципа максимума для различных отношений порядка в классе информационных множеств отличаются видом краевых условий для сопряженной системы (25). Выяснено также влияние выбора неулучшаемых (эффективных) программ наблюдения на разброс минимаксных оценок состояния системы.

Подобной задаче, но для систем с геометрическими ограничениями, посвящен раздел 3.2. Исследована задача выбора состава наблюдений для линейных динамических систем при геометрических ограничениях на ошибки измерения при отсутствии априорной информации о начальном векторе. Доказана сводимость рассматриваемой задачи к задаче оптимального управления, особенность которой состоит в том, что для нее не выполняются условия теоремы существования. Для полученной задачи установлена теорема двойственности (теорема 3.2.2) и на ее базе обоснован алгоритм решения задачи. Исследована структура оптимальных программ наблюдения.

Раздел 3.3 посвящен выбору оптимальных входов в задаче идентификации коэффициентов линейной управляемой системы при геометрических и интегральных ограничениях на ошибки измерения. Задачи об оптимальных входах широко исследуются в литературе по теории идентификации систем со стохастическими возмущениями (см., например, [186, 187, 198], где приведена соответствующая библиография). Для задач гарантированного оценивания различные постановки задачи о выборе оптимальных входов рассматривалась в [176,169, 189, 197]. В данной работе исследованы оптимальные входы (управления), обеспечивающие минимальную гарантированную ошибку оценивания. 06-

основана редукция задачи выбора оптимальных входов к задачам оптимального управления, которая базируется на применении теорем двойственности для бесконечномерных задач математического программирования. В случае системы с геометрическими ограничениями на ошибки измерения показано, что задача сводится к некоторой нестандартной задаче оптимального управления для вспомогательной линейной управляемой системы большей размерности. Для систем с интегральными ограничениями на ошибки доказано сведение задачи к нелинейной задаче оптимального управления с терминальным функционалом, определяемым при помощи выпуклой функции на множестве положительно определенных матриц (и, в частности, задаче управления максимальным собственным числом матрицы). Доказаны условия оптимальности в форме принципа максимума, приведены примеры численного решения задачи об оптимальных входах.

Наконец в разделе 3.4 рассмотрена задача оптимального выбора стационарных сенсоров в задаче оценивания мощности входных стационарных воздействий для уравнений диффузионного типа на плоскости. Рассматривается распределенная система, описываемая уравнением переноса и диффузии в R2

+ divwip + спр — /j,Ду? = ^2Qi(t)5(x - а*), (26)

с начальными и краевыми условиями

(f(Q,x) = v?o(^)) (f(t,x) —^ 0 при ЦжЦг —> +оо.

Здесь х = (#і, яг), = -^Ф + -рФ оператор Лапласа, 5(х) - дельта функция Дирака, Qi(t) измеримые ограниченные функции на отрезке [0,Т], a, fi заданные положительные числа. Вектор-функция w = w(x) = (wi(x),W2{x)) удовлетворяет уравнению неразрывности

0 д

UVJW = -W\ + -—W2 = 0.
ОХ\ ОХ2

Для фо(-) Є -^2(-R2) существует единственное решение уравнениям (26), понимаемое в слабом смысле.

На систему действуют возмущения в к заданных точках плоскости - ai,...,a&. Величины возмущений, описываемые функциями Qi(t),

и начальное состояние предполагаюся неизвестными. Информация о состоянии системы доставляется следующим уравнением измерений

yj(t) = (p{tybj) + ^{t), j = 1,...,5.

Здесь (t) - ошибка измерения j-oro сенсора, а точки &i,..., bs, описывающие размещение сенсоров на плоскости, выбираются внутри данной области Q,*. Таким образом, возмущения в правой части системы, ошибки измерения и начальное состояние системы <^о считаются заранее неизвестными. Вся априорная информация о неизвестных пара-меьтрах задается условиями

и := {Qi(')> і = h > &, fj(-), j = 1,..., s, є u>

где U заданное подмножество пространства Ь^[0, Т]xL^JO, T]xL2(R2). Априорные ограничения могут иметь форму либо геометрических ограничений

U = {u:0it і = 1,...,Аг, fe Wl < ej, j = 1,..., s, ti0(x) < фо{х), x Є і?2},

или форму интегральных квадратичных ограничений.

Задача оценивания состоит в том, что необходимо по результатам измерений y(t), 0 < t < Т восстановить величину интеграла

т
I = (p(t, x)dtdx.

о п

Данная постановка мотивирована, в частности, проблемами экологического мониторинга [108, 122]. Уравнение (26) представляет двумерную модель распространения загрязнения атмосферы при известной скорости ветра w. Расположение источников загрязнения - аг- предполагается известным, однако интенсивность выбросов, описываемая функциями Qi(t), не известна. Таким образом, задача состоит в таком размещении сенсоров внутри области Q*, которое обеспечило бы наиболее точную оценку для величины загрязнения области П.

В работе рассмотрен случай, когда интенсивность источников Qi не зависит от времени и w = const. Исходная задача преобразуется в стационарную, так как все рассматриваемые величины не зависят от времени. Показано, что задача может быть сведена к нахождению

величины минимума некоторой функции переменных, причем для вычисления значения функции в одной точке необходимо решать задачу линейного программирования (в случае, если априорные ограничения заданы в форме системы линейных неравенств). Приведена упрощенная форма задачи, получаемая при достаточно большом числе сенсоров и проведен ее анализ, основанный на использовании соотношений двойственности для полубесконечных задач математического программирования.

Работа выполнена при частичной поддержке грантов РФФИ 97-01-01003 и 00-01-00646. Результаты диссертации обсуждались на многих международных, всесоюзных и всероссийских конференциях по оптимальному управлению, математическому программированию, теории некорректных задач. Они докладывались на международных конференциях: "Стохастическая оптимизация", Киев, 1984; 12-ой конференции IFIP "Моделирование систем и оптимизация", Будапешт, 1985; "Mathematische Optimierungtheorie und Anwendungen", Эйзенах, 1981, 1989; "Modeling Techniques for Uncertain Systems", Шопрон, 1992; IFAC conference "Singular solutions and perturbations in control systems", Пере-яславль-Залесский, 1997; "Semi-Infinite Programming", Аликанте, 1999; "Control Applications of Optimization: 11th IFAC International Workshop", Санкт-Петербург, 2000; "Nonlinear Control Systems (NOLCOS' 2001), 5th IFAC Symposium", Санкт-Петербург, 2001; на Всесоюзных конференциях "Управление в механических системах", Москва, 1982, Казань, 1986, Львов, 1988, Свердловск, 1990; на Весоюзоюзных съездах по теоретической и прикладной механике, Ташкент, 1986, Москва, 1991, Пермь, 2001; Международном советско-польском семинаре "Мат. методы оптимального управления и их приложения", Минск, 1989; 2-м Международном семинаре "Негладкие и разрыв.задачи управления и оптимизации", Челябинск, 1993; Всероссийских конференциях "Алгоритм анализ неустойчивых задач", Екатеринбург, 1998, 2001, и др. Основные результаты опубликованы в работах [31]-[50], [156]-[167].

Автор глубоко благодарен Александру Борисовичу Куржанскому за постоянное внимание, помощь и поддержку.

Сходимость и оценки скорости сходимости областей достижимости при дискретной аппроксимации фазовых ограничений: линейный случай

В диссертации изучается три круга вопросов, относящихся к теории гарантированного оценивания состояния систем с неопределенными параметрами. Первый из них, рассмотренный в главе 1, связан с устойчивостью процедур гарантированного оценивания. Задачи оценивания (идентификации параметров) относятся к классу обратных задач, для которых характерны неединственность и неустойчивость решений относительно возмущений исходных данных. Эти задачи удобно описывать на языке операторных уравнений в линейных нормированных пространствах. Допустим, что измеряемый выход динамической системы у и неизвестный вход системы w (под входом системы могут пониматься возмущения в правой части системы дифференциальных уравнений, начальные условия, неизвестные параметры уравнений) связаны между собой равенством у = Лги -f- , где А : X — У -оператор вход-выход, определяемый динамикой системы и уравнениями измерения, - ошибки измерения (X, Y - линейные нормированные пространства). Априорная информация ош,( задается включениями ги Є W, Є Н, где W, Е - известные множества. Задача оценивания состоит в определении (оценке) значения оператора Fw для неизвестного априори входа w EW на, основании измерения выхода (сигнала) у. В качестве подобной оценки берется либо информационное множество либо некоторая точка множества z, в определенном смысле наилучшим образом представляющая точки множества. Оператор А, в задачах гарантированного оценивания часто не обратим (см., например, [119, 154, 194, 206], где исследуются вопросы обратимости в задачах наблюдения), либо А-1 существует, но оказывается неограниченным [92]. Поэтому задача восстановления Fw по у является некорректно поставленной, задачи подобного типа изучаются в теории некорректных задач [137, 60, 99, 116, 24]. Разрабатываемые в рамках теории гарантированного оценивания методы, основанные на сложившихся в рамках теории управления-наблюдения подходах и учитывающие специфику задач оценивания динамики систем, в значительной степени используют результаты теории некорректно поставленных задач. Методы решения задач в рамках теории управления-наблюдения и некорректных задач, разрабатываемые для формально различных задач по существу часто дают близкие решения. Отметим, что на связь теории фильтрации Винера с методом регуляризации Тихонова указывалось в монографии [137]. К настоящему времени вопросы о связи различных процедур регуляризации, развиваемых в теории некорректно поставленных задач, и алгоритмов гарантированного оценивания исследованы достаточно полно. В работах Куржанского и Сивергиной [90, 91] для задач оценивания состояния параболических систем по результатам неполных наблюдений было установлено, что при подходящем задании оператора вход-выход и априорных ограничений минимаксные (гарантированные) оценки совпадают с решениями, получаемыми при помощи метода регуляризации Тихонова, метода квазирешений Иванова, метода невязки, метода квазиобращения Лионса-Латтеса. Вопросы устойчивости минимаксных оценок тесно связаны с общей проблематикой корректности задач оптимального управления и математического программирования, имеющей обширную библиографию (см.,например, [21, 27, 57, 59, 52, 134, 149]), асимптотическими методами в теории оптимального управления и оценивания [4, 53, 79, 80, 123]. Алгоритмы решения обратных задач динамики, сочетающие методы теории некорректных задач и позиционного управления [78, 135] развиваются в рамках теории позиционного моделирования [98, 97, 109, 75, 195].

Различные аспекты устойчивости в задачах оценивания изучались в работах [102, 148, 16, 185, 132].

Наряду с точечными минимаксными оценками в задачах гарантированного оценивания часто оперируют с информационными множествами, поскольку именно информационные множества содержат полную информацию о неизвестных данных, которую можно извлечь из результатов наблюдения. Вопрос об устойчивости информационных множеств иногда рассматривается в следующей постановке [94, 180]. Определим на W многозначное отображение Y(w) = Aw + Е, тогда равенство У-1 (у) = {w : у Є Y{w)} определяет обратное отображение и информационное множество Z{y) может быть определено как суперпозиция оператора F и Y 1(y). Таким образом, непрерывная зависимость (липшицевость) Z{y) по у определяется свойствами У-1 (у) и может исследоваться путем применения различных обобщений теоремы о неявных функциях, развиваемых в. многозначном анализе [54, 61, 55, 70].

Однако, если иметь в виду устойчивость процедур оценивания относительно ошибок измерения, более соответствующей сложившимся в теории некорректных задач определениям устойчивости отвечает следующая задача, исследуемая в данной работе. Рассмотрим наряду с множеством Z(y) информационное множество Z(y), отвечающее измерениям, проводимым без ошибок. Формально оно определяется так же как и Z(y) с заменой Е на множество {0}, состоящего из нулевого элемента . Вопрос, который изучается в первой главе состоит в выяснении условий, при которых h(Z(y), Z{y)) — 0, у Є S + у при стремлении уровня ошибок измерения к нулю ( 5 = /г(Е, {0}) — 0, 0 Є S) и оценкам скорости сходимости в зависимости от величины 6. Отметим, что в отличие от устойчивости минимаксных оценок доказательство устойчивости информационных множеств (и тем более, получение оценок скорости сходимости ) требует гораздо более жестких условий на операторы A, F.

Первая глава разбита на пять разделов (параграфов). В первых двух разделах исследуется вопрос об оценках погрешности областей достижимости управляемых систем, описываемых обыкновенными дифференциальными уравнениями при наличии фазовых ограничений, при дискретизации ограничений. С основной тематикой главы эти разделы связывает тот известный факт, что информационное множество для задачи оценивания состояния динамической системы с неопределенными возмущениями и ошибками измерений представляют из себя область достижимости системы с фазовыми ограничениями, задаваемыми уравнениями измерений. Таким образом, на приводимые оценки можно смотреть с точки зрения обоснования применения дискретных аппроксимаций при построении информационных множеств. Сходимость дискретных аппроксимации и оценки погрешности аппроксима ций исследуются во многих работах, посвященных численным методам в теории управления и дифференциальных играх [20, 51,115,118,139]. Особенностью изучаемых в данной работе задач является то, что рассматриваются фазовые ограничения типа равенства, не имеющие внутренних точек. Эти предположения, в свою очередь, вызваны тем, что получаемые оценки ориентированы на возможные применения при анализе устойчивости информационных множеств.

Регуляризация и вариационное представление информационных множеств в задачах с интегральными ограничениями

Далее рассмотрены задачи гарантированного оценивания для задач с нормально разрешимым оператором А. Линейный непрерывный оператор А : X — Y называется нормально разрешимым, если множество его значений Н — АХ замкнуто в Y. Для линейного операторного уравнения Aw = у в гильбертовом пространстве известно, что регу-ляризатор Тихонова при соответствующем выборе параметра регуляризации дает решение с ошибкой порядка 5, где S - ошибка в задании правой части уравнения [116, 56]. В работе показано, что оценки вида где h- хаусдорфово расстояние между множествами, имеют место и для задач гарантированного оценивания с нормально разрешимым оператором А в гильбертовых и произвольных банаховых пространствах (в последнем случае при условии конечномерности одного из пространств) (теоремы 1.3.2, 1.3.3). Применяемый здесь подход к доказательству основан на использовании теорем двойственности в выпуклом программировании [28, 58, 59] для вычисления опорных функций информационных множеств и последующих оценках возмущений решений двойственных задач. Рассмотрены применения полученных оценок к ряду конкретных задач. Данный класс задач гарантированного оценивания включает, например, важные для приложений системы с конечным числом наблюдений, многошаговые системы, а также некоторые классы задач идентификации параметров в условиях неопределенности.

В этом же разделе предложен подход к получению оценок скорости сходимости информационных множеств в системах с непрерывными измерениями, основанный на дискретных аппроксимациях по времени. Для линейных автономных систем с одним входом и одним выходом приведены оценки вида 0( 5 ) для скорости сходимости информационных множеств, где п - размерность вектора фазовых координат системы.

В следующем разделе данной главы для абстрактных задач гарантированного оценивания в гильбертовых пространствах введено понятие регуляризованного информационного множества Zaj(y)} а, є - параметры регуляризации, и дано его вариационное описание в терминах экстремальных задач, связанных с методом регуляризации Тихонова (теорема 1.4.1 ). Именно показано, что опорная функция информационного множества, зависящего от измеряемого сигнала и параметров регуляризации а, є, имеет вид

где не только минимаксная оценка (центр симметрии множества) (?/, є) совпадает с регуляризатором Тихонова (этот факт достаточно хорошо известен), но и самосопряженный оператор С и зависящее от измеряемого сигнала число а = сг(у,є) могут быть найдены из решения некоторых экстремальных задач метода регуляризации.

Данный результат позволяет для получения оценок скорости сходимости информационных множеств в гильбертовых пространствах использовать известные оценки для метода регуляризации. В следующем разделе главы продемонстрировано применение данной техники. Найден предел регуляризованных информационных множеств при стремлении уровня ошибок к нулю, даны оценки скорости сходимости множеств в хаусдорфовой метрике в зависимости от величины погрешности измерений (теорема 1.5.1 и следствия из нее).

Во второй главе диссертации рассматриваются вопросы оптимальности линейных (аффинных) операций в задачах априорного гарантированного оценивания. Класс допустимых оценок в задачах гарантированного оценивания для динамических систем с неопределенными параметрами должен быть достаточно широким, чтобы обеспечить приемлемую точность оценивания. С другой стороны, желательно чтобы выбранный класс оценок позволял формулировать задачу оценивания как экстремальную задачу из некоторого стандартного класса задач, допускающих эффективное решение. В частности, для задач оценивания линейных систем с выпуклыми ограничениями на неопределенные возмущения в качестве допустимых оценок рассматривались линейные непрерывные функционалы от измеряемого сигнала [76, 77]. Это позволяло свести задачу априорного оценивания в минимаксной постановке к решению задачи выпуклого программирования в банаховом пространстве. Однако, возникает вопрос об обоснованности использования данного класса оценок с точки зрения достигаемой в нем точности оценивания по сравнению с нелинейными операциями. Оказывается для достаточно широкого класса задач с выпуклыми симметричными относительно нуля ограничениями на помехи при оценивании скалярного функционала можно ограничиться линейными оцен ками, не ухудшая при этом точности оценивания. Этот факт вытекает из доказанного в [82] утверждения о совпадении в наихудшем для наблюдателя случае результатов априорного и апостериорного оценивания (см. следствие 10.5). Так как по определению априорная оценка ищется в классе линейных, а апостериорная в классе произвольных нелинейных оценок,то отсюда вытекает совпадение гарантированных результатов оценивания в этих двух классах. Доказательство в [82] проводится для задачи оценивания состояния линейной динамической системы при условии, что априорные ограничения на возмущения на входе системы и ошибки измерения заданы выпуклыми компактами, симметричными относительно нуля. Отсюда следует, в частности, совпадение результатов априорного оценивания, достигаемых в классах произвольных нелинейных и непрерывных линейных оценок для постановок задач оценивания, рассмотренных в [76, 77].

В работе [ПО] данный результат обобщен для абстрактной постановки задачи гарантированного оценивания значения линейного непрерывного функционала на решениях операторного уравнения в линейных нормированных пространствах. Здесь ослаблены требования к множествам, задающим априорные ограничения: эти множества предполагаются выпуклыми и симметричнымии относительно нуля. Отметим, что близкие по постановке задачи рассматриваются во многих работах по оптимальному восстановлению функций и операторов [131, 107, 10].

В данной главе вопрос об оптимальности линейных (аффинных) оценок рассматривается применительно к следующей абстрактной постановке задачи гарантированного оценивания значения линейного непрерывного функционала в линейных нормированных пространствах без предположений о симметричности ограничений задачи относительно нуля. Пусть X, Y -линейные нормированные пространства, Z -метрическое пространство. Пусть заданы S С X х Y и отображение / : X — Z. Множество 5 представляет априорную информацию о неизвестном элементе w = (х,у) Є 5, где у известно и трактуется как результат "измерений". Требуется оценить величину f(x) Є Z по доступной информации о у.

Оптимальность линейных (аффинных) алгоритмов в задачах гарантированного оценивания

Далее в данной главе обсуждается оптимальность линейных алгоритмов в задачах гарантированного оценивания векторного функционала для различных типов метрик в конечномерном пространстве оценок. Отметим, что для задач оценивания векторного функционала оптимальность линейных минимаксных оценок, является скорее исключением из правила. Здесь приведен ряд примеров, иллюстрирующих данное утверждение. Показано, что оптимальность линейных алгоритмов имеет место при условиях теорем 2.2.3, 2.2.4, если Z = Rn, F- линейный непрерывный оператор, d(x,y) = \\х — t/. Учитывая, что оценки по норме достаточно широко используются в приложениях, рассмотрен вопрос об оптимальности линейных оценок при d{x,y) = \\х — у\\п и показано, что оптимальность имеет место при п = 2 и, вообще говоря, это не верно при п 2.

Следующий раздел второй главы посвящен абстрактным задачам управления наблюдениями. Во многих прикладных задачах, связанных с необходимостью восстанавливать неизвестные параметры системы по результатам доступных измерений, имеется возможность управления процессом наблюдения. Применительно к динамическим системам с неопределенными коэффициентами задача выбора наилучшего входа для идентификации представляет типичный пример подобной задачи. Другой пример относится к проблеме оптимизации измерений, возникающей, в частности, в задачах экологического мониторинга [108, 122]. Управляя процессом наблюдения, можно уменьшить влияние возмущений в системе и ошибок измерения и повысить точность восстановления искомых неизвестных величин.

Вопросы оптимизации измерений в задачах оценивания состояния и выбора оптимальных входов в задачах идентификации применительно к системам со случайными возмущениями имеют обширную библиографию (см., например, [12, 29, 141, 15, 65, 66, 71, 72, 105, 114, 133, 150, 153, 192, 198, 203, 204, 19]).

Первые постановки задач управления наблюдениями в контексте гарантированного оценивания рассмотрены в работах [38, 104]. Абстрактные постановки подобных задач рассматривались в [157, 196, 125]. Минимаксные задачи оптимального сочетания управлений и наблюдений в задачах оптимального управления и дифференциальных играх исследовались в [112, 144, 145]. Различным постановкам задач оптимизации наблюдений и связанным с ними задачам о наихудших и наилучших входах посвящены работы [5, 120, 125, 128, 146, 147, 176].

Задача управления наблюдениями в рамках теории гарантированного оценивания может быть формализована следующим образом. Предположим, что оператор А зависит от некоторого управляющего параметра и Є U, действующего на процесс измерения, так что уравнение измерений имеет вид: и пусть априорные ограничения на неопределенные параметры и величины ошибок измерения заданы в виде w Є W, (GH, причем ограничения на ошибки измерения, вообще говоря, зависят от и: Н = 3(и). Рассматриваются два типа задач оптимизации наблюдений, которые условно можно назвать априорными и апостериорными. Пусть

Пусть Z(y,u) = F(Su(y)) - информационное множество, отвечающее наблюдениям у, Ф(-) действительная функция, определенная на огра ничейных подмножествах Z, такая что величина 4f(Z(y, и)) характеризует точность оценивания. Задача оптимизации наблюдений (апостериорная) может быть в этом случае представлена как задача минимизации функционала от информационных множеств где верхняя грань берется по всем возможным значениям выхода, на множестве U.

Пусть задано некоторое множество S отображений из У в Z, которые будем называть априорными операциями оценивания. Уклонение оценки z(y) от неизвестного значения Fw будем характеризовать ве-. личиной d(z(y),Fw), где d{z\,z i) - заданная функция на Z х Z. Например, d(z(y),Fw) = y(z(y) — Fw), где 7 _ норма или полунорма в Z. Пусть где верхняя грань вычисляется по всем w Є W, ( 6 S. Постановка априорной задачи оптимизации наблюдений выглядит следующим образом

Далее во второй главе исследовано соотношение между априорными и апостериорными задачами, показано их совпадение для отдельных критериев.

В стохастической теории оценивания состояний динамических систем по результатам измерений рассматриваются адаптивные (позиционные) задачи оптимизации измерений, в рамках которых при выборе закона наблюдения (наблюдателя) для моментов времени t т учитывается информация об измеренном сигнале в предшествующие моменты времени. Применительно к задаче управления наблюдениями в гарантированной постановке автором в [39] был анонсирован результат, состоящий в том, что для системы с совместными интегральными квадратичными ограничениями на возмущения в системе и ошибки измерения переход к адаптивным процедурам не обеспечивает лучший результат по сравнению с программным управлением наблюдениями. В работе [125] было показано совпадение гарантированных результатов наблюдения в классах адаптивных и программных процедур для некоторого класса абстрактных задач гарантированного оценивания в гильбертовых пространствах. В данной главе рассмотрено соотношение между программными и адаптивными процедурами для задачи гарантированного оценивания в абстрактной постановке применительно к операторным уравнениям в банаховых пространствах. Для отдельных классов задач установлено совпадение результатов оценивания в классах адаптивных и программных измерителей. Отметим, что близкие вопросы рассматриваются в работах по теории оптимальных минимаксных алгоритмов [136, 144, 138].

В третьей главе рассмотренные абстрактные постановки конкретизируются для задач управления измерениями в динамических системах с неопределенными параметрами. В разделе 3.1 рассматривается проблема оптимального выбора состава измерений в задаче гарантированного оценивания для линейной системы с интегральными квадратичными ограничениями на неопределенные возмущения и ошибки измерения.

Управление наблюдениями в задаче гарантированного оценивания для системы с геометрическими ограничениями на помехи

Данная постановка мотивирована, в частности, проблемами экологического мониторинга [108, 122]. Уравнение (26) представляет двумерную модель распространения загрязнения атмосферы при известной скорости ветра w. Расположение источников загрязнения - аг- предполагается известным, однако интенсивность выбросов, описываемая функциями Qi(t), не известна. Таким образом, задача состоит в таком размещении сенсоров внутри области Q , которое обеспечило бы наиболее точную оценку для величины загрязнения области П.

В работе рассмотрен случай, когда интенсивность источников Qi не зависит от времени и w = const. Исходная задача преобразуется в стационарную, так как все рассматриваемые величины не зависят от времени. Показано, что задача может быть сведена к нахождению величины минимума некоторой функции 2к переменных, причем для вычисления значения функции в одной точке необходимо решать задачу линейного программирования (в случае, если априорные ограничения заданы в форме системы линейных неравенств). Приведена упрощенная форма задачи, получаемая при достаточно большом числе сенсоров и проведен ее анализ, основанный на использовании соотношений двойственности для полубесконечных задач математического программирования.

Работа выполнена при частичной поддержке грантов РФФИ 97-01-01003 и 00-01-00646. Результаты диссертации обсуждались на многих международных, всесоюзных и всероссийских конференциях по оптимальному управлению, математическому программированию, теории некорректных задач. Они докладывались на международных конференциях: "Стохастическая оптимизация", Киев, 1984; 12-ой конференции IFIP "Моделирование систем и оптимизация", Будапешт, 1985; "Mathematische Optimierungtheorie und Anwendungen", Эйзенах, 1981, 1989; "Modeling Techniques for Uncertain Systems", Шопрон, 1992; IFAC conference "Singular solutions and perturbations in control systems", Пере-яславль-Залесский, 1997; "Semi-Infinite Programming", Аликанте, 1999; "Control Applications of Optimization: 11th IFAC International Workshop", Санкт-Петербург, 2000; "Nonlinear Control Systems (NOLCOS 2001), 5th IFAC Symposium", Санкт-Петербург, 2001; на Всесоюзных конференциях "Управление в механических системах", Москва, 1982, Казань, 1986, Львов, 1988, Свердловск, 1990; на Весоюзоюзных съездах по теоретической и прикладной механике, Ташкент, 1986, Москва, 1991, Пермь, 2001; Международном советско-польском семинаре "Мат. методы оптимального управления и их приложения", Минск, 1989; 2-м Международном семинаре "Негладкие и разрыв.задачи управления и оптимизации", Челябинск, 1993; Всероссийских конференциях "Алгоритм анализ неустойчивых задач", Екатеринбург, 1998, 2001, и др. Основные результаты опубликованы в работах [31]-[50], [156]-[167].

Автор глубоко благодарен Александру Борисовичу Куржанскому за постоянное внимание, помощь и поддержку. Устойчивость алгоритмов гарантированного оценивания: оценки погрешности

Первая глава посвящена анализу устойчивости апостериорных (позиционных) процедур гарантированного оценивания. В первых двух параграфах исследуется вопрос об оценках погрешности областей достижимости управляемых систем, описываемых обыкновенными дифференциальными уравнениями при наличии фазовых ограничений, при дискретизации ограничений. С основной тематикой главы эти разделы связывает тот известный факт, что информационное множество для задачи оценивания состояния динамической системы с неопределенными возмущениями и ошибками измерений представляют из себя область достижимости системы с фазовыми ограничениями, задаваемыми уравнениями измерений. Таким образом, на приводимые оценки можно смотреть с точки зрения обоснования применения дискретных аппроксимаций при построении информационных множеств. Сходимость дискретных аппроксимации и оценки погрешности аппроксимаций исследуются во многих работах, посвященных численным методам в теории управления и дифференциальных играх [20, 51, 115, 118, 139]. Особенностью изучаемых в данной работе задач является то, что рассматриваются фазовые ограничения типа равенства, не имеющие внутренних точек. Эти предположения, в свою очередь, вызваны тем, что получаемые оценки ориентированы на возможные применения при анализе устойчивости информационных множеств. В параграфе 1.3 исследуется вопрос об устойчивости информационных множеств для абстрактных задач гарантированного оценивания в банаховых пространства относительно ошибок измерения. Для задач с нормально разрешимыми операторами получены оценки для уклонения информационных множеств, имеющие первый порядок малости от величины ошибок измерения. В следующих параграфах данной главы для абстрактных задач гарантированного оценивания в гильбертовых пространствах введено понятие регуляризованного информационного множества и дано его вариационное описание в терминах экстремальных задач, связанных с методом регуляризации Тихонова. Данный результат позволяет для получения оценок скорости сходимости информационных множеств в гильбертовых пространствах использовать известные оценки для метода регуляризации. Найден предел регуляризованных информационных множеств при стремлении уровня ошибок к нулю, даны оценки скорости сходимости множеств в хаусдорфовой метрике в зависимости от величины погрешности измерений

Похожие диссертации на Оптимальность и устойчивость алгоритмов гарантированного оценивания