Математическое обеспечение решения задач распознавания в системе обработки многозональной космической видеоинформации Асмус Василий Валентинович

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Асмус Василий Валентинович. Математическое обеспечение решения задач распознавания в системе обработки многозональной космической видеоинформации : ил РГБ ОД 61:85-1/1702

Содержание к диссертации

Введение

ГЛАВА I. Фильтрация полупрозрачной облачности 16

1.1. Введение 16

1.2. Модель формирования видеосигнала и построение оптимального фильтра 17

1.3. Оценка параметров фильтра 20

1.4. Реализация алгоритма фильтрации на ЭВМ. Постановка задачи 23

1.5. Прямая свертка и быстрая свертка 24

1.6. Фильтрация разбиением на блоки .. 27

1.7. Оптимальные размеры блоков 31

1.8. Результаты экспериментов 34

1.9. Заключение 35

I.IO. Выводы 37

ГЛАВА 2. Квадратичные решающие правила (к.р.п.) и оценка их параметров 38

2.1. Введение J. 38

2.2. Постановка задачи 39

2.3. Построение почти оптимального к.р.п... 40

2.4. Связь к.р.п. с байесовским р.п. 42

2.5. Последовательные методы при алгоритмической реализации к.р.п 44

2.6. Динамический критерий выбора признаков и его связь с дивергенцией 45

2.7. Размерность пространства признаков и рекуррентное представление к.р.п 47

2.8. Вероятность ошибочной классификации к.р.п. и ее использование для оптимизации вычислительного алгоритма 49

2.9. Выбор пространства признаков для к.р.п... 54

2.10.Программа распознавания по к.р.п 56

2.II.Реализация к.р.п. при параллельных вычисле ниях 59

2.12.Использование текстурных признаков 66

2.13.Редактирование и генерализация результатов распознавания 67

2.14.Исходные материалы для численных эксперимен тов и их радиометрическая коррекция 72

2.15.Результаты численных экспериментов 75

2.16.Выводы 79

ГЛАВА 3. Адаптация обучающих данных при решении задач распознавания 81

3.1. Вв едение 81

3.2. Изменчивость многозональных данных и методы ее учета 81

3.3. Адаптация в задачах распознавания 84

3.4. Физические основы метода адаптации 85

3.5. Математическая постановка задачи 87

3.6. Уравнения максимального правдоподобия . 90

3.7. Численное решение уравнений 92

5.8. Эксперименты по адаптации 93

3.8. Сравнение с другими методами адаптации... 96

3.10. Алгоритм кластерного анализа по многомерной гистограмме 97

3.11. . Заключение 101

3.12. Выводы 102

ГЛАВА 4. Форш представления многозональной космической видеоинформации (МКВ) 103

4.1. Представление МКВ в пространстве меньшей размерности 103

4.1.1. Введение 103

4.1.2. Постановка задачи 105

4.1.3. Построение системы проектирующих векторов 108

4.1.4. Эксперименты по визуализации многомер ных данных 112

4.2. Оптимальное представление МКВ 113

4.2.1. Постановка задачи 113

4.2.2. Метод главных компонент 116

4.2.3. Метод декорреляции 117

4.2.4. Вычислительный алгоритм 119

4.2.5. Эксперименты по цветному синтезу 123

4.3. Выводы 131

Заключение 132

Литература

Реализация алгоритма фильтрации на ЭВМ. Постановка задачи
Последовательные методы при алгоритмической реализации к.р.п
Физические основы метода адаптации
Эксперименты по визуализации многомер ных данных

Введение к работе

Эффективность изучения природных ресурсов аэрокосмическими средствами во многом определяется методами обработки данных дистанционного зондирования /1-3/. В настоящее время, в соответствии с программой ГКНТ СССР 0Ц.038 и Постановлением ЦК КПСС, СМ СССР, Президиума АН СССР и ГКНТ СССР от 05.05.77 г. ведутся работы по созданию комплекса вычислительных средств оперативной обработки многозональной космической видеоинформации (МКВ). Трудности построения такой системы в основном определяются двумя причинами. Первая причина - гигантские объемы информации (до 100 Мбайт на одно многозональное изображение, при мощности входного информационного потока свыше I Гбайт/,час) и многомерный характер данных (две пространственные координаты, одна спектральная и одна временная). Отсюда повышенные требования к эффективности алгоритмов, быстродействию и размерам памяти вычислительных устройств. Вторая причина состоит в невозможности или нецелесообразности с вычислительной точки зрения полной формализации большинства задач обработки. Это приводит к необходимости организации оперативного участия человека для наблюдения и управления ходом решения задачи. Такой режим обработки принято называть диалоговым или интерактивным. Диалог человек - ЭВМ можно рассматривать как своеобразный алгоритм оптимизации, позволяющий сочетать различные стратегии обработки и содержательный анализ (с привлечением априорной информации) промежуточных и конечных результатов обработки. Типичным примером интерактивного режима работы является процедура маркировки оператором на экране дисплея элементов изображения, ко-

торые затем служат обучающими выборками при решении задачи распознавания с обучением.

С учетом сказанного выше, концепция построения комплекса оперативной обработки предполагает разделение вычислительного процесса на два уровня: интерактивную обработку части данных для выработки стратегии обработки и валовую (конвейерную) обработку всего информационного потока по решающим правилам, определенным в интерактивном режиме.

Реализация этой концепции возможна в рамках функциональной схемы комплекса (рис.0 Д), главными структурными элементами которой являются: банк космической информации (накопители высокой плотности записи), обеспечивающий регистрацию и буферизацию спутниковых измерений, доступ к ним блока валовой обработки и перегапись части информации (до 10%) в банк априорных данных; блок валовой обработки (спецпроцессоры быстродействием до сотен млн опер/сек); интерактивный комплекс (видеодисплейные системы); банк априорных данных, обеспечивающий хранение информации, необходимой для выработки решающих функций; блок отображения результатов обработки (лазерные фоторегистраторы, графопостроители); блок "главного администратора", формирующий "лист заказа" на выходную продукцию, планирующий съем информации и выполняющий диспетчеризацию всех процессов обработки.

Общую задачу обработки МВБ можно сформулировать как задачу определения свойств природных объектов по характеристикам их электромагнитного излучения. Решение этой комплексной задачи достигается путем подразделения всего процесса обработки на ряд более или менее независимых проблемных модулей.

Рис. 0.1 Функциональная схема комплекса обработки

_{гшиыи ЦШИСТШОР}

_{0Т0БРАЖШЕІ}

спутник.

ИЗМЕРИТ. nOAOHGTE-

наземная наши,.

ИЗМЕРИТ. ПОАСИСТЕ-МА

БАНК КОСМИЧЕСКОЙ ИНФОРМАЦИИ

БАНК АПРИОРНЫХ ДАННЫХ

^\ СПЕЦПРОЦЕССОРЫ LliiLliV BAAOBQU 06PA5QT.

^—г-/1—^и^А

WHTEPAKTWoHblU КОМПЛЕКС

_г"^

і-

+ +

ч- н- -ь + +

О СО

хэ «с о

J oL-n-pVOpUa.?. ПІ*» (р&р JU 31.14,11.9.

-7 лтогоъональные. даймів

рв-швсющие (ру-н'кц'игі.

результати оВраЬотигг/ (тематически є -карте/)

В настоящей работе рассмотрены вопросы, решение которых должно давать возможность представлять МКВ в виде наиболее удобном для визуального анализа и автоматического дешифрирования (в том числе и фильтровать облачность), проводить само дешифрирование и редактировать результаты обработки. Круг этих вопросов обычно связывают с содержанием модуля распознавания. Модуль распознавания является центральным при тематической обработке, что и определяет актуальность проблемы разработки его математического обеспечения.

Общая цель работы заключается в исследовании и разработке типовых алгоритмов и методов организации вычислений, служащих основой для эффективного решения задач модуля распознавания в системе оперативной обработки МКВ. Для этого, в частности, необходимо:

разработать функциональное наполнение модуля, обеспечивающее построение эффективных решающих правил, фильтрацию облачности, оптимальное представление МКВ и показать возможность реализации разработанных алгоритмов в режиме валовой обработки на спецпроцессорах;

найти пути сокращения вычислительных затрат при выработке решающих функций на интерактивном комплексе. Эта задача является ключевой для работы всей системы, поскольку до 70% времени обработки одиночного снимка тратится на интерактивный процесс обучения;

определить содержание банка априорных данных.

При решении указанных задач ориентация была взята на разработку методов эффективных в реальной ситуации, то есть требую-

щих минимума априорной информации и достаточно просто реализуемых на вычислительной технике. Поэтому постановка задач рассмотрена в возможно более общем виде (например, без обычных в таких случаях ограничений на вид функции распределения), а алгоритмы используют лишь информацию, которую можно получить из анализа самих многозональных данных. Все алгоритмы типизированы и разработаны последовательные и параллельные методы их реализации, оценены объемы вычислительных затрат, определены функции, подлежащие реализации на спецпроцессорах.

Диссертация состоит из введения, четырех глав и заключения. Главы имеют однотипную структуру: введение, постановка задачи, математическая формализация постановки, решение задачи, алгоритмическая реализация решения на ЭВМ, эксперименты на реальных и модельных данных, заключение и выводы.

В первой главе на основе общих соотношений формирования видеосигнала рассматривается решение задачи фильтрации полупрозрачной облачности гомоморфными методами линейной фильтрации. Оценка параметров фильтра производится при помощи алгоритмов распознавания. Ядро вычислительной процедуры составляет свертка многомерных массивов блоками методом перекрытия с накоплением. Найдены оптимальные параметры обработки. Экспериментально показано, что наилучшие результаты для визуального дешифрирования дает фильтр энергетического спектра, а для последующего автоматического распознавания фильтр Колмогорова-Винера.

Вторая глава посвящена исследованию квадратичных решающих правил (к.р.п.) при условии, что вся доступная информация о

распознаваемых классах ограничивается указанием первых двух моментов. Рассматривается построение к.р.п., получены оценки вероятностей ошибочной классификации. Для реализации к.р.п. при последовательном счете применен динамический критерий отбора признаков в сочетании с использованием порогов, для случая параллельных вычислений разработан обобщенный метод главных компонент. Проведен сравнительный анализ к.р.п., полученных в предположении нормального распределения и без него* Экспериментально показано, что для реальных данных при оценке параметров к.р.п. лучше применять робастные методы, чем оценки максимального правдоподобия. Рассмотрены вопросы учета пространственных характеристик: текстурных и контекстных. Последние используются при решении задач генерализации на основе кластерного анализа и редактирования, методом релаксации. Описан применявшийся для обеспечения экспериментов на реальной информации алгоритм радиометрической коррекции.

В третьей главе рассмотрена проблема адаптации обучающих данных. На основе модели изменчивости МКВ получена система нелинейных уравнений для решения указанной задачи. Коэффициенты уравнений определяются посредством процедуры идзнтиф икации параметров смеси многомерных нормальных законов. Ядро процедуры составляет алгоритм кластерного анализа по многомерной гистограмме без ограничения на число каналов. Решение системы уравнений проводится с помощью метода сопряженных направлений. Экспериментально, сравнением результатов распознавания, показано, что разработанная модель хорошо компенсирует разницу в условиях съемки.

Четвертая глава посвящена вопросам оптимизации представления

МКВ: в пространстве меньшей размерности с целью ее визуализации и в виде наиболее приемлемом для цветного синтезирования. Для решения первой задачи на основе критерия максимина разработан алгоритм проектирования с помощью линейного дискриминанта Фишера. Экспериментально показана эффективность максиминно-го подхода. Для оптимального представления МКВ с целью ее цветного синтеза разработан метод декорреляции, основанный на идее вращения факторов. Эксперименты подтвердили, что цветной синтез изображений, обработанных по этому методу, дает лучшие результаты по сравнению с известными процедурами яркостных преобразований. Для реализации линейных преобразований типа описанных выше предложена процедура, позволяющая производить нормировку данных, соответствующую динамическому диапазону устройств отображения, одновременно с выполнением самого преобразования.

Экспериментальные исследования проводились на стендовом вычислительном комплексе Государственного научно-исследовательского центра изучения природных ресурсов (ГосНВД ИПР), включающем: ЗВМ L.5I-2 и EC-I022, устройства ввода/вывода изображений ФОТОМЕЙШН и ВОЛГА, полутоновые дисплеи РАМТЕК и ПЕРИНО ЛОР-ЮОО магнитофоны высокой плотности записи ШЛЕМБЕРІЕ, многоканальный синтезирующий проектор МСПЧв. Разработанное программное обеспечение в основном написано на языке Фортран, с реализацией на Ассемблере модулей взаимодействия с нестандартными внешними устройствами и модулей критичных с точки зрения быстродействия и использования памяти.

Программы выполняют построчную обработку входных массивов,

записанных в спектросовмещенном формате (каждому элементу изображения ставится в соответствие последовательность Ы байтов, описывающих результаты регистрации излучения разрешаемого элемента земной поверхности во всех ri диапазонах) и пригодны для обработки изображений самых больших размеров. Те результаты обработки, которые по своему смыслу являются изображениями также записываются в спектросовмещенном формате. Унификация входных и выходных форматов данных позволяет в процессе обработки эффективно использовать устройства визуализации и дает возможность применять разработанные программные модули в произвольной последовательности, тем самым обеспечивая конечным числом алгоритмов полное покрытие предметной области.

Основные результаты, выдвигаемые на защиту:

Исследование и разработка новых эффективных методов преобразования МЕВ в системе обработки, функционально покрывающих предметную область модуля распознавания.
На основе этих методов разработка и экспериментальная проверка новых алгоритмов, а именно:

алгоритма гомоморфной линейной фильтрации полупрозрачной облачности;

алгоритмов построения, отбора признаков и оценки параметров решающих правил второго порядка;

алгоритмов генерализации, с помощью кластерного анализа и редактирования, на основе метода релаксации;

алгоритма кластерного анализа по многомерной гистограмме без ограничения на число спектральных каналов;

алгоритма проектирования в пространство меньшей размерности по критерию максимина линейного дискриминанта Фишера;

алгоритма оптимального представления для цветного синтеза с помощью преобразования декорреляции.

Унификация алгоритмов модуля распознавания и определение базовых преобразований: преобразования по таблице, линейного преобразования, многомерной свертки и квадратичной формы. Разработка новых методов реализации этих преобразований при последовательной и параллельной обработке.
Разработка метода и реализующего его алгоритма пространственно-временной адаптации обучающих данных, позволяющего сократить объем работ, выполняемых на интерактивном комплексе за счет повышения эффективности использования банка априорных дан-

ных*

Полученные в диссертации результаты позволили сформулировать Требования и определить Состав ППП модуля распознавания и использованы при разработке Технического Проекта перспективной спутниковой системы изучения природных ресурсов Земли.

Разработанное программное обеспечение применяется в течение ряда лет при обработке, в том числе к оперативной, космических данных получаемых многозональными сканирующими системами МСУ-С, МСУ-М, "Фрагмент", камерой МКФ-6, локатором бокового обзора,

комплексом "Болгария-1300" для решения агрометеорологических, гидрологических и океанографических задач.

Программы пакета обработки внедрены в Вычислительном центре СО АН СССР, на Физическом факультете МГУ им. М.В.Ломоносова, во ВНИИ сельскохозяйственной метеорологии и Главном центре

приема и обработки спутниковой информации Госкомгидромета, а также переданы для использования в Центральный институт физики Земли АН ІДР, Центральный институт прогнозов и Центральный метеорологический институт МС ВНР.

Основные результаты диссертации докладывались и обсуждались на П Всесоюзной конференции по использованию космической информации при решении задач исследования природных ресурсов (Москва, 1978 г.) , на Всесоюзном семинаре "Использование аэроюс-,; -мической информации при решении агрометеорологических задач. Вопросы интерпретации и обработки спутниковой информации" (Ташкент, 1978 г.)» на Всесоюзной школе-семинаре молодых ученых по системному и теоретическому программированию (Львов, 1979 г.), на симпозиуме "Исследование и проектирование сложных систем" (пос.Славско, 1980 г.), П научной конференции Рабочей группы социалистических стран по дистанционному зондированию (Брно, ЧССР, 1980 г.), на Региональной конференции "Обработка изображений и дистанционные исследования" (Новосибирск, 1981 г.), на Международном совещании-семинаре "Проблемы цифровых методов обработки космических видео-данных" (Москва, 1982 г.), на семинаре отдела математических методов геофизики ВЦ СО АН СССР (рук. чл.-корр. А.С.Алексеев; 1983 г.), на межфакультетском семинаре МГУ "Методы обработки космической информации в интересах решения пилотажно-навигационных задач и задач землеведения"

(рук. проф. В.А.Садовничий; 1984 г.), на Всесоюзном совещании

"Радиофизические и оптические методы исследования снега и льда"

(Ленинград, 1984 г»), на Ученом совете и конференциях молодых ученых ГосНИІЩІР (1977-1984 гг.).

Часть практических результатов обработки космической информации экспонировалась на ВДНХ СССР.

По теме диссертации опубликовано 14 печатных работ. Сведения о программном обеспечении публиковались в "Международном информационном бюллетене алгоритмов и программ обработки аэрокосмической видеоинформации", вып. І-Ш, Интеркосмос, Москва - Варшава, 1979-81 гг.

Реализация алгоритма фильтрации на ЭВМ. Постановка задачи

Оценив параметры фильтра Н, получаем отфильтрованное изображение f являющееся оценкой полезного сигнала -f : = &, ()-сурIE аам,-іс,и.-іг,1-ьг)к(и9іг,ьГ)} (і.7) иг гг и, О Таким образом, время реализации выражения (1.7) на ЭВМ определяется временем выполнения преобразования типа свертки для трехмерного массива данных.

В рамках решения данной задачи, когда размеры входного массива намного превосходят размеры оперативной памяти (ОП) и (или) когда не требуется фильтрация всего массива, а лишь его части (например, занятой облачностью), можно применить специальные приемы, дающие возможность существенно снизить требования к объе - 24 му ОП и разрядности вычислительных устройств, вести фильтрацию в скользящем режиме (по мере поступления данных), увеличить быстродействие и распараллелить обработку. Основная идея таких алгоритмов фильтрации заключается в разбиении входного массива на блоки, раздельной (параллельной) фильтрации каждого блока и объединении результатов. Ранее фильтрация делением на блоки применялась для обработки одномерных сигналов (радиолокационные данные, речевые сигналы) /10/. Хотя обобщение соответствующих алгоритмов на многомерный случай и не вызывает каких-либо принципиальных трудностей, однако при поиске параметров, оптимизирующих многомерную фильтрацию, получен ряд любопытных результатов. Проведенные расчеты показали, в частности, что принцип "чем больше объем ОП, тем быстрее вычисления" не всегда верен, так как существуют оптимальные размеры блоков, подлежащих фильтрации Основанием для применения фильтрации блоками к многозональной видеоинформации может служить факт экспоненциального убывания корреляции элементов изображения с ростом расстояния между ними /II/.

Ниже, в параграфе 1.5 выведены соотношения, позволяющие производить выбор способа фильтрации (во временной или в частной области) в зависимости от значения входных параметров; описание алгоритмов фильтрации блоками дано в параграфе 1.6;ларагра$ 1.7 посвящен вопросам, связанным с оптимизацией.параметров процедуры фильтрации.

Прямая свертка и быстрая свертка Рассмотрим свертку в пространстве См : - 25 где {/1( ,...,/ ), 0,/ -.1] ,fc = і,Mi - импульсная харак теристика фильтра, { ХСиг ...,ж.м ке [од -і], (с = ігм -массив исходных данных, і ( -І,..., М), К И,І - к],»с = і,м}-выходной массив.

Вычисление - может быть проведено как во временной области (путем непосредственной реализации выражения (1.8) ), так и в частотной, при помощи преобразования Фурье. В первом случае свертка называется прямой сверткой (ПС), во втором случае -быстрой сверткой (БС). Термин быстрая применяется потому, что существует алгоритм быстрого преобразования Фурье (ШФ) /10/. Для вычисления свертки черев ШФ, (1.8) нужно представить в виде "круговой" свертки, для чего требуется доопределить массив -L нулями до размеров массива х. . Метод БС заключается во взятии БПФ от & и эс , перемножении спектров и проведении обратного БПФ. При этом последние (/V«-1),K = I,M отсчетов по каждой координате обусловлены круговыми наложениями и не рассматриваются. Поэтому, чтобы избежать искажений на краях, массив аг. обычно доопределяют нулями.

Найдем значения параметров, при которых нужно применять ту или иную реализацию выражения (1.8). Для определенности рассмотрим наиболее распространенный алгоритм ШФ по основанию 2. При ПС на одну выходную точку требуется А/ = лУі Л/г ... (N/M комплексных умножений (к.у.) и N-1 комплексное сложение (к.с). Таким образом время Тпсс прямой свертки массива размером т = = ІіЛ2-..Ім равно

Последовательные методы при алгоритмической реализации к.р.п

Перейдем к вопросам алгоритмической реализации р.п. (2.10). Прежде всего заметим, что меру (2.13) можно получить не только преобразованием ЛСШ, но также преобразованием по методу главных компонент (МГК, см. параграф 4.2.2). В последнем случае оценка ОСц строится как линейная функция всех N компонент вектора X . Фактически ЛСКО и МГК можно рассматривать, как два различных способа приведения квадратичной формы (x-ju fZ tx-JUK) к каноническому виду. В МГК вместо (2.12) используется следующее разложение (существующее вследствие положительной определенности XI ц. ): Z =VKSKVK (2.14) где VK -матрица собственных векторов, S = ( г? " ) матрица собственных чисел и v: v. = v; v.=Е (2.15) При помощи (2.14) и (2.15) 00 можно представить так: (2.16) на где е - - tb , р - проекция вектора ( х - м ) і -ый собственный вектор, Ski - разброс по і -ой главной оси. Запишем р.п. (2.10) в следующем виде: X 00;,, если %(Х) %М (2.17) Представив Я (Х) в каноническом виде (2.10) /или (2.16)/, из (2.17) получаем, что гипотеза о принадлежности вектора X классу (л)і может быть отвергнута как только частичная сумма a X) =s\ . , UMN (2.18) К=1 или 1 (у) - j\ е\ -і . t /v/ превзойдет величину Я)г;(х)

Очевидно, что выгодно заставить частичную сумму увеличиваться самым быстрым образом, тогда неправильная гипотеза бу дет отвергнута при минимальном значении к, . Для этого нужно изменить порядок измерений в векторе X (при этом величина (х) не изменится) так, чтобы осредненные по классу о), слагаемые в каноническом разложении 3 (х) убывали при возрастании номера ю . Нетрудно подсчитать, что Mj .) = иД Z.J + (Д- / lU/JLj -дП іТ.к (2.19) где Luc- к.-ая строка матрицы t»i и Mjсе- = l + " "/Г к (2-го) Ч - к -ый собственный вектор матрицы Y

Хотя при разложении МГК частичные суммы %\ (х) будут расти несколько быстрее за счет большей концентрации дисперсии (МГК в этом смысле является оптимальным преобразованием /27/) это обстоятельство, однако, практически не оказывает большого влияния на скорость классификации при небольших значениях i\j . В то же время,использование разложения Холецкого (2.12) приводит к тому, что количество операций, необходимых для вычисления величины Ь\ . становится пропорциональным ic /см.(2.II) /, так как при накоплении частичных сумм сначала берется наиболее информативный для различения данной пары классов о)і и со. признак, затем наиболее информативная пара признаков и т.д. При разложении же (2.14) для вычисления любого слагаемого используются все N признаков. Поскольку при вышеописанном подходе пространство признаков выбирается не заранее, до начала классификации, а непосредственно в процессе распознавания, то этот подход можно назвать динамическим. Важнейшей особенностью динамического подхода следует признать то, что эффек тивность его применения возрастает при росте числа классов и размерности вектора наблюдений. Действительно, чем больше имеется зон съемки, тем легче найти зону (или пару зон и т.д.), по которой данная пара классов различается.

Информативность измерений во введенном нами смысле можно связать с дивергенцией - широко применяющейся в случае нормально распределенных классов мерой при отборе признаков /25, 30/. Действительно, информацию, отличающую класс СО. от класса СО-можно измерить логарифмом отношения правдоподобия U. (to./%)-&, у ]) Средняя различающая информация для класса (JO- определяется выражением Г(СО.-,С0І.) = М- ( U,(u). 0Oi)) . Если классы ш к-ч. имеют нормальные распределения vN/f/U , 2,1с) , то М: С а 00 - %]№) = X Т((о.,со) - Є и J о 12-; I

Таким образом, согласно (2.17), если X t U2t- , то среднее значение квадратичной формы для отвергаемой гипотезы превосходит соответствующее значение для правильной гипотезы на величину, пропорциональную средней различающей информации. Полную среднюю информацию для различения классов называют межклассовой дивергенцией и определяют как «J (со.,С0\) - ICta. 6ot)+ I(to u).) /25/.

Физические основы метода адаптации

Данные с многозонального сканера "Фрагмент" (4 зоны съемки, ширина полосы обзора 85 км, разрешение 80 м /53/) не могут быть непосредственно, без радиометрической коррекции использоваться при тематическом анализе. Природа радиометрических искажений этих данных следующая. Для увеличения разрешения на местности и улучшения соотношения сигнал/шум в приемном блоке ряда сканирующих устройств используется линейка с детекторами излучения (в приборе "Фрагмент" их 6). Такая линейка детекторов, производя сканирование одновременно нескольких строк поперек трассы полета ИСЗ дает возможность увеличить время наблюдения каждой элементарной площадки земной поверхности и тем самым удовлетворить альтернативным требованиям по разрешению и отношению сигнал/шум. В настоящее время точная калибровка детекторов друг относительно друга и ее сохранение на протяжении эксплуатации прибора в космосе встречает технические трудности. Отсутствие точной калибровки визуально проявляется на снимках в виде эффекта "полосатости". Для устранения этого эффекта разработана программа радиометрической коррекции " COFR, ", которая производит коррекцию каждой зоны многозонального файла путем уравнения статистических характеристик (первые два момента) результатов регистрации излучения по всем детекторам данной зоны. Уравнивание ведется относительно одного из детекторов, выбранного в качестве опорного. Номер опорного детектора для данного канала задается как номер среднего значения сигнала, зафиксированного этим детектором, в вариационном ряду для всех датчиков этого канала. Коррекция может проводиться как для всего файла, так и для любого его прямоугольного фрагмента. Запись откорректированных данных производится в том же спектросовмещенном формате, что и исходное изображение, с сохранением служебных байт и аннотации (различного рода буквенно-цифровая информация и телеметрия). На рис.2.2 представлен пример радиометрической коррекции.

Для более уверенной идентификации с/х полей на изображениях по картографическим материалам применялась направленная фильтрация контуров (рис»2.3) оператором Собеля /6/.

В качестве реальных данных, обладающих нормальным распределением были взяты многозональные векторы, соответствующие достаточно однородным тестовым участкам озимой пшеницы с высокой степенью проективного покрытия (90-100%). Проверка нормальности осуществлялась вычислением коэффициентов асимметрии, эксцесса и среднего отклонения. В качестве данных, имеющих отличный от нормального закон распределения, были взяты данные тестовых участков озимой пшеницы с умеренным проективным покрытием (60-80%). Гистограммы этих данных имеют двумодовый характер (один пик соответствует вкладу зеленой массы, другой - почвы).

Подобные результаты получены и на реальной информации: р.п. (2.10) уступает ЕРП на 3,7% на нормально распределенных данных и на 12,8% превосходит его по уровню ошибок классификатора на данных, не имеющих нормального распределения.

Кроме того, поскольку в реальном изображении могут встречаться объекты и с нормальным и с отличным от нормального законами распределения был проведен "смешанный" эксперимент по одновременному распознаванию и тех и других классов. В результате р.п. (2.10) дало классификацию лучшую на 7,2%, При испытании р.п. применялась стратегия "складного ножа" /29/: выборка делилась на 10 частей, классификатор обучался на 90% выборок и распознавал остальные 10%. Процедура повторялась 10 раз с использованием различных 10% выборок. Результат в конце осреднялся.

Сравнительный анализ применения оценок максимального правдоподобия и медианных оценок при вычислении in и в "смешанном" эксперименте показал, что последние дают выигрыш в среднем около 1,2% в правильном распознавании для р.п. (2.2) и 1,7% для р.п. :(2.10).

Кроме-того, в "смешанном" эксперименте исследовалась пригодность оценок на вероятность ошибочной классификации (2.27) и (2.28) при отборе признаков. Необходимость такой проверки диктуется тем, что неравенство Чебышева, как и всякий общий результат, использующий минимум априорной информации дает довольно грубые оценки и применимость их должна быть показана эмпирически. Проверка заключалась в следующем: сначала из 4 зон информации по критерию минимакса (2.310 отбиралось две зоны и по ним проводилось распознавание. Затем распознавание проводилось и для всех остальных парных сочетаний зон (всего С экспериментов). Оказалось, что наилучшую классификацию дает первый эксперимент. Пара каналов, определенная критерием (2.31) как наихудшая, дала наихудшие результаты при распознавании. Все это подтверждает применимость на практике оценок на вероятность ложной классификации квадратического р.п.

Эксперименты по визуализации многомер ных данных

Задачу выбора единиц представления МКВ имеет смысл ставить как можно меньше привязываясь к конкретному содержанию снимка (т.е. не привлекая подробной априорной информации о структуре данных)«исходя из принципа максимума энтропии (критерий автоинформативности ).

На применении этого принципа основано решение задачи оптимизации представления изображений по полю яркостей с учетом характеристик устройств отображения и психовизуальных свойств зрения. Наиболее распространенным здесь является преобразование яркостей исходного изображения О Х Хпс в яркости о$шімьу такие, чтобы воспринимаемые глазом яркости Сі % были распределены равномерно (используется иногда и нормальное распределение /46/ ), то есть О , в противном случае Легко показать, что равномерное распределение обеспечивает максимум энтропии, если случайная величина отлична от нуля в конечном интервале. Если же априорная информация о неотрицательной случайной величине задана средним и дисперсией, то следует выбирать нормальное распределение /25/.

Для сохранения соотношений "светлее - темнее" функция а должна быть монотонной. Поскольку 32,М , % связаны монотонными преобразованиями, то Р( [0,Х]) - Р( б[0, 1) = ($ [ОД]) или ]wu) rfu.«[yuW откуда u cot) =; а { g СО) + L KJJM )- }(0)] jp (u)Ju}

В частности, аппроксимируя чувствительность глаза логарифмической функцией (закон Вебера-Фехнера /46/: Q (и) - Ь (V + С) , где С - постоянная, определяемая условиями восприятия, освещенностью фона и т.д.) получаем соотношение, известное, как преобразование гиперболизации гистограммы /6, 46/. Для оптимизации представления МКВ по полю яркостей разработана программа " EQUAL ", реализующая операции эквализации, гиперболизации, приведения к нормальному закону и линейное преобразование по минимальным и максимальным значениям, определяемым из гистограммы по заданному уровню значимости. Цикл обработки требует двух проходов по данным: расчет гистограмм по каждому каналу и преобразование по передаточной функции.

Одними лишь преобразованиями по полю яркостей получить хороший цветосинтезированный снимок трудно, поскольку изображения остаются коррелированными по зонам съемки. Для декорреля-ции МКВ по спектральным диапазонам в настоящее время применяется МГК - метод также использующий критерий автоинформативности /92-96/.

Пусть {X X ( Н исходное N -зональное изобра жение и К его ковариационная матрица. Пусть Ф - матрица, столбцы которой суть собственные векторы матрицы К,, упорядо ченные в порядке убывания соответствующих им собственных чи сел \i У, Хг 7/ ... У/ Хы . Вектор главных компонент (ГК) Y а : і определяется, как линейная комбинация компонент исходного вектора X : Ї-Ф Х (4.2.1) при этом ковариационная матрица векторов Y равна ZL- (Ь X ) » т0 есть "К некоррелированы (статистическая ортогональность). Набор из первых к. ГК является оптимальным по критерию максимальной концентрации дисперсии. Поскольку матрица Ф ортонормальна (геометрическая ортогональность), то Ьь =ІЛ.21 u. ІІСІ = 1Ш , следовательно )(ь М)-л.л - " . Известно, что из свойства статисти ческой ортогональности ГК можно вывести свойство максимальной концентрации дисперсии в направлении, определяемом собственными векторами и наоборот.

С точки зрения оптимального представления, декорреляция МКВ, устраняющая общий фон (изображения сильно коррелированы по зо-нам за счет большого вклада постоянной яркостной составляющей /92/ ) является свойством очень ценным. С другой стороны, при цветовом синтезе изображений, представленных в пространстве собственных векторов, природные объекты получают не свойственную им окраску. Кроме того, МГК приводит к сильной концентрации шума в младших компонентах. При синтезе, когда нет возможности отбросить зоны с большим количеством шума, например, если на входе 3-4 зональное изображение это проявляется в характерных шумовых выбросах (ряби) на цветосинтезированном изображении. Суммируя, можно сказать, что желательно было бы иметь преобразование, производящее декорреляцию в пространстве близком к исходному без экстремального перераспределения дисперсии.

Математическое обеспечение решения задач распознавания в системе обработки многозональной космической видеоинформации Асмус Василий Валентинович

Реализация алгоритма фильтрации на ЭВМ. Постановка задачи

Последовательные методы при алгоритмической реализации к.р.п

Физические основы метода адаптации

Эксперименты по визуализации многомер ных данных

Похожие диссертации на Математическое обеспечение решения задач распознавания в системе обработки многозональной космической видеоинформации