Эффективные способы и средства описания изображений в задачах распознавания Корябкина Ирина Валентиновна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Корябкина Ирина Валентиновна. Эффективные способы и средства описания изображений в задачах распознавания : диссертация ... кандидата технических наук : 05.13.17.- Москва, 2006.- 138 с.: ил. РГБ ОД, 61 07-5/893

Содержание к диссертации

Введение

Глава 1. Формальные способы описании изображений 9

1.1. Исследование моделей изображений 11

1.1.1. Понятие модели изображения 11

1.1.2. Классификация моделей изображений 13

1.2.1. Классы моделей, порождаемые методами когнитивной психологии 13

1.2.2. Классы моделей, порождаемые методами представления и обработки изображенийіб

1.2.3. Классы моделей, порождаемые дескриптивным подходом к анализу и распознаванию изображений 18

1.2. Роль признаковой модели в задачах распознавания и анализа изображений 20

1.2.1. Признаковое описание изображений 20

1.2.2. Определение понятая «признак изображения» 21

1.2.3. Основные задачи анализа и распознавания изображений, в которых используются признаки изображений 26

Глава 2. Систематизация и сравнительный анализ признаков изображений 29

2.1. Основные подходы к классификации признаков изображений 29

2.1.1. Библиографические источники, использованные для классификации и систематизации признаков изображений 30

2.1.2. Требования к классификации признаков изображений 33

2.1.3. Принципы классификации признаков изображений 34

2.2. Классификации признаков изображений по информации об изображении 35

2.2.1. Классификация признаков по типу изображения, служащего основой для вычисления признака 36

2.2.1.1. Бинарные признаки 36

2.2.1.2. Тоновые признаки 37

2.2.1.3. Яркости ые признаки 39

2.2.2. Классификация признаков по типу модельного представления, служащего основой для вычисления признака изображения 41

2.2.2.1. Статистические признаки 41

2.2.2.2. Признаки, характеризующие форму 42

2.2.2.3. Спектральные признаки 42

2.2.3. Классификация признаков по области изображения, на которой вычисляется признак 43

2.2.4. Классификация признаков по типу объекта, служащего основой для вычисления признака 44

2.2.4.1. Точечные признаки 44

2.2.4.2. Контурные признаки 45

2.2.4.3. Сегментационные признаки 46

2.2.4.4. Остовные признаки 46

2.3. Классификации признаков изображений по математическим средствам, используемым для вычисления признаков 46

2.3.1. Классификация по уровню признака 47

2.3.2. Классификация по способу определения признака 51

2.3.2.1. Вычисляемые признаки 51

2.3.2.2. Измеряемые признаки 51

2.3.2.3. Извлекаемые признаки 53

2.3.2.4. Выделяемые признаки 54

2.3.3. Классификация по типу пространства, допустимым элементом которого является признак 55

2.3.3.1. Символы и символьные строки 55

2.3.3.2. Числовые, векторные, матричные признаки 57

2.3.3.3. Структуры 68

2.3.3.4. Кусочно-непрерывные функции 59

2.3.4. Классификация признаков по математическому аппарату, используемому для определения признаков 60

2.3.4.1, Комбинаторные признаки 60

2.3.4.2, Логические признаки 60

2.3.4.3, Матричные признаки 61

2.3.4.4, Арифметические признаки 62

2.3.4.5, Топологические/геометрические признаки 62

2.4. Классификации признаков изображений, основанные на наличии у признаков некоторых специальных свойств 64

Глава 3. Метод выбора преобразований изображения в задачах распознавании изображений 66

3.1. Математическая постановка задачи распознавания изображений 66

3.1.1. Понятие эквивалентности в задачах распознавания изображений и способы задания эквивалентности 66

3.1.2. Математическая постановка задачи распознавания изображений в терминах классов эквивалентности 71

3.1.3. Математическая постановка редуцированной задачи распознавания изображений 73

3.1.4. Условия полноты класса АВО для редуцированной задачи распознавания изображений 74

3.1.5. Классы эквивалентности изображений в задачах распознавания 75

3.2. Мульти-модельные представления изображений в задачах распознавания 76

3.2.1. Понятие порождающего дескриптивного дерева 76

3.2.2, Параметрические ПДД 77

3.2.2,1. Использование параметрических ПДД при решении прикладных задач 86

3.3. Формальное описание метода выбора преобразования изображений в зависимости от информационных характеристик изображений 91

3.3.1. Информационные свойства изображений 91

3.3.2. Алгоритмическая схема, реализующая метод выбора преобразований изображений в задачах распознавания 93

Глава 4. Экспериментальное исследование метода выбора преобразования изображения. Библиотека вычисления признаков изображений . 99

4.1. Библиотека вычисления признаков изображений 99

4.1.1. Краткая характеристика библиотеки вычисления признаков 99

4.1.2. Сценарий работы с библиотекой вычисления признаков 105

4.2. Применение предложенного метода в задаче диагностического анализа цитологических препаратов 109

4.2.1. Постановка задачи анализа цитологических препаратов 109

4.2.2. Описание шагов предложенного метода при решении задачи анализа цитологических препаратов 112

4.2.3. Сравнение результатов распознавания на различных наборах признаков 114

Заключение 118

Список литературы 122

Классификация моделей изображений
Классификации признаков изображений по информации об изображении
Понятие эквивалентности в задачах распознавания изображений и способы задания эквивалентности
Сценарий работы с библиотекой вычисления признаков

Введение к работе

Актуальность темы

Разработка, исследование и реализация методов решения задач анализа, распознавания и оценивания изображений является одним из ведущих направлений информатики. Результаты соответствующих фундаментальных и прикладных исследований непосредственно используются в технической диагностике, неразрушающем контроле, дистанционном зондировании, экологическом мониторинге, прогнозировании и диагностике в медицине, планировании, поиске в геологии, прогнозировании в химии, автоматизации научных исследований. Данная тематика привлекает значительное число исследователей, однако, подавляющее большинство работ в данной области имеет эмпирический характер.

До сих пор по большей части применяются методы обработки изображений, заимствованные из цифровой обработки сигналов, и традиционные математические методы (главным образом, статистические). Известны публикации, посвященные возможностям расширения используемого при анализе изображений математического аппарата (например, вейвлетов, фракталов, метода регуляризации) и применения методов и аппарата математической теории распознавания.

"Алгебраизация" обработки, анализа и распознавания изображений считается во всем мире актуальным и перспективным направлением исследований. Идея построения унифицированной теории для различных понятий и операций, использующихся в обработке изображений и сигналов, появилась впервые в работах Ангера (Unger, 1958) (распараллеливание алгоритмов обработки и анализа изображений на ЭВМ с клеточной архитектурой). Отдельные концепции алгебраического подхода к обработке изображений нашли отражение в теории образов У.Гренандера (алгебраическое описание анализируемых объектов), и алгебре изображений Г.Риттера (алгебраическое представление операций обработки и анализа изображений). Наибольший интерес представляет дескриптивный подход к анализу и пониманию изображений, разработанным И.Б. Гуревичем в качестве специализации общего алгебраического подхода Ю.И.Журавлева к решению задач распознавания, классификации и прогнозирования на случай представления исходных данных в виде изображений. Фундаментальными составляющими дескриптивного подхода являются формальные представления изображений (классы моделей изображений и признаковых описаний изображений), порождающие дескриптивные деревья, понятие эквивалентности изображений и дескриптивные алгебры изображений.

Наиболее близки к проблеме автоматизации анализа изображений дескриптивный подход к анализу и распознаванию изображений И.Б.Гуревича, алгебра изображений Риттера и теория образов Гренандера. К сожалению, результаты теоретических исследований не находят широкого применения в задачах распознавания изображений. В значительной степени это связано с тем, что для применения формализованных алгебраических конструкций к изображениям необходимо, прежде всего, достичь степени

формализации исходной информации, допускающей использование соответствующих алгоритмов распознавания.

Сравнительно недавно пришло осознание необходимости разбиения задачи распознавания изображений на задачу приведения изображений к виду удобному для распознавания и собственно задачу распознавания. В связи с этим возникла потребность в разработке методов и средств построения формальных описаний изображений.

Цели и задачи диссертационной работы

Диссертационная работа посвящена исследованию информационной природы изображения как средства представления и передачи информации и исследованию методов формального описания изображений в задачах анализа и распознавания изображений с целью автоматизации выбора алгоритма преобразования изображений.

Для достижения поставленной цели были проведены следующие исследования:

Исследование средств и способов формального описания изображений как основы для выбора алгоритма распознавания изображений, в том числе исследование моделей изображений и признаков изображений.
Построение классификаций признаков, используемых в задачах распознавания изображений.
Сравнительный анализ информационных характеристик изображений и признаков изображений, используемых в задачах распознавания изображений.
Разработка метода выбора преобразования изображения в зависимости от информационных характеристик анализируемого изображения.
Разработка библиотеки программ вычисления признаков изображений и построения признаковых описаний изображений.
Решение прикладных задач с использованием полученных теоретических результатов.

Научная новизна

Задачи и результаты работы предназначены для использования при разработке автоматизированных систем анализа и распознавания изображений широкого назначения, не связанных с узкой предметной областью, а также для решения особо важных прикладных задач и классов и отдельных задач, возникающих в тех случаях, когда автоматизация принятия интеллектуальных решений основана на методах распознавания образов, а исходная информация представляется в виде изображений, полученных в широких диапазонах условий наблюдения и средств регистрации. Создание нового поколения таких систем существенно связано с возможностью автоматизации выбора метода преобразования изображения в зависимости от его информационной природы и семантики. Одним из основных направлений разработки таких систем является автоматизация выполнения их отдельных

функций, в частности выбора методов описания и преобразования изображений с учетом их информационной природы.

Методы исследования

В диссертационной работе используются математические методы распознавания образов, методы обработки, анализа и распознавания изображений, методы дескриптивной теории анализа изображений, методы статистического анализа.

Практическая ценность

Научная и практическая ценность работы определяются прямой возможностью использования разработанных и программно реализованных алгоритмов вычисления признаков изображений для решения широкого круга задач, сводящихся к задачам распознавания изображений, в различных прикладных областях (автоматизация научных исследований, прогнозирование и диагностика в медицине и химии, техническая диагностика, неразрушающий контроль, дистанционное зондирование, экологический мониторинг и др.)

Разработанная библиотека алгоритмов вычисления признаков изображений зарегистрирована в ФГУП «Всероссийский научно-технический информационный центр».

Апробация полученных результатов

В основу диссертационной работы положены результаты, полученные автором в ходе исследований, проводимых в рамках НИР по проектам:

1. Российский фонд фундаментальных исследований:

проект 01-07-90016 "Система для автоматизации исследования, сравнения и тестирования алгоритмов анализа и оценивания информации, представленной в виде изображений",

проект 02-01-00182 "Исследование информационной природы изображений на основе понятий эквивалентности и инвариантности в задачах распознавания",

гранты поддержки молодых ученых, аспирантов и студентов № 01-07-06014, 02-07-06031, 03-07-06058,

проект 03-07-90406 "Информационная технология и поддерживающий программно-алгоритмический комплекс для интерактивного морфологического анализа и классификации клеток крови",

проект 05-01-00784 "Приведение изображений к виду, удобному для распознавания. Методы и модели",

Проект № 2.14 "Разработка и реализация методов анализа и оценивания слабо структурированной информации в интеллектуальных системах распознавания" Президиума Российской академии наук,
Соглашение между РАН и Национальным советом исследований Италии:

совместный проект "Анализ и синтез изображений в задачах нейроинформатики. Теоретические основы и разработка прототипа инструментально-программного комплекса",

совместный проект "Анализ и синтез изображений. Теоретические основы и разработка прототипа алгоритмическо-программного комплекса для анализа медицинских изображений",

Проект № 37.011.11.0016 "Открытая исследовательская система широкого назначения для автоматизации разработки и применения информационных технологий обработки, анализа и оценивания изображений" ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 годы Министерства образования и науки Российской Федерации,
Международная Ассоциация содействия сотрудничеству с учеными из новых независимых государств бывшего Советского Союза (ИНТАС):

проект поддержки молодых ученых, INTAS YSF 03-55-1798,

проект 04-77-7067 «Извлечение знаний из медицинских изображений: теоретические основы и технологические аспекты».

Разработанное алгоритмическое и программное обеспечение внедрено и используется (использовалось) для выполнения плановых НИР в следующих организациях:

Научный совет по комплексной проблеме «Кибернетика» РАН,

Вычислительный центр им. А.А. Дородницына РАН,

Гематологический научный центр РАМН,

Институт систем обработки изображений РАН,

Московский государственный университет им. М.В.Ломоносова, факультет Вычислительной математики и кибернетики,

Научно-исследовательский институт прикладной математики и кибернетики Нижегородского государственного университета им. Н.И.Лобачевского.

Результаты диссертационной работы докладывались и обсуждались на:

6-ой Всероссийской с участием стран СНГ конференции «Методы и средства обработки сложной графической информации» (Нижний Новгород, сентябрь 2001),

5-ой Международной конференции «Распознавание-2001» (Курск, 2001),

Международной конференции Международной ассоциации «Наука и технологии для развития» совместно с Сибирским отделением РАН «Автоматизация, контроль и информационные технологии», (Новосибирск, июнь 2002),

6-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Великий Новгород, октябрь 2002),

6-м Открытом российско-немецком семинаре «Распознавание образов и понимание изображений» (OGRW-6-2003) (Катунь, август 2003),

13-ой Скандинавской конференции по анализу изображений (Ґетеборг, Швеция, июнь-июль 2003),

7-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, октябрь 2004),

Международной научной конференции «Современные информационные и телемедицинские технологии для здравоохранения» (Минск, Беларусь, ноябрь 2005).

Основные положения работы освещены в 10 опубликованных печатных работах.

Структура и объем работы

Классификация моделей изображений

Весьма существенные результаты, касающиеся классификации моделей изображений, порождаемой методами когнитивной психологии, получены в [118]. Предполагается, что узнавание человеком знакомых объектов основано на сравнении распознаваемых объектов со знакомыми, хранимыми в памяти, с учетом того опыта, который человек накопил в течение жизни. Поскольку распознаваемый объект не всегда хранится в памяти в точности в таком виде, в каком он наблюдается субъектом, возникает неоднозначность сравнения объекта и его изображения. В большинстве психологических теорий распознавания образов эта проблема решается следующим образом.

В долговременной памяти хранится множество представлений объектов и связанная с ними информация об образах. Информация хранится в виде некоторого канонического представления объекта (модели), отражающего инвариантные свойства объекта, характерные для данного объекта во всех его представлениях. В процессе распознавания исходное изображение (полученное на сетчатке глаза) преобразуется к тому же формату, в котором хранится информация в долгосрочной памяти, и в памяти выбирается модель, наиболее близкая к исходному изображению.

Когнитивная психология при анализе зрительных процессов мозга оперирует четырьмя основными классами моделей: модели, основанные на сопоставлении эталонов, модели, основанные на наборе признаков, модели, основанные на преобразовании Фурье, и структурные модели. Далее они будут охарактеризованы более подробно.

В данном классе модель изображения представляет собой точную копию изображения, получающегося на сетчатке глаза в результате воздействия объекта. Полученные модели хранятся в долгосрочной памяти и при поступлении нового изображения, имеющиеся модели одновременно сравниваются с поступающим образцом. На основе меры сходства изображений делается вывод о том, какая именно модель была на входе. В качестве меры сходства, как правило, используется отношение совпадающих точек к несовпадающим (по заданному порогу), но возможны и другие, более сложные метрики.

Данная модель представляет собой описание геометрических особенностей изображения с помощью вектора признаков, характеризующего особенности входного изображения. Такими признаками могут быть вертикальные или горизонтальные линии, кривые, соединения вида «Т», «Y» и др. Разработаны специальные методы выделения каждого отдельного признака во входном изображении вне зависимости от его расположения. После применения всех методов получается вектор признаков, значениями которого являются величины, характеризующие частоту встречаемости каждого признака на исходном изображении. В памяти хранятся список всех возможных признаков, поиск которых ведется на изображении, и вектор признаков, соответствующий исходному изображению. Каждому признаку можно поставить в соответствие некоторый вес с тем, чтобы признаки, инвариантные относительно функций преобразования изображения, оказывали существенное влияние на сопоставление моделей изображений.

В процессе сопоставления получившийся вектор признаков сравнивается с теми, что хранятся в памяти, с учетом весов, приписанных каждому признаку. Мера близости может быть определена различными способами, например, количество совпадающих признаков, квадратичная разность между элементами векторов и др. Модель, наиболее близкая к исходной модели в смысле заданной меры близости, ставится ей в соответствие.

Многие ученые, занимающиеся исследованием зрительного восприятия человека, полагают данный класс моделей наиболее близким к тому, что происходит в мозге человека. Здесь образ каждого объекта представляется его Фур ье-преобразованием. Важными достоинствами такого представления является то, что в Фурье-модели информация о четких границах и мелких деталях отделена от информации об объекте в целом (первая заключена в коэффициентах, соответствующих высоким пространственно-частотным компонентам, а вторая - в коэффициентах, соответствующих низким пространственно-частотным компонентам). Также Фурье-модель изображения инвариантна относительно некоторых преобразований изображения.

Классификации признаков изображений по информации об изображении

Признак изображения существенным образом зависит от исходного изображения, которое используется для анализа и вычисления. Такую зависимость можно характеризовать с разных сторон, в частности, автором выделены такие классификации признаков: по типу изображения, иа котором вычисляется признак; по модели исходного изображения; по информации об области изображения, па которой вычисляется признак; по природе объекта, служащего основой для вычисления признака, В соответствии с изложенными принципами выделим следующие классы признаков изображений,

1) Классификация признаков по типу изображения, на котором вычисляется признак: бинарные, тоновые и яркостные признаки.

2) Классификация признаков по модели изображения: статистические признаки, признаки формы и спектральные признаки.

3) Классификация признаков по информации об области изображения, на которой вычисляется признак: локальные и глобальные признаки.

4) Для вычисления признаков может использоваться не все изображение, а некоторая его часть, либо объект, выделенный на изображении. Все множество таких признаков можно условно разделить па классы, зависящие от природы объекта, служащего основой для вычисления признака: контурные, сегментационпые, остовныс и точечные признаки.

Признаки изображения характеризуют исходное изображение, поэтому, очевидно, признаки естественным образом зависят от исходных изображений. В соответствии с количеством бит, отводимых для хранения информации о каждом пикселе, изображения можно условно разделить на бинарные, тоновые и цветные. Для храпения информации в бинарных изображениях используется 1 бит/пиксел, принимающий два значения, так бинарные изображения обыкновенно соответствуют черно-белым, либо представлены любыми другими двумя цветами. Для хранения топовых изображений отводится 8 бит/пиксел, а цветных - 24 и более бит. Таким образом, выделяются следующие группы признаков: бинарные признаки, тоновые признаки и яркостные признаки,

Бинарные признаки часто используются при анализе изображений. Любой признак, вычисляемый с помощью некоторой функции на бинарном изображении, называется бинарным признаком. Многие признаки, вычисляемые в несколько этапов (признаки высокого уровня) являются бинарными, в частности, арифметические признаки вычисляются в два этапа: 1) бинаризация тонового изображения с помощью выделения контуров объектов; 2) применение арифметических операций к полученному бинарному изображению. Бинарные признаки используются для распознавания букв [154], иероглифов [106], лиц [89], [145], отпечатков пальцев [174], людей [75], движения [120] и др. Основным преимуществом бинарных признаков является то, что для их вычисления не требуется больших вычислительных затрат, это связано с особенностями представления бинарных признаков.

В [154] описаны бинарные признаки, используемые для распознавания букв латинского алфавита: гистограммы проекций, признаки, полученные с помощью операции разделения на зоны, и геометрические инварианты-моменты. В [106] представлен метод распознавания рукописных иероглифов, основанный на бинарных признаках. В [75] бинарные признаки используются для распознавания людей по походке, признаки вычисляются по бинарному изображению силуэта идущего человека, полученному из исходного изображения. В [120] описаны бинарные признаки, характеризующие движение на последовательных изображениях, на их основе с помощью логических и других математических функций построены более сложные бинарные признаки. В [145] распознавание контуров головы и лица производится на бинарных изображениях, полученных из исходного тонового изображения с помощью бинаризации с некоторым порогом. Этот метод имеет большое количество ограничений, и в сложных случаях применяются более сложные методы - проекции на оси х и у топографического рельефа уровней яркости или геометрическая модель лица. В [89] распознавание лиц производится с помощью геометрической модели лица, построенной на основе бинарного изображения.

Тоновыми признаками называются признаки, вычисляемые с помощью некоторой функции на тоновом изображении, т.е. на таком изображении, каждый пиксел которого имеет значение большее, чем просто 0 или I [66]. Обычно значение пикселов тоновых изображений варьируются от 0 до 63, или от 0 до 255, или от 0 до 1023, что соответствует 6-ти, 8-ми и 10-ти бит/пиксел. Тоновые признаки часто используются при анализе текстур [15, 65], распознавании букв [154, 170], лиц [104, 145, 171, 172], медицинских изображений [51, 68], отпечатков пальцев [105,109,122], структурных элементов изображения (углов в [137]).

В [154] описаны тоновые признаки, используемые для распознавания букв латинского алфавита: профили контуров, дескрипторы Фурье, а также признаки, полученные с помощью операции разделения на зоны и с помощью аппроксимации сплайнами. В [104] предложен подход к распознаванию лиц, предусматривающий использование проекции на оси х а у топографического рельефа уровней яркости объекта тонового изображения. Данные проекции используются для последующего вычисления относительной позиции внутри объекта, значений максимума между двумя минимумами, расстояния между минимумами, схожести значений уровней яркости и коэффициента расстояния между минимумами по отношению к ширине объекта. В [145, 171] также используются проекции па оси х и у топографического рельефа уровней яркости объекта тонового изображения, но вычисляемые по ним признаки более просты - локальные минимумы и максимумы, их взаимное расположение. В [172] для анализа тоновых изображений лица используется геометрическая модель лица.

Понятие эквивалентности в задачах распознавания изображений и способы задания эквивалентности

Решение задачи распознавания изображений предполагает наличие некоторого представления изображения, наличие эффективного алгоритма распознавания и соответствие используемого представления изображения требованиям алгоритма распознавания к исходным данным. Подавляющее большинство алгоритмов распознавания изображений, обладающих вычислительной эффективностью, предназначены для работы лишь с признаковыми описаниями или моделями изображений. Для того, чтобы максимально использовать при анализе изображений содержащуюся в них информацию, необходимо преодолеть принципиальное противоречие между природой изображения и методами извлечения информации из изображений, основанными на использовании символьных моделей изображений. В то же время подавляющее большинство методов работы с изображениями являются чисто эвристическими и достоинства их, в сущности, определяются тем, сколь успешно с их помощью удается отображать «изобразительный» характер изображений ((неизобразитсльными» средствами. В результате анализ и распознавание изображений опираются на преобразования, не зависящие от представления обрабатываемой информации в виде изображений.

Предлагаемая методика выбора преобразований изображений при решении задач распознавания основывается на дескриптивном подходе к анализу изображений [1,48,49, 50, 58]. Используется гипотеза, состоящая в том, что:

а) всякое изображение обладает определенной регулярностью или смесью регулярностей различных типов;

б) каждому классу эквивалентности изображений соответствует некоторый класс преобразований, применение которых к изображению/модели изображения не выводит результат преобразования за пределы соответствующего класса эквивалентности.

Характеризация эквивалентности изображений основывается на том, что изображения, порождаемые из некоторого изображения-прототипа (набора изображений-прототипов) с помощью допустимого набора базисных преобразований, эквивалентны относительно указанного базиса операций.

Понятие эквивалентности является существенным во многих разделах математики. В распознавании образов оно является принципиальным - без задания классов эквивалентности на множестве распознаваемых объектов задача распознавания образов не имеет смысла. Определение понятия «эквивалентность изображений» является одной из ключевых проблем математической теории анализа и распознавания изображений. В отличие от классической теории распознавания при анализе изображений наибольший интерес представляет эквивалентность объектов преобразований, а не эквивалентность собственно преобразований, хотя между этими видами эквивалентностей, вообще говоря, может быть установлено соответствие.

Основная цель введения и использования математических характеристик эквивалентности изображений - определение и формирование классов обучающей выборки при решении задачи распознавания. Существует несколько способов задания отношения эквивалентности па множестве изображений.

1. Идеальным способом введения отношения эквивалентности на изображении является использование некоторого «внутреннего (неотъемлемого) свойства изображений» (или набора и/или комбинации таких свойств). Этот способ должен основываться на специфической семантике соответствующих изображений, и естественным образом связан с информационной природой изображений. В задачах распознавания изображений сама постановка задачи подразумевает наличие такого «внутреннего свойства изображений», поскольку в задаче исходные изображения разбиваются на несколько классов. Такое задание эквивалентности не является отношением эквивалентности в математическом смысле (т.е. условия рефлексивности, симметричности и транзитивности могут быть не выполнены), тем не менее, подобная эквивалентность может быть использована при решении прикладных задач.

2. С математической точки зрения эквивалентность изображений может устанавливаться тремя способами: а) как совпадение векторов признаков, описывающих изображения в пространстве формальных описаний или в пространстве признаков, представляющих изображение; б) как близость изображений по некоторой метрике, заданной в пространстве формальных описаний или в пространстве признаков, представляющих изображение; в) как идентичность изображений относительно некоторой системы преобразований.

Сценарий работы с библиотекой вычисления признаков

Таким образом, использование предложенного метода позволяет увеличить точность распознавания более чем на 10%), с 83,18% до 93,37%, что особенно существенно для медицинских задач, где схема лечения пациента напрямую зависит от поставленного диагноза. Следует также отметить, что точность распознавания при применении предложенного метода и сокращенного набора признаков оказывается выше, чем точность при использовании признакового описания из 47 признаков, что также подтверждает эффективность предложенного метода.

Задачи и результаты работы предназначены для использования при разработке автоматизированных систем анализа и распознавания изображений широкого назначения, не связанных с узкой предметной областью, а также для решения особо важных прикладных задач и классов и отдельных задач, возникающих в тех случаях, когда автоматизация принятия интеллектуальных решений основана на методах распознавания образов, а исходная информация представляется в виде изображений, полученных в широких диапазонах условий наблюдения и средств регистрации. Создание нового поколения таких систем существенно связано с возможностью автоматизировать выбор метода преобразования изображения в зависимости от его информационной природы и семантики. Одним из основных направлений разработки таких систем является автоматизация выполнения их отдельных функций, в частности выбора методов описания и преобразования изображений с учетом их информационной природы.

В основу диссертационной работы положены результаты, полученные автором в ходе исследований, проводимых в рамках НИР по проектам Комплексной программы научных исследований РАН "Математическое моделирование и интеллектуальные системы", Программы фундаментальных исследований Отделения математических наук РАН "Алгебраические и комбинаторные методы математической кибернетики", Российского фонда фундаментальных исследований, совместного проекта в рамках соглашения между РАН и Национальным советом исследований Италии, проектов Международной Ассоциации содействия сотрудничеству с учеными из новых независимых государств бывшего Советского Союза.

На защиту вынесены следующие основные положения и результаты. 1. Метод выбора преобразования изображений, позволяющий учитывать информационную природу изображений, и его программная реализация. 2. Критерии классификации признаков, используемых для описания изображений. 3. Классификация признаков изображений как формального средства описания изображений. 4. Метод построения многоаспектных описаний изображений на основе классификаций признаков изображений. 5. Пример применения разработанного метода выбора преобразования изображений в задаче автоматизации медицинской диагностики. 6. Библиотека вычисления признаков изображений для инструментально-программного комплекса автоматизации научных исследований и обучения в области обработки, анализа, распознавания и понимания изображений «Черный квадрат».

Научная и практическая ценность работы определяется прямой возможностью использования разработанных и программно реализованных алгоритмов вычисления признаков изображений для решения широкого круга задач, сводящихся к задачам распознавания изображений, в различных прикладных областях (автоматизация научных исследований, прогнозирование и диагностика в медицине и химии, техническая диагностика, неразрушающий контроль, дистанционное зондирование, экологический мониторинг и др.)

Материалы, изложенные в диссертации, были доложены на:

6-ой Всероссийской с участием стран СНГ конференции «Методы и средства обработки сложной графической информации» (Нижний Новгород, сентябрь 2001);

5-ой Международной конференции «Распознавапие-2001» (Курск, 2001);

6-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Великий Новгород, октябрь 2002);

6-м Открытом российско-немецком семинаре «Распознавание образов и понимание изображений» (OGRW-6-2003) (Катунь, август 2003);

13-ой Скандинавской конференции по анализу изображений (Ґетеборг, Швеция, июнь-июль 2003);

7-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, октябрь 2004);

Международной научной конференции «Современные информационные и телемедицинские технологии для здравоохранения» (Минск, Беларусь, ноябрь 2005), пленарный доклад. По результатам диссертации в реферируемых изданиях опубликовано 10 работ, в том

Эффективные способы и средства описания изображений в задачах распознавания Корябкина Ирина Валентиновна

Классификация моделей изображений

Классификации признаков изображений по информации об изображении

Понятие эквивалентности в задачах распознавания изображений и способы задания эквивалентности

Сценарий работы с библиотекой вычисления признаков

Похожие диссертации на Эффективные способы и средства описания изображений в задачах распознавания