Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений Томакова, Римма Александровна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Томакова, Римма Александровна. Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений : диссертация ... доктора технических наук : 05.13.17 / Томакова Римма Александровна; [Место защиты: Белгородский государственный университет].- Курск, 2013.- 341 с.: ил. РГБ ОД, 71 14-5/107

Содержание к диссертации

Введение

ГЛАВА 1. Методы и средства классификации сложных объектов на основе анализа сложноструктурируемых изображений 18

1.1. Сложные объекты и методы их описания 18

1.2. Математические модели изображений 25

1.3. Анализ методов и алгоритмов сегментации сложноструктурируемых изображений

1.3.1. Сегментация на основе пороговой обработки 33

1.3.2. Методы сегментации, основанные на кластеризации 36

1.3.3. Методы сегментации, основанные на градиентных операторах 37

1.3.4. Сегментация с помощью модели 1.4. Математическая морфология и обработка изображений 46

1.5. Процедуры и методы классификации изображений 49

1.6. Цели и задачи исследований 52

ГЛАВА 2. Интеллектуальные операторы для сегментации сложноструктурируемых изображений ... 55

2.1. Обобщенный алгоритм сегментации сложноструктурируемых изображений 55

2.2. Синтез морфологического оператора для препарирования изображения G1 61

2.3. Нечеткая модель формирования бинарного изображения границы сегмента 72

2.4. Выводы второй главы 85

ГЛАВА 3. Методология спектрального описания кривых сложной формы

3.1. Метод морфологической обработки бинарных изображений.. 87

3.2. Исследования методов спектрального представления контуров минимальной толщины 96

3.3. Выбор и оптимизация числа используемых дескрипторов Фурье при анализе границ сегментов сложноструктурируемых изображений 104

3.4. Выводы третьей главы 113

ГЛАВА 4. Разработка и исследования сетевых технологий, предназначенных для классификации сегментов на сложноструктурируемых изображениях

4.1. Разработка универсальной сетевой структуры для задач двухальтернативной классификации 115

4.2. Нейросетевые структуры для сегментации изображений по параметрам пикселей и их окрестностей

4.2.1. Структура первого решающего модуля 127

4.2.2. Структура второго решающего модуля..

4.3. Алгоритмическое и программное обеспечение моделирования решающих модулей 139

4.4. Выводы четвертой главы 148

ГЛАВА 5. Разработка алгоритмов идентификации сегментов на изображениях мазков периферической крови 150

5.1. Алгоритм измерения межклеточных соотношений в периферической крови 150

5.2. Модуль анализа цветного изображения сегмента 158

5.3. Модуль анализа сегментов черно-белого изображения 176

5.4. Структура базы данных для настройки модуля принятия решений 180

5.5. Программное обеспечение интеллектуальной системы классификации форменных элементов крови

5.5.1. Общая структура программного обеспечения 183

5.5.2. Программный модуль сегментации микроскопических изображений мазков крови 187

5.5.3. Программный модуль для классификации форменных элементов крови 192

5.5.4. Схема формирования файлов обучающих выборок 199

5.5.5. Алгоритм формирования интегрированных моделей решающих модулей для классификации форменных элементов крови... 2 5.6. Экспериментальные исследования разработанной системы анализа микроскопических изображений форменных элементов крови... 212

5.7. Выводы пятой главы 219

ГЛАВА 6. Интеллектуальные системы анализа сложных объектов и сложноструктурируемых изображений в офтальмологических исследованиях .. 223

6.1. Структура автоматизированной системы поддержки принятия решений врача-офтальмолога 223

6.2. Экспериментальные исследования эффективности классификации извилистости сосудов сетчатки 226

6.3. Нейронные сети с макрослоями для классификации и прогнозирования сосудистой патологии глазного дна 230

6.4. Формирование нелинейных отображений на входах НСМ для диагностики и прогнозирования тромбоза центральной вены сетчатки и ее ветвей 233

6.5. Оценка эффективности правил прогнозирования и диагностики степени тяжести тромбозов центральной вены сетчатки и ее ветвей 240

6.6. Разработка нейросетевых моделей принятия решений по результатам анализа фотографий флюоресцентных ангиограмм глазного дна 242

6.7. Экспериментальные исследования качества сегментации изображения глазного дна при различных видах патологий 258

6.8. Экспериментальные исследования автоматизированной системы анализа изображений сетчатки глаза диагностики диабетической ретинопатии 261

6.9. Выводы шестой главы 266

Заключение 269

Список принятых обозначений и сокращений 272

Список использованных источников

Анализ методов и алгоритмов сегментации сложноструктурируемых изображений
Синтез морфологического оператора для препарирования изображения G1
Выбор и оптимизация числа используемых дескрипторов Фурье при анализе границ сегментов сложноструктурируемых изображений
Структура первого решающего модуля

Введение к работе

Актуальность исследования. Многие направления науки, техники и производства в значительной степени ориентируются на развитие систем, в которых информация представлена в виде изображений. При обработке такой информации возникает ряд сложных научных, технических и технологических проблем. На сегодняшний момент наиболее сложными являются анализ и распознавание изображений. О важности этой проблемы говорит тот факт, что исследования по распознаванию образов, анализу изображений и речи включены в перечень приоритетных направлений развития науки и техники и критических технологий федерального уровня.

В настоящее время интенсивно развиваются интеллектуальные системы, предназначенные для описания формы анализируемых изображений или выделения из них метрической или семантической информации. Анализ семантики является вершиной иерархической процедуры обработки изображений, сложность которой связана с тем, что изначально эта процедура решает нечеткую задачу.

Решению проблемы анализа и распознавания изображений посвящены работы отечественных и зарубежных ученых, среди которых следует выделить труды Д. Балларда, Е. Дэвиса, Р. Гонсалеса, Ю.И. Журавлева, В.А. Сой-фера, Ж. Серра, Д. Марра, А. Демпстера, Г. Шафера, М. Павель, Ю.П. Пытье-ва, Я.А. Фурмана, Л.П. Ярославского. За последние десятилетия создано множество успешных систем машинного зрения, в которых в тех или иных сочетаниях используются разработанные ими парадигмы и подходы.

Тем не менее, существует ряд проблем, связанных с классификацией изображений, которые не решены в настоящее время. Для успешной классификации изображений необходима априорная информация о структуре и свойствах мира. Однако многие факторы (деформация формы, перекрытие, переход от 3D-сцен к 2D-изображениям и т.п.) снижают ценность априорных данных и затрудняют семантическую сегментацию изображения, при которой каждый сегмент рассматривается как объект определенного класса. В итоге изображение имеет альтернативные структуры, решение по выбору одной из которых не может быть принято однозначно, основываясь на принятой картине мира. Определим этот класс изображений как сложноструктури-руемые. Следовательно, если изображение является сложноструктурируе-мым, то это ведет к значительному снижению качества его классификации или классификации его сегментов посредством обучаемых классификаторов.

Сложноструктурируемому изображению характерно искажение границ сегментов и появление ложных сегментов, а также наличие древовидных структур. Поэтому использование известных локальных градиентных операторов выделения границ и оконтуривающих морфологических операторов не дает ожидаемого эффекта в связи с тем, что они привязываются к априорно заданной картине мира и не анализируют локальные результаты принятого решения и многоальтернативные решения.

В настоящее время научно-техническое направление классификации сложноструктурируемых изображений активно развивается. В последнее десятилетие предложены методы определения дескрипторов изображений и их сегментов, позволяющие построить признаковые пространства, устойчивые к ряду аффинных преобразований, шуму, изменению в освещении: SIFT (Scale Invariant Feature Transform), SURF (Speeded Up Robust Features), PCA-SIFT (PCA – Principal Component Analysis) и т.д. Но эти дескрипторы предназначены для работы в интеллектуальных системах поиска аналогичных и подобных изображений, а не в системах классификации. В настоящее время для классификации успешно применяются алгоритмы, такие как Bagging и Boosting, основанные на использовании множества базовых классификаторов с последующей агрегацией их решений, направленной на снижение ошибок первого и второго рода. Использование этих алгоритмов предполагает наличие больших объемов выборок, позволяющих осуществить настройку множества классификаторов. Однако существует достаточно большой класс сложноструктурируемых изображений, для которых обеспечить необходимый объем обучающей выборки принципиально невозможно. Это, в частности, относится к медицинским изображениям, где эти ограничения обусловлены наличием сочетанной патологии и сложностью экспериментов на живых объектах. В этом случае для классификации целесообразно использовать методы и алгоритмы, основанные на различных парадигмах, что позволяет построить гибридные модели классификации, которые применяют как методы обучаемых систем распознавания образов, так и методы экспертного оценивания. Гибридные модели целесообразно использовать и в случае иерархической семантической классификации, когда для окончательной классификации необходимо учитывать не только класс сегмента, но и его геометрические характеристики и масштаб.

В качестве обучаемых систем классификации изображений в настоящее время наиболее часто используются искусственные нейронные сети. Однако известные структурно-функциональные решения для искусственных нейронных сетей не могут быть эффективно применены при анализе и классификации сложноструктурируемых изображений ввиду ограниченности объемов обучающих выборок и высокой степени пересечения классов в признаковом пространстве. Ограниченность объема обучающей выборки компенсируется посредством использования методов экспертного оценивания, основанных на нечетком логическом выводе. Но в случае классификации сложноструктурируемых изображений использование этих методов не приводит к приемлемому результату из-за того, что методология нечеткого вывода слабо адаптирована под задачи классификации. Поэтому отсутствие методов и алгоритмов разработки гибридных классификаторов сложнострук-турируемых изображений является серьезной проблемой, затрудняющей и замедляющей разработку новых приложений и практических систем в области компьютерного зрения. В связи с этим возникает проблемная ситуация, связанная с противоречием между возможностями современной компьютерной и оптико-электронной техники и недостаточностью теоретической базы

при ее использовании в системах классификации, основанных на анализе сложноструктурируемых изображений.

Указанное противоречие определяет постановку и решение актуальной проблемы повышения качества анализа и классификации сложнострук-турируемых изображений на основе гибридных методов классификации при ограничениях на объемы обучающих выборок и высоком уровне пересечения классов в пространстве информативных признаков.

Объект исследования. Интеллектуальные системы анализа данных и поддержки принятия решений.

Предмет исследования. Методы, модели и алгоритмы для интеллектуальных систем сегментации и классификации сложноструктурируемых изображений.

Целью диссертационной работы является развитие методологии классификации сложноструктурируемых изображений на основе гибридных сетевых структур как средств унифицированного подхода к семантическому анализу яркостно-геометрических моделей изображений.

В соответствии с поставленной целью в работе решаются следующие основные задачи:

анализ современного состояния методов и средств сегментации и классификации сложноструктурируемых изображений, исследование их критических свойств, поиск новых модификаций и обобщений этих методов, повышающих эффективность принятия решений;

разработка математических и алгоритмических средств формирования интеллектуальных морфологических операторов, предназначенных для сегментации сложноструктурируемых изображений;

разработка метода формального описания геометрические свойства сегментов сложноструктурируемых изображений, позволяющего получать адекватные пространства информативных признаков, предназначенных для сетевых моделей их классификации;

разработка математического и алгоритмического обеспечения для гибридных нейросетевых структур, позволяющих осуществлять анализ и классификацию сложноструктурируемых изображений на основе их яр-костно-геометрического описания;

создание специальных методов, алгоритмов и программного обеспечения анализа изображений для интеллектуальных систем прогнозирования и диагностики функционального состояния сложных объектов;

проведение экспериментальных исследований интеллектуальных систем анализа и классификации сложноструктурируемых изображений для оценки релевантности полученных информативных признаков, а также обоснование эффективности разработанных информационных технологий при использовании их в интеллектуальных системах поддержки принятия решений по классификации и идентификации функциональных состояний сложных объектов.

Методы и средства исследований. Для решения поставленных задач использовались математический аппарат линейной алгебры, теория

вероятностей, аппарат морфологического анализа изображений, теория нейронных сетей и распознавания образов, методология спектрального анализа, теория множеств, методы экспертного оценивания и принятия решений. При разработке нейросетевых моделей и модулей нечеткого вывода в качестве инструментария использовался MATLAB 7.10 с графическим интерфейсом пользователя для Neural Network Toolbox и со встроенным пакетом Fuzzy Logic Toolbox.

Степень достоверности результатов проведенных исследований

обеспечивается корректным использованием математического аппарата, соответствием результатов вычислительных экспериментов выдвигаемым в диссертации положениям и выводам качественного характера, а также результатами практического использования методов, предложенных в диссертационной работе. Работоспособность разработанных методов и алгоритмов подтверждена статистикой обработки большого объема реальных изображений, отсутствием противоречий с известными положениями теории и практики анализа и классификации изображений.

Научную новизну составляют следующие результаты.

Метод сегментации сложноструктурируемых изображений, построенный на основе гибридной обработки исходного полутонового изображения, отличающийся тем, что процесс получения бинарного изображения, отражающего морфологическую структуру исходного изображения, разбит на три последовательных этапа: на первом этапе получают градиентное изображение, на втором этапе препарированное градиентное изображение, а на третьем этапе осуществляют переход к бинарному изображению, отражающему контуры границ сегментов исходного изображения, осуществляемый посредством нечеткой нейросетевой модели.
Интеллектуальный оператор, предназначенный для формирования границы сегмента, реализованный в виде многослойной нечеткой сети, включающей базу решающих правил и агрегирующие и классифицирующие слои, позволяющий реализовать итерационный процесс активации пикселей границы сегмента.
Метод построения математической модели сегмента произвольной формы, основанный на морфологической обработке бинарных или полутоновых растровых изображений, отличающийся тем, что путем использования цепочки, состоящей из четырех морфологических операторов, множество пикселей изображения, описывающих границу сегмента, дополняется до двух непересекающихся подмножеств, границы которых устанавливаются по нижней и верхней границам координат пикселей, входящих в исходное изображение, позволяющий представить изображение произвольной кривой, в том числе и незамкнутой, в виде контура, имеющего формализованную структуру.
Метод формирования пространства информативных признаков для нейронной сети, классифицирующей кривую произвольной формы, основанный на определении дескрипторов Фурье соответствующего контура, отличающийся тем, что после получения отсчетов спектра Фурье

контура число спектральных отсчетов дополняется нулевыми отсчетами, амплитуда спектральных составляющих увеличивается на величину, прямо пропорциональную величине расширения спектра, обусловленной добавлением нулевых отсчетов, а затем число дескрипторов Фурье отсекается до оптимального значения, определяемого путем минимизации функционала ошибки, позволяющий получить адекватную классификационную модель независимо от числа отсчетов в анализируемых контурах.

5. Математическое и алгоритмическое обеспечение для проек
тирования многомодульных сетевых структур, предназначенных для класси
фикации объектов по их полихроматическим изображениям, включающее:

математическую модель для построения универсальных сетевых структур, предназначенных для классификации двухальтернативных выборок при решении задач сегментации сложноструктурируемых изображений;

сетевую структуру классификации двухальтернативных данных, включающую два решающих модуля и отличающуюся тем, что первый решающий модуль имеет сетевую структуру, соответствующую модели Арнольда-Колмогорова, в котором узлы первого скрытого слоя выполняют нелинейные отображения, узлы второго скрытого слоя - нейроны adaline, а второй решающий модуль предназначен для управления формой нелинейных отображений в первом скрытом слое первого решающего модуля в зависимости от окружения анализируемого пикселя изображения, позволяющую формировать границу сегмента произвольной формы;

модель гибридной нейронной сети, отличающуюся параллельным включением нейронных сетей прямого распространения, настроенных на классификацию сегментов по пространственно-яркостным характеристикам пикселей изображения, и последовательно включенной радиально-базисной нейронной сетью, позволяющую классифицировать морфологические образования на растровых сложноструктурируемых изображениях;

модели нейронных сетей с макрослоями, которые используют для диагностических заключений по группам информативных признаков, получаемых по различным методикам и технологиям.

6. Комплекс алгоритмов для формирования и функционирова
ния многомодульных сетевых структур, предназначенных для анализа слож-
ноструктурируемых изображений, включающий:

алгоритм функционирования нейронной сети с макрослоями, классифицирующей сегменты цветного изображения, построенный по двухступенчатой схеме, отличающийся тем, что на первой ступени обрабатывают изображение, полученное в результате сегментации исходного полутонового изображения после обработки морфологическим оператором «эрозия», а на второй ступени изображение, полученное после обработки исходного черно-белого изображения посредством морфологического оператора «дилата-ция», при этом на каждой ступени решение принимается на основе агрегации двух оценок, полученных в результате анализа цвето-яркостных характеристик сегмента и характеристик формы сегмента; при этом на первой ступени завышают число ошибок первого рода, а на второй ступени – число ошибок

второго рода, а окончательное решение принимается на основе сопоставления решений, принятых на первой и на второй ступенях обработки;

алгоритмы формирования моделей сетевых структур для классификации пикселей на сложноструктурируемом изображении, отличающиеся использованием итерационных процедур настройки решающих модулей и итерационным процессом управления структурой скрытых слоев решающих модулей, входящих в настраиваемую модель, которые позволяют получать модели сетевых структур, удовлетворяющие априорно заданным параметрам качества классификации;

структуру базы данных обучающих выборок для нейронных сетей с макрослоями, отличающуюся тем, что записи в обучающих выборках распределены по двум уровням, причем для каждой L-й выборки i-ые строки (записи) в первом и втором уровнях относятся к одному и тому же сегменту изображения, а атрибуты для i-го сегмента L-й выборки на втором уровне получены из атрибутов L-й выборки i-го сегмента на первом уровне посредством их анализа модулями обработки цветного и черно-белого изображений;

алгоритм автоматизированного получения интегрированных моделей решающих модулей для классификации сегментов сложноструктурируемых изображений, отличающийся адаптацией классифицирующей модели к анализируемому изображению, осуществляемый, по меньшей мере по двум контурам управления;

программное обеспечение для формирования сетевых моделей, предназначенных для классификации пикселей сегментов сложноструктурируе-мых изображений, включающее интерактивные среды настройки функциональных блоков сетевых структур и реализованное в среде Matlab 7.10.

Практическая ценность диссертационной работы состоит в применении разработанных в ней методов и процедур анализа и классификации сложноструктурируемых изображений в ряде практических задач, в том числе в геоинформационных системах, в системах гематологического анализа, в автоматизированных системах гистологических исследований, в автоматизированных системах для офтальмологических исследований. Использование предлагаемых технических решений позволило повысить оперативность и достоверность принимаемых решений в системах диагностики и лабораторного анализа.

Реализация результатов исследования осуществлена: в НИЦ (г.Курск) ФГУП «18 ЦНИИ» МО РФ, Курском ОАО «Прибор», ОБУЗ «Офтальмологическая клиническая больница – Офтальмологический центр» (г.Курск), НУЗ «Отделенческая больница на ст. Курск ОАО «РЖД», ОБУЗ «Курская городская больница №1 им. Н.С. Короткова»; в учебном процессе факультета информатики и вычислительной техники ФГБОУ ВПО «Юго-Западный государственный университет» при подготовке специалистов по специальности «Биотехнические аппараты и системы», «Инженерное дело в медико-биологической практике».

Внедрения подтверждаются соответствующими документами.

Связь с научными и инновационными программами.

Диссертационные исследования проводились в рамках выполнения ряда проектов следующих программ фундаментальных, поисковых и инновационных исследований:

федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы», государственные контракты № П705, № П2088, № П424;

гранта Минобрнауки России на 2012-2013 годы «Гибридные технологии анализа и классификации сложноструктурируемых изображений для медицинских приложений» (Соглашение № 14. В37.21.1970).

Положения, выносимые на защиту.

Математические модели, схемы алгоритмической реализации и практическое использование теории формирования интеллектуальных морфологических операторов, позволяющие рассматривать сегментацию сложноструктурируемых изображений с позиций гомеостатического моделирования на основе гибридных нейросетевых структур, объединяющих парадигмы нейронных сетей прямого распространения и нечеткого моделирования.
Метод и схемы алгоритмической реализации для построения и спектрального анализа контуров произвольной формы, позволяющие использовать методологии спектрального и морфологического анализа сигналов и изображений для классификации сегментов полутоновых и/или цветных сложноструктурируемых изображений.
Методы и алгоритмические средства формирования гибридных нейросетевых структур, позволяющие осуществлять анализ и классификацию сложноструктурируемых изображений по их цвето-яркостным и геометрическим характеристикам с последующей агрегацией решений.
Модели нейронных сетей с макрослоями, позволяющие принимать многоальтернативные решения по результатам нейросетевого анализа групп информативных признаков, получаемых по различным методикам и технологиям.

5. Специальное математическое, алгоритмическое и программное
обеспечение для интеллектуальных систем классификации
сложноструктурируемых изображений.

6. Типовые структурно-функциональные решения по анализу
сложноструктурируемых изображений, апробация которых в системах
поддержки принятия решений по классификации сложных объектов показала
их преимущество перед известными техническими решениями.

Специальность, которой соответствует диссертация. Содержание диссертации соответствует паспорту специальности 05.13.17 – теоретические основы информатики (технические науки) по следующим областям исследования:

п.5. Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и ис-

следование методов и алгоритмов анализа текста, устной речи и изображений;

п.7. Разработка методов распознавания образов, фильтрации, распознавания и синтеза изображений, решающих правил.

Апробация результатов диссертационных исследований.

Основные положения диссертации докладывались и получили положительную оценку на 24 научно-технических конференциях: Международная конференция по аппликативным вычислительным системам «ABC`2012» (Москва) в 2012 году; Международная научная конференция «Информационные технологии и компьютерные системы для медицины» (Маврикий) в 2012 году; Международная научная конференция «Компьютерное моделирование в науке и технике» (Андорра) в 2012 году; Международная научная конференция «Физика и радиоэлектроника в медицине и экологии ФРЭМЭ» (Владимир) в 2010, 2012 годах; Международная научно-техническая конференция «Оптико-электронные приборы и устройства в системах распознавания образов и обработки изображений и символьной информации» (Курск) в 2012 году; Международная научная конференция «Современные наукоемкие технологии» (Испания-Франция) в 2012 году; Международная научная конференция «Фундаментальные и прикладные исследования в медицине» (Сочи) в 2012 году; Международная научно-практическая конференция «Перспективы развития информационных технологий» (Новосибирск) в 2011, 2012 годах; Международная научно-практическая конференция «Медико-экологические информационные технологии» (Курск) в 2009, 2010, 2011 годах; Международная научно-техническая конференция «Компьютерные науки и технологии» (Белгород) в 2011 году; Международная научно-практическая конференция «Интегратив-ные процессы в науке» (Москва) в 2010, 2011 годах; Международная научная конференция «Лазерно-информационные технологии в медицине, биологии и геоэкологии» (Новороссийск) в 2008, 2009, 2010, 2011 годах; Всероссийская научно-техническая конференция «Информационные и управленческие технологии в медицине и экологии» (Пенза) в 2009 году; Международная научно-техническая конференция «Информационно-измерительные диагностические и управляющие системы» (Курск) в 2009 году; Всероссийская научно-техническая конференция «Искусственный интеллект в XXI веке. Решения в условиях неопределенности» (Пенза) в 2008 году; Международный радиоэлектронный форум «Прикладная радиоэлектроника. Состояние и перспективы развития» (Харьков) в 2008 году.

Публикации. По результатам исследований опубликованы 59 работ, из них 21 работа в изданиях из списка ВАК РФ, 3 монографии, 2 заявки на изобретение, 2 свидетельства о регистрации программы, 23 публикации материалов докладов, 8 статей в других изданиях.

Структура и объем диссертации. Диссертация состоит из введения, 6 глав, заключения и двух приложений. Работа изложена на 296 страницах машинописного текста, включающего 127 рисунков, 21 таблицу и список литературных источников из 211 наименований.

Анализ методов и алгоритмов сегментации сложноструктурируемых изображений

Создание и использование систем искусственного интеллекта требует специального теоретического осмысления общих закономерностей построения и функционирования объектов различной природы.

Современная наука ищет способы и методы определения в сложных системах свойств отдельных объектов, их строгой формализации на основе последних достижений математики, логики, кибернетики, информатики и других точных наук. Анализ сложных объектов основывается на методологии системного подхода [13]. Системный подход, как правило, опирается на математическое моделирование с использованием теории подобия, теории научного эксперимента, математической статистики, теории алгоритмов и ряда других фундаментальных классических теорий. С этих позиций исследование и разработка методов и средств классификации сложных объектов основывается на системном подходе [191].

В практике искусственного интеллекта [129] приходится иметь дело с такими понятиями как объект и система. Основными методологическими категориями описания сложных объектов являются понятия: объект, класс, отношение (связь), система. В наиболее общем представлении объект - это все, что лицо, принимающее решение (ЛПР), различает как нечто целое и реально существующее, или возникающее в его сознании и обладающее свойствами, значения которых позволяют ЛПР однозначно распознавать это нечто. Под системой будем понимать множество элементов, находящихся в отношениях и связях друг с другом, которое образует определённую целостность, единство. Отличие системы от объекта состоит в том, что на систему накладываются дополнительные ограничения, соответствующие ее функциональному состоянию, то есть способности выполнять определенный вид деятельности. Таким образом, объект воспринимается как целое независимо от его функционального состояния или от связей между элементами, тогда как система воспринимается как система только при наличии всех связей, обеспечивающих ее функциональное состояние. Сложная система - система, состоящая из множества взаимодействующих составляющих (подсистем), вследствие чего сложная система приобретает новые свойства, которые отсутствуют на подсистемном уровне и не могут быть сведены к свойствам подсистемного уровня.

В теории искусственного интеллекта понятие «объект» играет роль фундаментального исходного понятия, через которое определяются все основные понятия. Оно не может быть выведено из каких-либо более общих понятий путем наследования их свойств. Любые объекты определяются путем детализации и конкретизации атрибутов данного понятия:

Допускается также дополнять, конкретизировать или изменять данный перечень атрибутов в зависимости от природы определяемых объектов.

Вообще говоря, атрибут есть существенная деталь, параметр, свойство или функция определяемого объекта. Другими словами, атрибут есть объект, служащий для определения другого объекта, и он так же, как и любой другой объект, имеет свои атрибуты. В зависимости от предназначения атрибуты объектов можно разделить на: идентификаторы, параметры, методы взаимодействия и функции, которые определяют динамику внутренних состояний объектов и внешний эффект, возникающий в результате этой динамики. Границы между перечисленными группами атрибутов весьма условны. Назначение атрибутов при описании объекта является прерогативой исследователя и полностью определяется целями и задачами исследования.

Объекты, определенные на одних и тех же атрибутах с различными значениями, относят к одному классу объектов. Процесс объединения объектов в классы в соответствии с их свойствами называется классификацией.

В действительности мышление человека основано на абстракциях (понятиях), обозначающих классы различных объектов. При анализе сложных систем исследователь (разработчик) должен выбирать необходимые ему экземпляры объектов из заданного класса объектов путем конкретизации значений их атрибутов (идентификации). Сложность выбора необходимого варианта (экземпляра объектов) оценивается величиной разнообразия (мощностью) данного класса объектов. «Класс» - термин, употребляемый в математике в основном как синоним термина «множество» для обозначения произвольных совокупностей объектов, обладающих каким-либо определенным свойством, или признаком (например, в алгебре - классы эквивалентности относительно данного отношения эквивалентности). Иногда классами предпочитают называть совокупности, элементами которых являются множества. В некоторых случаях под влиянием аксиоматической теории множеств термин «класс» применяется для того, чтобы подчеркнуть, что данная совокупность оказывается собственно классом, а не множеством в узком смысле (например, в алгебре - примитивные классы универсальных алгебр, называемые также многообразиями).

Синтез морфологического оператора для препарирования изображения G1

Под сегментацией в общем случае будем понимать процедуру представления изображения в виде многосвязной области. Границы областей описываются бинарным изображением - замкнутым контуром. Поэтому процесс сегментации предполагает декомпозицию исходного изображения на множество изображений или получения для исходного изображения соответствующей многосвязной области, отражающей результат сегментации.

Как показано в разделе 1, большинство методов сегментации включает последовательную обработку изображения градиентным и пороговым операторами. Как правило, используют два анизотропных градиентных оператора, в результате чего получают градиентное изображение, каждый пиксель которого характеризуется двумя параметрами, определяемыми как Glx=dG/dx; G\y=dGldy, (2Л) где G - исходное изображение, G\-изображение, полученное в результате обработки изображения G градиентным оператором, х и у - направления, характеризующие анизотропию градиентного оператора.

Многие изображения не имеют четкого морфологического описания сегментов и относятся к классу сложноструктурируемых изображений. При этом сложность структурирования обусловлена как природой самого изображения, так и зашумленностью изображения. Очень часто изображения получают в условиях различной освещенности, как всего изображения, так и его частей. Также возникают ситуации, когда одни и те же сегменты на различных изображениях имеют различную цветовую окраску. Во многих случаях сложноструктурируемые изображения получаются из хорошо структурируемых изображений за счет того, что объемные изображения с явно выраженными сегментами проецируются на двумерную плоскость. Проекции сегментов накладываются друг на друга, при этом образуются псевдо сегменты или искаженные сегменты, что приводит к снижению ценности априорных данных [97, 154].

В качестве примера сложноструктурируемого изображения рассмотрим фотографию флюоресцентной ангиограммы глазного дна с инволюционной центральной хориоретинальной дистрофией (ЦХРД). Эта фотография показана на рисунке 2.1, а.

На этом изображении можем выделить три диагностически значимых сегмента: 1) диск зрительного нерва, 2) зона отслойки пигментного эпителия, 3) кровеносные сосуды. Для выделения этих сегментов используем два наиболее известные метода сегментации, основанные на градиентных операторах типа (2.1): детектор Канни с автоматическим определением порога и детектор «лапласиан гауссиана» с управляемой в интерактивном режиме дисперсией. На рисунке 2.1, б показан результат сегментации с помощью детектора Канни, а на рисунке 2.1, в результат сегментации с помощью детектора «лапласиан гауссиана». Экспертная оценка сегментированных изображений показывает неудовлетворительную сегментацию посредством известных методов, так как ни один из них не выделил ни одного из трех необходимых сегментов.

Таким образом, операторы типа (2.1) с последующими операторами пороговой обработки не удовлетворяют критериям точности выделения границ сегментов, так как не учитывают морфологические особенности изображения. Для учета морфологических особенностей изображения должны быть известны априорные данные о структуре границ сегментов [1, 43,180]. При сегментации сложноструктурируемых изображений такие данные нельзя представить на формальном уровне, а значит, непосредственно внести в алгоритм сегментации посредством математических выражений или алгоритмических процедур. Следовательно, такие задачи необходимо решать посредством моделирования мышления лица, принимающего решения (ЛПР), то есть необходимо использовать интеллектуальные морфологические операторы.

Как было указано ранее, сегментация эквивалентна выделению на изображении контуров, соответствующих границам сегментов, то есть преобразованию изображения в многосвязную область. Причем априорно неизвестны ни топология контуров, ни их количество. В этом случае обязательными процедурами алгоритма сегментации должны быть процедура определения начальной точки контура и процедура определения конца поиска границ сегментов - конца сегментации.

Так как, используя одну и ту же начальную точку, можно получить бесконечное множество контуров, то необходим критерий, позволяющий построить контур, ближайший к некоторому оптимальному. Решить эту задачу можно используя два подхода: 1) критерий оптимальности проверяется после построения контура в целом; 2) критерий оптимальности проверяется после выбора группы пикселей, принадлежащих контуру, или каждого последующего пикселя.

Выбор и оптимизация числа используемых дескрипторов Фурье при анализе границ сегментов сложноструктурируемых изображений

После получения векторного двумерного массива G2 формируется векторный одномерный массив R, получаемый в результате упорядочения по убыванию яркости (2.27) массива G2.

Проверка выполнения первого условия осуществляется в блоке 8 (см. рис.2.15). С этой целью выбирается прямоугольная маска W\, центральный элемент которой устанавливается в пиксель изображения G3 с координатами (к,-6). Если в маске J-ГІна изображении G3 находится хотя бы один бинаризированный пиксель, то пиксель с координатами (к, ), не может быть началом границы сегмента. Отметим, что ничто не мешает ему быть пикселем, включенным в границу сегмента.

Проверка выполнения второго (порогового) условия осуществляется в блоке 10 (см. рис.2.16). Порог выбирается таким образом, чтобы шум или изменение освещенности не влияли на результаты сегментации. Для определения этого уровня необходимо провести статистический анализ составляющей (2.27) изображения G2y. С этой целью исследуется гистограмма G2, и анализируется ее модальность. Блок 8 (см. рис.2.16), в котором осуществляется этот процесс, может быть реализован в автоматическом или интерактивном режиме. В блоке 12 (см. рис.2.15) определяется последующий пиксель границы сегмента относительно направлений 0Q,...,0-J, а в блоке 13 — его координаты. Эти координаты становятся текущими координатами границы сегмента при условии выполнения правила «развернутого угла». Это правило требует, чтобы направление движения текущего пикселя отличалось от направления

Одной из основных процедур выделения границы сегмента является определение конца границы сегмента. В качестве детектора конца границы сегмента используем следующее решающее правило: Если { (последующая координата пикселя границы вышла за кадр изображения) или (последующая координата пикселя границы сегмента уже выбрана) \, то « конец границы сегмента», иначе « текущий пиксель принадлежит границе сегмента». (2.31)

Введено понятие класса сложноструктурируемых изображений, как изображений с нечеткой морфологией, обусловленной как природой самого объекта, так и зашумленностью изображения за счет того, что объемные изображения с четко выраженными сегментами проецируются на двумерную плоскость, так, что проекции сегментов накладываются друг на друга, образуя при этом псевдо сегменты.

Проведенные исследования показали, что при построении алгоритмов выделения сегментов на изображениях с нечеткой морфологией на их входе целесообразно использовать изображения, имеющие векторную структуру, полученную посредством обработки исходного полутонового изображения двумя, адаптированными к взаимно-перпендикулярным направлениям, градиентными операторами. Предложен алгоритм сегментации сложноструктурируемых изображений, который построен на основе градиентной обработки исходного полутонового изображения. Отличительная особенность приведенного алгоритма заключается в том, что процесс получения бинарного изображения, отражающего морфологическую структуру исходного изображения, разбит на три последовательных этапа.

На первом этапе получают градиентное изображение, на втором -производят препарирование изображения и получают препарированное градиентное изображение, а на третьем - выполняют переход к бинарному изображению, отражающему контуры границ сегментов исходного изображения; переход осуществляется посредством интеллектуального морфологического оператора, построенного на основе нечеткой нейросетевой модели.

Сформирован морфологический оператор, который основан на операциях «дилатация» и «эрозия». Отличительной особенностью является теоретико-множественный подход к формированию «окна» локальной обработки, и использование правил продукционного типа, которые осуществляют выбор между двумя морфологическими операциями в векторном подокне «окна» наблюдения, основанными на сравнении ориентации подокна и направления вектора, характеризующего активный пиксель. Применение морфологического оператора позволяет снизить влияние проекционных помех и пробелов данных при сегментации сложноструктурируемых изображений.

Разработана структура интеллектуального оператора синтеза границы сегмента, реализованная в виде многослойной нечеткой сетевой модели, включающей базу решающих правил, агрегирующие и классифицирующие слои, позволяющая выполнять итерационный процесс активации пикселей границы сегмента.

Предложен алгоритм реализации интеллектуального оператора, включающий процедуры выбора начального пикселя границы сегмента и определения конца границы сегмента. Отличительная особенность предложенного алгоритма заключается в параллельной реализации процедур трех решающих правил, которые осуществляют способы выбора предпочтительного направления движения пикселя границы сегмента. Процедуры решающих правил основаны, соответственно, на сравнении атрибута направления текущего пикселя и выделенного направления в «окне», минимизации модуля разности атрибутов направлений текущего и предыдущего пикселей; и минимизации модуля разностей атрибутов яркости текущего и предыдущего пикселей.

Структура первого решающего модуля

Одним из атрибутов пикселя является его яркость или RGB-код в случае цветного изображения. Поэтому наиболее простым и распространенным методом сегментации является пороговая или двухпороговая обработка, приводящая к бинаризации изображения [27, 141].

Фрагменты на сложноструктурируемом изображении находятся в зонах различной освещенности, что требует отстройки от фоновой составляющей, поэтому для сегментации таких изображений используются различные градиентные методы. Исходные атрибуты пикселя являются релевантными показателями при сегментации изображений, они успешно используются в методах «расщепления и слияния» или в методах «наращивания областей» [135,189].

В целях снижения ошибок при сегментации изображений целесообразно использовать адаптивные методы, в зависимости от типа выделяемого сегмента. Так как одной из особенностей сложноструктурируемых изображений является многообразие свойств выделяемых сегментов и зашумленность их границ, то при их сегментации целесообразно применять гибридные методы или использовать одновременно методы, основанные на различных парадигмах.

Для реализации такого подхода используем классифицирующие нейронные сети, на входы которых подаются атрибуты окрестности анализируемого пикселя (окрестность определяется априорно заданной маской, а в частном случае это один пиксель), а на выходе получаем сигнал, определяющий принадлежность пикселя к заданному классу.

В зависимости от конкретного объекта исследования и выбранного метода выделения сегмента можно предложить множество реализаций нейронных сетей, соответствующих предложенному походу. В данном разделе рассмотрим базовый вариант нейросетевой структуры, ориентированный на один пиксель с учетом того, что усложнение окрестности и метода формирования области сегмента не приводит к качественному изменению нейросетевой структуры, а приводит лишь к увеличению нейронов входного слоя и усложнения блочной структуры.

Для разделения пикселей изображения глазного дна на два класса «сегмент» и «не сегмент» предлагается использовать сетевую структуру, представленную на рисунке 4.5. На вход сети подаются два вектора информативных признаков. Первый трехкомпонентный вектор информативных признаков подается на первый решающий модуль и представляет собой RGB-коды пикселей, которые необходимо классифицировать.

На второй решающий модуль подается трехкомпонентный вектор фона, значение компонент которого определяются усредненными характеристиками RGB-кодов в окрестности анализируемого пикселя, форма и размеры которой зависят от вида сегмента (решаемой задачи). Второй решающий модуль осуществляет управление структурой первого решающего модуля. Это осуществляется следующим образом.

Первый решающий модуль настраивается на класс «сегмент». Его структура соответствует универсальной сетевой структуре уравнения (4.14). Согласно этому аппроксимирующему уравнению должно быть осуществлено нелинейное отображение входного вектора в пространство признаков той же или более высокой размерности, целесообразность которого доказывает теорема Ковера [176].

Специфичность анализируемого класса изображений заключается в том, что визуализируемая сцена на сложноструктурируемом изображении располагается на сферической поверхности и, следовательно, включенные в нее объекты освещены неравномерно. Поэтому RGB-коды не позволяют отделить сегмент от фона или других сегментов изображения. Следовательно, необходимо либо ввести дополнительные информативные признаки, отражающие уровень освещенности в окрестности исследуемого пикселя, либо изменять вид используемого нелинейного отображения в зависимости от уровня освещенности, задавшись при этом определенным количеством уровней освещенности и для каждого уровня построить соответствующее нелинейное отображение. В данной работе используется последний способ, при этом выделяются три класса фона, которые определяются освещенностью (цветовой палитрой) зоны интереса на изображении.

Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений Томакова, Римма Александровна

Анализ методов и алгоритмов сегментации сложноструктурируемых изображений

Синтез морфологического оператора для препарирования изображения G1

Выбор и оптимизация числа используемых дескрипторов Фурье при анализе границ сегментов сложноструктурируемых изображений

Структура первого решающего модуля

Похожие диссертации на Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений