Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка алгоритмов семантической сегментации и классификации биомедицинских сигналов низкой размерности на основе машинного обучения Сенюкова, Ольга Викторовна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Сенюкова, Ольга Викторовна. Разработка алгоритмов семантической сегментации и классификации биомедицинских сигналов низкой размерности на основе машинного обучения : диссертация ... кандидата физико-математических наук : 05.13.11 / Сенюкова Ольга Викторовна; [Место защиты: Моск. гос. ун-т им. М.В. Ломоносова].- Москва, 2012.- 134 с.: ил. РГБ ОД, 61 12-1/1215

Содержание к диссертации

Введение

Глава 1. Задачи анализа биомедицинских сигналов низкой размерности 13

1.1. Биомедицинские изображения и их особенности 13

1.2. Задачи анализа биомедицинских изображений 15

1.3. Обзор существующих алгоритмов сегментации биомедицинских изображений 19

1.3.1. Низкоуровневые алгоритмы 19

1.3.2. Алгоритмы на основе методов оптимизации и вероятностных моделей 21

1.3.3. Алгоритмы на основе априорной информации 28

1.4. Недостатки существующих алгоритмов сегментации биомедицинских изображений 32

1.5. Медицинские сигналы и их особенности 36

1.6. Задачи анализа медицинских сигналов 37

1.7. Обзор существующих алгоритмов классификации одномерных медицинских сигналов 40

1.7.1. Линейные индикаторы 40

1.7.2. Нелинейные индикаторы 42

1.7.3. Алгоритмы на основе машинного обучения 44

1.8. Недостатки существующих алгоритмов классификации одномерных медицинских сигналов 45

1.9. Выводы 47

Глава 2. Разработанные алгоритмы семантической сегментации и классификации биомедицинских сигналов низкой размерности 49

2.1. Алгоритм выделения на изображениях однородных объектов с нечеткими границами и похожими характеристиками 49

2.1.1. Построение изолиний с помощью контурного алгоритма 50

2.1.2. Расчет признаков для классификатора 53

2.1.3. Классификация изолиний методом опорных векторов 55

2.1.4. Автоматическое выделение искомых областей внутри указанного региона 60

2.2. Алгоритм разбиения изображений на заданный набор областей, неоднородных по интенсивности, при наличии единственного обучающего размеченного изображения 61

2.2.1. Предварительная обработка тестового изображения 62

2.2.2. Разбиение изображений на суперпиксели с помощью алгоритма сдвига среднего 66

2.2.3. Априорная пространственная информация 72

2.2.4. Классификация пикселей с помощью рандомизированного решающего леса 74

2.2.5. Уточнение результата классификации с помощью Марковского случайного поля 76

2.3. Алгоритм классификации с обучением по одному прецеденту 78

2.3.1. Задача классификации с обучением по одному прецеденту 79

2.3.2. Применение алгоритма AdaBoost к индикаторам из нелинейной динамики 81

2.3.3. Метод "декомпозиции ансамблей классификаторов" 84

2.4. Выводы 85

Глава 3. Экспериментальная оценка разработанных алгоритмов 88

3.1. Тестирование алгоритма выделения на изображениях однородных объектов с нечеткими границами и похожими характеристиками 88

3.1.1. Параметры контурного алгоритма 88

3.1.2. Сравнение разработанного алгоритма с алгоритмом ISODATA 89

3.1.3. Сравнение разработанного алгоритма с базовыми алгоритмами сегментации 92

3.1.4. Дальнейшие пути развития алгоритма 94

3.2. Тестирование алгоритма разбиения изображений на заданный набор областей, неоднородных по интенсивности, при наличии единственного обучающего размеченного изображения 95

3.2.1. Параметры алгоритма 95

3.2.2. Тестирование алгоритма на изображениях из Алленовского атласа 96

3.2.3. Тестирование алгоритма на изображениях экспериментальных срезов 98

3.2.4. Дальнейшие пути развития алгоритма 99

3.3. Тестирование алгоритма классификации с обучением по одному прецеденту 101

3.3.1. Тестирование обобщенного классификатора "больной/здоровый" 101

3.3.2. Тестирование классификаторов на основе метода "декомпозиции ансамблей классификаторов" 104

3.3.3. Дальнейшие пути развития алгоритма 105

3.4. Выводы 105

Глава 4. Программная реализация разработанных алгоритмов 107

4.1. Программная реализация алгоритма выделения на изображениях однородных объектов 107

4.2. Программная реализация алгоритма разбиения изображений на заданных набор областей 111

4.3. Программная реализация алгоритма классификации с обучением по одному прецеденту 114

4.4. Выводы 115

Заключение 116

Благодарности 117

Литература 118

Введение к работе

Объект исследования и актуальность работы

Алгоритмы автоматического анализа сигналов постепенно внедряются во всевозможные области человеческой деятельности, в частности, медицину и биологию. В настоящее время существуют алгоритмы, способные классифицировать данные и распознавать объекты на изображениях. В биомедицинских приложениях это находит применение для автоматизации процесса описания данных и предварительной диагностики, что особенно актуально при больших объемах данных и сложности визуального анализа самих данных. Рост вычислительных мощностей способствует появлению более точных алгоритмов.

В рамках диссертационной работы рассматриваются биомедицинские сигналы низкой размерности — двумерные изображения и одномерные сигналы.

Существующие биомедицинские технологии позволяют получать достаточно качественные изображения внутренних органов в виде трехмерных изображений или набора последовательных двумерных срезов. Одна из актуальных задач, связанных с обработкой полученных таким образом изображений, — семантическая сегментация, т.е. выделение на изображениях объектов, относящихся к заданному классу. Это могут быть, например, задачи сегментации изображений на анатомические структуры, выделения патологических образований.

В задаче сегментации изображения участка тела на анатомические структуры может использоваться атлас - набор изображений усредненной модели участка тела с анатомической разметкой. Но при этом необходимо учитывать индивидуальные особенности субъекта и трансформировать разметку из атласа в соответствии с этими особенностями.

Задача выделения патологических образований характерна тем, что для патологии сложнее построить модель. Все существующие атласы описывают здоровые органы и ткани. Патологические образования могут сильно варьироваться по форме и другим характеристикам, и зачастую нельзя сказать ничего конкретного об их местоположении и взаимном расположении.

Задачи, связанные с обработкой одномерных сигналов, возникают, в частности, в кардиологии и включают в себя классификацию данных на случай здорового пациента и случаи различных заболеваний, а также индикацию различных физиологических состояний.

Большинство существующих алгоритмов используют машинное обучение. Но для обучения классификаторов обычно необходимы большие обучающие базы, которые требуют тщательной разметки экспертом. Особенно трудоемким этот процесс оказывается при разметке изображений. Кроме того, в некоторых задачах получение большого объема самих данных для обучающей базы либо невозможно, либо сопряжено с существенными трудностями.

В диссертационной работе предложены новые алгоритмы семантической сегментации и классификации, основанные на машинном обучении, которые упрощают обучение классификатора либо за счет введения новой эффективной процедуры разметки обучающей базы, либо за счет возможности обучения по одному прецеденту. Разработанные алгоритмы были применены к конкретным биомедицинским задачам и продемонстрировали точность либо выше аналогов, либо сравнимую с аналогами. Эти алгоритмы также применимы и к другим задачам обработки изображений.

Цель диссертационной работы

Целью диссертационной работы является разработка и программная реализация алгоритмов семантической сегментации и классификации биомедицинских сигналов низкой размерности.

Научная новизна

Разработанный в рамках диссертации алгоритм выделения на изображениях однородных объектов с нечеткими границами и похожими характеристиками, основанный на классификации изолиний функции интенсивности, является новым и превосходит аналоги по точности в рамках поставленной задачи.

Алгоритм разбиения изображений на заданный набор областей, неоднородных по интенсивности, является новым. В отличие от аналогов, он может работать при наличии единственного обучающего размеченного изображения за счет введения нового метода расчета априорной пространственной информации и демонстрирует точность, сравнимую с аналогами для похожих задач.

Алгоритм классификации с обучением по одному прецеденту основан на новом методе "декомпозиции ансамблей классификаторов". В отличие от существующих алгоритмов классификации с обучением по одному прецеденту, алгоритм не требует наличия классификаторов для других классов, построенных по полноценным обучающим базам, а требует лишь наличие обобщенного двухклассового классификатора. В рамках поставленной медицинской задачи алгоритм превосходит аналоги по точности.

Практическая значимость

Предложенный алгоритм выделения на изображениях однородных объектов с нечеткими границами и похожими характеристиками позволяет выделять широкий класс патологических образований на медицинских изображениях. Процедура разметки обучающей базы является более быстрой и удобной, чем у аналогов: вместо попнксельной ручной разметки необходимо среди автоматически построенных изолиний функции интенсивности указать те из них, которые являются границами искомых объектов. Программная система, разработанная на основе построенного алгоритма, используется в НИИ Неотложной Детской Хирургии и Травматологии (НИИ НДХиТ).

Разработанный алгоритм разбиения изображений на заданный набор областей, неоднородных по интенсивности, может применяться для сегментации изображений гистологических срезов на анатомические структуры, так как он устойчив к перепадам интенсивности между соседними пикселями внутри областей. Алгоритм может работать при наличии единственного обучающего размеченного изображения. Это чрезвычайно важно для экспериментов, где процесс получения и обработки данных представляется особенно трудоемким, например, получение изображений гистологических срезов мозга мыши. Разработка алгоритма проводилась совместно с НИИ Нормальной Физиологии имени П.К. Анохина (НИИ НФ).

Разработанный алгоритм классификации с обучением по одному прецеденту при наличии обобщенного двухклассового классификатора может использоваться для классификации данных на подклассы этих двух классов. Например, если имеется классификатор "больной/здоровый", построенный по кардиоинтервалограммам и являющийся ансамблем классификаторов, то на базе него можно построить классификатор для конкретного заболевания или физиологического состояния по одному обучающему примеру. Это особенно актуально для задач определения редких заболеваний и конкретных физиологических состояний, для которых трудно или невозможно подготовить большую обучающую базу. Разработанный алгоритм планируется для использования прежде всего в профессиональном спорте, в частности, для определения состояний перетренировки и оптимального функционирования спортсмена.

Апробация работы

Основные результаты диссертации докладывались и обсуждались на:

19-й международной конференции по компьютерной графике и зрению "GraphiCon'2009", Россия, Москва, 2009;

тика-2010", Россия, Москва, 2010;

"GraphiCon'2010", Россия, Санкт-Петербург, 2010;

7-й международной научно-практической конференции по психологии спорта и физической культуры "Руликонские чтения - 2011", Москва, Россия, 2011;

"GraphiCon'2011", Россия, Москва, 2011;

(CMLS-11), Япония, Тояма, 2011;

Bioinformatics" (СІВ 2011), США, Питтсбург, 2011;

Computational Intelligence" (ICCCI 2011), Таиланд, Бангкок, 2011;

тета ВМиК МГУ под руководством доц. Ю.М. Баяковского;

сов под руководством чл.-корр. РАН Л.Н. Королева;

фи я: фундаментальные исследования и клиническая практика", Россия, Москва, 2012;

ститута Прикладной Математики им. М.В. Келдыша. Публикации

Автором опубликовано 18 научных работ, в том числе 12 по теме диссертации: 2 статьи в рецензируемых журналах, рекомендованных ВАК [1-3], 7 статей в сборниках трудов международных конференций [4-10], 1 статья в сборнике трудов всероссийской конференции [11], а также 2 тезисов доклада [12, 13].

Структура и объем диссертации

Алгоритмы на основе методов оптимизации и вероятностных моделей

Алгоритмы второго поколения включают в себя кластеризацию К-средних и нечеткую кластеризацию С-средних, алгоритмы, основанные на классификации пикселей по набору признаков, простейшие деформируемые модели, поиск на графах.

Алгоритмы, основанные на кластеризации пикселей, разбивают пиксели изображения на кластеры по интенсивности 7(ж). Разбиение производится путем минимизации некоторой функции, например, суммы расстояний пикселей до центров кластеров, к которым они отнесены. Среди этих кластеров затем можно выделить кластер, содержащий пиксели искомого объекта. Принадлежность каждого пикселя к тому или иному кластеру может определяться жестко в случае кластеризации К-средних или в вероятностном виде в случае нечеткой кластеризации С-средних [28, 29]. Количество кластеров может быть фиксированным (кластеризация К-средиих и С-средних) или варьироваться (метод ISODATA). В работе [30] метод ISODATA (Iterative Self-Organizing Analysis Technique) используется для нахождения очагов поражения мозга на изображениях МРТ.

Общая схема работы алгоритма ISODATA [31]: 1. Центры кластеров назначаются случайным образом. Каждый пиксель относится к тому кластеру, расстояние до которого минимально.

2. Рассчитываются расстояния между центрами кластеров и стандартное отклонение для каждого из кластеров

два кластера соединяются в один, если расстояние между их центрами меньше заданного порога;

кластер разбивается на два, если хотя бы для одного пикселя стандартное отклонение а превышает заданный порог.

3. Процедура 2 повторяется итеративно для новых центров кластеров до тех пор, пока либо:

среднее расстояние между кластерами не окажется меньше заданного порога;

среднее изменение расстояний между центрами кластеров между итерациями не окажется меньше заданного порога;

максимальное количество итераций не будет достигнуто.

Могут быть заданы и другие пороговые значения и критерии останова.

Алгоритмы, основанные на классификации пикселей, принадлежат к группе методов обучения с учителем. Для каждого пикселя х строится вектор-признак, его характеризующий

Далее, строится обучающая выборка, где известно, какой категории принадлежит каждый пиксель: где Xj,i = 1,.. .,т - вектор-признак для г-ro пикселя, y j = 1,..., к -метка класса. Если поставлена задача классификации пикселей на анатомические структуры, то yj задает метку структуры. Если задача состоит в нахождении пикселей, относящихся к патологическим образованиям, тог/j может принимать два значения - "объект" (патологическое образование) и "фон" (здоровая ткань).

По обучающей выборке строится классификатор - алгоритм, осуществляющий отображение X — Y, где X - множество описаний объектов, a Y - множество меток классов. Любому объекту х, в том числе, не входящему в обучающую выборку (1.5) заданному с помощью вектор-нризнака (1.4), классификатор может поставить в соответствие метку класса. Чем меньше ошибок совершает классификатор при присвоении меток классов объектам, не входящим в обучающую выборку, тем выше точность классификатора.

В ранних работах, например, [32], использовался классификатор искусственная нейронная сеть. В более поздних работах - современные классификаторы: в [33-35] - метод К ближайших соседей, в [36] - рандомизированный решающий лес (см. рисунок 1.4), в [37-39] - метод опорных векторов. В [38] при построении обучающей выборки для метода опорных векторов используется метод усиления слабых классификаторов AdaBoost, в [39] для этой цели используется наивный Байесовский классификатор.

В [42] строится распределение интенсивностей для нескольких типов здоровых тканей мозга и патологических образований. В работах [43-45] патологические образования определяются как выбросы из распределений интенсивностей здоровых тканей мозга.

Введение Марковского случайного поля [46] позволяет учитывать не только значения признаков самого пикселя, но и взаимное расположение пикселей. Значения признаков и классы соседних пикселей могут влиять на результат классификации данного пикселя.

Изображение может быть описано с помощью марковской сети, гдея -это наблюдаемые переменные - пиксели, a tj - это скрытые переменные -их метки класса (рисунок 1.5).

Унарный член в (1.8) отвечает за меру соответствия пикселя каждому из классов. Бинарный член в (1.8) отражает сходство меток классов соседних пикселей. Несовпадение меток классов соседних пикселей штрафуется некоторым значением, т.е. используется предположение, что соседние пиксели часто относятся к одному и тому же классу. Искомая разметка изображения соответствует глобальному минимуму энергии (1.8). В некоторых работах Марковское случайное поле применяется для уточнения результата классификации [47-49], где в качестве унарных членов используются выходы классификатора (1.6). В [43, 50] Марковское случайное поле используется для уточнения результата работы ЕМ-алгоритма (Expectation Maximization).

Алгоритмы, использующие деформируемые модели, позволяют выделить конкретный объект при наличии начального приближения границ этого объекта. К наиболее ранним относятся "змеи" 51. Кривая может эволюционировать, при этом обладая физическими свойствами эластичности и жесткости. В результате итеративной процедуры минимизации энергии кривая находит ближайший край на изображении, который характеризуется повышенным значением градиента интенсивности. Значение функционала энергии вычисляется по формуле

Разбиение изображений на суперпиксели с помощью алгоритма сдвига среднего

В отличие от медицинских задач, где могут быть мультимодальныо данные, в поставленной задаче имеется всего одно изображение для каждого субъекта. Поэтому каждый отдельный пиксель может быть охарактеризован тремя признаками — местоположением на изображении (ж, у) и значением интенсивности. Этой информации в общем случае недостаточно для того, чтобы делать выводы о принадлежности данного пикселя той или иной области. В частности, это связано с тем, что внутри областей могут быть большие скачки интенсивностей между соседними пикселями (как, например, на изображениях гистологических срезов). Окрестность пикселя является гораздо более информативной в этом плане, поскольку она обеспечивает информацию о средней интенсивности в данном регионе, текстуре и другую полезную информацию. Если рассматривать фиксированную окрестность вокруг пикселя, например, квадратное окно с центром в данном пикселе, то полученная окрестность может содержать пиксели более чем одной области в том случае, когда в окно попадают границы областей. Поэтому признаки, вычисленные по такой окрестности, не могут эффективно служить для обучения классификатора. Окрестностями пикселей должны быть сегменты изображения (суперпиксели), находящиеся внутри границ областей. Суперпиксель представляет собой непрерывный набор пикселей, объединенных некоторым свойством или набором свойств, отличающим его от соседних суперпикселей. Так как при переходе от одной области к другой меняются свойства окрестности, то границы областей на изображении вероятно будут совпадать с границами прилежащих к ним суперпикселей. Идея построения классификатора на основе суперпикселей была предложена в [101].

В данной работе для разбиения обучающего и тестового изображений на суперпиксели используется алгоритм сдвига среднего. Благодаря предварительному размытию изображения последующая сегментация позволяет объединить в сегменты пиксели, интенсивность которых в целом сходна на данном конкретном участке.

Алгоритм сдвига среднего (Mean shift), изначально предложенный К. Фуку нага и Л. Хостетлером в 1975 году [102], основан на идее эффективного поиска локальных максимумов распределения вероятностей без явного построения полной модели этого распределения. Разбиение набора данных на кластеры (изображения на сегменты) происходит таким образом, что точки, сходящиеся к одному и тому же локальному максимуму, принадлежат одному и тому же кластеру (сегменту). Ниже приведено описание алгоритма для случая одномерных данных [103].

После этого производится поиск локальных максимумов методом градиентного подъема. Стартуя от некоторого начального приближения у , которое может быть любой исходной точкой ХІ, рассчитывается градиент функции плотности /(ж) в этой точке и производится шаг вверх в этом направлении. Градиент f(x) рассчитывается Поиск локального максимума производится с помощью итеративной процедуры. Если ук - текущее приближение локального максимума, то на следующей итерации оно заменяется па ук+\ по формуле:

Работа алгоритма может продолжаться либо до момента достижения заданного количества итераций, либо до тех пор, пока величина сдвига (2.29) не будет меньше заданного порога.

Иллюстрация работы алгоритма сдвига среднего приведена на рисунке 2.8.

При сегментации изображений локальные максимумы ищутся для совместного распределения цвета (или интенсивности) хг и местоположения xs = (х,у). Начальные приближения локальных максимумов уь обычно строятся в каждой точке изображения.

Достоинства алгоритма заключаются в том, что не делается предположений о виде и параметрах распределения и форме кластеров, и в том, что количество кластеров определяется автоматически (в отличие от кластеризации К-средних). Использование совместного распределения местоположения и интенсивности позволяет производить более качественную сегментацию, чем при использовании информации только об интенсивности.

После проведения процедуры сегментации для каждого суперпикселя рассчитываются следующий набор признаков, взятый из алгоритма [104]:

цветовая статистика:

- среднее значение интенсивности;

- дисперсия по интенсивности;

геометрическая статистика:

- отношение площади сегмента к площади изображения ;

- отношение среднего значения по ж-координате к ширине изображения;

- отношение среднего значения по у-координате к высоте изображения;

- дисперсия по ж;

- дисперсия по у;

- ковариация ж и у;

- 1-е собственное значения матрицы ковариации х и у;

- х-компонента 1-го собственного вектора матрицы ковариации х и у; - у-компонента 1-го собственного вектора матрицы ковариации х и у;

- 2-е собственное значения матрицы ковариации хну;

- ж-компонента 2-го собственного вектора матрицы ковариации х и у]

- у-компонента 2-го собственного вектора матрицы ковариации х и у;

- отношение длины к ширине;

- асимметрия;

- плотность;

- главное направление;

- отношение крайнего правого значения по х ограничивающего прямоугольника к ширине изображения;

- отношение нижнего значения по у ограничивающего прямоугольника к высоте изображения;

- отношение крайнего левого значения по а; ограничивающего прямоугольника к ширине изображения;

- отношение верхнего значения ноу ограничивающего прямоугольника к высоте изображения;

- отношение ширины ограничивающего прямоугольника к ширине изображения;

- отношение высоты ограничивающего прямоугольника к высоте изображения;

- компактность;

- длина; — ширина;

— площадь;

— периметр;

— площадь аппроксимирующего многоугольника;

- периметр аппроксимирующего многоугольника;

- площадь выпуклой оболочки;

— периметр выпуклой оболочки;

- мера выпуклости;

- ж-коордипата центра аппроксимирующего эллипса;

— у-координата центра аппроксимирующего эллипса;

— угол наклона аппроксимирующего эллипса;

- ширина аппроксимирующего эллипса;

- высота аппроксимирующего эллипса;

— ж-координата центра аппроксимирующего прямоугольника с минимальной площадью;

- у-координата центра аппроксимирующего прямоугольника с минимальной площадью;

- угол наклона аппроксимирующего прямоугольника с минимальной площадью;

- ширина аппроксимирующего прямоугольника с минимальной площадью

Тестирование обобщенного классификатора "больной/здоровый"

Для того чтобы проанализировать возможность построения обобщенного классификатора "больной/здоровый" с помощью алгоритма усиления слабых классификаторов AdaBoost, где в роли слабых классификаторов выступают индикаторы из нелинейной динамики - детреидовый анализ флуктуации и мультимасштабный анализ энтропии, были построены графики распределения значений этих индикаторов для кардиоинтервалограмм здоровых пациентов и кардиоинтервалограмм пациентов с различными заболеваниями (см. рисунок 3.8). Были заданы следующие значения параметров индикаторов. Для детрендового анализа флуктуации угол /Зі наклона прямой, приближающей график зависимости log F(m) от logm из уравнения (1.26), рассчитывается для участка графика 4 т 16, как и в исходной работе [83]. Для мультимасштабного анализа энтропии параметр масштаба т из уравнения 1.27 установлен в 5. Были взяты кардиоинтерва-лограммы размером 1024 точки каждая, что составляет около 15 минут, от 52 здоровых пациентов, 27 пациентов с застойной сердечной недостаточностью и 48 пациентов с различными видами аритмии, что составляет суммарное количество временных промежутков около 7.3 х 106. Также использовались 78 кардиоинтервалограмм от пациентов с суправентрикулярной аритмией и 106 кардиоинтервалограмм от пациентов с пароксизмальной фибрилляцией предсердий.

Из графиков на рисунке 3.8 видно, что распределение значений индикаторов для кардиоинтервалограмм здоровых пациентов в среднем отличается от распределений значений индикаторов для кардиоинтервалограмм больных пациентов, независимо от вида заболевания. Особенно это разделение заметно для индикатора детрендовый анализ флуктуации (рисунок 3.8 а). Это позволяет сделать вывод о возможности построения обобщенного классификатора "больной/здоровый". Тем не менее, видно, что распределения значительно перекрываются для больных и здоровых пациентов.

Построение мета-модели с помощью бустипга на основе этих индикаторов, позволяет повысить качество классификации.

Для обучения обобщенного классификатора "больной/здоровый" была использована треть имеющихся данных от пациентов с аритмией и половина данных от пациентов с застойной сердечной недостаточностью. На остальных данных проводилось тестирование. Количество итераций алгоритма AdaBoost равно 30. При поиске наилучшей модели слабого классификатора на каждой итерации сравнивались две модели, основанные на каждом из двух используемых нелинейных индикаторов. При этом для каждой из этих моделей варьировались следующие параметры. Для детрсндового анализа флуктуации это границы диапазона значений длины промежутка т. Поиск оптимального значения нижней границы диапазона производился в интервале [4,128], а оптимального значения верхней границы диаиа-зонв - в интервале [6,128]. Для мультимасштабного анализа энтропии это параметр г - величина допустимого отклонения, в рамках которого значения точек временного ряда можно считать одинаковыми. Поиск оптимального значения параметра г производился в интервале [0.0005,2]. Границы диапазона значений параметра масштаба г были установлены вручную [0,20]. Также производился поиск оптимальных значений порогов, разделяющих классы по значениям индикаторов: для детрендового анализа флуктуации в интервале [0.01,3.0], для мультимасштабного анализа энтропии - в интервале [—3.0,3.0]. В качестве алгоритма оптимизации используется имитация отжига [123].

Программная реализация алгоритма выделения на изображениях однородных объектов

На базе предложенного алгоритма разработано интерактивное приложение, которое внедрено в НИИ Неотложной Детской Хирургии и Травматологии и используется для выделения очагов поражения головного мозга на изображениях магнитно-резонансной томографии (см. приложение 1).

Приложение реализовано на языке С#. Использована система разработки настольных приложений Windows Presentation Foundation (WPF). Приложение использует набор внешних библиотек:

OpenDicom — открытая библиотека для загрузки и последующего преобразования изображений в формате DICOM

EmguCV — .NET-оболочка библиотеки OpenCV (библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом)

Galasoft MVVM Light Toolkit — библиотека для поддержки шаблона проектирования Model-View-ViewModel (MVVM), являющегося общепринятым стандартом при проектировании WPF, Silver light и других .NET приложений.

Приложение работает в двух режимах: обычном и полноэкранном. Для удобства одновременного просмотра изображений магнитно-резонансной томографии и ангиографии был используется элемент управления GridSplitter, позволяющий разделить рабочее пространство на две зоны. В верхней части приложение содержит меню, в котором реализованы основные функции для работы с изображениями. В нижней части приложение содержит индикатор состояния StatusBar для отображения текущей информации о стадии работы приложения.

В приложении реализован следующий набор функций:

открытие/сохранение:

- открытие папок с изображениями в формате DICOM, загрузка изображений, возможность их интерактивного просмотра;

- сохранение текущего просматриваемого изображения в формате PNG;

- сохранение всех изображений, на которых выделены регионы интереса, в формате PNG в новую папку;

- сохранение всех изображений в формате PNG в новую папку;

редактирование:

- выделение региона интереса на изображении;

- отмена последнего выделения;

- очистка текущего изображения;

- очистка всех изображений;

режимы мыши:

- режим "выделение" для выделения региона интереса;

- режим "крест" для просмотра координат пикселя на изображении (см. рисунок 4.1);

- режим "лупа" для быстрого просмотра результата работы алгоритма на указанном участке в увеличенном виде (см. рисунок 4.2);

- режим "сопоставление" для выделения региона интереса, автоматического выделения очагов поражения с помощью предложенного алгоритма и сопоставления результатов с изображениями ангиографии (см. рисунок 4.3);

специальные функции:

- увеличение/уменьшение размеров изображения при прокрутке колеса мыши;

- "горячие" клавиши для быстрого доступа к функциям приложения;

- дополнительное окно с реализованными алгоритмами эквализа-ции гистограммы, гамма-коррекции, Гауссова размытия и другими алгоритмами для дополнительной обработки текущего изображения;

дополнительные страницы:

- страница для тестирования и анализа контурного алгоритма в выделенных регионах интереса;

- страница для тестирования, анализа и обучения классификатора методом опорных векторов, используемого в предложенном алгоритме.

Архитектура приложения построена на принципе Model-View-ViewModel. В качестве Model используется набор классов, в которых реализован математический аппарат, используемый в приложении, в частности, классы содержат:

алгоритм построения изолиний;

алгоритм классификации с помощью метода опорных векторов (используется внешняя библиотека EmguCV);

алгоритм эквализации гистограммы;

алгоритм Гауссова размытия;

алгоритм гамма-коррекции.

View - набор страниц и элементов управления. Вес View написаны на стандартном языке разметки XAML и содержат в себе информацию о взаимном расположении элементов управления. ViewModel — набор классов, являющихся связующим звеном между Model и View. Согласно шаблону проектирования MVVM, весь код приложения работает по ряду принципов (см. рисунок 4.4)

Похожие диссертации на Разработка алгоритмов семантической сегментации и классификации биомедицинских сигналов низкой размерности на основе машинного обучения