Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Моделирование систем распознавания изображений Абрамов Евгений Сергеевич

Моделирование систем распознавания изображений
<
Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений Моделирование систем распознавания изображений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Абрамов Евгений Сергеевич. Моделирование систем распознавания изображений : 05.13.01 Абрамов, Евгений Сергеевич Моделирование систем распознавания изображений (На примере печатных текстов) : Дис. ... канд. техн. наук : 05.13.01 СПб., 2006 140 с. РГБ ОД, 61:06-5/1984

Содержание к диссертации

Введение

1 Современные методы распознавания текста и анализа изображений 10

1.1 Базовые концепции распознавания образов 10

1.1.1 Существующие парадигмы теории и практики распознавания образов 10

1.1.2 Формализация проблемы распознавания образов . 13

1.2 Основные определения 17

1.3 Современные методы решения задач распознавания изображений 20

1.3.1 Признаки, используемые при распознавании изображений 26

1.3.2 Методы выбора признаков объектов для задач распознавания 30

1.3.3 Методы классификации признаков , . 33

1.4 Методы предварительной обработки изображений 35

1.4.1 Классификация искажений изображений символов . 35

1.4.2 Методы предварительной обработки и борьбы с искажениями изображений 37

2 Задача распознавания печатных текстов 41

2.1 Формализация задачи распознавания текстов 43

2.2 Задача выбора признаков 48

2.3 Задача обеспечения помехоустойчивости признаков 50

2.4 Задача классификации векторов признаков 51

3 Решение поставленных задач 53

3.1 Этапы решения задачи распознавания печатных текстов . 53

3.2 Выбор методики выделения векторов признаков 56

3.3 Построение секторов признаков изображений символов . 57

3.4 Совершенствование метода получения векторов признаков . 62

3.5 Фильтрация искажений изображений символов 69

3.6 Классификация векторов признаков 76

4 Программная реализация методов решения задач 79

4.1 Выбор средств разработки программного обеспечения . 79

4.2 Общий алгоритм решения задачи распознавания текста . 81

4.3 Алгоритм распознавания символов . 84

4.3Л Алгоритм предварительной обработки изображения . 84

4.3.2 Алгоритм выделения признаков изображения 87

4.3-3 Алгоритм классификации признаков изображения . 88

4.4 Структура системы распознавания текстов 90

4.5 Оценка возможности масштабирования рассмотренных алгоритмов 93

5 Вычислительный эксперимент 96

5.1 Тестирование системы распознавания текста 9в

5.2 Оценка эффективности предложенных методов распознавания текстов 99

Заключение 101

Положения, выносимые на защиту 104

Литература 105

Приложение А 118

Введение к работе

Задачи, решаемые при помощи ЭВМ- В течение последних 60-ти лет вычислительная техника развивалась стремительными темпами. Это развитие состояло как в увеличении производительности вычислительных машин, так и в уменьшении их размеров. В настоящее время персональный компьютер значительно превосходит по производительности суперкомпьютер 7Ох-80х годов 20-го века.

Рост производительности вычислительных машин и увеличение объемов носителей информации сделали возможным решение при помощи ЭВМ широкого класса задач, связанных с цифровой обработкой данных. Например, персональный компьютер сейчас способен хранить и обрабатывать изображения, звук, видео, а ведь всего 30 лет назад об этом можно было только мечтать.

Казалось бы, что современные компьютеры становятся все «умнее», и сейчас они могут решать те задачи, которые еще недавно были им не под силу. Однако, имеются задачи, которые не могут быть решены с использованием ЭВМ и сейчас.

Существует два типа задач, которые не решаются при помощи ЭВМ.

Во-первых, это задачи, которые имеют алгоритм решения, но этот алгоритм не может быть реализован с достаточной степенью эффективности на современной вычислительной машине, Такие задачи могут быть решены, например, при помощи параллельных вычислений. В качестве примеров подобных задач можно привести задачу анализа генетической информации (см., например, [38]) или задачу моделирования атмосферных явлений, описанную в [94].

Во-вторых, существуют задачи, которые не имеют алгоритмического решения. Такие задачи не стали решаться лучше с ростом производительности вычислительных машин. Хорошим примером такого рода задач является задача создания искусственного интеллекта. Для того, чтобы решить эту задачу, необходимо знать, как действует интеллект человеческий, то есть необходимо разобраться в том, как «работает» человеческий мозг. Существует ли универсальный алгоритм, по которому он действует? На этот вопрос мы не можем ответить. Поэтому нам приходится руководствоваться догадками и предположениями о том, как действует человеческий разум для того, чтобы попытаться смоделировать его работу.

ЭВМ и распознавание образов. Одной из характеристик живой материи является се способность воспринимать информацию и адекватно па нее реагировать, Иначе говоря, живые организмы способны распознавать различные образы. Эта способность присуща всем формам жизни и является необходимой для выживания любого организма. В настоящее время полное представление о способностях живых организмов к распознаванию многих явлений и объектов отсутствуют. В то же время, создавая автоматизированные системы управления, человек высказывает гипотезы, продвигающие его к познанию устройства механизмов распознавания образов в природе, что позволяет успешно создавать распознающие системы [12].

Наиболее надежная распознающая система — мозг человека. Человек может воспринимать новую для него информацию, анализировать ее, сопоставлять с тем, что он уже знает, и делать выводы на основе полученной информации. Машина же действует по заранее определенному, данному ей алгоритму, что делает невозможным ее адекватную реакцию на не предусмотренные этим алгоритмом ситуации. Можно написать сколь угодно сложную программу, но эта программа все равно не будет учитывать всего многообразия случайностей, которые могут встретиться в процессе ее работы.

Вполне возможно, что в основе разумной деятельности человека лежит некий вполне определенный, хотя и очень сложный алгоритм. Сейчас мы не можем сказать ничего определенного по поводу того, как «работает» человеческий мозг, а можем высказать лишь некоторые предположения.

Одно из главных отличий человека от любого компьютера состоит в том, что человек способен к индуктивному мышлению, т. е, способен делать выводы об общем, руководствуясь частным. Главным помощником человека в индуктивных построениях является его интуиция. По-видимому интуиция является некоторым скрытым от сознания человека методом анализа имеющейся информации, который позволяет выделять в ней скрытые за кономернссти, обобщать ее и высказывать гипотезы, которые с логической точки зрения, возможно, ничем не обоснованы.

Проводя какое-то исследование, человек обычно начинает с эксперимента. Но даже поставив огромное количество опытов, нельзя полностью охватить все многообразие возможных ситуаций. Поэтому человек обобщает результаты конечного числа экспериментов и на основе этого обобщения высказывает гипотезу о закономерности поведения исследуемого объекта. Таким образом, в любой деятельности человека принятие решения происходит исходя из конечного числа наблюдений [96].

Длительное время вопросы распознавания образов рассматривались человеком лишь с позиций методов биологии и психологии. При этом целью изучения являлись в основном качественные характеристики, не позволяющие вскрыть и точно описать соответствующий механизм. Если и получались числовые характеристики, то они, как правило, были связаны с изучением рецепторов, таких как органы зрения, слуха, осязания. Что же касалось характеристик принятия решений, то до их оценки дело не доходило. И только кибернетика позволила ввести в изучение психологического процесса распознавания образов, лежащего в основе принятия любых решений, количественные методы, что открыло принципиально новые возможности в исследовании и проектировании автоматических и автоматизированных систем распознавания образов [61].

Компьютерная обработка любой информации должна включать в себя обязательный этап — программирование алгоритма обработки. Сейчас по строение алгоритма и написание программы для компьютера — это работа человека. Иными словами, для того чтобы научить машину решать некоторую задачу, человеку необходимо построить строго определенную последовательность действий, приводящую к решению этой задачи. Одной из главных проблем построения любого алгоритма является обеспечение адекватной реакции этого алгоритма на все многообразие возможных входных данных. В процессе решения задачи распознавания, число принимаемых решений по результатам распознавания конечно, в то время как число состояний внешней среды, оцениваемых в процессе самого распознавания и приводящих к указанным решениям, может быть бесконечным. Поэтому алгоритм распознавания должен уметь реагировать на бесконечное множество возможных состояний внешней среды. Построение такого алгоритма является одной из сложнейших задач теории распознавания образов.

Актуальность решения задач распознавания образов- С ростом автоматизации производства, возникла необходимость обеспечить работу многих технологических процессов без участия человека. Главным образом это процессы, связанные с рутинной, однообразной работой или опасные для человека. В таких процессах человека целесообразно заменить на автоматы, реагирующие на различные отклонения параметров технологического процесса от номинальных. Создание таких автоматов являлось первым шагом на пути к построению распознающих систем. Со временем, такие автоматы становились все сложнее, а с появлением компьютеров, открылись широчайшие возможности для применения распознающих автоматов [35, 397 66], работа которых основывается на цифровой обработке данных. Но не только указанная замена и освобождение человека от выполнения рутинных операций является причиной поиска путей создания систем распознавания образов, В некоторых случаях человек вообще не в состоянии решать поставленную задачу со скоростью, задаваемой обстоятельствами, независимо от качеств и психологического состояния принимающего решение (например: противоракетный маневр самолета в сложных метеоусловиях; вывод из рабочего режима АЭС и т.п.). Таким образом, основные цели замены человека в задачах распознавания сводятся к следующим:

• освобождение человека от однообразных рутинных операций для решения других более важных задач;

• повышение качества выполняемых работ;

• повышение скорости решения задач.

Развитие теории распознавания образов. В течение достаточно продолжительного времени проблема распознавания образов привлекает внимание специалистов в области прикладной математики, а затем и информатики. В частности, можно отметить работы Р. Фишера, выполнен-ныс в 20-х годах и приведшие к формированию дискриминантного анализа, как одного из разделов теории и практики распознавания образов. В 40-х годах А. Н. Колмогоровым и А. Я. Хинчиным поставлена задача о разделении смеси двух распределений. Наиболее плодотворными явились 50-60-е годы XX века- В это время на основе массы работ появилась теория ста тистических решений. В результате этого появления найдены алгоритмы, обеспечивающие отнесение нопого объекта к одному из заданных классов, что явилось началом планомерного научного поиска и практических разработок. В рамках кибернетики начало формироваться новое научное направление, связанное с разработкой теоретических основ и практической реализации устройств, а затем и систем, предназначенных для распознавания объектов, явлений, процессов. Иными словами, появилась новая научная дисциплина, которая получила название «Распознавание образовк

К середине 70-х годов определился облик теории распознавания как самостоятельного научного направления и началось ее бурное развитие, связанное, в первую очередь, с развитием вычислительной техники.

Однако в виду сложности проблемы распознавания образов основные исследования были сосредоточены на решении конкретных реальных задач, таких как распознавание изображений.

Несмотря па многолетние усилия исследователей, задача распознавания изображений остается не решенной до сих пор. В настоящее время существуют программы распознавания текстов, (например, ABBYY FineReader, Readiris, ScanSoft OmniPage, Cognitive Technologies CuneiForm) каждая из которых предлагает свою реализацию решения задачи распознавания. Эти программы позволяют достичь приемлемого качества распознавания для узкого круга задач и для каждой из них находится такой текст, который хорошо читается человеком и очень плохо поддается распознаванию программой. Это происходит потому, что качество распознавания текста та кими программами в значительной степени зависит от влияния факторов, которые при чтении текста человеком не вызывают у него никаких затруднений. Например, человек может читать с любого разумного расстояния текст развернутый в пространстве практически под любым углом, напечатанный на плохой бумаге и содержащий символы любого размера, причем способ начертания этих символов также не играет никакой роли. Для машины же даже небольшое отклонение угла расположения текста, качества печати и начертания символов от заложенных в программу приведут к значительным отклонениям результатов распознавания от приемлемых. Поэтому нельзя сказать, что задача распознавания печатного текста решена. Актуальность решения этой задачи не вызывает сомнений поскольку обучение компьютеров чтению откроет возможность автоматизации таких процессов, как получение электронных копий различных документов и книг, поиск информации в бумажных источниках и т, п.

Тематика данной работы. В данной работе рассматривается задача распознавания печатных текстов- Эта задача была выбрана по причине ее высокой практической ценности и актуальности. Можно сказать, что решение этой задачи выведет теорию распознавания образов на новый виток развития и позволит автоматизировать многие процессы управления. Кроме того, задача распознавания текста решалась в рамках проекта «система распознавания текста с открытым кодом», разрабатываемого при поддержке фирмы Digital Design.

Существующие парадигмы теории и практики распознавания образов

Как и в любой другой научной дисциплине, в теории распознавания образов существуют различные подходы к рассматриваемой проблеме.

Рассмотрим базовые идеи и концепции, приведшие к возникновению различных подходов к общей задаче распознавания образов.

1.1.1 Существующие парадигмы теории и практики распознавания образов

Всякое новое научное знание строится в терминах уже существующих теорий. Начальная точка этого процесса устанавливается общепринятыми, очевидными представлениями фактов (аксиомами), которые не могут быть оспорены и поставлены под сомнение. Эти фундаментальные факты, тем не менее, могут быть различны для разных исследователей. Как следствие этого могут появиться различные подходы к исследуемой проблеме и различные «школы».

В этом параграфе мы обсудим четыре подхода к распознаванию образов. Все они вытекают из двух противоположных философских подходов к построению процесса познания. Эти подходы можно представить как построение процесса познания от общего к частному (подход Платона) и от частного к общему (подход Аристотеля) [74].

Подход Платона основывается па общепринятых концепциях и глобальных идеях о мировом устройстве. Первичной задачей исследователя, использующего этот подход является выявление в своих наблюдениях основополагающих концепций и идей.

В подходе Аристотеля наблюдения ставятся на первый план. Научные описания строятся таким образом, чтобы максимально соответствовать этим наблюдениям. Наблюдения всегда являются фундаментом, от которого исследователь строит свое познание. Основная идея такого подхода выражается так: «следует избегать теорий, которые более сложны, чем требуется для объяснения наблюдений» (бритва Оккама).

Нельзя сказать ничего определенного в пользу того или иного подхода к проведению исследований. Выбор подхода зависит исключительно от личных предпочтений исследователя. К недостаткам подхода Аристотеля можно отнести то, что исследователь не видит общей картины, С другой стороны используя подход Платона, ученые часто выдают желаемое за действительное.

В этом параграфе мы будем пользоваться самым общим определением распознавания образов; Распознавание образов — это умение обобщать результаты наблюдений.

Исследование в области распознавания образов может проходить путем самоанализа. Исследователь пытается понять, какие действия он предпринимает при решении задач распознавания. Такой подход, основанный на самоанализе, называется внутренним.

Если исследователь изучает, как работают при решении задач распознавания реальные распознающие системы (например, другие люди), то такой подход называется внешним. При таком подходе исследователь пытается определить опытным путем, как распознающая система приходит к тому или иному выводу на основе результатов ее восприятия тестового объекта.

Комбинируя только что рассмотренные подходы, можно получить четыре основные ветви развития теории распознавания образов,

1. Спиритуалистический подход.

2. Реалистический подход.

3. Материалистический подход,

4. Идеалистический подход.

Эти четыре направления, представленные на рис. 1.1 подробно обсуждаются в приложении А.

В данной работе используется комбинация материалистического реалистического и идеалистического подходов.

Этапы решения задачи распознавания печатных текстов

В разделе 2.4 данной работы были выделены следующие этапы решения задачи распознавания текста,

1. Разделение текста на строки.

2. Разделение строк па символы.

3. Распознавание символов.

В работе основное внимание уделяется последнему этапу решения задачи, то есть распознаванию изображений символов. Однако, поскольку одной из целей работы было создание программного продукта для распознавания текстов, то методы решения подзадач, связанных с первыми двумя этапами, также описываются.

Рассмотрим изображение листа с текстом Z{i,j), имеющее размер [М х N]. Опишем кратко алгоритмы выделения строк текста и символов на этом изображении.

В рамках задачи распознавания текстов, решаемой в данной работе, было принято считать, что на изображении содержится только текст, то есть искать на изображении области, содержащие текст не нужно. Это допущение несколько упрощает задачу выделения символов.

Метод сегментации строк основывается на том, что средняя яркость точек в изображениях межстрочных интервалов существенно ниже средней яркости в изображениях текстовых строк. Сначала вычисляются массив средних значений яркости пиксельных строк Sr(i) и средняя яркость по изображению Sz:

Затем в массиве Sr(i) ищутся те номера строк, для которых значение яркости устойчиво превышает значения яркости межстрочных промежутков. Строка текста начинается с той пиксельной строки, с которой наблюдается устойчивое увеличение средней яркости и заканчивается на той пиксельной строке, после которой имеется устойчивое уменьшение средней яркости [22], Под устойчивым увеличением средней яркости в строке і понимается выполнение условий: где ки 1ц — весовые коэффициенты, которые были подобраны экспериментально [22].

Алгоритм выделения слов. Алгоритм сегментации слов основывается па том, что средняя яркость в интервалах между словами существенно ниже средней яркости в изображениях слов. Поэтому он похож на алгоритм сегментации строк с той только разницей, что просмотр идет по пиксельным столбцам изображения строки [22].

Алгоритм выделения символов. Алгоритм выделения символов основывается на том, что средняя яркость по столбцу пикселов в интервалах между символами ниже средней яркости по столбцу в изображениях символов (см. [22]).

В результате работы алгоритма выделения символов получается множество изображений отдельных символов. Эти изображения являются исходными данными для процесса распознавания.

Согласно общей схеме построения систем распознавания образов (см. п. 1.1.2), после получения результатов измерений исходного сигнала (в нашем случае это цифровое представление изображения — матрица яркостей точек), необходимо провести вычисление координат векторов признаков. Поэтому перейдем к поиску методики выделения векторов признаков изоб ражений символов, подходящей для решаемой в данной работе задачи.

В разделе 1.3.1 данной работы были рассмотрены некоторые виды признаков изображений, используемые при решении задач распознавания. Были выделены четыре типа признаков: геометрические, топологические, вероятностные и спектральные. Выберем семейство признаков, подходящее для решения поставленной задачи распознавания текстов. При выборе будем учитывать требования, сформулированные в разделе 2.2, которым должны удовлетворять признаки, характеризующие изображение символа.

Важнейшим критерием выбора методики вычисления векторов признаков является информативность получаемых в результате значений векторов. Очевидно, с точки зрения информативности при решении задач распознавания текстов могут быть использованы геометрические, вероятностные и спектральные признаки.

Вероятностные признаки характеризуются высокой устойчивостью к помехам, по вместе с тем векторы признаков, построенные по вероятностным схемам, имеют большую размерность и требуют значительных вычислительных затрат при построении и классификации. То же самое можно сказать и о спектральных признаках, вычисление которых связано со сложными преобразованиями исходного изображения.

Класс геометрических признаков содержит большое количество схем лучения векторов признаков. Как правило это схемы, подходящие для решения узкого класса задач распознавания изображений. Для обеспечения помехоустойчивости геометрических признаков часто требуется предварительная обработка исходного изображения. Вместе с тем, геометрические признаки относительно легко вычисляются, являются информативными. Следует отметить, что для задачи распознавания текстов можно подобрать схему вычисления геометрических признаков, при которой векторы будут достаточно легко вычисляться и иметь небольшую размерность.

Рассмотрим геометрическую схему получения векторов признаков, которая использовалась в данной работе,

Общий алгоритм решения задачи распознавания текста

Алгоритм решения задачи распознавания текстов, реализованный в данной работе состоит из четырех этапов.

Выделение строк текста. Выделение символов из строк.

Распознавание символов.

Основное внимание в данной работе уделялось алгоритму распознавания изображений символов. Тем не менее рассмотрим кратко алгоритмы выделения строк, слов и символов.

Алгоритмы сегментации изображений листа с текстом. Предлагаемые в данной работе алгоритмы сегментации основываются на простом предположении, что яркость областей, относящихся к тексту выше яркости областей фона документа, изображение документа представляет собой матрицу яркостей Z размерности М х N. Где N — высота, аМ- ширина изображения в пикселах. Исходное изображение можно представить как массив, состоящий из последовательных строк пикселов.

Алгоритм сегментации строк основывается на том, что средняя яркость в изображениях межстрочных интервалах существенно ниже средней яркости в изображениях текстовых строк. Сначала вычисляются массив средних значений яркости пиксельных строк Sr(i) и средняя яркость по изображению Sz:

Затем в массиве Sr(i) ищутся те номера строк, для которых значение яркости устойчиво превышает значения яркости межстрочных промежутков. Строка текста начинается с той пиксельной строки, с которой наблюдается устойчивое увеличение средней яркости и заканчивается на той пиксельной строке, после которой имеется устойчивое уменьшение средней яркости.

Алгоритм выделения символов. Алгоритм выделения символов основывается на том, что средняя яркость по столбцу пикселов в интервалах между символами ниже средней яркости по столбцу в изображениях символов (см. [22]).

Пусть Wij — изображение слова (матрица яркостей размерности d х h). Сначала вычисляется массив средних значений яркости пиксельных столбцов слова Sh{i) и среднее значение яркости в слове Sw. Далее в массиве S}t(i) ищутся те номера столбцов г, для которых значения элементов массива минимальны. Поиск минимумов происходит на смежных интервалах изменения индекса столбца. Размер интервала Д выбирается исходя из высоты строки. Для любых шрифтов отношение ширины символа к его высоте не превышает величину 0.3. Поэтому размер интервала, на котором ищется минимум, выбран как Д = 0.35 . Затем происходит проверка на возможную принадлежность этих минимумов межсимвольным интервалам.

Рассмотренный метод может выявить ложные границы символов, которые имеют в своем начертании тонкие линии (например, «Н», «Ж», «И»). Поэтому на следующем этапе сегментации проводится анализ полученных «кусочков» изображения слова, для выявления истинных межсимвольных границ и слияния ложно разделенных символов [22]. В результате работы алгоритмов сегментации исходное изображение документа разбивается на области, содержащие изображения символов. Эти изображения символов и подвергаются затем распознаванию.

Следует отметить, что несмотря на специальные усилия, предпринятые для устранения возможных ошибок разбиения изображения слова на изображения отдельных символов, полностью эти ошибки устранить не удастся. Поэтому в ходе работы был предложен алгоритм принятия решений по разбиению изображения слова на символы, имеющий связь с алгоритмом распознавания символов и дающий более точные результаты разбиения. Данный алгоритм будет описан ниже в п. 4.3.3.

Оценка эффективности предложенных методов распознавания текстов

Суть вычислительного эксперимента, описанного в данном параграфе состоит в сравнении скорости выполнения алгоритмов, реализованных в системе OpenOCR со скоростью работы алгоритмов программы FineReader.

Тестирование проводилось на изображениях листа с текстом формата А4, отсканированного при разрешении 300 точек на дюйм с использованием 256 оттенков серого цвета (см. рис. 5.5). В качестве тестовой платформы использовалась вычислительная машина на базе Intel Celeron 1400 MHz с 512Мб оперативной памяти. В ходе тестирования сравнивалось время полного распознавания листа с текстом.

В ходе первой серии экспериментов сравнивалась скорость распознавания текста хорошего качества (см. рис. 5.5). На втором этапе тестирования распознавался текст, содержащий искажения (см. рис. 5.4) и сравнивалась скорость работы алгоритмов распознавания программы FineReader и программы OpenOCR с включенной фильтрацией. Результаты описанный экспериментов приведены в таблице 5.1.

В результате сравнения времени работы был сделан вывод о незначительном преимуществе программы FineReader. В результате получилось, что программа FineReader превосходит по быстродействию программу, реализующую алгоритмы данной работы в два раза. Этот результат вызван относительно низким быстродействием виртуальной Java-машины, на ко торой работает система OpenOCR по сравнению с исполняемым файлом, в виде которого реализована система FineReader,

Следует отметить, что система OpenOCR является компактной (50 Кб) и может работать на любой платформе, для которой существует виртуальная машина Java, тогда как FineReader представляет собой систему, реализованную для Microsoft Windows,

В данной главе описаны эксперименты, проведенные с целью проверки работоспособности программного обеспечения, реализующего алгоритмы данной работы- Эксперименты были направлены на анализ работоспособности алгоритмов распознавания и сравнение результатов работы этих ал-горитмов с результатами, полученными при помощи программы FineReader.

Б результате проведенных экспериментов, сделаны следующие выводы.

Во-первых, при использовании предложенных в данной работе методик оценки полезности и понижения размерности вектора признаков, удается добиться достаточно высокого качества распознавания даже при выборе в качестве основы простой системы признаков.

Во-вторых, предложенная в работе методика фильтрации искажений позволяет улучшить качество распознавания текстов.

В-третьих, разработанная система распознавания может использоваться на практике для распознавании качественных текстов.

Б данной работе были рассмотрены некоторые современные методы распознавания образов и анализа изображений. Был проведен обзор основных групп признаков, используемых при решении задачи распознавания изображений и описаны некоторые методики выбора признаков. Рассмотрены методы классификации признаков в процессе решения задач распознавания. Проведен анализ и предложена классификация искажений, присущих изображениям, описаны некоторые известные методы цифровой обработки изображений, позволяющие бороться с искажениями.

Проведенный анализ существующих подходов к распознаванию и обработке изображений позволил выявить сильные и слабые стороны этих подходов, В результате изучения литературы по освещенным в первой главе вопросам были сделаны следующие выводы. Во-первых, не существует общей методики для выбора признаков изображений при решении задач распознавания. Во-вторых большинство методик выделения признаков изображений в значительной степени подвержены влиянию искажений, вносимых в изображения в процессе их оцифровки.

Далее в работе проведена формализация задачи распознавания печат 101

пых текстов и представлен метод ее решения. Этот метод был разработан в результате проведения в первой главе системного анализа основных подходов к распознаванию изображений и современных математических методов обработки изображений,

В результате проведенных исследований были впервые предложены две эффективные методики, позволяющие осуществлять выбор элементов вектора признаков изображений с целью повышения качества распознавания и понижения размерности вектора признаков. Данные методики могут использоваться для усовершенствования используемой системы признаков при решении широкого класса задач распознавания образов.

Также в работе проведена классификация искажений изображений символов, встречающихся при решении задачи распознавания текстов и предложен метод предварительной обработки изображения перед распознаванием использующий вейвлет-преобразование с целью фильтрации шумов и улучшения качества распознавания.

Похожие диссертации на Моделирование систем распознавания изображений