Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Бородин Михаил Владимирович

Устройство распознавания изображений текстовых знаков по энтропийным характеристикам
<
Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам Устройство распознавания изображений текстовых знаков по энтропийным характеристикам
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бородин Михаил Владимирович. Устройство распознавания изображений текстовых знаков по энтропийным характеристикам : Дис. ... канд. техн. наук : 05.13.05 : Курск, 2004 178 c. РГБ ОД, 61:04-5/3383

Содержание к диссертации

Введение

1 Методы и устройства распознавания символов 9

1.1 Ввод информации 10

1.2 Кодирование 11

1.3 Предварительная обработка 13

1.4 Распознавание 17

1.5 Обучение 25

1.6 Устройства распознавания текстовых знаков 26

1.7 Выводы 30

2 Способ формирования шаблонов 31

2.1 Способ оценки информативности элементов двоичных эталонных изображений 31

2.2 Обобщение способа оценки информативности элементов на случай цветных изображений 40

2.3 Способы формирования шаблонов на основе информативности элементов . 41

2.4 Связь между вероятностью правильного распознавания и расстоянием между эталонами 44

2.5 Выводы 45

3 Моделирование распознавания 46

3.1 Моделирующая программа 46

3.2 Результаты моделирования 52

3.3 Выводы 66

4 Описание устройства распознавания 67

4.1 Устройство распознавания 67

4.2 Блок формирования шаблонов 72

4.3 Блок распознавания 89

4.4 Выводы 99

Заключение 100

Библиография

Введение к работе

Создание текстов в электронной форме, при помощи персонального компьютера, в последние десять-пятнадцать лет стало повседневной практикой. Сейсас абсолютное большинство создаваемой офисной, научной и конструкторской документации представлено именно в электронной форме. Возникли и получили широкое распространение электронные библиотеки и базы данных научной, технической и учебной направленности.

Вместе с тем, в настоящее время, огромный массив текстовой информации по-прежнему доступен лишь на бумажных носителях. Нет необходимости подробно останавливаться на всех недостатках указанной ситуации — они очевидны. Достаточно упомянуть лишь о том, что поиск информации в электронном издании обычно занимает несколько секунд, в то время как для поиска той же информации в том же издании на бумажном носителе может потребоваться до нескольких часов.

Процесс перевода текстовой информации в электронную форму обычно состоит из двух этапов — сканирования и распознавания. К настоящему моменту разработано множество способов распознавания текстовых символов и целый ряд систем, реализующих эти способы. Большинство из них являются программными реализациями, среди которых есть несколько популярных пакетов OCR (Optical Character Recognition — оптическое распознавание символов). Современные программные реализации алгоритмов распознавания, как правило, приспособлены ко вводу единичных документов и мало подходят для обработки больших массивов текстовой информации по причине недостаточного быстродействия. Причина этому — плохая приспособленность универсальных компьютеров к решению как задач распознавания изображений текстовых знаков в частности, так и задач обработки изображений вообще.

Путь к достижению высокой скорости распознавания состоит в создании высокопроизводительных специализированных устройств распознавания. Применение таких устройств должно помочь решению проблемы массового перевода бумажных текстовых документов в электронную форму. В настоянщее время известен ряд устройств распознавания, однако

большинство из них характеризуется недостаточной вероятностью правильного распознавания или повышенной вычислительной сложностью.

В связи с вышеизложенным, научно-техническая задача повышения вероятности правильного распознавания, а также скорости распознавания изображений текстовых знаков является актуальной.

Работа выполнена в рамках гранта Министерства образования и науки Российской Федерации 1.10.98 «Разработка фундаментальных основ и алгоритмического обеспечения автоматизированных систем обработки изображения» и темы 1-37.02 «Разработка программных средств обработки измерительной информации».

Объект исследования

Объектом исследования является процесс распознавания текстовых знаков.

Цель работы

Цель работы состоит в повышении вероятности правильного распознавания текстовых знаков при вводе текстов с бумажных носителей путем разработки способа распознавания, с использованием шаблонов, сформированных на основе энтропийных характеристик элементов эталонов, и быстродействующего устройства, реализующего этот способ.

Задачи, решаемые в работе

  1. Исследование зависимости вероятности правильного распознавания от энтропийных характеристик элементов эталонов и разработка способа определения информативности элементов на ее основе.

  2. Разработка способа формирования шаблонов, на основе информативности элементов эталонов.

  3. Сравнительное исследование предлагаемого способа формирования шаблонов и известного способа, основанного на использовании спинового стекла.

  4. Разработка устройства, реализующего предложенный способ распознавания.

Методы исследования

При решении поставленных задач использовались методы теории проектирования элементов и устройств вычислительной техники и устройств управления, теории цифровых

автоматов, теории алгоритмов, теории вероятностей и математического моделирования.

Научная новизна

  1. Установлена связь между энтропийными характеристиками элементов эталонных изображений и вероятностью правильного распознавания знаков,-позволяющая оценить информативность элементов через их энтропийные характеристики.

  2. Разработан способ оценки информативности элементов эталонных изображений на основе энтропийных характеристик.

  3. Разработан способ формирования шаблонов на основе оценки информативности элементов эталонных изображений, позволивший снизить выроятность ошибки распознавания.

Практическая ценность

Практическая ценность работы заключается в разработке алгоритмических, аппаратных и программынх средств для распознавания изображений текстовых знаков. Предложенные алгоритмы могут найти широкое применение в системах распознавания текстовых знаков. Использование разработанных аппаратных средств позволит повысить вероятность правильного распознавания текстовых знаков при сохранении скорости распознавания, присущей наиболее быстродействующим устройствам этого класса.

Положения, выносимые на защиту

  1. Способ оценки информативности элементов эталонных изображений на основе энтропийных характеристик.

  2. Способ формирования шаблонов на основе оценки информативности элементов эталонных изображений.

  3. Структурно-функциональная организация устройства распознавания изображений текстовых знаков.

Реализация и внедрение результатов исследований

Результаты работы внедрены в ОКБ «Авиаавтоматика», а также в учебном процессе кафедры «Программное обеспечение вычислительной техники» Курского государственного

технического университета в рамках дисциплин «Методы и алгоритмы обработки изображений», «Высокоскоростные системы обработки символьной информации» и «Моделирование»

Апробация работы

Основные результаты диссертационной работы докладывались на:

  1. III и IV Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2002 и 2003 гг.);

  2. XXXI вузовской научно-технической конференции «Молодежь и XXI век» (Курск 2003 г.);

  3. I Международной научно-технической конференции «Современные инструментальные системы, информационные технологии и инновации» (Курск, 2003 г.);

4. VI Международной конференции «Оптико-электронные приборы и устройства в
системах распознавания образов, обработки изображений и символьной информации»
(Курск 2003 г.).

Публикации

Результаты исследований отражены в шести печатных работах. В работе [62] лично автором проведено моделирование распознавания с использованием различных наборов эталонов и установлена количественная связь между расстоянием между эталонами в пространстве признаков и вероятностью правильного распознавания. В работе [10] автором предложен алгоритм распознавания с использованием нелинейных преобразований. В работах [60, 63, 64] лично автором разработан способ формирования шаблонов на основе энтропийных характеристик эталонов, а также проведено моделирование распознавания с использованием этих шаблонов. В работах [9, 60] лично автором разработана структурно-функциональная схема устройства распознавания текстовых символов с использованием шаблонов.

Структура работы

Материалы исследований излагаются в четырех главах диссертации, введении, заключении и приложениях.

В первой главе проведен аналитический обзор методов и устройств распознавания символьной информации.

Во второй главе проведено исследование энтропийных характеристик элементов эталонов и их связи с вероятностью верного распознавания предъявленных образов. Также в этой главе рассматривается способ формирования шаблонов на основе вышеназванных характеристик.

В третьей главе описываются программные средства для проведения моделирования распознавания образов по предлагаемому методу, а также представлены результаты моделирования распознавания цифр по их черно-белым изображениям.

В четвертой главе описывается устройство, реализующее предложенный способ формирования шаблонов и распознавания образов.

В приложениях представлены исходные тексты программ моделирования алгоритма и устройства распознавания.

Область возможного применения

Разработанное устройство может быть использовано в системах автоматического чтения текстов при вводе их с бумажных носителей.

Предварительная обработка

Предварительная обработка позволяет «улучшить» информацию, поступающую на вход системы распознавания образов, путем удаления различного рода помех [48, 52, 91]. Различные методы улучшения изображений — подавление шумов, фильтрация, восстановление и тому подобное — подробно рассмотрены в [24, 77].

Сглаживание исходного изображения — наиболее часто выполняющаяся при предварительной обработки операция. Простейшим способом сглаживания изображений является замена значений яркости каждого элемента средним значением, найденным по окрестности этого элемента. Усреднение по окрестности может проводиться с некоторыми весами, например с весами, убывающими по мере удаления от центра окрестности. Иногда выгодно использовать окрестность переменных размеров.

Следует отметить, что усреднение приводит к расфокусировке изображения. Для сглаживания изображения без расфокусировки можно применять сочетание рассмотренных. методов усреднения с применением пороговых операций. Такое сочетание позволяет отфильтровать импульсные помехи на изображении. Для этого необходимо заменять значение яркости каждого элемента, если оно отличается от среднего уровня по некоторой окрестности больше чем на некоторую пороговую величину, средним значением яркости по окрестности.

При применении большинства процедур предварительной обработки изображения возникает вопрос о способах обработки точек, лежащих вблизи границ изображения, то есть краевой эффект. Для обработки краевых точек используются три схемы: Р-схема, 5-схема и Г-схема [33].

Р-схема обработки ограничивается фильтрацией центральной зоны, оставляя края изображения необработанными. Фильтрация по Р-схеме приводит к уменьшению фактических размеров изображения на ширину необработанной каймы. Достоинство этой схемы — простота реализации. 5-схема использует для обработки краев изображения окно меньшего размера. При этом краевой эффект сохраняется, но существенно ослабевает. Алгоритм, реализующий S-схему, сложнее, чем алгоритм реализации Р-схемы, но он позволяет частично решить проблему краевых эффектов. Т-схема обработки использует представление изображения в виде виртуального тора. Представим, что изображение сначала скручивается в трубку, так что правый край прилегает к левому. Причем правый край сдвинут вниз на одну точку, то есть конец первой строки примыкает к началу второй строки. Аналогично соединяются верхний и нижний края изображения. За последней точкой последней строки идет первая точка первой строки. При таком подходе, возможно, увеличивается быстродействие фильтра, так как изображение разворачивается в одномерный массив и фильтр перемещается последовательно по элементам массива.

Ослабить шум на изображении, не ослабляя при этом самого изображения, можно путем усреднения нескольких независимо полученных копий одного и того же изображения.

Для фильтрации шума на изображении применяют двумерные фильтры [52]. Берется небольшой прямоугольный участок плоскости, на котором определяется некоторая функция. Такой участок называется окном, а заданная на нем функция — функцией окна, или весовой функцией. Каждому элементу окна ставится в соответствие определенное число, называемое весовым множителем. Совокупность весовых множителей и составляет функцию окна. Окно вместе с заданной на нем функцией окна часто называют маской.

При фильтрации изображений обычно используют окно небольшого размера (3x3 или 5x5) элементов. Линейные размеры окна берутся нечетными, чтобы можно было однозначно определить центральный элемент окна.

Фильтрацию осуществляют перемещением маски по изображению. В каждом положении маски выполняются однотипные действия, которые определяют отклик фильтра. Если функция окна и размеры окна в процессе фильтрации не изменяются, то фильтрация является пространственно-инвариантной операцией.

Наиболее часто используются линейные фильтры, когда в каждом положении окна весовая функция поэлементно умножается на значения соответствующих точек исходного изображения. Полученные значения суммируются, и сумма делится на нормирующий коэффициент. Полученная величина, являющаяся откликом фильтра, присваивается точке нового (отфильтрованного) изображения, соответствующей центру окна.

Одним из наиболее распространенных применений линейных фильтров — сглаживание шума. Для этого применяются функции окна следующего вида: Сглаживание шума с применением масок, согласно формуле (1.1), является одним из вариантов усреднения. Фильтрация пространственных частот

Одним из методов сглаживания изображения является подавление высших пространственных частот в его преобразовании Фурье. Основные свойства преобразования Фурье, быстрые преобразования Фурье рассмотрены в [66].

Применение низкочастотной пространственной фильтрации к графическим изображениям приводит к расфокусировке изображения, и поэтому она обычно нежелательна. Однако в некоторых случаях шум можно отфильтровать путем подавления отдельных участков пространственного спектра изображения, не затрагивая высшие пространственные частоты, чтобы не вызывать размытия контуров. Если на исходный сигнал, например графическое изображение, наложен периодический шум, то он может быть подавлен путем устранения соответствующего узкого участка в спектре зашумленного изображения. Например, телевизионное изображение можно рассматривать как изображение, на которое наложена сетка параллельных темных линий. Таким образом, можно бороться с зернистостью фотоэмульсии и других регистрирующих сред, возможно улучшение изображений, полученных сканерами с низкой разрешающей способностью.

Для обработки графических изображений, которые являются функциями двух аргументов (координаты по вертикали и горизонтали), разработаны методы двумерного гармонического синтеза и спектрального анализа [52].

Из-за низкого качества печати, помех при считывании, неоднородностей бумаги, ленты и других подобных причин, сигнал на растре имеет различные отклонения, часть из которых носит систематический, а часть — случайный характер. При достаточно малых размерах подрастров, которым сопоставляются символы алфавита, желательно, чтобы все линии в изображении имели одинаковую толщину. Однако, как правило, после считывания символы на растре обладают разной толщиной линий, и более того, одна и та же линия имеет переменную по длине толщину.

Устройства распознавания текстовых знаков

Наиболее распространены устройства распознавания символов, работающие по принципу вычисления расстояния в пространстве признаков [26, 41]. Использование оптоэлектрон-ных методов сравнения позволило значительно увеличить производительность устройств распознавания [41]. В большинстве устройств распознавания символов используется опорный словарь [3, 26]. В устройствах распознавания широко применяются структурные методы [2, 23]. В адаптивных устройствах распознавания символов используются методы клеточной логики [37], матричные процессоры [36], а так же комплексные методы, сочетающие структурные и нейронно-сетевые модели распознавания [28, 58].

Известны и другие варианты реализации устройств распознавания символов: аналогово-цифровое устройство, моделирующее реальный физический объект — «спиновое стекло» [26]; цифровое устройство, работающее с использованием алгоритмов Хопфилда [84]; цифровое устройство, использующее алгоритм сравнения зон, имеющих различные коэффициенты значимости [28].

Цифровое устройство, работающее с использованием алгоритмов Хопфилда, состоит из блока хранения эталонов, блока хранения коэффициентов, блока вычислений и устройства управления. Использование цифровых элементов упрощает монтаж и настройку устройства. Устройство легко программируется и обучается. Точность распознавания соответствует аналоговому варианту. К недостаткам следует отнести низкое быстродействие при обучении и распознавании.

Главное достоинство устройства, использующего алгоритм сравнения зон, — повышение достоверности распознавания за счет введения коэффициентов значимости зон. Вместе с тем устройство обладает низким быстродействием в связи с большим объемом производимых вычислений, включая операцию умножения. В устройстве отсутствует автоматическое определение коэффициентов значимости зон, следовательно, невозможно автоматическое обучение и дообучение. В обучении устройства обязательно участвует оператор.

Самостоятельную группу составляют устройства, в которых принятие решения о принадлежности распознаваемого образа тому или иному классу осуществляется непосредственно на основе поэлементного (попиксельного) сравнения с эталоном. В некоторых устройствах этой группы хранение эталонов осуществляться в специальном блоке, откуда данные эталонов выбираются во время работы блоком принятия решения. Путем перезаписи памяти эталонов такие устройства можно настроить на распознавание иного набора классов. В других устройствах блок хранения эталонов в явном виде отсутствует, а сравнение с эталоном реализовано при помощи специальных комбинационных схем (с использованием дешифратора).

Преимуществами таких устройств является простота реализации и отсутствие необходимости предварительного обучения устройства на множестве эталонных реализаций. Некоторые устройства из этой группы способны распознавать не отдельные символы, а составленные из символов строки или группы строк.

Перечислим некоторых типичных представителей этой группы устройств. Устройство [42] представляет собой блок из девяти датчиков, расположенных в узлах матрицы размером 5x9. Выходы с датчиков поданы на блок принятия решения, реализованный в виде дешифратора..

Весьма сходно с предыдущим устройство [38]. В нем используется шесть датчиков — для распознавания трех горизонтальных, двух наклонных и одного вертикального штриха, соответственно.

В устройстве [35] для повышения вероятности правильного распознавания предусмотрен блок выделения в распознаваемом изображении девяти (трех горизонтальных, четырех вертикальных и двух диагональных) штрихов составляющих изображение цифры.

В этом устройстве используется матрица датчиков размером 6x9 элементов. С каждым штрихом связано от 8 до 18 датчиков (причем некоторые датчики связаны сразу с несколькими штрихами). Наличие штриха фиксируется в том случае, когда количество связанных с ним включенных датчиков не меньше некоторого порогового значения. Описываемое устройство позволяет распознавать изображения с различными уровнями яркости путем адаптивной настройки порогового значения.

В отличие от ранее упомянутых, устройства [42, 43] способны распознавать не только цифры, но и все символы латиницы и кириллицы (различая при этом регистр), а также знаки препинания и некоторые специальные математические символы. Оба устройства рассчитаны на распознавание целых строк текста. Положение строк текста определяется с помощью специальных меток, выполняемых на носителе в виде четырех темных полос, предшествующих строке текста и параллельных ей. Сканирование текста в этих устройствах осуществляется построчно по мере движения носителя перпендикулярно строкам текста.

Сходно с рассмотренными устройство [31]. Его особенностью является то, что оно способно распознавать последовательности цифр, записанных на специальном бланке, вне зависимости от направления сканирования бланка. Это достигается благодаря тому, что на бланке присутствует метка в виде двойной горизонтальной линии над строкой цифр. Толщина этой линии значительно больше толщины штрихов цифр. В начале распознавания устройство находит указанную линию на изображении и определяет с помощью нее положение и ориентацию строки цифр. Дальнейший процесс распознавания почти не отличается вышеописанного.

Известно устройство [20], в котором распознавание производится путем искажения рас познаваемого образа до тех пор, пока не произойдет полное совпадение этого образа с одним из эталонов. Искажения заключаются в дорисовывании или стирании части изображения в соответствии с правилами, в отдельности определенными для каждого класса. В ходе таких искажений сначала в распознаваемом образе устраняются шлейф, разрывы и изолированные точки, а затем происходит постепенное перемещение штрихов, образующих изображение символа, в положение, соответствующее их положению в эталоне. Вид искажений применяемых к каждой отдельной точке определяется ее координатами в распознаваемом изображении и значениями соседних точек. На величину искажений накладываются ограничения, специфичные для каждого отдельного класса. В ходе работы в описываемом устройстве поддерживается по одной копии распознаваемого изображения для каждого класса образов. Искажения копий производятся параллельно до тех пор, пока одна из них не совпадет с соответствующим эталоном, либо пока искажения не выйдут за допустимые пределы.

Другую группу составляют устройства, в которых перед принятием решения осуществляется выделение в распознаваемом изображении информативных признаков (например гармоники). В составе этих устройств обычно имеется блок хранения эталонных значений информационных признаков различных классов. В некоторых устройствах этой группы предусмотрен специальный режим обучения, предназначенный для записи вычисляемых значений информативных признаков в соответствующий блок.

Способы формирования шаблонов на основе информативности элементов

Как указывалось в главе 1, шаблоном называется множество наиболее информативных элементов эталонного изображения. Предложенная в разделе 2.1 оценка информативности элементов эталонных изображений делает возможным разработку способов формирования шаблонов, состоящих из наиболее информативных элементов.

Другим важным критерием, который должен быть учтен при формировании шаблонов является обеспечение их «равнопрочности». «Равнопрочными» станем называть такие шаблоны, которые обеспечивают равную (или почти равную) вероятность правильного распознавания реализаций каждого класса. Количественной оценкой «равнопрочности» может служить среднее квадратическое отклонение оценки вероятности правильного распознавания реализаций классов.

Далее рассмотрим возможные варианты способа формирования шаблонов на основе оценки информативности элементов эталонных изображений.

Первый вариант способа формирования шаблонов состоит в том, чтобы включить в шаблон все элементы информативность которых не меньше некоторого, наперед заданного, порогового значения. Т. е., при использовании этого способа, шаблон г-го класса можно определить как Mi = U дц д }, (2.43) где МІ — шаблон г-го класса, а дт\п — пороговое значение.

Недостатком этого, по-видимому, самого простого варианта является то, что сформированные шаблоны могут оказаться очень «неравнопрочными». Произойдет это в том случае, если количество элементов с наибольшими информативностями в разных эталонных изображениях различно. Это приведет к тому, что количество элементов в соответствующих шаблонах тоже будет различно. Поскольку, предположительно, шаблоны, содержащие меньшее количество элементов обеспечивают меньшую вероятность правильного распознавания, то наличие в каком-либо эталонном изображении меньшего (по сравнению с другими эталонными изображениями) количества элементов с информативностью большей или равной пороговой будет приводить к снижению вероятности правильного распознавания реализаций соответствующего класса, т. е. к снижению «равнопрочности» всей совокупности шаблонов.

Попытаться устранить указанный недостаток можно, если сформировать шаблоны так, чтобы количество элементов к каждом из них было одинаково.

Второй вариант способа формирования шаблонов состоит в том, чтобы включить в каждый шаблон одинаковое, наперед заданное, количество наиболее информативных элементов соответствующего эталонного изображения. Т. е. во втором способе формирования шаблонов ограничивающим фактором становится не информативность элемента, а количество элементов в шаблоне.

Второй вариант способа формирования шаблонов может быть реализован следующим алгоритмом.

Входные данные: п — количество классов, т — количество элементов в эталоне, gij — информативность j-ro элемента г-го класса, I — количество элементное в шаблоне. Выходные данные: М» — шаблон г-го класса. Временные переменные: г, j, к, и — счетчики. for г Є {1,2,..., п} do МІ -0 for и Є {1,2,..., 1} do for/гє {2,3,...,m} do if 9ik gij then j -k end if end for м,«-м«и{# end for end for

Несмотря на то, что второй вариант обеспечивает построение более «равнопрочных» шаблонов по сравнению с первым вариантов, существует возможность дальнейшего улучшения. Дело в том, что, хотя общее количество элементов в каждом шаблоне будет одинаковым, количество элементов обладающих каждым конкретным значением информативности может быть разным. Так, в частности, может оказаться, что любой элемент одного шаблона более информативен чем любой элемент другого шаблона. По сути, второй вариант способа формирования шаблонов рассматривает все шаблонные элементы как «равнополезные» для распознавания, а при формировании шаблонов не учитывает абсолютные значения информативностей.

Попытаться улучшить «равнопрочность» шаблонов можно если при формировании шаблонов учитывать абсолютные значения информативностей элементов эталонных изображений.

Третий вариант способа формирования шаблонов состоит в том, чтобы включить в каждый шаблон такое количество наиболее информативных элементов, чтобы суммы информативностей этих элементов в каждом шаблоне были равны (или почти равны). При этом общее количество элементов во всех шаблонах должно быть равно, некоторой, наперед заданной, величине. Количество же элементов каждом шаблоне в отдельности может различаться. Таким образом, третий вариант позволяет «компенсировать» отсутствие в эталонном изображении необходимого количества высокоинформативных элементов ббльшим количеством несколько менее информативных элементов.

Третий вариант способа формирования шаблонов может быть реализован следующим алгоритмом. Входные данные: п — количество классов, т — количество элементов в эталоне, дц — информативность j-ro элемента г-го класса, / — общее количество шаблонных элементнов. Выходные данные: М — шаблон г-го класса.

Результаты моделирования

С целью экспериментального исследования способа построения шаблонов предложенного в главе 2 при помощи вышеописанной программы было проведено моделирование процесса распознавания изображений текстовых знаков.

В качестве знаков в процессе моделирования использовались цифры от «О» до «9», представленные черно-белыми изображениями размером 24 х 12 пикселя, взятые из шрифтов Ариэль (Arial), Курьер (Courier) и Таймз (Times). Один из использовавшихся наборов эталонных изображений представлен на рис 3.1.

Также, для сравнения, проводилось моделирование распознавания образов с использованием шаблонов сформированных с помощью способа, основанного на использовании спинового стекла.

В ходе моделирования изменению подвергались два параметра: общее количество шаблонных элементов (только для распознавания по шаблонам, формируемым предлагаемым способом); уровень шума.

Как указывалось выше, непосредственно перед проведением моделирования распознавания программа производит формирование шаблонов в соответствии с указанными параметрами. Основой для формирования шаблонов являются вычисленные показатели информативности. На рис. 3.2 представлена информативность элементов эталонных изображений, вычисленная программой моделирования.

После вычисления показателя информативности программой моделирования были сформированы шаблоны. При формировании шаблонов суммарное количество элементов в ша блонах задавалось равным от 60 до 240 с шагом 60 элементов. На рис. 3.3 - 3.6 представлены шаблоны сформированные программой моделирования из соответствующего количества элементов.

Результаты моделирования распознавания образов с использованием шаблонов из 60, 120, 180 и 240 элементов приведены в таблицах 3.1 - 3.4, соответственно.

По результатам, приведенным в табл. 3.1 - 3.4 были построены графики зависимости вероятности правильного распознавания от интенсивности шума при различном количестве шаблонных элементов. Названные графики приведены на рис 3.7.

Результаты моделирования показывают, что шаблоны из 120 элементов обеспечивают правильное распознавание почти всех классов с вероятностью 1 при уровне шума до 0,1, а из 240 элементов — при уровне шума до 0,2. Также можно установить, что при использованием шаблонов из 180 элементов правильное распознавание с вероятностью 0,9 обеспечивается при уровне шума до 0,3, а при использовании шаблонов из 240 элементов — при уровне шума до 0,4.

Также было проведено моделирование распознавания с использованием шаблонов сформированных с использованием спинового стекла, при этом общее количество шаблонных элементов составило 274, 219 и 240 для наборов эталонов, полученных из шрифтов Ариэль, Курьер и Таймз, соответственно. Для сравнения было проведено моделирование распознавания с использованием предлагаемого метода для того же общего количества шаблонных элементов. Полученные результаты представлены в таблицах 3.5 и 3.6 и на рис. 3.8.

Результаты моделирования показывают, что использование шаблонов, сформированные по предлагаемому способу позволяет при уровне шума до 0,45 - 0,55 (в зависимости от набора эталонов) повысить вероятность правильного распознавания образов по сравнению с шаблонами, сформированными с использованием спинового стекла. В частности при уровнях шума не превышающих 0,3 предложенный способ, по сравнению с использованием спинового стекла, позволяет сократить количество ошибок распознавания более чем в 2 раза, а при уровнях шума не превышающих 0,4 — в 1,5 раза.

На рис. 3.9 приведен график зависимости среднего квадратического отклонения вероятностей правильного распознавания изображений различных символов.

Из представленных графиков видно, что предлагаемый способ по сравнению со способом, использующим спиновое стекло, при всех уровнях шума обеспечивает меньшее среднее квадратическое отклонение вероятности правильного распознавания изображений текстовых знаков, т. е. лучше соответствует критерию «равнопрочности».

Зависимость среднего квадратического отклонения оценки вероятности правильного распознавания от уровня шума для шаблонов, построенных с использованием спинового стекла (сплошная линия) и с использованием энтропийных характеристик (штрихи). спинового стекла, можно отметить, что еще одним преимуществом первого является возможность варьировать количество шаблонных элементов, а значит и время, затрачиваемое на распознавание.

1. Разработаны алгоритмы моделирования, дающие возможность экспериментальной проверки предложенного способа формирования шаблонов.

2. Реализовано численное моделирование формирования шаблонов в соответствии с предложенным способом.

3. Осуществлено моделирование формирования шаблонов по предложенному способу и распознавание с использованием этих шаблонов, а также моделирование распознавания с использованием шаблонов, сформированных при помощи способа, основанного на использовании спинового стекла.

4. Проведен анализ результатов моделирования, позволивший установить, что предлагаемый способ формирования шаблонов позволяет снизить вероятность ошибки распознавания в 1,5-2 раза по сравнению со способом, основанным на использовании спинового стекла.

Похожие диссертации на Устройство распознавания изображений текстовых знаков по энтропийным характеристикам