Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях Ла Суан Тханг

Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях
<
Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ла Суан Тханг. Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях : диссертация ... кандидата технических наук : 05.13.06 / Ла Суан Тханг; [Место защиты: Моск. гос. автомобил.-дорож. ин-т (техн. ун-т)]. - Москва, 2008. - 210 с. : ил. РГБ ОД, 61:08-5/1064

Содержание к диссертации

Введение

1. Обзор систем документооборота 10

1.1. Система электронного документооборота как элемент управления предприятием 10

1.2. Основные задачи, решаемые системами документооборота 15

1.3. Общая классификация систем документооборота 16

1.4. Сравнительный анализ систем документооборота 18

Выводы по главе 1 40

2. Подход к построению систем распознавания рукописного текста 41

2.1. Основные виды задач распознавания рукописного текста 41

2.2. Подходы к решению задач распознавания рукописного текста 44

2.3. Сверточная нейронная сеть в применении к распознаванию отдельных символов 49

2.3.1. Новый подход к построению систем распознавания рукописных символов 50

2.3.1. Новый подход к построению систем распознавания рукописных символов 50

2.3.2. Модель СНС, используемой в распознавании рукописных символов 54

2.4. Обучение системы на основе данных 66

Выводы по главе 2 19

3. Эксперимент с системами распознавания рукописных символов 80

3.1. Сбор данных для обучения 80

3.2. Реализация системы распознавания рукописных текстов 83

3.3. Интерфейс программы 89

3.4. Результаты экспериментов 94

3.4.1. Эксперимент с системой СНС РТ 94

3.4.2. Сравнение с другими классификаторами 97

3.5. Инвариантность или устойчивость системы к шумам 107

Выводы по главе 3 109

4. Внедрение СЭД на промышленном предприятии 110

4.1. Характеристики КИС в промышленных предприятиях 110

4.2. Современная модель управления информационными потоками предприятия и роль СУД в КИС 114

4.3. Выбор Docs Vision как комплексная программная платформа для автоматизации процессов управления, документооборота и для создания интегрированных приложений 117

4.4. Методология внедрения автоматизированных систем управления документами 136

4.4.1. Этапы работ по внедрению системы управления документами 136

4.4.2.Модели методологии внедрения системы автоматизации документооборота Docs Vision 138

4.5. Внедрения системы Docs Vision в ТД «Роллтон» 156

4.5.1. Общие сведения об объекте 156

4.5.2. Типичные бизнес-процессы документооборота в ТД «Роллтон» и ЗАО «DHV-S», подлежащие автоматизации с помощью системы Docs Vision 157

4.6. Результаты внедрения системы документооборота Docs Vision в ТД «Роллтон» 157

4.6.1 Показательные данные результатов процесса внедрения системы автоматизации документооборота в ТД «Роллтон» 157

4.6.2. Техническое описание внедренной системы в ТД «Роллтон» 169

Выводы по главе 4 175

Заключение 176

Литература 177

Введение к работе

Актуальность проблемы

Управленческая, производственная, хозяйственная деятельность предприятия тесно связаны с обработкой и хранением значительных объемов документов: руководящих, отчетных, информативных и т.д. По этой причине особую актуальность приобретает использование на предприятиях систем электронного документооборота (СЭД), позволяющих значительно сократить временные и финансовые затраты предприятия на организацию бизнес-процессов документооборота, а также, в большинстве случаев, разработать и легко осуществить мероприятия по их оптимизации.

В 2007 году рынок СЭД в России превысил 170 млн. долларов США. Рынок демонстрирует стабильную динамику роста. CAGR 2005/2004 составлял более 50%, а 2006/2005 - несколько ниже, в 2007 году темп роста составил 20%.

В составе систем автоматизации документооборота обязательно присутствуют средства ввода бумажных документов, естественно, путем сканирования. Задача распознавания произвольного рукописного текста является актуальной сегодня, и проблема не будет закрыта в ближайшие десятилетия. Задача распознавания рукописных текстов (PPT) как научная проблема и как информационная технология находится на подъеме, благодаря большому интересу к этой области в коммерческих кругах, среди компьютерных компаний, в научном сообществе.

Предметом исследования являются система электронного документооборота (СЭД) на промышленных предприятиях, а также ее составляющая - система автоматического ввода данных.

Цель и основные задачи исследования

Целью работы является повышение эффективности функционирования СЭД на промышленных предприятиях за счет создания методики комплексного анализа, внедрения СЭД, а также усовершенствования системы ввода данных в СЭД.

Для достижения данной цели в работе решаются следующие задачи:

    1. Сравнительный анализ систем документооборота в России.

    2. Исследование методов распознавания рукописных текстов.

    3. Разработка модели нейронной сети распознавания рукописных символов.

    4. Разработка алгоритма для ускоренного обучения нейронной сети.

    5. Разработка программы для распознавания рукописных цифр.

    6. Методы выбора и внедрения систем документооборота на промышленных предприятиях среднего размера.

    Методы исследования

    При разработке формальных моделей компонент в диссертации использовались модели нейронных сетей, градиентные методы обучения нейронной сети, методы математического программирования, теория вероятностей и др.

    Научная новизна работы состоит в разработке методов, моделей, алгоритмов и стратегий построения системы распознавания рукописных текстов в качестве системы автоматического ввода данных для СЭД, а также методики комплексного анализа и внедрения СЭД на промышленных предприятиях.

    На защиту выносятся:

    Методика сравнительного анализа систем документооборота

    по функциональности, стоимости и др.

    Модели интеграционных корпоративных информационных систем, систем электронного документооборота и жизненного цикла документов на предприятии.

    Результаты классификации и исследования методов обработки документов.

    Модель нейронной сети для распознавания рукописных текстов.

    Алгоритм ускоренного обучения нейронных сетей с большим количеством весовых коэффициентов.

    Разработанная программа распознавания рукописных текстов и результаты экспериментов.

    Достоверность научных положений, рекомендаций и выводов

    Обоснованность научных положений, рекомендаций и выводов определяется предварительным анализом работы системы распознавания рукописных цифр, согласованностью результатов предложенных модели нейронной сети и алгоритма обучения сети. Достоверность положений и выводов диссертации подтверждена положительными результатами внедрения положений работы на крупном промышленном предприятии, занимающимся производством продуктов быстрого приготовления.

    Практическая ценность и реализация результатов работы

    Научные результаты, полученные в диссертации, доведены до практического использования. Они представляют непосредственный интерес в области распознавания и системной интеграции. Методы и алгоритмы, а также программные средства могут быть использованы при решении задач построения систем автоматического ввода данных. Разработанные методы и алгоритмы прошли апробацию и внедрены для практического применения на предприятиях ТД «Роллтон», ЗАО «DocsVision», а также используются в учебном процессе на кафедре АСУ МАДИ(ГТУ).

    Апробация работы

    Содержание отдельных разделов и диссертации в целом было доложено и получило одобрение:

    на заседании кафедры АСУ МАДИ (ГТУ);

    на конференциях в области автоматизации документооборота (2006г.-2008г.).

    Система электронного документооборота как элемент управления предприятием

    В эпоху информационных технологий одним из важнейших инструментов руководителя при реализации планов стратегического развития становится информационный капитал. Это не просто набор технических и программных средств, состоящий из систем, баз данных, библиотек, сетей и пр. Информационный капитал делает информацию и знания доступными для всех сотрудников компании.

    Но в отличие от других видов капитала информационный имеет ценность только в рамках реализуемой стратегии, и одна из важнейших задач при построении информационного капитала — его соответствие целям и задачам стратегического развития компании в целом.

    Прежде всего, необходимо понимать и представлять структуру управления компанией. Простейшая ее модель приведена на рисунке 1.1.

    Автоматизации подлежат следующие процессы управления:

    процесс подготовки плана работ, который бывает многоступенчатым и требует предварительного сбора информации, многократных согласований, визирования и утверждения;

    процесс передачи информации об инициации деятельности. Все подразделения организации нуждаются в информации для функционирования — где, что и как делать. Информация должна быть точной и своевременной, поэтому управляющее воздействие должно поступать в систему максимально быстро и с минимальными информационными потерями;

    процесс сбора информации о ходе выполнения приказов и поручений, о ходе основной деятельности (все ли делается из того, что нужно сделать?);

    процесс сбора данных о результатах деятельности организации, передача их «управляющему системой», передача управляющего воздействия, выработанного по результатам анализа полученной информации, на вход системы. Анализ может производиться по-разному в зависимости от поставленных целей: есть ли прибыль, расширяется ли производство, довольны ли клиенты, хватает ли ресурсов для выполнения заказов и прочее.

    Информационные системы выполняют следующие функции:

    передачу транзакций при выполнении рутинных операций (действия внутри управляемой системы);

    передачу информации о состоянии управляемой системы в управляющий орган и ее анализ (аналитические системы);

    управление организационными изменениями — системы, изменяющие бизнес-процессы (трансформационные системы).

    Основной метод управления, используемый в настоящее время, — документациопный, поэтому в обеспечении качественного управления все большую роль начинают играть системы электронного документооборота (СЭД). СЭД могут взять на себя часть вышеперечисленных функций.

    В частности, система электронного документооборота реализует все функции оперативного управления — передачу информации по всем каналам (прямому и обратному), передачу документов и всей необходимой информации в ходе основной деятельности, передачу информации о результатах в аналитические системы.

    Основное преимущество СЭД — ее способность работать в качестве трансформационной системы, которая может изменять текущие бизнес-процессы организации. Это осуществляется на уровне настроек системы, ее масштабирования в зависимости от изменения производственной структуры, количества рабочих мест и территориальной распределенности — в отличие от других систем, где перенастройка осуществляется на уровне программного кода.

    Фактически СЭД создает основной контур управления, на базе которого может быть построена структура управления, включающая все нужные информационные системы. Специфика реализации стратегии ложится на аналитические приложения, которые включаются в основной контур управления совместно с СЭД. Например, организация, реализующая стратегию снижения полных затрат, получит высочайшую отдачу от информационных систем, которые сфокусированы на улучшении качества, совершенствовании процессов, повышении производительности труда. Стратегия решения для клиентов имеет наибольший выигрыш от сведений об их предпочтениях и поведенческих стереотипах, а также о данных, которые укрепляют связи с заказчиками, улучшают обслуживание и способствуют сохранению клиентской базы. При стратегии лидерства продукта требуется информация для разработки новых товаров и услуг и поддержки процессов развития с помощью таких средств, как трехмерная компьютерная графика, виртуальное моделирование системы проектирования. Помимо создания общего контура передачи информации, СЭД повышает качество общего оперативного управления.

    Модель СНС, используемой в распознавании рукописных символов

    Общая архитектура сети:

    Для обеспечения некоторого уровня инвариантности к искажению и деформации входных распознаваемых образов, СНС объединяют в себе 3 особенности:

    локальные рецепторные поля (обеспечивают локальную двумерную связность нейронов).

    общие веса (обеспечивают детектирование некоторых черт в любом месте изображения и уменьшают общее число весовых коэффициентов).

    иерархическая организация с пространственными подвыборками.

    Центрированное и нормированное изображение поступает на входной слой. Каждый нейрон в плоскости получает входной сигнал из области, которая находится "по соседству" на плоскости предыдущего слоя. Веса нейронов устанавливаются одинаковыми. Каждая плоскость может рассматриваться как карта особенностей или карта значений.

    Множество плоскостей всегда присутствует в каждом слое, поэтому слои называются сверточными.

    Типичная сверточная сеть, используемая для распознавания символов, прозванная СНС_РТ, показана на рисунке 2.4. На входе она принимает изображения или текстовую информацию, которая в какой-то мере уже выровнена и центрирована. Каждый нейрон в одной плоскости на данном слое получает информацию от нескольких ближайших нейронов с предыдущего слоя.

    С помощью рецептивных полей, нейроны могут извлекать элементарные визуальные характеристики, такие как дуги, граничные точки, углы (или аналогичные типы сигналов наподобие речевых спектрограмм). Эти характеристики затем обрабатываются последующими слоями в порядке выделения все более сложных деталей. Как было показано ранее, искажение или сдвиг входного сигнала может привести к различным вариациям характерных особенностей.

    Характерные особенности изображения могут быть выявлены в результате работы совокупности плоскостей, рецептивные поля которых расположены в различных частях изображения. Нейроны на каждом слое объединены в плоскости, при этом все нейроны в одной плоскости выделяют одинаковую совокупность весовых коэффициентов. Такая плоскость называется характеристической картой. Все нейроны характеристической карты призваны выполнять одинаковые операции над разными частями изображения. Весь сверточный слой состоит из нескольких характеристических карт (с различными векторами весовых коэффициентов), так что многочисленные характеристики могут быть обработаны в одном месте. Конкретный пример - первый слой системы СНСРТ показанной на рисунке 2.6. Нейроны на первом слое СНСРТ сгруппированы в 6 плоскостей, каждая из которых представляет собой характеристическую карту.

    Каждому нейрону соответствует поле чувствительности, состоящее из матрицы 5x5 сенсорных узлов. Эти поля называются рецептивными. Каждый нейрон имеет 25 входов и, следовательно, 25 обучаемых коэффициентов, плюс 1 настраиваемый коэффициент порога.

    Как было сказано ранее, все нейроны характеристической карты имеют общие 25 весовых коэффициентов и общий настроечный коэффициент ошибок и, таким образом, могут аналогично определить схожие детали во всех возможных положениях входного образа. Различные характеристические карты текущего слоя используют различные весовые коэффициенты и настраиваемые коэффициенты порога, поэтому выделяют различные характерные особенности входного шаблона. В случае CHCJPT, в каждой части входного изображения шесть различных признаков выделяются шестью характеристическими картами.

    Интересным свойством сверточных слоев является то, что если входное изображение окажется смещено или искажено, то результат обработки характеристической карты будет несколько сдвинут, но останется неизменным. Это свойство обеспечивает устойчивость сверточных сетей по отношению к сдвигам и искажениям входного шаблона.

    Если какая-то особенность была однажды выявлена, ее точное положение становится не столь важно. Только ее расположение по отношению к другим признакам имеет значение. К примеру, зная, что входное изображение содержит граничную точку некоего горизонтального сегмента в левой верхней части, угол в правом верхнем углу изображения и граничную точку некоего вертикального сегмента в нижней части изображения, то мы можем определить, что это изображение цифры «7». Точное расположение каждого из вышеупомянутых признаков не только безразлично для идентификации содержимого данного изображения, но и наоборот усложняет ее, ибо местоположения данных признаков могут варьироваться. Наиболее простой способ снизить точность определения излишних деталей, преобразуемых характеристической картой, это уменьшение разрешения характеристической карты. Это может быть достигнуто с помощью слоев подвыборки, которая осуществляет локальное усреднение, дискретизацию и снижение разрешения характеристической карты и, таким образом, снижает чувствительности системы к сдвигам и искажениям входного сигнала. Второй скрытый слой системы СНС_РТ представляет собой слой подвыборки. Этот слой включает в себя шесть характеристических карт, по одной для каждой характеристической карты предыдущего слоя. Рецептивное поле каждого нейрона данного слоя представляет собой квадрат размером 2 на 2 в соответствии с характеристической карты предыдущего слоя. Каждый нейрон определяет некоторые усредненные величины входных данных со своих четырех входов, умножает их на обучающий весовой коэффициент, добавляет величину настроечного коэффициента порога, и пропускает результат через сигмоидальную функцию. Характеристическая карта слоя подвыборки имеет вдвое меньше строк и столбцов чем характеристическая карта предыдущего слоя.

    Характеристики КИС в промышленных предприятиях

    Новая экономическая ситуация ставит перед предприятиями ряд задач, которые ранее ими не рассматривались. Среди наиболее важных задач, стоящих перед промышленными предприятиями в современных условиях, можно выделить:

    повышение конкурентной борьбы;

    требование выпускать продукцию в соответствии с текущими заказами покупателей, а не с долгосрочными перспективными планами;

    необходимость оперативного принятия решений в сложной экономической ситуации;

    укрепление связей между поставщиками, производителями и покупателями.

    В конкурентной борьбе побеждает только тот, кто быстрее других реагирует на изменения в бизнесе и принимает более верные решения. Именно информационные технологии помогают руководителям промышленных предприятий в решении этих сложных задач.

    Современные информационные системы являются сложными интегрированными комплексами, которые включают в себя модули, отвечающие практически за все механизмы работы современного предприятия. Информационная система - это набор механизмов, методов и алгоритмов, направленных на поддержку жизненного цикла информации и включающих три основных процесса: обработку данных, управление информацией и управление знаниями.

    С точки зрения программных технологий, информационная система -это не один, и даже не несколько программных комплексов. Можно построить структурную модель информационной системы (см. рис.4.1), выделив ее основные компоненты, которые содержат программные модули определенного класса.

    Корпоративная информационная система строится как единый комплекс программно-технических и организационных решений, охватывающих все производственные, технологические, финансовые и хозяйственные процессы и объединяя все подразделения корпорации в единое информационное пространство.

    Система должна обладать открытой модульной структурой. Это, во-первых, позволяет максимально эффективно решать весь спектр задач, стоящих перед каждой конкретной компанией, обеспечивать гибкую настройку создаваемой системы в зависимости от условий и вида деятельности (переработка, транспортировка и реализация продукции). Во-вторых, оптимизируются затраты на внедрение этого решения за счет поэтапной реализации проекта и максимального использования уже существующих у компании информационных систем и их компонентов.

    Круг конкретных задач, решаемых в результате создания современной информационной системы, включает:

    объединение в единое информационное пространство большого числа территориально удаленных друг от друга объектов и подразделений компании;

    высокоскоростную передачу по каналам связи любых видов информационных потоков;

    поддержку деятельности всех подразделений и объектов корпорации;

    автоматизацию всех технологических и бизнес-процессов компании, оперативный контроль и управление процессами производства, транспортировки и сбыта, взаиморасчетов с потребителями и поставщиками, управление персоналом и т.д.;

    мощные средства обработки и анализа получаемой информации, расчет плановой и фактической себестоимости продукции;

    обеспечение необходимого уровня безопасности и защиты информационных ресурсов корпорации.

    Главным итогом внедрения корпоративной информационной системы должно явиться создание в корпорации эффективного и действенного механизма управления, охватывающего бизнес-процессы - финансово-производственные, технологические, маркетинг, продажи и т.д. В результате этого корпорация выходит на качественно новый уровень управления и планирования своей деятельности.

    Техническое описание внедренной системы в ТД «Роллтон»

    На рис. 4.17 представлена схема построения системы Docs Vision в ТД Роллтон.

    все данные хранятся в базе данных, находящейся под управлением Microsoft SQL Server 2005;

    сервер Docs Vision (сервер приложения) реализован на платформе .NET и базируется на Internet Information Server 5.0;

    полнофункциональное клиентское рабочее место, реализованное как приложение Windows и базирующееся на Internet Explorer;

    клиентское рабочее место с минимальной функциональностью, реализованное как дополнение к программе Microsoft Outlook.

    В качестве системы OCR используются сетевые скансерверы RICOH AFICIO MP 2000LN и система распознавания ABBYY FineReader 8.0 Corporate Edition

    Операционная система

    Microsoft Windows 2003 Server (Standard, Enterprise или DataCenter Edition) с установленной службой Internet Information Services (IIS) и поддержкой ASP.NET. Для активизации обоих компонентов достаточно включить роль «Сервер приложений» (Application server) при помощи «Мастера настройки сервера» (Manage Your Server).

    Допустима также установка системы DocsVision на Microsoft Windows 2000, Windows ХР - однако технические особенности функционирования компонентов ASP.NET и IIS с этими операционными системами существенно снижают производительность работы.

    Основное программное обеспечение

    Microsoft .NET Framework 2.0

    Сервер баз данных: Microsoft SQL Server 2000 (Standard, Enterprise или Developer Edition) с установленным Service Pack 4 и службой полнотекстового поиска (Fullext Search); или Microsoft SQL Server 2005 (Standard, Enterprise или Developer Edition). Сервер баз данных может быть установлен на другом компьютере (это рекомендуемый режим для создания более производительных конфигураций).

    Набор компонентов «Объекты совместной работы» (CDO — Collaborative Data Objects). Установить CDO можно при помощи пакета установки Microsoft Office (входит в состав компонента Microsoft Outlook).

    Для настройки почтовых профилей требуется Microsoft Outlook (только если сервер не устанавливается на компьютер вместе с Microsoft Exchange).

    Дополнительное программное обеспечение

    Доступ к домену ActiveDirectory. Доступ пользователей в базу DocsVision осуществляется в соответствии с их правами, определяемыми на основе доменных или локальных учетных записей. Установка в домене предпочтительнее, так как при этом права на вход в систему и доступ к ее объектам могут конфигурироваться с использованием существующих учетных записей (NTLM-аутентификация).

    В случае если сервер DocsVision и клиентские машины входят в разные домены, требуется наличие доверительных отношений между этими доменами. В противном случае, автоматическая (NTLM) аутентификация будет невозможна, и потребуется явный ввод имени пользователя и пароля при входе в систему (при этом дополнительные приложения DocsVision, такие как Личный Помощник или Панель инструментов для Microsoft Office, необходимо будет сконфигурировать отдельно).

    Допускается установка без домена, в этом случае будет использоваться явная аутентификация (ввод имени пользователя и его пароля при входе в DocsVision). С другой стороны, если на серверном компьютере определены локальные учетные записи, имя и пароль которых совпадает с именем и паролем пользователя на клиентском компьютере, то и в этом случае возможна автоматическая аутентификация пользователей.

    Доступ к Microsoft Exchange 5.5 или выше необходим для работы с сообщениями, поступающими от бизнес-процессов приложения «Управление процессами» и маршрутизации писем и заданий приложения «Делопроизводство»

    Если предполагается централизованная установка форм offline-заданий на сервер Microsoft Exchange, то необходимо наличие компонента Поддержка сценариев Visual Basic (Visual Basic Scripting Support), установить который можно при помощи пакета установки Microsoft Office (компонент Microsoft Outlook).

    Для полнотекстового поиска по формам русских слов требуется установка дополнительного программного обеспечения, например ALESTA Search For BackOffice фирмы Алеста.

    Система поддерживает полнотекстовый поиск по файлам Microsoft Office. Для полнотекстового поиска по файлам других форматов требуются расширения службы Microsoft Indexing Service в формате IFilter, например:

    Microsoft Visio IFilter 2003

    Adobe Acrobat PDF IFilter

    Конфигурация оборудования

    Платформа: Dell РЕ 2950

    Оперативная память: 16 ГБ

    Процессор: Xeon Duo 3.4

    Дисковая подсистема: 200Гб. 4-дисковая подсистема для организации RAID 1 для хранения данных.

    Похожие диссертации на Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях