Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Куликов Александр Анатольевич

Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица
<
Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Страница автора: Куликов Александр Анатольевич


Куликов Александр Анатольевич. Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица: диссертация ... кандидата технических наук: 05.13.11 / Куликов Александр Анатольевич;[Место защиты: Московский государственный институт радиотехники, электроники и автоматики (технический университет)].- Москва, 2014.- 322 с.

Содержание к диссертации

Введение

Глава I. Аналитический обзор методов, алгоритмов и программных средств распознавания лица 8

1.1.Основные классы решаемых задач связанных с идентификацией личности 8

1.2. Анализ существующих методов распознавания человека по изображению лица .11

1.3.Программные средства распознавания лицевых изображений 27

1.4.Сравнительный анализ методов распознавания лицевых изображений. Постановка задачи диссертационного исследования. 32

Глава II. Развитие методов и алгоритмов распознавания человека по изображению лица . 40

2.1.Необходимость исследования и доработки алгоритмов распознавания применительно к изображению лица. 40

2.2. Принципы поэтапного распознавания лица 41

2.3. Разработка модифицированного метода распознавания на основе эластичного графа применительно к распознаванию лица. Введение понятия джета . 43

2.4.Разработка алгоритма хранения и поиска данных для идентификации лица. Разработка типовой структуры организации информационного хранилища ключевых признаков лицевых изображений. 55

2.5.Краткие выводы по главе II 69

Глава III. Применение нейросетевого подхода в задаче распознавания лицевого изображения . 69

3.1.Алгоритм обучения нечеткой нейронной сети NEFClass 69

3.2. Проведение экспериментов с нейронной сетью NEFClass применительно к распознаванию человека по изображению лица 75

3.3.Иccлeдoвания влияния oцeнки cтeпeни сжaтия изoбражения лица на результат идентификации для контрольно пропускной системы. 82

3.4.Разработка алгоритма обучения модифицированной нейронной сети NEFClass M для введенного понятия джета. 90

3.5. Проведение экспериментов с нейронной сетью NEFClass М применительно к распознаванию человека по изображению лица 96

3.6.Разработка типовой структуры контрольно-пропускной системы для автоматической видео идентификации. 101

3.7.Разработка программного обеспечения обработки изображения лица и описание интерфейса системы идентификации лиц для обучения и настройки системы 107

3.8.Краткие выводы по главе III 113

Заключение 114

Литература 118

Введение к работе

Актуальность исследования. Системы идентификации личности используются в автоматизированных системах безопасности для управления контрольно-пропускной системой (КПС), в различных общественных местах с различными целями. Поиск и идентификация личности обычно проводится с использованием таких данных как фамилия, имя, отчество, дата рождения и др. Такие системы имеет высокую скорость, но не лишены недостатков, главным из которых является возможность получения доступа по подложным документам. Альтернативой этому варианту поиска является метод идентификации личности по лицевому изображению.

Сложившиеся подходы к идентификации человека по изображению лица практически устоялись. Актуальными задачами остаются улучшение точностных и временных характеристик существующих методов, алгоритмов и программных средств идентификации. Дальнейшее развитие систем распознавания лица, является создание подсистем набора из видеоряда, формируемой, путем считывания информации с видеокамер изображений лиц, а так же создание комплекса систем интерфейсов. В дальнейшем этот набор можно использовать в качестве входной информации для системы идентификации.

Задаче распознавания лицевых изображений посвящено большое количество публикаций, однако в целом она ещ остается далкой от разрешения. Основные трудности метода идентификации личности состоят в том, что система должна распознавать человека по изображению лица независимо от изменения условий освещнности, изменения ракурса, а так же при различных других внешних изменениях лица. Кроме того не решены такие задачи как оценка сжатия изображения для снижения необходимого объема на вероятность распознавания, специальных алгоритмов сохранения и поиска ключевых признаков изображения и др.

Объект исследования: Человеко-машинные интерфейсы обработки

изображений в системах автоматической видео идентификации для

предоставления индивидуального доступа по изображению лица в

контрольно-пропускных системах.

Предмет исследования: Предмет исследования определен предметной областью №7 паспорта специальности 05.13.11, «Человеко-машинные интерфейсы: модели, методы, алгоритмы и программные средства обработки изображений», а так же перечнем задач решаемых в диссертации.

Цель работы. Целью работы является развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица с целью построения контрольно-пропускной системы (КПС), а так же разработка программного интерфейса, позволяющий настраивать и обучать КПС. Для достижения этой цели в работе ставятся следующие задачи:

  1. Модифицировать метод эластичного графа, позволяющий повысить эффективность распознавания лицевых изображений. Ввести коэффициент джета в общую формулу определения меры подобия графов в алгоритме эластичного графа;

  2. Разработать модифицированный алгоритм обучения нейронной сети NEFCLass, позволяющий повысить надежную идентификацию лица;

  3. Определить допустимую степень сжатия изображения лица, для уменьшения объема хранимой информации;

  4. Разработать типовую структуру, алгоритмы и программное обеспечение для контрольно-пропускной системы (КПС), производящей автоматическую видео идентификацию для предоставления индивидуального доступа по изображению лица;

  5. Разработать алгоритм хранения и оперативного поиска данных о персоне в базе данных. Разработать типовую структуру организации информационного хранилища позволяющего хранить необходимо-большой объем данных;

  1. Разработать программное обеспечение, позволяющее автоматически производить видео идентификацию личности по изображению лица;

  2. Разработать программный интерфейс, позволяющий настраивать и обучать контрольно-пропускную систему.

Методы исследования. Для решения поставленных задач, применялись методы объектно-ориентированного программирования, вычислительной математики, теории распознавания образов, разработки и обучения нейронной сети, математического моделирования.

Научная новизна работы состоит в следующем:

  1. Разработан модифицированный метод распознавания на основе эластичного графа, позволяющий повысить качество распознавания лицевых изображений. Введен коэффициент вклада джета в общую формулу определения меры подобия графов в алгоритме эластичного графа, позволяющий увеличить вероятность распознавания в среднем на 5-7%;

  2. Разработан алгоритм хранения и поиска данных о персоне в базе данных позволивший повысить скорость идентификации; Разработана типовая структура информационного хранилища ключевых признаков изображения, позволяющая хранить необходимо-большой объем ключевых признаков;

  3. Определенна стeпeнь cжaтия изoбpaжeния для применения в системе идентификации лиц. Показано, что приемлемо допустимый уровень сжатия изображения составляет 25%, при этом необходимый объем хранимой информации снижается в 7 раз;

  1. Разработан алгоритм обучения модифицированной нейронной сети NEFCLass M. Как показал эксперимент, из исследуемых алгоритмов нейронная сеть NEFClass M наиболее эффективно решает задачу распознавания лицевых изображений;

  2. Разработан алгоритм идентификации и поиска данных о персоне в

базе данных. Основным отличием алгоритма являются: отсутствие

необходимости вычисления меры подобия при поиске, отсутствие атрибута (признака) поиска, возможность работы в реальном масштабе времени, работа при неполной априорной информации о лицевом изображении. Практическая ценность работы состоит в том, что в ней:

1. Разработан алгоритм организации хранения и поиска информации, а

так же определен минимальный набор ключевых признаков;

2. Разработано прикладное программное обеспечение позволяющее
производить автоматическую видео идентификацию личность по
изображению лица;

3. Установлен максимально допустимый уровень сжатия изображений,

при их обработке в алгоритме эластичного графа.

4. Научные положения диссертации внедрены в практические разработки.
Личный вклад. Все результаты работы, вынесенные на защиту,

получены автором лично.

Реализация и внедрение. На основе полученных в работе научных
результатов, разработана контрольно-пропускная система для

идентификации персонала по изображению лица, которая внедренная в ООО «Эврика Тревел» и в ООО Консультационный центр «Простые решения». Имеются акты о внедрении системы.

Достоверность научных положений, выводов и практических
рекомендаций, полученных в диссертации, подтверждается корректным
обоснованием постановок задач, точной формулировкой критериев согласно
нормативным документам, имитационным моделированием, а также
результаты диссертации внедрены в практическое использование.

Достоверность новизны технического решения подтверждается

экспериментами, проведенными в ходе разработке системы.

Апробация работы. Основные положения диссертационной работы

доложены и обсуждены на научно-практических конференциях: «VI

Московская межвузовская научно-практическая конференция» (Москва,

2011); «VII Московская межвузовская научно-практическая конференция» (Москва, 2012), «VIII Недели науки молодежи СВАО» (Москва, 2013); «Карьера и образование – 2013»» (Москва, 2013), XI Международная заочная научно-практическая конференция «технические и математические науки» (2013 г.).

Публикации. По результатам исследований опубликовано 11 научных работ, из них 5 статей в реферируемом журнале, рекомендованном ВАК.

Структура и объем работы. Диссертация состоит из Введения, трех глав основного текста, Заключения и списка литературы, включающего 116 наименования. В приложении приведены документы о внедрении, листинг разработанной программы и расчет параметров нейронной сети NEFClass M Общий объем диссертации составляет 323 листа, включая 46 рисунков и 12 таблиц.

Анализ существующих методов распознавания человека по изображению лица

Задача идентификации личности делится на три больших класса, отличающихся как по требованиям, предъявляемым к системам распознавания, так и по способам их решения. Различны и требования, предъявляемые к ошибкам возникающим при решении этих классов задач. - поиск ключевых признаков в больших базах данных; - контроль доступа; - контроль фотографий в различных документах (документный контроль). Ошибкой первого рода (type I error, misdetection) называют ситуацию, когда объект заданного класса не распознатся (пропускается) системой. Ошибка второго рода (type II error, falsealarm) происходит, когда объект заданного класса принимается за объект другого класса.[1-5]

Следует также отметить различие понятий верификации и распознавания (идентификации). В задаче верификации неизвестный объект заявляет, что он принадлежит к некоторому известному системе классу. Система подтверждает или опровергает это заявление. При распознавании требуется отнести объект неизвестного класса к одному из известных или выдать заключение о том, что этот объект не относится к известным классам. Поиск изображения в базе данных.

При поиске изображения в базах данных большого объема используется сравнение типа «один со многими». При этом предъявляются высокие требования к ошибке первого рода - система распознавания должна находить изображения, соответствующие данному человеку, не пропустив, по возможности, ни одного такого изображения. Система должна находить изображения, соответствующие конкретному человеку.

Обычно в большой базе данных (с объемом хранения 104 - 107 изображений) требуется найти изображения, наиболее похожие на заданное. Поиск должен быть произведн за минимальное время(менее 5 сек). Одно из решений состоит в хранении в базе данных небольших наборов заранее извлечнных ключевых признаков, максимально характеризующих изображение. При этом требования к точности при подборе похожих изображений лица не столь критичны как в задачах контроля доступа и документного контроля.

При решении задач данного класса, прежде всего, применяется метод эластичного графа [71, 113]. В данном методе для получения граф-модели изображения лица используются, так называемые, джеты набор комплексных коэффициентов Габора для некоторых точек изображения, полученных в результате свертки изображения лица с вейвлетами Габора, которые хорошо характеризуют локально-частотные свойства изображения. Для сравнения изображений используется функция подобия, учитывающая амплитуду и фазу соответствующих коэффициентов Габора.

При решении задач данного класса используется также метод «собственных лиц» (метод главных компонент) [25, 107]. При использовании этого метода коэффициенты, полученные разложением входного изображения на главные компоненты, используются для сравнения изображений путм вычисления Евклидова расстояния, а в более совершенных методах - на основе метрики Махаланобиса с использованием гауссовского распределения [86,107]. В работе [66] описано развитие метода главных компонент на основе нейронных сетей. Задача контроля доступа.

При решении задачи контроля доступа используется сравнение типа «один с несколькими». Для этой задачи критичны требования к ошибкам второго рода. Система распознавания изображений не должна характеризовать незнакомых людей в качестве знакомых, возможно, даже за счт увеличения ошибок первого рода (отказа в доступе знакомым людям).

Решение задачи контроля доступа обычно требуется в условиях, когда имеется небольшая группа лиц (например 5-50 человек), которых контрольно-пропускная система должна распознавать по изображению лица для принятия решения о доступе конкретного лица на охраняемую системой территорию. Лиц, не входящих в состав доверенной группы, КПС не должна пропускать.

Возможны варианты, когда требуется установить конкретную личность по изображению лица. При этом от системы требуется высокая достоверность распознавания, возможно, даже за счт увеличения числа отказов в доступе.

Обычно в качестве тренировочных изображений каждого члена доверенной группы системе доступны несколько изображений его лица, полученных при различных условиях. Это могут быть, например, различные ракурсы съемки, освещнность, различные причски, мимика, наличие или отсутствие очков, усов, бороды и т.п.

При этом в штатном режиме система должна работать в реальном масштабе времени (время принятия решения системой не должно превышать нескольких десятков секунд), в то время как процесс настройки функционирования системы на конкретную доверенную группу лиц может занимать значительно больше времени, но в подготовительном режиме, выполняемом заранее.

Ограничений на применяемые методы нет. Однако, большинство методов сходятся к одному: имеется обучающий набор изображений лиц заданной доверенной группы сотрудников (возможно, при различных условиях съмки), к этому набору система обращается в процессе распознавания и принятия решения о допуске. Или в процессе обучения система настраивается на этот набор. При решении этого класса задач распространн подход с использованием нейронных сетей, которые после обучения обладают хорошей обобщающей способностью.

Разработка модифицированного метода распознавания на основе эластичного графа применительно к распознаванию лица. Введение понятия джета

Повторный эксперимент, проведенный при размере ячейки 20x15 и начальных координатах (22, 24) (Рис. 3.12) показал аналогичные результаты: наибольшее расхождение в значениях мер подобия зарегистрировано в областях с однородным характером - светлое пространство между глаз, лоб.

Однако в областях, где графической информации много (плотность ее высока) и она важна (область глаз, область кончика носа), мера подобия соответствующих джетов остается высокой. Установленная в работе закономерность позволяет ввести весовой коэффициент Wn в стоимостную функцию меры подобия графов, который характеризует вклад каждого джета в общее определение величины меры подобия. С учетом сказанного функция подобия (см. формулу(2.3.)) может быть найдена в соответствии с формулой (3.6), представленной ниже

Результаты сравнительного анализа функций подобия графов без учета весов джетов(2.3) и разработанной функции с учетом весов джетов(3.6)приведены в Таблице 3.6. Для проведения сравнения были использованы несколько вариантов изображений разных персон. Таблица 3.6 Сравнение функций подобия

Анализ показал, что использование функции подобия графов с учетом весовых коэффициентов для джетов позволяет повысить вероятность распознавания для отдельных изображений в среднем на 7%. Разработанная модификация алгоритма эластичного графа позволяет сделать процесс распознавания более гибким, настраиваемым. А, следовательно, повысить вероятность распознавания как одного изображения лица человека, так и системы распознавания в целом. При проектировании системы распознавания человека по изображению лица рекомендуется использовать полученный результат. Настройка весовых коэффициентов должна проводится с учетом размерности обрабатываемых изображений, а также топологии графа. 3.4. Разработка алгоритма обучения модифицированной нейронной сети NEFClass M для введенного понятия джета. Общее описание. Разработан алгоритм обучения модифицированной нейронной сети NEFClass M для модифицированного метода распознавания, в котором в значительной мере устранены недостатки, связанные с несовершенством алгоритма обучения нечетких сетей NEFClass.

Эмпирический алгоритм обучения заменен на строгий алгоритм численной оптимизации для архитектуры и алгоритмов сети [20,23]. Как и оригинальная, так и модифицированная модель NEFClass [20,23] основывается на архитектуре нечеткого персептрона. Архитектурные различия оригинальной и модифицированной моделей состоит в виде функций принадлежности нечетких множеств, функции t-нормы для вычисления активаций нейронов правил, а также в виде агрегирующей функции (t-конормы), определяющей активации выходных нейронов. Применение численных методов оптимизации требует дифференц-руемости функций принадлежности нечетких множеств – условие, которому треугольные функции принадлежности не удовлетворяют. Поэтому в модифицированной модели нечеткие множества имеют гауссовскую функцию принадлежности, описываемую как [20,23] //(x) = exp Конкретная функция принадлежности задается двумя параметрами – a и b.

Требование дифференцируемости диктует также вид t-нормы (пересечения) для вычисления активации нейронов правил. В NEFClass для этого используется функция минимума; в модификации это произведение соответствующих значений.

Вид агрегирующей функции (t-конормы) для модифицированной модели ограничен только взвешенной суммой. Причина состоит в том, что функция максимума, которая используется в оригинальной системе, не удовлетворяет условию дифференцируемости. Основное изменение[20,23], касается нечеткого алгоритма обучения . Целевой функцией в модифицированной NEFClass выступает минимизация среднеквадратичной ошибки на обучающей выборке по аналогии с классическими (четкими) нейросетями [20,23](3.7): 1 N mmE = — Y\\a(rp)-a(rp) II2, 3.7 iv р=\ где N - количество образцов обучающей выборки, а(ср)- априорный вектор активации нейронов выходного слоя для очередного обучающего образца;?, а а - целевое значение этого вектора для данного паттерна. Компоненты целевого вектора для паттерна/? равны: (РГ \J J где } - номер класса, которому принадлежит данный паттерн. Аргументом численной оптимизации, направленной на уменьшение среднеквадратичной ошибки по обучающей выборке, является совокупный вектор параметров а и Ъ всех нечетких множеств сети. В качестве конкретного метода выступает любой метод безусловной оптимизации, например, градиентный метод или метод сопряженных градиентов.

Проведение экспериментов с нейронной сетью NEFClass применительно к распознаванию человека по изображению лица

С помощью эластичного графа можно представить любой объект, для которого необходимо проводить процедуру распознавания. Однако, чтобы реализовать автоматическое распознавание человека по изображению лица необходимо подробнее описать, какую структуру имеет лицо человека, и формализовать представление лица человека в виде эластичного графа.

Для того, чтобы представить изображение лица с помощью эластичного графа, следует определить набор лицевых точек, например, зрачки, углы губ, и пр.). Размеченный граф G, представляющий лицо, содержит N узлов в этих лицевых точках в позициях хпгп = 1,..,тги Е ребер между ними. Узлы обозначены джетами /„. Ребрае=1,..,E являются двухмерными векторами и помечены расстояниями Ахв = хп — хп . Ребра е связывает узел п с узлом п.. Такой граф лица является объектно-адаптированным, так как узлы выбраны в точках, специфичных для лица (лицевые точки) [24].

Графы для различных поворотов головы различаются в геометрии и локальных характеристиках. Несмотря на то, что лицевые точки ссылаются на соответствующие объектные локализации, некоторые из них могут быть скрыты, и джеты, как и дистанции, изменятся вследствие поворота в глубину. Для возможности сравнивать графы при различных поворотах лица требуется вручную определять указатели на соответствующие узлы в различных графах.

Джеты, извлеченные из различных изображений лиц, могут значительно отличаться. Следовательно, нельзя ожидать, что можно достоверно находить лицевые точки, согласовывая лишь одну модель с изображениями лиц различных персон. Задача решается путем использования обобщенного набора графов моделей для различных лиц - «общее знание о структуре лица» (GeneralFaceKnowledge).

В общем знании о структуре лица все графы моделей имеют одинаковую структур: узлы графа определяются соответствующими лицевыми точками. Все узлы, ссылающиеся на одинаковые лицевые точки, связываются вместе и представляют собой различные экземпляры этих локальных лицевых областей. Ребра размечаются усредненными значениями расстояний между узлами. Таким образом, достигается усредненная геометрия лица (Рис. 2.5).

Допустим, что имеется М графов моделей GBm (т = 1,...,М) идентичной структуры. Граф В, заключающий в себе общие знания, имеет такую же структуру, его узлы помечены пучками джетов }%т и его ребра размечены усредненными расстояниями [24]

Обобщенный граф используется для автоматической разметки нового изображения с целью получения графа изображения. При этом каждый узел графа может быть подвергнут сравнению с соответствующим узлом любой из моделей во множестве (Рис. 2.5.) [24]. Допустим, что для каждого нового лица и для каждой лицевой точки имеется «экспертный» джет в общих знаниях, достаточно подобный с джетом на новом лице в этом месте, чтобы приблизительно определить позицию лицевой точки. Помимо получения графа изображения процесс разметки также предоставляет информацию о том, какая модель более подобна новому лицу в любой лицевой точке.

Естественно может возникать вопрос об объеме обобщенного графа. Он зависит от степени различия лиц во множестве. Если лица во множестве имеют принадлежность к различным расам, с разным выражением эмоций, разного возраста и т.д., общий граф должен содержать достаточно много различных моделей, чтобы справиться с описанными различиями. Объем обобщенного графа также будет увеличиваться, если требуется достичь желаемой точности согласования при нахождении лицевых точек на новом лице в процессе формировании графа изображения. Точность согласования может быть оценена при разметке обобщенного графа на изображение лица. При этом найденные лицевые точки проверяются вручную.

Сравнение джетов. Вследствие вращения фазы джеты, взятые в двух разных точках на расстоянии в несколько пикселей друг от друга, имеют очень различные коэффициенты, несмотря на то, что отображают схожие локальные области изображения. Это может стать причиной некоторых проблем при разметке. Поэтому следует либо игнорировать фазу, либо компенсировать ее изменение явно. Функция подобия, которая пренебрегает учетом фазы [110] для джета J, взятого в фиксированной позиции изображения и джетов / =/(%) взятых в изменяемой позиции х, функция Sa(J,f(xy) является гладкой функцией с локальным экстремумом (в виде «холма»), сводящейся для быстрого и надежного процесса сходимости к простым методам поиска, таким, например, как вероятностный градиентный спуск (Рис. 2.6а).

Использование фазы имеет два потенциальных преимущества. Во-первых, информация о фазе требуется для выделения среди моделей с похожими значениями амплитуд и, во-вторых, так как фаза в зависимости от местоположения изменяется быстро, это обеспечивает возможность точной локализации джета на изображении. Допуская, что два джета J и Г ссылаются на местоположения объекта с малым относительным смещением d = (dXfdy) сдвиги фазы могут быть приблизительно компенсированы за счет члена dk} Получим функцию подобия для джетов, чувствительную к фазе [24]

Проведение экспериментов с нейронной сетью NEFClass М применительно к распознаванию человека по изображению лица

Разработан метод распознавания и построена КПС, что позволило ре шить задачу - идентификация и поиск человека по изображению его лица в масштабе реального времени. Исследовано и показано, что для наибольшей эффективности алгоритма распознавания наряду с несжатыми изображениями возможно также использование изображений сжатых алгоритмом JPEG. Оценено влияние степени сжатия JPEG и показано, что приемлемо допустимый уровень сжатия (обеспечивающая 90% вероятность распознавания) составляет 25%, а необходимый объем хранимой информации снижается при этом в 7 раз при сохранении допустимого уровня распознавания.

Введен коэффициент вклада джета в общую формулу определения меры подобия графов в алгоритме эластичного графа, что позволило увеличить вероятность распознавания в среднем на 3%, а в некоторых случаях и на 4,5%.

Исследована задача построения контрольно-пропускной системы распознавания человека по видео изображению. Разработаны и исследованы функциональные модели КПС, а также даны рекомендации по организации, хранению и поиску информации в специализированной реляционной СУБД. Определен минимальный набор данных, которые необходимо хранить. Разработана схема информационного хранилища, детально рассмотрены функциональность каждой из реляционных таблиц хранилища. Разработан алгоритм хранения данных о регистрируемой персоне в реляционной базе данных.

Исследована задача идентификации персоны по двум изображениям. Разработаны алгоритмы поиска персоны в реляционной СУБД, способные осуществлять поиск в реальном масштабе времени. Экспериментально показано, что наилучшую скорость поиска показал алгоритм с использованием хранимой процедуры (33 мсек./запись).

При разработке КПС использовались разработанные методологические принципы проектирования КПС и новые результаты, полученные в диссертационном исследовании.

Научная новизна: 1. Разработан модифицированный метод распознавания на основе эластичного графа, позволяющий повысить качество распознавания лицевых изображений. Введен коэффициент вклада джета в общую формулу определения меры подобия графов в алгоритме эластичного графа, позволяющий увеличить вероятность распознавания в среднем на 5-7%; 2. Разработан алгоритм хранения и поиска данных о персоне в базе данных позволивший повысить скорость идентификации; Разработана типовая структура информационного хранилища ключевых признаков изображения, позволяющая хранить необходимо-большой объем ключевых признаков; 3. Определенна cтeпeнь cжaтия изoбpaжeния для применения в системе идентификации лиц. Показано, что приемлемо допустимый уровень сжатия изображения составляет 25%, при этом необходимый объем хранимой информации снижается в 7 раз; 4. Разработан алгоритм обучения модифицированной нейронной сети NEFCLass M. Как показал эксперимент, из исследуемых алгоритмов нейронная сеть NEFClass M наиболее эффективно решает задачу распознавания лицевых изображений; 5. Разработан алгоритм идентификации и поиска данных о персоне в базе данных. Основным отличием алгоритма являются: отсутствие необходимости вычисления меры подобия при поиске, отсутствие атрибута (признака) поиска, возможность работы в реальном масштабе времени, работа при неполной априорной информации о лицевом изображении. 115 Практическая ценность работы состоит в том, что в ней: 1. Разработан алгоритм организации хранения и поиска информации, а также определен минимальный набор ключевых признаков; 2. Разработано прикладное программное обеспечение позволяющее производить автоматическую видео идентификацию личность по изображению лица; 3. Установлен максимально допустимый уровень сжатия изображений, при их обработке в алгоритме эластичного графа. 4. Научные положения диссертации внедрены в практические разработки. Личный вклад. Все результаты работы, вынесенные на защиту, получены автором лично. Реализация и внедрение. На основе полученных в работе научных результатов, разработана контрольно-пропускная система для идентификации персонала по изображению лица, которая внедренная в ООО «Эврика Тревел» и в ООО Консультационный центр «Простые решения». Имеются акты о внедрении системы.

Достоверность научных положений, выводов и практических рекомендаций, полученных в диссертации, подтверждается корректным обоснованием постановок задач, точной формулировкой критериев согласно нормативным документам, имитационным моделированием, а также результатами внедрения методов, предложенных в диссертации, на практике. Достоверность новизны технического решения подтверждается экспериментами, проведенными в ходе разработке системы. Все поставленные в работе задачи решены.

Похожие диссертации на Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица