Введение к работе
Актуальность темы. Создание моделей зрительных систем представляет собой один из важнейших разделов современной кибернетики и прикладной математики. Помимо чисто теоретического интереса, данная задача имеет большое практическое значение. Достаточно назвать, например, одну из актуальных проблем - проблему построения интегральных роботов, решение которой в значительной степени способствовало бы автоматизации различных производственных процессов. Действительно, так же как и человек, интегральный робот должен до 90% информации относительно проблемной среды получать посредством зрительной системы и, как минимум, оперативно решать задачи по распознаванию зашумленных объектов произвольной топологии, имеющих произвольную пространственно-угловую ориентацию и различный масштаб. Кроме того, интегральный робот должен определять значения некоторого набора параметров распознанного объекта, например, его координаты, угловое положение, линейные размеры и т.д. Поэтому проблема оперативной интерпретации визуальной информации посредством систем машинного зрения приобретает особую практическую значимость.
Среди широкого круга задач, необходимость в решении которых возникает при построении распознающих систем, наиболее сложной и наименее формализованной является задача выбора наборов признаков, описывающих распознаваемые объекты. В связи с этим особый интерес представляют исследования, связанные с изучением функционирования нейронных сетей зрительных систем, показавшие, что в них в качестве признаков используются спектральные признаки, формирование которых происходит в результате преобразований, напоминающих преобразования Фурье (следует отметить, что аналогичные преобразования выполняются и в слуховых системах). На основе этих исследований был сделан вывод о том, что инвариантность зрительных систем млекопитающих к пространственно-угловому положению и масштабу распознаваемых объектов в значительной степени обеспечивается, благодаря переходу в частотную область.
Целью работы является построение и исследование систем машинного зрения, предназначенных для оперативного распознавания и интерпретации зашумленных изображений с произвольным пространственно-угловым положением и масштабом на основе спектральных и структурно-лингвистических методов.
Методы исследования. Решение поставленной задачи осуществлено с использованием теории вероятностей, статистической теории принятия решений, спектральной теории сигналов, структурно-лингвистичеких методов и теории многослойных систем распознавания образов.
Научная новизна. В диссертационной работе получены следующие основные научные результаты:
-
Выполненные исследования позволили установить, что при представлении частотной плоскости в полярной системе координат обеспечивается инвариантность амплитудно-частотного спектра только к поворотам объекта на углы, кратные 90 . В связи с этим для повышения надежности распознающей системы предложено анализ изображений начинать с распознавания примитивов в виде отрезков заданной длины с угловой ориентацией, кратной 90.
-
Предложен оригинальный подход к распознаванию объектов произвольного масштаба, с произвольной пространственно-угловой ориентацией, основанный на спектральном анализе отдельных фрагментов изображения с использованием структурно-лингвистических методов.
3. Для ускорения процедуры выполнения преобразования Фурье
предложена новая система кусочно-постоянных базисных функций, для
которой справедлива теорема о сдвиге. Исследованы ее свойства, дока
заны теоремы о сдвиге и масштабе. Апробация предложенной кусочно-
постоянной системы базисных функций подтвердила справедливость
доказанных теорем.
4. В результате рассмотрения как общих принципов построения нейрон
ных сетей (НС), так и конкретных вопросов их синтеза, на базе линейных
пороговых элементов (ЛПЭ) разработана структура трехслойной НС, реа
лизующей процедуры спектрального, структурно-лингвистического анали
за изображения, а также процедуры принятия решений.
Практическая ценность. Разработанные методы, алгоритмы и программы прежде всего могут быть использованы при построении интегральных роботов с целью автоматизации различных производственных процессов. В целом же полученные результаты, носят достаточно общий характер и поэтому могут быть использованы для решения широкого круга задач по анализу и распознаванию изображений (при автоматизации процедур анализа и распознавания аэрокосмических снимков, рентгенограмм, изображений шельфа морского дна и т. д.).
Реализация результатов. С помощью разработанного комплекса программ экспериментально установлено, что по всем показателям наибольшей надежностью характеризуется модель многоуровневой распознающей системы, основанная на спектральном анализе отдельных фрагментов изображения с применением структурно-лингвистических методов.
Апробация работы. Основное содержание диссертации доложено:
на пятой краевой научно-практической конференции по повышению эффективности применения средств вычислительной техники и автоматизированных систем управления в народном хозяйстве Хабаровского края. Хабаровск, 1984.
на всесоюзной конференции по машинной графике и цифровой об работке изображений. Владивосток: ИАПУ ДВНЦ АН СССР, 1985.
- на 23-й научно-практической конференции профессорско-препо
давательского состава. Хабаровск: ХПИ. 1988.
на первом Советско-Китайском симпозиуме по актуальным проблемам научного и технического прогресса Дальневосточного региона на основе прямого Советско-Китайского сотрудничества. Хабаровск, 1991.
на втором международном симпозиуме по содействию научному и техническому прогрессу на Дальнем Востоке. Харбин, Китай. 1992.
на третьем международном Российско-Китайском симпозиуме по актуальным проблемам научного и технического прогресса Дальневосточного региона. Харбин, Китай. 1993.
на четвертом международном симпозиуме по развитию науки и техники на Дальнем Востоке. Харбин, Китай. 1995.
на расширенном заседании НТС НИИ КТ при ХГТУ, Хабаровск, 1997 г.
Публикации. По теме диссертации опубликовано 22 печатные работы.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и приложений. Работа содержит 232 страницы, в том числе 139 страниц основного машинописного текста, 17 страниц рисунков (39 рисунков), 5 страниц таблиц (10 таблиц), 61 страницу приложений и список литературы на 10 страницах (85 наименований).