Нейросетевые алгоритмы для решения задач кодирования изображений с использованием технологии CUDA Нгуен Виет Хунг

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Нгуен Виет Хунг. Нейросетевые алгоритмы для решения задач кодирования изображений с использованием технологии CUDA : диссертация ... кандидата технических наук : 05.13.17 / Нгуен Виет Хунг; [Место защиты: Центр информац. технологий и систем органов исполнит. власти].- Москва, 2012.- 154 с.: ил. РГБ ОД, 61 12-5/2494

Введение к работе

Актуальность темы:

В настоящее время пропускная способность каналов сетей передачи данных продолжает расти, и дает возможность передачи информации все быстрее и быстрее, однако актуальность проблемы сжатия изображений и видео при их передаче по проводным и беспроводным линиям связи (передача телевизионных изображений, передача изображений по линии Internet и др.) сохраняется. Действенным методом снижения технических требований к пропускной способности используемых каналов передачи данных, определяемой вероятностно-энергетическими характеристиками и скоростью передачи, является кодирование (сжатие) изображений и видеопоследовательностей при их передаче и декодирование в приемном устройстве. Появляются многие виды услуг, которые требуют передачи в реальном времени, например такие как видеотелефония, мобильная и стационарная телеконференцсвязь, многопрограммное интерактивное телевидение, телевидение высокой четкости, многопрограммное звуковое вещание и др. Алгоритмы сжатия изображений и видеоданных постоянно совершенствуются, создаются новые стандарты.

Проблема сжатия изображений и видеопоследовательностей актуальна также при создании центров хранения, архивов и каталогов (баз данных) изображений и видеопоследовательностей в цифровом виде (медицинские изображения, космические изображения, получаемые при помощи датчиков дистанционного зондирования, фотоизображения и др.). Решение этой проблемы позволит уменьшить объем информации, хранимой на носителях.

Разработка алгоритмов цифрового сжатия различных видов информации для их передачи по каналам связи как альтернативы аналоговым системам проводится уже более 20 лет во всем в мире. Был получен ряд важных результатов в плане разработки алгоритмов сжатия, включая стандарты JPEG (JPEG-2000), MPEG-1, MPEG-2, MPEG-4 (видео), Н.261, Н.263, Н.264 (AVC) и др. для статических и динамических изображений различного разрешения.

К настоящему времени исследованы разные алгоритмы сжатия изображений. Самыми популярными в практике алгоритмами сжатия изображений являются алгоритмы поблочного кодирования с преобразованием, основанные на дискретных ортогональных преобразованиях. Среди алгоритмов с преобразованием фактическим стандартом являются алгоритмы Joint Photographic Experts Group - JPEG и JPEG2000. Однако эти алгоритмы имеют низкую скорость работы и сложны в аппаратной реализации. В последние годы в связи с широким распространением нейросетевых методов были разработаны нейросетевые алгоритмы сжатия изображений. Исследовались разные типы нейронных сетей как обучаемые с учителем, так и самообучаемые нейронные сети. Нейронные сети могут быть легко распараллелены, что позволяет сократить время вычисления и дает возможность сжимать изображения в реальном времени.

В современных стандартах сжатия видео процесс компенсации движения играет очень важную роль. Использование алгоритмов компенсации движения при одинаковом качестве передаваемого изображения может увеличить степень

сжатия информации. Эффективность и время выполнения процесса компенсации движения сильно зависит от алгоритмов поиска векторов движения. Однако поиск векторов движения является одним из наиболее вычислительно затратных этапов цифрового кодирования, требующего большого числа арифметических операций. В стандартах сжатия видео алгоритмы поиска векторов движения обычно не фиксированы и их можно свободно оптимизировать в рамках стандарта сжатия. Программа сжатия с эффективным алгоритмом поиска векторов движения может достигать значительного преимущества над другими программами, реализующими тот же стандарт сжатия. Поэтому разработка алгоритмов поиска векторов движения является актуальной задачей.

Целью диссертационной работы является разработка эффективных нейросетевых алгоритмов сжатия статических и динамических изображений, обеспечивающих повышение эффективности процесса кодирования с применением технологии CUDA на графических процессорах NVIDIA.

Для достижения поставленной цели были решены следующие задачи:

выполнен анализ существующих алгоритмов сжатия статических и видео изображений;
разработаны и исследованы нейросетевые алгоритмы сжатия изображения, которые также реализованы на графических процессорах NVIDIA;
выполнен анализ существующих алгоритмов поиска векторов движения;
разработан и реализован более эффективный по сравнению с аналогами алгоритм поиска векторов движения на графических процессорах NVIDIA;
проведены экспериментальные исследования разработанных алгоритмов на реальной информации.

Научная новизна:

Предложен новый нейросетевой алгоритм для сжатия изображения на основе самоорганизующейся карты Кохонена в преобразованном пространстве.
Предложен алгоритм распараллеливания процесса обучения и эксплуатации сети Кохонена на графическом процессоре.
Предложен алгоритм поиска векторов движения, отличающийся от известных использованием нового нейросетевого подхода для построения набора кандидатов вектора движения.
Реализация на графических процессорах NVIDIA алгоритмов поиска вектора движения: предложенного алгоритма, алгоритма полного перебора и нового трехшагового алгоритма

Практическая ценность:

Разработана программа реализующая процесс обучения сети Кохонена на CUDA. Программа помогает ускорить процесс обучения сети Кохонена в 9-10 раз по сравнению с CPU.
Разработан программный комплекс для сжатия изображений с использованием нейронной сети на CUDA.

Разработана программа для быстрого нахождения векторов движения на CUD А, которая может быть применена в программном комплексе реализующем стандарт сжатия видео.
Проведен комплекс экспериментальных исследований разработанных алгоритмов.

Основные положения, выносимые на защиту: На защиту выносятся следующие положения, разработанные и исследованные в данной работе:

Новый нейросетевой алгоритм сжатия статического изображения, использующего коэффициенты вейвлетного дискретного преобразования как входы самоорганизующейся карты Кохонена, что позволяет увеличить качество сжатого изображения при высоком коэффициенте сжатия.
Реализация процесса обучения сети Кохонена на CUDA, что позволяет увеличить скорость процесса обучения в 9-10 раз. Реализация алгоритма сжатия с использованием сети Кохонена на CUDA, что позволяет увеличить скорость сжатия, и дает возможность сжатия изображений в реальном масштабе времени.
Новый алгоритм поиска вектора движения с использованием нейронной сети для определения множества кандидатов, что позволяет уменьшить количество вычислений оценочной функции и увеличить степень компрессии.
Реализация предложенного алгоритма поиска вектора движения на CUDA, что позволяет увеличить скорость нахождения вектора движения.
Результаты экспериментальных исследований разработанных алгоритмов.

Апробация работы. Основные положения работы докладывались на следующих семинарах и конференциях:

Научно-практическая конференция «Вычисления с использованием графических процессоров в молекулярной биологии и биоинформатике» - Москва -2010.
IX Всероссийская конференция «Нейрокомпьютеры и их применение». Москва-2011

3.54-ая научная конференция МФТИ «Проблемы фундаментальных и прикладных естественных и технических наук в современном информационном обществе» - Долгопрудный - 2011.

4. XIV Всероссийская научно-техническая конференция

«Нейроинформатика-2012» - Москва - 2012

5.Х Всероссийская конференция «Нейрокомпьютеры и их применение». Москва-2012.

Публикации. По теме диссертации автором опубликовано 9 работ, из них 3 статьи в научно-технических журналах из перечня ВАК [4][5][9].

Структура и объем диссертации: Диссертационная работа состоит из введения, четырех глав, заключения и трех приложений. Содержит 152 страницы, 9 таблиц, 43 рисунков и 3 приложения. Список цитируемой литературы содержит 80 наименований.

Нейросетевые алгоритмы для решения задач кодирования изображений с использованием технологии CUDA Нгуен Виет Хунг

Похожие диссертации на Нейросетевые алгоритмы для решения задач кодирования изображений с использованием технологии CUDA