Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Управление роботами на основе быстроменяющейся информации Заединов Руслан Вильданович

Управление роботами на основе быстроменяющейся информации
<
Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации Управление роботами на основе быстроменяющейся информации
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Заединов Руслан Вильданович. Управление роботами на основе быстроменяющейся информации : диссертация ... кандидата технических наук : 05.02.05.- Москва, 2003.- 249 с.: ил. РГБ ОД, 61 03-5/3959-0

Содержание к диссертации

Введение

1. Современные состояние методов предсказания и управления по предсказанию. Требования, предъявляемые к сенсорной и управляющей системам 14

1.1. Развитие и современное состояние нейросетевых методов управления 14

1.1.1. Исторический обзор 18

1.1.2. Биологические нейронные сети 19

1.1.3. Модель технического нейрона 21

1.1.4. Архитектуры искусственных нейронных сетей 22

1.1.5. Обучение искусственных нейронных сетей 23

1.1.6. Многослойные персептроны 27

1.2. Требования к сенсорной и управляющим системам игрового тренажера 29

1.2.1. Требования к сенсорной системе 33

1.2.2. Требования к системе управления 36

2. Предсказание состояния динамического объекта 39

2.1. Метод фильтрации и формирования оценки предсказания 40

2.1.1. Постановка задачи 41

2.1.2. Метод решения 41

2.1.3. Выбор начальных условий 43

2.2. Предсказание состояния линейной нестационарной системы 47

2.3. Предсказание состояния нелинейной системы 49

2.4. Выводы 56

3. Управление манипулятором на основе предсказания состояния внешней среды 58

3.1. Метод полиномиальной интерполяции 60

3.1.1. Решение задачи планирования траектории методом полиномиальной интерполяции..: 62

3.1.2. Моделирование процесса управления манипулятором 65

3.2. Нейросетевой метод планирования траектории 72

3.2.1. Постановка задачи нейросетевого планирования траектории 75

3.2.2. Вывод основных кинематических соотношений манипулятора 78

3.2.2.1. Прямая задача о положении 78

3.2.2.2. Обратная задача о положении 80

3.2.2.3. Прямая задача о скорости 84

3.2.2.4. Обратная задача о скорости 85

3.2.3. Алгоритм обучения нейронной сети 86

3.2.3.1. Алгоритм обратного распространения ошибки 87

3.2.3.2. Модификация алгоритма обратного распространения ошибки 92

3.2.3.3. Инициализация весов нейронной сети 101

3.2.4. Экспериментальные исследования нейронной сети 105

4. Вспомогательное математическое обеспечение 116

4.1. Вывод уравнений удара 116

4.2. Трехмерная калибровка системы технического зрения 122

4.2.1. Погрешности в трехмерных видеосистемах 122

4.2.2. Модель видеокамеры 127

4.2.3. Вывод уравнений калибровки 129

4.2.4. Решение уравнений калибровки 131

4.3. Восстановление трехмерных координат по двумерным 138

4.4. Выводы 140

5. Вопросы реализации 142

5.1. Аппаратная конфигурация 142

5.2. Управление интерфейсом видеозахвата 146

5.3. Вычислительные процессы 150

5.3.1. Подсистема калибровки 151

5.3.2. Подсистема двумерного слежения 153

5.3.3. Подсистема предсказания 156

Заключение 160

Список использованных источников 164

Приложение

Введение к работе

Класс задач, который решается робототехническими системами постоянно растет. Робототехника зародилась и развивалась как наука, призванная создать средства для замены человека на производстве и в других средах при выполнении рутинных повторяющихся операций. Но в последнее время робототехника применяется все больше и больше в непроизводственной сфере: решение задач спасения с помощью робототехнических средств, боевое применение роботов, выполнение тех или иных операций в экстремальных средах имеют сейчас большое значение.

Как и при проектировании роботов для производства задача построения роботов для экстремальных сред разбивается на задачи автоматизации и собственно роботизации.

Автоматизация. В настоящее время большинство роботов для экстремальных сред создается в виде манипуляторов, которыми управляет человек-оператор на расстоянии. Такой подход оправдан во многих случаях, но есть задачи, в которых качество управления должно быть выше, чем у удаленного оператора. Одна из проблем — невозможность формирования и точного отслеживания заданной траектории движения объекта управления из-за физиологических особенностей человека. Данная проблема возникает в той или иной степени независимо от квалификации оператора. Существуют приложения, в которых неточные действия со стороны человека-оператора могут и не приводить к непоправимым последствиям. При выполнении таких задач у оператора имеется несколько попыток. Однако, класс задач, где необходимо достигать цель управления за одну попытку, достаточно широк. Более того, именно такие задачи составляют подавляющее большинство в сфере автоматизации операций спасения, а также при боевом применении роботов. Другая часто возникающая проблема — отсутствие канала связи с достаточно высокими характеристиками для удаленного управления в реальном

масштабе времени. Таким образом, задача создания систем автоматического управления роботами для экстремальных сред является актуальной.

Роботизация. Частично проблемы автоматизации могут быть сняты за счет размещения человека-оператора в непосредственной близости к месту функционирования робота или снабжения его большим количеством информации. Качество получаемой информации также может быть повышено за счет применения средств виртуальной реальности, предварительной оценки и классификации поступающей информации с применением экспертных систем и т.п. Но, во-первых, некоторые из названных методов могут быть не применимы. Например, размещение человека-оператора в месте функционирования робота может быть невозможно из-за крайней агрессивности среды, где производятся работы, или из-за необходимости действовать быстро, не тратя время на привлечение и транспортировку к месту работ квалифицированного сотрудника. Во-вторых, характеристики среды могут быть такими, что применение традиционных подходов к управлению будет безуспешным. В частности, при работе в быстроменяющейся среде многим современным роботам не удастся успешно функционировать по причине недостаточного быстродействия. Большая инерционность роботов по сравнению с объектами экстремальной среды функционирования является основной проблемой роботизации задач рассматриваемого класса.

В качестве иллюстрации рассмотрим несколько задач, в которых ясно прослеживаются названные выше черты.

Сопровождение и техническое обслуживание. Требуется снять с орбиты космический аппарат, который потерял управление и произвольно вращается (рисунок В.1). Подобные ситуации могут возникать и в других экстремальных средах, например, под водой.

Рис. B.l. Сопровождение и техническое обслуживание

В такой ситуации можно использовать манипулятор, который оборудован необходимыми техническими средствами для надежного захвата данного космического аппарата и приведения его к месту оказания помощи. В случае полного отсутствия информации о параметрах полета с самого аппарата, что может быть обусловлено серьезным сбоем на его борту, их восстановление возможно только по визуальной, радиолокационной и прочей внешней информации. Таким образом, информационный поток, который поступает на вход системы управления захватывающего манипулятора, обладает, по крайней мере, двумя негативными свойствами: отсутствие полноты и присутствие шумов. Кроме того вращение космического аппарата приводит к возникновению существенных изменений его ориентации за довольно короткие промежутки времени.

Спасение. Требуется захватить оторвавшегося от страховочного троса космонавта, который находится в открытом космосе (рисунок В.2).

Рис. В.2. Спасение

В этом случае доступна только визуальная информация о параметрах полета. Для успешного спасения необходимо знать, по крайней мере, составляющие линейной и угловой скоростей полета космонавта, что затруднительно при визуальном наблюдении из одной точки. Таким образом, и в этой ситуации информационный поток является неполным. Количество попыток захвата космонавта также ограничено запасом топлива маневровых двигателей космического корабля-спасателя, а при более подробном рассмотрении задачи спасения становится очевидным, что такая попытка всего одна, т.к. неудача при захвате может привести к разгерметизации скафандра, повреждению систем его жизнеобеспечения, ранению или даже гибели космонавта. Дополнительные сложности возникают из-за несоизмеримости массоинерционных характеристик корабля и космонавта.

Разминирование. Требуется отвести на безопасное расстояние от некоторого объекта, например, морского порта, плавающую мину, оторвавшуюся от минрепа (рисунок В.З).

Рис. В.З. Разминирование

Поскольку уничтожение мины вблизи важного объекта недопустимо, необходимо на основании визуальных, акустических и прочих наблюдений захватить мину и транспортировать ее на безопасное расстояние для последующего уничтожения или разоружения. Как и в двух предыдущих примерах здесь имеется всего одна попытка для захвата объекта. Кроме того, в наблюдениях могут присутствовать значительные шумы, а участие человека по соображениям безопасности желательно вообще исключить.

Игровые тренажеры. В качестве модельной задачи, объединяющей в себе свойства названных выше и многих других задач, может выступать игровой тренажер для игры, которая предполагает взаимодействие игроков с динамическим объектом. Такая задача не только объединяет в себе свойства других, но и является самой доступной для исследований и апробации алгоритмов управления.

Рассмотрим, например, тренажер для игры в настольный теннис (рисунок В.4). Требуется отслеживать положение мяча, которому приданы некоторые линейная и угловая скорости. Манипулятор должен отразить удар таким образом, чтобы попасть на половину стола соперника в нужной точке с требуемыми скоростными характеристиками. В этой задаче информация, доступная системе управления манипулятором неполна, т.к. для успешного

10 отражения удара необходимо иметь информацию о вращении мяча, наблюдать которое невозможно.

Рис. в.4. Игровые тренажеры

Доступная же информация о положении зашумлена: для ее получения используются визуальный и, возможно, акустический каналы. Кроме того, мяч летит столь быстро (до 7 м/с), что это можно рассматривать в качестве критических изменений в конфигурации внешней среды за короткие промежутки времени. Очевидно также, что тренажер-манипулятор обладает большими инерционными характеристиками, чем объект наблюдений, а цель управления должна достигаться за одну попытку.

Таким образом, основная проблема при создании систем управления для рассматриваемого класса робототехнических систем заключается в невозможности непосредственного управления на основе текущих наблюдений из-за их неполноты, зашумленности, быстрого изменения состояния объекта наблюдений и инерционности объекта управления.

Решение данной проблемы может лежать в двух плоскостях. Прежде всего, можно разрабатывать новые технические средства (сенсорные системы, манипуляторы) для компенсации шумов, восстановления полноты информации

11 и улучшения массоинерционных характеристик объекта управления. Но можно пойти и по другому пути — по пути создания алгоритмов, которые бы полностью или частично решали данную проблему. Основной идеей, которая могла бы быть при этом применена, является идея предсказания состояния объекта наблюдений по неполной и зашумленной информации о его текущем состоянии на основе априорных знаний. Такое упреждающее знание состояния объекта наблюдений позволит более эффективно строить алгоритм управления и тем самым частично компенсировать инерционность манипулятора или другого применяемого объекта управления.

Задачами данной диссертационной работы являются:

  1. Создание метода предсказания состояния объекта наблюдений на основе априорной информации о данном объекте и сведений о его текущем состоянии, полученных в реальном масштабе времени. При этом данные о текущем состоянии объекта наблюдений могут быть зашумлены и неполны.

  2. Разработка метода управления на основе предсказанного состояния объекта наблюдений.

  3. Исследование обоих методов с целью определения их работоспособности в реальных условиях путем математического моделирования на ЭВМ.

В качестве модельной задачи будет рассмотрен тренажер для игры в настольный теннис. Такой выбор объясняется, прежде всего, тем, что, как уже отмечалось ранее, игровые тренажеры объединяют в себе свойства многих других задач. Кроме того, игровые тренажеры являются наиболее доступными для реализации и, следовательно, для апробации разрабатываемых алгоритмов. Решив обозначенные выше задачи для игрового тренажера, можно быть уверенным, что и задачи сопровождения, автоматического спасения и т.п. могут быть решены в будущем.

Предметом исследований является система формирования предсказания состояния динамического объекта, а также система управления манипулятором на основе сформированного предсказания. Место подсистем, которые рассматриваются в данной работе, в составе всей робототехнической системы

игрового тренажера — представлено на рисунке В.5. Такая система обладает, прежде всего, подсистемой наблюдения за динамическим объектом

мячом. По результатам работы данной подсистемы формируется вектор наблюдений z, значения компонентов которого передаются в подсистемы оценки текущего значения х и предсказания хг фазового вектора объекта наблюдений. Полученные оценка и предсказание используются системой управления манипулятором для формирования вектора управления q, который передается в исполнительную подсистему.

-Предмет исследований

Рис. В.5. Предмет исследований

В первой главе диссертации дан подробный анализ наиболее перспективных методов управления на основе предсказания — нейросетевых. На основе проведенного исследования выбрана архитектура искусственной нейронной сети для планирования траектории движения схвата манипулятора в составе РТС тренажера для игры в настольный теннис. Кроме того, в первой

главе проанализированы основные требования, которые налагаются на сенсорную и управляющую системы данного тренажера.

Вторая глава посвящена алгоритму формирования предсказания состояния объекта наблюдений. Выведены формулы для вычисления предсказанного вектора состояния на заданный промежуток времени вперед. Формулы получены на основании фильтра Калмана. Проведен анализ выбора начальных условий для интегрирования уравнений предсказания. Полученный результат проверен путем моделирования для случаев предсказания состояния линейной нестационарной и нелинейной стационарной систем.

В третьей главе описан метод управления манипулятором на основе предсказанного состояния объекта внешней среды. Проведено сравнение пластического и нейросетевого методов формирования траектории. При использовании нейросетевого метода для удовлетворения кинематических ограничений манипулятора получен модифицированный алгоритм обучения нейронной сети, основанный на обратном распространении ошибки. Приведены результаты моделирования нейросетевого метода формирования траектории для шестистепенного манипулятора.

Четвертая глава содержит описания вспомогательных математических методов, которые используются при реализации тренажера. Выведены формулы для обновления оценок линейной и угловой скорости объекта наблюдений — мяча — при его ударе о неподвижную плоскость. Также описаны методы трехмерной калибровки стерео системы технического зрения и перевода двумерных координат изображений точки в ее трехмерные координаты.

Пятая глава посвящена описанию реализации быстродействующей стерео системы технического зрения на основе операционной системы реального времени QNX с использованием инструментальных средств фирмы Watcom.

Требования к сенсорной и управляющим системам игрового тренажера

Проблема создания сенсорных и управляющих систем для роботов, функционирующих в динамических средах с быстроменяющейся конфигурацией, стоит в настоящее время достаточно остро. Многогранность проблемы определяет сложность реализации таких устройств. Независимо от среды функционирования робота и, соответственно, типа применяемых в нем сенсорных и управляющих устройств некоторые требования, которые предъявляются к ним, являются общими для всех. Ниже обозначены наиболее важные из них.

Адекватное быстродействие. В случае функционирования робота в динамически изменяющейся среде быстродействие сенсорной подсистемы является решающим моментом в успешной реализации робототехнической системы в целом. Именно своевременное предоставление информации о состоянии внешней среды системе управления определяет такие ее качества как устойчивость, качество управления и, опять же, быстродействие. Это отнюдь не означает, что необходимо максимизировать быстродействие создаваемых сенсорных и управляющих подсистем. Нужно лишь заранее определить ограничения, накладываемые на выходную информацию сенсоров системой управления, а именно: максимально допустимая задержка и, в случае дискретных сенсорных подсистем, минимальная частота временной дискретизации информации. Совокупность этих требований дает критерий адекватного быстродействия сенсорной подсистемы.

Адекватность быстродействия системы управления определяется как объектом управления, его динамическими свойствами, так и свойствами объектов наблюдений. Если объект управления — робот — должен взаимодействовать с динамическими объектами среды, то важно, чтобы алгоритмы управления обеспечивали выполнение заданных операций за определенный промежуток времени. При этом, раннее завершение процесса управления, например, выход в заданную точку, также недопустимо, как и позднее. Жесткая привязка действий робота к определенному расписанию — основная особенность при построении управляющих систем для работы средах с взаимодействием с динамическими объектами.

Допустимая погрешность результатов. В сенсорных системах обеспечение погрешности измерений, которая бы не превышала заранее заданный порог, есть ни что иное, как способ получения адекватного представления о тех или иных параметрах внешней среды. В системах управления обеспечение допустимой погрешности результатов является одним из основных способов повышения качества управления в целом. К увеличению погрешности измерений может приводить множество факторов: физические свойства сенсорного элемента, способ передачи информации от сенсора к системе управления, способ кодирования сенсорной информации. Особое значение способ кодирования информации имеет в сенсорных системах с цифровым выходом, т.к. в таких системах значительная погрешность может быть внесена на этапе дискретизации информации по уровню. Поскольку дискретизация по уровню является фундаментальным свойством цифровых систем, погрешность этапа дискретизации может быть уменьшена только за счет увеличения количества дискрет или путем сужения диапазона измерений. Погрешность может быть дополнительно увеличена под влиянием помех при передаче цифрового сигнала. Помехи приводят к инверсии значений разрядов цифрового представления информации - битов. Универсального решения данной проблемы не существует. Наиболее часто используемыми методами борьбы с помехами являются: применение кодов Грея и Хемминга (алгоритм ЕСС - error checking and correcting), резервирование каналов связи между сенсорной и управляющей подсистемами проверка четностипття обеспечения высокой защищенности внутренних шин как от помех,

Устойчивость к помехам в канале наблюдения. Погрешность данных на выходе сенсорной системы может быть обусловлена не только свойствами сенсорного элемента и способами представления и передачи информации. Она может быть вызвана самим характером наблюдений, т.е. шумами, которые

Предсказание состояния линейной нестационарной системы

Рассмотрим применение формул (2.12) для предсказания состояния линейной нестационарной системы. В качестве модели будем использовать линеаризованное уравнение движения математического маятника в среде с вязкостью, изменяющейся по гармоническому закону:

Приведем уравнение (2.13) к каноническому виду. Матрица эквивалентной системы дифференциальных уравнений в виде (2.4) выглядит так:

Интегрируя систему с матрицей (2.14), формируем последовательность псевдонаблюдений в соответствии с формулой (2.15) с помощью генератора случайных чисел, распределенных по нормальному закону. Далее, полученные псевдонаблюдения обрабатываются по формулам (2.12) с учетом описанных ограничений на выбор начальных условий. Предсказание осуществляется на г = 1 с. Результат работы метода представлен на рисунках 2.4 — 2.6. Заметим, что предсказание фазового вектора имеет место только с момента t,« 2.2 с, чтосвязано с выполнением процедуры согласования начальных условий для уравнений (2.12).

До этого момента исключительно из иллюстративных соображений вектор X/ (/) принимает некоторые постоянные значения. Этим объясняется и тот факт, что ошибка предсказания до момента //1+гк3.7с довольно велика, а ее изменение повторяет изменение фазовых координат (рисунок 2.6).

Формулы (2.12) выведены для линейных систем. Однако результаты следующего эксперимента показывают, что эти соотношения могут быть верны и для нелинейных систем видав случае если все остальные условия соблюдены. В частности, метод может быть использован при предсказании координат и скорости теннисного мяча, передвигающегося в поле зрения видеосистемы.

Для проверки метода было проведено моделирование таких наблюдений и формирование оценок предсказания значений фазового вектора модели, которая описывает полет мяча. При этом матрица системы пересчитывалась в каждой точке интегрирования системы (2.12):

Силы и моменты, воздействующие на мяч (рисунок 2.7), выражаются следующим образом:линейной скорости центра масс мяча, со - 3x1 вектор угловой скорости мяча, S- площадь центрального сечения мяча, R - радиус мяча, т - масса мяча,J- момент инерции мяча относительно его центральных осей, --плотность воздуха, С,- коэффициент силы вязкого трения, С,- коэффициент подъемной силы, С, - коэффициент момента трения.

При моделировании и в дальнейшем при расчете координат шарика в реальном времени используется упрощенная модель его полета без учета вращения и, следовательно, без подъемной силы и момента трения, т.е.

Выбор начальных значений компонент матрицы Р обусловлен, во-первых, тем, что значения составляющих скорости мяча оцениваются с большей погрешностью, чем его декартовы координаты, и, во-вторых, тем, что погрешность оценки скорости зависит от погрешности оценки координат. Полученную последовательность псевдонаблюдений используем , для интегрирования системы (2.12) на том же интервале. При этом время предсказания выбираем равным 0.2 с. На рисунках 2.8 — 2.10 показаны результаты моделирования алгоритма для системы (2.12) с начальными О Буквами на рисунках обозначены: а — траектория полета мяча (реальное значение координат); б — наблюдаемые значения декартовых координат (псевдонаблюдения); в — фильтрационная оценка х(0; г — оценка предсказания xr(t) Отсутствие изменений значений оценок предсказания на начальном этапе интегрирования объясняется работой алгоритма согласования начальных условий для уравнений фильтрации и формирования предсказаний. Моделирование проводилось в системе MatLAB версии 6.0 (приложение А).

Нейросетевой метод планирования траектории

При использовании метода полиномиальной интерполяции планирования траектории результат его работы представлялся в виде многочлена. Такой подход изящен, но при росте числа параметров, которые необходимо учитывать степень многочлена растет. Например, если необходимо обойти препятствие, то его можно описать в виде некоторого числа допустимых для перемещения точек, в которые манипулятор должен выйти, чтобы не столкнуться с препятствием. Тот же подход можно применить и для удовлетворения внутренних кинематических ограничений манипулятора. Чем больше дополнительных точек траектории используется на этапе планирования, тем выше степень результирующего многочлена, а, следовательно, и сложность решения.

Выходом из ситуации может быть метод, который бы позволял генерировать сами интерполяционные точки на основании требований, которые наложены на начальное и конечное положения манипулятора, и его кинематических ограничений (рисунок 3.6).

Причем, поскольку функционирование системы управления должно осуществляться в соответствии с жесткими временными требованиями, время, которое потребуется на планирование траектории необходимо знать заранее.

Другими словами, не смотря на общую постановку задачи, требуется разработать жесткий безытерационный алгоритм планирования траектории.

Таким требованиям может отвечать, в частности, нейронная сеть. С одной стороны, нейронную сеть можно обучить решать достаточно общие задачи. С другой стороны, выдача решения нейронной сетью проводится за детерминированное время. Входом для такой сети служат требования, которые предъявляются к концам траектории, т.е. условия согласования положения и скорости объекта управления и объекта наблюдений. Обучение сети проводится на основе известных данных о кинематических ограничениях объекта управления. Такой подход потребует модификации существующих или разработки новых алгоритмов обучения нейронных сетей, т.к. существующие алгоритмы обучения [21, 14] требуют наличия эталонных образов, которые в данном случае отсутствуют. Утверждение о необходимости таких образов неПоскольку форма планируемой траектории будет зависеть не только от начального и конечного положений манипулятора, но и от его кинематических ограничений, окончательно задачу планирования траектории необходимо переформулировать в терминах обобщенных координат манипулятора. Следовательно, при разработке нейросетевого метода планирования траектории необходимо, прежде всего, выбрать одну из кинематических схем манипуляционных роботов, которые могут быть реально применены для решения этой задачи. Это должен быть манипулятор, по крайней мере, с шестью степенями подвижности, т.к. взаимное положение мяча и робота в точке встречи заранее не определено, как не определено и направление вектора скорости мяча. Для однозначности будет рассмотрена кинематическая схема манипулятора РМ-01 (PUMA 560), которая показана на рисунке 3.7. Внешний вид манипулятора показан на рисунке 3.8. наблюдений, полученная в момент времени t, но относящаяся к моменту t+ г,v(0 = (v., v,, v.)7 — оценка предсказания линейной скорости объектанаблюдений, полученная в момент времени t, но также относящаяся к моменту Т = t+т, требуется выбрать точку встречи конечного звена манипулятора с мячом:а также спланировать вектор скорости конечного звена для успешного отражения мяча:

На основании полученных данных и сведений о кинематической схеме манипулятора рассчитать значения обобщенных координат и скоростей для конечного положения:координат;скоростей.

Выбрать число слоев, количество и тип нейронов в слое нейронной сети, которая по входной информации о начальном и требуемом конечном положении отдельного звена / манипулятора выдает заданное количество интерполяционных точек траектории (/,(/), /е[о,г]. Общий вид сети представлен на рисунке 3.9.

Разработать алгоритм обучения представленной нейронной сети для планирования точек траектории q,(t\ ге[о,г] с учетом кинематическихограничений для данного звена /:

Сгенерировать точки встречи манипулятора с мячом и обучить нейронную сеть на основании данных о положении и скорости мяча в точке встречи.

Заметим, что ограничения по ускорению, вообще говоря, не являются кинематическими, однако, как будет показано далее, учет этих ограничений придает траектории большую гладкость. Заметим также, что ограничения по положениям и скоростям обычно доступны из документации на манипулятор, но ограничения по ускорениям не заданы. Вместо ограничений по ускорению заданы максимально допустимые нагрузки. Это связано с ограничением тока в обмотке якоря электродвигателей, которые обычно используются в манипуляторах. Ток пропорционален моменту на выходном валу двигателя, а зависимость тока от ускорения неоднозначна, т.к. при этом нужно учитывать и момент инерции нагрузки, который обычно является переменным. Поэтому указанные здесь ограничения на ускорения являются лишь оценочными.

Решение поставленных задач предполагает знание решения прямых и обратных задач по положению и скорости для манипулятора с выбранной кинематической схемой. Поэтому в далее приводится вывод основных кинематических соотношений для манипулятора РМ-01.

Приведенный в здесь вывод решений прямых и обратных задач о положении и скорости для манипулятора РМ-01 основан на работах [27, 23, 13, 22].задан вектор обобщенных координат манипулятора:

Требуется определить положение рабочего органа манипулятора на основании вектора q, кинематической схемы манипулятора (рисунок 3.7) и кинематических параметров манипулятора (таблица 3).Будем пользоваться обозначениями косинусов и синусов обобщенных координат, которые введены в 3.1.2. С учетом этих обозначений матрица перехода от системы координат / -ого звена к системе координат (/-7)-ого запишется в виде:где d, а и a — кинематические параметры из таблицы 3. Подставляя ввыражение (3.16) конкретные значения кинематических параметров длякаждого из звеньев манипулятора получим следующие выражения для матриц:

Трехмерная калибровка системы технического зрения

Одним из самых важных источников погрешностей в трехмерных видеосистемах является взаимное расположение видеокамер. Эффект, который производит взаимное расположение камер на точность измерений, проиллюстрирован на рисунке 4.2. Пусть имеется некоторая погрешность измерений положения калибровочной точки 5. Из рисунка 4.2а видно, что при условии постоянства фокусного расстояния видеокамер величина пространственной области, в которой может находиться калибровочная точка, определяется углом а между осями зрения видеокамер. Чем больше данный угол, тем меньше размер этой области, а, следовательно, и максимально возможная погрешность измерений е ах- Величина погрешности также зависит от расстояния между видеокамерами d. Чем больше это расстояние, тем больше величина области неопределенности при том же угле а. Очевидно, что при перпендикулярном расположении осей зрения видеокамер достигается минимизация области неопределенности по углу а. Погрешность измерений в этом случае зависит только от параметров видеокамер и расстояния до объекта наблюдения Выбор расстояния между видеокамерами d является результатом компромисса между допустимой величиной погрешности измерений и объемом рабочего пространства в котором возможны наблюдения с обеих видеокамер В данной работе выбрано перпендикулярное расположение видеокамер Камеры установлены друг от друга на расстоянии около 1.5 м.

Параметры используемых видеокамер также приводят к возникновению погрешности измерений. Обеспечение минимизации погрешности измерений за счет выбора видеокамеры с более высокими характеристиками также должно проводиться на компромиссной основе. Например, из рисунка 4.2 видно, что при одной и той же погрешности измерения положения изображения калибровочной точки 5 размер области неопределенности зависит от фокусного расстояния видеокамеры. Видеокамеры с большим фокусным расстоянием (рисунок 4.2а) обеспечивают меньший размер области неопределенности, чем видеокамеры с меньшим фокусным расстоянием (рисунок 4.26). Однако использование видеокамер с большим фокусным расстоянием приводит к уменьшению угла зрения, что может привести к невозможности наблюдений за интересующей разработчика частью рабочей зоны. Если речь идет об использовании короткофокусных или длиннофокусных видеокамер для сенсорной системы РТС для игры в настольный теннис, то короткофокусные видеокамеры являются предпочтительными с функциональной точки зрения.

Для уменьшения погрешности калибровки короткофокусных видеокамер необходимо применять специальные методики. Методика, выбранная в данной работе, описана ниже.

Характеристики измерительного элемента видеокамеры также являются источником погрешности измерений. На рисунке 4.2 погрешность измерения координат калибровочной точки на изображении обозначена через 5. Уменьшение величины 5 приведет к уменьшению области неопределенности. отмечалось выше, это особенно важно для короткофокусных видеокамер. Величина 5 содержит как методические, так и случайные составляющие. К методическим погрешностям следует, прежде всего, отнести искажения оптической системы SIICK. С целью их устранения, эти искажения, в общемслучае, необходимо учитывать в модели видеокамеры как при калибровке, так и при измерениях в реальном времени. Некоторые составляющие случайной погрешности описаны ниже.

Погрешность дискретизации 81)жкп. Погрешность дискретизацииобусловлена съемкой исходного изображения на дискретный элемент — ПЗС матрицу, квантованием аналогового видеосигнала, полученного от видеокамеры, на этапе оцифровки с целью записи его в память обрабатывающей ЭВМ и дискретизацией по уровню, которая обусловлена конечностью разрядной сетки ЭВМ.

Геометрические искажения 5трт. Геометрические искажения являютсяследствием нелинейного перспективного преобразования, которое имеет место при съемке калибровочных точек. Например, если при калибровке используются координаты центра плоского объекта круглой формы, который расположен не параллельно плоскости изображения тс, то координаты центра изображения объекта не будут соответствовать координатам центра реального объекта. Вместо них будут измерены координаты центра эллипса, в то время как для точного измерения необходимо получить координаты одного из его фокусов (рисунок 4.3). Методика компенсации геометрических искажений описана в [30]. Для снижения вычислительной сложности алгоритма калибровки путем уменьшения количества параметров модели видеокамеры в данной работе применяются калибровочные объекты, расположенные в плоскостях, параллельных плоскости изображения или близких к таковым.

Похожие диссертации на Управление роботами на основе быстроменяющейся информации