Vision-based control

Управление манипуляционным роботом в среде CoppeliaSim с использованием стереокамеры и обучения с подкреплением DDPG.

Алгоритм

Цель агента - приближение схвата к объекту определённого цвета, расположенного в рабочей зоне.
Для уменьшения количества входных признаков было решено предварительно извлекать из изображения параметры прямоугольника, обрамляющего целевой объект. Такое решение уменьшает привязанность к определённой камере и цели, предотвращает проблему с переносом программы на реальное устройство, где изображение значительно различается от моделируемого.
Для детектирования в каждой точке находится расстояние L1 между цветом в ней и искомым. Далее по заданному порогу составляется маска принадлежности точек объекту, что позволяет найти прямоугольник, обрамляющий область.

Перед непосредственным приближением к объекту происходит поиск сектора, из которого открывается вид на цель. Решение данной подзадачи предполагает сохранение промежуточных результатов и проще достигается императивно.
Таким образом, нейросеть производит планирование траектории по направлению к целевому объекту, находящемуся в зоне видимости. Вход нейронной сети - обобщённые координаты и параметры прямоугольной области, описывающей объект на изображении; выход - изменение координат.
Параметры нейросети настраиваются с помощью обучения с подкреплением по алгоритму DDPG (Deep Deterministic Policy Gradient). Алгоритм решает проблему непрерывности и многомерности действия агента.
Вычисляемая награда включает разницу потенциалов следующего и текущего состояний, а также штраф за длину перемещения. Предназначение штрафа в поощрении гладкой многоточечной траектории. Потенциал состояния вычисляется как взвешенная сумма площади прямоугольника, его смещения относительно центра изображения, а также средней дальности по карте глубины.

Использование

Запустить симуляцию сцены Scene.ttt в CoppeliaSim
Использовать ноутбук inference.ipynb

Необходимые библиотеки

Tensorflow 2
OpenCV
Numpy

Обучение

Запустить симуляцию статической сцены StaticScene.ttt в CoppeliaSim. Использование статической модели робота в режиме синхронизации позволяет проводить обучение с максимальной скоростью.
Открыть скрипт training.py и настроить параметры обучения. Рекомендуется установить количество шагов обучения steps >= 5000.
Выполнить скрипт

Графики процесса обучения

Суммарная награда за эпизод

Оценка действий сети-актера Q

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
images		images
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
Scene.ttt		Scene.ttt
StaticScene.ttt		StaticScene.ttt
control_utils.py		control_utils.py
detection.py		detection.py
environment.py		environment.py
inference.ipynb		inference.ipynb
model.h5		model.h5
network_utils.py		network_utils.py
remoteApi.dll		remoteApi.dll
sim.py		sim.py
simConst.py		simConst.py
training.py		training.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Vision-based control

Алгоритм

Использование

Обучение

Графики процесса обучения

About

Uh oh!

Languages

Hazuwall/VisionBasedControl

Folders and files

Latest commit

History

Repository files navigation

Vision-based control

Алгоритм

Использование

Обучение

Графики процесса обучения

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Languages