1. Ускорение обучения роботов контактным манипуляциям: учебное исследование (arXiv)

Автор: Кристиан С. Бельтран-Эрнандес, Дэмиен Пети, Ишчел Г. Рамирес-Альпизар, Кэнсуке Харада

Аннотация. Парадигма обучения с подкреплением (RL) была важным инструментом для автоматизации роботизированных задач. Несмотря на достижения в области RL, она все еще не получила широкого распространения в отрасли из-за необходимости дорогостоящего взаимодействия роботов с окружающей средой. Учебная программа (CL) была предложена для ускорения обучения. Однако большинство исследовательских работ оценивались только в смоделированных средах, от видеоигр до роботизированных игрушечных задач. В этой статье представлено исследование по ускорению обучения роботов задачам манипулирования с большим количеством контактов на основе обучения по учебной программе в сочетании с рандомизацией предметной области (DR). Мы решаем сложные задачи промышленной сборки с помощью роботов с позиционным управлением, например задачи по вставке. Мы сравниваем различные проекты учебных программ и подходы к выборке для DR. На основе этого исследования мы предлагаем метод, который значительно превосходит предыдущую работу, в которой используется только DR (без CL), с менее чем пятой частью времени обучения (выборки). Результаты также показывают, что даже при обучении только в симуляции с игрушечными задачами наш метод может изучать политики, которые можно перенести на реального робота. Изученные политики позволили добиться успеха до 86% в реальных сложных промышленных задачах по вставке (с допусками ± 0,01 мм), чего не наблюдалось во время обучения.

2.Из одной руки в несколько рук: имитационное обучение ловким манипуляциям с помощью телеоперации с одной камерой (arXiv)

Автор: Юйчжэ Цинь, Хао Су, Сяолун Ван.

Аннотация: мы предлагаем провести имитационное обучение ловким манипуляциям с многопальцевой рукой робота на демонстрациях человека и перенести политику на настоящую руку робота. Мы представляем новую систему телеуправления с одной камерой для эффективного сбора 3D-демонстраций с помощью только iPad и компьютера. Одним из ключевых достижений нашей системы является то, что мы создаем индивидуальную руку робота для каждого пользователя в физическом симуляторе, который представляет собой манипулятор, напоминающий по кинематической структуре и форме руку оператора. Это обеспечивает интуитивно понятный интерфейс и позволяет избежать нестабильного перенацеливания человека на робота для сбора данных, что приводит к крупномасштабным и высококачественным данным. После сбора данных настроенные траектории рук робота могут быть преобразованы в различные заданные руки робота (изготовленные модели) для создания обучающих демонстраций. Благодаря имитационному обучению с использованием наших данных мы показываем значительное улучшение по сравнению с базовыми уровнями с несколькими сложными задачами манипулирования. Важно отметить, что мы показываем, что наша изученная политика значительно более надежна при переносе на реального робота. Больше видео можно найти в https://yzqin.github.io/dex-teleop-imitatio

3. Тонкоформатный тактильный датчик на основе зрения с массивом микролинз (MLA) (arXiv)

Автор: Ся Чен, Гуаньлань Чжан, Майкл Ю Ван, Хонгю Юй

Аннотация: Тактильные датчики на основе зрения широко изучались в области робототехники на предмет высокого пространственного разрешения и совместимости с алгоритмами машинного обучения. Однако используемая в настоящее время система визуализации датчика громоздка, что ограничивает ее дальнейшее применение. Здесь мы представляем визуальную систему на основе массива микролинз (MLA) для достижения формата сенсора малой толщины с высокими характеристиками тактильного восприятия. Множественные микрообъективы микролинз покрывают весь эластичный контактный слой и обеспечивают сшитое четкое тактильное изображение, обеспечивая высокое пространственное разрешение при толщине 5 мм. Метод термического оплавления и мягкой литографии обеспечивает равномерный сферический профиль и гладкую поверхность микролинзы. Как оптические, так и механические характеристики продемонстрировали стабильное изображение датчика и превосходное тактильное восприятие, что позволяет получать точную трехмерную тактильную информацию, такую ​​как отображение смещения и распределение силы, с ультракомпактной тонкой структурой.

4. Пересмотр компромисса между надежностью и точностью состязательности в обучении роботов (arXiv)

Автор:Матиас Лехнер, Александр Амини, Даниела Русь, Томас А. Хенцингер

Аннотация:Состязательное обучение (т. е. обучение на входных данных, искаженных со стороны злоумышленников) — это хорошо изученный метод повышения устойчивости нейронных сетей к потенциальным состязательным атакам во время логического вывода. Однако повышение надежности не является бесплатным, а скорее сопровождается снижением общей точности и производительности модели. Недавняя работа показала, что в практических приложениях для обучения роботов эффекты состязательного обучения не представляют собой справедливого компромисса, а приносят чистые потери при измерении целостной производительности робота. Эта работа пересматривает компромисс между надежностью и точностью в обучении роботов путем систематического анализа того, могут ли последние достижения в надежных методах обучения и теории в сочетании с состязательным обучением роботов сделать состязательное обучение пригодным для реальных приложений роботов. Мы оцениваем широкий спектр задач обучения роботов, начиная от автономного вождения в среде с высокой точностью воспроизведения, подходящей для развертывания в режиме реального времени, и заканчивая распознаванием жестов мобильного робота. Наши результаты показывают, что, хотя эти методы обеспечивают постепенное улучшение компромисса в относительном масштабе, негативные побочные эффекты, вызванные состязательным обучением, по-прежнему перевешивают улучшения на порядок. Мы пришли к выводу, что необходимы более существенные достижения в надежных методах обучения, прежде чем они смогут принести пользу задачам обучения роботов на практике.