1. Оценка глубины и восстановление изображения с помощью глубокого обучения расфокусированных изображений (arXiv)

Автор: Сакиб Назир, Лоренцо Вакеро, Мануэль Мусьентес, Виктор М. Бреа, Даниэла Колтук.

Аннотация: Монокулярная оценка глубины и устранение размытия изображения — две фундаментальные задачи компьютерного зрения, учитывая их решающую роль в понимании 3D-сцен. Выполнение любой из них, опираясь на одно изображение, является некорректной задачей. Недавние достижения в области глубоких сверточных нейронных сетей (ГНС) произвели революцию во многих задачах компьютерного зрения, включая оценку глубины и устранение размытия изображения. Когда дело доходит до использования расфокусированных изображений, оценка глубины и восстановление изображения All-in-Focus (Aif) становятся связанными проблемами из-за физики расфокусировки. Несмотря на это, большинство существующих моделей рассматривают их отдельно. Однако есть недавние модели, которые решают эти проблемы одновременно, объединяя две сети в последовательность, чтобы сначала оценить карту глубины или расфокусировки, а затем на ее основе реконструировать сфокусированное изображение. Мы предлагаем DNN, которая решает оценку глубины и устранение размытия изображения параллельно. Наша двухголовая сеть оценки глубины и устранения размытия (2HDED:NET) расширяет обычную сеть определения глубины от расфокусировки (DFD) ветвью устранения размытия, которая использует тот же кодировщик, что и ветвь глубины. Предложенный метод был успешно протестирован на двух бенчмарках: NYU-v2 и Make3D, один для внутренних, а другой для наружных сцен. Обширные эксперименты с 2HDED:NET на этих тестах продемонстрировали более высокие или близкие к производительности современные модели для оценки глубины и устранения размытия изображения.

2. Глубокое обучение с подкреплением для роботизированного толкания и выбора в загроможденной среде (arXiv)

Автор: Юхун Дэн, Сяофэн Го, Исюань Вэй, Кай Лу, Бин Фан, Ди Го, Хуапин Лю, Фучунь Сунь.

Аннотация: В этой статье создается новая роботизированная система захвата для автоматического захвата объектов в загроможденных сценах. Составная роботизированная рука, состоящая из присоски и захвата, предназначена для стабильного захвата объекта. Присоска используется для подъема объекта из беспорядка в первую очередь, а захват для захвата объекта соответственно. Мы используем карту аффорданса, чтобы предоставить попиксельные варианты точек подъема для присоски. Для получения хорошей карты аффорданса в систему вводится активный механизм исследования. Эффективная метрика предназначена для расчета вознаграждения за текущую карту возможностей, а глубокая Q-сеть (DQN) используется для направления роботизированной руки к активному исследованию окружающей среды до тех пор, пока сгенерированная карта возможностей не станет пригодной для захвата. Экспериментальные результаты показали, что предлагаемая роботизированная система захвата способна значительно повысить вероятность успеха роботизированного захвата в загроможденных сценах.