Отличные статьи…

DetectoRS: обнаружение объектов с помощью пирамиды рекурсивных функций и переключаемой свертки Atrous

Авторы: Сиюань Цяо, Лян-Чи Чен, Алан Юилль

Абстрактный -

Многие современные детекторы объектов демонстрируют выдающиеся характеристики благодаря использованию механизма двойного взгляда и размышлений. В этой статье мы исследуем этот механизм в базовой конструкции для обнаружения объектов. На макроуровне мы предлагаем рекурсивную пирамиду функций, которая включает в себя дополнительные обратные связи от сетей пирамид функций в восходящие магистральные уровни. На микроуровне мы предлагаем переключаемую свертку предсердий, которая объединяет функции с разной скоростью и собирает результаты с помощью функций переключения. Их объединение дает DetectoRS, который значительно улучшает характеристики обнаружения объектов. В тестовой разработке COCO DetectoRS достигает 54,7% прямоугольных AP для обнаружения объектов, 47,1% AP по маске для сегментации, например, и 49,6% PQ для паноптической сегментации.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/2006.02334v1.pdf

Код можно найти здесь:



IterDet: итерационная схема для обнаружения объектов в переполненных средах

Данила Рухович, Константин Софиюк, Данил Галеев, Ольга Баринова, Антон Конушин

Абстрактный -

Детекторы на основе глубокого обучения обычно создают избыточный набор ограничивающих рамок объекта, включая множество повторяющихся обнаружений одного и того же объекта. Эти блоки затем фильтруются с использованием немаксимального подавления (NMS), чтобы выбрать ровно одну ограничивающую рамку для каждого интересующего объекта. Эта жадная схема проста и обеспечивает достаточную точность для изолированных объектов, но часто дает сбой в переполненных средах, так как нужно как сохранять ящики для разных объектов, так и подавлять повторяющиеся обнаружения. В этой работе мы разрабатываем альтернативную итерационную схему, в которой новое подмножество объектов обнаруживается на каждой итерации. Обнаруженные блоки из предыдущих итераций передаются в сеть на следующих итерациях, чтобы гарантировать, что один и тот же объект не будет обнаружен дважды. Эта итерационная схема может применяться как к одноэтапным, так и к двухэтапным детекторам объектов с небольшими модификациями процедур обучения и логического вывода. Мы проводим обширные эксперименты с двумя различными базовыми детекторами на четырех наборах данных и показываем значительное улучшение по сравнению с базовым уровнем, что приводит к современной производительности на наборах данных CrowdHuman и WiderPerson.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/2005.05708v1.pdf

Код можно найти здесь:



Нейронная сеть с однократным уточнением для обнаружения объектов

Авторы: Шифэн Чжан, Лунъинь Вэнь, Сяо Бянь, Чжэнь Лэй, Стэн З. Ли

Абстрактный -

Для обнаружения объектов двухэтапный подход (например, Faster R-CNN) обеспечивает наивысшую точность, тогда как одноэтапный подход (например, SSD) имеет преимущество высокой эффективности. Чтобы унаследовать достоинства обоих и преодолеть их недостатки, в этой статье мы предлагаем новый детектор на основе однократного измерения, называемый RefineDet, который обеспечивает лучшую точность, чем двухэтапные методы, и поддерживает сопоставимую эффективность одноэтапных методов. RefineDet состоит из двух взаимосвязанных модулей, а именно модуля уточнения привязки и модуля обнаружения объектов. В частности, первый нацелен на 1. отфильтровать отрицательные привязки, чтобы уменьшить пространство поиска для классификатора, и 2. грубо отрегулировать расположение и размеры привязок, чтобы обеспечить лучшую инициализацию для последующего регрессора. Последний модуль принимает уточненные привязки в качестве входных данных от первого для дальнейшего улучшения регрессии и прогнозирования метки с несколькими классами. Между тем, мы разрабатываем блок подключения передачи для передачи функций в модуле уточнения привязки для прогнозирования местоположений, размеров и меток классов объектов в модуле обнаружения объектов. Функция потери многозадачности позволяет нам обучать всю сеть сквозным способом. Обширные эксперименты с PASCAL VOC 2007, PASCAL VOC 2012 и MS COCO демонстрируют, что RefineDet обеспечивает высочайшую точность обнаружения с высокой эффективностью.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/1711.06897v3.pdf

Код можно найти здесь:



VoxelNet: сквозное обучение для обнаружения трехмерных объектов на основе облака точек

Инь Чжоу, Онел Тузель

Абстрактный -

Точное обнаружение объектов в трехмерных облаках точек является центральной проблемой во многих приложениях, таких как автономная навигация, домашние роботы и дополненная / виртуальная реальность. Чтобы связать очень разреженное облако точек LiDAR с сетью предложений региона (RPN), большинство существующих усилий было сосредоточено на вручную созданных представлениях функций, например, проекции с высоты птичьего полета. В этой работе мы устраняем необходимость в ручном проектировании функций для трехмерных облаков точек и предлагаем VoxelNet, общую сеть трехмерного обнаружения, которая объединяет извлечение признаков и прогнозирование ограничивающей рамки в одноступенчатую сквозную глубокую сеть с возможностью обучения. В частности, VoxelNet делит облако точек на трехмерные воксели, расположенные на равных расстояниях, и преобразует группу точек в каждом вокселе в унифицированное представление объекта с помощью недавно представленного слоя кодирования признаков вокселя (VFE). Таким образом, облако точек кодируется как описательное объемное представление, которое затем подключается к RPN для генерации обнаружений. Эксперименты с тестом KITTI для обнаружения автомобилей показывают, что VoxelNet с большим отрывом превосходит современные методы 3D-обнаружения на основе LiDAR. Кроме того, наша сеть изучает эффективное отличительное представление объектов с различной геометрией, что приводит к обнадеживающим результатам в 3D-обнаружении пешеходов и велосипедистов на основе единственного LiDAR.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/1711.06396v1.pdf

Код можно найти здесь:





Обнаружение людей в произведениях искусства с помощью CNN

Николас Вестлейк, Хунпин Кай, Питер Холл

Абстрактный -

CNN значительно улучшили качество обнаружения объектов на фотографиях. Однако исследования в области обнаружения объектов в произведениях искусства остаются ограниченными. Мы показываем ультрасовременный перформанс на сложном наборе данных People-Art, который содержит людей из фотографий, мультфильмов и 41 различных художественных движений. Мы достигаем такой высокой производительности, настраивая CNN для этой задачи, тем самым демонстрируя, что обучение CNN на фотографиях приводит к переобучению фотографий: только первые три или четыре слоя переносятся с фотографий на произведение искусства. Хотя производительность CNN пока самая высокая, она остается ниже 60% AP, что говорит о необходимости дальнейшей работы для решения проблемы перекрестного изображения.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/1610.08871v1.pdf

Код можно найти здесь:



Ссылки и кредиты -