5 исследовательских статей AI / ML по обнаружению объектов, которые вы должны прочитать

Отличные статьи…

DetectoRS: обнаружение объектов с помощью пирамиды рекурсивных функций и переключаемой свертки Atrous

Авторы: Сиюань Цяо, Лян-Чи Чен, Алан Юилль

Абстрактный -

Многие современные детекторы объектов демонстрируют выдающиеся характеристики благодаря использованию механизма двойного взгляда и размышлений. В этой статье мы исследуем этот механизм в базовой конструкции для обнаружения объектов. На макроуровне мы предлагаем рекурсивную пирамиду функций, которая включает в себя дополнительные обратные связи от сетей пирамид функций в восходящие магистральные уровни. На микроуровне мы предлагаем переключаемую свертку предсердий, которая объединяет функции с разной скоростью и собирает результаты с помощью функций переключения. Их объединение дает DetectoRS, который значительно улучшает характеристики обнаружения объектов. В тестовой разработке COCO DetectoRS достигает 54,7% прямоугольных AP для обнаружения объектов, 47,1% AP по маске для сегментации, например, и 49,6% PQ для паноптической сегментации.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/2006.02334v1.pdf

Код можно найти здесь:

joe-siyuan-qiao / DetectoRS
30.06.2020] DetectoRS теперь официально поддерживается MMDetection. Огромное спасибо @ xvjiarui, @ZwwWayne и @hellock за… github.com

IterDet: итерационная схема для обнаружения объектов в переполненных средах

Данила Рухович, Константин Софиюк, Данил Галеев, Ольга Баринова, Антон Конушин

Абстрактный -

Детекторы на основе глубокого обучения обычно создают избыточный набор ограничивающих рамок объекта, включая множество повторяющихся обнаружений одного и того же объекта. Эти блоки затем фильтруются с использованием немаксимального подавления (NMS), чтобы выбрать ровно одну ограничивающую рамку для каждого интересующего объекта. Эта жадная схема проста и обеспечивает достаточную точность для изолированных объектов, но часто дает сбой в переполненных средах, так как нужно как сохранять ящики для разных объектов, так и подавлять повторяющиеся обнаружения. В этой работе мы разрабатываем альтернативную итерационную схему, в которой новое подмножество объектов обнаруживается на каждой итерации. Обнаруженные блоки из предыдущих итераций передаются в сеть на следующих итерациях, чтобы гарантировать, что один и тот же объект не будет обнаружен дважды. Эта итерационная схема может применяться как к одноэтапным, так и к двухэтапным детекторам объектов с небольшими модификациями процедур обучения и логического вывода. Мы проводим обширные эксперименты с двумя различными базовыми детекторами на четырех наборах данных и показываем значительное улучшение по сравнению с базовым уровнем, что приводит к современной производительности на наборах данных CrowdHuman и WiderPerson.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/2005.05708v1.pdf

Код можно найти здесь:

saic-vul / iterdet
В этом проекте размещен код для реализации схемы IterDet для обнаружения объектов, представленной в нашей статье… github.com

Нейронная сеть с однократным уточнением для обнаружения объектов

Авторы: Шифэн Чжан, Лунъинь Вэнь, Сяо Бянь, Чжэнь Лэй, Стэн З. Ли

Абстрактный -

Для обнаружения объектов двухэтапный подход (например, Faster R-CNN) обеспечивает наивысшую точность, тогда как одноэтапный подход (например, SSD) имеет преимущество высокой эффективности. Чтобы унаследовать достоинства обоих и преодолеть их недостатки, в этой статье мы предлагаем новый детектор на основе однократного измерения, называемый RefineDet, который обеспечивает лучшую точность, чем двухэтапные методы, и поддерживает сопоставимую эффективность одноэтапных методов. RefineDet состоит из двух взаимосвязанных модулей, а именно модуля уточнения привязки и модуля обнаружения объектов. В частности, первый нацелен на 1. отфильтровать отрицательные привязки, чтобы уменьшить пространство поиска для классификатора, и 2. грубо отрегулировать расположение и размеры привязок, чтобы обеспечить лучшую инициализацию для последующего регрессора. Последний модуль принимает уточненные привязки в качестве входных данных от первого для дальнейшего улучшения регрессии и прогнозирования метки с несколькими классами. Между тем, мы разрабатываем блок подключения передачи для передачи функций в модуле уточнения привязки для прогнозирования местоположений, размеров и меток классов объектов в модуле обнаружения объектов. Функция потери многозадачности позволяет нам обучать всю сеть сквозным способом. Обширные эксперименты с PASCAL VOC 2007, PASCAL VOC 2012 и MS COCO демонстрируют, что RefineDet обеспечивает высочайшую точность обнаружения с высокой эффективностью.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/1711.06897v3.pdf

Код можно найти здесь:

sfzhang15 / RefineDet
Мы предлагаем новый одноразовый детектор под названием RefineDet, который обеспечивает лучшую точность, чем двухэтапные методы… github.com

VoxelNet: сквозное обучение для обнаружения трехмерных объектов на основе облака точек

Инь Чжоу, Онел Тузель

Абстрактный -

Точное обнаружение объектов в трехмерных облаках точек является центральной проблемой во многих приложениях, таких как автономная навигация, домашние роботы и дополненная / виртуальная реальность. Чтобы связать очень разреженное облако точек LiDAR с сетью предложений региона (RPN), большинство существующих усилий было сосредоточено на вручную созданных представлениях функций, например, проекции с высоты птичьего полета. В этой работе мы устраняем необходимость в ручном проектировании функций для трехмерных облаков точек и предлагаем VoxelNet, общую сеть трехмерного обнаружения, которая объединяет извлечение признаков и прогнозирование ограничивающей рамки в одноступенчатую сквозную глубокую сеть с возможностью обучения. В частности, VoxelNet делит облако точек на трехмерные воксели, расположенные на равных расстояниях, и преобразует группу точек в каждом вокселе в унифицированное представление объекта с помощью недавно представленного слоя кодирования признаков вокселя (VFE). Таким образом, облако точек кодируется как описательное объемное представление, которое затем подключается к RPN для генерации обнаружений. Эксперименты с тестом KITTI для обнаружения автомобилей показывают, что VoxelNet с большим отрывом превосходит современные методы 3D-обнаружения на основе LiDAR. Кроме того, наша сеть изучает эффективное отличительное представление объектов с различной геометрией, что приводит к обнадеживающим результатам в 3D-обнаружении пешеходов и велосипедистов на основе единственного LiDAR.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/1711.06396v1.pdf

Код можно найти здесь:

charlesq34 / pointnet
Создано Чарльзом Р. Ци, Хао Су, Кайчун Мо, Леонидасом Дж. Гибасом из Стэнфордского университета. Эта работа основана на нашем… github.com

qianguih / voxelnet
Это неофициальная реализация VoxelNet: сквозное обучение для обнаружения трехмерных объектов на основе облака точек в… github.com

Обнаружение людей в произведениях искусства с помощью CNN

Николас Вестлейк, Хунпин Кай, Питер Холл

Абстрактный -

CNN значительно улучшили качество обнаружения объектов на фотографиях. Однако исследования в области обнаружения объектов в произведениях искусства остаются ограниченными. Мы показываем ультрасовременный перформанс на сложном наборе данных People-Art, который содержит людей из фотографий, мультфильмов и 41 различных художественных движений. Мы достигаем такой высокой производительности, настраивая CNN для этой задачи, тем самым демонстрируя, что обучение CNN на фотографиях приводит к переобучению фотографий: только первые три или четыре слоя переносятся с фотографий на произведение искусства. Хотя производительность CNN пока самая высокая, она остается ниже 60% AP, что говорит о необходимости дальнейшей работы для решения проблемы перекрестного изображения.

Бумагу можно найти здесь:

Https://arxiv.org/pdf/1610.08871v1.pdf

Код можно найти здесь:

BathVisArtData / PeopleArt
Набор данных People-Art Набор данных People-Art - это набор данных изображений из фотографий и произведений искусства, с ограничением правды… github.com

Ссылки и кредиты -

arXiv.org
arXiv - это бесплатная служба распространения и архив с открытым доступом для 1 721 837 научных статей в областях… arxiv.org

5 исследовательских статей AI / ML по обнаружению объектов, которые вы должны прочитать

Отличные статьи…

DetectoRS: обнаружение объектов с помощью пирамиды рекурсивных функций и переключаемой свертки Atrous

Абстрактный -

IterDet: итерационная схема для обнаружения объектов в переполненных средах

Абстрактный -

Нейронная сеть с однократным уточнением для обнаружения объектов

Абстрактный -

VoxelNet: сквозное обучение для обнаружения трехмерных объектов на основе облака точек

Абстрактный -

Обнаружение людей в произведениях искусства с помощью CNN

Абстрактный -

Вопросы по теме