Одним из основных компонентов компьютерного зрения является обнаружение объектов. Обнаружение Набор функций из входного изображения - самый первый шаг обнаружения объекта. Обычно для этих целей используется техника скользящего окна. Некоторыми примерами алгоритмов обнаружения объектов являются RCNN и YOLO.

R-CNN вместо скользящего окна использует выборочный поиск, который увеличивает шансы потенциальных ограничивающих рамок.

CNN - извлекает особенности

SVM - оценивает коробки с уровнем достоверности

ЛИНЕЙНАЯ МОДЕЛЬ - регулирует ограничивающие рамки.

NON-MAX SUPPRESSION - исключает повторное обнаружение

YOLO немного похож на RCNN.

Yolo использует ограничивающую рамку и уровень достоверности, но обычно использует меньше прямоугольников.

Йоло (вы посмотрите только один раз) используется для обнаружения объектов. Граничные рамки и связанные с ними вероятности классов используются для алгоритма Йоло.

Люди обладают способностью различать вещи и предметы. Один взгляд на изображение может определить идентичность, цвет, форму и другие аспекты чего угодно.

Управляя автомобилем, человек может определить опасность.

Единая сверточная сеть одновременно прогнозирует несколько ограничивающих прямоугольников и вероятности классов для этих прямоугольников. YOLO обучается на полных изображениях и напрямую оптимизирует эффективность обнаружения. У этой унифицированной модели есть несколько преимуществ перед традиционными методами обнаружения объектов.

В отличие от методов, основанных на скользящем окне и предложении регионов, YOLO видит все изображение во время обучения и тестирования, поэтому кодирует контекстную информацию о классах, а также об их внешнем виде.

YOLO учится обобщению представлений объектов. При обучении на некоторых естественных изображениях и тестировании на них было замечено, что YOLO превосходит лучшие методы обнаружения, такие как R-CNN, по лучшей оценке точности.

Самые большие преимущества YOLO:

Скорость, 45 кадров в секунду

Сеть понимает обобщенное представление объекта, то есть изображения реального мира, которые они могут более или менее предсказать.

Другая версия, компромисс между скоростью и точностью: - 155 кадров в секунду.

Существует несколько различных алгоритмов обнаружения объектов, которые можно разделить на две группы:

  1. Алгоритмы, основанные на классификации - работают в два этапа. На первом этапе мы выбираем на изображении интересные области, которые могут быть ограничены ограничивающими рамками. Это делит все изображение на сетку N X N. Если какой-либо объект попадает внутрь сетки, то ячейка сетки отвечает за выделение и обнаружение этого объекта. Затем мы классифицируем эти области с помощью сверточных нейронных сетей {CNN}. Это решение может быть очень медленным, потому что нам нужно выполнять прогноз для каждого выбранного региона.
  2. Алгоритмы, основанные на регрессии - вместо выделения ограничивающего прямоугольника на изображении мы «прогнозируем» классы и ограничивающие прямоугольники для всего изображения. Примером этого типа алгоритма является YOLO (Вы смотрите только один раз), который обычно используется для обнаружения объектов в реальном времени.

Прежде чем мы углубимся в детали YOLO, мы должны знать, что мы собираемся прогнозировать. Наша задача - спрогнозировать класс объекта и ограничивающую рамку, определяющую местоположение объекта.

Каждый ограничивающий прямоугольник можно описать с помощью пяти дескрипторов:

  1. центр ограничивающей рамки (x, y)
  2. ширина (w)
  3. высота (h)
  4. уверенность, с которой мы предсказываем
  5. значение c соответствует классу объекта (например, автомобиль, светофор, животное).

Yolo может предсказать несколько ограничивающих рамок для каждой ячейки сетки. Для каждого объекта при обучении отвечает только одна ограничивающая рамка. Во время тестирования Yolo становится очень быстрым, потому что для него требуется только одна оценка сети, в отличие от методов на основе классификаторов. Йоло обучен функции потерь, которая приближается к характеристикам обнаружения. Из-за неправильной локализации.

Но Йоло может пострадать из-за меньшей группы объектов, таких как колония муравьев или косяк рыб. Йоло сталкивается с трудностями при обобщении объектов с новыми или необычными пропорциями и конфигурациями.