Экземпляр → сложно, так как мы должны подсчитать количество экземпляров на изображении → очень сложно, и они могут перекрываться.
Быстрая RCNN → обновления → Маска RCNN.
В основном → изображение закодировано → это кодировка функции. (еще одна сеть, обученная классификации объектов).
FPN → мы собираемся выделить особенности в разных масштабах → сделать вещи намного более мощными. (FPN → можно выбрать несколько характерных изображений).
Затем создает региональную ограничивающую рамку → супер круто. (если есть перекрытие → может быть сложно решить, какие якорные блоки использовать).
Для лучшего соответствия объекту происходит множественное подавление. (это хорошо).
Теперь для каждого ограничивающего прямоугольника → для КАЖДОГО ограничивающего прямоугольника мы собираемся классифицировать → вот почему он такой мощный и динамичный.
Наконец, → мы собираемся сгенерировать маску сегментации. (маска наземной истины уменьшена до 256 * 256) → для упрощения обучения и ускорения.
Автор использовал разные инструменты аннотации.
Сеть извлечения признаков - это основа → без этого ничего.
Единственное различие между Faster RCNN → это сеть масок → создание маски сегментации. (и есть еще несколько этапов доработки).
Подавление не максимума → поскольку окклюзия - огромная проблема.
Разделяйте разные объекты и для каждого объекта → придайте определенную индивидуальность. (на этом изображении 7 объектов).
Довольно маленькая карта функций → но мы собираемся построить пирамиду.
Начало якорей → это заранее определенные места перед обучением → это гораздо более простой подход.
Компьютерное зрение - это крутая область → мы просим сеть нарисовать ограничивающую рамку на изображении → это очень важно и имеет множество приложений.
Softmax → будет предлагать несколько областей изображения →, которые будут содержать какой-то объект.
Некоторые сети используют → FCN →, чтобы получить карту сегментации или другое.
В принципе, если основа извлечения признаков выполнена хорошо → считайте, что проблема решена.
Они просто соединили две разные современные модели. (раскраска довольно проста → просто отображается с разными цветными картами).