Использовать модель обнаружения объектов как средство извлечения функций

У меня есть модель mask-rcnn, которая была обучена с помощью API обнаружения объектов для обнаружения некоторых объектов. Теперь у меня есть другая задача, которая должна выполнить регрессию на этих изображениях (а также на других функциях). Можно ли использовать обученную модель mask-rcnn в качестве экстрактора признаков (аналогично тому, как работает передача обучения) и изменить последний слой (или слои) на другую задачу?


person Pawel    schedule 15.05.2020    source источник


Ответы (1)


Mask r-cnn создает общую карту функций, которая используется для прогнозов в регионах RPN. Немного изменив API обнаружения объектов, вы можете извлечь тензор, содержащий функции для данной области. Обычно эти функции используются для предсказания поля / маски, но вы можете использовать его для чего угодно.

Если вам нужен только экстрактор функций (он остается замороженным), это должно сработать. Если вы действительно хотите продолжить обучение маске r-cnn на основе дальнейших результатов нисходящего потока, это становится труднее сделать с API обнаружения объектов, потому что вам нужно все подключить и изменить кучу обучающего кода TF. В этом случае вы можете подумать о создании собственной модели или о другом подходе в зависимости от проблемы.

person xcodesucks123    schedule 16.05.2020
comment
Чрезмерная самореклама может быть воспринята сообществом как спам. Взгляните на справочный центр и особенно последний раздел Какое поведение ожидается от пользователей?: Избегайте явного саморекламы. Возможно, вас также заинтересуют Как не быть спамером и Запрещены ли ключевые слова и подписи?. - person Ian Campbell; 15.07.2020