У меня есть модель mask-rcnn, которая была обучена с помощью API обнаружения объектов для обнаружения некоторых объектов. Теперь у меня есть другая задача, которая должна выполнить регрессию на этих изображениях (а также на других функциях). Можно ли использовать обученную модель mask-rcnn в качестве экстрактора признаков (аналогично тому, как работает передача обучения) и изменить последний слой (или слои) на другую задачу?
Использовать модель обнаружения объектов как средство извлечения функций
Ответы (1)
Mask r-cnn создает общую карту функций, которая используется для прогнозов в регионах RPN. Немного изменив API обнаружения объектов, вы можете извлечь тензор, содержащий функции для данной области. Обычно эти функции используются для предсказания поля / маски, но вы можете использовать его для чего угодно.
Если вам нужен только экстрактор функций (он остается замороженным), это должно сработать. Если вы действительно хотите продолжить обучение маске r-cnn на основе дальнейших результатов нисходящего потока, это становится труднее сделать с API обнаружения объектов, потому что вам нужно все подключить и изменить кучу обучающего кода TF. В этом случае вы можете подумать о создании собственной модели или о другом подходе в зависимости от проблемы.