Я тренирую проблему регрессии ограничивающей рамки и использую координатный компонент функции потерь, описанный в документ YOLO а>.
Метод 1. В качестве входных данных для ИНС использовался вектор признаков HOG. Та же функция потерь. Подарили хорошую модель.
Метод 2: Использование изображений в качестве входных данных для CNN. Последний слой остается таким же, как и в методе 1. Такая же функция потерь. Но я столкнулся с проблемой расчета потерь. Он печатает nan loss для обучения, разработки и тестирования с самой первой эпохи.
Как мне заставить CNN работать, если та же самая функция потерь отлично работает с ANN? И в чем может быть причина такого явления? Я хотел бы иметь возможность использовать ту же функцию потерь.