Я использую TinyYolo с deeplearning4j, прочитав этот учебник http://emaraic.com/blog/yolo-custom-object-detector, но я не совсем уверен, нужна ли мне дополнительная конфигурация для обработки изображений 720p, поскольку изображения в этом примере имеют размер 416x416. Есть ли жесткие требования к этому? Я просто изо всех сил пытаюсь полностью понять некоторые конфигурации, как указано:
private static final int CHANNELS = 3;
private static final int GRID_WIDTH = 13;
private static final int GRID_HEIGHT = 13;
private static final int CLASSES_NUMBER = 1;
private static final int BOXES_NUMBER = 5;
private static final double[][] PRIOR_BOXES = {{1.5, 1.5}, {2, 2}, {3,3}, {3.5, 8}, {4, 9}};//anchors boxes
private static final int BATCH_SIZE = 4;
private static final int EPOCHS = 50;
private static final double LEARNIGN_RATE = 0.0001;
private static final int SEED = 1234;
private static final double LAMDBA_COORD = 1.0;
private static final double LAMDBA_NO_OBJECT = 0.5;
Раньше я использовал darkflow для своих меток и изображений и добился большого успеха. Я хотел использовать deeplearning4j для большей интеграции с имеющимся у меня java-проектом. Поскольку я изо всех сил пытался импортировать созданные мной модели, которые все еще успешно работают с некоторым кодом Python, который у меня есть, но, похоже, есть некоторые нюансы с экспортом.
Если бы кто-то мог пролить свет на это, я считаю, что должны быть способы обработки изображений 720p. Я считаю, что, возможно, нужно изменить размер. Я знаю, что даркнет и даркфлоу сами выполнили это действие. Кроме того, если я изменю размеры, потребуются ли изменения в XML-файлах аннотаций меток?
Спасибо за любую помощь.