Образец CNTK ImageDeserializer и DCGAN

Я переделываю этот образец https://github.com/Microsoft/CNTK/blob/master/Tutorials/CNTK_206B_DCGAN.ipynb для работы с файлами png MNIST (а не с одномерным массивом изображений, который используется в учебнике). Я использую ImageDeserializer (и файл карты для загрузки данных):

def create_mb_source(map_file, image_dims, num_classes, randomize=True):
transforms = [
    xforms.scale(width=image_dims[2], height=image_dims[1], channels=image_dims[0], interpolations='linear')]
return MinibatchSource(ImageDeserializer(map_file, StreamDefs(
    features=StreamDef(field='image', transforms=transforms),
    labels=StreamDef(field='label', shape=num_classes))),
                       randomize=randomize)

Я изменил ввод-вывод на Дискриминатор, чтобы ожидать изображение 28x28 (и вывод Генератора). См. код здесь: https://github.com/olgaliak/cntk-cyclegan/blob/master/trainDCGan.py

проблема в том, что trainDCGan.py теперь генерирует шум. Ценю вашу помощь!


person OlgaLi    schedule 15.05.2017    source источник
comment
Не могли бы вы проверить, что данные, выходящие в образце мини-пакета, имеют правильную форму и отображают изображение цифр в соответствии с вашими ожиданиями.   -  person Sayan Pathak    schedule 16.05.2017


Ответы (1)


Проблема была решена после того, как я 1) переключился на использование 3 каналов в ImageDeserializer 2) изменил сетевую архитектуру, чтобы использовать 2d strides\kernels вместо 1d. Этот коммит выделяет изменения, благодаря которым все заработало.

person OlgaLi    schedule 18.05.2017