Как классифицировать образ Cifar с помощью Alexnet на Deeplearning4j

Я новичок в Deeplearning4j и собираюсь протестировать классификацию изображений Cifar-10. Я просто копирую пример Alexnet из DL4j (AnimalsClassification.java), например:

    MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
        .seed(seed)
        .weightInit(WeightInit.DISTRIBUTION)
        .dist(new NormalDistribution(0.0, 0.01))
        .activation(Activation.RELU)
        .updater(Updater.NESTEROVS)
        .iterations(iterations)
        .gradientNormalization(GradientNormalization.RenormalizeL2PerLayer) // normalize to prevent vanishing or exploding gradients
        .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
        .learningRate(1e-2)
        .biasLearningRate(1e-2*2)
        .learningRateDecayPolicy(LearningRatePolicy.Step)
        .lrPolicyDecayRate(0.1)
        .lrPolicySteps(100000)
        .regularization(true)
        .l2(5 * 1e-4)
        .momentum(0.9)
        .miniBatch(false)
        .list()
        .layer(0, convInit("cnn1", channels, 96, new int[]{11, 11}, new int[]{4, 4}, new int[]{3, 3}, 0))
        .layer(1, new LocalResponseNormalization.Builder().name("lrn1").build())
        .layer(2, maxPool("maxpool1", new int[]{3,3}))
        .layer(3, conv5x5("cnn2", 256, new int[] {1,1}, new int[] {2,2}, nonZeroBias))
        .layer(4, new LocalResponseNormalization.Builder().name("lrn2").build())
        .layer(5, maxPool("maxpool2", new int[]{3,3}))
        .layer(6,conv3x3("cnn3", 384, 0))
        .layer(7,conv3x3("cnn4", 384, nonZeroBias))
        .layer(8,conv3x3("cnn5", 256, nonZeroBias))
        .layer(9, maxPool("maxpool3", new int[]{3,3}))
        .layer(10, fullyConnected("ffn1", 4096, nonZeroBias, dropOut, new GaussianDistribution(0, 0.005)))
        .layer(11, fullyConnected("ffn2", 4096, nonZeroBias, dropOut, new GaussianDistribution(0, 0.005)))
        .layer(12, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD)
            .name("output")
            .nOut(numLabels)
            .activation(Activation.SOFTMAX)
            .build())
        .backprop(true)
        .pretrain(false)
        .setInputType(InputType.convolutional(height, width, channels))
        .build();

Когда я запускаю код, он выдает исключение, говорящее о том, что есть некоторые проблемы с конфигурацией «уровень-9» для нового int[]{3,3}, оно должно быть больше 0 и меньше, чем pHeight + 2*padH. При изменении веса * высоты с 32 * 32 на 100 * 100 в java-коде он работал правильно, но я и не должен, результат должен быть хорошим. Поэтому я немного запутался в конфигурации слоя на alexnet, работающем с изображениями 32 * 32.

deep-learning deeplearning4j dl4j

Jerome tan 09.01.2017 источник

Ответы (1)

arrow_upward
0
arrow_downward

Это не будет правильным примером для использования. Пожалуйста, подождите, пока мы не закончим импорт нашей новой модели из keras. Это также будет включать предварительно обученные модели.

Adam Gibson 10.01.2017

Как классифицировать образ Cifar с помощью Alexnet на Deeplearning4j

Ответы (1)

Вопросы по теме