Получение изученного представления данных из неконтролируемого обучения в pylearn2

Мы можем обучить автоэнкодер в pylearn2, используя приведенный ниже файл YAML (вместе с pylearn2/scripts/train.py)

!obj:pylearn2.train.Train {
    dataset: &train !obj:pylearn2.datasets.mnist.MNIST {
        which_set: 'train',
        start: 0,
        stop: 50000
    },
    model: !obj:pylearn2.models.autoencoder.DenoisingAutoencoder {
        nvis : 784,
        nhid : 500,
        irange : 0.05,
        corruptor: !obj:pylearn2.corruption.BinomialCorruptor {
            corruption_level: .2,
        },
        act_enc: "tanh",
        act_dec: null,    # Linear activation on the decoder side.
    },
    algorithm: !obj:pylearn2.training_algorithms.sgd.SGD {
        learning_rate : 1e-3,
        batch_size : 100,
        monitoring_batches : 5,
        monitoring_dataset : *train,
        cost : !obj:pylearn2.costs.autoencoder.MeanSquaredReconstructionError {},
        termination_criterion : !obj:pylearn2.termination_criteria.EpochCounter {
            max_epochs: 10,
        },
    },
    save_path: "./dae_l1.pkl",
    save_freq: 1
}

Мы получаем изученную модель автоэнкодера как «dae_l1.pkl».

Если я хочу использовать эту модель для контролируемого обучения, я могу использовать «dae_l1.pkl» для инициализации слоя MLP. Затем я могу обучить эту модель. Я даже могу предсказать результат модели, используя функцию fprop.

Но что, если я не хочу использовать эту предварительно обученную модель для контролируемого обучения, и я просто хочу сохранить новое изученное представление моих данных с помощью автоэнкодера.

Как я могу это сделать?

Еще более подробный вопрос размещен здесь


person Abhishek    schedule 21.09.2014    source источник


Ответы (2)


Это должен делать метод reconstruct маринованной модели - я считаю, что использование такое же, как fprop.

person Kyle Kastner    schedule 23.09.2014

Я думаю, вы можете использовать функции кодирования и декодирования автоэнкодера, чтобы получить скрытое представление. Например:

l1_path = 'dae_l1.pkl'
l1 = serial.load(l1_path)
"""encode"""
#layer 1
l1Input = l1.get_input_space().make_theano_batch()
l1Encode = l1.encode(l1Input)
l1Decode = l1.decode(l1Encode)
l1EncodeFunction = theano.function([l1Input], l1Encode)
l1DecodeFunction = theano.function([l1Encode], l1Decode)

Тогда представление будет:

l1encode = l1EncodeFunction(YourData)
person iTS    schedule 22.07.2015