Загрузка обученной модели Keras и продолжение обучения

Мне было интересно, можно ли сохранить частично обученную модель Keras и продолжить обучение после повторной загрузки модели.

Причина этого в том, что в будущем у меня будет больше обучающих данных, и я не хочу снова переобучать всю модель.

Я использую следующие функции:

#Partly train model
model.fit(first_training, first_classes, batch_size=32, nb_epoch=20)

#Save partly trained model
model.save('partly_trained.h5')

#Load partly trained model
from keras.models import load_model
model = load_model('partly_trained.h5')

#Continue training
model.fit(second_training, second_classes, batch_size=32, nb_epoch=20)

Редактировать 1: добавлен полностью рабочий пример

С первым набором данных после 10 эпох потеря последней эпохи будет 0,0748, а точность 0,9863.

После сохранения, удаления и перезагрузки модели потеря и точность модели, обученной на втором наборе данных, составят 0,1711 и 0,9504 соответственно.

Это вызвано новыми данными обучения или полностью переобученной моделью?

"""
Model by: http://machinelearningmastery.com/
"""
# load (downloaded if needed) the MNIST dataset
import numpy
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.utils import np_utils
from keras.models import load_model
numpy.random.seed(7)

def baseline_model():
    model = Sequential()
    model.add(Dense(num_pixels, input_dim=num_pixels, init='normal', activation='relu'))
    model.add(Dense(num_classes, init='normal', activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

if __name__ == '__main__':
    # load data
    (X_train, y_train), (X_test, y_test) = mnist.load_data()

    # flatten 28*28 images to a 784 vector for each image
    num_pixels = X_train.shape[1] * X_train.shape[2]
    X_train = X_train.reshape(X_train.shape[0], num_pixels).astype('float32')
    X_test = X_test.reshape(X_test.shape[0], num_pixels).astype('float32')
    # normalize inputs from 0-255 to 0-1
    X_train = X_train / 255
    X_test = X_test / 255
    # one hot encode outputs
    y_train = np_utils.to_categorical(y_train)
    y_test = np_utils.to_categorical(y_test)
    num_classes = y_test.shape[1]

    # build the model
    model = baseline_model()

    #Partly train model
    dataset1_x = X_train[:3000]
    dataset1_y = y_train[:3000]
    model.fit(dataset1_x, dataset1_y, nb_epoch=10, batch_size=200, verbose=2)

    # Final evaluation of the model
    scores = model.evaluate(X_test, y_test, verbose=0)
    print("Baseline Error: %.2f%%" % (100-scores[1]*100))

    #Save partly trained model
    model.save('partly_trained.h5')
    del model

    #Reload model
    model = load_model('partly_trained.h5')

    #Continue training
    dataset2_x = X_train[3000:]
    dataset2_y = y_train[3000:]
    model.fit(dataset2_x, dataset2_y, nb_epoch=10, batch_size=200, verbose=2)
    scores = model.evaluate(X_test, y_test, verbose=0)
    print("Baseline Error: %.2f%%" % (100-scores[1]*100))

Редактировать 2: примечания tenorflow.keras

Для tensorflow.keras измените параметр nb_epochs на эпохи в соответствии с моделью. Функции импорта и базовой модели:

import numpy
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import load_model


numpy.random.seed(7)

def baseline_model():
    model = Sequential()
    model.add(Dense(num_pixels, input_dim=num_pixels, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

Wilmar van Ommeren 08.03.2017 источник

comment

Вы это проверяли? Я не вижу причин, чтобы это не работало. - maz 08.03.2017

comment

Сейчас я вижу, что моя точность падает примерно на 10 процентов после загрузки модели (только в первые эпохи). Если перезагрузка работает, это, конечно, вызвано новыми данными обучения. Но я просто хочу убедиться, что это действительно так. - Wilmar van Ommeren 08.03.2017

comment

Сохраняете ли вы свою модель напрямую с помощью model.save или используете контрольную точку модели (keras.io / callbacks / # example-model-checkpoints)? Если вы используете model.save, есть ли вероятность, что вы сохраняете последнюю модель (т.е. последнюю эпоху) вместо лучшей (самая низкая ошибка)? Можете ли вы предоставить актуальный код? - maz 08.03.2017

comment

Сохраняю свою последнюю модель, не самую лучшую (до этого момента я не знал, что это возможно). Я подготовлю код - Wilmar van Ommeren 08.03.2017

comment

Я добавил пример кода. Здесь точность падает на 3,6 процента, а потеря увеличивается с 0,07 до 0,17 между последней эпохой первого набора данных и первой эпохой второго набора данных. - Wilmar van Ommeren 08.03.2017

comment

Так не могли бы вы перезагрузить это и продолжить обучение на тех же данных поезда? Это должно убедить вас, что перезагрузка в порядке, если результаты будут сопоставимы. - Marcin Możejko 08.03.2017

comment

Такое простое решение. Ваше право @ MarcinMożejko. Это работает. Спасибо! - Wilmar van Ommeren 08.03.2017

comment

Как насчет всех параметров обучения, таких как, например, скорость обучения. Сохраняются ли они при возобновлении тренировок? - Antonio Sesto 01.12.2017

Ответы (7)

arrow_upward
40
arrow_downward

Фактически - model.save сохраняет всю информацию, необходимую для перезапуска обучения в вашем случае. Единственное, что может испортить перезагрузка модели, - это состояние вашего оптимизатора. Чтобы проверить это - попробуйте save перезагрузить модель и обучить ее на данных обучения.

Marcin Możejko 08.03.2017

comment

@Marcin: при использовании keras save() сохраняет ли он лучший результат (наименьшие потери) модели или последний результат (последнее обновление) модели? Благодарность - Lion Lai; 28.11.2017

comment

последнее обновление. Обратный вызов контрольной точки модели предназначен для сохранения лучшего. - Holi; 30.11.2017

comment

@Khaj Вы имеете в виду эту keras.io/callbacks/#modelcheckpoint? Вроде по умолчанию сохраняет последнее обновление (не самое лучшее); лучший сохраняется, только если save_best_only=True установлен явно. - flow2k; 17.09.2019

comment

Вопрос, сохраняет ли model.save скорость обучения в случае планирования скорости обучения или снижения скорости обучения. Я хочу заниматься онлайн-обучением и не хочу, чтобы каждый полученный мной пример имел такой же эффект, как и данные обучения, которые я использовал. - Mahmoud Youssef; 26.01.2021

arrow_upward
23
arrow_downward

Большинство приведенных выше ответов касались важных моментов. Если вы используете последнюю версию Tensorflow (TF2.1 или выше), следующий пример вам поможет. Модельная часть кода взята с сайта Tensorflow.

import tensorflow as tf
from tensorflow import keras
mnist = tf.keras.datasets.mnist

(x_train, y_train),(x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

def create_model():
  model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(512, activation=tf.nn.relu),  
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
    ])

  model.compile(optimizer='adam', loss='sparse_categorical_crossentropy',metrics=['accuracy'])
  return model

# Create a basic model instance
model=create_model()
model.fit(x_train, y_train, epochs = 10, validation_data = (x_test,y_test),verbose=1)

Сохраните модель в формате * .tf. По моему опыту, если у вас определен какой-либо custom_loss, формат * .h5 не сохранит статус оптимизатора и, следовательно, не будет служить вашей цели, если вы захотите переобучить модель с того места, где мы оставили.

# saving the model in tensorflow format
model.save('./MyModel_tf',save_format='tf')


# loading the saved model
loaded_model = tf.keras.models.load_model('./MyModel_tf')

# retraining the model
loaded_model.fit(x_train, y_train, epochs = 10, validation_data = (x_test,y_test),verbose=1)

Этот подход перезапустит обучение с того места, где мы остановились перед сохранением модели. Как упоминалось другими, если вы хотите сохранить веса лучшей модели или хотите сохранять веса модели каждую эпоху, вам необходимо использовать функцию обратных вызовов keras (ModelCheckpoint) с такими параметрами, как save_weights_only=True, save_freq='epoch' и save_best_only.

Дополнительные сведения см. здесь и в другом примере здесь.

Vishnuvardhan Janapati 06.04.2020

comment

хорошо, это выглядит очень многообещающе - спасибо за информацию. В этом примере мне кажется, что вы переобучаете модель на тех же данных, которые использовались для обучения. Если да, то я бы подумал, что правильным подходом будет загрузка нового подмножества обучающих данных для повторного обучения (чтобы отразить новую информацию, вводимую в процесс)? - bibzzzz; 06.04.2020

comment

@bibzzzz Согласен с вами. Очень хороший комментарий. Я хотел продемонстрировать переобучение на тех же данных, чтобы улучшить производительность. Суть ясно показывает улучшение производительности там, где оно было остановлено перед сохранением модели. Полностью согласен с тем, что переучивайтесь на других данных и попробую позже. Спасибо! - Vishnuvardhan Janapati; 06.04.2020

comment

отлично - вы очень хорошо это продемонстрировали, спасибо. - bibzzzz; 06.04.2020

comment

Вы уверены в этом Сохраните модель в формате * .tf. По моему опыту, если у вас определен какой-либо custom_loss, формат * .h5 не сохранит статус оптимизатора, потому что он никогда не упоминается в документации Keras. tensorflow.org/guide/keras/save_and_serialize - Stallion; 20.07.2021

arrow_upward
10
arrow_downward

Проблема может заключаться в том, что вы используете другой оптимизатор - или другие аргументы оптимизатора. У меня была такая же проблема с пользовательской предварительно обученной моделью, используя

reduce_lr = ReduceLROnPlateau(monitor='loss', factor=lr_reduction_factor,
                              patience=patience, min_lr=min_lr, verbose=1)

для предварительно обученной модели, при этом исходная скорость обучения начинается с 0,0003, а во время предварительного обучения она снижается до min_learning rate, которая составляет 0,000003

Я просто скопировал эту строку в сценарий, который использует предварительно обученную модель, и получил очень плохую точность. Пока я не заметил, что последней скоростью обучения предварительно обученной модели была минимальная скорость обучения, то есть 0,000003. И если я начну с этой скорости обучения, я получу точно такую же точность, что и результат предварительно обученной модели - что имеет смысл, поскольку начиная со скорости обучения, которая в 100 раз больше, чем последняя скорость обучения, использованная в предварительно обученной модели. Модель приведет к значительному превышению GD и, следовательно, к значительному снижению точности.

Wolfgang 28.12.2017

arrow_upward
3
arrow_downward

Обратите внимание, что у Keras иногда возникают проблемы с загруженными моделями, как, например, здесь. Это может объяснить случаи, когда вы не начинаете с той же обученной точности.

shahar_m 26.07.2017

arrow_upward
1
arrow_downward

Все вышеперечисленное помогает, вы должны возобновить обучение с той же скорости обучения (), что и LR, когда модель и веса были сохранены. Установите его прямо в оптимизаторе.

Обратите внимание, что улучшение оттуда не гарантируется, потому что модель могла достичь локального минимума, который может быть глобальным. Нет смысла возобновлять модель для поиска другого локального минимума, если только вы не намерены увеличить скорость обучения контролируемым образом и подтолкнуть модель к возможно лучшему минимуму неподалеку.

flowgrad 29.05.2018

comment

Это почему? Разве я не могу использовать меньший LR, чем раньше? - lte__; 10.07.2019

comment

На самом деле, продолжение обучения МОЖЕТ привести вас к лучшей модели, если вы получите больше данных. Так что есть смысл возобновить модель, чтобы найти другой локальный минимум. - Corey Levinson; 31.10.2019

arrow_upward
1
arrow_downward

Вы также можете нажать Concept Drift, см. Следует ли переобучать модель при появлении новых наблюдений. Также существует концепция катастрофического забывания, о которой говорится в ряде научных статей. Вот один с MNIST Эмпирическое исследование катастрофического забывания

Gustavo 10.12.2018

arrow_upward
0
arrow_downward

Если вы используете TF2, используйте новый метод saved_model (формат pb). Дополнительная информация доступна здесь и здесь.

model.fit(x=X_train, y=y_train, epochs=10,callbacks=[model_callback])#your first training
tf.saved_model.save(model, save_to_dir_path) #save the model
del model #to delete the model
model =  tf.keras.models.load_model(save_to_dir_path)
model.fit(x=X_train, y=y_train, epochs=10,callbacks=[model_callback])#your second training

vimzie 30.01.2021

Загрузка обученной модели Keras и продолжение обучения

Ответы (7)

Вопросы по теме