Выполнение 10-кратной перекрестной проверки во время обучения с помощью Image Data Generator

Я создал CNN для двоичной классификации набора данных из 400 изображений. Мой код следующий:

def neural_network():
  classifier = Sequential()

  # Adding a first convolutional layer
  classifier.add(Convolution2D(48, 3, input_shape = (320, 320, 3), activation = 'relu'))
  classifier.add(MaxPooling2D())

  # Adding a second convolutional layer
  classifier.add(Convolution2D(48, 3, activation = 'relu'))
  classifier.add(MaxPooling2D())

  #Flattening
  classifier.add(Flatten())

  #Full connected
  classifier.add(Dense(256, activation = 'relu'))
 
  #Full connected
  classifier.add(Dense(1, activation = 'sigmoid'))


  classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

  classifier.summary()


  train_datagen = ImageDataGenerator(rescale = 1./255,
                                    shear_range = 0.2,
                                    horizontal_flip = True,
                                    vertical_flip=True,
                                    brightness_range=[0.5, 1.5])

  test_datagen = ImageDataGenerator(rescale = 1./255)
  test_final_datagen = ImageDataGenerator(rescale = 1./255)
  test_final_four = ImageDataGenerator(rescale = 1./255)

  training_set = train_datagen.flow_from_directory('/content/drive/My Drive/data_sep/train',
                                                  target_size = (320, 320),
                                                  batch_size = 32,
                                                  class_mode = 'binary')

  test_set = test_datagen.flow_from_directory('/content/drive/My Drive/data_sep/validate',
                                              target_size = (320, 320),
                                              batch_size = 32,
                                              class_mode = 'binary')

  
  test_final = test_final_datagen.flow_from_directory('/content/drive/My Drive/data_sep/validate',
                                              target_size = (320, 320),
                                              batch_size = 32,
                                              class_mode = 'binary',
                                              shuffle = False)

  filepath  = "/content/drive/My Drive/data_sep/weightsbestval.hdf5"
  checkpoint = ModelCheckpoint(filepath, monitor='val_accuracy', verbose=1, save_best_only=True, mode='max',save_weights_only=True)
  callbacks_list = [checkpoint]

  history = classifier.fit(training_set,
                          epochs  = 50,
                          validation_data = test_set,
                          callbacks= [callbacks_list]
                          )
  
  
  best_score = max(history.history['val_accuracy'])

Как я могу выполнить 10-кратную перекрестную проверку моего набора данных? Я не видел где-либо 10-кратного выполнения с увеличением данных, но с таким небольшим количеством изображений точность будет очень низкой. Что я могу сделать?


person asimplecoder    schedule 23.11.2020    source источник


Ответы (1)


концептуально вам нужно следующее:

  • выгружать все изображения в один каталог
  • поместить все имена файлов в фрейм данных
  • генерировать индексы для k-кратного с помощью sklearn.model_selection.KFold
  • run 10 cycles of:
    • select train and validation filenames using DF slices with k-fold indices.
    • используйте ImageDataGenerator.dataflow_from_dataframe() для кормления модели
    • оценить модель

подробнее см. flow_from_dataframe() docs

person Poe Dator    schedule 23.11.2020