Как сэкономить время на поиск по сетке и перекрестную проверку в k раз для настройки гиперпараметров?

Я планирую выполнить поиск по сетке с k-кратной перекрестной проверкой (CV) для оптимизации гиперпараметров LSTM. Допустим, у меня есть n комбинаций гиперпараметров и определено k -кратное резюме. Это означает, что мне нужно запускать LSTM n x k раз, что может потребовать больших вычислительных ресурсов.

Q1. есть ли какой-нибудь практический совет, который поможет сэкономить время?

Чтобы сэкономить время, что, если 1) я разделю все данные обучения на test vs val (например, 80:20), без k-кратного увеличения, и найду оптимальные гиперпараметры; в этом случае n x 1 запусков и 2) выполнить k -кратное CV для LSTM только с оптическим гиперпараметром, найденным из 1), чтобы продемонстрировать общую производительность выбранного LSTM? Имеет ли это смысл?


person SunO    schedule 27.03.2020    source источник


Ответы (1)


Для больших моделей CV нецелесообразно. Таким образом, вы должны разделить свои данные методом train-val-test.

Поиск по сетке также не лучший подход, предпочтительнее использовать случайный поиск, почему, см., Например, здесь.

person Fabricio    schedule 29.03.2020