Я планирую выполнить поиск по сетке с k-кратной перекрестной проверкой (CV) для оптимизации гиперпараметров LSTM. Допустим, у меня есть n комбинаций гиперпараметров и определено k -кратное резюме. Это означает, что мне нужно запускать LSTM n x k раз, что может потребовать больших вычислительных ресурсов.
Q1. есть ли какой-нибудь практический совет, который поможет сэкономить время?
Чтобы сэкономить время, что, если 1) я разделю все данные обучения на test vs val (например, 80:20), без k-кратного увеличения, и найду оптимальные гиперпараметры; в этом случае n x 1 запусков и 2) выполнить k -кратное CV для LSTM только с оптическим гиперпараметром, найденным из 1), чтобы продемонстрировать общую производительность выбранного LSTM? Имеет ли это смысл?