Мне было интересно, как использовать функции, разработанные во время обучения, для прогнозирования новых данных. Рассматриваемый набор данных — это набор данных об отмене встречи из Прогнозировать встречу без явки , Гитхаб
Рассмотрим функцию locations.PERCENT_TRUE(no_show)
: процент прошлых отмен встреч в данном месте. Допустим, у меня есть новые входящие тестовые данные с теми же местоположениями, что и в данных поезда, для которых я уже знаю эти значения. Как я могу использовать эту функцию в тестовых данных? Конечно, я могу объединить тестовые данные с данными поезда и пересчитать все функции, используя featuretools.dfs()
, но это занимает много времени.
Есть ли более простой способ?