Как модели со временем изучают новую информацию, сохраняя и развивая предыдущие знания

Добро пожаловать обратно в серию Иллюстрированное машинное обучение. Если вы читали другие статьи из этой серии, вы знаете, в чем дело. Мы берем (скучную) концепцию машинного обучения и делаем ее интересной, иллюстрируя ее! В этой статье будет рассмотрена концепция под названием Поэтапное обучение, согласно которой модели машинного обучения со временем изучают новую информацию, сохраняя и развивая предыдущие знания. Но прежде чем углубиться в это, давайте сначала поговорим о том, как выглядит процесс построения модели сегодня.

При построении моделей мы обычно следуем процессу, который называется статическое обучение. В этом процессе мы обучаем модель, используя последние доступные данные. Настраиваем и настраиваем модель в процессе обучения. И как только мы удовлетворены его производительностью, мы его развертываем. Данная модель находится в производстве уже некоторое время. Затем мы замечаем, что производительность модели со временем ухудшается. Именно тогда мы выбрасываем существующую модель и строим новую, используя последние доступные данные. И промываем и повторяем тот же процесс.

Проиллюстрируем это на конкретном примере. Рассмотрим этот гипотетический сценарий. Мы начали создавать модель мошенничества в конце января 2023 года. Эта модель определяет, является ли транзакция по кредитной карте мошеннической или нет. Мы обучаем нашу модель, используя все данные о транзакциях по кредитным картам, которые у нас были за последний годичный период (с января 2022 г. по декабрь 2022 г.), и используем данные о транзакциях за этот месяц (январь 2023 г.) для тестирования модели.

В конце следующего месяца мы замечаем, что модель работает не слишком хорошо на новых данных. Поэтому мы построили еще одну модель, но на этот раз используя данные за последний годичный период (с февраля 2022 года по январь 2023 года) для ее обучения, а затем использовали данные текущего месяца (февраль 2023 года) для ее тестирования. И все данные за пределами этих периодов обучения и тестирования удаляются.