Наше определение временных рядов: последовательно раскрываемые, с отметками времени и критичные ко времени данные.

Примеры включают цены на акции, сканирование логистики, журналы машин, розничные продажи, посещения веб-сайтов… Противоположные примеры включают изображения, речь, потребительские предпочтения, социальные графики…

Почему алгоритмы машинного обучения, применяемые к временным рядам, работают хуже при использовании стандартных процедур обучения, проверки и тестирования?

Это происходит из-за трех особенностей временных рядов.

  1. У них нет стабильной базовой структуры. В других (технических) терминах вы не можете предполагать, что точки данных независимы и одинаково распределены («IID»). Безопаснее и реалистичнее предположить часто меняющиеся временные зависимости.
  2. Их последовательность важна для обучения. Предположим, вы учитесь распознавать кошек по миллиону изображений; порядок, в котором ваш алгоритм их обрабатывает, не изменит результат процесса обучения. Но если вы возьмете биржевую диаграмму, разобьете ее на ежедневные вариации и скормите их в случайном порядке вашему алгоритму, не останется ничего полезного для изучения.
  3. Их последовательность важна для интерпретации. Во временных рядах последовательность событий имеет такое же значение, как и сами события. Например, тот факт, что задержка доставки произошла сегодня, а не вчера, является потенциально важной информацией для менеджера цепочки поставок. Принимая во внимание, что тот факт, что я разместил свою фотографию сегодня, а не вчера, не влияет на возможность Facebook отметить меня.

Стандартная процедура обучения, проверки и тестирования основана на предположении, что точки данных являются IID. И стандартные методы разработки признаков изначально не работают с последовательными данными…

Отсюда два обычных последствия игнорирования особенностей временных рядов при построении решения для машинного обучения:

  • Без надлежащих процедур обучения и тестирования вы потеряете 30–50% максимально достижимой точности вашего решения. Конечно, для приложений с низким уровнем воздействия такое снижение производительности может быть приемлемым — что-то часто лучше, чем ничего.
  • Менее терпимым является тот факт, что у вас не будет уверенности в способности вашего решения противостоять контакту с реальностью: хотя можно игнорировать особенности временных рядов в контексте пробирки прототипов, они будут ударить вас по лицу, как только ваше решение будет запущено в производство.

Первоначально опубликовано на https://www.datapred.com.