В первых трех частях этой серии мы подчеркивали важность очистки данных временных рядов и предлагали различные методы обработки отсутствующих данных, работы с тенденциями и сезонностью, а также удаления аномалий или выбросов. В этой заключительной части мы углубимся в сглаживание данных, которое является важным шагом в анализе данных временных рядов.

Сглаживание данных

Сглаживание данных — это метод, используемый для удаления шума из данных временных рядов, что упрощает их анализ и интерпретацию. Существует несколько методов сглаживания данных, таких как скользящие средние, экспоненциальное сглаживание, передискретизация и сплайн-интерполяция. Однако важно отметить, что не все данные временных рядов требуют сглаживания. Необходимость сглаживания зависит от анализа или модели, которую вы собираетесь использовать. В некоторых случаях сильно предварительно обработанные данные, как в данном примере, могут не требовать дополнительного сглаживания. Всегда важно оценивать ваши данные и учитывать конкретный контекст, чтобы определить, необходимо ли сглаживание.

Скользящие средние

Скользящие средние включают вычисление среднего значения фиксированного количества последовательных точек данных, таких как предыдущие три или пять точек. Это может помочь устранить краткосрочные колебания данных и выявить долгосрочные тенденции.

# Calculate a rolling mean with a window of 3
df_smoothed = df_beer['Production'].rolling(window=3).mean().dropna()

Экспоненциальное сглаживание

Экспоненциальное сглаживание — это метод сглаживания данных, который использует средневзвешенное значение прошлых наблюдений для создания сглаженного значения для текущего наблюдения. Веса, присвоенные каждому прошлому наблюдению, со временем уменьшаются экспоненциально, при этом более поздним наблюдениям придается больший вес, чем более старым.

Экспоненциальное сглаживание — широко используемый и эффективный метод удаления шума и выявления тенденций в данных временных рядов. Его можно применять к различным типам временных рядов, включая те, которые имеют тренд, сезонность или и то, и другое.