Дата и время часто настолько беспорядочны, что становятся бесполезными. При правильной очистке мы можем использовать их для получения ценной информации.

В наборах данных, где дата и время указаны вместе, они бесполезны и ничего не вносят, поскольку их невозможно интегрировать ни в модель, ни в анализ.

И большую часть времени их dtype будет в объекте, что еще больше сделает его недействительным. Но при правильном обращении и преобразовании в полезную переменную она может привнести другую перспективу в анализ и в модель.

Чтобы решить эту проблему, в pandas есть функция, которая может обрабатывать такие сценарии. to_datetime изменит столбец на отметку времени из объекта dtype

df['Start_Time']=pd.to_datetime(df.Start_Time)

Когда он находится в формате даты и времени, его можно использовать для проведения ряда анализов, извлекая различные периоды дней, месяцев, недель и времени.

days=df.Start_Time.dt.day_of_week       #7 days format 
months = df.Start_Time.dt.month         #12 months format 
hours = df.Start_Time.dt.hour           #24 hours format

Использование .dt.day_of_week

Будет извлекать и выдавать только дни из столбца даты и времени . Дни недели будут отображаться от 0 до 6 с понедельника по воскресенье соответственно.

Использование .dt.month

Извлечет и выдаст месяцы для столбца даты и времени . Он также будет отображаться в числовом формате от 1 до 12 для января и декабря соответственно.

Использование dt.hour

Извлечет и выдаст часы в формате 24 часа .

Представьте, что набор данных имеет дело с авариями и просто исправлением столбца даты и времени. Это поможет получить представление о том, в какой день месяца происходит больше всего несчастных случаев (или) в какое время дня происходит больше всего несчастных случаев. На ее основе можно построить даже прогностическую модель, чтобы предсказать, в какое время года произойдет всплеск несчастных случаев.

Всем им можно задать такие переменные, как день, месяц, часы, и их можно использовать для получения ценной информации.

Вот и все .

Не стесняйтесь комментировать и рассказывать о любых других методах, которые вы используете для обработки даты и времени .