Ваша база данных будет практически бесполезна в будущем, если вы сохраните только отдельные значения состояния. Вам нужен временной ряд
Данные были золотой жилой последнего десятилетия, и большие данные с каждым годом растут быстрее, чем в предыдущем, благодаря всем другим связанным областям, таким как машинное обучение и Интернет вещей.
Получение большего количества данных от ваших пользователей очень ценно. Вы можете изучать их поведение, обнаруживать закономерности и многое другое, о чем вы прямо сейчас не можете себе представить. Но в будущем все это станет возможным с вашими данными.
Эра временных рядов
Вы сможете анализировать прошлое, настоящее и будущее! Что изменилось по сравнению со старыми способами сохранения только последних состояний ваших данных?
Вы генерируете больше данных каждую минуту!
Мы получаем лучшее оборудование, хранилище и более умные алгоритмы.
Данные - это стандарт для всего.
Данные временных рядов везде
Даже если вы не думаете, что у вас есть такие данные, вы должны рассматривать данные, которыми вы управляете, с более широкой точки зрения.
Общая чистая стоимость акций S&P представляет собой временной ряд:
Данные о погоде меняются ежедневно, но вы хотите сохранить всю историю:
Даже положение вашей личной Tesla может стать данными временного ряда, учитывая, что наличие всей истории конкретных данных может привести вас к достижению невероятных результатов, таких как отслеживание вора вашей Tesla.
Предскажите мое будущее!
Вы можете получить много идей, используя больше данных:
- Аналитика: для выявления тенденций за определенный период времени.
- Визуализация: для усиления информационных панелей в вашей организации.
- Машинное обучение: больше входных и выходных данных позволит вам создавать модели машинного обучения в будущем.
- Автоматизация: определение пороговых значений, запускающих конвейеры или рабочие процессы.
Как выглядят данные временных рядов?
Как вы думаете, это похоже!
Как это на самом деле выглядит!
Что это меняет?
В прошлом вы в основном делали UPDATES
. С временными рядами вы в основном будете использовать только INSERT
!
Раньше вы в основном писали случайно распределенные данные. С временными рядами вы будете писать в недавние временные интервалы!
В прошлом вы сосредоточились на написании на основе первичного ключа. С временными рядами вы будете писать на основе первичного ключа, объединенного со значением временной метки!
Как вы действительно можете начать?
Вы можете очень глубоко погрузиться в эту область, пытаясь найти новое представление о том, как реализовать это историческое управление версиями значений, которые вы всегда запоминали в базе данных вашего приложения.
Вашим первым шагом может быть попытка найти базу данных временных рядов, которую можно использовать у предпочитаемого вами облачного провайдера. Следующим шагом может быть попытка заполнить вашу конкретную базу данных набором образцов данных, уже отформатированных таким своевременным образом - вероятно, из любого конкурса на Kaggle, который занимается анализом временных рядов.
Я оставлю вас с последней мыслью для размышления после прочтения этого краткого введения в данные временных рядов: все ли данные являются данными временных рядов?
Хотите больше узнать о временных рядах?
Я также предлагаю вам несколько книг, которые в основном используются разработчиками машинного обучения, но это поможет вам получить некоторые знания и размышления по этой теме:
- Практический анализ временных рядов: прогнозирование со статистикой и машинным обучением: https://amzn.to/393uDzA
- Введение в временные ряды и прогнозирование: https://amzn.to/3pGzKvF
Ссылки и ресурсы
- Https://amzn.to/393uDzA
- Https://amzn.to/3pGzKvF
- Https://www.youtube.com/watch?v=TQk_tc03MyQ
- Https://www.youtube.com/watch?v=7hxXU9dceaE
- Https://blog.timescale.com/blog/what-the-heck-is-time-series-data-and-why-do-i-need-a-time-series-database-dcf3b1b18563/
- Https://www.trustradius.com/time-series-databases
- Https://www.kaggle.com/tags/time-series-analysis