Вот новое простое руководство по анализу набора данных.
В этом случае я взял итальянский набор данных о пациентах с положительным результатом на COVID-19, также известный как вирус Corona, предоставленный официальным репозиторием Protezione civile GitHub:
https ://github.com/pcm-dpc/COVID-19/blob/master/dati-andamento-nazionale/dpc-covid19-ita-andamento-nazionale.csv

Набор данных

Набор данных максимально прост, без бесполезных столбцов (много раз я видел необработанную информацию и столбцы без смысла).
В нашем анализе мы берем только два столбца, данные и totale_positivi (дата, total_positive).

Цель

Цель состоит в том, чтобы спрогнозировать количество положительных пациентов в этом временном ряду событий.
Мы хотим ответить на вопрос: Сколько положительных пациентов будет через 7 дней, как сейчас?

Модель

Модель представляет собой простое прогнозирование временных рядов с использованием модели python statsmodels ARIMA.

Язык

Как уже говорилось ранее, я использовал Python3, который очень надежен для такого рода анализа.

Код

Это огромный проект, и я приглашаю вас в мой репозиторий gitHub и посмотреть мой код, также я предлагаю разветвить или клонировать мой проект, потому что он находится под лицензией GNUv3, поэтому не стесняйтесь использовать его по своему усмотрению и адаптировать его к вашим данным.



………………………………………………………………………………………..
Оставьте здесь несколько комментариев и дайте мне знать, что вы думаете об этом.

Спасибо за внимание.