Вот новое простое руководство по анализу набора данных.
В этом случае я взял итальянский набор данных о пациентах с положительным результатом на COVID-19, также известный как вирус Corona, предоставленный официальным репозиторием Protezione civile GitHub:
https ://github.com/pcm-dpc/COVID-19/blob/master/dati-andamento-nazionale/dpc-covid19-ita-andamento-nazionale.csv
Набор данных
Набор данных максимально прост, без бесполезных столбцов (много раз я видел необработанную информацию и столбцы без смысла).
В нашем анализе мы берем только два столбца, данные и totale_positivi (дата, total_positive).
Цель
Цель состоит в том, чтобы спрогнозировать количество положительных пациентов в этом временном ряду событий.
Мы хотим ответить на вопрос: Сколько положительных пациентов будет через 7 дней, как сейчас? ”
Модель
Модель представляет собой простое прогнозирование временных рядов с использованием модели python statsmodels ARIMA.
Язык
Как уже говорилось ранее, я использовал Python3, который очень надежен для такого рода анализа.
Код
Это огромный проект, и я приглашаю вас в мой репозиторий gitHub и посмотреть мой код, также я предлагаю разветвить или клонировать мой проект, потому что он находится под лицензией GNUv3, поэтому не стесняйтесь использовать его по своему усмотрению и адаптировать его к вашим данным.
………………………………………………………………………………………..
Оставьте здесь несколько комментариев и дайте мне знать, что вы думаете об этом.
Спасибо за внимание.