Обзор вируса короны

Коронавирусы (CoV) - это большое семейство вирусов, вызывающих заболевания, варьирующиеся от простуды до более тяжелых заболеваний, таких как ближневосточный респираторный синдром (MERS-CoV) и тяжелый острый респираторный синдром (SARS-CoV). Новый вирус короны - это новый штамм, который ранее не был идентифицирован у людей.

Вирусы короны являются зоонозными, то есть передаются от животных к людям. Подробные исследования показали, что SARS-CoV передавался от циветтовых кошек человеку, а MERS-CoV - от верблюдов-верблюдов к людям. Несколько известных вирусов короны циркулируют среди животных, которые еще не заразили людей.

Общие признаки инфекции включают респираторные симптомы, жар, кашель, одышку и затрудненное дыхание. В более тяжелых случаях инфекция может вызвать пневмонию, тяжелый острый респираторный синдром, почечную недостаточность и даже смерть.

Стандартные рекомендации по предотвращению распространения инфекции включают регулярное мытье рук, прикрытие рта и носа при кашле и чихании, тщательное приготовление мяса и яиц. Избегайте тесного контакта с кем-либо, у кого проявляются симптомы респираторного заболевания, такие как кашель и чихание.

Изучение вируса CORONA

Набор данных о вирусе короны был размещен на kaggle. Вы можете скачать набор данных здесь.

data = pd.read_csv («// Пользователи // maheshsai // Desktop // Roman-corona-virus-2019-dataset // 2019_nCoV_data.csv»)
data.head ()

Давайте сделаем несколько интересных графиков на основе данных

Распределение подтвержденных, умерших и выздоровевших по дням

Количество поступивших обращений с течением времени составляет

Уровень смертности, замеченной с течением времени, составляет

Процент выздоровевших с течением времени составляет

мы ясно видим, что многие люди выздоровели. Так что не паникуйте и помните о симптомах.

Я также построил график смертей и выздоровлений.

По состоянию на 15 февраля люди из 30 разных стран и 62 разных городов заразились вирусом короны.

Подтвержденный список стран по состоянию на 15 февраля

Подтвержденный список городов на 15 февраля

Приведенные выше графики построены с использованием следующего фрейма данных

Эта информация также нанесена на карту мира для лучшей визуализации.

Вышеупомянутый сюжет написан по-деревенски. Информация о городах, пострадавших в Китае, также нанесена отдельно.

Применение прогнозирования временных рядов к данным

Если количество обращений, которые будут получены на следующий день, будет оценено, мы сможем спланировать более качественные услуги.

Наряду со стандартными моделями прогнозирования, такими как AR, MA и ARIMA, я применил нейронные сети для прогнозирования количества полученных обращений. Я начал прогнозировать количество случаев, взятых из мира, затем применяю прогноз для случаев из конкретной страны, а затем и из конкретного города.

Я написал функцию для выбора лучших значений p, d, q в модели ARIMA.

Результаты модели ARIMA

Вычисление доверительного интервала для прогноза от ARIMA может быть полезно для оценки случаев, т.е. мы можем ожидать случаев между нижней и верхней границей.

Мы можем передавать данные временных рядов в повторяющиеся нейронные сети для прогнозирования. Подробнее о подготовке данных для прогнозирования и подгонки данных к модели нейронной сети можно узнать здесь.

Код для построения простой нейронной сети, который я использовал,

model = Sequential()
model.add(LSTM(50, activation=’relu’, input_shape=(3, 1)))
model.add(Dense(1))
model.compile(optimizer=’adam’, loss=’mse’)

мы можем прогнозировать, используя функцию прогнозирования

Я также применил модель croston, которая используется для прогнозирования прерывистых закономерностей на наших данных. Для построения модели Croston я использовал функцию

Результаты для модели Кростона

Доверительный интервал для прогноза по модели Кростона находится между 29 454 и 49 506, то есть мы можем ожидать случаев между 29 454 и 49 506.

Как я уже упоминал, я извлек данные о подтвержденных случаях в Китае и сделал прогнозы с помощью тех же моделей.

Расчет доверительных интервалов помогает оценить случаи внутри страны.

Я также применил нейронные сети для прогнозирования данных по стране. Вы можете получить доступ к коду и прогнозу здесь.

Моя настоящая идея - применить прогнозирование по городу. Таким образом, можно идеально спланировать предоставляемые услуги. Я расскажу об этом в следующем посте.

Я завершу этот пост ответом на один важный вопрос, а именно:

Может ли вирус КОРОНА распространяться по воздуху?

Многие источники уже пришли к выводу «НЕТ». Я попытался доказать то же самое на основе данных, имеющихся в наборе данных.

Давайте посмотрим, какие страны не пострадали в первый день и пострадали во второй день.

Выберите один город из списка и проанализируйте близлежащие города, доступные в нашем наборе данных. Этот город может пострадать или не пострадать в первый день. Давайте посмотрим на данные по этому городу.

После подробного наблюдения за различными возможными комбинациями, многие из близлежащих городов либо менее затронуты, либо не затронуты в предыдущий день. Кроме того, города, которые сильно пострадали в предыдущий день, находятся далеко от городов, которые пострадали позже. Таким образом, вероятность распространения по воздуху может быть меньше.

Заключение

Мы провели предварительный анализ данных по этому набору данных. Мы также применили прогнозирование временных рядов по количеству обращений, чтобы лучше планировать услуги. Наконец, мы попытались доказать, что вирус короны не распространяется по воздуху. Для этого анализа потребовалось много предварительной обработки данных. Вы можете получить доступ к полному коду здесь.

Спасибо за прочтение :)