Визуализация/обработка данных
Узнайте, насколько Индия добилась большего успеха, чем многие страны, в борьбе с COVID-19 с помощью простого графика!
Данные говорят лучше, чем слова
(Примечание: существуют различные факторы, связанные с тем, почему у Индии все хорошо, но основным фактором являются ранние действия и карантин, вы можете прочитать об этом в этой статье)
После того, как ВОЗ объявила COVID-19 пандемией, многие страны начали блокировать свои страны, что означает, что каждый гражданин этой страны должен оставаться дома и выходить из дома только в случае крайней необходимости и в чрезвычайных ситуациях.
Для выполнения повестки дня о том, как помогает изоляция, мы возьмем примеры таких стран, как США и Италия, которые сильно страдают из-за этой пандемии.
Прежде чем углубиться в детали кодирования, давайте проясним несколько статистических данных, которые важны для понимания приведенного выше графика!
Во время изучения ситуации в США различные штаты, местные органы власти приняли меры и объявили чрезвычайное положение, закрытие учебных заведений, компаний и т. д.
Большинство штатов приняли решение о блокировке до29 марта 2020 года. Но они опоздали с этой мерой, потому что общее количество случаев достигло 140 000.
Если бы президент США Дональд Трамп принял меры раньше и приказал ввести общенациональный карантин, то его можно было бы остановить!
24 марта 2020 г. премьер-министр Индии приказал ввести общенациональный карантин для борьбы с COVID-19. Это произошло после того, как общее число подтвержденных случаев заболевания коронавирусом в Индии составило примерно 500.
Многие страны соблюдают режим самоизоляции и прилагают достаточно усилий для борьбы с этой пандемией, предоставляя нуждающимся товары первой необходимости, распространяя информацию через СМИ, социальные сети и т. д.
Теперь пусть данные говорят правду, помогает ли изоляция бороться или нет!
Мы будем импортировать наборы данных по указанной ниже ссылке и необходимые библиотеки.
import pandas as pd import numpy as np url="https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv" Confirmed= pd.read_csv(url)
Базовая предварительная обработка для извлечения необходимых функций из набора данных.
df = Confirmed.groupby(by='Country/Region').sum().reset_index() df = df.drop(['Lat', 'Long'], axis=1) df = df[df['Country/Region'].isin([ 'China', 'Spain', 'Italy', 'Germany', 'France', 'Turkey', 'Russia', 'US', 'Brazil', 'Canada', 'India', ])] x = df['Country/Region'].values
Вкратце, мы преобразуем фрейм данных pandas в массив numpy, просматриваем каждое значение массива и вычисляем дни для достижения количества случаев, упомянутых в case_list[].
df_array = df.to_numpy() day_list_final = [] case_list = [0, 5000, 10000, 20000, 30000] for i in range(0, 11): ind = 1 day_list = [] days = 0 for k in range(4): for j in range(ind, 99): if df_array[i][j] >= case_list[k] and df_array[i][j] \ <= case_list[k + 1]: days += 1 else: ind = j day_list.append(days) break day_list_final.append(day_list)
Теперь у нас есть список дней, за которые дела должны быть упомянуты в case_list[]. мы преобразуем в фрейм данных и посмотрим на окончательный фрейм данных.
df = pd.DataFrame(day_list_final, columns=['0-5000', '5000-10000', '10000-20000', '20000-30000'], index=x) df['20000-30000'] = df['20000-30000'] - df['10000-20000'] df['10000-20000'] = df['10000-20000'] - df['5000-10000'] df['5000-10000'] = df['5000-10000'] - df['0-5000'] print(df)
Что говорят данные?
- Согласно отчету, коронавирус возник из Китая, и эти цифры подтверждают это. Количество дней, необходимое для достижения 0–5000, очень меньше, что позволяет предположить, что Китай является основным источником вируса.
- Индия достигла 0–5000 случаев за 76 дней, что составляет наибольшее количество дней, чтобы достичь 0–5000 случаев во всех странах, перечисленных выше.
- Индии потребовалось 97 дней, чтобы достичь 30 000 случаев, что является самым высоким показателем по сравнению со всеми другими странами.
Окончательный вывод:-
Индия блокирует нацию 24 марта.
- положительные случаи 500 ок.
- население 1,3 млрд.
- Дела по состоянию на 6 мая — ок. 50 тыс.
Большинство штатов Италии были заблокированы до 10 марта.
- положительные случаи 10 тыс. ок.
- население 60 млн.
- Дела по состоянию на 6 мая — ок. 200 тыс.
Большинство штатов Америки были заблокированы до 29 марта.
- положительных случаев 140 тыс.
- население 320 млн.
- дел по состоянию на 6 мая — ок. 1200 тыс.