Визуализация/обработка данных

Узнайте, насколько Индия добилась большего успеха, чем многие страны, в борьбе с COVID-19 с помощью простого графика!

Данные говорят лучше, чем слова

(Примечание: существуют различные факторы, связанные с тем, почему у Индии все хорошо, но основным фактором являются ранние действия и карантин, вы можете прочитать об этом в этой статье)

После того, как ВОЗ объявила COVID-19 пандемией, многие страны начали блокировать свои страны, что означает, что каждый гражданин этой страны должен оставаться дома и выходить из дома только в случае крайней необходимости и в чрезвычайных ситуациях.

Для выполнения повестки дня о том, как помогает изоляция, мы возьмем примеры таких стран, как США и Италия, которые сильно страдают из-за этой пандемии.

Прежде чем углубиться в детали кодирования, давайте проясним несколько статистических данных, которые важны для понимания приведенного выше графика!

Во время изучения ситуации в США различные штаты, местные органы власти приняли меры и объявили чрезвычайное положение, закрытие учебных заведений, компаний и т. д.

Большинство штатов приняли решение о блокировке до29 марта 2020 года. Но они опоздали с этой мерой, потому что общее количество случаев достигло 140 000.

Если бы президент США Дональд Трамп принял меры раньше и приказал ввести общенациональный карантин, то его можно было бы остановить!

24 марта 2020 г. премьер-министр Индии приказал ввести общенациональный карантин для борьбы с COVID-19. Это произошло после того, как общее число подтвержденных случаев заболевания коронавирусом в Индии составило примерно 500.

Многие страны соблюдают режим самоизоляции и прилагают достаточно усилий для борьбы с этой пандемией, предоставляя нуждающимся товары первой необходимости, распространяя информацию через СМИ, социальные сети и т. д.

Теперь пусть данные говорят правду, помогает ли изоляция бороться или нет!

Мы будем импортировать наборы данных по указанной ниже ссылке и необходимые библиотеки.

import pandas as pd
import numpy as np
url="https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
Confirmed= pd.read_csv(url)

Базовая предварительная обработка для извлечения необходимых функций из набора данных.

df = Confirmed.groupby(by='Country/Region').sum().reset_index()
df = df.drop(['Lat', 'Long'], axis=1)
df = df[df['Country/Region'].isin([
    'China',
    'Spain',
    'Italy',
    'Germany',
    'France',
    'Turkey',
    'Russia',
    'US',
    'Brazil',
    'Canada',
    'India',
    ])]
x = df['Country/Region'].values

Вкратце, мы преобразуем фрейм данных pandas в массив numpy, просматриваем каждое значение массива и вычисляем дни для достижения количества случаев, упомянутых в case_list[].

df_array = df.to_numpy()
day_list_final = []
case_list = [0, 5000, 10000, 20000, 30000]
for i in range(0, 11):
    ind = 1
    day_list = []
    days = 0
    for k in range(4):
        for j in range(ind, 99):
            if df_array[i][j] >= case_list[k] and df_array[i][j] \
                <= case_list[k + 1]:
                days += 1
            else:
                ind = j
                day_list.append(days)
                break
    day_list_final.append(day_list)

Теперь у нас есть список дней, за которые дела должны быть упомянуты в case_list[]. мы преобразуем в фрейм данных и посмотрим на окончательный фрейм данных.

df = pd.DataFrame(day_list_final, columns=['0-5000', '5000-10000',
                  '10000-20000', '20000-30000'], index=x)
df['20000-30000'] = df['20000-30000'] - df['10000-20000']
df['10000-20000'] = df['10000-20000'] - df['5000-10000']
df['5000-10000'] = df['5000-10000'] - df['0-5000']
print(df)

Что говорят данные?

  1. Согласно отчету, коронавирус возник из Китая, и эти цифры подтверждают это. Количество дней, необходимое для достижения 0–5000, очень меньше, что позволяет предположить, что Китай является основным источником вируса.
  2. Индия достигла 0–5000 случаев за 76 дней, что составляет наибольшее количество дней, чтобы достичь 0–5000 случаев во всех странах, перечисленных выше.
  3. Индии потребовалось 97 дней, чтобы достичь 30 000 случаев, что является самым высоким показателем по сравнению со всеми другими странами.

Окончательный вывод:-

Индия блокирует нацию 24 марта.

  1. положительные случаи 500 ок.
  2. население 1,3 млрд.
  3. Дела по состоянию на 6 мая — ок. 50 тыс.

Большинство штатов Италии были заблокированы до 10 марта.

  1. положительные случаи 10 тыс. ок.
  2. население 60 млн.
  3. Дела по состоянию на 6 мая — ок. 200 тыс.

Большинство штатов Америки были заблокированы до 29 марта.

  1. положительных случаев 140 тыс.
  2. население 320 млн.
  3. дел по состоянию на 6 мая — ок. 1200 тыс.

Таким образом, в такой стране, как Индия с населением в миллиарды человек, примерно 50 тысяч случаев заболевания — отличный признак того, что она хорошо борется с этим вирусом по сравнению с другими странами, в которых меньше населения и больше случаев.