Исследовательский анализ данных с использованием различных библиотек Python.

Индия с более чем 5,3 миллионами случаев заболевания является одной из стран, наиболее пострадавших от коронирусного вируса. Число погибших в Индии превысило 85 000 человек.

Как энтузиаст науки о данных, я решил изучить различные факторы, из-за которых вирус короны распространяется по всей стране. С помощью этого набора данных https://www.kaggle.com/sudalairajkumar/covid19-in-india я смог сделать некоторые прогнозы относительно этих факторов.

Импорт библиотек

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import cufflinks as cf
cf.go_offline()
%matplotlib inline
import plotly_express as px
import plotly.graph_objects as go
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
init_notebook_mode(connected=True)
import datetime
from IPython.display import HTML

Чтение данных

Поскольку все данные были в формате CSV, их было довольно просто прочитать через библиотеку pandas.

Исследовательский анализ данных

Различные графики были построены с помощью библиотеки морских.

Было замечено, что большинство пострадавших были в возрастной группе 20–50.

Почти 67% пациентов были мужчинами.

На изображении выше показано распределение по состояниям. Махараштра был наиболее пострадавшим штатом в стране.

Таким образом, мы показали несколько простых, но подробных визуализаций и анимаций в полном коде.

Полный код для этой статьи доступен по адресу:

https://www.kaggle.com/umaaairr11/covid-in-depth-eda