Исследовательский анализ данных с использованием различных библиотек Python.
Индия с более чем 5,3 миллионами случаев заболевания является одной из стран, наиболее пострадавших от коронирусного вируса. Число погибших в Индии превысило 85 000 человек.
Как энтузиаст науки о данных, я решил изучить различные факторы, из-за которых вирус короны распространяется по всей стране. С помощью этого набора данных https://www.kaggle.com/sudalairajkumar/covid19-in-india я смог сделать некоторые прогнозы относительно этих факторов.
Импорт библиотек
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import cufflinks as cf cf.go_offline() %matplotlib inline import plotly_express as px import plotly.graph_objects as go from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot init_notebook_mode(connected=True) import datetime from IPython.display import HTML
Чтение данных
Поскольку все данные были в формате CSV, их было довольно просто прочитать через библиотеку pandas.
Исследовательский анализ данных
Различные графики были построены с помощью библиотеки морских.
Было замечено, что большинство пострадавших были в возрастной группе 20–50.
Почти 67% пациентов были мужчинами.
На изображении выше показано распределение по состояниям. Махараштра был наиболее пострадавшим штатом в стране.
Таким образом, мы показали несколько простых, но подробных визуализаций и анимаций в полном коде.
Полный код для этой статьи доступен по адресу: