Создание базовой круговой диаграммы с использованием Matplotlib

Как круговые диаграммы можно использовать для описания ваших данных.

Круговые диаграммы используются для представления категориальных данных в формате, который подчеркивает, как каждая точка данных способствует целому, то есть 100%. Диаграмма имеет круглую форму, похожую на круговую, и каждая точка данных представлена ​​определенным процентом, принимая при этом часть круговой диаграммы, имеющую форму среза. Чем больше его кусок в круговой диаграмме, тем большую долю занимает точка данных.

Как использовать круговую диаграмму в блокноте Jupyter

Получение набора данных

Набор данных был получен с веб-сайта английской премьер-лиги и извлечен из 15 лучших бомбардиров английской премьер-лиги. Затем ими манипулировали, чтобы выяснить, как команды премьер-лиги представлены в этой таблице.

После получения набора данных следующим шагом будет импорт пакета визуализации данных для анализа.

Импорт пакета визуализации данных

Пакет визуализации данных, который был импортирован для построения круговых диаграмм, называется Matplotlib, и он был импортирован с использованием следующих наборов кодов:

## Import data visualization packages
import matplotlib.pyplot as plt
%matplotlib inline

Создание круговой диаграммы

Цель состоит в том, чтобы построить круговую диаграмму, представляющую пять лучших команд, которые забили наибольшее количество голов среди 15 лучших бомбардиров премьер-лиги. Во-первых, будет построена очень простая круговая диаграмма. Круговая диаграмма сделана с использованием следующих кодов:

labels = df_score_2.index
colors = ['lightskyblue', 'red', 'blue', 'green', 'gold']
plt.pie(df_score_2['Stat'], labels= labels, colors=colors, startangle=90, autopct='%.1f%%')
plt.show()

label = df_score_2.index использовался для хранения индекса таблицы в качестве меток для круговой диаграммы. Ярлыки - это названия пяти команд. colors = ['lightskyblue', 'red', 'blue', 'green', 'gold'] будут использоваться для представления каждой части пяти команд премьер-лиги на круговой диаграмме как их цвета. plt.pie (df_score_2 ['Stat'], labels = labels, colors = colors, startangle = 90, autopct = '% .1f %%') должен быть используется для создания круговой диаграммы. df_score_2 [‘Stat’] содержит числовые значения каждой команды, которые делятся на общую сумму и умножаются на 100. Размеры их долей зависят от их пропорции. label = labels - это метка для каждого фрагмента круговой диаграммы. Параметр colors = colors предназначен для выделения цвета каждого фрагмента. startangle = 90 - это угол, с которого начинается построение круговой диаграммы. autopct = ’% .1f %% предназначен для форматирования того, как проценты отображаются на круговой диаграмме. Наконец, plt.show () используется для отображения круговой диаграммы.

Улучшение круговой диаграммы

Приведенная выше круговая диаграмма представляет собой черновик круговой диаграммы, которую можно улучшить, добавив дополнительные коды. Предполагая, что «Ливерпуль» должен был сыграть с «Тоттенхэмом», и обе команды хотят быть более заметными. Это можно сделать с помощью набора кодов, написанных ниже:

## for exploding the pie chart 
labels = df_score_2.index 
colors = ['lightskyblue', 'red', 'blue', 'green', 'gold']
explode =(0,0.1,0,0.1,0) 
plt.pie(df_score_2['Stat'], explode = explode,labels= labels, colors=colors, startangle=90, autopct='%.1f%%') 
plt.show()

В приведенном выше коде ничего не изменилось, за исключением того факта, что была добавлена ​​новая строка кода explode = (0,0.1,0,0.1,0). Если добавить эту строку кода и указать, что второй и четвертый члены заключенных в скобки значений равны 0,1, то Ливерпуль и Тоттенхэм Хотспур будут исключены из пирога. Затем к функции plt.pie добавляется новая команда explode = explode.

Улучшение круговой диаграммы II

Круговую диаграмму можно улучшить, добавив заголовок для более подробной информации и тени, чтобы она выглядела более солидно, используя приведенные ниже коды.

## Adding a title to the pie chart and a shadow to the chart 
labels = df_score_2.index 
colors = ['lightskyblue', 'red', 'blue', 'green', 'gold'] 
explode =(0,0.1,0,0.1,0)
plt.pie(df_score_2['Stat'], explode = explode,labels= labels, colors=colors, startangle=90, autopct='%.1f%%', shadow = True) plt.title("Top five teams with the most goals among the top 15 highest goal scorers \nin the premier league 2019/20 mid-season", fontsize = 18) 
plt.show()

Команда shadow = True была добавлена ​​к функции plt.pie, чтобы круговая диаграмма выглядела более элегантно. plt.title («Пять команд с наибольшим количеством голов среди 15 лучших бомбардиров \ n в премьер-лиге 2019/20 в середине сезона», fontsize = 18) код также использовался для добавления заголовка к круговой диаграмме.

Улучшение круговой диаграммы III

В круговую диаграмму можно внести больше улучшений, чтобы сделать ее более структурированной и презентабельной. Можно добавить легенду, увеличить круговую диаграмму и улучшить структуру изображения.

## Adding a legend to the chart and increasing its size 
labels = df_score_2.index 
colors = [‘lightskyblue’, ‘red’, ‘blue’, ‘green’, ‘gold’] 
explode =(0,0.1,0,0.1,0) 
fig, ax1 = plt.subplots(figsize = (24,12)) 
ax1.pie(df_score_2[‘Stat’], explode = explode, colors=colors, startangle=90, autopct=’%.1f%%’, shadow = True) 
plt.title(“Top five teams with the most goals among the top 15 highest goal scorers \nin the premier league 2019/20 mid-season”, fontsize = 24) 
ax1.legend(labels, loc = “upper right”) 
plt.tight_layout() 
plt.show()

Новые дополнения включают добавление fig, ax1 = plt.subplots (figsize = (24,12)), который является кодом, который используется для увеличения круговой диаграммы при назначении функции построения круговой диаграммы в ax1. plt.pie становится ax1.pie. Затем ax1.legend (labels, loc = «upper right») используется для добавления легенды к круговой диаграмме с метками в качестве легенд. и легенда, расположенная в правом верхнем углу рисунка. plt.tight_layout () используется для лучшего закрепления круговой диаграммы на фигуре.

Круговая диаграмма выше представляет собой красивую презентабельную форму круговой диаграммы и пример того, как поместить круговую диаграмму в круговую диаграмму.

Круговые диаграммы очень полезны для категоризации данных, которые в сумме дают общее значение, чтобы показать, сколько каждой категории в круговой диаграмме. Например, расовое представительство в кампусе колледжа или владение маркой автомобиля в районе.