Визуализация данных с использованием matplotlib в Python.

В этой статье мы собираемся изучить визуализацию данных с помощью matplotlib в Python. Визуализация данных - один из важных способов эффективного представления анализа данных. Эта статья призвана помочь и быстро разобраться в matplotlib. Мы продемонстрируем, как создавать наиболее широко и часто используемые графики в визуализации данных, и обсудим, когда использовать каждый из них.

Давайте начнем.

Что такое матплотлиб?

У Python есть сотни и тысячи библиотек. matplotlib - одна из самых мощных библиотек в Python для визуализации данных. Вы можете увидеть подробную документацию по Matplotlib на https://matplotlib.org. Matplotlib позволяет программистам на Python выполнять визуализацию данных очень простым способом.

Как установить matplotlib

Если у вас есть Anaconda Navigator, вы можете просто установить matplotlib из своего терминала или командной строки, используя:

conda install matplotlib

Если на вашем компьютере нет Anaconda, установите matplotlib со своего терминала, используя:

pip install matplotlib

Как я импортировать библиотеку matplotlib

Вы можете импортировать matplotlib и использовать его в программах Python для визуализации. matplotlib.pyplot - это интерфейс matplotlib на основе состояний. Он предлагает способ построения графиков, подобный MATLAB. Pyplot в основном нацелен на интерактивные графики и простые случаи программного создания сюжетов. Например,

import matplotlib.pyplot as plt

Обычно matplotlib импортируется под псевдонимом plt. Кроме того, вы можете дать любое другое имя.

Если вы используете записную книжку Jupyter, вы должны использовать приведенный ниже код для отображения графиков:

%matplotlib inline

Но если вы используете matplotlib в скрипте Python, вам необходимо добавить приведенную ниже строку кода в скрипт, чтобы иметь возможность отображать свой график на экране.

plt.show()

С помощью нескольких строк кода мы можем создавать различные графики, такие как линейные, гистограммы, точечные диаграммы, гистограммы, гистограммы, круговые диаграммы и т. Д..

Линейные графики

Линейный график - один из самых простых графиков matplotlib. Линейный график обычно используется для отображения взаимосвязи между двумя числовыми наборами значений. Например:

Сделать стильную, привлекательную и понятную визуализацию вашего сюжета в matplotlib очень просто, и вы можете украсить свой сюжет следующим образом:

Гистограмма

Гистограмма облегчает сравнение различных наборов данных среди разных групп. Он показывает взаимосвязь с использованием двух осей, в которых категории находятся на одной оси, а дискретные значения - на другой оси. Гистограмма показывает основные изменения данных с течением времени.

Чтобы создать столбчатую диаграмму, вам нужно изменить код с plt.plot() на plot.bar(), и он будет преобразован в столбчатую диаграмму. Если вы заглянете внутрь кода, вы также можете добавить цвет аргумента, это поможет нам быстро настроить цвет графика. Например:

Вы также можете перевернуть гистограмму по горизонтали, используя plt.barh(). Например:

Диаграммы разброса

Диаграмма рассеяния используется для изображения отношения между двумя числовыми столбцами в виде разбросанных точек. Обычно диаграмма рассеяния используется, когда для каждого значения на оси x есть несколько значений на оси y. Для диаграммы рассеяния необходимо изменить код с plt.bar() на plt.scatter(). Вы также можете включить аргумент s. s указывает размер точек на графике. Например:

Гистограммы

Гистограммы используются для графического представления распределения вероятностей. Гистограмма - это просто гистограмма определенного типа.

Здесь интервалы - это аргумент, который позволяет вам настроить, сколько интервалов вы хотите в гистограмме, а альфа - это аргумент, который отображает уровень прозрачности точек данных.

Коробчатые графики

Коробчатая диаграмма позволяет сравнивать распределения значений, удобно показывая медиану, квартили, максимум и минимум набора значений. Например:

Круговые диаграммы

Круговая диаграмма - это круговой статистический график. Он может отображать только одну серию данных. Область диаграммы - это общий процент заданных данных. Например:

Заключение

В этой статье мы исследовали возможности matplotlib для визуализации. Как только мы углубимся в визуализацию с помощью matplotlib, мы сможем создавать красочные, подробные и яркие графики, которые могут помочь в принятии лучших решений. Вы также можете получить доступ к Блокноту Jupyter, чтобы выполнить руководство по визуализации данных, обсуждаемое в этой статье. С библиотекой matplotlib возможно создание множества графиков. В python доступны и другие популярные библиотеки, такие как seaborn, pandas plot, и plotly и т. Д.

Завершая заметки, не стесняйтесь делиться своими комментариями. Ваши лайки и комментарии, безусловно, помогут мне лучше представить контент. Увидимся на следующей неделе.

Больше контента на plainenglish.io