Коллекция библиотек Python, используемых для визуализации данных.

Прежде чем мы перейдем к коллекции библиотек Python для визуализации данных, было бы неплохо узнать несколько фундаментальных понятий о визуализации данных и понять, почему это важно.

Я считаю, что визуализация — одно из самых мощных средств достижения личных целей. — Харви Маккей

По сути, мы не умеем рассказывать истории с помощью данных. Визуализация данных помогает нам сократить время, необходимое для понимания и объяснения идей, содержащихся в наших данных. Так что же именно подразумевается под визуализацией данных? Визуализация данных представляет данные в визуальной форме (например, в виде графиков, диаграмм, инфографики, анимации или карт), чтобы их было легче понять. Основное использование визуализации данных — изучение данных и передача данных. Итак, что же такого важного в визуализации данных? Визуализация данных имеет решающее значение, потому что она помогает нам сократить время, необходимое для понимания данных, и облегчает нам рассказывание историй с данными.

Есть несколько библиотек Python, которые могут помочь нам в создании визуализаций данных. В этой статье я рассмотрю несколько библиотек Python, которые можно использовать для визуализации данных (статической и интерактивной визуализации). Итак, приступим!

1. Matplotlib

На первую позицию я поставлю Matplotlib как наиболее широко используемую библиотеку Python для визуализации данных. Matplotlib — это библиотека, используемая для классической визуализации данных. Каждый, кто начинает изучать визуализацию данных в python, наверняка использовал Matplotlib. Типы визуализации данных в Matplotlib включают базовые графики, графики массивов, графики статистики и графики для неструктурированных координат. Существует множество сторонних пакетов, созданных поверх и расширяющих Matplotlib, таких как Seaborn, Cartopy, DNA Features Viewer, Plotnine, WCS Axes и другие. До сих пор была выпущена версия Matplotlib 3.5.2.

Прежде чем использовать Matplotlib, вам необходимо сначала установить его.

# Install using pip:
pip install matplotlib

# Install using conda:
conda install matplotlib

Подробнее о Matplotlib можно прочитать здесь.

2. Сиборн

Далее я поставлю Seaborn на второе место после Matplotlib. Seaborn — это библиотека Python, созданная поверх Matplotlib для визуализации данных. Он предоставляет высокоуровневый интерфейс для рисования привлекательных и информативных статистических графиков. Кроме того, Seaborn также интегрирован со структурой данных pandas. Seaborn разработан так, чтобы быть эффективным на протяжении всего жизненного цикла исследовательского проекта. Seaborn поддерживает быстрое прототипирование и исследовательский анализ данных, предоставляя целые изображения с помощью одного вызова функции с минимальным вводом данных. Его также можно использовать для создания отточенных рисунков качества публикации, поскольку он предоставляет множество возможностей настройки, а также предоставляет основные объекты Matplotlib (Waskom, 2021). До сих пор была выпущена версия Seaborn 0.11.2.

Прежде чем использовать Seaborn, вам необходимо сначала установить его. Имейте в виду, что при установке Seaborn также будут установлены несколько других библиотек, таких как NumPy, SciPy, pandas и Matplotlib.

# Install using pip:
pip install seaborn

# Install using conda:
conda install seaborn

Подробнее о Seaborn можно прочитать здесь.

3. сюжет

После Seaborn поставлю Plotly как питоновскую библиотеку для интерактивной визуализации данных. Plotly — это интерактивная библиотека визуализации, которая используется для визуализации данных в Jupyter, локально в браузере или даже для размещения этих графиков для просмотра на платформе для визуализаций и информационных панелей, созданных командой Plotly под названием Dash. Plotly предлагает на выбор более 40 типов диаграмм, охватывающих широкий спектр статистических, финансовых, географических, научных и трехмерных приложений. Plotly Python построен на основе библиотеки JavaScript Plotly (plotly.js). До сих пор была выпущена версия Plotly для Python 5.8.0.

Прежде чем использовать Plotly, вам необходимо сначала установить его.

# Install using pip:
pip install plotly

# Install using conda:
conda install -c plotly plotly

Подробнее о Plotly можно прочитать здесь.

4. Боке

На четвертом месте боке. Как и Plotly, Bokeh — это библиотека Python, используемая для интерактивной визуализации данных. Bokeh фокусируется на экосистеме Python, а Plotly строится на основе plotly.js. Графики, информационные панели и приложения, созданные с помощью Bokeh, можно публиковать на веб-страницах или в блокнотах Jupyter. Кроме того, одно из преимуществ Bokeh заключается в том, что вы можете создавать визуализации на основе JavaScript без написания JavaScript самостоятельно. До сих пор вышло Боке версии 2.4.3.

Прежде чем использовать Bokeh, вам необходимо сначала установить его.

# Install using pip:
pip install bokeh

# Install using conda:
conda install bokeh

Подробнее о боке можно прочитать здесь.

5. Альтаир

На пятой позиции Альтаир. Altair — это библиотека Python для декларативной визуализации данных, основанная на Vega и Vega-lite. Основная концепция этой библиотеки заключается в том, что нам не нужно явно записывать каждую функцию на графике (например, ось x, ось y, цвет и т. д.). Эти детали будут обрабатываться Altair автоматически. Используя Altair, мы можем проектировать визуализацию данных, начиная от простой и заканчивая сложной, используя только относительно краткую грамматику. До сих пор была выпущена версия Altair 4.2.0.

Прежде чем использовать Altair, вам необходимо сначала установить его. Почти как Seaborn, когда вы устанавливаете Altair, в качестве точек входа также будут установлены следующие модули: jsonschema, NumPy, Pandas и Toolz.

# Install using pip:
pip install altair

# Install using conda:
conda install -c conda-forge altair

Подробнее об Альтаире можно прочитать здесь.

6. Пайдек

на последнем месте Pydeck — популярная библиотека Python для визуализации данных. Pydeck — это библиотека Python для крупномасштабного пространственного рендеринга, которая отображает визуализацию в виде слоев поверх Mapbox. Чтобы использовать Pydeck, вам нужен доступ в Интернет, если доступа к Интернету нет, визуализация не будет отображаться. С помощью Pydeck мы можем включать или отключать элементы управления картой, а также изменять тип проекции карты, например, рисовать на плоской плоскости вместо построения в проекции Меркатора. До сих пор была выпущена версия Pydeck 0.7.1.

Прежде чем использовать Pydeck, вам необходимо сначала установить его.

# Install using pip:
pip install pydeck

# Install using conda:
conda install -c conda-forge pydeck

Подробнее о Pydeck можно прочитать здесь.

Ссылки:

[1] Дж. Д. Хантер, «Matplotlib: среда 2D-графики, Computing in Science & Engineering, vol. 9, нет. 3, стр. 90–95, 2007».

[2] Кнафлик, К. (2015). Рассказывание историй с помощью данных: руководство по визуализации данных для бизнес-профессионалов. Уайли.

[3] Васком, М.Л., (2021). seaborn: визуализация статистических данных. Journal of Open Source Software, 6(60), 3021, https://doi.org/10.21105/joss.03021

[4] https://plotly.com/python/

[5] https://docs.bokeh.org/en/latest/index.html

[6] https://altair-viz.github.io/index.html

[7] https://deckgl.readthedocs.io/ru/latest/

Возможно, вам будет интересно прочитать следующую статью: