Подробнее Введение в Pandas для опытных пользователей Excel

В другом посте мы научились (легко !!) выполнять 3 расширенные задачи Excel на Python. Здесь мы продолжим эту миссию и узнаем еще 3 сложные вещи, с которыми вы легко сможете справиться! Я надеюсь, что этот пост сделал Python более доступным, в то же время предоставив забавные сравнения между двумя замечательными инструментами.

Мы начнем с импорта панд и загрузки двух фреймов данных на основе листов, доступных в нашей книге. Мы используем те же наборы данных, что и в предыдущей статье.

Я загрузил сюда полную записную книжку для этого поста, если вы хотите продолжить. Его можно найти по этой ссылке. К сожалению, цветное форматирование не выполнено, но вы можете легко скопировать и вставить код оттуда. Точно так же, если вы хотите следовать в Excel, вы можете скачать файл по этой ссылке.

Давайте нырнем!

Форматирование цветовых карт в Pandas

Условное форматирование - один из тех замечательных инструментов в Excel, который позволяет нам быстро выбирать выбросы в данных, такие как самое высокое или самое низкое значение. Давайте сначала сделаем это в нашем файле Excel!

Выберите столбец, который хотите отформатировать.

На вкладке Главная выберите Условное форматирование, Цветовые шкалы и

Выберите масштаб, который хотите использовать. Мы использовали зеленый-желтый-красный.

В Pandas нам нужно применить метод стиля .background_gradient. Мы можем сделать это, введя:

sales.style.background_gradient(subset=[‘Sales’], cmap = ‘YlGnBu’)

Это возвращает:

Давайте немного разберем этот синтаксис:

  • Подмножество: определяет столбцы, к которым вы хотите применить это. Если вам нужно больше одного, держите их вложенными в список.
  • cmap: относится к карте цветов в Matplotlib. Это определяет тип цветовой шкалы, которую мы хотим применить. Более подробную информацию можно найти здесь".

Панели данных в Python

Подобно цветовым шкалам, гистограммы позволяют легко определить величину значения в ячейке.

Чтобы добавить гистограммы в Excel:

Выберите столбцы, которые хотите отформатировать.

На вкладке «Главная» выберите «Условное форматирование» → «Панели данных».

Для этого мы выбрали Solid Blue.

Чтобы добиться этого в Python с Pandas, мы можем написать следующее:

sales.style.bar(subset=['Sales'], color = '#50C878')

Давайте еще раз разберемся с этим:

  • Подмножество, опять же, относится к столбцам, к которым мы хотим применить форматирование, а
  • Цвет обозначает шестнадцатеричный код цвета, который мы хотим применить!

СУММЕСЛИ в пандах

Наконец, мы узнаем, как заполнять СУММЕСЛИМН в Python. Функции СУММЕСЛИ позволяют складывать значения на основе условий (возникает ли это условие в другом столбце, зависит от нас).

В примере слева мы вычисляем общий объем продаж для всех продаж бананов. Мы достигли этого с помощью формулы:

=SUMIF(sales[Product], "Bananas", sales[Sales])

Мы можем сделать то же самое в Python, написав:

sales.loc[sales["Product"] == "Bananas", "Sales"].sum()

Как и в Excel, возвращается 5843. Давайте разберемся, что здесь происходит:

Заключение: узнайте, как (легко !!) выполнять ЕЩЕ 3 расширенные задачи Excel в Python

В этом посте мы узнали, как выполнять три дополнительных сложных задачи в Excel и Pandas. Мы узнали, как применять цветовые шкалы, цветовые полосы и функции СУММЕСЛИ в Pandas.

Если вы еще не сделали этого, ознакомьтесь с первой частью этого сообщения, нажав на эту ссылку.

Спасибо за прочтение!