Pandas - это библиотека с открытым исходным кодом, построенная на основе библиотеки NumPy. Это пакет Python, который предлагает различные структуры данных и операции для управления числовыми данными и временными рядами.

Он в основном популярен для упрощения импорта и анализа данных. Pandas быстр и обладает высокой производительностью и производительностью для пользователей.

Библиотека NumPy, которая предоставляет объекты для многомерных массивов, pandas предоставит объект 2d таблицы в памяти под названием Dataframe. поэтому у pandas будет много дополнительных функций, таких как построение графиков, создание сводных таблиц.

# Создание фрейма данных с использованием списка: DataFrame может быть создан с использованием одного списка или списка списков.

Dataframe можно визуализировать как словари Series. Dataframe будет в виде строк и столбцов, данных

Во фрейм данных можно легко добавить новые столбцы и строки. Помимо основных функций, фрейм данных панды можно сортировать по определенному столбцу.

head (): возвращает первые 5 строк в объекте фрейма данных

tail (): возвращает 5 нижних строк фрейма данных

info (): печатает сводку фрейма данных

описать (): дает хороший обзор основных агрегированных значений по каждому столбцу

Итак, это небольшое пошаговое руководство по концепции Pandas.Каждый раз, когда мы начинаем изучать Pandas, есть вероятность, что вы можете блуждать в Pandas, например, в индексе, функциях, NumPy и т. Д., Но мы должны понимать основы концепции не позволяйте путанице дойти до нас.

Наконец, мы должны четко понимать, что Pandas - это инструмент для визуализации и более глубокого понимания ваших данных.

Вот ссылка на мою записную книжку Kaggle, чтобы начать

Https://www.kaggle.com/deepikabhandarkar/pandas/edit

Использованная литература :

Https://www.geeksforgeeks.org/pandas-tutorial/

Https://pandasguide.readthedocs.io/en/latest/

Первоначально опубликовано на https://www.numpyninja.com 17 мая 2021 г.