Pandas - это библиотека с открытым исходным кодом, построенная на основе библиотеки NumPy. Это пакет Python, который предлагает различные структуры данных и операции для управления числовыми данными и временными рядами.
Он в основном популярен для упрощения импорта и анализа данных. Pandas быстр и обладает высокой производительностью и производительностью для пользователей.
Библиотека NumPy, которая предоставляет объекты для многомерных массивов, pandas предоставит объект 2d таблицы в памяти под названием Dataframe. поэтому у pandas будет много дополнительных функций, таких как построение графиков, создание сводных таблиц.
# Создание фрейма данных с использованием списка: DataFrame может быть создан с использованием одного списка или списка списков.
Dataframe можно визуализировать как словари Series. Dataframe будет в виде строк и столбцов, данных
Во фрейм данных можно легко добавить новые столбцы и строки. Помимо основных функций, фрейм данных панды можно сортировать по определенному столбцу.
head (): возвращает первые 5 строк в объекте фрейма данных
tail (): возвращает 5 нижних строк фрейма данных
info (): печатает сводку фрейма данных
описать (): дает хороший обзор основных агрегированных значений по каждому столбцу
Итак, это небольшое пошаговое руководство по концепции Pandas.Каждый раз, когда мы начинаем изучать Pandas, есть вероятность, что вы можете блуждать в Pandas, например, в индексе, функциях, NumPy и т. Д., Но мы должны понимать основы концепции не позволяйте путанице дойти до нас.
Наконец, мы должны четко понимать, что Pandas - это инструмент для визуализации и более глубокого понимания ваших данных.
Вот ссылка на мою записную книжку Kaggle, чтобы начать
Https://www.kaggle.com/deepikabhandarkar/pandas/edit
Использованная литература :
Https://www.geeksforgeeks.org/pandas-tutorial/
Https://pandasguide.readthedocs.io/en/latest/
Первоначально опубликовано на https://www.numpyninja.com 17 мая 2021 г.