Использование панды. Руководство для начинающих по python🐍🐼pandas.

Что такое панды?

Python pandas — это библиотека с открытым исходным кодом, которая широко используется для анализа данных.
Библиотека Pandas используется для чтения и обработки данных в машинном обучении и науке о данных.

пип установить панды

Команда pip для установки pandas в вашей системе.

Что такое датафрейм?

Pandas DataFrame — это двумерный массив данных или таблица со строками и столбцами.

Создать фрейм данных в пандах:

импортировать панды как pd
car_dataset = {
'cars': ['Tata', 'Maruti', 'Tesla'], 'Model': ['Nano', 'i10', '11x3'] , 'Диапазон: [300, 315, 400]
}
car_df = pd.DataFrame(car_dataset)
print(car_df)

Основные операции со столбцами в фрейме данных
Вы можете легко получить доступ к столбцу фрейма данных с помощью квадратных скобок, а также назначить или обновить его значения.
Ниже приведены некоторые основные операции, которые вы можете выполнять со столбцом фрейма данных.

#Доступ к одному столбцу
print(car_df[['cars']])
# вы также можете использовать одинарные квадратные скобки для доступа к одному столбцу
#Доступ к нескольким столбцам
print(car_df [[ 'Model', 'Range']])
# Добавить новый столбец
car_df['new_column_name'] = [1, 2, 3] # новое значение столбца
# Удалить столбец< br /> car_df.drop(columns=['new_col_name'], inplace=True)
# переименовать столбец
#Синтаксис: df.renamel columns={oldName:NewName}, inplace=True)
car_df.rename(columns={ 'Model' : 'model'}, inplace=True)

Чтение CSV-файла:

Простым способом хранения больших наборов данных является использование CSV-файлов (файлов, разделенных запятыми).
CSV-файлы — это распространенный тип файлов, который вы будете использовать при работе с машинным обучением или наукой о данных.

импортировать панд как pd
df = pd.read_csv('Housing.csv') print(df)
# print(df.to_string())
# использовать to_string() для печати всего Датафрейм.

Загляните в данные:

Чтобы понять общий обзор данных, pandas предлагает несколько функций, и некоторые из них:

импортировать pandas как pd
Чтение CSV-файла
df = pd.read_csv('Housing.csv')
#head of the data
print(df.head(10)) print первые 19 строк фрейма данных
#tall данных
print(df.tail(10)) напечатать последние 10 строк фрейма данных
#shape = Чтобы узнать размеры данных print(df .shape)
#(545, 19) 11 означает 545 строк и 13 столбцов
#Features
print(df.columns) # возвращает имя столбца
#Index(price , площадь, спальни ванные комнаты, этажи, matnroad
#гостевая, подвал, горячая водаотопление', 'кондиционирование,
#parking prefarea, Furnituretatus ], dtype=object)
#info
print (df.info())
выводит информацию о нулевых значениях и типах данных каждого столбца.

Статистический анализ с использованием Pandas:

Панды предлагают некоторые функции, которые помогут вам копнуть глубже и найти более полезную информацию из данных, и некоторые из полезных функций:

# description : возвращает статистические показатели, такие как минимальное и максимальное значения, среднее значение, стандартное отклонение и т. д.
df.describe()
# unique : возвращает все уникальные значения в столбце.
df[ 'columnName'].unique()
#value_count : возвращает частоту значений df['columnName'].value_counts()
# корреляция : находит корреляцию между функциями соответственно.
df.corr()

Панды также имеют функции для поиска других статистических показателей, таких как среднее значение, медиана, мода и т. д.