Pandas — один из популярных модулей в Python. Чтобы использовать модуль, он обычно начинается со следующего кода для вызова модуля.
import pandas as pd
Создание данных с помощью Pandas
Мы используем функцию DataFrame для создания таблицы, и код будет
pd.DataFrame( { 'Apple':[20,30], 'Grava':[10,30] } )
Результат будет
Если данные строкового типа, то код будет
pd.DataFrame( { 'Apple':['US','Japan'], 'Grava':['Taiwan','Japan'] } )
Присвоение имен строк каждой строке данных с помощью следующего кода.
pd.DataFrame( { 'Apple':['US','Japan'], 'Grava':['Taiwan','Japan'] }, index=['Imported','Domestic' ] )
Результат будет
Функция Series представляет собой список, это последовательность значений данных. Пример данных, как показано ниже.
pd.Series( [1,2,3,4] )
И каждой строке данных можно дать имя, и создать конкретное имя для этого набора данных.
pd.Series( [1,2,3,4], index=['Number:1','Number:2','Number:3','Number:4'], name='Sample Data' )
Чтение данных
Помимо создания данных, Pandas может загружать данные из внешнего источника. Например:
/* assuming the .csv file is stored on your local. */ data = pd.read_csv("./Desktop/stock.csv")
Затем мы можем использовать следующий код, чтобы проверить, сколько строк и столбцов в дате.
data.shape /* Result will be (number of row , number of column). For example (1234456, 12)
Если данные слишком велики, мы можем использовать команду head() для предварительного просмотра данных. Эта команда может отображать первые 5 строк данных.
data.head()