Часть 4: Сводная таблица

Сводная таблица

import pandas as pd
data = {
  'city':['Seoul', 'Seoul', 'Seoul', 'Busan', 'Busan', 'Busan', 'Incheon', 'Incheon' ],
  'year':['2015', '2010', '2005', '2015', '2010', '2005', '2015', '2010'],
  'num':[9904312, 9631482, 9762546, 3448737, 3393191, 3512547, 2886172, 2660610],
  'area': ['capital', 'capital', 'capital', 'rural', 'rural', 'rural', 'capital', 'capital']
}
columns=['city', 'year', 'num', 'area']
df1 = pd.DataFrame(data, columns=columns)
df2 = df1.pivot('city', 'year', 'num')

df2.columns
df2.index

df2['2015']
df2.loc['Seoul']

Групповой метод

# continued
gb = df1.groupby('city') 
# group by int -> only 'num' in this case
gb.mean()
gb.sum()
# all columns
gb.count()

des = gb.describe()
des.columns
des[('num', 'mean')]