Pandas基礎(四):分組groupby的用法
阿新 • • 發佈:2018-12-21
首先採用kesci的第三套練習作為groupby的初步用法介紹,後面有什麼收穫或者心得再補充。
原文連結:
kesci資料分析練習題
匯入庫和資料:
import pandas as pd
drinks = pd.read_csv('/drinks.csv')
用head方法檢視下匯入的資料,如下圖
1.檢視平均消耗的啤酒(beer)最多的大陸(continent):
drinks.groupby('continent').beer_servings.mean()
輸出:
continent AF 61.471698 AS 37.045455 EU 193.777778 OC 89.687500 SA 175.083333 Name: beer_servings, dtype: float64
2.打印出每個大陸(continent)的紅酒消耗(wine_servings)的描述性統計值
drinks.groupby('continent').wine_servings.describe()
輸出如圖:
3.打印出每個大陸每種酒類別的消耗平均值
drinks.groupby('continent').mean()
輸出如圖:
4.打印出每個大陸對spirit飲品消耗的平均值,最大值和最小值
drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max'])
輸出如圖: