24、python對資料框進行分組統計簡單操作
阿新 • • 發佈:2018-12-07
分組分析:是指根據分組欄位,將分析物件劃分成不同的部分,已進行對比分析各組之間的差異性的一種分析方法
常見的統計指標:
計數
求和
平均值
1 函式
01 分組統計函式:
groupby(by=[分組列1,分組列2,...])[統計列1,統計列2,。。。]
.agg({統計列名1:統計函式1,統計列名2:統計函式2,。。。})
引數說明:
by: 用於分組的列
中括號:用於統計的列
agg: 統計別名顯示統計值的名稱,統計函式用於統計資料
02 常用統計函式 註釋
size 計數
sum 求和
mean 均值
2 案例說明
import pandas
data=pandas.read_csv(
'D:\\DATA\\pycase\\5.2分組分析\\data.csv',
engine='python',
sep=',',
encoding='utf8'
)
# 分組進行統計
# by 後邊是分組列,score是統計列
import numpy
aggResule=data.groupby(
by=['class']
)['score'].agg({
'總分': numpy.sum,
'人數': numpy.size,
'平均值': numpy.mean
})