1. 程式人生 > 實用技巧 >5-Pandas之常用的描述性統計函式、彙總函式

5-Pandas之常用的描述性統計函式、彙總函式

常用的描述性統計函式
函式 作用 函式 作用
count 非缺失樣本的數量 sum 求和
mean 均值 mad 平均絕對偏差(Mean absolute deviation)
median 中位數 min 最小值
max 最大值 mode 眾數
abs 絕對值 prod 乘積
std 標準差 var 無偏方差
sem 平均標準誤差 skew 偏度(三階矩)
kurt 峰度(四階矩) quantile 分位數
cumsum 累計求和 cumprod 累積
cummax 累計最大值 cummin 累積最小值

二、彙總函式

(1)describe():檢視各個特徵的均值、標準差、最小值、最大值即分位數,對樣本資料量進行統計,預設僅對數值型資料進行統,也可通過上一節資料篩選中所說的include和exclude來設定包括或是剔除哪些型別的特徵

  例如:>>>df.describe(include=['object'])

  需要注意的是:describe()也可以對非數值型資料進行統計,只是統計指標不同而已

  例如:

>>>df['grade'].describe()
count 68
unique 6
top  B
freq 18
Name:grade,dtype:object