5-Pandas之常用的描述性統計函式、彙總函式
阿新 • • 發佈:2020-07-26
函式 | 作用 | 函式 | 作用 |
count | 非缺失樣本的數量 | sum | 求和 |
mean | 均值 | mad | 平均絕對偏差(Mean absolute deviation) |
median | 中位數 | min | 最小值 |
max | 最大值 | mode | 眾數 |
abs | 絕對值 | prod | 乘積 |
std | 標準差 | var | 無偏方差 |
sem | 平均標準誤差 | skew | 偏度(三階矩) |
kurt | 峰度(四階矩) | quantile | 分位數 |
cumsum | 累計求和 | cumprod | 累積 |
cummax | 累計最大值 | cummin | 累積最小值 |
二、彙總函式
(1)describe():檢視各個特徵的均值、標準差、最小值、最大值即分位數,對樣本資料量進行統計,預設僅對數值型資料進行統,也可通過上一節資料篩選中所說的include和exclude來設定包括或是剔除哪些型別的特徵。
例如:>>>df.describe(include=['object'])
需要注意的是:describe()也可以對非數值型資料進行統計,只是統計指標不同而已
例如:
>>>df['grade'].describe() count 68 unique 6 top B freq 18 Name:grade,dtype:object