Pandas 描述統計函式
阿新 • • 發佈:2019-01-07
在進行統計描述時,pandas對三個資料物件的軸引數規定如下:
Series: 沒有軸引數
DataFrame: “index” (axis=0, default), “columns” (axis=1)
Panel: “items” (axis=0), “major” (axis=1, default), “minor” (axis=2)
統計描述引數如下:
Function | Description | 描述 |
---|---|---|
count | Number of non-null observations | 觀測值的個數 |
sum | Sum of values | 求和 |
mean | Mean of values | 求平均值 |
mad | Mean absolute deviation | 平均絕對方差 |
median | Arithmetic median of values | 中位數 |
min | Minimum | 最小值 |
max | Maximum | 最大值 |
mode | Mode | 眾數 |
abs | Absolute Value | 絕對值 |
prod | Product of values | 乘積 |
std | Bessel-corrected sample standard deviation | 標準差 |
var | Unbiased variance | 方差 |
sem | Standard error of the mean | 標準誤 |
skew | Sample skewness (3rd moment) | 偏度係數 |
kurt | Sample kurtosis (4th moment) | 峰度 |
quantile | Sample quantile (value at %) | 分位數 |
cumsum | Cumulative sum | 累加 |
cumprod | Cumulative product | 累乘 |
cummax | Cumulative maximum | 累最大值 |
cummin | Cumulative minimum | 累最小值 |
cov() | covariance | 協方差 |
corr() | correlation | 相關係數 |
rank() | rank by values | 排名 |
pct_change() | time change | 時間序列變化 |