1. 程式人生 > >資料探索(3)Python主要資料探索函式

資料探索(3)Python主要資料探索函式

Python中用於資料探索的庫主要是Pandas(資料分析)和Matplotlib(資料視覺化)。
資料探索函式可大致分為統計特徵函式和統計作圖函式。
Pandas的主要統計特徵函式。
sum() 列總和
mean() 平均數
var() 方差
std() 標準差
corr()Spearman相關係數矩陣
cov()協方差矩陣
skew()偏度(3階矩陣)
Kurt()峰度(4階矩陣)
describe()給出樣本的基本描述

擴充套件統計特徵函式

cum累積計算和pd.rolling_滾動計算
cumsum() 依次給出前1、2—n個數的和
cumprod()依次給出前1、2—n個數的積
cummax()依次給出前1、2—n個數的最大值
cummin()依次給出前1、2—n個數的最小值

統計作圖函式

plot()折線圖
pei()餅圖
hist()直方圖
boxplot()箱形圖
plot(logy=True)y軸的對數圖
plot(yerr=error)誤差條形圖