Python+pandas計算資料相關係數
本文主要演示pandas中DataFrame物件corr()方法的用法,該方法用來計算DataFrame物件中所有列之間的相關係數(包括pearson相關係數、Kendall Tau相關係數和spearman秩相關)。
>>> import numpy
as np
>>> import pandas
as pd
>>> df = pd.DataFrame({'A':np.random.randint(1, 100, 10),
'B':np.random.randint(1, 100, 10),
'C':np.random.randint(1, 100, 10)})
>>> df
A B C
0 5 91 3
1 90 15 66
2 93 27 3
3 70 44 66
4 27 14 10
5 35 46 20
6 33 14 69
7 12 41 15
8 28 62 47
9 15 92 77
>>> df.corr() # pearson相關係數
A B C
A 1.000000 -0.560009 0.162105
B -0.560009 1.000000 0.014687
C 0.162105 0.014687 1.000000
>>> df.corr('kendall') # Kendall Tau相關係數
A B C
A 1.000000 -0.314627 0.113666
B -0.314627 1.000000 0.045980
C 0.113666 0.045980 1.000000
>>> df.corr('spearman') # spearman秩相關
A B C
A 1.000000 -0.419455 0.128051
B -0.419455 1.000000 0.067279
C 0.128051 0.067279 1.000000
----------相關閱讀----------
----------喜大普奔----------
1、繼《Python程式設計基礎》(2017年9月第5次印刷)、《Python程式設計(第2版)》(2017年9月第4次印刷)、《Python可以這樣學
https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14464369246.84.46f16db0roWfX4&id=557107249812&rn=339cbc9df2bac424664103917dedfbd2&abbucket=8&tbpm=3
2、董付國老師新作《中學生可以這樣學Python》已正式出版,很快就會在各大書城全面上架。