python學習----pearsonr(x,y)相關係數計算
阿新 • • 發佈:2019-01-03
函式:pearsonr(x,y)
功能:
計算特徵與目標變數之間的相關度
引數說明:
1)輸入:x為特徵,y為目標變數.
2)輸出:r: 相關係數 [-1,1]之間,p-value: p值。
注: p值越小,表示相關係數越顯著,一般p值在500個樣本以上時有較高的可靠性。
python實現
import numpy as np
from scipy.stats import pearsonr
import random
np.random.seed(0)
size=300
x=np.random.normal(0,1,size)
print "Lower noise" ,pearsonr(x,x+np.random.normal(0,1,size))
print "Higher noise",pearsonr(x,x+np.random.normal(0,10,size))
輸出:
Lower noise (0.71824836862138408, 7.3240173129983507e-49)
Higher noise (0.057964292079338155, 0.31700993885324752)