1. 程式人生 > >28、python計算多序列間相關係數、相關程度

28、python計算多序列間相關係數、相關程度

線性相關:主要採用皮爾遜相關係數來度量連續變數之間的線性相關強度;

線性相關係數|r    相關程度

0<=|r|<0.3       低度相關

0.3<=|r|<0.8     中度相關

0.8<=|r|<1       高度相關


1 函式

相關分析函式:

DataFrame.corr()
Series.corr(other)

  說明:
如果由資料框呼叫corr方法,那麼將會計算每個列兩兩之間的相似度

如果由序列呼叫corr方法,那麼只是計算該序列與傳入序列之間的相關度

  返回值:
  
dataFrame呼叫:返回DataFrame
Series呼叫:  返回一個數值型,大小為相關度

2  案例
import pandas

data=pandas.read_csv(
        'D:\\DATA\\pycase\\5.6\\data.csv'       
           )

# 進行兩列之間的相關性分析

data['人口'].corr(data['文盲率'])

## 多列之間的相關度的計算方法
## 選擇多列的方法

data[[
      '超市購物率','網上購物率','文盲率','人口'
      ]].corr()