1. 程式人生 > 其它 >mRMR特徵選擇

mRMR特徵選擇

1、介紹

  Max-Relevance and Min-Redundancy,最大相關—最小冗餘。最大相關性保證特徵和類別的相關性最大;最小冗餘性確保特徵之間的冗餘性最小。

  它不僅考慮到了特徵和標註之間的相關性,還考慮到了特徵和特徵之間的相關性。度量標準使用的是互資訊(Mutual information)。對於mRMR方法,特徵子集與類別的相關性通過各個特徵與類別的資訊增益的均值來計算,而特徵與特徵的冗餘使用的是特徵和特徵之間的互資訊加和再除以子集中特徵個數的平方,因為I(xi,xj)計算了兩次。

2、pymrmr庫

  2.1mRMR方法在pymrmr庫,官網上寫的在pycharm中直接pip install pymrmr報錯。

  2.2在path中配置pycharm報錯。

  2.3提升pip版本也不行。

  2.4看到有說python3.6才能使用該庫,安裝後還是不能使用。

  最後安裝了C++ 桌面開發成功解決問題。visual studio 官網連結:https://visualstudio.microsoft.com/zh-hans/,下載的社群版2022,安裝好後找到C++的桌面開發,等安裝好後,重新開啟pycharm,在終端輸入pip install pymrmr安裝成功。

3、mRMR的使用

  import pymrmr

  result = pymrmr.mRMR(引數一,引數二,引數三)

  引數一:DataFrame,要求第一列是目標量(標註),其他列是特徵量。

  引數二:選擇的方法,有'MID'、'MIQ'兩種。

  引數三:要求int型別,最後輸出的特徵數量。

  

 

   最後輸出結果類似這種。。。