特徵選擇之支援向量機遞迴特徵消除(SVM-RFE)
阿新 • • 發佈:2019-02-11
支援向量機遞迴特徵消除(下文簡稱SVM-RFE)是由Guyon等人在對癌症分類時提出來的,最初只能對兩類資料進行特徵提取。它是一種基於Embedded方法。
支援向量機
支援向量機廣泛用於模式識別,機器學習等領域,SVM採用結構風險最小化原則,同時最小化經驗誤差,以此提高學習的效能。詳細的SVM介紹請看我的另一篇博文《 線性支援向量機》
在這簡單介紹一下SVM。
設訓練集
SVM需要求解的優化問題為:
而原始問題可以轉化為對偶問題:
其中,
最後
兩分類的SVM-RFE演算法
SVM-RFE是一個基於SVM的最大間隔原理的序列後向選擇演算法。它通過模型訓練樣本,然後對每個特徵進行得分進行排序,去掉最小特徵得分的特徵,然後用剩餘的特徵再次訓練模型,進行下一次迭代,最後選出需要的特徵數。而特徵
兩分類SVM-RFE演算法:
輸入:訓練樣本
輸出:特徵排序集R
1)初始化原始特徵集合S={1,2,…,D},特徵排序集R=[]
2)迴圈以下過程直至S=[]
獲取帶候選特徵集合的訓練樣本;
用式
用式
找出排序得分最小的特徵
更新特徵集R=[p,R];
在S中去除此特徵:S=S/p。
多分類的SVM-RFE演算法
多分類的SVM-RFE演算法其實和兩分類的SVM-RFE演算法類似,只不過在處理多分類時,把類別進行兩兩配對,其中一類為正類,另一類為負類,這樣需訓練