1. 程式人生 > >特徵選擇--IV和WOE方法

特徵選擇--IV和WOE方法

        這篇文章清晰表明了IV和WOE的關係,也說清楚了根據IV值的高低,去選擇篩選特徵,之後我們可以將篩選出來的特徵去做其他方式的編碼。

        簡單說,就是將需要的特徵列算出各自的IV值,然後將其排序,IV值越高的特徵列說明其預測能力越高,IV值越低的特徵列說明其預測能力越低。可以根據業務情況,進行篩選特徵列,過濾掉IV值低的特徵列。

       github有位國人寫了一個關於WOE編碼的包,專案地址如下: