1. 程式人生 > >one-hot-encode編碼方式

one-hot-encode編碼方式

有時特徵內容並不是數值,而是字串型別。如果直接將字串轉成一個對應的數值,造成原本的特徵具有大小關係。這是需要使用 one-hot-encode編碼格式。

兩種轉化方式:

pandas.get_dummies():常用方法,功能強大,操作簡單;
sklearn.preprocessing.OneHotEncoder():用法複雜且易報錯,較少使用。
pandas.get_dummies(data, columns=["one","two",...], dummy_na=False, ...) 
# columns : 需處理的列逐個填寫
# dummy_na : 是否將NA作為新的分類

sklearn.preprocessing.OneHotEncoder()使用時需將列的型別轉成str型別。一般類的dtype如果是object,OneHotEncoder時會報錯,因為object是混合型別,需將型別轉換成str型別。
--------------------- 
作者:scxyz_ 
來源:CSDN 
原文:https://blog.csdn.net/sscc_learning/article/details/73719019 
版權宣告:本文為博主原創文章,轉載請附上博文連結!