pandas的get_dummies進行one-hot編碼
阿新 • • 發佈:2018-12-04
pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)
說下常用引數
data:的話就是我們要處理的資料
prefix:就是我們制定的字首,
columns:這是我們直接在原資料集上使用
eg:
data=pd.DataFrame({'a':['x','y','z','y','x'],'b':[1,2,3,1,2]}) data a b 0 x 1 1 y 2 2 z 3 3 y 1 4 x 2 pd.get_dummies(data,prefix='love') b love_x love_y love_z 0 1 1 0 0 1 2 0 1 0 2 3 0 0 1 3 1 0 1 0 4 2 1 0 0 pd.get_dummies(data['b']) 1 2 3 0 1 0 0 1 0 1 0 2 0 0 1 3 1 0 0 4 0 1 0 pd.get_dummies(data,prefix='love',columns=['b']) a love_1 love_2 love_3 0 x 1 0 0 1 y 0 1 0 2 z 0 0 1 3 y 1 0 0 4 x 0 1 0