1. 程式人生 > >深度學習如何做特徵工程?

深度學習如何做特徵工程?

“深度能自動獲取特徵”只是對某些領域而言的。實際上深度學習只是能自動對輸入的低階特徵進行組合、變換,得到高階特徵。對於影象處理之類的領域來說,畫素點就可以作為低階特徵輸入,組合、變換得到的高階特徵也有比較好的效果,所以看似可以自動獲取特徵。

在其他領域的情況就不是這樣了。例如自然語言處理中,輸入的字或詞都是離散、稀疏的值,不像圖片一樣是連續、稠密的。輸入原始資料進行組合、變換得到的高階特徵並不是那麼有效。而且有的語義並不來自資料,而來自人們的先驗知識,所以利用先驗知識構造的特徵是很有幫助的。

所以在深度學習中,原來的特徵選擇方法仍然適用。不過方便的一點是,神經網路能對特徵自動進行排列組合,所以只要輸入一階特徵就行,省去了手動構造高階特徵的工作量。