47.端到端學習的興起 翻譯自 吳恩達新書-Machine Learning Yearning
阿新 • • 發佈:2018-12-13
假如你正在構建一個機器學習系統,這個系統可以檢查線上的產品評論,然後告訴你評論者是否喜歡對應的產品。比如,你希望將下面的例子識別成正例:
這個拖把非常棒
或者把下面這句識別成負例:
這個拖把質量非常差,買了非常後悔。
這種識別正例/負例的問題稱作情感分類。
為了構建這樣一個系統,你可能需要開發兩個元件:
-
解析器: 你的系統給文字加上註釋,來找到重要的單詞。比如你可能會使用解析器來標記出所有的形容詞和名次。因此通過解析器你可能會到的下面這個句子: 這個拖把名詞非常棒形容詞
-
情感分類器:通過機器學習演算法,使用標記好的文字,預測出文字對應的感情。解析器註釋後的文字,非常有利於演算法的學習:通過給形容詞加上更高的權重,比如“非常棒”,忽略不重要的單詞,比如“這個”。
我們可以把兩個元件組成的流水線繪製出來: 最近有個趨勢就是把流水線式的系統變成一個單一的學習演算法。端到端學習演算法就是用來處理這種任務的。只要提供原始的輸入,比如原始文字"這個拖把非常棒!",然後直接進行情感識別: 神經網路警察用於端到端的學習系統。端到端這個詞語的意思是通過學習演算法,直接將原始輸入轉化成最終輸出。也就是說使用學習演算法將輸入端和輸出端連結起來。
在資料豐富的問題中,端到端系統取得了非常顯著的成功。但是他們也不都是最好的選擇。下一章,我們將給出更多端到端的例子,並給出一些建議,說明那些問題適合使用端到端系統,哪些問題不適合使用端到端系統。