Quoc Le，谷歌AutoML的幕後英雄

阿新 • • 發佈：2019-02-10

李杉編譯自 AI Frontiers
量子位出品 | 公眾號 QbitAI

提到Google的AutoML，大家總會想到Jeff Dean、李飛飛，而實際上，這個專案背後還有一位貫穿始終的幕後英雄。

他是吳恩達的學生，Google Brain的創立者之一，也正是他的研究，為谷歌神經機器翻譯打下了基礎。

他就是Quoc Le。

一個名為AI Frontiers的科技部落格對Quoc Le的研究做了比較全面的介紹，量子位翻譯如下：

640?wx_fmt=png

Quoc Le身材瘦弱，舉止安靜，戴著一副厚厚的眼鏡，你很難想象他竟然在人工智慧領域領導一場革命。

2011年，Le與他的博士生導師吳恩達，以及Jeff Dean和Greg Corrado兩位谷歌研究員共同創辦了谷歌大腦，目標是在谷歌龐大的資料背景下探索深度學習技術。在此之前，Le在斯坦福大學針對無監督深度學習開展了一些開創性工作。

2012年，Le在ICML會議上發表了一篇論文，引起了人們對深度學習的濃厚興趣：他開發了一種深度神經網路模型，可以從來自YouTube的1000萬張圖片中，自動識別出貓，還能識別ImageNet資料集中的3000多種物體。

這也就是把谷歌大腦帶到公眾視線之中的“認貓事件”。

這個龐大的系統包含1.6萬臺機器和10億個突觸，比之前任何一次嘗試的規模都要大100倍。Le的論文發表後，同年晚些時候有了AlexNet的論文，於是，整個深度學習領域都開始引人關注。

雖然後來的事實證明無監督機器學習在商業用途上有些不切實際——至少當時如此——但Le還是在2015年接受《連線》採訪時表達了一種願望：“如果我們能夠找到一種可以發現（還可以通過同樣的方式學習）的演算法，那就太好了，因為更實際的情況是，我們掌握的非標記資料遠多於標記資料。“

序列對序列學習

2013年畢業後，Le便正式擔任谷歌研究員。在此之後，他很快在機器翻譯方面取得了驚人的突破，這也是機器學習最活躍的研究領域之一。

為了實現這個結果，他必須突破在影象和語音領域效果很好的深度學習方法。已有的方法只能分析固定大小的輸入資訊，而在自然語言中，句子的長度各不相同，詞語的順序也很重要。

2014年，Le與谷歌研究員Ilya Sutskever和Oriol Vinyals一起提出序列到序列（seq2seq）學習方法。這是一種通用的編碼器-解碼器框架，可以訓練模型將序列從一個域轉換到另一個域，例如在不同語言之間實現語句翻譯。

seq2seq所需的工程設計選擇較少，能讓谷歌的翻譯系統高效而準確地處理龐大的資料集。它主要用於機器翻譯系統，但也被證明適用於更廣泛的任務，包括文字摘要、會話AI和問答。

640?wx_fmt=png

接下來，Le發明了doc2vec，這種無監督演算法從長度各異的文字片段（如句子、段落和文件）中學習固定長度的特徵表示。

Doc2vec是谷歌研究員Tomas Mikolov 2013年推出的word2vec的擴充套件，word2vec的想法是，每個單詞都可以用向量表示，而向量可以從一組文字中自動學習。Le向其中添加了段落向量，因此無論長度如何，模型都可以生成文件的表示。

Le的研究工作得到了回報。2016年，谷歌宣佈推出神經機器翻譯系統，它藉助AI的學習能力，可以隨著時間的推移，逐漸形成更好、更自然的翻譯。

2015年，Le入選《麻省理工學院科技評論》評選的“35歲以下創新者”名單，原因是他致力於“讓軟體足夠聰明，以幫助人們在日常生活中獲得好的感受。”

640?wx_fmt=png

AutoML：讓神經網路學會自我提升

訓練深度神經網路需要大量的標記資料和反覆的實驗：你可以選擇一個架構，構建一些隱藏層，然後根據輸出調整權重。對於機器學習專業知識有限的人來說，這個訓練過程有些費時費力。

2016年，Le和另一位谷歌同事Barret Zoph提出了神經架構搜尋。他們使用迴圈神經網路生成神經網路的模型描述，並使用強化學習訓練這個迴圈神經網路，從而儘可能提升生成的架構在驗證集上的預期準確率。

這種新方法可以幫助研究人員設計新網路架構，該架構在CIFAR-10資料集中測試精度，能匹敵最好的人工架構。

一年後，Le和Zoph將他們的研究提升到了一個新的水平，提出了NASNet-A，這是一個針對大規模影象資料集設計的可轉換架構。

640?wx_fmt=png

Le的研究為AutoML奠定了基礎，這套谷歌產品的目標使用者，是那些在機器學習方面專業能力和資源有限的開發人員。

儘管還很早期，但AutoML正在解決現實問題：有資料科學家使用AutoML建立了一個模型，可以根據麵條影象識別出一家餐廳，準確度幾乎達到95％。還有日本開發人員用AutoML構建了一個模型，可以根據品牌名稱對影象進行分類。

谷歌今年早些時候推出了AutoML Vision。在上個月的谷歌Cloud Next會議上，該公司還發布了翻譯和自然語言工具。

過去6年裡，Le一直處於深度學習發展的最前沿。這位36歲的谷歌研究員現在準備將深度學習提升到新的水平。

原文：

https://medium.com/@aifrontiers/an-unassuming-genius-the-man-behind-google-brains-automl-4ddc801f3e9b

— 完 —

加入社群

量子位AI社群19群開始招募啦，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話介面回覆關鍵字“交流群”，獲取入群方式；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號（QbitAI）對話介面回覆關鍵字“專業群”，獲取入群方式。（專業群稽核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

Quoc Le，谷歌AutoML的幕後英雄

李杉編譯自 AI Frontiers
量子位出品 | 公眾號 QbitAI

序列對序列學習

AutoML：讓神經網路學會自我提升

Quoc Le，谷歌AutoML的幕後英雄

js 利用canvas + flv.js實現視頻流截屏、本地下載功能實現，兼容火狐，谷歌，截屏跨域的坑

美國STEAM教育頂尖教具，谷歌又一力作！

確認，谷歌AI中國中心總裁李佳離職

gRPC 1.17.0 釋出，谷歌開源的高效能 RPC 框架

gRPC 1.17.1 pre 1 釋出，谷歌開源的高效能 RPC 框架

angular相容性問題的解決（ie6，ie7....，火狐，谷歌，360，等親測相容）

gRPC 1.17.2 釋出，谷歌開源的高效能 RPC 框架

Linux 系統下 CodeBlocks，谷歌，搜狗的安裝與使用

福布斯釋出全球50位科技女性，谷歌前任首席AI科學家李飛飛上榜！

程式設計師優秀程式碼註釋的5個技巧，谷歌創始人的一段程式碼相當霸氣！

IE11 400錯誤，谷歌、火狐、edge正常顯示

數字戰爭：蘋果，谷歌和微軟的internet之戰

安卓 9 先行，谷歌公共 DNS 開始支援 DNS-over-TLS

在網頁上插入視訊，相容ie6，火狐，谷歌

Android應用內呼叫百度，高德，谷歌地圖導航

jsp html5 video實現線上視訊播放原始碼，支援IE6,7,8,10,11，谷歌，火狐等瀏覽器

IE，火狐，谷歌之間差異

jQuery ajax 返回資料時報錯readystate:0 status:0 statusText:"error"； Firefox報錯，谷歌正常；

insertCell在IE，火狐，谷歌下

Quoc Le，谷歌AutoML的幕後英雄

李杉 編譯自 AI Frontiers量子位 出品 | 公眾號 QbitAI

序列對序列學習

AutoML：讓神經網路學會自我提升

相關推薦

李杉編譯自 AI Frontiers
量子位出品 | 公眾號 QbitAI