1. 程式人生 > >Yann LeCun專訪:我不覺得自己有天分,但是我一直往聰明人堆裡鑽

Yann LeCun專訪:我不覺得自己有天分,但是我一直往聰明人堆裡鑽

640?wx_fmt=jpeg

來源:AI 科技評論

摘要:紐約大學教授、Facebook 副總裁與首席 AI 科學家 Yann LeCun 由於對深度學習的突出貢獻,被譽為深度學習的「三駕馬車」之一,更被稱為「CNN」之父。Yann LeCun 也一直非常活躍,發論文、教學、創立學術會議、出席學術與公共活動、引領 Facebook 的 AI 學術研究,是電腦科學研究者中的一面旗幟,也是大眾眼中的人工智慧「偶像」。

前段時間,RSIP VISION 出版的《Computer Vision News》雜誌對這位偶像進行了專訪並發表在了 2018 年 11 月刊中。專訪中 Yann LeCun 談到了學術生涯中的趣事、對自己是否是個聰明人的評價、對近期技術進展的評價、對工業界學術界合作的期待和誤解的澄清,以及「退休之前最希望做出的成果」。

記者:在過去的二三十年中,你對整個人工智慧界產生了巨大影響。跟我們講講你是如何一步步走到今天這個位置的呢?

LeCun:我很小的時候就對人工智慧很感興趣。「智慧」這個概念讓我感到十分著迷。並不僅僅是我們現在天天談起的機器智慧,而是一般意義上的「智慧」。我一直都覺得「學習」是智慧中的重要部分。我大學專業是電氣工程,然後做研究的時候發現在 1950、60 年代就有人在研究會學習的機器了。我接觸到這些知識其實有那麼點意外成分,然後本科畢業之前就開始讀這方面的各種文獻。我想在這方面做更多研究的想法就是這時候出現的,接下來趁著在學校,我做了好幾個有關的專案,然後決定了我就要研究這個方向。

我發現在法國有一群人在研究一種叫做 Automata 網路的東西,似乎和智慧隱隱有那麼點聯絡;這大概是 1983 年前後的事情。那時候電腦科學這邊還沒有任何人在研究神經網路,甚至只是簡單的機器學習都沒有。在 AI 的大課題下有那麼一點點機器學習的研究,但是隻有很少很少的一撮人。我當時遇到了一些人,他們已經開始思考很多簡單的單元互相連線起來形成的網路會有哪些新的性質,實際上這就是神經網路了。我和他們取得聯絡以後,發現他們有一個全球性的研究社群,他們已經開始研究神經網路了。

我當時讀了 John Hopfield 寫的 Hopfield 網路的論文,也聽說了 Geoff Hinton 和 Terry Sejnowski 這兩個人。他們那時候剛剛發表了一篇關於玻爾茲曼機的論文,我覺得那篇論文棒極了,很想見見他們。

然後我就開始讀博士了。但我的導師對神經網路一無所知,他就說:「我可以給你的論文簽字,你似乎挺聰明的,但是從技術角度講我確實沒辦法幫助你。」我通過我本科的母校 ESIEE 獲得了獎學金。最後我自己在 1984 年左右發現了一個版本的反向傳播,終於在 1985 年在法國的一個會議上與 Geoff Hinton 和 Terry Sejnowski 見面了。有一個會議上我遇到了貝爾實驗室的 Larry Jackel 和 John Denker,後來就是他們把我招到貝爾實驗室去的。1987 到 1988 年,我跟著 Geoff Hinton 在多倫多做了博士後。Larry Jackel 在貝爾實驗室建立了一個小組研究神經網路硬體,我博士後一結束他們就把我招過去了。

記者:現在我們談談你的個人天份的部分?之前我們採訪 Yoshua Bengio 的時候他說:「我能成功並不是因為我比別人聰明,而是因為我很明白如何專注。」你同意這句話嗎?如果這是他的祕訣,那你的祕訣是什麼?

LeCun:我是鑽到一群比我聰明的人裡面去,所以在很多方面我都根本沒覺得自己有什麼天賦。反倒是我經常為別人感到驚歎。比如我和 Léon Bottou 有過很長時間的聯絡和合作。在機器學習界他是一個知名人物,而且幾乎每個方面他都比我強!(笑)我喜歡做的事,而且可能還是我做的不錯的一件事,就是一直向下挖掘,去發現一個疑問背後真正的問題是什麼。「如何才能讓機器學習」,類似這種。有點像是考慮大方向、考慮哪些是真正重要的問題。把問題簡化、再簡化,直到達到真正的核心問題。

有時候一個想法或者一個概念顯得很複雜,因為其中用到了很多很麻煩的數學知識,但是它真正的核心往往就是一個很簡單的想法。我覺得我還沒法和 Richard Feynman 相提並論,但是這種思考方式真的和他的很像。就是要問最基本的問題、摒棄一切表面上的東西,直到得到一個簡單得不可思議的問題。不過我做得還沒有他那麼好。

至於 Yoshua 說的那句話,他是一個非常自律的、井井有條的人。我不是那樣的人,我活得亂糟糟的。

記者:那是因為你是法國人嘛!

LeCun:Yoshua 也是在法國出生的呀!不過我不是一個好的理論科學家。相比之下我的朋友 Léon Bottou 就對數學啊什麼的理論性很強的東西很在行。我做的還行的是實現、讓東西跑起來,不過做的也算不上多好。不同的人擅長不同的事情嘛。

記者:唔,你是法國人,我是義大利人。有人說這兩個國家的人都做事不是很有條理!

LeCun:(笑)我也不知道,我聽說法國人都特別橫平豎直的,但我就不那樣,我特別隨性。

記者:有沒有導師或者教師對你的影響很大?還是說你基本上靠自學?

LeCun:對我有很大影響的人有好幾個。我在工程學院的時候,那些數學教授給了我很大幫助。我和他們一起做了好幾個專案,幾個專案的主題他們自己也不是很懂,但是他們允許我自己探索,也就很早就讓我嘗試到了做科研的感覺。他們都是很好的人。也就是這個時候我開始研究神經網路。我並不知道應該怎麼研究。我必須自己琢磨出來它是怎麼回事。我當時看了很多日本人用英文寫的論文,就這樣學會的英語,所以那時候我的英語簡直糟透了。(笑)70 年代末、80 年代初的時候,大多數關於神經網路的研究成果都是日本人做出來的,因為西方的人已經完全拋棄了這個領域了;我們能讀到的論文就只有這些了。

然後也有一些我很感興趣的科學人物。很自然地,我一開始看了很多關於愛因斯坦的東西,也就對物理學很感興趣。後來我的閱讀材料就是 Geoff Hinton 這樣的人。我跟著他做的博士後,也發現我們其實有很多共同點。

640?wx_fmt=jpeg

記者:我們聊聊 Facebook 的事情吧。如今人工智慧界的出色的軟體人員,有很多都跟著你幹活。我採訪過好多出色的 AI 軟體人員,有很多現在就在 Facebook,也有一些在其他大公司。但很滑稽的是,這些人裡的大多數並不參與 Facebook 的核心業務,而是做一些在你看來中長期比較重要的事情。能跟我們講講這是怎麼回事嗎?談談能談的。

LeCun:其實沒有什麼不能談的,起碼很少很少吧。因為 Facebook 人工智慧研究院是 Facebook 的一個基礎 AI 研究實驗室,它也是對外的。它和整個研究社群有很多的聯絡。我們做的所有東西都會公開發表,我們向開源世界貢獻很多程式碼,我們和大學有很多合作,我們在法國和美國都有實習生和訪問博士生。它是高度開放的。它對整個社會是有好處的,而且,當然長遠來看也對 Facebook 自己有好處,因為如今的 AI 技術面對的最大的限制並不是 Facebook 領先谷歌、IBM、微軟多少,而是整個領域的發展有沒有向著我們希望的方向前進。比如如果你想要造智慧虛擬助理的話,它和人類之間的互動需要具備一些人類常識,然而我們現在並沒有科學技術能讓我們造出這樣虛擬助理來。所以我們的目標就是開發出這些技術來,這樣的產品才能變成現實。即便我們僱傭了很多頂尖的人才,我們也不會壟斷任何好的想法。為此我們也需要和更廣泛的研究社群有充分的溝通。這也是我們如此開放的原因。

Facebook 裡還有另外一些機構,可以算是更廣泛的「Facebook AI」機構。它們更關注於和 Facebook 直接相關的問題,比如計算機視覺、自然語言處理、搜尋,等等。其中的很多小組使用的技術都是最初由Facebook 人工智慧研究院開發出來的,雖然可能是出於其他的目的,所以也還是有很大的影響力;但這些小組的運轉方式也就和研究院不一樣了,他們主要關注的是公司的業務需求。他們也會發一些論文,但是不那麼頻繁。他們要不斷改進 Facebook 提供的服務,或者創造新的服務。Facebook 人工智慧研究院做的事情就是一開始說的開發全新的技術、推進整個領域的前進。有時候我們會說希望 3 年、5 年或者 10 年之後看到回報,但是也有時候我們想出來的東西其實馬上就會變得很有用。有時候還會給我們帶來驚喜。

記者:在你看來,2018 年最棒的計算機視覺論文是哪一篇?我們雜誌評選的 2017 年的最佳計算機視覺論文是 Mask R-CNN,我相信你不會覺得意外吧哈哈。

LeCun:我也同意啊!(笑)計算機視覺領域發生了太多事情,太多太多了,我都看不過來了。我沒法單獨點出某一篇論文,但我覺得自我監督學習的整個領域都有非常有趣的成果。不管是用對抗性生成式網路(GANs),還是用一些別的技術,人們都在想辦法挖掘更高層次的視覺概念,比如物體、運動、深度等等,而且不需要真正顯式地給系統提供監督。我覺得這是一條光明大道,而且我們已經邁出了一步。目前這些技術還沒有什麼實際的應用,但我覺得這是未來的很大的技術成就的開始,可能會帶來計算機視覺的下一次革命,或者說是人工智慧的下一次革命。過去三年的公開演講裡我都在說這句話,就是「AI 的未來就在自我監督學習裡」。

這種學習方式是,你訓練一個機器學習這個世界是怎麼回事,並不指定什麼具體的任務;然後你再訓練它做某一個具體的任務,但是隻給它非常非常少的資料。人類和動物的學習方式就是這樣的。Facebook、英特爾、谷歌、DeepMind 和 NVIDIA 都在這方面發表了很多論文。有一篇關於上色的論文,裡面讓 AI 給視訊裡面的物體上色,得到的結果是,可以說它學到了物體的運動。類似這樣的讓人驚歎的東西還有很多。

記者:我們的一位工程師拜託我問你一個問題。據說這個問題挺滑稽的,不過我自己不是工程師所以不理解這個問題的笑點在哪裡。他的問題是,ReLU 和批量正則化兩者之間,你更喜歡哪個?

LeCun:哦我知道了啊哈哈哈哈哈……

記者:所以,真的很好笑嗎?

LeCun:真的很好笑!這個問題的答案很簡單,但是這個問題會引出很多別的問題。我會回答 ReLU,因為它是個很簡單的想法,所有人都會用它,可以說正是有了 ReLU 才可以讓我們訓練相對比較深的神經網路。還有另外一個想法,就是何愷明提出的殘差連線,它讓我們可以訓練更深的網路。而批量正則化在很多人看來,包括我自己看來,是一種必要的惡。要怎麼理解呢,可以說沒有人喜歡它,但是它的作用還不錯,所以大家還是都會用它;但同時大家都在嘗試把它換成什麼的別的東西,因為大家都討厭它。它自身有一些東西不是很讓大家滿意。

我們都有一種感覺,就是肯定有什麼東西比它更好。另一方面,大家並不理解它為什麼有效、是怎麼發揮效果的。對於神經網路是怎麼收斂和學習的,我們有一些直覺上的思考,但是批量正則化和我們的這些思考是衝突的,所以想要理解它為什麼有效、找個別的東西來代替它的話,我們還有很多工作要做。何愷明也提出了分組正則化,他的目的就是要替換掉批量正則化,看起來也確實表現要更好一些。

640?wx_fmt=jpeg

記者:暢想未來,你覺得在計算機視覺以及人工智慧社群裡,學術界和工業界怎麼才能更好地協作?

LeCun:我自己的職業生涯中,有一半的時間在學術界、一半的時間在工業界。我一開始在貝爾實驗室,後來它變成了 AT&T 實驗室;接著我在 NEC 研究院待了 18 個月。後來我做了教授,我的時間一部分花在工業界,一部分花在學術界。我覺得可以一部分時間花在工業界、一部分時間花在學術界是一個很好的想法,我也寫過一篇文章談這件事。

記者:嗯,我讀了這篇文章。《雙重聯盟》。

LeCun:就是這篇。我覺得很多人都誤解了這篇文章裡面的非常重要的一點,就是,只有在那個你工作的工業界實驗室是一個研究性質的實驗室,而不是開發性質的實驗室,以及,這個實驗室做的是開放性的研究、設立這個實驗室的企業對實驗室的智慧財產權沒有很強的佔有慾的時候,這種雙重聯盟的模式才是可行的。之所以我推崇雙重聯盟,就是要讓工業界和學術界之間有足夠多的資訊溝通,這樣你才能利用到兩面的好處:在工業界這邊,你能得到工程方面的支援,有大規模的計算設施,而在大學裡有很多學生、很多年輕人,他們有很多的創意,但是他們的執行模式是和工業界不一樣的。

對不同的人有不同的激勵方法是一件好事,當他們在不同的環境的時候也就可以產生不同的點子。這當然是一件好事,但是前提是你所在的工業界實驗室做的是開放性的研究、做的是真正的研究,而且肯發表論文。如果雙重聯盟的工業界那一方對任何東西都要保密、任何工作都是為了實際應用的和工程性的,那就做不成。我看到了一些對我的文章的迴應,其中有一些明顯是弄混了這兩種工業界研究方式的區別。他們會說,雙重聯盟是不現實的,因為既然你在工業界工作了,你要做的東西就無論如何都要是對這個企業有用的,而且有一些東西要保密,這樣就和學術界的做法產生衝突了。如果是這樣的話,那我也同意,確實是有衝突的;但是我不同意說沒有可能在工業界做雙重聯盟。這要取決於工業界的這個研究院是如何運轉的。

我在 Facebook 做的事情之一就是設計這個研究院的執行方式,讓它不要和學術界的做法產生衝突。過去五年中我對工業界研究風氣做的一大貢獻大概就是這個吧,而且可以說直到現在才真正形成了這樣的合作模式。過去也曾經有工業界的組織對科學發展有很大的的影響,比如我曾經工作過的貝爾實驗室,還有 IBM 研究院和微軟研究院也是這樣,但是他們對於智慧財產權的佔有慾都太強了。那時候並沒有開源啊或者其他開放的傳統。現在,現在時代已經不一樣了,這裡已經形成了一種工業界做研究的新方式。我覺得已經有一些別的企業或多或少受到了我們的影響。比如在過去五年裡,谷歌對於自己的研究成果要比更早的時候開放得多。他們現在也還是有一些保密性的,但是肯定比以前要開放太多了。

記者:我知道一個人,她可以算是你想要在 Facebook 做的這些事情的見證人!這個人就是 Pauline Luc,我上個月才剛剛採訪過她,她告訴我說:「我在 Facebok 的實驗室就和我在學校的實驗室一樣。」

LeCun:對的,就是這樣。當然我也很瞭解 Pauline 的工作,因為我有參與她的專案,和她一起寫過論文。我覺得她的研究成果特別棒。

記者:最後,我們來談談在你退休之前最想做出來的成果是什麼?

LeCun:找到一個普遍通用的好方法來做自我監督學習。我在確實計算機視覺方面做過一些研究,不過我不覺得自己是一個計算機視覺研究員。起碼不完全是做計算機視覺的。我的興趣實際上還是在學習上,比如我喜歡尋找不同的方式讓機器通過觀察來學習這個世界是怎麼運作的。這就意味著在包含有不確定性的環境中學習。如果你讓機器看一段視訊,然後讓它預測接下來會發生什麼,可能的發展其實會有很多。但另一方面,所有這些可能的發展裡,真正發生在接下來的視訊裡只會有一種,但其他的狀況也還是有可能發生的。當你訓練一個機器預測視訊的時候,如果你不小心的話,它就會輸出一個模糊的預測結果,差不多是所有可能發生的情境的平均值。那這就是一個糟糕的預測了。

我們想要解決的一個技術問題就是,在一個理想的預測結果不是單一的值、而是一系列值的環境裡,我們要怎麼樣訓練一個機器。寫成數學形式的話,我們可以說是讓它預測一個概率分佈,不再是單個的點。但我們並不知道如何在高維連續空間裡表示概率分佈。我覺得這裡很有可能是,就像採訪前面說過的那樣,要弄清楚其中真正關鍵的概念,然後找到簡單的架構,容易理解,也容易處理表示不確定性的問題。GANs 是一個有潛力的方法,但我們對 GANs 的理解也不是很透徹。它們不是總能收斂,但是當它們能出結果的時候通常都能出很棒的結果。既然它們不能保證每次都出結果,那我們就需要找別的辦法,要麼理解 GANs 能出結果的原因,要麼尋找一些別的方法,用這些新的方法幫助機器學習儘可能多地通過觀察視訊、照片等等的學習這個世界的背景知識。然後等到機器學到了關於這個世界的好的模型之後,它就能夠像我們理想的那樣只需要很少的樣本或者只嘗試幾次就能學會任何具體的任務。我未來幾年的目標就是這個。

未來智慧實驗室是人工智慧學家與科學院相關機構聯合成立的人工智慧,網際網路和腦科學交叉研究機構。

未來智慧實驗室的主要工作包括:建立AI智慧系統智商評測體系,開展世界人工智慧智商評測;開展網際網路(城市)雲腦研究計劃,構建網際網路(城市)雲腦技術和企業圖譜,為提升企業,行業與城市的智慧水平服務。

  如果您對實驗室的研究感興趣,歡迎加入未來智慧實驗室線上平臺。掃描以下二維碼或點選本文左下角“閱讀原文”

640?wx_fmt=jpeg