深度學習引發的思考和三巨頭時代

阿新 • • 發佈：2019-01-26

“在不久的將來，我們認為深度學習將取得更多成就，因為它只需要極少的人工參與，所以它能輕而易舉地從計算能力提升和資料量增長中獲得裨益。目前正在開發的用於深層神經網路的新型學習演算法和體系結構必將加速這一程序。” 《自然》-深度學習一文

1.第一次聽到你的名字

2013年10月的某一天，我在浙大碩士入學差不多一個多月，所在的CAD國家重點實驗室內部舉行了一次前沿技術分享的討論會。本次的分享人是實驗室的何曉飛教授（2005博士畢業於芝加哥大學，2016年4月份出任滴滴研究院首任院長，是國內乃至全球機器學習領域的大咖等等，總之很牛~），那是我第一次聽說 Deep Learning （深度學習）這個名詞。

雖然是一次實驗室內部分享交流會，但是有五六十個座位的屋子卻擠得滿滿的，實驗室裡很多有資歷和學術比較厲害的教授也都去了。（簡單來說，這種場面還是比較少見，畢竟作為國內圖形學領域一哥的CAD, 就算是國外某藤校大牛過來也未必能有這麼高座次）。

其實，作為吃瓜群眾的我，當時和班上很多同學一樣，並不是衝著分享內容去的，而是想過去看看年輕有為的大牛教授長啥樣子，畢竟就是同一個實驗室裡面樓上樓下的關係。雖然何教授平時為人低調，甚至有一次食堂吃飯他和蔡登老師（也很牛~）就坐在我旁邊桌上聊天。

何老師當時分享的時候大概是這麼說的：我們最近也是剛開始接觸Deep Learning, 它的效能在很多Benchmark(資料庫競賽平臺）上都取得了很大的提升，而且在語音和視覺等很多領域方面也表現很好, 有些方面的準確率甚至超過了人類。

這麼神奇的東西，大家聽了以後肯定要想問個究竟。所以好多教授副教授就開始提問了：何老師，這個DeepLearning 這麼神，你能給咱大概說下它背後的工作原理是啥麼？

何老師停頓少許，臉上露出淡淡地微笑說：實在抱歉，這個Deep Learning是怎麼工作的，我還真不知道。據說目前世界上除了一個叫Hinton(辛頓）的老頭，其他人都不是很瞭解。Hinton開個了個公司(DNNresearch), 被谷歌以重金收購了，但公司裡只有三個員工，就是他自己和兩個學生。

聽完這次分享會的時候，不知道大家是啥感覺，我的感覺是回去好好幹活，Deep Learning這個東西對我只有兩種可能：一是不靠譜，而是太遙遠。

2 . 深度學習三巨頭

提起邁克爾－喬丹（Michael Jordan）這個名字，相信全地球人都知道。為啥呢？　愛玩耍的同學知道他是籃球界的傳奇，愛學習的同學知道他是機器學習的傳奇。雖然這兩老頭不是一個人，但地球人都納悶，為啥叫邁克爾－喬丹的人都這麼牛？

        前者引領的公牛王朝六連冠戰績至今無人能破，今天就不說他了。後者現任加州伯克利大學教授，在許多年內是機器學習領域的泰山北斗之一，前百度深度研究院院長、斯坦福人工智慧實驗室主任吳恩達（Andrew Ng）就是他的得意門生之一，光是在美國常青藤當教授的徒子徒孫就有一大籮筐。所以喬丹有多牛，咱就不多廢話了~

        但是咱今天的重點是說一股大風。這股風有多大呢，簡單來說，這股風颳起來以後，全世界的人都在裡頭飄，有些是真的飄，有些是假的飄，還有些是裝著飄~ 不過同時，這股風催生了這個時代三位和邁克爾-喬丹名氣相當的男神，他們不僅在各大媒體電臺上頻頻曝光，坐擁數以萬計的粉絲，而且將會因為他們對於整個時代和人類歷史程序的影響，將其姓名寫入歷史的功勳薄中。這股風叫做深度學習，這三個男神分別是傑弗裡-辛頓（Geoffery Hinton），揚-勒丘恩（Yann Le Cun）和約書亞-本吉奧（Yoshua Bengio），真想說，這三個人的中文名字寫出來真累~

        先說Hinton吧，現在是多倫多大學的教授，谷歌工程院士，也在負責谷歌大腦(google brain)的相關工作。資歷最老，研究成果也豐富。上週還公開說目前風靡全球的深度學習框架太笨重，咱們要推倒重來，一般人說這話可能無關痛癢，但是老先生親口說出還是令人佩服的，畢竟他‘坐了30年的冷板凳’才等到今天享譽全球、描出劃時代的一筆。

        前兩天出了個“資訊瓶頸”理論說是揭示深度學習本質的東東，Hinton 說他要再看10000遍。真是羨慕老先生這種已經70歲仍然追求真理的科學精神。真希望他再多活50年~

        維基一段：傑弗裡·埃弗里斯特·辛頓（Geoffrey Everest Hinton）（1947年12月6日－）是一位英國出生的計算機學家和心理學家，以其在神經網路方面的貢獻聞名。辛頓是反向傳播演算法和對比散度演算法的發明人之一，也是深度學習的積極推動者。

        再說說Lecun吧（好像前段這哥們到清華演講給自己取了個名字，叫楊立昆），紐約大學教授，目前是Facebook 人工智慧研究院的院長。據說是第一個把神經網路成功應用的人。比較有名的就是1989年那篇用反向傳播網路讓自己識別手寫1, 2，3，4，5……的論文。LeNet是深度學習入門的經典網路，就是用他名字取的。好像是三個裡面曝光率最高的，畢竟是FB的院長，各國演講籤協議是少不了的~

維基一下：揚·勒丘恩（法語：Yann Le Cun，英語：Yann LeCun，1960年7月8日—）是一位電腦科學家，他在機器學習、計算機視覺、mobile robotics和計算神經科學等領域都有很多貢獻。他最著名的工作是在光學字元識別和計算機視覺上使用卷積神經網路 (CNN)，他也被稱為卷積網路之父。他同Léon Bottou和Patrick Haffner等人一起建立了DjVu影象壓縮技術。他同Léon Bottou一起開發了Lush語言。

最後說說Bengio吧，目測是三巨頭裡面唯一一個在學校全職工作的，他在加拿大的蒙特利爾大學當全職教授，是三巨頭裡最年輕的一位。Bengio的貢獻主要在高階機器學習方面，比如自然語言處理等。去年出的《deeplearning》一書前兩個作者就是他的學生Ian Goodfellow和Bengio。可能是Bengio太低調了，維基裡頭都找不到他的中文介紹，就谷歌翻譯了一下。不過據說微軟全球副總裁沈向洋已經向Bengio丟擲橄欖枝了，FaceBook也在加拿大建立了研究院。　

維基一下：Yoshua Bengio （1964年出生於法國）是加拿大電腦科學家，最著名的是他在人工神經網路和深度學習方面的工作。

本吉奧獲得麥吉爾大學理學學士（電氣工程），工程碩士（電腦科學）和博士學位（電腦科學）。他是麻省理工學院博士後研究員（邁克爾·喬丹）和AT＆T貝爾實驗室。班吉奧自1993年以來一直是蒙特利爾大學的教授，負責MILA（蒙特利爾學習演算法學院），並擔任加拿大高階研究所機器和大腦學習專案的聯合主任。

其實“三巨頭”這個稱謂不一定準確，但因為這三人作為推動人工智慧和深度學習發展的傑出科學家，包括他們在15年聯名在《自然》上發表論文，也經常一起“搞大事情”，為了給大家一個容易記的印象，所以姑且就這麼稱呼著吧。

3. 值得反思的東西？

        假設，bengio最終把微軟挖走，這樣看來，谷歌、臉譜和微軟三家都在AI佈局中搶到了“法寶”。尤其看過他三個的履歷後，發現這三個人分別來自英國和法國，並且是在加拿大一起工作的時候作出了重要成果，推動了深度學習的復興。這樣不得不佩服，美國大型科技公司在人才招攬方面的魄力和智慧（當然，還有一點，這個大家都懂~）。

        深度學習這個名詞第一次是2006年由Hinton等人提出，雖然它的歷史略早一些（這個之後會詳扒）。也就短短十來年的時間，它席捲了整個學術界和工業界、以及生活的方方面面。

        我突然想起了三件事情：第一件就是四年前第一次聽到Deep Learning的時候，覺得這東西很虛~ 結果四年後開始著手做相關研究的時候，發現慢了許多步。第二件就是05上初中那會兒，第一次聽說阿里巴巴，大家覺得網銀和網購這事情非常不靠譜。第三件，就是時常聽人說，機器人再怎麼發展，也取代不了人~ 第一件，過了十年，我笑了。第二件，過了四年我笑了，第三件，我聽到的時候笑而不語。

參考文獻【1】：維基百科

參考文獻【2】：《自然》 2015 年5月刊《深度學習》

我們致力於推廣普及人工智慧(AI), 讓AI走進每個人的生活~

歡迎分享AI相關的人物軼事、工業應用、科普常識、動態前沿~

投稿郵箱：[email protected]

——《萬眾AI》 2017年第四期

深度學習引發的思考和三巨頭時代

深度學習引發的思考和三巨頭時代

入門深度學習，先看看三位頂級大牛Yann LeCun、Yoshua Bengio和Geoffrey Hinton的聯合綜述

深度學習深刻理解和應用--必看知識

深度學習——線性單元和梯度下降

深度學習中 GPU 和視訊記憶體分析深度學習中 GPU 和視訊記憶體分析

深度學習之經驗和訓練集（訓練中英文樣本）

人工智慧和機器學習、深度學習的區別和聯絡

深度學習用於文字和序列

深度學習之儲存和讀取tensorflow模型

機器學習6：邏輯迴歸到深度學習的思考

【轉載】演講實錄：百度大規模深度學習應用實踐和開源AI框架PaddlePaddle

深度學習基礎--BP和訓練--常用的梯度下降

深度學習基礎--BP和訓練--中繼監督優化(intermediate supervision)

[Keras深度學習淺嘗]實戰三·CNN實現Fashion MNIST 資料集分類

2018華為杯E題的一些思考和三維模型圖繪圖技巧總結

Coursera-吳恩達-深度學習-神經網路和深度學習-week1-測驗

深度學習中Dropout和Layer Normalization技術的使用

吳恩達深度學習第二課第三週作業：識別手勢

吳恩達深度學習第二課第三週作業及學習心得體會 ——softmax、batchnorm

網易雲深度學習第一課第三週程式設計作業

深度學習引發的思考和三巨頭時代

相關推薦