1. 程式人生 > 實用技巧 >定了!AI視覺泰斗朱鬆純教授歸國就任北大人工智慧研究院院長

定了!AI視覺泰斗朱鬆純教授歸國就任北大人工智慧研究院院長


轉載於新智元

來源:北大新聞網

編輯:白峰、依明

【新智元導讀】北京大學官網顯示,前UCLA教授朱鬆純受聘擔任北大人工智慧研究院院長,北大常務副校長龔旗煌代表學校,對朱鬆純受聘北大表示熱烈歡迎。此前曾有訊息傳出朱鬆純擬入職清華,現在來看,還是北大「搶」得了先機!

北京大學新聞網釋出訊息:朱鬆純教授受聘擔任北大人工智慧研究院院長。

這則新聞在AI學術圈再次掀起熱議。就在本月中旬剛有訊息傳出「朱鬆純擬加入清華大學自動化系,任教研系列教授」。

然而,知乎上入職清華相關的帖子現在已經被刪除了。

前腳還傳進清華,此時落地入北大


沒有帖子,也沒有傳言。

9月24日,朱鬆純已經以院長的身份在北大開了工作會議。北大常務副校長龔旗煌

代表學校,對朱鬆純受聘北大表示熱烈歡迎。

朱鬆純表示,他與北大、清華的相關學者一直保持著密切的學術交流與合作,有很多朋友和合作夥伴。近一段時間來,自己又深入考察瞭解了北大、清華等高校的情況。

在北大,他與多個研究方向的師生進行了充分的交流,深入瞭解了北大人文社科領域的發展狀況,與多位知名學者進行了跨學科的探討,收穫頗豐。

朱鬆純認為通用人工智慧的實現,離不開哲學層面的思考,也需要與理工文醫深入融合。

而北大在各方面都有深厚的積澱,因此,堅定了自己在北大開展人工智慧研究的信心。

他將全身心投入到關鍵領域、重大問題的研究,培養更多國家需要的拔尖創新型人才,爭取取得更多突破性、原創性的成果。

朱鬆純還特別強調,他將主動發揮好橋樑紐帶作用,推動北大、清華等各兄弟院校精誠合作,整合各自優勢資源,形成合力,共同來參與、支援北京通用人工智慧研究院的建設。

清華北大都來「搶」的朱鬆純:三次問鼎計算機視覺最高獎

朱鬆純於1996年獲哈佛大學計算機博士學位,師從國際數學大師大衛·曼福德教授,在國際頂級期刊和會議上發表論文300餘篇,並三次問鼎計算機視覺領域國際最高獎項——馬爾獎。

朱鬆純對計算機視覺有著自己獨到的看法,在認知科學領域,如視覺常識推理、場景理解等領域做出了重要貢獻。

他信奉一句話,「一個民族如果忘記了歷史, 她也註定將失去未來」,而這句話,對計算機視覺來說,也是同樣發人深省。

他提到,現在很多新發表的視覺的論文,很少有文章能夠引用到 5 年之前的文獻,都是引用近兩年arxiv上的文章,去比一些Benchmarks。

很少有人認真去看 10 年前,20 年前,甚至 30 年前的論文,而當時的一些思想和框架性的東西,對現在的研究仍有重要的意義,大家幾乎都用同樣的方法在比小數點後面的精度。

大家都相當短視,只關注這幾年的歷史和流行的方法,根本無法傳承這個學科。特別是等當前這一波方法退潮之後,這批人就會慢慢失去根基和源創力。

談到自己的學術生涯,他認為David Marr 對他影響最為深遠。

60 年代開始的時候大家已經很多人研究視覺神經生理學、心理學問題,也有人做一些邊緣檢測的工作。但是,計算機視覺到底要解決哪些問題?如何實現?大家莫衷一是,談不清楚。

David Marr 分出了三個層次來解決這個問題,分別是計算(其實應該說成是表達)、演算法、和實現。

首先,在表達的層次, 如何把它寫成一個數學問題。任務是什麼?輸出是什麼?這是獨立於解決問題的方法的。

其次,對這個數學問題去求解時,可以選擇不同的演算法, 可以並行或者序列。

再次,一個演算法如何在硬體上實現, 可以用 CPU,DSP, 或者神經網路來實現。

除此之外,David Marr 還理清了視覺到底要計算什麼。

Marr 提出了一個系列的表達,從primal sketch(首要簡約圖), 到 2 ½ D sketch(深度簡約圖), 到 3D sketch。

這裡面還包含了紋理、立體視覺、運動分析、表面形狀等等。Marr認為,視覺計算不是單純去求一個解,而是一個連續不斷的計算過程,越看、越琢磨,可能得到的理解就越多。

值得一提的是,Marr 在1978 年冬診斷得了急性白血病,在得知來日無多後,Marr就趕緊整理了一本書《視覺:從計算的視角研究人的視覺資訊表達與處理》,去世時年僅35歲。

朱鬆純和同事在這本書上花了8年時間,把 Marr 提出的早期視覺概念, 包括紋理 、影象基元以及原始簡約圖等轉換成了一個統一的數理模型。

從此,視覺就可以從純粹的理論、計算的角度來研究了。

除了視覺的統計建模和計算理論,朱鬆純還實現了影象與場景的解譯(parsing)計算框架, 擴充套件了模式識別創始人傅京孫先生的句法模式識別理論。

自2010年以來,朱鬆純將計算機視覺與認知科學、自然語言理解、機器人等學科結合,探索他所稱的「人工智慧的暗物質」——佔95%的、無法通過感知輸入觀測到的智慧。

現在,朱鬆純團隊構建了一個大規模、物理逼真的VR / AR環境,用於訓練和測試負責執行大量日常任務的自主AI智慧體。

這些智慧體可以整合視覺,語言,認知,機器學習和機器人技術等領域的能力,在此過程中發展物理常識和社會常識,並使用認知架構與人類進行交流。

熟悉朱鬆純教授的人,對他嚴謹的治學精神,也從不吝惜讚美之詞。

他對數學一絲不苟,對視覺領域有著一流的直覺

微軟亞洲研究院視覺組研究員代季峰,曾經在朱鬆純教授的VCLA實驗室訪學一年多,為我們分享了一些朱鬆純教授的學術人生。

對視覺領域大方向有著一流的直覺

朱鬆純教授的實驗裡學生人數較多,自然要用雄厚的funding資金來支撐。朱教授在最近幾年應該都是美國大學視覺界裡funding最多的教授(不知道是不是要加個「之一」)。

從2011年起,朱老師的實驗室,作為PI拿到的資助超過4000萬美元,其主要原因就是其「研究思維超前」。

能夠拿到這些大funding,意味著朱教授對這個領域的大方向「有著一流的直覺以及領先和準確的把握」。

而朱教授這種的「第六感」在多年前就已經有所體現。

2012年,朱鬆純教授主持的一個MURI大專案在UCLA開會,他上臺講了一通「vision meets language」,說視覺和語言的結合會是一個重要的問題,比如看到一整個圖片,系統應該輸出一段話描述它,比如看到一個bounding box區域,要描述這裡面發生了什麼,這個用一個hierarchical的And-Or graph該如何實現。

當時很多視覺領域的大佬都覺得有些天方夜譚。沒想到過一兩年,這就是紅極一時的VQA任務,不過是用神經網路實現的。

「能夠提前感知到未來的大方向」,這是頂級的research感覺,這也是朱鬆純教授最厲害的地方。

朱鬆純教授提的大方向,雖然有錯的,但是正確的概率已經是很高了。

對數學(尤其是統計)一絲不苟

跟朱教授討論的時候,最經常被challenge的就是「這個演算法不對,數學上是錯的,這個CV領域最近火的技術在統計上是不對的」

對大部分研究者來說,概率模型流行就用概率模型,SVM流行就用SVM,神經網路流行就用神經網路。

而朱鬆純教授是有信仰的,那就是他的「概率模型」,曾經在SVM之前引領了視覺領域的潮流。那是他們自己的東西,所以不像其他人那樣可以輕易捨棄。

朱教授曾經說過「做research像下圍棋,不能東下一顆西下一顆,地盤全被別人佔了」。

對學生刀子嘴豆腐心

這是朱教授受到的爭議最大的地方。

剛去他實驗室的時候,會很不適應他的批評,但你慢慢了解他,就好了。

他對學生的長遠發展和重要利益,是非常好的;雖然批評時很難受,但過後他不記仇;還有同實驗室吳教授的平衡和調和。

其實學術圈的老闆,脾氣大一些、對學生push的非常多,算是research人的通病吧。

但最後找工作什麼的關鍵時刻,他和同實驗室的吳教授都是非常supportive,有人情味的。

朱鬆純教授的女兒在年滿18歲之際放棄了美國國籍加入中國國籍,也許從那時起,朱鬆純教授的回國計劃就已經提上了日程。

朱鬆純這次回國,將為國內人工智慧尤其是通用人工智慧的發展,帶來強勁動力。他也離「人工智慧大一統理論」的夢想上更近了一步。

參考連結:

http://www.stat.ucla.edu/~sczhu/research_blog.html#VisionHistory(朱鬆純:正本清源 | 初探計算機視覺的三個源頭、兼談人工智慧 ,2016)

https://www.zhihu.com/question/59182074(文中評價來自微軟研究員代季峰的知乎回答)

21考研的QQ群,有很多大學的計算機考研/軟體考研資料,歡迎加入

群號是954288959


您還可以在以下平臺找到我們

你點的每個在看,我都認真當成了喜歡