1. 程式人生 > 資訊 >訊息稱微軟亞洲研究院 CV 大牛王井東離職,或將加入百度

訊息稱微軟亞洲研究院 CV 大牛王井東離職,或將加入百度

據多位知情人士向雷鋒網爆料,微軟亞洲研究院計算機視覺大牛王井東已離職,或將加入百度

視覺計算組作為微軟亞研的靈魂團隊,陸續培養出了沈向洋、湯曉鷗、馬毅、孫劍、何愷明等老中青三代計算機視覺引領者,只可惜這些人都已遠去。

王井東原為微軟亞洲研究院視覺計算組的首席研究員,研究領域包括神經架構設計、人體姿態估計、語義分割、影象分類、目標檢測、大規模索引和顯著目標檢測。

他是 ACM 傑出會員和 IAPR Fellow,曾任 IEEE TPAMI、IEEE TMM、IEEE TCSVT 副主編,以及 CVPR、ICCV、ECCV、ACM MM、IJCAI、AAAI 等視覺、多媒體、AI 領域頂級會議的區域主席。谷歌學術顯示,他目前論文總引用量為 23950,h 指數為 69。

王井東本科就讀於清華大學自動化系,是個學霸,成績全年級第一。他 2001 年和 2004 年在清華大學自動化系先後獲得學士學位和碩士學位,碩士期間也曾獲得優秀碩士學位論文獎。2007 年,他在香港科技大學計算科學與工程系獲得博士學位,同年進入微軟亞洲研究院。

他的碩士導師是清華大學教授張長水,在碩士期間他曾去微軟亞研實習,接受沈向洋的指導,那是他與微軟亞研的初次結緣。攻讀博士學位階段,他成為了香港科技大學教授權龍的學生。

▲權龍(左)和王井東(右)

除此之外,在整個學術生涯中,王井東亦合作過多位知名 AI 學者,包括華先勝、田奇、梅濤、李世鵬等。

加入微軟亞研後,王井東從研究員一步步上升為高階首席研究經理,並秉承微軟亞研一貫的高產傳統,發表了兩百多篇論文。

王井東加入百度後,具體去向如何?

因其過硬的實力,王井東或許可以成為百度研究院在視覺研究的“一把手”。

AI 工業界有句老話:得視覺者得天下。

百度研究院歷來的掌舵人,從餘凱、林元慶到王海峰,以及副院長張潼、集團首席科學家吳恩達等人,除了林元慶外,其他均為機器學習和 NLP 領域的學者,視覺領頭人屬實稀缺。

更是從未有過 Fellow 級的計算機視覺專家。

反觀這些年的騰訊(張正友、賈佳亞)、阿里(華先勝、張磊)、華為(田奇)、京東(梅濤),長期都有 Fellow 級知名計算機視覺學者坐鎮。

這也難怪,百度的業務支柱是搜尋和廣告,主要涉及文字資訊檢索和推薦,自然和 NLP、機器學習等技術更加契合,而在影象領域,除了自動駕駛外,百度天然缺少線下物理世界的檢視場景,而線上影象的資料識別和處理,本身並不具備太大難度,且實用價值不足,這對知名的計算機視覺專家來說,吸引力著實有限。

業內人告訴雷鋒網,王井東加入百度自動駕駛部門也不無可能。

其一,百度前機器人、自動駕駛實驗室主任及首席 3D 視覺科學家楊睿剛教授已在去年初加入嬴徹科技擔任 CTO,這一職位一直空缺。

其次,他的同門師弟 AutoX 創始人肖健雄,在自動駕駛方向頗為成功,這為王井東破圈進入自動駕駛領域有不少借鑑意義。

王井東在計算機視覺領域特別是視覺感知方面的研究非常廣泛,比如人體姿態估計、語義分割、影象分類、目標檢測等技術,對於自動駕駛來說都是很重要的感知功能。

他還曾開發出 HRNet 模型,其通用性很強,不但可勝任人體姿態、分割、人臉關鍵點檢測、目標檢測等任務,體現了高解析度表徵的優點,並且從引數量、計算量以及最終結果看,都很有優勢。在 CCF-GAIR 2020 上,王井東詳細介紹了這一模型。在報告中,王井東表示:

這個方法自從在 CVPR 發表以來,已經成為在人體姿態構建裡一個標準的網路,一些文章或者比賽都會採用 HRNet 架構。

詳見:https://www.leiphone.com/category/smartsecurity/Qu1qbNlNCWdiaaf7.html

而另外一聲音則預判,王井東深厚的三維視覺背景,有可能會去百度研究院,成為元宇宙、AR/VR 等創新專案的支撐力量。

可以預見,三維重建在未來必定會成為元宇宙最重要的基礎技術之一,玩家長期在虛擬空間中進行互動,離不開大量的重建和識別。

王井東的導師權龍教授也曾告訴雷鋒網,三維重建包含三大問題:一、定位置。假如我給出一張照片,計算機視覺要知道這張照片是在什麼位置拍的。二、多目。通過多目的視差獲取三維資訊,識別每一個畫素並進行匹配,進行三維重建。三、語義識別。完成幾何三維重建後,要對這個三維資訊進行語義識別,這是重建的最終目的。三維重建不是最終的目的,最終的應用肯定要把三維重建和識別融為一體。