1. 程式人生 > >周博磊知乎熱答:如何評價何愷明大神斬獲ICCV 2017最佳論文

周博磊知乎熱答:如何評價何愷明大神斬獲ICCV 2017最佳論文

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

授權轉載自知乎

作者:周博磊

2017年10月24日下午,Facebook AI 研究員何愷明大神斬獲ICCV 2017最佳論文,這是他第三次斬獲頂會最佳論文,對於Kaiming He 在 ICCV 2017 上拿下雙 Best的paper,他的中大同學,另一位大神周博磊在知乎寫了一段他眼中的凱明師兄。

大資料文摘經周博磊授權,釋出這篇文章,看看大神眼中的大神是什麼樣?

其實從他發Dark Channel那篇論文開始,我就挺關注他的研究工作。那時候還是前Deep Learning時代的計算機視覺,一切都還不怎麼work,還流行著LDA和各種graphical models。他那幾篇low-level vision的論文讀完就讓人有眼前一亮的感覺,很多時候論文的立意都是從現象出發,然後追溯到背後的本質,然後再提出了一個樸實有效的解決問題的辦法。雖然我自己不做low-level vision,但這些論文讀完讓我有 “啊哈” 的欣喜感覺,受到挺大的啟發。這種從現象和問題出發追溯本質的思想

,給他後面更加優秀和廣為人知的工作埋下了重要的伏筆。

後來愷明從中大(CUHK)博士畢業在MSRA當研究員的時候就開始領隊打ImageNet比賽了,做image classification的問題。從low-level vision到high-level vision,對於一般研究者,本來是個挺大的轉變。但這恰好趕上了deep learning的浪潮,如何訓練更好的分類神經網路本身是個非常empirical的研究問題。神經網路太複雜了,很難有什麼理論指導,所以這玩意更像一個現象。

這樣,愷明之前的從現象到本質的研究方式讓他發現了神經網路中很多的問題所在,並提出了一些很有效的解決辦法。比如說從防治gradient vanishing問題, 匯出了Parametric ReLU,以及進一步提出後來封神的ResNet。再比如針對在object detection裡如何更有效地利用CNN feature map, 提出了Spatial Pyramid Networks,到後來Fast RCNN, 跟Ross一起的Faster RCNN, 以及現在獲獎的Mask RCNN。你可以很清楚地看出這些優秀研究工作的連貫性。在一個研究問題上死磕5,6年,在現在這個亂花迷人眼的時代非常難得。而且這image classification and object detection是計算機視覺的核心問題,愷明能解決得如此漂亮,真是由衷佩服,對這個領域推動也是巨大的(連AlphaGo Zero都用了residual block,可以想象Resnet是如何應用到計算機視覺的研究和產品線中去的)。當然,愷明的這些研究工作有很多頂級優秀的Collaborator參與,比如說他MSRA的孫老大(現Face++),兩位頂尖實習生Xiangyu Zhang, Shaoqing Ren,以及FAIR的頂尖高手Ross和Pitor等等,這裡就不展開了。

愷明去年夏末的時候才從MSRA到美國來加入Facebook AI Research,一年不到就搞出了MaskRCNN這個黑武器。MaskRCNN是semantic segmentation和object detection的一個結合,成為了instance segmentation的利器。Facebook內部工程線上面都廣泛部署了Resnet和MaskRCNN,想必對公司貢獻是非常大的。三週前我剛去FB總部參加了一個workshop,跟他聊了些近況和新的研究方向。你們的愷明大神還是依舊戰鬥在coding最前線的,哈哈,我是不會透露他正在蘊釀下一個什麼大招的,大家期待就是了。

最後,大家可以再留意一下ICCV'17最後一天(也就是這週末)的Workshop COCO + Places 2017 。我參與舉辦了這次joint challenge,比賽專案是object detection, keypoint detection, scene parsing, instance segmentation等等。一個看點是,Kaiming和Ross所在的FAIR團隊如何對壘中國的一些視覺公司如Face++和SenseTime等等,比賽結果會在當天揭曉。結果挺有意思,也值得大家思考。

0?

往期精彩文章

點選圖片閱讀

0?wx_fmt=jpeg0?wx_fmt=jpeg

0?wx_fmt=jpeg