1. 程式人生 > >關於CVPR 2019投稿的一些感想

關於CVPR 2019投稿的一些感想

640?wx_fmt=png


作者 | 胡國聖,英國 anyvision 高階研究員,從事深度學習,人臉識別的研究。


一年一度的 CVPR 是人工智慧的機器視覺方向最重要的學術會議,每年吸引都會全球最頂尖的大學和公司的研究人員投稿,文章如果被錄用,通常認為你在你的研究子方向達到了國際領先水平,是對研究人員水平的一個肯定。如果中過 CVPR 這種頂會論文,對學生找工作,老師申請專案,公司做 PR 都有很大的幫助,CVPR 論文甚至是一些 AI 初創公司估值的重要組成部分。所以,中一篇 CVPR 意義挺重大。


關於本次 CVPR 投稿簡單說一下自己的看法:


1. 今年收到投稿 7100+ 篇,有效投稿 5165 篇,比去年增加 56% (圖1,華剛老師的統計)。 巨大利益的推動,從業人員大增,投稿量大增,論文的線上協同編輯工具 overleaf 一度因為編輯人太多而崩潰(圖2)。這種現象的背後是,國家制定人工智慧戰略,各大高校紛紛成立人工智慧獨立學院,很多原計算機學院 AI 方向的碩博名額大增。學生們紛紛轉專業學 AI 考 AI,轉不了專業的也在自學 AI。一群搞數學、物理、電子、機械、生物的都在轉。還有一大批物理數學奧賽(國際/國家/省賽

)金獎銀獎選手也加入競爭。華南理工譚明奎教授評論:當硬體領域的摩爾定律逐漸因為硬體極限而失效的時候,paper 發表數量接了班(圖3)。


640?wx_fmt=jpeg


640?wx_fmt=jpeg


2. 馬毅老師的微博(圖4)同樣引起了熱議:伯克利的馬毅老師和六十多歲的Malik 教授為了趕 deadline,深夜和學生一起奮戰,討論論文,修改論文。


640?wx_fmt=jpeg


3. 大佬們生活離我遠一些,那些歲數差不多的高校教師呢? 一大批青年教師,名校畢業,受過非常系統的科研訓練,水平高同時又非常有責任心,非常拼命。趕論文時,跟幾個青年老師簡單溝通了一下,他們最後一個星期基本每天晚上睡個 3-4 個小時,然後最後一天通宵幹到論文截止。


4. 學生們就不用說啦。這次跟國內老師合作的一篇論文, 我晚上下班後幫學生改論文,需要不停跟學生討論並互動。由於 8 小時的時差,我晚上工作的時候,他在國內已經下半夜啦。我工作到 12 點, 我問學生什麼時候睡。學生說,會一直陪我到我這邊 12 點(國內早上 8 點)。


5. 老師學生的強度都非常大,熬夜高強度工作,以致於論文群裡的深研院的彭小江老師非常嚴肅地分享了醫生給他的心梗自救-自我心肺復甦的一些方法(圖5,圖6),大家這才意識到自己在玩兒命。


640?wx_fmt=jpeg
640?wx_fmt=jpeg


6. 現在論文的集團化作戰現象明顯,分工明確,有人找創新點,有人定方向,有人做實驗,有人寫論文,有人負責畫圖。寫論文還分為有人寫方法論,有人寫 introduction。每個模組都有最牛逼的人做,有好幾個特別牛逼的組,學生只需要提供實驗結果,非常有經驗的老師和博後會把文章從 0 給寫完。我個人認為,培養一個研究生、博士生,你應該讓他學會找點、實驗和寫作,搞全套科研。但現在的情況是大家都集團作戰,你自己慢慢搞全套必然慢一些,很容易吃虧。


7. 這種集團化作戰的結果就是,馬太效應加劇,強者越強,弱者越弱。工業化大生產碾壓小作坊,以個人力量對抗一個個有經驗有資源的大組,結果就是小的組和閉門造車的個人發表頂級論文的可能性越來越低。


8. 這次投稿跟很多組進行了交流,有經驗的組和沒有經驗的組的一個主要區別是時間管理的不同。有經驗的組會要求學生一個月之前提交論文初稿,這樣老師會有足夠的時間跟學生討論並提高論文。沒有經驗的組,學生提前 2-3 天完成初稿,老師跟學生累死了,論文質量還沒有保證。建議老師應該給組裡學生一個 hard 的截止日期,比如提前一個月,或提前 2 個星期,如果學生在那之前不能提交初稿,就要放棄那篇論文。


9. 很多老師到最後都累在幫學生寫論文或改論文上,畢竟創新和實驗部分前期都完成啦。大部分學生做實驗都很好,但很多學生對論文寫作沒有系統鍛鍊過,論文呈現出來的邏輯簡直慘不忍睹。很多老師都跟我在抱怨這個問題,一個老師直接告訴我:“看到學生的初稿後,我真是 shock 啦,徹徹底底的 shock 啦。" 我相信很多老師看到自己學生寫的論文都有這個感受 :(


10. 最後給大家留個彩蛋,開心一下。我幫一個合作學生改論文時,他論文寫了“improve 3 points”,我讀的時候不太明白,看看錶格里的資料,提升了 3%,原來他把漢語土話中的“提升了三個點”按字面意思翻譯了一下。看完後, 我出去喝了一大杯水壓了壓驚,最後給學生起了個外號叫“三個點”。


最後的最後,祝大家 CVPR 論文高中。如果沒中的話,也多放寬心,看看你競爭對手的豪華陣容。投稿前盡全力做好自己能做好的,每個細節都盡力啦,問心無愧就好啦。有幸與世界最聰明的人同臺競技,一起觀看行業的風起雲湧,也是我輩幸運。同時,人工智慧這種增長速度和競爭強度值得每個從業者深思(不管你處於那個 Level),你如何自處,說得糙點,你如何活下來並尋求發展,佔據有利位置,保住自己的位置。


#關於文中提到的分工寫 paper 的現狀,圖森未來首席科學家王乃巖和商湯科技聯合創始人林達華也發表了自己的觀點。他們認為,這種流水線作業對學生成長是不利的,一個好的科研人員需要有獨立做研究的能力,只有全程參與,才能成為有戰鬥力的生力軍。


640?wx_fmt=png


640?wx_fmt=png


原文連結:

https://zhuanlan.zhihu.com/p/50263270


BDTC 2018

精彩紛呈


2018 年12月6-8 日,由中國計算機學會主辦,CCF 大資料專家委員會承辦,CSDN、中科天璣資料科技股份有限公司協辦的 2018 中國大資料技術大會(BDTC 2018),將在北京新雲南皇冠假日酒店隆重舉行。


除 Keynote 外,主辦方精心策劃了 13 場專題技術和行業論壇,涵蓋大資料分析與生態系統、深度學習、推薦系統、大資料安全與政策、大資料可視分析、精準醫療大資料、資料科學與大資料技術教育、資料庫、金融大資料、知識圖譜、工業大資料、區塊鏈、交通與旅遊大資料等主題。


屆時,近百位技術專家及行業領袖將齊聚於此,聚焦大資料技術如何促進數字經濟迅速發展,關注大資料新應用,思辨通達,深入解析熱門技術在行業中的實踐和落地。緊貼時代脈搏,走近資料前沿。

       640?wx_fmt=jpeg


推薦閱讀

ImageNet時代將終結?何愷明新作:Rethinking ImageNet Pre-training

“萬”字諫言,給那些想學Python的人,建議收藏後細看!

2W臺伺服器、每秒數億請求,微信如何不“失控”?

Istio,下一個Kubernetes?

炸了!剛寫完這段程式碼,就被開除了…

中國可以沒有俞敏洪, 區塊鏈不能沒有這些女王們, 女性從業者現狀調查