What Do We Understand About Convolutional Networks翻譯(一)
最近讀了篇深度學習綜述類的論文,讀完對整個深度學習網路會有個新的瞭解,該論文是在2018年3月23號發表在了arXiv,論文正文部分長達80頁,我會將翻譯分成幾塊。
Introduction
1.1 動機
在過去幾年中,主要的計算機視覺研究都集中在卷積神經網路上,通常稱為ConvNets或CNN。這些效果在廣泛的分類和迴歸任務中產生了新的最先進的效能。相比之下,雖然這些方法的歷史可以追溯到若干年,但對這些系統如何實現其卓越結果的理論理解滯後。事實上,目前計算機視覺領域的許多貢獻都使用ConvNets作為一個黑盒子,對於它的工作原理有一個非常模糊的想法,從科學的角度來看這是非常不令人滿意的。特別是,有兩個主要的互補問題:
(1)對於學習方面(例如卷積核),它究竟學了什麼?
(2)對於網路設計方面(例如層數,核心數,池化策略,非線性選擇),為什麼某些選擇比其他選擇更好?
這些問題的答案不僅可以提高對ConvNets的科學理解,還可以提高它們的實際適用性。
此外,目前ConvNets的實現需要大量的資料用於訓練,不同的設計對效能有很大影響。 更深入的理論理解應該減少對資料驅動的依賴。 雖然實證研究調查了網路的運作,但迄今為止,他們的結果主要侷限於內部處理的視覺化,以瞭解ConvNet不同層面正在發生的事情。
1.2 目標
本文獻將回顧多種卷積網路。重要的是,我們將通過用多種方法來討論典型的卷積網路的各個組成部分,這些方法的設計基於生物學發現和合理的理論基礎。此外,還將通過視覺化和實證研究來理解ConvNets的不同嘗試。最終目標是闡明ConvNet網路中涉及的每一層的作用,提煉我們目前對ConvNets的理解,並突出不足之處。
1.3 論文大綱
本報告的結構如下:本章的動機是需要回顧我們對卷積網路的理解。第2章將介紹各種多層網路,並介紹計算機視覺應用中最典型的網路。第3章將更具體地關注典型卷積網路的每個結構塊,並從生物學和理論角度討論不同元件的設計。最後,第4章將描述ConvNet設計的當前趨勢以及對ConvNet理解的有效性,並強調仍然存在的一些突出不足之處。