1. 程式人生 > >ECCV2018 | 論文閱讀DetNet: A Backbone network for Object Detection

ECCV2018 | 論文閱讀DetNet: A Backbone network for Object Detection

持續更新~~~

目前大部分的目標檢測網路,包括one-stage和two-stage法,都是直接對用於影象分類的ImageNet預訓練模型進行微調,很少有專門為目標檢測設計的特徵提取器。更重要的是,影象分類和物體檢測之間存在許多差異:
(i)最新的物體探測器如FPN和RetinaNet通常需要影象分類任務以外的部分,來處理目標檢測所關注的物體的尺度問題。
(ii)影象分類只需要識別物體的類別,而目標檢測不僅要對物體進行匪類,還要定位物體的空間位置。 大尺度的降取樣操作增大了感受野,有利於影象分類,但是對於需要定位目標的檢測任務而言就不一定有利,因為降取樣操作會降低影象解析度,丟失了目標的位置資訊,對於大目標的定位和小目標的識別實在不利。
由於分類與檢測任務的各種不同,本文設計了一種專為目標檢測的主幹網路—— DetNet。
由於目標檢測存在物體的尺度問題,DetNetFPN中添加了額外的部分。 與用於ImageNet分類的傳統預訓練模型不同,即使包括額外的部分,我們仍可以保持特徵的空間解析度。為了保持DetNet的效率,我們採用了低複雜度的膨脹瓶頸結構。 通過整合這些改進點,我們的DetNet不僅可以保持高解析度的特徵圖,還可以保留較大的感受野,這兩者對於目標檢測任務都非常重要。