1. 程式人生 > >R-FCN 論文學習

R-FCN 論文學習

R-FCN: Object Detection via Region-based Fully Convolutional Networks

論文地址: https://arxiv.org/pdf/1605.06409v2.pdf.

Abstract

作者使用R-FCN (region-based,fully convolutional networks)進行精確和有效的目標檢測。對比之前的區域檢測器(Fast/Faster R-CNN 應用於每一個區域子網格要花費數百次),我們的區域檢測是基於整幅圖片的全卷積計算

。作者使用了一個 position-sensitive score maps 來處理在影象分類中的平移不變性和在目標檢測中的平移變換性這樣一種兩難境地。作者的方法採用了全卷積圖片分類主幹部分,例如最新的殘差網路(Residual Networks) (ResNets),用於目標檢測。在PASCAL VOC(e.g.,83.6% mAP on the 2007 set) 資料集的實驗上,作者使用了101層的 ResNet 達到了很好的效果。同時僅僅使用了170ms/每張圖片,比Faster R-CNN匹配快了2.5~20倍左右。

1. Introduction

目標檢測領域的深度網路,在 Region of Interest(RoI) 池化層前後可被分為兩個子網路:

  • 一個是共享的,全卷積且獨立於 RoI 的子網路;
  • 一個是 RoI-wise 且不共享計算的子網路,由若干全連線層組成;
    比如 ALexNet 和 VGG Net 一般來說,都是先經過一系列的卷積層,每層卷積以後會有一些池化層,最後跟著若干全連線層。Fast R-CNN,SPPnet就是卷積層後跟著 SPP 或者 RoI 池化層,然後再有全連線層。