1. 程式人生 > >【論文筆記】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

【論文筆記】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

《Region-based Convolutional Networks for Accurate Object Detection and Segmentation》是將卷積神經網路應用於物體檢測的一篇經典文章。

整個識別過程可以用下面的一張圖片來清晰的表示:

首先給定一張輸入影象,採用selective search產生區域提名,因為區域提名的長寬比例不一樣,將提取出的區域縮放為固定的大小和長寬比例以便於送入CNN模型進行運算。通過CNN運算後,得到一個特徵向量,然後通過線性SVM來判斷這個區域是否屬於某個類別。


1.要想做檢測,首先需要的是區域提名,文章中提到了很多種區域提名的方法:objectness [51], selective search [21], category-independent object proposals [52], constrained parametric min-cuts (CPMC) [22], multi-scale combinatorial grouping [35] 。 本文中用了selective search

 (J. Uijlings, K. van de Sande, T. Gevers, and A. Smeulders, “Selective search for object recognition,”IJCV, 2013 )作為區域提名的方法。通過該方法,對於每張圖片可以產生大概2000個候選區域。

2.網路採用的是經典的AlexNet網路,文中稱之為TorontoNet,其實是同一個網路。訓練過程中,採用梯度下降法,在VOC和ILSVRC2013 兩類資料集上分別進行訓練,在網路的最後,不是採用softmax而是針對沒一個類別單獨的訓練一個線性SVM。