【論文筆記】Region-based Convolutional Networks for Accurate Object Detection and Segmentation
《Region-based Convolutional Networks for Accurate Object Detection and Segmentation》是將卷積神經網路應用於物體檢測的一篇經典文章。
整個識別過程可以用下面的一張圖片來清晰的表示:
首先給定一張輸入影象,採用selective search產生區域提名,因為區域提名的長寬比例不一樣,將提取出的區域縮放為固定的大小和長寬比例以便於送入CNN模型進行運算。通過CNN運算後,得到一個特徵向量,然後通過線性SVM來判斷這個區域是否屬於某個類別。
1.要想做檢測,首先需要的是區域提名,文章中提到了很多種區域提名的方法:objectness [51], selective search [21], category-independent object proposals [52], constrained parametric min-cuts (CPMC) [22], multi-scale combinatorial grouping [35] 。 本文中用了selective
search
2.網路採用的是經典的AlexNet網路,文中稱之為TorontoNet,其實是同一個網路。訓練過程中,採用梯度下降法,在VOC和ILSVRC2013 兩類資料集上分別進行訓練,在網路的最後,不是採用softmax而是針對沒一個類別單獨的訓練一個線性SVM。