1. 程式人生 > >R-CNN論文詳解(學習筆記)

R-CNN論文詳解(學習筆記)

R-CNN:基於候選區域的目標檢測


Region proposals

基本概念(看論文前需要掌握的):

1.cnn(卷積神經網路):CNN從入門到精通(初學者)

2.Selective search:選擇性搜素

3.warp:圖形region變換

4.Supervised pre-trainning:有監督預訓練-遷移學習

5.IOU:交併比IOU=(A∩B)/(A∪B)

6.NMS:非極大值抑制

7.DPM:採用判別訓練的部件模型進行目標檢測

基於候選區域的目標檢測原理圖

第一步:輸入影象,採用Selective Search 從原始圖片中提取2000個左右區域候選框

第二步:劃分區域提案,進行歸一化:將所有候選框變為固定大小的(227*227)區域

第三步:CNN網路提取特徵

第四步:SVM結合NMS(非極大值抑制)識別分類區域邊框,採用DPM精修邊框的位置

Selective research for object recognition(選擇性搜尋)

1.適應不同尺度:通過改變視窗的大小來適應物體的不同尺度,演算法採用影象分割(image segmentation)和層次演算法(Hierarchical Algorithm)

2.通過使用顏色、紋理、大小等多種分割策略對於分割好的區域進行合併

 Supervised pre-trainning(有監督訓練(遷移學習))

物件分類:被標註的訓練資料很多

目標檢測:

用少量的標註資料訓練高質量的模型

遷移學習:採用Imagenet的資料集,進行預訓練,然後在PASCAL進行微調

CNN網路提取特徵

模型(Alexnet,VGG)

訓練SVM分類器

訓練特定類別的SVM分類器

訓練SVM的正負樣本:採用IOU閾值樣本,計算每一個region proposal與標準框的IOU,當大於閾值0.3時則為正樣本,小於閾值0.3時為負樣本。

輸入:CNN提取的區域特徵

輸出:每個候選區域特徵的概率輸出

獲取Bounding box

CNN生成每個region proposal 固定長度的特徵向量

svm計算 每個region特徵向量的score,並進行排序

NMS:選取概率最大的區域,計算與其他區域的IOU;當IOU大於給定閾值後丟棄該區域,同樣的過程依次遍歷所有region