R-CNN論文詳解(學習筆記)
R-CNN:基於候選區域的目標檢測
Region proposals
基本概念(看論文前需要掌握的):
1.cnn(卷積神經網路):CNN從入門到精通(初學者)
2.Selective search:選擇性搜素
3.warp:圖形region變換
4.Supervised pre-trainning:有監督預訓練-遷移學習
5.IOU:交併比IOU=(A∩B)/(A∪B)
6.NMS:非極大值抑制
7.DPM:採用判別訓練的部件模型進行目標檢測
基於候選區域的目標檢測原理圖
第一步:輸入影象,採用Selective Search 從原始圖片中提取2000個左右區域候選框
第二步:劃分區域提案,進行歸一化:將所有候選框變為固定大小的(227*227)區域
第三步:CNN網路提取特徵
第四步:SVM結合NMS(非極大值抑制)識別分類區域邊框,採用DPM精修邊框的位置
Selective research for object recognition(選擇性搜尋)
1.適應不同尺度:通過改變視窗的大小來適應物體的不同尺度,演算法採用影象分割(image segmentation)和層次演算法(Hierarchical Algorithm)
2.通過使用顏色、紋理、大小等多種分割策略對於分割好的區域進行合併
Supervised pre-trainning(有監督訓練(遷移學習))
物件分類:被標註的訓練資料很多
目標檢測:
遷移學習:採用Imagenet的資料集,進行預訓練,然後在PASCAL進行微調
CNN網路提取特徵
模型(Alexnet,VGG)
訓練SVM分類器
訓練特定類別的SVM分類器
訓練SVM的正負樣本:採用IOU閾值樣本,計算每一個region proposal與標準框的IOU,當大於閾值0.3時則為正樣本,小於閾值0.3時為負樣本。
輸入:CNN提取的區域特徵
輸出:每個候選區域特徵的概率輸出
獲取Bounding box
CNN生成每個region proposal 固定長度的特徵向量
svm計算 每個region特徵向量的score,並進行排序
NMS:選取概率最大的區域,計算與其他區域的IOU;當IOU大於給定閾值後丟棄該區域,同樣的過程依次遍歷所有region