1. 程式人生 > >Faster-RCNN筆記

Faster-RCNN筆記

(1)anchor機制
這裡寫圖片描述

實驗中,原圖大小1000*600,經過五層卷積後縮小為原來的1/16,feature map大小為60*40。這裡面的關鍵就是選擇合適的sliding window大小,使得在feature map上任意一個object region的資訊必須包含在一個sliding window內。然後再選擇合適大小和比例的anchor box 來生成region proposals。
每個anchor box有四個座標(x,y,w,h),將它們平移縮放後,就可以得到原始圖片中object 的bounding box的四個座標(x’,y’,w’,h’)。如果將它們與ground truth相比較,就能夠得到它們的分類分數。