1. 程式人生 > >Fully Motion-Aware Network for Video Object Detection

Fully Motion-Aware Network for Video Object Detection

目標檢測 prop cti bubuko 提取 inf 相差 detect fast

來自清華的一篇文章,發表在ECCV2018上,是對FGFA做的改進。

技術分享圖片

  針對R-FCN這一目標檢測算法做出的專有改進,目前看來這個方法只適合用在R-FCN,無法遷移到其他目標檢測算法,如faster rcnn、SSD等。

具體的做法是這樣的,FGFA就是圖中左半部分,分別提取相鄰幀的圖片特征,並用光流做對齊,這篇文章有意思的點在於他對多幀特征進行的是求和去平均值,

沒用加權平均,作者稱直接取平均得到的結果和加權平均相差不大,還能減少計算量。作者稱左邊這一步為像素級的對齊。右邊是作者提出的實例級的對齊,將每一張圖片的

特征送入檢測網絡,得到多個proposal的位置敏感圖,再利用光流對得到的位置敏感圖進行對齊,將對齊後的結果取平均做一個增強,達到了還不錯的效果。

技術分享圖片

在VID上達到了78.1的mAP,但文章裏沒有提速度,感覺比FGFA會慢一些。

Fully Motion-Aware Network for Video Object Detection