1. 程式人生 > >目標檢測:MSCNN

目標檢測:MSCNN

相比Faster-rcnn主要改進點在多尺度及速度上,該網路屬於UCSD大學的SVCL實驗室和IBM研究院一起研究的結果。其程式碼已經開源到GitHub,連結為:https://github.com/zhaoweicai/mscnn。具體如下:

 

這篇文章主要解決多尺度同時存在時的檢索問題,設計了MSCNN網路,提出了兩點創新:

(1)針對多尺度問題:

   類似於FCNT跟蹤方法,該文章也是觀察到了卷積網路不同層得到的特徵特點的不同,對不同層的特徵採用不同的利用方式。比如conv-3的低層,細節更加清楚,可以進行小目標的檢測;而高層如conv-5,對於大目標的檢測更加準確。對於不同的層設計不同尺度的目標檢測器,完成多尺度下的檢測問題。

   具體細節在下圖1proposal網路結構中可以看到,不同層有針對性完成不同尺度目標的檢索。

(2)針對速度問題:

   使用特徵的上取樣代替輸入影像的上取樣步驟。設計一個去卷積層,來增加特徵圖的解析度,使得小目標醫院可以被檢測出來。這裡使用了特徵圖的deconvolutional layer(去卷積層)來代替input影像的上取樣,可以大大減少記憶體佔用,提高速度。

   具體deconvolutional layer在下圖2目標檢測網路結構中可以看到。

 

文章的網路結構類似RCNN,分為proposal提取和目標檢測,兩個部分獨立進行。

proposal子網路和目標檢測子網路結構圖分別如下:

 

實驗過程與結果:

文章主要在KITTI和Caltech Pedestrian資料集上進行了MSCNN的測試,因為這兩個資料集中包含許多小目標。

作者對proposal網路部分目標檢測部分的實驗結果分別進行了全部系統的分析和對比,這裡僅僅將在KITTI上的檢測結果展示: