論文提要“Fast Feature Pyramids for Object Detection”
很多目標檢測器需要對影象進行多尺度精細搜尋,傳統方法的瓶頸是對每個尺度分別計算特徵,本文使用比較大的間隔octave計算特徵,之後對octave之間的尺度特徵進行推算,節省了多尺度特徵計算的時間,將目標檢測提到實時。
動機:目前的目標檢測方法如DPM,通常需要使用多通道,精細尺度取樣及增強的歸一化方法提升準確率,導致計算量大大增加。自然場景影象存在碎片統計特徵,可以用於不同尺度直接的結構預測。
多尺度梯度直方圖對比實驗
由一個問題引出,給定影象在某一尺度的梯度特徵,能夠估計臨近尺度的梯度特徵?
梯度直方圖是影象梯度角度的分佈,每個畫素對梯度直方圖投票,權值是梯度幅值。作者做了一個有趣的實驗,將影象進行上取樣和下采樣2倍,統計重取樣前後梯度直方圖某個bin的幅值比例
對於上取樣,均值為2,即為上取樣的倍數,對於下采樣,均值為0.34,為常數,比取樣倍數小的原因是損失了高頻資訊。對於歸一化的直方圖,下采樣直方圖幅值變化的比例均值為0.26。
多尺度特徵統計學習
1. 特徵尺度法則
用
根據Ruderman和Bialek提出的自然場景影象與尺度間的法則,並考慮將影象分成K個曉得影象塊,
2. 估計
為了估計給定不同通道
根據公式(4),
則
3. 單一影象偏差的幅值
快速特徵金字塔
1. 特徵通道縮放
使用R(I,s)表示影象I使用尺度s重取樣,給定影象I的特徵
下圖顯示了該方法的原理:
2. 快速特徵金字塔
快速金字塔的原理如下圖所示,傳統的方法是先重取樣影象,再計算每個尺度的特徵。文中只在每個octave重取樣影象計算特徵,每個octave之間的尺度(4到12個尺度)對應的特徵使用(7)式進行估計,使用octave進行估計的運算量是直接計算影象特徵運算量的1/3。
目標檢測器
1. Aggregated Channel Features(ACF)
給定一幅影象,計算幾個通道
2. Integral Channel Features(ICF)
ICF使用積分影象進行特徵提取,ICF檢測器及尺度金字塔如下圖所示
3. DPM
直接貼出實驗結果,使用本文的方法提升後VOC資料20類測試的mAP只降低2%。