1. 程式人生 > >目標追蹤論文之狼吞虎嚥(4):MCCT演算法

目標追蹤論文之狼吞虎嚥(4):MCCT演算法

一、創新點

作者提出,單一追蹤器的效能不夠穩定,而從多個追蹤器的決策層得出的融合結果可以有效地提高魯棒性。因此,作者提出一個基於多線索相關濾波的追蹤演算法(MCCT),文章的主要貢獻如下:

  • 提出了一個可以保留多條線索的追蹤演算法,在每一幀中演算法在眾多專家中挑選出一個最可靠的專家結果;
  • 考慮到多個專家存在分歧,作者提出一個自適應更新策略,可以有效區分不可靠樣本(如遮擋或大幅度形變)從而減輕訓練樣本的汙染。
  • 作者實現了MCCT演算法的兩個版本,用來驗證框架的一般性。

二、相關工作

  • 相關濾波
  • 融合追蹤,作者提出,已有的融合多個追蹤器的演算法存在一些侷限:
    1. 總體速度受到最低追蹤器的限制,此外,融合方法要分析前向和反向軌跡,這要求每個追蹤器至少要跑2次
    2. 追蹤器被認為是一個黑箱子,每一幀的融合結果沒有反饋給追蹤器,導致不能很好利用每一幀的融合輸出結果
    3. 如果追蹤器數目增加,計算負擔將大大增大

與上述追蹤演算法不同,作者提出的MCCT演算法
1. 所有的專家都是基於DCF,通過作者提出的投入產出比ROI和訓練樣本共享策略,演算法的高效性得到保證
2. 每一幀的追蹤結果都會反饋給專家們,以促進他們提升
3. 通過一個簡單但是高效魯棒的評估策略,用於選擇最可靠的專家,且計算複雜度只有O(TN),T是幀數,N是專家數。

三、論文演算法

3.1 DCF框架

數學模型

這裡寫圖片描述

模型訓練

這裡寫圖片描述

模型測試

這裡寫圖片描述

引數更新

這裡寫圖片描述

3.2 特徵池和專家池

特徵池包含3種類型的特徵{低階、中級、高階},其中

  • 低階特徵:HOG
  • 中級特徵:去除VGG-19全連線層,提取conv4-4的輸出
  • 高階特徵:去除VGG-19全連線層,提取conv5-4的輸出

由特徵池對應的專家池裡共有 C 3

1 + C 3 2 + C 3 3 = 7 名專家
這裡寫圖片描述
注:這裡的 H O G 1 H O G 2 是由31維的HOG特徵加上1維的每個patch的灰度平均值構成的32維向量分解而成的2個16維特徵。

3.3 MCCT演算法

演算法流程圖

這裡寫圖片描述
step1. 提取不同特徵的ROI,放在特徵池中
step2. 每個專家給出一個獨立的預測線索,挑選最靠譜的專家用於當前的追蹤
step3. 自適應更新策略,用於防止專家墮落(效能下降)