1. 程式人生 > >基於Deep Learning的跟蹤演算法總結(四)

基於Deep Learning的跟蹤演算法總結(四)

題外話:博主這段時間忙於辦理簽證,比較忙,一直沒時間看論文。:-(

一、引言

深度學習具有強大的能力,但由於目標跟蹤任務本身的特殊性,深度學習一直沒能很好地發揮出自己的潛能。其中,導致深度學習演算法速度慢的一個重要原因是online-update,即更新過程中的反向傳播。那麼,於是就人提出,是否可以不進行線上更新呢?而只在線下訓練,測試時只進行前向的一次傳遞,這樣的速度是很快的。

二、How

注意,本文不詳細介紹每一篇論文,只介紹每篇論文是如何做到不線上更新,還保持準確率的。其中第一、二篇論文介紹,請參考本系列之前文章,第三篇請參考博主上一篇博文。論文連結之前也放出,這裡不再列舉。

1、GOTURN

Our tracker uses a simple feed-forward network with no online training required. The tracker learns a generic relationship between object motion and appearance and can be used to track novel objects that do not appear in the training set.

學習的是物體運動特徵和外貌特徵的關係,能夠跟蹤在訓練過程中未出現過的物體。

2、Siamese Nets

網路學習的是一個相似度比較函式。

3、Re3 Net

CNN+LSTM網路。CNN捕捉外貌特徵,LSTM捕捉運動特徵,其中外貌特徵是線下訓練得到的,在測試過程中CNN引數是固定的,而LSTM也不進行反向傳播。但LSTM的state會在前向傳播中更新(注意,這個有別於反向傳播的更新)。

此處未完,待更。

三、綜述

個人覺得前兩種方法比較牽強,當然都取得很好的效果。而第三種方法更加直觀。像第一種方法,為什麼能捕捉運動資訊呢?而第二種,則是學習的是相似度函式,但看上去線下需要各種物體大量的訓練資料,對新物體的效果應該會大打折扣。第三種方法,雖然因為無法線上更新,對新物體的特徵無法學習,但是LSTM能夠在前向過程中更新狀態,可以理解為捕捉到最近幾幀的運動特徵,效果顯然要比第一種好。