《Randomized Low-Rank Dynamic Mode Decomposition for Motion Detection》讀書筆記(下)
謝絕任何不標註出處的轉載
如有問題請聯絡作者
原文連結:https://arxiv.org/abs/1512.03526
上文說了dmd的大概構建過程,這裡複習DMD在背景提取上的應用。RPCA中對於背景提取已經有了成果,對於一個視訊矩陣A,我們可以將其拆分成L和S兩個矩陣。其中L是一個低秩矩陣,用於描述視訊的背景;S是一個稀疏矩陣,用於描述視訊中的動態物體:
DMD不能像RPCA這樣直接將矩陣拆分,但是它可以求得一個矩陣的近似值。要做到背景提取,首先需要了解什麼是傅立葉模式(Fourier modes):
根據劉建忠:“傅立葉模式認為,人腦嘗試記憶儲存的是影象形狀的傅立葉轉換模式,而不是影象形狀的原型。傅立葉變換的實質是將視網膜的到的影象的密度矩陣分解成一定頻率上的訊號,即把現實世界的影象通過一個變換而轉變到頻率空間上去,從而可以在頻率空間看到原來在真實世界看不到的許多特徵,並根據這些特徵進行分析與識別。
傅立葉模式的優點有:
(1)當影象在一定範圍內變化時,其傅立葉變換後的某些量仍未改變。影象平移不影響其傅立葉變換的幅度,即:只要知道一個影象的傅立葉變換的幅度,則無論該影象如何平移,都能根據原來的傅立葉變換幅度進行這一影象的識別。
(2)實現方便
傅立葉模式也有三個難以克服的缺點:
(1)傅立葉變換是對整個影象的變換,若影象由若干部分組成,則經傅立葉變換後的譜不能指出哪些譜是對應影象的哪一部分。
(2)影象的任何一小部分有一個無規則的變動,都會引起傅立葉譜的激烈變化(這是一個致命問題)。
(3)找不到一種將傅立葉譜與影象位置相對應的規律(感覺與(2)類似?)”【1】
用公式表示傅立葉模式有:
在標準視訊中,我們預設delta t =1,所以wi就被簡化成了第二個等號後面的式子。其中,得到的w的敘述部分表示模式的震盪(mode's oscillations);實數部分是決定了單個模式隨著時間的變化(determine the mode's evolution over time)。現在我們根據傅立葉模式重寫DMD的公式:
如此一來,我們可以用w來替代複雜的λ奇異值的計算,是不是很方便呀~~然後我們可以將公式進步一改寫為:
其中l是低秩矩陣L的element(background); s是稀疏矩陣S的element(dynamics)。這個分解公式也是background和foreground的重構公式,拆開來用就好。或者可以用下式求得動態物體:
通常3-5 modes足矣。
大致的原理就結束啦,其實這麼看來,rDMD和RPCA的思路還是非常像的,只不過DMD通過低秩讓計算量減少,從而讓演算法速度增快啦~
參考資料:
【1】 二次轉載出處;https://blog.csdn.net/largestone_187/article/details/6158449
轉載標註出處:http://hi.baidu.com/liujianz