概率圖模型在影象處理中的應用
1.概率圖模型簡介:
概率圖模型是圖靈獎獲得者Pearl開發出來的用圖來表示變數概率依賴關係的理論。概率圖模型理論分為概率圖模型表示理論,概率圖模型推理理論和概率圖模型學習理論。
概率圖理論共分為三個部分,分別為概率圖模型表示理論,概率圖模型推理理論和概率圖模型學習理論。基本的概率圖模型包括貝葉斯網路、馬爾可夫網路和隱馬爾可夫網路。基本的Graphical Model 可以大致分為兩個類別:貝葉斯網路和馬爾可夫隨機場。它們的主要區別在於採用不同型別的圖來表達變數之間的關係:貝葉斯網路採用有向無環圖來表達因果關係,馬爾可夫隨機場則採用無向圖來表達變數間的相互作用。這種結構上的區別導致了它們在建模和推斷方面的一系列微妙的差異。一般來說,貝葉斯網路中每一個節點都對應於一個先驗概率分佈或者條件概率分佈,因此整體的聯合分佈可以直接分解為所有單個節點所對應的分佈的乘積。而對於馬爾可夫場,由於變數之間沒有明確的因果關係,它的聯合概率分佈通常會表達為一系列勢函式的乘積。通常情況下,這些乘積的積分並不等於1,因此,還要對其進行歸一化才能形成一個有效的概率分佈——這一點往往在實際應用中給引數估計造成非常大的困難。
2.概率圖模型在影象特徵點匹配中的應用
數字影象處理是計算機視覺重要的組成部分,特徵點匹配是數字影象處理技術中一個基礎而經典的技術環節,它的主要任務是將兩個或者多個點集中滿足一定幾何變換關係的點匹配成對,從而識別和定位物體,它在醫學影象匹配、運動目標的監測和跟蹤、手寫文字型識別等諸多領域中都有著重要的應用,具有十分重要的地位和研究價值,匹配結果的優劣直接影響到高層視覺中問題求解的正確與否。
點集匹配要找出兩個點集之間的空間對映關係。目前,解決點匹配問題仍有較多困難。把馬爾可夫隨機場應用到點集匹配中,得到模板點集的馬爾可夫隨機場表示,並且根據實際應用對演算法進行了很大程度的優化,降低了複雜度,從而得到了模板點集的非剛性全集匹配演算法;最後,引入匹配閾值,對全匹配演算法進行了改進,最終得到了一種非剛性子集匹配演算法。將概率圖模型應用到點集匹配領域,得出一種新的旋轉、縮放不變,並且能夠承受一定程度噪聲的非剛性子集匹配演算法,該方法計算量小,有較好的普適性,更重要的是,它實現了子集之間的多對一對映。
3.概率圖模型在影象分割中的應用
影象分割的目的就是將給定的一幅影象分割成物體的集合,而對於這些物體可以運用諸如影象檢測、辨識和跟蹤等這些處理高層次影象的技術進一步處理。解決影象分割問題的演算法大致可分為確定性方法和概率方法。前者把分割問題看做確定性最優化問題,後者把分割問題看做隨機最優化問題。概率方法又可進一步細分為兩類方法:(1)基於概率圖模型(如 MRF 和 BN)建模相關影象實體的聯合概率分佈;(2)利用引數或非參方法直接建模影象實體的概率分佈,包括判別式模型和產生式模型。
MRF和條件隨機場(CRF)是兩類在影象分割中應用最廣泛的無向圖模型。BN是應用最廣泛的有向無環圖。
(1) 基於MRF的分割模型
MRF 分割模型在二維格柵上建模影象觀測和標記變數的聯合概率分佈,根據貝葉斯定理,聯合概率能被分解成影象觀測似然函式和標記變數先驗分佈的乘積。一種先驗的馬爾可夫過程通常被作為先驗分佈,該先驗分佈激勵鄰近影象觀測的標註趨同。MRF假設影象觀測條件獨立於已給定的各位置的標註。
(2) 基於CRF的分割模型
與MRF不同,CRF在給定影象觀測條件下,直接建模標記變數的後驗概率分佈,並假設該後驗概率滿足馬爾可夫鏈性質。因此,CRF 是著重判別各位置圖象觀測的判別式模型。CRF 鬆弛觀測變數的條件獨立性假設,允許觀測變數之間任意互動,這樣也更符合實際情況。同時,CRF 假設標記變數在給定觀測資料條件下滿足馬爾可夫鏈性質,從而也能鬆弛基於觀測資料的區域性勻質約束,也讓 CRF以自然的方式處理不連續的影象資料和標註。LEE LH 等人設計一種普適的影象分割演算法。該方法基於 Adaboost 學習不同分割區域間的差異資訊,根據獲得的資訊構造 CRF 能量函式,從而能用最合適的特徵表示被分割區域。LI Xi 等人採用 CRF,提出一種基於超畫素的分割目標類的框架。該框架首先使用多尺度 Boosting 分類器估計超畫素標記,然後設計一個各相異性對比度敏感的成對函式,用以表示目標間的互動勢函式。
(3) 基於BN的分割模型
BN提供一種系統方法去建模隨機變數之間的因果關係。它利用條件獨立性關係簡化可能複雜的聯合概率分佈建模。基於BN結構,聯合概率分佈能分解為區域性條件概率的積,同時,使用區域性條件概率更容易說明其蘊含的語義。在影象分割中,BN 能表示不同實體之間(區域、邊緣和它們的觀測先驗度)統計關係上的知識。
4.概率圖模型總結
概率圖模型及其應用是一個比較前沿的研究領域,對解決不確定性問題具有非常好的應用前景。
概率圖模型有很多好的性質:
(1)提供了一種簡單的視覺化概率模型的方法,有利於設計和開發新模型;
(2)通過對圖的深入研究瞭解概率模型的性質;
(3)用於表示複雜的推理和學習運算,簡化了數學表達;
但是概率圖模型也有很多問題值得關注:
(1) 很多的應用系統都是用PGM的某一種方法,對不同領域演算法的效率不高。
(2) 圖和將現有的一些影象和視訊智慧資訊工具和方法(影象的多尺度分析方法,視訊的運動估計方法等)結合到PGM方法中還值得進一步研究。
PMG自身的特點使得基於PGM的演算法通常具有較高的時間複雜度,對PGM進行