1. 程式人生 > >關於馬爾科夫隨機場(MRF)在影象分割中應用的個人理解

關於馬爾科夫隨機場(MRF)在影象分割中應用的個人理解

首先明確幾個基本概念(個人理解):

先驗概率: 基於歷史經驗得到的當前事件發生的概率

後驗概率: 根據資料或證據得到的事件發生的概率 (由因到果)

似然概率: 已知事件發生的概率下資料或證據發生的概率 (由果到因)

影象分割和目標識別都可以看成一個影象中各個畫素點做label的過程。例如進行邊緣檢測,就是以一定閾值判斷這些畫素值屬於標籤集{edge,nonedge}中的哪一類。

為此,我們認為每個畫素s在影象中具有一個特徵向量,對整張圖有

定義每個畫素s屬於label ws,對整張圖有

根據以上定義,圖形分割從概率的角度來說就是一種求各畫素點屬於每個label的概率,取其中最大的那個label的過程。

P(w|f)表示基於observed feature f的條件下屬於一個標籤的概率,也叫後驗概率。因此,該過程就是最大化後驗概率來尋找最優標籤w。該思想被稱作MAP(Maximum a Posteriori),即就是

基於貝葉斯理論可知P(w|f)與P(f|w)和P(w)有關

P(f|w)就是似然概率,P(w)是先驗概率,P(f)是一個常量。

由於影象中某些區域的相鄰畫素點見會有相似的顏色,紋理之類的,那麼馬爾科夫隨機場這種概率模型就能夠得到很好的應用。

根據The Hammersley-Clifford Theorem可知,當且僅當先驗概率P(w)滿足Gibbs分佈時,隨機場為馬爾可夫場。Gibbs分佈就是如下形式

是歸一化引數。

下面介紹Clique的概念。

當一個子集C屬於S滿足其中的每一對畫素點都是相鄰的情況下,該子集被稱為clique,含有n個畫素的C為Cn。影象中clique的交集表示為C,即

對每個C,對應有一個clique potential,定義為Vc(w),w是前文中的標籤。那麼易得

我們一般假定似然概率符合高斯分佈(因為噪聲呈高斯分佈?)

對於定義的Clique potentials有以下值:

singleton(單個畫素點)Clique potential=logP(f|w)

doubleton(畫素點對)Clique potential是一個分段函式,與平滑性有關,引數beta越大則該區域越homogenous(同質)

定義mrf模型的能量方程為

尋找最優w的過程就是優化能量函式的過程。

以上就是基本思路,常用優化演算法如模擬退火 梯度下降之類的對能量函式進行優化。