自然語言期末複習筆記—最大熵馬爾科夫模型MEMM
阿新 • • 發佈:2019-01-05
在這篇部落格,我們來談一談最大熵馬爾科夫模型MEMM
關於這部分內容,我看了一晚上,整個公式都都梳理了之後,愣是沒明白這個最大熵體現在哪裡,當然我最終查閱了很多資料,終於還是弄明白了,我會在這篇部落格上詳細講解。不得不說一下,咱們國內的部落格基本都是來自同一個資料源,就比如說這個最大熵馬爾科夫模型,搜尋來搜尋去,都是拿複製轉載,有的好的會加點自己的觀點。
最大熵馬爾科夫型MEMM
這個圖是以序列標註為舉例,與隱馬爾科夫做對比。我們可以看到很大的不同是,序列標註是根據上一個狀態和觀察值來判定。
再來上一個圖,可能可以給更清楚的認識
在這裡我需要提醒以下我們看到一個狀態的概率是前一個狀態和和當前觀察狀態下的條件概率。P(S|O,M),這個是一個很抽象的表示式,不要把他當成是HMM模型中那種頻數相除。
這個是關於MEMM數學公式表示式。我們看到等式最右邊那個是對通過特徵函式做的歸一化操作。
特徵函式,我們在最大熵模型那篇部落格裡已經詳細介紹過,在這裡簡單說說
到此就是我們求MEMM的過程。其實整個過程並不複雜,我寫這篇部落格重點也不是這個,我看到這之後我的疑問是最大熵馬爾科夫模型之所以叫最大熵馬爾科夫模型的原因,就是說,最大熵體現在哪裡? 對於這個解釋,我翻了很多資料最終是在speech and language processing 這本書裡看到了解釋。