馬爾可夫毯(Markov Blanket)
馬爾可夫毯(Markov Blanket)
最近接觸到馬爾可夫毯(MarkovBlanket)這個概念,發現網上資料不多,通俗易懂的解釋甚少,查了一些資料後,決定寫一個總結。
提到馬爾可夫毯,就會有一堆從名字上看很相近的概念,比如馬爾可夫鏈(Markov Chain, MC)、隱馬爾可夫模型(Hidden Markov Model, HMM)、馬爾可夫隨機場(MarkovRandom Field, MRF)等等。其實,馬爾可夫毯與這些概念不同,它是一個局部的概念,而不是一個整體模型級別的概念。以下內容主要參考【何憲. 基於貝葉斯網絡的馬爾可夫毯發現算法研究[D]. 電子科技大學, 2012.】,更多內容請參閱原文獻。
首先看馬爾可夫毯的定義:
這種純符號的定義看起來有些抽象,形象一點說,把一個隨機變量全集U分成互斥的三部分,變量X以及集合A和B,三個子集沒有交集,並集即為全集U;如果說給定集合A時,變量X與集合B沒有任何關系,則稱集合A為變量X的馬爾可夫毯。在式(2-16)中,集合MB即為我說的集合A,{U-MB-{X}}即為我說的集合B,符號“⊥”表示“獨立”,符號“|”表示在給定xx條件下,因此式(2-16)可讀為“在給定集合MB時,變量X與{U-MB-{X}}獨立”。
打個比方說,全集U是整個社會,X是你個人,MB就是你生活圈子裏的人。按照哲學的說法,萬事萬物都是有聯系的;但是,你並不會與社會裏的所有人有什麽關系,而是通過你的生活圈子和他們有間接的關系,即當給定你的生活圈子以後,你和社會其余的人是沒啥關系的(獨立的)。
特殊一點,當以上提到的全集是可信的貝葉斯網絡(Bayesian Network, BN)的各個結點的時候:
這段話說的比較嚴謹,通俗點兒說就是在可信的貝葉斯網絡中,一個節點的馬爾可夫毯包括它的爸媽、它的所有孩子、還有它的配偶,即生它的人和它參與生出來的人及它的現任妻子(因為你會發現孩子並非都是T和配偶共有的^_^)。再通俗點兒說,其實用我國傳統的家庭組成來解釋最為形象,以家裏的男主人為核心(即圖中的T),一家人包括爺爺奶奶(X1、X2,即T的爸媽)、小倆口(T他自己、X8)、孩子(X6、X7,其中X7是小倆口一起生的,X6是T和前妻生的,但現歸T撫養,已經沒前妻啥事兒了^_^)。值得註意的是,每個節點的配偶可以不止一個(即允許一夫多妻制,假如添加一條從X4到X6的箭頭,則X4也是T的配偶),也可以沒有配偶(即單身,比如圖中的X4,雖然有兩個孩子,但目前單身),當然我在這裏假設的性別也是隨時在變的,找誰的馬爾可夫毯,誰就是男性^_^
那麽馬爾可夫毯有什麽用處呢?文中提到了特征選擇(當然這只是用處之一):
換句話說,一個人的馬爾可夫毯就是和你有關系的所有人(按式2-16定義)。如果想要調查這個人,總不能把全社會的所有人都調查一下吧(大量的特征冗余),其實只要找出這個人的馬爾可夫毯人群調查一下就好了(特征選擇)。特別地,如果這個社會是貝葉斯網絡,馬爾可夫毯人群只包括自己的家人,相當於人只與自己的家人有關系,和其他人沒關系,是一種簡化的模型,具體可以查一查貝葉斯網絡的概念。
那麽怎麽找出這個人的馬爾可夫毯人群呢?那就去看看原文獻吧……
最後簡單談一點貝葉斯網絡,它是一個有向無環圖(Directed Acyclic Graph, DAG),如圖2-2所示,結點之間的連結都是有向箭頭,且不能沿著箭頭走一圈。貝葉斯網絡是馬爾可夫鏈的推廣,馬爾可夫鏈限定了結構只能是一條鏈,而貝葉斯網絡則不再限定結構是一個鏈,但二者都遵守馬爾可夫假設,即一個結點只依賴於它的上一個節點(一階馬爾可夫假設)。有關馬爾可夫鏈、隱馬爾可夫模型、貝葉斯網絡可以看一看《數學之美》,“統計語言模型”一章會涉及到馬爾可夫鏈,專門有一章叫“隱含馬爾可夫模型”,還有一章叫“馬爾可夫鏈的擴展——貝葉斯網絡”,講的比較通俗易懂,此處不再贅述。
文中幾次提到了可信的貝葉斯網絡,在文獻第3章給了可信性的定義:
也不知道上面的定義是不是指的“可信的貝葉斯網絡”中的“可信”,個人理解“可信的”意思可能是指這個貝葉斯網絡是個真正的貝葉斯網絡,即滿足馬爾可夫假設。
來源:CSDN
原文:https://blog.csdn.net/jbb0523/article/details/78424522
馬爾可夫毯(Markov Blanket)