1. 程式人生 > >條件概率分佈與邊緣概率分佈

條件概率分佈與邊緣概率分佈

1.條件概率分佈

這是理解馬爾科夫鏈的重要概念,單獨成文

參考百科:http://baike.baidu.com/view/1969485.htm?fr=aladdin

大家都能理解概率分佈,但加了條件二字,就難理解了。我比較討厭官方的定義,術語太繞,我的理解如下:

設X和Y分別是概率分佈(如正態分佈那種直觀的),那麼(X,Y)就是聯合概率分佈,又稱為二維隨機變數。這種聯合概率分佈就不那麼直觀了。但用條件概率分佈這個概念定義,可以把抽象變為形象。

具體這樣做,假設X是均勻分佈,1-10這個數字出現的可能性都是0.1,而Y也是均勻分佈,21-30陣列出現的可能性都是0.1。

把Y取一個固定值,如:1,這樣Y就是100%出現了,只需要考慮X的概率分佈。21出現的可能性是X21,即0.1的概率。但是如果想得到聯合概率(X21,Y1),要怎麼做?這時把X1的概率也算進去就可以了,用P(X=1)*P(Y=21),就可以算出P(X=1,Y=21)。

可見,條件概率分佈,作用是簡化“聯合概率分佈”,這樣,聯合概率分佈成為可以被“數學運算”的概念。這是處理複雜隨機過程的一個基本理念,雖然簡單(就是把複雜的概率概念,轉化為簡單的概率概念,是一個化繁為簡的思想),但要銘記於心。

可見,要處理複雜問題,關鍵是掌握化繁為簡的能力,從簡單概念入手是掌握隨機過程的訣竅。想到馬爾科夫鏈,首先要想到條件概率,然後要想到普通的概率分佈。

2.邊緣概率分佈

下文寫的不錯,就不畫蛇添足了。 下文轉自:http://www.baike.com/wiki/邊緣分佈

某一組概率的加和,叫邊緣概率。邊緣概率的分佈情況,就叫邊緣分佈。和“邊緣”兩個字本身沒太大關係,因為是求和,在表格中往往將這種值放在margin(表頭)的位置,所以叫margin distribution。

marginal distribution,邊緣分佈(有時也翻譯成邊界分佈)。

如果我們把每一個變數的概率分佈稱為一個概率分佈,那麼邊緣分佈就是若干個變數的概率加和所表現出的分佈。舉個例子,假設P(B),P(C),P(A|B),P(A|C)已知,求P(A)。那麼P(A)=sum(P(B)*P(A|B),P(C)*P(A|C))。

再舉個簡單的例子:對於一個任意大小(n*n)的概率矩陣X,每一個元素表示一個概率,對於其中任一行或任一列求和,得到的概率就是邊緣概率。如果寫成式子,就是第i行有以下邊緣分佈:P(i)=sum(P(i,j),for each j in n)。

對,定義就是這麼簡單。就是指的某一些概率的加和值的分佈,其實就對應一個等式,讓它等於某種概率加和運算。

為什麼叫"marginal"呢?是因為這個值曾經用於表示某一個概率矩陣中某一行或某一列的概率加和,而這個加和在table中往往放在margin(表頭)的位置,所以叫marginal distribution,翻譯過來變成了邊緣概率,汗…偶還以為很邊緣……

3.概率矩陣

第2點提到的概率矩陣是什麼呢?