1. 程式人生 > >全概公式和貝葉斯公式的理解

全概公式和貝葉斯公式的理解

條件概率

首先,理解這兩個公式的前提是理解條件概率,因此先複習條件概率。

P(A|B)=P(AB)P(B)

理解這個可以從兩個角度來看。
第一個角度:在B發生的基礎上,A發生的概率。那麼B發生這件事已經是個基礎的條件了,現在進入B已經發生的世界,看看A發生的概率是多少。那麼分子就是B發生A也發生,分母就是B這個世界發生的概率了。分母如果是1,那麼成了什麼意思呢?

另一個角度是看韋恩圖。這裡A在B發生的基礎上發生的概率是A和B交集的陰影部分面積佔用B的比例。

那麼由條件概率出發,看一下變形出來的乘法公式:
P(AB)=P(A)P(B|A)=P(B)P(A|B)

也可以提供上面的兩個角度來理解這個公式,雖然可以由上面的直接推導,但是我們認為這是問題的思考的不同角度,不僅僅是公式之間的運算。

一:AB同時發生的概率是在A基礎上發生B的概率乘以A本身在外部發生的概率,也是B基礎上發生A的概率乘以B本身在外部發生的概率.
二:AB表示的是陰影部分的面積佔用A或者B的比例關係。

僅僅從形式上說,豎線後面的要在前面多乘以一個以達到平衡。

全概率

然後再看全概率公式。

一個別人舉的例子:

一個村子與三個小偷,小偷偷村子的事件兩兩互斥,求村子被偷的概率。

解釋:假設這三個小偷編號為A1,A2,A2
偷東西的事件標記為B,不偷的話標記為:B

那麼被偷的概率就是:要麼是A1,要麼是A2,要麼是A3
如果是A1, 概率是什麼呢?首先得是A1,其次是村子被偷,也即是兩個事件都滿足,所以是P

(A1B)
同理,可以得到P(A2B),P(A3B)

又因這三個小偷兩兩互斥,表示不會同時去偷。所以被偷的概率是:

P(B)=P(A1B)+P(A2B)+P(A3B)

當然按照條件概率或者乘法公式展開:
P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3) (*)

PS: P(Ai),P(B|Ai)

問:是不是有想展開為:

P(B)=P(B)P(A1|B)+P(B)P(A1|B)+P(B)P(A1|B)的衝動?

當然這個式子是沒錯的,但是體現不了這個問題的解法:分階段。

(*)式子體現的是問題分為兩個階段:
1)選人,分割問題
2)計算分割的子問題的條件概率

對應的這裡來便是:
1)選小偷,誰去偷
2)選定的小偷作為條件,那麼他去偷的條件概率是什麼

所以將問題拆解為階段的問題便是全概率公式針對的問題。

貝葉斯公式

貝葉斯公式有意思極了,簡單說就是逆全概公式。

前面是問總體看來被偷的概率是多少,現在是知道了總體被偷了這件事,概率並不知道,問你個更有意思的問題,像是偵探斷案:是哪個小偷的偷的,計算每個小偷偷的概率。

這個特性用在機器學習,人工智慧領域相當好用。

也就是求:P(Ai|B)=P(AiB)P(B)

Ai:iB:

首先是一個淳樸的條件概率的展開。
分母裡出現了P(B),剛剛討論的全概公式拿來用一用!
P(AiB)=P(Ai)P(B|Ai)

對應到上面的例子就鮮活一些:村子被偷了,求Ai偷的概率。

自然現在條件是P(B),分子變形為P(AiB)=P(Ai)P(B|Ai),是因為假定就是Ai偷的,這是一個已知的概率。
分母P(B)=ni=1P(Ai)P(B|Ai)

20161223 update:

除了上面的思路外,通常需要注意的是分階段意味著時間的先後。在先進行的事件的基礎上進行後面的事件,就很容易計算概率:P(AB)=P(A)P(B|A)這種。

所以當我們需要計算先驗概率,即先發生的時間的概率時,總是想著用上面的這個型別來計算,且是通過條件概率進行過渡。