1. 程式人生 > >【概率論】聯合概率, 邊緣概率, 條件概率, 鏈式法則 和 獨立性

【概率論】聯合概率, 邊緣概率, 條件概率, 鏈式法則 和 獨立性

這些概念考量的是一組變數之間的關係, 不妨設定兩個隨機變數 X~P(X)Y~P(Y).

聯合概率分佈 joint probability distribution

joint probability 指的是多個變數聯合發生的概率分佈.

P(X=x,Y=y), 也可以簡記做 P(x,y)

邊緣概率分佈 marginal probability distribution

我們已知兩個有限的離散型隨機變數 XY 以及它們的聯合概率分佈, 那麼我們就是把 P(X,Y) 寫成一個表格形式, 每一行代表一個

xX, 每一列代表一個 yY, 那麼我們可以把每一行的 P(x,y)加和, 寫到右邊的邊緣處(margin), 這就是對應行 X=x 的概率, 即

xX,P(X=x)=yP(X=x,Y=y), 我們就把這種子集上的概率分佈依記賬形式記做 邊緣概率分佈 (marginal probability distribution).
同理, 對於連續型隨機變數, 只要把求和變成積分即可 p(x)=p(x,y)dy

條件概率和鏈式法則 conditional probability & chain rule

顧名思義, 條件概率指的是某個事件在給定其他條件時發生的概率, 這個非常符合人的認知:我們通常就是在已知一定的資訊(條件)情況下, 去估計某個事件可能發生的概率. 概率論中,用 | 表示條件, 條件概率可以通過下式計算得到

P(Y=y|X=x)=P(Y=y,X=x)P(X=x), 即 在 x 發生的條件下 y 發生的概率 等於 x,y 同時發生的聯合概率 除以 x自身的概率. 注意, 必須滿足 P(x)>0, 否則對於永遠不會發生的事情討論條件概率無意義.

基於條件概率, 任意多維隨機變數的聯合分佈都可以寫成其中任意一個隨機變數的條件概率相乘的形式

P(x(1),...,x(n))=P(x(1))i=2nP(x(i)|x(1),...,x(i1)),

具體而言, 對於一個三元分佈 :

P(a,b,c)=P(a|b,c)p(b,c)=P(a|b,c)P(b|c)P(c), 這樣通常很難直接得到的 P(a,b,c) 就分解為以下三個簡單的情形乘積的形式:
  1. P(c):c 發生的概率, 通常已知.
  2. P(b|c):c 發生的條件下, 觀察到 b 的概率, 通常從資料中挖出.
  3. p(a|b,c):b,c 同時發生的條件下, 觀察到 a 的概率, 通常從資料中挖出.

獨立性和條件獨立性 independent & conditionally independent

由上面的 joint probability, 滿足下面的條件