1. 程式人生 > >詳細解釋到底啥是共軛先驗(用本科知識來解釋)

詳細解釋到底啥是共軛先驗(用本科知識來解釋)

我們直奔主題。

根據百度百科上的解釋:
如果後驗分佈與先驗分佈屬於同類(分佈簇),則先驗分佈與後驗分佈被稱為共軛分佈,而先驗分佈被稱為似然函式的共軛先驗。

上面這個定義有點複雜,我們待會兒再回過頭來看這個定義

P(θx)=P(xθ)P(θ)P(xθ)P(θ)dθP(\theta|x)=\frac{P(x|\theta)·P(\theta)}{\int P(x|\theta')·P(\theta')d\theta'}

=P(xθ)P(θ)P(x)(

)=\frac{P(x|\theta)·P(\theta)}{P(x)}\\(這種是書上常見的)
pB(n,p),θ=p當p來自二項分佈中的B(n,p),且\theta=p時
上式:
P(px)=P(xp)P(p)P(x)P(p|x)=\frac{P(x|p)·P(p)}{P(x)}①

一、

似然函式(二項分佈):
P(xp)=P(kp)=P(X=k)=B(k:n,p)=Cnkpk(1p)1k

P(x|p)=P(k|p)=P(X=k)=B(k:n,p)=C_n^k·p^k·(1-p)^{1-k}②

二、

p的先驗分佈(β\beta分佈),
pp的先驗分佈假設為ββ分佈,超引數為α,β\alpha,\beta
(為啥這麼假設呢?就是為了剛好和共軛的分佈湊一對兒,方便取名,這裡的假設可以理解為“當p的先驗分佈恰巧為β分佈時”):
P(p)=P(pα,β)=1B(α,β)pα1(1p)β1P(p)=P(p|\alpha,\beta)=\frac{1}{B(\alpha,\beta)}p^{\alpha-1}(1-p)^{\beta-1}③


這個PpP和p可能看著有點暈哈,我稍微解釋下:
所謂的ββ分佈,他是“描述概率分佈的分佈”,可以參考:
https://blog.csdn.net/a358463121/article/details/52562940

我們將②和③代入①中,得到:
P(px)=P(xp)P(p)P(x)x=kP(pk)=P(kp)P(p)P(k)=1P(k)Cnkpk(1p)nk1B(α,β)pα1(1p)β1=[1P(k)CnkB(α,β)]pk+α1(1p)nk+β1=[1P(k)1B(α+k,β+nk)]pk+α1(1p)nk+β1P(p|x)=\frac{P(x|p)·P(p)}{P(x)}\\ x=k時,\\ P(p|k)=\frac{P(k|p)·P(p)}{P(k)}\\ =\frac{1}{P(k)}·C_n^k·p^k·(1-p)^{n-k} ·\frac{1}{B(\alpha,\beta)}p^{\alpha-1}(1-p)^{\beta-1}\\ =[\frac{1}{P(k)}·\frac{C_n^k}{B(\alpha,\beta)}]·p^{k+\alpha-1}·(1-p)^{n-k+\beta-1}\\ =[\frac{1}{P(k)}·\frac{1}{B(\alpha+k,\beta+n-k)}]·p^{k+\alpha-1}·(1-p)^{n-k+\beta-1}

到了這一步,我們回到最初的概念:

選取什麼樣的先驗分佈 會讓後驗分佈與先驗分佈具有"相同的數學形式"
如果先驗分佈和似然函式可以使得先驗分佈和後驗分佈有相同的形式,那麼就稱先驗分佈與似然函式是共軛的

說人話就是:
P(p)P(p)是啥分佈時,根據①計算的得到的P(px)P(p|x)P(p)P(p)長得很相似(長得相似的意思就是共軛)?
當根據①計算的得到的P(px)P(p|x)P(p)P(p)長得很相似時,那麼:
(1)先驗分佈P(p)P(p)P(px)P(p|x)被稱為共軛分佈(即:互為共軛關係)
(2)先驗分佈P(p)P(p)被稱為似然函式P(xp)P(x|p)的共軛先驗。





下面這些概念到底啥意思?

共軛(conjugate):啥意思?就是兩個東西長得很相似,取名叫共軛
A分佈是B分佈的共軛先驗分佈:啥意思?也就是說,這兩個分佈互為共軛關係(講人話就是他們的模樣長得很像),A是B的共軛分佈,B也是A的共軛分佈。
由於A分佈同時也是B分佈的先驗分佈,所以A是B的“共軛、先驗分佈”
簡稱:“共軛先驗分佈”

共軛先驗分佈有啥用?

引用百度百科上的話:
共軛先驗的好處:
主要在於代數上的方便性,可以直接給出後驗分佈的封閉形式,否則的話只能數值計算。共軛先驗也有助於獲得關於似然函式如何更新先驗分佈的直觀印象。
上面的到底啥意思?說人話:
除非你要搞學術理論(和代數相關的理論),作報告,否則沒啥用。

因為當年出來這個概念的時候,計算機還不發達,手算為了方便校對不同結果的形式,出來這麼個概念。
你想啊,你從等式左邊推導到右邊,萬一出錯了呢?出來這麼個概念方便你檢查草稿紙上算得對不對。
因為是共軛先驗分佈,那麼等式左右兩側,你推導的結果,也就是等式的右邊,要大致等於等式的左邊。