1. 程式人生 > >貝葉斯告訴你,投擲硬幣概率可以是90%

貝葉斯告訴你,投擲硬幣概率可以是90%

事實上,貝葉斯決策很少只涉及A和B, 而是內部包含非常關鍵的隱變數(引數),涉及我們對所研究事物的一些基本預設。比如下面這個特別簡單的例子:

拋擲硬幣,一個硬幣被投擲10次9次朝上,那麼根據頻率學派的觀點, 得到第11次投擲的概率不變為0.5 ,如果你回答了0.9, 你經常會被看成一個傻X。 其實不然,天底下哪有一樣的硬幣呢?

那麼問題來了,我設一個賭局, 一次正面向上你可以受益100, 反面懲罰150, 基於剛才的事實你要不要做這個局? 

我們完全可以套用貝葉斯決策的理論來。 這裡的一個重要的隱變數是每一次投擲硬幣的概率,這個數字按照經典頻率學派認定一定是0.5, 而按照貝葉斯學派的觀點, 需要把這個變數看成是未知的,具有一定先驗概率,之後嚴格按照貝葉斯公式計算新加入證據對先驗概率的影響。

此處的先驗概率即你對硬幣向上0.5這件事的信念, 你越相信這個事實, 這個分佈越尖,反之越寬廣。 我們用希臘字母theta來表徵這個概率。整個決策表述如下:

公式的含義是你要用求解已知9次朝上1次朝下的時候求解你下一次投擲硬幣的期望收益, 並因此決策要不要賭。

中間要驗證的假設空間即每一次投擲為正的概率,我們依然以每次事件獨立和該概率不隨時間變化為基準(如果不是問題將無限複雜),那麼證據將根據上述公式改變假設空間的概率分佈, 而最終的期望可以根據這個分佈求出。決策即使得這個期望最大的解。

注意此處先驗十分重要,因為它影響決策的結果, 而這又是一個很主觀的東西,如果你對0.5有絕對的信心, 那麼你的就會非常尖,這個時候你需要得到大量偏離0.5的證據才能逐步糾偏。 

對於書呆子樣的人,估計會傾向給出一個比較尖銳的先驗分佈,相信書裡說的0.5而不賭, 而一些更加傾向於相信特例的人則會給出很平坦的先驗而更大的概率去賭。最終後者發財和傾家蕩產的機率都比較高,而前者比較容易旱澇保收。

當然, 在資料量超大,比如說1000次有900次為正的情況下,我們幾乎不需要考慮先驗(自己去看公式),此時幾乎可以認定投擲的概率就是0.9.

圖:證據對信念發生作用的貝葉斯過程