貝葉斯定理及其應用
事實上,貝葉斯決策很少只涉及A和B, 而是內部包含非常關鍵的隱變數(引數),涉及我們對所研究事物的一些基本預設。比如下面這個特別簡單的例子:
拋擲硬幣,一個硬幣被投擲10次9次朝上,那麼根據頻率學派的觀點, 得到第11次投擲的概率不變為0.5 ,如果你回答了0.9, 你經常會被看成一個傻X。 其實不然,天底下哪有一樣的硬幣呢?
那麼問題來了,我設一個賭局, 一次正面向上你可以受益100, 反面懲罰150, 基於剛才的事實你要不要做這個局?
我們完全可以套用貝葉斯決策的理論來。 這裡的一個重要的隱變數是每一次投擲硬幣的概率,這個數字按照經典頻率學派認定一定是0.5, 而按照貝葉斯學派的觀點, 需要把這個變數看成是未知的,具有一定先驗概率,之後嚴格按照貝葉斯公式計算新加入證據對先驗概率的影響。
此處的先驗概率即你對硬幣向上0.5這件事的信念, 你越相信這個事實, 這個分佈越尖,反之越寬廣。 我們用希臘字母theta來表徵這個概率。整個決策表述如下:
公式的含義是你要用求解已知9次朝上1次朝下的時候求解你下一次投擲硬幣的期望收益, 並因此決策要不要賭。
中間要驗證的假設空間即每一次投擲為正的概率,我們依然以每次事件獨立和該概率不隨時間變化為基準(如果不是問題將無限複雜),那麼證據將根據上述公式改變假設空間的概率分佈, 而最終的期望可以根據這個分佈求出。決策即使得這個期望最大的解。
注意此處先驗十分重要,因為它影響決策的結果, 而這又是一個很主觀的東西,如果你對0.5有絕對的信心, 那麼你的就會非常尖,這個時候你需要得到大量偏離0.5的證據才能逐步糾偏。
對於書呆子樣的人,估計會傾向給出一個比較尖銳的先驗分佈,相信書裡說的0.5而不賭, 而一些更加傾向於相信特例的人則會給出很平坦的先驗而更大的概率去賭。最終後者發財和傾家蕩產的機率都比較高,而前者比較容易旱澇保收。
當然, 在資料量超大,比如說1000次有900次為正的情況下,我們幾乎不需要考慮先驗(自己去看公式),此時幾乎可以認定投擲的概率就是0.9.
圖:證據對信念發生作用的貝葉斯過程
大腦是一個貝葉斯網路?
如果我們的貝葉斯決策中牽涉的證據更復雜呢? 如果這些證據之間不是簡單獨立而是互為因果呢?這時候更為強大的工具——貝葉斯網路就應運而生。
世界上的事無一不處於複雜的聯絡之中, 而貝葉斯網路正是刻畫這種關聯的數學表述。
構建一個貝葉斯網路的關鍵方法是圖模型,構建一個圖模型我們需要把具有因果聯絡的各個事件用箭頭連在一起。
下圖的例子是這樣一個事件, 我們看到草坪溼潤了,那麼我想推測此時天氣多雲的概率 ,因為導致草坪溼潤的原因有下雨或者灑水車在工作, 而這兩者又都和多雲有聯絡,那麼我們可以畫出如下圖形,按照貝葉斯概率公式逐級推出每個事件的概率。
貝葉斯網路的特性是,當某點的一個證據出現, 整個網路中事件的概率都變化, 所謂看到鏡中的一絲百發, 就改變你對人生中所有重大事件概率的推斷。
我們的大腦 : 有人說我們的大腦是一個貝葉斯網路, 這句話又對又不對 ,我們的大腦學習的原理,的確正是一個新的證據逐步和內部信念耦合的過程,本質即貝葉斯網路,但是我們大腦又是一個不完全的貝葉斯推斷機, 每個人都有一個頂層以三觀構建,底層逐步深入個個關於具體問題看法的貝葉斯網路, 但是我們卻很少有能夠通過一個證據更新整個網路的能力,或者是我們吸收新證據的速度也往往十分緩慢,這是為什麼我們經常具有自相矛盾的信念體系,經常一方面喊著人性解放一方面又崇拜偶像。
梧桐一葉又有幾人知秋。
(注:本文來自DT財經的作者許鐵,僅代表作者獨立觀點,版權歸作者所有,轉載請與作者聯絡。)