1. 程式人生 > >貝葉斯定理簡介

貝葉斯定理簡介

1.貝葉斯定理有什麼用:
為了解決“逆概率”問題,它可以根據過去的資料來預測出概率,在有限的資訊下,能夠預測出概率。
2.什麼是貝葉斯定理:
公式: P(A|B) = P(A) * [P(B|A)/P(B)]
1)P(A):先驗概率,即在不知道B事件的前提下,我們對A事件概率的一個主觀判斷。
2)P(B|A)/P(B):可能性函式,這是一個調整因子,即新資訊B帶來的調整,作用是使得先驗概率更接近真實概率。
  2.1.如果“可能性函式”P(B|A)/P(B) > 1,意味著“先驗概率”被增強,事件A的發生的可能性變大;
  2.2.如果“可能性函式”= 1,意味著B事件無助於判斷事件A的可能性;
  2.3.如果“可能性函式”< 1,意味著“先驗概率”被削弱,事件A的可能性變小;
3)P(A|B):後驗概率,即在B事件發生以後,我們對A事件概率的重新評估。
3.應用案例:
1)全概率公式:這個公式的作用是計算貝葉斯定理中的P(B)
   P(B) = P(B|A)P(A) + P(B|A')P(A')
含義:如果A和A'構成一個問題的全部(全部的樣本空間),那麼事件B的概率,就等於A和A'的概率分別乘以B對這兩個事件的條件概率之和。
案例題:1號碗(30顆巧克力+10顆水果糖)、2號碗(20顆巧克力+20顆水果糖)
問:把碗蓋住,隨機選擇一個碗,從裡面摸出一顆巧克力,這顆巧克力來自1號碗的概率有多少?
解:來著1號碗記為事件A1,來著2號碗記為事件A2,那麼問題即為P(A|B)【即取出的是巧克力,來著1號碗的概率】
1)求先驗概率:
由於兩個碗是一樣的,所以在得到新資訊(取出的是巧克力之前),這兩個碗被選擇的概率相同。因此P(A1) = P(A2) = 0.5(A1表示來著1號碗,A2表示來著2號碗)
2)求可能性函式 P(B|A)/P(B):
P(B|A1)表示從1號碗中(A1)取出巧克力(B)的概率
因為1號碗裡有30顆巧克力+10顆糖,所以P(B|A1) = 30/(30+10) = 75%
P(B) = P(B|A1)P(A1) + P(B|A2)P(A2) = [30/(30+10)]*0.5 + [20/(20+20)]*0.5 = 62.5%
可能性函式P(B|A1)/P(B) = 75%/62.5% = 1.2
3)帶入貝葉斯公式求後驗概率:
P(A1|B) = P(A1)*[P(B|A1)/P(B)] = 50%*1.2 =60%

2)如果將公式中的A換成“規律”,B換成“現象”:
   P(規律|現象) = P(現象|規律)[P(規律)/P(現象)]
還以前案例分析:這兒有兩個規律(從1號碗來規律、從2號碗來規律),有兩個現象(巧克力現象、水果糖現象)。而且知道兩個碗是一模一樣的,所以兩個規律的概率是一樣的,P(從1號碗來規律) = P(從2號碗來規律) = 0.5。同時知道P(巧克力現象|從1號碗來規律) = 30/(30+10)=0.75,P(水果糖現象|從1號碗來規律)=10/(30+10)=0.25;P(巧克力現象|從2號碗來規律) = 20/(20+20)=0.5 = P(水果糖現象|從2號碗來規律)。另外,P(巧克力現象)=(30+20)/(30+10+20+20)=0.625,P(水果糖現象)=(10+20)/(30+10+20+20)=0.375。現在的問題是觀察到了一個巧克力現象,要求推斷後面的規律,即從1號碗來的規律的概率有多大,也就是P(從1號碗來規律|巧克力現象):
P(從1號碗來規律|巧克力現象) = P(巧克力現象|從1號碗來規律)*[P(從1號碗來規律)/P(巧克力現象)] = 0.75*[0.5/0.625]=60%

舉例2:
1所學校裡有60%的男生,40%的女生。男生總是穿長褲,女生則一半穿長褲、一半穿裙子。假設你走在校園裡,迎面走來一個穿長褲的學生,問男生的概率是多大?
這兒有兩個規律(是男生規律、是女生規律),而且知道規律的發生概率P(是男生規律)=0.6,P(是女生規律)=0.4。有兩種現象(穿長褲現象、穿裙子現象),假設有10個學生,6個男生、4個女生,那麼P(穿長褲現象)=(6+2)/10=0.8,P(穿裙子現象)=2/10=0.2。另外,P(穿長褲現象|是男生規律)=6/6=1,P(穿裙子現象|是男生規律)=0,P(穿長褲現象|是女生規律) = P(穿裙子現象|是女生規律)=0.5。現在,看到了一個穿長褲的學生,需要推斷是男生的概率,即P(是男生規律|穿長褲現象):
P(是男生規律|穿長褲現象) = P(穿長褲現象|是男生規律)*[P(是男生規律)/P(穿長褲現象)]=1*[0.6/0.8]=0.75

舉例3:
一輛計程車在雨夜肇事,現場有一個目擊者說,看見該車是藍色。已知:1.該目擊者識別藍色和綠色計程車的準確率是80%;2.該地的計程車85%是綠色的,15%是藍色的。問:那輛肇事車是藍色的概率有多大?
有兩個規律:藍色的車、綠色的車,有兩個現象(或者叫觀察、資料、取樣等等):車被看成藍色、車被看成綠色。從例子中的資訊可知:P(綠色的車)=0.85,P(藍色的車)=0.15。P(車被看成藍色|藍色的車)=0.8,P(車被看成綠色|藍色的車)=0.2,P(車被看成綠色|綠色的車)=0.8,P(車被看成藍色|綠色的車)=0.2。假設該地有100輛計程車,那麼,85輛是綠色的、15輛是藍色的。再者,目擊者只有80%的準確率,那麼,車被看成藍色的有:是藍色的看成了藍色的=15*0.8=12,是綠色的看成了藍色的=85*0.2=17,總計12+17=29,所以P(車被看成藍色)=29/100=0.29
P(藍色的車|車被看成藍色) = P(車被看成藍色|藍色的車)*[P(藍色的車)/P(車被看成藍色)] = 0.8*[0.15/0.29]=0.4138