1. 程式人生 > >二項分佈與泊松分佈

二項分佈與泊松分佈

二項分佈(Binomial distribution)

要介紹二項分佈,先要介紹伯努利實驗,然後自然而然就想到了拋硬幣問題,正面朝上的概率為p,反面朝上的概率為q (q = 1 - p),假設正面朝上標記為1,反面朝上為0,則一次伯努利實驗的期望為p,方差為p*q。

二項分佈是對n次伯努利實驗正面朝上(或反面朝上)次數及其概率進行刻畫的一種離散分佈。
官方一點表述是n次獨立伯努利試驗成功次數的離散概率分佈(當n = 1時,又稱為伯努利分佈)。

二項分佈的概率表現形式(概率質量函式PMF)為:
Pr(X = k) = (

n k ) n \choose k p k q
n k p^{k}q^{n-k}
,k = 0,1,2,…n

假設B1,B2,,,Bn為n次獨立的伯努利試驗,根據期望和方差的公式:
二項分佈的期望為:
E(B1 + B2 + … + Bn) = nE(B1) = np
方差:
V(B1 + B2 + … + Bn) = nV(B1) = np*q

關於二項分佈的例子

1,連續獨立地拋硬幣n次,統計正面朝上的次數及其概率,它在理論上服從二項分佈(這是p = q = 0.5的情況)。
2,連續獨立地擲骰子(6個面)n次,統計點數為6的次數及其概率,這是p = 1/6,q = 5/6的情況。
3,在p比較小,n比較大時可以用泊松分佈來近似(一個保守的法則是n>= 100 & p <= 0.01)。
4,當npq >= 5 時,用正態分佈來近似二項分佈是合適的。

泊松分佈(Poisson distribution)

二項分佈的命名是因為有成功和失敗兩項,泊松分佈則是根據泊松這個人來命名的。它也是離散概率分佈,與稀有事件的發生有關。

考慮下面幾個事件:
1,整個下午通過某個不繁忙路口的汽車數服從泊松分佈。
將整個下午(時間長度為T)分成很多小段時間 Δ t \Delta t ,對於每一小段,通過一輛車的概率為 P r ( X = 1 ) = λ Δ t λ Pr(X = 1) = \lambda\Delta t(\lambda為單位時間內通過車輛的期望數) ,則整個下午通過該路口的車輛數服從引數為 λ T \lambda T 的泊松分佈。
2,面積為A的瓊脂培養皿上的細菌群體數服從泊松分佈。
將整個培養皿分成很多小塊 Δ A 1 P r ( X = 1 ) = λ Δ A λ \Delta A,在小區域內發現1個菌群的概率為Pr(X = 1) = \lambda \Delta A(\lambda為單位面積內菌群的期望數) ,則整個培養皿上的菌群數服從引數為 λ A \lambda A 的泊松分佈。
3,1年時間內得傷寒去世的人數服從泊松分佈
將一年的時間分成很多小段,跟前面一樣, λ \lambda 為單位時間內死亡人數的期望值,則1年內因傷寒死亡人數的服從 λ T \lambda T 的泊松分佈。

上述幾個例子都滿足:

1,都是罕見事件;
2,將整體分成的小段間彼此獨立;
3,在整個長時間區間內,任一單位長度上事件的發生數不變化。

泊松分佈的其它例子:

1,普魯士陸軍被馬踢死的概率;
2,出生缺陷和基因突變;
3,每頁紙的列印錯誤;
4,麥當勞漢堡中的頭髮數;
5,每月機器出故障的次數。

泊松分佈的公式:

P r ( X = k ) = e μ μ k k ! , k = 0 , 1 , 2... Pr(X = k) = e^{-\mu}\frac{\mu^{k}}{k!}, k = 0,1,2...
μ = λ t \mu = \lambda t為指定時間發生事件的期望數

可以證明泊松分佈的期望和方差都為 μ \mu ,在 μ &gt; 10 \mu &gt; 10 時,泊松分佈可以很好地被同樣期望和方差的正態分佈所近似。