二項分佈與泊松分佈
二項分佈(Binomial distribution)
要介紹二項分佈,先要介紹伯努利實驗,然後自然而然就想到了拋硬幣問題,正面朝上的概率為p,反面朝上的概率為q (q = 1 - p),假設正面朝上標記為1,反面朝上為0,則一次伯努利實驗的期望為p,方差為p*q。
二項分佈是對n次伯努利實驗正面朝上(或反面朝上)次數及其概率進行刻畫的一種離散分佈。
官方一點表述是n次獨立伯努利試驗成功次數的離散概率分佈(當n = 1時,又稱為伯努利分佈)。
二項分佈的概率表現形式(概率質量函式PMF)為:
Pr(X = k) =
,k = 0,1,2,…n
假設B1,B2,,,Bn為n次獨立的伯努利試驗,根據期望和方差的公式:
二項分佈的期望為:
E(B1 + B2 + … + Bn) = nE(B1) = np
方差:
V(B1 + B2 + … + Bn) = nV(B1) = np*q
關於二項分佈的例子
1,連續獨立地拋硬幣n次,統計正面朝上的次數及其概率,它在理論上服從二項分佈(這是p = q = 0.5的情況)。
2,連續獨立地擲骰子(6個面)n次,統計點數為6的次數及其概率,這是p = 1/6,q = 5/6的情況。
3,在p比較小,n比較大時可以用泊松分佈來近似(一個保守的法則是n>= 100 & p <= 0.01)。
4,當npq >= 5 時,用正態分佈來近似二項分佈是合適的。
泊松分佈(Poisson distribution)
二項分佈的命名是因為有成功和失敗兩項,泊松分佈則是根據泊松這個人來命名的。它也是離散概率分佈,與稀有事件的發生有關。
考慮下面幾個事件:
1,整個下午通過某個不繁忙路口的汽車數服從泊松分佈。
將整個下午(時間長度為T)分成很多小段時間
,對於每一小段,通過一輛車的概率為
,則整個下午通過該路口的車輛數服從引數為
的泊松分佈。
2,面積為A的瓊脂培養皿上的細菌群體數服從泊松分佈。
將整個培養皿分成很多小塊
,則整個培養皿上的菌群數服從引數為
的泊松分佈。
3,1年時間內得傷寒去世的人數服從泊松分佈
將一年的時間分成很多小段,跟前面一樣,
為單位時間內死亡人數的期望值,則1年內因傷寒死亡人數的服從
的泊松分佈。
上述幾個例子都滿足:
1,都是罕見事件;
2,將整體分成的小段間彼此獨立;
3,在整個長時間區間內,任一單位長度上事件的發生數不變化。
泊松分佈的其它例子:
1,普魯士陸軍被馬踢死的概率;
2,出生缺陷和基因突變;
3,每頁紙的列印錯誤;
4,麥當勞漢堡中的頭髮數;
5,每月機器出故障的次數。
泊松分佈的公式: