1. 程式人生 > 其它 >二項分佈期望和方差推導

二項分佈期望和方差推導

若隨機變數\(X\)服從二項分佈,即\(X\sim B(n,p)\), 則有\(P(X=k)=C_n^kp^k(1-p)^{n-k}\),其均值和方差分別是
\(E(X)=np\)
\(D(X)=np(1-p)\)

之前學二項分佈的時候看到它的期望和方差覺得形式很簡單,就沒怎麼細看推導過程。但是自己去推導的時候發現也沒那麼簡單。。。本文做個總結

二項分佈期望

整個推導過程如下

\[\begin{align} E(k) &=\sum_{k=0}^{n} k p(k) \\ &=\sum_{k=0}^{n} k\left(\begin{array}{l} n \\ k \end{array}\right) p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k\left(\begin{array}{l} n \\ k \end{array}\right) p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k \frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k \frac{n !}{k !(n-k) !} p^{k} q^{n-k} \\ &=n p \sum_{k=1}^{n} \frac{(n-1) !}{(k-1) !(n-k) !} p^{k-1} q^{\frac{(\mathrm{n}-1)-(\mathrm{k}-1)}{}=(n-k)} \\ &=n p \end{align} \]
  • 第1到第3行應該很好理解,不過需要注意的是第3行的下標從 \(k=1\)
    開始了,因為\(k=0\)時值為0所以省略了。
  • 第4行:把排列組合展開了
  • 第5行:令\(q=1-p\)
  • 第6行:這是整個推導過程magic所在。為更加方便理解,對於式(6)右邊那一坨 \(\sum_{k=1}^n\frac{(n-1)!}{(k-1)!(n-k)!}p^{k-1}q^{(n-1)-(k-1)}\),我們可以做一下換元,即令\(z=k-1,m=n-1\),注意原式的k取值範圍是\(k\in[1,n]\),那麼z的取值範圍應該就是\(z\in[0,n-1]\),所以換元后式(6)變形得到\(\sum_{z=0}^{m}\frac{m!}{z!(m-z)!}p^zq^{m-z}\),這就是二項分佈概率累加,其結果為1。

二項分佈方差

\(D(X)=E[X-EX]^2=E[X^2-2XEX+(EX^2)]\)

注意\(EX\)可視為一個常數,所以\(E[2XEX]=2EX E[X]=2(EX)^2\),同理\(E[(EX)^2]=(EX)^2\),綜上 \(D(X)=EX^2-(EX)^2\)

下面我們只需要在計算\(EX^2\)即可,推導過程如下:

\[\begin{align} E\left(k^{2}\right) &=\sum_{k=0}^{n} k^{2} p(k) \\ &=\sum_{k=1}^{n} k^{2}\left(\begin{array}{l} n \\ k \end{array}\right) p^{k} q^{n-k} \\ &=\sum_{k=1}^{n}[\mathrm{k}(\mathrm{k}-1)+\mathrm{k}]\left(\begin{array}{c} n \\ k \end{array}\right) p^{k} q^{n-k} \\ &=\sum_{k=1}^{n} k(k-1)\left(\begin{array}{c} n \\ k \end{array}\right) p^{k} q^{n-k}+\sum_{k=1}^{n} k\left(\begin{array}{c} n \\ k \end{array}\right) p^{k} q^{n-k} \\ &=\sum_{k=1}^{n} k(k-1) \frac{n !}{k !(n-k) !} p^{k} q^{n-k}+n p \\ &=n(n-1) p^{2} \sum_{k=1}^{n} \frac{(n-2) !}{(k-2) !(n-k) !} p^{k-2} q^{(n-2)-(k-2)}+n p \\ &=n(n-1) p^{2}+n p \end{align} \]

所以\(DX=EX^2-(EX)^2=n(n-1) p^{2}+np-(np)^2=np(1-p)\)

參考

微信公眾號:AutoML機器學習
MARSGGBO原創
如有意合作或學術討論歡迎私戳聯絡~
郵箱:[email protected]

2022-04-20 20:00:20