1. 程式人生 > >常用統計數字特征及解析工具

常用統計數字特征及解析工具

log 隨機變量 函數定義 泊松分布 相關 blog 數值 我們 直接

母函數

母函數定義

考慮只取非負值的離散型隨機分布,如二項分布,泊松分布,幾何分布等,稱之為整值隨機變量。而有一種變換方法比較適於變換,即母函數法。

對於整值隨機變量 \(\xi\) ,根據佚名統計學家公式,定義母函數為 \(P(s)=Es^{\xi}=\sum_{k=0}^\infty p_ks^k\) ,當 \(|s|\le1\)時,\(P(s)\) 一致收斂且絕對收斂,所以母函數對任何整值隨機變量都存在。

二項分布母函數: \(P(s)=(q+ps)^n\)

泊松分布母函數: \(P(s)=e^{\lambda s}e^{-\lambda}=e^{\lambda(s-1)}\)

幾何分布母函數: \(P(s)=\frac{ps}{1-qs}\)

母函數的性質

  • 唯一性:母函數能唯一確定分布列

  • 母函數與數值特征相關

因為,\(P(s)=\sum_{k=0}^\infty p_ks^k\) ,可以推得\(P'(s)=\sum_{k=1}^\infty kp_ks^{k-1}\)\(P''(s)=\sum_{k=2}^\infty k(k-1)p_ks^{k-2}\)

所以,當數學期望和方差存在的時候,可以知道 \(E\xi=P'(1)\),而\(E(\xi(\xi-1))=E(\xi^2)-E\xi=P''(1)\)

推得\(D\xi=E\xi^2-(E\xi)^2=E(\xi(\xi-1))+E\xi-(E\xi)^2=P''(1)+P'(1)-(P'(1))^2\)

所以,利用母函數可以更為簡單直接的求整值隨機變量的數字特征。

  • 獨立隨機變量和的母函數

考慮隨機變量和的母函數,根據整值隨機變量的定義我們可以知道,計算隨機變量 \(\zeta=\xi+\eta\)時,(分別對應於分布\(\{c_k\},\{a_k\},\{b_k\}\))有\(c_r=\sum_{i=0}^ra_ib_{r-i}\),這個實際上給出了卷積的從統計角度上的理解。既然是卷積,我們知道多項式乘法的計算過程也是利用卷積,所以通過母函數,我們可以把隨機變量和的概率分布求解轉化成多項式乘法,即\(C(s)=A(s)B(s)\)。兩個獨立隨機變量之和的母函數是這兩個隨機變量母函數的乘積,而母函數和分布是一一對應的,從而可以間接求出分布。

結論可以推廣到n個獨立整值隨機變量之和的場合。

  • 隨機個隨機變量之和的母函數

考慮一組獨立同分布的隨機變量\(\{\xi_n\}\),母函數為\(F(s)=\sum_{j=0}^\infty f_js^j\),和與之獨立的正值隨機變量\(v\) ,母函數為\(G(s)=\sum_{n=0}^\infty g_ns^n\) ,考慮 \(\eta = \sum_{i=1}^v \xi_i\),即隨機個隨機變量之和的分布。

\(\eta\)的母函數為\(H(s)=\sum_{i=0}^\infty h_is^i\) ,所以有
\[ \begin{split} h_i &= P\{\eta=i\} = \sum_{n=1}^\infty P\{v=n\}P\{\eta=i|v=n\}\ &= \sum_{n=1}^\infty P\{v=n\}P\{ \sum_{i=1}^n \xi_i|v=n\}\ &= \sum_{n=1}^\infty P\{v=n\}P\{ \sum_{i=1}^n \xi_i\} \end{split} \]
而隨機變量\(\{\xi_n\}\)獨立同分布,所以有
\[ \begin{split} H(s)&=\sum_{i=0}^\infty h_is^i\ &= \sum_{n=1}^\infty P\{v=n\}P\{ \sum_{i=1}^n \xi_i\}s^i\ &= \sum_{n=1}^\infty P\{v=n\}[F(s)]^n\ &= G[F(s)] \end{split} \]
即隨機個隨機變量之和的母函數是原來兩個母函數的復合。

考慮應用:由於 \(H'(s)=G'[F(s)]F'(s)\)\(s=1\)可以求得,\(E\eta=Ev E\xi_i\)

?

常用統計數字特征及解析工具