1. 程式人生 > >常見的幾種概率分佈

常見的幾種概率分佈

文章來源:http://blog.csdn.net/pipisorry/article/details/39076957

常見離散概率分佈

Bernoulli、Binomial、Poisson

統計學(三):幾種常見的概率分佈

Note: 一般的二項分佈是n次獨立的伯努利試驗的和。它的期望值和方差分別等於每次單獨試驗的期望值和方差的和。

伯努利、二項分佈、多項分佈

伯努利分佈就是對單次拋硬幣的建模,X~Bernoulli(p)的PDF為f(x)=px(1−p)1−x,隨機變數X只能取{0, 1}。對於所有的pdf,都要歸一化!而這裡對於伯努利分佈,已經天然歸一化了,因此歸一化引數就是1。

很多次拋硬幣的建模就是二項分佈了。注意二項分佈有兩個引數,n和p,要考慮拋的次數。

二項分佈的取值X一般是出現正面的次數,其PDF為:

f(x)=P(X=x)=P(X=x|n,p)=Cxnpx(1−p)n−x

Cxn就是二項分佈pdf的歸一化引數。如果是beta分佈,把Cxn換成beta函式分之一即可,這樣可以從整數情況推廣為實數情況。所以beta分佈是二項分佈的實數推廣!

多項分佈則更進一層,拋硬幣時X只能有兩種取值,當X有多種取值時,就應該用多項分佈建模。

這時引數p變成了一個向量p⃗ =(p1,…,pk)表示每一個取值被選中的概率,那麼X~Multinomial(n,p)的PDF為:

f(x)=P(x1,,xk|n,p⃗ )=(nx1,,xk)px11

pxkk=n!ki=1xi!pxix

多項式分佈Multinomial


常見連續概率分佈


常見的概率分佈_文庫下載http://www.wenkuxiazai.com/doc/e14db3d233d4b14e852468c0.html
常見的概率分佈_文庫下載http://www.wenkuxiazai.com/doc/e14db3d233d4b14e852468c0.html

常見的連續分佈的概率密度函式和累積分佈度函式:

均勻分佈

指數分佈

正態分佈與卡方分佈

統計學(三):幾種常見的概率分佈

Beta分佈

拉普拉斯分佈 Laplace Dist

在概率論與統計學中,拉普拉斯分佈是以皮埃爾-西蒙·拉普拉斯的名字命名的一種連續概率分佈。由於它可以看作是兩個不同位置的指數分佈背靠背拼接在一起,所以它也叫作雙指數分佈。當資料分佈的波峰比正態分佈更尖銳時使用 Laplace 分佈。例如,Laplace 分佈用於生物、金融和經濟學方面的建模。

兩個相互獨立同概率分佈指數隨機變數之間的差別是按照指數分佈的隨機時間布朗運動,所以它遵循拉普拉斯分佈。

拉普拉斯分佈概率密度圖  拉普拉斯分佈累積概率密度圖

概率密度函式                                                                                         累積分佈函式

概率分佈、概率密度以及分位數函式

如果隨機變數的概率密度函式分佈為

f(x|\mu,b) = \frac{1}{2b} \exp \left( -\frac{|x-\mu|}{b} \right) \,\!
= \frac{1}{2b}    \left\{\begin{matrix}      \exp \left( -\frac{\mu-x}{b} \right) & \mbox{if }x < \mu      \\[8pt]      \exp \left( -\frac{x-\mu}{b} \right) & \mbox{if }x \geq \mu    \end{matrix}\right.

那麼它就是拉普拉斯分佈。其中,μ 是位置引數,b > 0 是尺度引數。如果 μ = 0,那麼,正半部分恰好是尺度為 1/2 的指數分佈。

拉普拉斯分佈的概率密度函式讓我們聯想到正態分佈,但是,正態分佈是用相對於 μ 平均值的差的平方來表示,而拉普拉斯概率密度用相對於平均值的差的絕對值來表示。因此,拉普拉斯分佈的尾部比正態分佈更加平坦

根據絕對值函式,如果將一個拉普拉斯分佈分成兩個對稱的情形,那麼很容易對拉普拉斯分佈進行積分。它的累積分佈函式為:

F(x)\, = \int_{-\infty}^x \!\!f(u)\,\mathrm{d}u
= \left\{\begin{matrix}             &\frac12 \exp \left( -\frac{\mu-x}{b} \right) & \mbox{if }x < \mu             \\[8pt]             1-\!\!\!\!&\frac12 \exp \left( -\frac{x-\mu}{b} \right) & \mbox{if }x \geq \mu            \end{matrix}\right.
=0.5\,[1 + \sgn(x-\mu)\,(1-\exp(-|x-\mu|/b))]

逆累積分佈函式為

F^{-1}(p) = \mu - b\,\sgn(p-0.5)\,\ln(1 - 2|p-0.5|)

拉普拉斯分佈的數字特徵

引數 \mu\, 位置引數(實數)
b > 0\, 尺度引數(實數)
支撐集 x \in (-\infty; +\infty)\,
概率密度函式 \frac{1}{2\,b} \exp \left(-\frac{|x-\mu|}b \right) \,
期望值 \mu\,
中位數 \mu\,
眾數 \mu\,
方差 2\,b^2
偏度 0\,
峰度 3\,
資訊熵 1 + \ln(2\,b)
動差生成函式 \frac{\exp(\mu\,t)}{1-b^2\,t^2}\,\! for |t|<1/b\,
特性函式 \frac{\exp(\mu\,i\,t)}{1+b^2\,t^2}\,\!

拉普拉斯分佈的性質

  • 如果 Y = |X-\mu| 並且 X \sim \mathrm{Laplace},則 Y \sim \mathrm{Exponential} 是指數分佈
  • 如果 Y = X_1 - X_2 與 X_1,\, X_2 \sim \mathrm{Exponential},則 Y \sim \mathrm{Laplace}

Gaussian-Exponential Mixture

laplace分佈可以看成是高斯分佈和指數分佈的混合體。