1. 程式人生 > >冪律分佈、泊松分佈、指數分佈、長尾分佈的概念

冪律分佈、泊松分佈、指數分佈、長尾分佈的概念

   冪律分佈(Power Law distruibition):  

        Zipf定律與Pareto定律都是簡單的冪函式,我們稱之為冪律分佈;還有其他形式的冪律分佈,像名次- 規模分佈、規模- 概率分佈,這四種形式在數學上是等價的,其通式可寫成

   ,其中x, y是正的隨機變數,c, r均為大於零的常數. 這種分佈的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大. 對上式兩邊取對數,可知lny與lnx滿足線性關係lny= lnc - rlnx,也即在雙對數座標 (log-log plot下,冪律分佈表現為一條斜率為冪指數的負數的直線,這一線性關係是判斷給定的例項中隨機變數是否滿足冪律的依據。

       判斷兩個隨機變數是否滿足線性關係,可以求解兩者之間的相關係數;利用一元線性迴歸模型最小二乘法,可得lny對lnx的經驗迴歸直線方程,從而得到y與x之間的冪律關係式.在雙對數座標下的圖形,由於某些因素的影響,前半部分的線性特性並不是很強,而在後半部分,則近乎為一直線,其斜率的負數就是冪指數。

   

Poisson分佈:  是一種統計與概率學裡常見到的離散概率分佈(discrete  probability distribution),由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。

 概率函式:

 

泊松分佈的引數λ是單位時間(或單位面積)內隨機事件的平均發生率。 泊松分佈適合於描述單位時間內隨機事件發生的次數。


泊松分佈的期望和方差均為

   特徵函式為  
在實際事例中,當一個隨機事件,例如某電話交換臺收到的呼叫、來到某公共汽車站的乘客、某放射性物質發射出的粒子、顯微鏡下某區域中的白血球等等,以固定的平均瞬時速率λ(或稱密度)隨機且獨立地出現時,那麼這個事件在單位時間(面積或體積)內出現的次數或個數就近似地服從泊松分佈P(λ)。因此,泊松分佈在管理科學、運籌學以及自然科學的某些問題中都佔有重要的地位。  http://baike.baidu.com/view/79815.htm 冪函式(Power Function): 形如y=x^α(α為常數)的函式 。 指數分佈:指數函式 exponential function===Memoryless Property 無記憶性. http://baike.baidu.com/view/743082.htm


指數分佈雖然不能作為機械零件功能引數的分佈規律,但是,它可以近似地作為高可靠性的複雜部件、機器或系統的失效分佈模型,特別是在部件或機器的整機試驗中得到廣泛的應用。
指數分佈的圖形表面上看與冪律分佈很相似,實際兩者有極大不同,指數分佈的收斂速度遠快過冪律分佈。
正態分佈即高斯分佈:normal distribution==gaussian distribution . :正態曲線呈鍾型,兩頭低,中間高,左右對稱因其曲線呈鐘形,因此人們又經常稱之為鐘形曲線  隨機變數X服從一個數學期望為μ、方差為σ^2的正態分佈,記為N(μ,σ^2)。其概率密度函式為正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。當μ = 0,σ = 1時的正態分佈是標準正態分佈。 http://baike.baidu.com/view/45379.htm
                                                                  正態分佈圖 長尾理論: http://baike.baidu.com/subview/327983/5047777.htm