指數分佈與冪律分佈定義及不同(泊松分佈、伽馬分佈)
1、定義
(1)冪律分佈(pow law distribution),其概率密度函式形式如下,這種分佈的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大。
y=cx-r
其中x,y是正的隨機變數,c,r均為大於零的常數。
對上式兩邊取對數,可知lny與lnx滿足線性關係lny=lnc-rlnx,也即在雙對數座標下,冪律分佈表現為一條斜率為冪指數的負數的直線,這一線性關係是判斷給定的例項中隨機變數是否滿足冪律的依據。判斷兩個隨機變數是否滿足線性關係,可以求解兩者之間的相關係數;利用一元線性迴歸模型和最小二乘法,可得lny對lnx的經驗迴歸直線方程,從而得到y與x之間的冪律關係式。
(2)指數分佈
指數分佈一個重要特徵是無記憶性(Memoryless
Property,又稱遺失記憶性)。這表示如果一個隨機變數呈指數分佈,當s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。其概率密度函式和分佈函式如下:
其中λ
> 0是分佈的一個引數,常被稱為率引數(rate parameter)。即每單位時間內發生某事件的次數。指數分佈的區間是[0,∞)。 如果一個隨機變數X呈指數分佈,則可以寫作:X~
E(λ)
2、其他差異
通過資料擬合,發現兩者的不同可以用一句話概括,冪律比指數下降的更快。
參考:http://blog.sina.com.cn/s/blog_8f48f45301015ofs.html
泊松分佈:http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html
伽馬分佈:http://www.tinysoft.com.cn/tsdn/helpdoc../display.tsl?id=12849