1. 程式人生 > >泊松分佈和冪律分佈 轉

泊松分佈和冪律分佈 轉

泊松分佈和冪律分佈
自然界與社會生活中,許多科學家感興趣的事件往往都有一個典型的規模,個體的尺度在這一特徵尺度附近變化很小。比如說人的身高,中國成年男子的身高絕大多數都在平均值1.70米左右,當然地域不同,這一數值會有一定的變化,但無論怎樣,我們從未在大街上見過身高低於10釐米的“小矮人”,或高於10米的“巨人”。如果我們以身高為橫座標,以取得此身高的人數或概率為縱座標,可繪出一條鐘形分佈曲線(如圖1左圖所示),這種曲線兩邊衰減地極快;類似這樣以一個平均值就能表徵出整個群體特性的分佈,我們稱之為泊松分佈。
對於另一些分佈,像國家GDP或個人收入的分佈,情況就大不一樣了,個體的尺度可以在很寬的範圍內變化,這種波動往往可以跨越多個數量級。冪律分佈的示意圖如圖1右圖所示,其通式可寫成y=cx^(−r),其中x,y是正的隨機變數,c,r均為大於零的常數。這種分佈(冪律分佈)的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大。對上式兩邊取對數,可知lny與lnx滿足線性關係lny=lnc-rlnx,也即在雙對數座標下,冪律分佈表現為一條斜率為冪指數的負數的直線,這一線性關係是判斷給定的例項中隨機變數是否滿足冪律的依據。
冪律表現了一種很強的不平等性,對個人收入的分佈來說這確實是一件很恐怖的事,但同時也說明了,單純依據人均收入來衡量兩個城市或國家的發展水平,並沒有多大的實際意義。
統計物理學家習慣於把服從冪律分佈的現象稱為無標度現象,即,系統中個體的尺度相差懸殊,缺乏一個優選的規模。可以說,凡有生命的地方,有進化、有競爭的地方都會出現不同程度的無標度現象。
這裡寫圖片描述


圖1 泊松分佈(左)與“長尾”/冪律分佈(右)
從統計物理學來看,網路是一個包含了大量個體及個體之間相互作用的系統。近年來在對複雜網路的研究過程中,科學家們亦發現了眾多的冪律分佈,雖然這些網路在結構及功能上是如此的千變萬化,相差迥異。複雜網路中節點的度值k相對於它的概率P(k)滿足冪律關係,且冪指數多在大於2小於3的範圍內;這一現象是如此的普遍,如此地令人驚歎不已,以至於人們給具有這種性質的網路起了一個特別的名字——無標度網路。這裡的無標度是指網路缺乏一個特徵度值(或平均度值),即節點度值的波動範圍相當大。
在過去的40多年裡,科學家們一直想當然地認為現實中的網路都是隨機的,隨機圖論就是專門為了研究隨機網路而發展起來的一門數學學科,但無標度特性的發現打破了這種構想。隨機網路的度分佈是泊松分佈,度值比平均值高許多或低許多的節點,都十分罕見,是一種高度“民主”的網路,而無標度網路的度分佈則是冪律分佈,節點度值相差懸殊,往往可以跨越幾個數量級,是一種極端“專制”的網路,二者之間有本質的區別。這兩種網路的一個形象化的比較如圖所示。
![這裡寫圖片描述](
http://117.img.pp.sohu
.度分佈滿足冪律的無標度網路還有一個奇特的性質——“小世界”特性,雖然WWW中的頁面數已超過80億,但平均來說,在WWW上只需點選19次超連結,就可從一個網頁到達任一其它頁面。“小世界”現象在社會學上也稱為“六度分離”,它來源於1967年,美國哈佛大學的社會心理學家Milgram的一個實驗,這個實驗證實,世界上任何兩個人,不論他(她)是中國的藏民,非洲的難民,還是美國的政界高層,好萊塢的明星,甚至北極的愛斯基摩人,美洲的土著印第安人,都可通過熟人找熟人的方式建立聯絡,而兩者之間的平均最少“中介”數是6,如此看來,整個地球確實是一個小小的世界。
2 冪律分佈的形成機制
Barabási與Albert針對複雜網路中普遍存在的冪律分佈現象,提出了網路動態演化的BA模型,他們解釋,成長性和優先連線性是無標度網路度分佈呈現冪律的兩個最根本的原因。所謂成長性是指網路節點數的增加,像Internet中自治系統或路由器的新增,以及WWW中網站或網頁的增加等,優先連線性是指新加入的節點總是優先選擇與度值較高的節點相連,比如,新網站總是優先選擇人們經常訪問的網站作為超連結。隨著時間的演進,網路會逐漸呈現出一種“富者愈富,貧者愈貧”的現象。社會學家所說的“馬太效應”,《新約》聖經所說的“凡有的,還要加給他,叫他有餘”,同優先連線也有某種相通之處。
“優先連線”並不適用於所有出現冪律分佈的情況,即便是對於某些無標度網路,用它解釋冪律的成因也顯得很不合理(其他略)。
3 冪律分佈的動力學影響
冪律特性的度分佈對無標度網路的動力學性質有著極其深刻的影響。以疾病或病毒在網路中的傳播這一物理過程為例,以前的基於規則網路及隨機網路的研究表明,疾病的傳染強度存在一個閾值,只有傳染強度大於這個閾值時,疾病才能在網路中長期存在,否則感染人數會呈指數衰減。但對無標度網路上傳染病模型的研究結果表明,不存在類似的閾值,只要傳染病發生,就將長時間存在下去,這一特性表明,要想在Internet這樣的無標度網路上徹底消滅病毒,即使是已知的病毒,也是不可能的。//區別規則網路、小世界網路、隨機網路和無標度網路
另外,度分佈的冪律特性對網路的容錯性和抗攻擊能力也有很大的影響,對網路的攻擊分為隨機攻擊和選擇性攻擊兩種型別,分別稱為網路的容錯能力與抗攻擊能力。研究表明,無標度網路具有很強的容錯性,但是對基於節點度值的選擇性攻擊抗攻擊能力相當差。比如對全球資訊網或因特網中集散節點的攻擊,有可能造成整個網路的癱瘓,對於某些微生物來說,它們體內度值很高的蛋白質通常掌握著細胞的生死。度分佈滿足泊松分佈的隨機網路,其容錯性和抗攻擊能力則是基本相當的。可見,網路的結構穩定性是與網路的度分佈特性緊密聯絡在一起的。/images/blog/2007/7/10/19/18/1144901ae68.jpg)
圖2 具有相同節點數和邊數的隨機網路(左)和無標度網路(右)