第五章:節點重要性與相似性
第五章節點的重要性與相似性
關鍵節點是網絡科學的重要研究內容之一
本章要重點詳細介紹無向網絡中節點重要性排序的幾個常用指標:度值,介數,接近數,k-殼值和特征向量
5.2無向網絡節點重要性指標
5.2.1度中心性
一個節點度越大就意味著這個節點越重要。
此類問題都與如何刻畫節點在網絡中的位置有關,這便是度中心性的問題了
5.2.2介數中心性:
概念:以經過某個節點的最短路徑的數目來刻畫節點重要性的指標就稱為介數中心性,簡稱介數bc
這個概念刻畫了節點i對於網絡中節點對之間沿著最短路徑傳輸信息的控制能力
理論某節點的最大介數就是(n-1)(n-2)/2
於是基於上述的歸一化介數定義為:實際介數/理論介數
介數越高其重要性也就越大
接近中心性:
網絡平均長度的另一種計算公式:
全部的節點i到節點j的距離的總和/總長度=d, 這就是網絡平均路徑長度 該值也在某種程度上反映了節點i在網絡中的相對重要性
我們把di的倒數定義為節點i的接近中心性,簡稱接近數
介數 對於信息的流動具有最大的控制力;
而接近數最大的節點則對於信息的流動具有最佳的觀察視野。
5.2.4 k-殼與k-核
k-殼分解:
我們每一次吧度數從到低的次序的節點及其相連的邊去掉直至不再有同樣度的邊 ,並將這些節點劃分到相應的k-殼中,這樣就得到了網路了k-殼分解。
實際網絡中也會出現類似的情形:度大的節點出現在分解的外層,從而得到度大的節點未必是重要的節點。
k-核:>-k的層稱為k-核
k-皮:<k的層稱為k-皮
核心:由kmax-殼中的節點構成,對Internet性能具有重要影響的一個區域。
對等連通片:有(kmax-1)-皮的最大連通片中的節點構成,這個存在有助於避免和緩解核心部分的擁堵
孤立片:由(kmax-1)-皮中不屬於最大連通片的節點構成,大約包括網絡中3層的節點。
5.2.5特征向量中心性
基本想法:一個節點重要性即取決於鄰居點的數量,也取決於鄰居節點重要性
基於這樣的思想有兩種算法:hits算法;
5.3.2 hits算法描述
基本思想:每個網頁有兩種刻畫指標:權威性和樞紐性
一個頁面被多個高樞紐值指向,那麽它便具有了高權威值
如果一個頁面指向多個高權威性的頁面,那麽該頁面就具有高的樞紐值
算法核心的思想:
叠代過程:在第k步進行如下3種操作:
1.權威值校驗:沒一節點的權威值校正為指向它的節點的樞紐值之和:
2.樞紐值校正規則:每一點的樞紐值校正為它所指向的節點的權威值之和
3.歸一化:
5.4.1pagerank基本算法
開始的時候將1全部平均分配給所有節點,隨機訪問一個節點,然後這個節點將自己的值全部分配給連接的邊節點,這樣叠代下去。。。
5.5節點相似性與鏈路預測
5.5.1問題描述與評價標準
節點相似性分析的一個典型應用就是鏈路預測,它是通過已知的各種信息預測給定網絡中尚不存在的兩個節點之間產生鏈接的可能性
(1)auc算法:
(待更新)
第五章:節點重要性與相似性