谷歌pagerank演算法

阿新 • • 發佈：2020-12-23

谷歌pagerank演算法

資料描述

Directed graph (each unordered pair of nodes is saved once): web-Google.txt
Webgraph from the Google programming contest, 2002
Nodes: 875713 Edges: 5105039
FromNodeId ToNodeId

程式碼

輸出： score top 100的node

import numpy as np
from graphUtil import *

P = 0.8
N = 875713
BIG_N = 930000
# N = 4
# BIG_N = 8
base = (1 / N) * 0.2

init_value = -1
allNodeList = [init_value] * 930000  # value[i] = -1: i is not a valid nodeId; >=0 i is nodeId
nodeTable = [[] for i in range(BIG_N)]

my_old_row = np.zeros(BIG_N)
my_new_row = np.zeros(BIG_N)
my_future_row = np.zeros(BIG_N)
id2rank = dict()

# pre process
def preprocess():

    for i in range(BIG_N):
        nodeTable[i].append(-1)
    for i in range(BIG_N):
        nodeTable[i].append(0)

    with open("web-Google.txt", "r") as f:
    # with open("web_test.txt", "r") as f:
        count = 0
        for line in f:  # iter each line
            # count = count + 1
            # if count == 50:
            #     break
            sourceNodeID, targetNodeID = line.split()
            sourceNodeID = int(sourceNodeID)
            targetNodeID = int(targetNodeID)
            allNodeList[sourceNodeID] = sourceNodeID
            allNodeList[targetNodeID] = targetNodeID
            if nodeTable[sourceNodeID][0] == -1:
                nodeTable[sourceNodeID][0] = sourceNodeID
                nodeTable[sourceNodeID][1] = nodeTable[sourceNodeID][1] + 1
                nodeTable[sourceNodeID].append(targetNodeID)
            else:
                nodeTable[sourceNodeID][1] = nodeTable[sourceNodeID][1] + 1
                nodeTable[sourceNodeID].append(targetNodeID)

    for i in range(BIG_N):
        if allNodeList[i] >= 0:
            # my_new_row[i] = 0  no random
            # my_new_row[i] = base
            my_old_row[i] = 1 / N


if __name__ == '__main__':
    preprocess()
    # for i in range(10):
    #     print(nodeTable[i])
    # print(nodeTable)

    for m_iter in range(10):
        S = 0
        for i in range(BIG_N):
            if allNodeList[i] >= 0:
                for j in nodeTable[i][2:]:
                    my_new_row[j] = my_new_row[j] + P * my_old_row[i] / nodeTable[i][1]

        S = my_new_row.sum()
        print("S: ", S)
        # print(my_new_row)
        for k in range(BIG_N):
            if allNodeList[k] >= 0:
                my_future_row[k] = my_new_row[k] + (1 - S) / N
        for k in range(BIG_N):
            if allNodeList[k] >= 0:
                my_old_row[k] = my_future_row[k]
                my_new_row[k] = 0
        print("range ", m_iter, "finish")

    for k in range(BIG_N):
        if allNodeList[k] >= 0:
            id2rank[k] = my_old_row[k]

    count = 0
    items = id2rank.items()
    final_result = sorted(items, key=lambda kv: (kv[1], kv[0]))
    for key, value in reversed(final_result):
        print(key, " ", value)
        count += 1
        if count == 100:
            break
    # result = np.sort(my_old_row)
    # print(result)
    # print(result.sum())
    # for i in range(92900, 93000):
    #     print(result[i])

谷歌pagerank演算法

谷歌pagerank演算法資料描述 Directed graph (each unordered pair of nodes is saved once): web-Google.txt

谷歌搜尋演算法升級，盜版圖書網站流量猛增

北京時間 10 月 27 日晚間訊息，據報道，線上教科書訂閱服務 Perlego 的資料顯示，谷歌近期對搜尋演算法的調整，可能加劇了線上圖書的盜版勢頭。利用搜索引擎優化（SEO）分析工具 Ahrefs，以及搜尋流量監測工具 Keyw

九章演算法 | 谷歌面試題：刪除排序陣列中的重複數字

技術標籤：演算法資料結構leetcodejavac++ 描述給定一個排序陣列，在原陣列中“刪除”重複出現的數字，使得每個元素只出現一次，並且返回“新”陣列的長度。

谷歌師兄的演算法刷題筆記

對於刷題相關的文章，在之前我也推薦過不少，今天在給大家推薦一份谷歌師兄的演算法刷題筆記，這份筆記與以往的刷題有所區別，作者把 Leetcode 一千多道題都進行了系統的整理，並且對於每一道題的程式碼，都要求 bea

谷歌 TPU AI 演算法祕密武器：數週的晶片佈局設計，現在只要 6 小時

6 月 10 日報道，谷歌用人工智慧提高晶片設計速度的研究，已發表於國際頂級期刊 Nature。

谷歌解釋為什麼 Pixel 6/Pro 的屏下指紋識別慢：採用增強的安全演算法

11 月 8 日訊息，谷歌 Pixel 6 和 6 Pro 有很多值得稱讚的地方，但它們的屏下指紋不在其中。自 Pixel 6 系列於 10 月釋出以來，使用者一直在抱怨其緩慢、不可靠的指紋感測器，這使得手機解鎖起來很麻煩。近日，谷歌

中科院團隊用演算法追上谷歌“量子霸權”：谷歌量子處理器的優勢，似乎並沒有當初宣傳的那樣大

兩年前，谷歌宣佈實現了“量子霸權”，用量子計算機完成了一個經典計算機不可能完成的任務。現在，來自中科院理論物理所的研究者，用數學方法追上了谷歌的“量子霸權”。他們用實驗證明了：經典計算機在使用一種新的

ping通谷歌後傳送QQ郵件通知

前言國慶期間，據說是為了防止有人在重大節日發表不正當言論，很多可以kxsw的ip都被封了，可是什麼時候才會解封呢，不能沒事就去ping一下吧，所以我寫了個定時任務，定時ping谷歌伺服器，如果ping通則發郵件通知

谷歌移動UI框架Flutter入門

引言作為Android開發人員，很有必要學習一下Flutter，那麼Flutter是什麼呢？它到底有什麼作用呢？我們一一來揭曉。Flutter是谷歌的移動UI框架，可以快速在iOS和Android上構建高質量的原生使用者介面。 Flutter可以與

谷歌移動UI框架Flutter教程之Widget

引言在之間我已經介紹了關於Flutter的下載安裝以及配置，還有開發工具Android Studio的配置，還不知道的同學可以看看我這篇部落格——谷歌移動UI框架Flutter入門。這裡為什麼非要用Android Studio，我可以解釋一下。

python自動化測試無法啟動谷歌瀏覽器問題

前言大家在使用python做web端自動化時會出現各種各樣的問題，下面我會告訴大家selenium無法啟動瀏覽器的問題

SpringCloud Zuul過濾器和谷歌Gauva實現限流

前提：已經配置Zuul閘道器參考： https://www.jb51.net/article/182894.htm 限流方式： 1）nginx層限流

Python爬蟲谷歌Chrome F12抓包過程原理解析

瀏覽器開啟網頁的過程就是爬蟲獲取資料的過程，兩者是一樣一樣的。瀏覽器渲染的網頁是豐富多彩的資料集合，而爬蟲得到的是網頁的原始碼htm有時候，我們不能在網頁的html程式碼裡面找到想要的資料，但是瀏覽器開啟的網

win10電腦裝不上谷歌地球怎麼辦？教你在win10裝谷歌地球軟體的方法

谷歌地球是一款虛擬地球軟體,它把衛星照片,航空照相和GIS佈置在一個地球模型上，足不出戶看世界。Wiin10作為新系統,很多使用者都不熟悉如何裝谷歌地球軟體，甚至不少使用者連安裝都裝不上，對於win10系統無法安裝使用

win10電腦谷歌瀏覽器訪問網頁時出現DNS_PROBE_FINISHED_NXDOMAIN如何解決

在win10系統中，許多使用者都喜歡安裝谷歌瀏覽器來使用，可是有時候在使用谷歌瀏覽器訪問網頁的時候，會出現DNS_PROBE_FINISHED_NXDOMAIN的錯誤，該怎麼辦呢，現在為大家講解一下具體的解決措施。

win10系統無法正常執行谷歌地球出現未響應如何解決

谷歌地球是一款虛擬地球軟體，它把衛星照片、航空照相和GIS佈置在一個地球的三維模型上，然而有win10系統使用者在安裝谷歌地球之後，卻發現無法正常執行谷歌地球，出現未響應的情況，該怎麼辦呢，現在為大家分享一下

Chrome DevTools谷歌瀏覽器開發者工具遠端除錯協議

[ 在底層，Chrome 開發者工具是用 HTML，JavaScript 和 CSS 寫的 Web 應用程式。在 Javascript 執行時，它提供一個特殊的繫結，這允許它與 chrome 網頁進行互動並且容許裝載它們。互動協議包括被髮送到頁面的命令，和

Chrome DevTools谷歌瀏覽器開發者工具評估資源載入時間 - Break易站

[ 使用Network(網路)面板評估網站的網路效能。 Network(網路)面板記錄在頁面上有關每個網路操作的資訊，包括詳細的時序資料，HTTP請求和響應頭，Cookie等。

如何（正確）使用搜索引擎？使用搜索引擎的高效技巧（例如：百度、谷歌）

前言提起這個搜尋引擎，我們對它就有三種級別的認識第一種：完全不知道“搜尋引擎”是什麼或者是“我只知道瀏覽器”

yb課堂谷歌開源快取框架Guava cache，封裝API 《二十》

Guava cache github地址：點我直達全記憶體的本地快取實現高效能且功能豐富執行緒安全，操作簡單

谷歌pagerank演算法

谷歌pagerank演算法

資料描述

程式碼

相關推薦