標籤傳播演算法（LPA）Python實現

阿新 • • 發佈：2019-02-01

標籤傳播演算法（LPA）的做法比較簡單：

第一步：為所有節點指定一個唯一的標籤；

第二步：逐輪重新整理所有節點的標籤，直到達到收斂要求為止。對於每一輪重新整理，節點標籤重新整理的規則如下：

對於某一個節點，考察其所有鄰居節點的標籤，並進行統計，將出現個數最多的那個標籤賦給當前節點。當個數最多的標籤不唯一時，隨機選一個。

注：演算法中的記號 N_n^k 表示節點 n 的鄰居中標籤為 k 的所有節點構成的集合。

以上資料來源於：

http://blog.csdn.net/cleverlzc/article/details/39494957

下面我們來簡單實現以下這個演算法：

資料，自己編的：

1	2,3,4
2	1,3,4,7
3	1,2,4
4	1,2,3
5	6,7,8
6	5,7,8
7	2,5,6,8
8	5,6,7

目的就是將上面的圖中的結點聚類成兩部分，轉換為下面的圖：

載入資料用的函式：

def loadLpaData(filename):
    f = open(filename,'r')
    data = {}
    for i in f.readlines():
        order,ship = i.split()[0],i.split()[1]
        ships = ship.split(',')
        data.setdefault(order,ships)
    f.close()
    return data

獲取數目最多的相鄰接點，有多個的話隨機選一個：

def getMost(ships):
    import collections
    counter = collections.Counter(ships)
    tmp = sorted(counter.items(),key = lambda x:x[1])
    
    maxc = tmp[-1][1]
    maxset = []
    for i in tmp:
        if i[1] == maxc:maxset.append(i[0])
    
    import random
    random.shuffle(maxset)
    return maxset[0]

更新標籤：

def updateShips(cluster,data):
    for _ in data.keys():
        data[_] = [cluster[i] for i in data[_]]

檢查是否已經收斂，簡單檢查，不嚴謹，出現死循壞也不是沒有可能：

def checkStatus(cluster,data):
    flag = 0
    for d in data.keys():
        if cluster[d] != getMost(data[d]):return 0
    return 1

主函式：

def main(mydata):
    data = mydata.copy()
    cluster = dict([(_,_) for _ in data.keys()])
    while 1:
        if checkStatus(cluster,data):break
        for i in cluster.keys():
            cluster[i] = getMost(data[i])
            updateShips(cluster,data)
    return cluster

data = loadLpaData('LPAdataset')
main(data)

執行結果：

別的訓練集沒有測試。

檢查是否已經收斂，簡單檢查，不嚴謹，出現死循壞也不是沒有可能

標籤傳播演算法（LPA）Python實現

標籤傳播演算法（LPA）的做法比較簡單：第一步：為所有節點指定一個唯一的標籤；第二步：逐輪重新整理所有節點的標籤，直到達到收斂要求為止。對於每一輪重新整理，節點標籤重新整理的規則如下：

幾種常用的排序演算法（一）--python實現

1. 選擇排序，時間複雜度O（n^2），演算法不穩定。思路：（1）迴圈整個陣列 arr，選出最大的數，將它放在空陣列 new_arr 的第一個位置。（2）將剛

演算法研究（1）python實現經典排序演算法並可視化分析複雜度

排序演算法在演算法界是一個怎麼樣的存在？就好像在學術界中數學的地位，說直接用好像用不上，可是不會做起事情來總會捉襟見肘，左支右絀。找工作的時候，有的面試官甚至會讓我們手寫排序演算法。既然排序演算法如此重要，就讓我們一起去夯實基礎，切切實實得掌握它吧。前言

（24）Python實現遞歸生成或者刪除一個文件目錄及文件

path 生成 std fun created elif ror spa else import os,errno #基本工具類 #①遞歸生成輸入的路徑下面的文件夾或文件 #②遞歸刪除輸入的路徑下面的文件夾及文件 ‘‘‘ param : dirPath return :

編譯原理實驗：實驗一簡單詞法分析程序設計（必修）(Python實現)

it is 括號 ali 鍵盤輸入優化沒有 mce constant 是否一、實驗目的了解詞法分析程序的基本構造原理，掌握詞法分析程序的手工構造方法。二、實驗內容 1、了解編譯程序的詞法分析過程。 2、根據PASCAL語言的說明語句形式，用手工方法構造一個對說明語

時間序列模式（ARIMA）---Python實現

dia 就會 ast 的確 ram 依次 play 銷售 ati 時間序列分析的主要目的是根據已有的歷史數據對未來進行預測。如餐飲銷售預測可以看做是基於時間序列的短期數據預測，預測的對象時具體菜品的銷售量。 1.時間序列算法：常見的時間序列模型; ?

作業（二）—python實現wc命令(未完待續)

output 努力結果 -o clas ati 符號字符數 ref Gitee地址：https://gitee.com/c1e4r/word-count(為什麽老師不讓我們用github) 0x00 前言好久沒發博客了，感覺自己的學習是有點偷懶了。這篇博客

全連線神經網路的反向傳播演算法（BP）

一、預熱篇參考連結：http://colah.github.io/posts/2015-08-Backprop/ 要理解的主要點：路徑上所有邊相乘，所有路徑相加反向傳播演算法(Backpropagation)已經是神經網路模型進行學習的標配。但是有很多問題值得思考一下：反向傳播

神經網路中反向傳播演算法（BP）

神經網路中反向傳播演算法（BP）本文只是對BP演算法中的一些內容進行一些解釋，所以並不是嚴格的推導，因為我在推導的過程中遇見很多東西，當時不知道為什麼要這樣，所以本文只是對BP演算法中一些東西做點自己的合理性解釋，也便於自己理解。要想看懂本文，要懂什麼是神經網路，對前向傳播以

程序與執行緒（2）- python實現多程序

python 實現多程序參考連結： https://morvanzhou.github.io/tutorials/python-basic/multiprocessing/ python中實現多程序的模組：multiprocessing 注意：在windows系統下

【機器學習】決策樹演算法（二）— 程式碼實現

#coding=utf8 ‘’’ Created on 2018年11月4日 @author: xiaofengyang 決策樹演算法：ID3演算法 ‘’’ from sklearn.feature_extraction import DictVectorize

leetcode 將已排序的陣列/連結串列轉換為二叉搜尋樹（BST）,Python實現

思路：不論是陣列還是連結串列，遞迴地找到他的root（即序列的中點），並返回。 1. 將陣列轉換為二叉樹： # Definition for a binary tree node. # class T

短作業優先排程演算法（SJF）——Java實現

短作業優先排程演算法（SJF）短作業優先排程演算法（Short Job First）用於程序排程時又被稱為短程序優先排程演算法（Short Process First），該演算法既可以用於作業排程，又可以用於程序排程。在作業排程中，該

python開發電影查詢系統（一）—python實現後臺資料

爬蟲也學了很長一段時間了，雖然有些東西還不是很熟悉，但使用python和Django自己做了一個專案，即爬取http://www.bd-film.com/的電影資訊，並將資料儲存到本地，再通過Django做一個查詢入口進行查詢。我將程式碼實現大致分為三部

標準粒子群演算法（PSO）matlab實現

標準PSO演算法的核心公式如下：其中，w,c1,c2是預置好的： w稱為慣性權重，大小一般在[0.5,1.5]。 c1,c2稱為學習因子，一般取值[1,4]，通常設定的c1=c2，但是c1與c2不必完全相同。此實驗是在二維空間尋找最小值，設定多峰函式： z = x^2 + y-7c

RNN與反向傳播演算法（BPTT）的理解

RNN是序列建模的強大工具。今天主要搬運兩天來看到的關於RNN的很好的文章： PS: 第一個連結中的Toy Code做一些說明之所以要迴圈8（binary_dim=8）次，是因為輸入是2維的（a和b各輸入一個bit），那麼，每個bit只會影響8

圖的鄰接矩陣表示與最短路徑演算法（ Dijkstra ）程式碼實現

#include <stdio.h> #define MAX_VERTEX_NUM 20 //最大頂點個數 typedef int VRTYPE, InfoType; typedef enum {DG, DN, UDG, UD

基於二維矩陣的深搜（dfs）和廣搜（bfs）python實現

該二維矩陣不是鄰接矩陣，每個結點只和上下左右4個方向的結點有連線。 def bfs(start, matrix): """廣搜""" n = len(matrix) queue = [] queue.append(start) vis = [[

深搜（dfs）-廣搜（bfs）python實現

基於鄰接表的深搜和廣搜圖：（忽略邊權，這裡只看邊） import sys from queue import Queue sys.setrecursionlimit(1000000) # 深搜 def dfs(start, graph, vis): print(st

專案總結（三）----------Python實現SSH遠端登陸，並執行命令！

在自動化測試過程中，比較常用的操作就是對遠端主機進行操作，如何操作呢？使用SSH遠端登陸到主機，然後執行相應的command即可。使用Python來實現這些操作就相當簡單了。下面是測試code。

標籤傳播演算法（LPA）Python實現

相關推薦