1. 程式人生 > >Content to Node: Self-Translation Network Embedding

Content to Node: Self-Translation Network Embedding

簡介

目的:學習網路中節點的低維表示 將利用節點資訊及網路結構識別節點的過程比喻為翻譯的過程 論文引用網路中,每個節點代表一篇論文,每條邊代表引用關係。每個節點自身屬性包括文章的摘要,關鍵詞,研究領域等等。該論文的假設依據是,論文所形成的引用網路與論文自身的屬性之間有較強關係 現有方案: 1. 將結構資訊和屬性資訊分別進行embedding之後,組合 2. 考慮短距離/固定鄰域範圍保留結構資訊(第一/二鄰近) (複雜問題中很難確定鄰域範圍)

創新點(貢獻):

提出基於seq2seq 的模型框架(STNE) 利用網路上隨機遍歷生成的序列,將節點內容資訊翻譯成結構資訊,從而結合兩種資訊
  • 將網路嵌入轉化為 seq2seq 任務,從區域性建模到序列的全域性結構建模,捕獲更多語義資訊
  • 設計了一個異構的seq2seq 模型,嵌入原始輸入文字,以端到端的方式學習從節點屬性序列到節點指示序列的對映
與傳統方法相比, STNE 直接對建模節點序列,從文字序列中自動學習生成函式,將 seq2seq 網路模型與其他文字嵌入模型相結合,通過學習內容序列到節點序列的對映,將內容資訊和結構資訊無縫融合到隱藏層的潛在向量中,能夠高效表示節點 相對於 CANE: 從相鄰文字節點感知嵌入 STNE:針對不同序列學習動態的節點嵌入(需要更長範圍,更靈活的上下文) 框架 STNE 總體框架 該框架步驟: 1. 給定內容豐富的網路,通過隨機遊走提取節點序列,並將節點序列分為兩個部分 節點屬性序列 節點指示序列(由節點指示向量 one-hot 表示) 2. 通過這兩個序列學習特定的 seq2seq 模型,該模型可以用於將節點屬性“翻譯”為節點指示向量 3. 步驟二的目的是得到中間層的潛在轉換( 是可用於複雜網路分析 )  更詳細的總結