論文筆記:InductivE_Inductive Learning on Commonsense Knowledge Graph Completion
阿新 • • 發佈:2022-04-01
本文整體架構為encoder-decoder架構,整體和SACN很像,框架一共包含三大部分:free-text encoder,graph encoder以及Conv-TransE decoder。
其中free-text encoder通過使用預訓練好的Bert 以及fast text對知識圖譜中的實體以及簡短的文字描述進行聯合embedding,將其對映為\(d\)維向量方便後續運算;graph encoder則是負責圖稠密化以及完成對(head,relation)對的特徵提取操作,圖稠密化主要是通過比較兩實體經由GCN處理後的特徵向量的餘弦相似度判定是否屬於語義相近的實體,如果是,則根據閾值\(m\)
本文對Conv-TransE也進行了改進,改進措施為在卷積操作之前進行了維度混洗的操作(打亂特徵順序),目的是實現跨維度的更多互動,$\phi_s$為混洗操作,$w$代表卷積核,$\phi_s * w$代表卷積操作,$vec()$代表將多個特徵圖拼接到一起再進行向量化,最後通過轉移矩陣$W$映射回d維向量。因為頭實體加關係最終對應的可能不止一個尾實體,所以將其看成一個多標籤分類問題,採用二元交叉熵損失,實質為對每個標籤取交叉熵最終相加取平均,其中$t$為標籤向量,$t_i$代表標籤的每個維度,$p$代表經sigmoid函式處理過的預測分數。
Experimental Setup:
CN | ATOMIC | |
---|---|---|
GR-GCN layers | 2 | 2 |
m | 5 | 3 |
the frequency of updating graph | every 100 epochs | every 500epochs |
number of kernels | 300 | 300 |
kernel size | \(2\times 5\) | \(2\times 5\) |
learning rate | 3e-4 | 1e-4 |
Result:
Evaluation: