論文筆記 Dynamic Graph Generation Network: Generating Relational Knowledge from Diagrams (CVPR2018)
Related works
1. visual relationships
2. Neural networks on a graph
3. Memory augmented neural network
文章方法上值得關注的地方
This paper propose a dynamic adjacency tensor memory (DATM) for the DGGN to store information about the relationships among the elements in a diagram.
將graph的邊與動態的memory network結合在一起,蠻創新的。基礎框架仍然是DGGN
dynamic adjacency tensor memory(DATM)其實是一個
的三維矩陣,該三維矩陣由兩部分拼接而成,一部分是鄰接矩陣
,另一部分是對應的隱單元H,其
元素
是GRU的m維隱向量,與節點
和
之間的連線有關。鄰接矩陣A表示有向圖中n個節點之間的連線狀態。對於每個GRU 單元的輸入就是
即
,
表示兩個object特徵之間的拼接。
對於Retrieval而言,就是用邊的存在概率
加權了
和
的相鄰向量
, 並且新增全域性特徵
以反映圖表的全域性形狀, 形成
時刻的GRU隱層向量
。
對於Update而言,其中memory裡面的一個cell
是由一個GRU cell的輸出
與隱層單元
拼接而成。
為了得到隱藏狀態
,使用了向量
和
作為標準GRU的先前隱藏狀態和輸入向量。
這是包含detection與graph generation的多工學習,因此其loss包含三項,目標檢測分支的分類損失
和位置迴歸損失
,圖生成網路的關係分類損失
。