【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

一、概要
該文章發於ACL 2017，在Knowledge base-based question answering (KB-QA)上，作者針對於前人工作中存在沒有充分考慮候選答案的相關資訊來訓練question representation的問題，提出了一個使用Cross-Attention機制的神經網路模型來針對於候選答案的不同方面資訊來訓練模型；並且訓練知識庫的全域性資訊學習，在一定程度上減輕的the out of vocabulary (OOV)問題，最終在資料集 WEBQUES- TIONS上取得不錯的效果。

二、模型方法
2.1 模型簡介
KB-QA的目標是給出一個用自然語言表達的問題，返回在實體集合A作為問題的答案。本文的模型如下圖所示，首先使用Freebase API識別出問題中的實體，在知識庫中找到候選答案，然後使用Attention機制的神經網路針對候選答案的answer entity、answer relation、answer type、以及answer context四個方面分別訓練對應的question representation和及其representation，最後使用相似度得分來選出最終的答案。本文的方法與Li Dong等人提出的方法非常類似，具體可看：

【論文筆記】Question Answering over Freebase with Multi-Column Convolutional Neural Networks，但其實大有不同，比如/business/board member 和/location/country 都是表示答案型別，但是因為它們的Attention不同，最後得到的question representation也會不同。

這裡寫圖片描述

2.2 Question Representation
首先，我們需要獲取到問題中每個詞的representation，假設存在問題q=(x1,x2,...,xn)，xi表示問題中的第i個單詞，如下圖所示，我們通過look up在E

w∈Rd×vw中獲得每個單詞的embeddings，Ew∈Rd×vw是隨機初始化的矩陣，並在模型虛擬立案過程中訓練，d表示單詞representation的維度，vw表示所有問題單詞集合的元素的個數，然後將這些詞向量傳入LSTM中，LSTM模型已經被證明在許多NLP問題上表現得非常好，同時為了考慮到每個詞的前後詞彙的資訊，這裡使用了雙向LSTM，LSTM的隱藏單元輸出維度為d/2，最後將雙向LSTM的輸出連線起來，即得到維度為d的向量。

這裡寫圖片描述

2.3 Answer aspect representation
在答案方面，直接通過KB embedding 矩陣Ek∈Rd×vk獲得上面提到四個方面的embedding，其中v

w表示KB中詞表的大小，Ek也隨著模型訓練而不斷學習優化，我們將answer entity , answer relation , answer type，以及answer context分別表示為ae、ar、at、ac，其對應的embedding分別表示為ee、er、et、ec，值得注意的是answer context 來自於知識庫中的多個方面，可以表示為(c1,c2,...,cn)，我們先通過Ek獲得KB embeddings為：(ec1,ec2,...,ecn)，最後算它們的平均embeddings，即：ec=1n∑ni=1eci。

2.4 Cross-Attention model
①Answer-towards-question(A-Q) attention
這是本文最關鍵的一部分，根據答案的ei∈(ee、er、et、ec)，可以對LSTM中輸出的word representation hj給予不同的權重，即不同的關注度，其計算方法如下：

aij=exp(wij)∑nk=1(wik)
wij=f(WT[hj;ei])+b
其中aij表示第i個詞的Attention權重，n為問題的單詞個數，W∈R2d×1為中間矩陣，b為偏置值，然後這些Attention權重被用來與對應的詞向量計算得到句子語義向量，即：
qi=∑nj=1(aijhj)
最後問題和候選答案的相似度計算方法如下：
S(q,a)=h（qi⋅e

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

一、概要該文章發於ACL 2017，在Knowledge base-based question answering (KB-QA)上，作者針對於前人工作中存在沒有充分考慮候選答案的相關資訊來訓練question representation的問題，提出

【論文筆記】An Intelligent Fault Diagnosis Method Using: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks

ivar 單位矩陣作用一次一個 http example tps 計算論文來源：IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS 2016年的文章，SCI1區，提出了兩階段的算法。第一個階段使用Sparse filtering

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

【論文筆記】An Intelligent Fault Diagnosis Method Using: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks

Reading Wikipedia to Answer Open-Domain Questions【論文筆記】

【論文筆記】One Millisecond Face Alignment with an Ensemble of Regression Trees

【論文筆記】T Test

Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【論文筆記】

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

Context-Aware Basic Level Concepts Detection in Folksonomies【論文筆記】

Question Answering with Subgraph Embeddings【論文筆記】

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

Semantic Parsing on Freebase from Question-Answer Pairs【論文筆記】

vggface2人臉識別資料集【論文筆記】VGGFace2——一個能夠用於識別不同姿態和年齡人臉的資料集

【論文筆記】使用多流密集網路的密度感知單影象去雨

【論文筆記】用形狀做擋風玻璃上的雨滴檢測《Detection Of Raindrop With Various Shapes On A Windshield》

【論文筆記】光流在視訊行為識別中的作用

【論文筆記】Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification

【論文筆記】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

【論文筆記】視訊物體檢測(VID)系列 NoScope:1000x的視訊檢索加速演算法

【論文筆記】In Defense of the Triplet Loss for Person Re-Identification

【論文筆記】視訊物體檢測(VID)系列 FGFA：Flow-Guided Feature Aggregation for Video Object Detection

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

相關推薦