1. 程式人生 > >Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths

Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths

direct 批評 研究 拼接 組成 人工 clas rec 向量

雖然要寫這篇文章,但是有些地方仍然沒有了解,比如對TimeBank-Dense。因為以後沒有用這個語料的可能性,所以就直接忽略了。

這篇論文是2017ACL上的一篇短文,作者為來自日本國立情報學研究所的Fei Cheng和Yusuke Miyao。

在引言部分,作者介紹了這篇論文的任務。時間關系抽取主要是判別時間實體對之間是否存在某種關系。實體有兩種,events和temporal expressions。能組成關系的有event-event(E-E), event-time(E-T)和event-DCT(document creation time, E-D)。論文在沒有利用外部知識和人工標註的實體屬性的情況下取得了較好的性能。

在方法部分,作者介紹了跨句子在語料中所占比例還是很大的,並且因為作者采用了基於依存路徑的輸入,一般依存路徑都是以一句話為單位的,所以如何表示跨句子實體間的依存路徑是一個挺大的障礙。於是了作者假設兩個相鄰的句子共享一個“common root”,這樣就可以表示了,具體如下圖所示:
技術分享圖片

從這個圖可以很清楚的看出,首先兩個句子都表示為依存路徑,然後共享一個“common root”。這樣就成功解決了跨句子的問題。依存路徑由Stanford CoreNLP工具進行解析得到。輸入的詞向量為詞向量、詞性向量和依存關系向量的拼接。

E-E,E-T使用同一個分類器,從源目標詞到common root和從目的目標詞到common root各自使用一個雙向的LSTM。E-D包含一個事件依存路徑分支,只使用了一個分支的雙向LSTM。具體看下圖就能了解:
技術分享圖片

實驗部分沒詳細了解,這也是前面我說的沒有了解的地方。以後有機會去做的話還是需要認真了解的。

這篇論文的介紹到這裏就結束了,如有理解錯誤的地方,歡迎批評指正。

Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths