1. 程式人生 > >NLP之共指消解總結

NLP之共指消解總結


本文僅是對自己所看論文的簡單總結,並不涉及該領域的詳細介紹。

共指的定義

指代是一種常見的語言現象,廣泛存在於自然語言的各種表達中。一般情況下,指代分為 2 種:回指(也稱指示性指代)和共指(也稱同指)。回指是指當前的照應語與上文出現的詞、短語或句子(句群)存在密切的語義關聯性,指代依存於上下文語義中,在不同的語言環境中可能指代不同的實體, 具有非對稱性和非傳遞性;共指主要是指 2 個名詞(包括代名詞、名詞短語)指向真實世界中的同一參照體,這種指代脫離上下文仍然成立。

共指消解的分類

這裡根據文強師兄學位論文第一章內容(西安交通大學-劉文強《多源關聯資料的聚合方法研究》),將共指消解分為3類;需要說明的是,其主要致力於RDF資料的共指消解。因此,本節所提及的常用於解決某種消解的方法均以RDF資料為背景。 從文強師兄學位論文中可以概括出其在衝突消解方面的主要工作包括:實體共指消解(resolving entity coreference)、模式匹配(schema matching)、賓語衝突消解(object conflicts resolution)。

  • 實體共指消解解決方法

實體共指消解是識別不同關聯資料來源中相同實體的不同識別符號,主要解決三元組中主語之間的衝突問題。
在這裡插入圖片描述

  • 模式匹配

模式匹配主要是發現不同關聯資料來源中屬性之間的對映關係,主要解決三元組中謂詞之間的衝突問題;另一種解釋:解決不同關聯資料來源對相同屬性採用不同識別符號的問題,從而實現異構資料來源的整合。
在這裡插入圖片描述

  • 賓語衝突消解
    賓語衝突消解是解決多源關聯資料賓語不一致問題。
    在這裡插入圖片描述

共指現象及其存在之因

本小節將以實體共指現象為例來說明共指現象,雖然共指與回指既有重疊又存在差異,但是在本節中將不做區分。

  1. RDF資料中存在共指的原因
    RDF將資料以<資源,屬性,屬性值>的形式去表示,並不保證某一實體或者資源的唯一性,所以在RDF資料中會存在實體共指的現象。

  2. 普通文字中存在實體共指的現象
    假設在某文字中存在這樣一句話:“唐納德·特朗普(Donald Trump),1946年6月14日生於紐約,美國共和黨籍政治家、企業家、商人,第45任美國總統。…… 川普打響了中美之間的貿易戰,……特朗普政府宣佈對華額外2000億美元進口商品加徵10%關稅,於9月24日(下週一)正式生效,並且2019年起關稅稅率將增加至25%……特朗普老爹不顧國際政府反對……一意孤行……”,那麼在該文字中存在的實體共指現象為:唐納德·特朗普馬={Donald Trump,第45任美國總統,特朗普,特朗普老爹,川普,他}。

面向實體共指消解的機器學習綜述

本節主要概括Vincent Ng 於2017年發表於AAAI會議的文章:Machine Learning for Entity Coreference Resolution: A Retrospective Look at Two Decades of Research

. 本節將該論文講述的利用機器學習解決實體共指的方法概括如下圖:
在這裡插入圖片描述
根據該文所述,Mention—Pair 模型為最具影響力的模型,Neural Models為值得深入研究的模型。

工作安排展示

Mon 17Mon 24OctoberMon 08Mon 15RDF教程 XML教程 3篇綜述 閱讀論文 NLP with DL PPT製作 現有任務下一步計劃工作計劃
  • 甘特圖中NLP with Deep Learning 為斯坦福CS224d課程,共18節課,預計25天左右時間學習完成,旨在系統掌握自然語言處理及深度學習相關知識,為進一步深入研究提供理論支撐;
  • 下一步工作計劃中的文獻為2016年發表於EMNLP的論文:Deep Reinforcement Learning for Mention-Ranking Coreference Models,其開源地址為:請點選原始碼連線
  • 預期目標:藉助於開原始碼,在2018-10-03之前完全掌握論文核心思想及實現方法;
  • 2018-10-07報告之PPT主要內容:共指消解綜述+以上論文核心思想+個人對該論文的思考及存在的問題。

本文引用的參考文獻:
[1]: Deep Reinforcement Learning for Mention-Ranking Coreference Models[C]. EMNLP, 2016.
[2]: Machine Learning for Entity Coreference Resolution: A Retrospective Look at Two Decades of Research[C]. AAAI, 2017.
[3]: 指代消解綜述[J]. 計算機工程, 2010.
[4]: 語篇中的代詞性回指現象[J].
[5]: 西安交通大學劉文強博士學位論文.