1. 程式人生 > >王仲遠 | 基於概念知識圖譜的短文字理解

王仲遠 | 基於概念知識圖譜的短文字理解

3月10日,美團點評AI Lab NLP負責人王仲遠博士,給大家進行了題為“基於概念化的短文字理解(Conceptualization for Short Text Understanding)”的報告。

640?wx_fmt=png&wxfrom=5&wx_lazy=1640?wx_fmt=gif&wxfrom=5&wx_lazy=1

王博士的這次報告主要分為3個步驟:通過理解短文字問題,引出知識圖譜概念;講解知識圖譜的技術;以及應用場景。

他首先從通俗易懂的小例子入手,講解了短文字。短文字比較稀疏,而且是充滿噪音幷包含歧義的。由於這樣的特性,傳統方法使得機器對短文字理解十分困難。並指出了當前搜尋引擎面臨的諸多問題。人類由於額外知識源,對於這種短文字的理解卻很容易。

640?wx_fmt=png640?wx_fmt=gif

按照人類理解問題和回答問題的過程,可以將知識分兩類—常識性知識和百科全書式知識(區別如下圖)

640?wx_fmt=png

而後,通過生動的例子講解指出人們對於短文字的理解,會將它們對映到一個概念空間,再根據上下文進行推理。

緊接著,指出將常識知識加入到計算推理中

640?wx_fmt=png

以例項講解“概念化”:將文字對映到概念的空間。

又以例子具體講解相關技術,如對實體進行正確的推理,挖掘字典關係,構建概念模型以及需要注意的事項等。

640?wx_fmt=png640?wx_fmt=png640?wx_fmt=png640?wx_fmt=png640?wx_fmt=png640?wx_fmt=gif

最後,王博士講了這些技術的實際應用場景結束了這次精彩的彙報演講。

640?wx_fmt=png

OpenKG.CN

中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜資料的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

640?wx_fmt=jpeg