1. 程式人生 > >新聞文字內容知識圖譜表示專案

新聞文字內容知識圖譜表示專案

TextGrapher

專案地址:https://github.com/liuhuanyong/TextGrapher
Text Content Grapher based on keyinfo extraction by NLP method。輸入一篇文件,將文件進行關鍵資訊提取,進行結構化,並最終組織成圖譜組織形式,形成對文章語義資訊的圖譜化展示。

專案介紹

如何用圖譜和結構化的方式,即以簡潔的方式對輸入的文字內容進行最佳的語義表示是個難題。 本專案將對這一問題進行嘗試,採用的方法為:輸入一篇文件,將文件進行關鍵資訊提取,並進行結構化,並最終組織成圖譜組織形式,形成對文章語義資訊的圖譜化展示。

使用方式

from text_grapher import *
content = '你要分析的文字'
handler = CrimeMining()
handler.main(content)

結果儲存在graph.html檔案當中。

事件舉例

1) 中興事件 
image

  1. 魏則西事件 
    image

  2. 雷洋事件 
    image

  3. 同學殺人事件 
    image

總結

1)如何用圖譜和結構化的方式,即以簡潔的方式對輸入的文字內容進行最佳的語義表示是個難題。
2)本專案採用了高頻詞,關鍵詞,命名實體識別,主謂賓短語識別等抽取方式,並嘗試將三類資訊進行圖譜組織表示,這種表示方式是一種嘗試。
3)命名實體識別以及關鍵資訊抽取受限於NLP的效能,在演算法和方式上還存在多處不足。

Question?

send mail to [email protected]
專案地址:https://github.com/liuhuanyong/TextGrapher
If any question about the project or me ,see https://liuhuanyong.github.io/