新聞文字內容知識圖譜表示專案
阿新 • • 發佈:2018-11-28
TextGrapher
專案地址:https://github.com/liuhuanyong/TextGrapher
Text Content Grapher based on keyinfo extraction by NLP method。輸入一篇文件,將文件進行關鍵資訊提取,進行結構化,並最終組織成圖譜組織形式,形成對文章語義資訊的圖譜化展示。
專案介紹
如何用圖譜和結構化的方式,即以簡潔的方式對輸入的文字內容進行最佳的語義表示是個難題。 本專案將對這一問題進行嘗試,採用的方法為:輸入一篇文件,將文件進行關鍵資訊提取,並進行結構化,並最終組織成圖譜組織形式,形成對文章語義資訊的圖譜化展示。
使用方式
from text_grapher import *
content = '你要分析的文字'
handler = CrimeMining()
handler.main(content)
結果儲存在graph.html檔案當中。
事件舉例
1) 中興事件
-
魏則西事件
-
雷洋事件
-
同學殺人事件
總結
1)如何用圖譜和結構化的方式,即以簡潔的方式對輸入的文字內容進行最佳的語義表示是個難題。
2)本專案採用了高頻詞,關鍵詞,命名實體識別,主謂賓短語識別等抽取方式,並嘗試將三類資訊進行圖譜組織表示,這種表示方式是一種嘗試。
3)命名實體識別以及關鍵資訊抽取受限於NLP的效能,在演算法和方式上還存在多處不足。
Question?
send mail to [email protected]
專案地址:https://github.com/liuhuanyong/TextGrapher
If any question about the project or me ,see https://liuhuanyong.github.io/