1. 程式人生 > >Stanford NLP工具--句法分析

Stanford NLP工具--句法分析

1,先上幾個網址。
主頁:http://nlp.stanford.edu
github地址:https://github.com/stanfordnlp/CoreNLP
線上效果展示1:http://nlp.stanford.edu:8080/parser/index.jsp
線上效果展示2:http://corenlp.run


2,下載並使用
(1)訪問http://stanfordnlp.github.io/CoreNLP/下載對應的zip包,zip包名稱類似於stanford-corenlp-full-2016-10-31.zip。
(2)訪問http://nlp.stanford.edu/software/lex-parser.html#Download下載對應的jar包(模型檔案,選擇需要分析的語言模型),jar包名稱類似於stanford-chinese-corenlp-2016-10-31-models.jar。
(3)新建java項工程,並將解壓後的zip包中所有jar包和model的jar包加入到java build path中。
 PS:Stanford NLP句法分析工具佔用記憶體較大,建議設定ide的記憶體為“-Xms512M -Xmx4096M”。切記使用1.8版本的jdk。
(4)編寫測試類。
 github地址中有很多測試類,可以自行查詢。以下提供幾個簡單的中文句法分析測試類。


 1)main方法如下
 public static void main(String[] args) {
        String[] arg2 = {"-encoding", "utf-8",
                "-outputFormat", "penn,typedDependenciesCollapsed",
                "edu/stanford/nlp/models/lexparser/xinhuaFactored.ser.gz",
                "D:\\t1.txt"};
        LexicalizedParser.main(arg2);
	}
 從該方法可以看出,edu.stanford.nlp.parser.lexparser.LexicalizedParser是一個很重要的類,該方法的main函式告訴我們怎樣使用這個方法。
 具體參考http://www.cnblogs.com/stGeekpower/p/3457746.html和http://www.cnblogs.com/stGeekpower/p/3477520.html。