Stanford NLP工具--句法分析
阿新 • • 發佈:2019-02-15
1,先上幾個網址。
主頁:http://nlp.stanford.edu
github地址:https://github.com/stanfordnlp/CoreNLP
線上效果展示1:http://nlp.stanford.edu:8080/parser/index.jsp
線上效果展示2:http://corenlp.run
2,下載並使用
(1)訪問http://stanfordnlp.github.io/CoreNLP/下載對應的zip包,zip包名稱類似於stanford-corenlp-full-2016-10-31.zip。
(2)訪問http://nlp.stanford.edu/software/lex-parser.html#Download下載對應的jar包(模型檔案,選擇需要分析的語言模型),jar包名稱類似於stanford-chinese-corenlp-2016-10-31-models.jar。
(3)新建java項工程,並將解壓後的zip包中所有jar包和model的jar包加入到java build path中。
PS:Stanford NLP句法分析工具佔用記憶體較大,建議設定ide的記憶體為“-Xms512M -Xmx4096M”。切記使用1.8版本的jdk。
(4)編寫測試類。
github地址中有很多測試類,可以自行查詢。以下提供幾個簡單的中文句法分析測試類。
1)main方法如下
具體參考http://www.cnblogs.com/stGeekpower/p/3457746.html和http://www.cnblogs.com/stGeekpower/p/3477520.html。
主頁:http://nlp.stanford.edu
github地址:https://github.com/stanfordnlp/CoreNLP
線上效果展示1:http://nlp.stanford.edu:8080/parser/index.jsp
線上效果展示2:http://corenlp.run
2,下載並使用
(1)訪問http://stanfordnlp.github.io/CoreNLP/下載對應的zip包,zip包名稱類似於stanford-corenlp-full-2016-10-31.zip。
(2)訪問http://nlp.stanford.edu/software/lex-parser.html#Download下載對應的jar包(模型檔案,選擇需要分析的語言模型),jar包名稱類似於stanford-chinese-corenlp-2016-10-31-models.jar。
(3)新建java項工程,並將解壓後的zip包中所有jar包和model的jar包加入到java build path中。
PS:Stanford NLP句法分析工具佔用記憶體較大,建議設定ide的記憶體為“-Xms512M -Xmx4096M”。切記使用1.8版本的jdk。
(4)編寫測試類。
github地址中有很多測試類,可以自行查詢。以下提供幾個簡單的中文句法分析測試類。
1)main方法如下
從該方法可以看出,edu.stanford.nlp.parser.lexparser.LexicalizedParser是一個很重要的類,該方法的main函式告訴我們怎樣使用這個方法。public static void main(String[] args) { String[] arg2 = {"-encoding", "utf-8", "-outputFormat", "penn,typedDependenciesCollapsed", "edu/stanford/nlp/models/lexparser/xinhuaFactored.ser.gz", "D:\\t1.txt"}; LexicalizedParser.main(arg2); }
具體參考http://www.cnblogs.com/stGeekpower/p/3457746.html和http://www.cnblogs.com/stGeekpower/p/3477520.html。