java中科院分詞配置(ICTCLAS) 轉
之前零零散散用過幾次,配置好了就沒管過。後來再用的時候就忘了怎麼配置,又找了很多資料(太麻煩了)。現總結一下當作筆記:
首先,下載中科院分詞專案。
github網址:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/NLPIR-ICTCLAS
使用的時候兩種方法 一種直接在eclipse中匯入如圖所示的專案
在這個java檔案中配置兩個路徑
第一個:
// 定義並初始化介面的靜態變數
CLibrary Instance = (CLibrary) Native.loadLibrary("D:\\NLPIR\\bin\\ICTCLAS2013\\x64\\NLPIR", CLibrary.class);
D:\\NLPIR\\bin\\ICTCLAS2013\\x64\\NLPIR 這個路徑改為下面路徑中的一個(ps 什麼系統選什麼樣的資料夾 如果你是win32位 那麼路徑就改為H:\\work_eclipse\\20160707102537_ICTCLAS2016分詞系統下載包\\漢語分詞20140928\\lib\\win32\\NLPIR 最後面的NLPIR是檔名不需要加字尾,當然你也可以把這個檔案單獨拿出來建一個目錄存放。只要把路徑改成該目錄的路徑就可以了)
第二個:
String argu = "D:\\NLPIR";
// String system_charset = "GBK";//GBK----0
String system_charset = "UTF-8";
argu 為data資料夾路徑,找到data資料夾路徑替換他就可以了(同樣可以將data資料夾單獨拿出來建一個目錄存放,只要把路徑改成該目錄的路徑就可以了)如圖所示
路徑就改為String argu = "H:\\work_eclipse\\20160707102537_ICTCLAS2016分詞系統下載包\\漢語分詞20140928";
配置完成後執行NlpirTest 可能會出現Not valid license or your license expired 這個錯誤。這時候你要點選這個URL:https://github.com/NLPIR-team/NLPIR/tree/master/License
根據需要找到你要的授權。如圖所示:
再點選View Raw即可下載(其他方式下載可能會出現資料夾隨壞的情況)
解壓後 將裡面的NLPIR.user複製到data檔案中即可。再執行NlpirTest 這個class就可以出結果了。
另一種是在專案中使用中科院分詞。配置如上不在贅述,與上面方法不同的地方在於你要在的專案中部署中科院分詞的jar包。如圖所示:
將這個jar包部署到你的專案中,再將NlpirTest 複製到你的專案中即可執行。
import utils.SystemParas; 這個出錯可直接刪除,當然你也可以將這個class複製到專案中配置一下(但是好像沒有用到)。(ps 如果你要做其他研究只要在NlpirTest中加入其他程式碼即可 )
轉自:http://www.cnblogs.com/lyr-notebook/p/5409008.html