1. 程式人生 > >中科院中文分詞在java中呼叫詳解(ICTCLAS2013版)

中科院中文分詞在java中呼叫詳解(ICTCLAS2013版)

在中文分詞的時候,現在流行的有很多,下面主要介紹中科院中文分詞,現在中科院地址是http://ictclas.nlpir.org/

首先也是開始呼叫這個介面,呼叫成功後覺得應該共享出來,讓更多人去使用。

然後主要是介紹一下怎麼用使用漢語分詞系統怎麼去呼叫。必須先在上面那個網址下載NLPIR漢語分詞系統,除此之外還要下載NLPIR-ICTCLAS2013-Win-32-JNI(u0114)的支援java版的補充包,包中包括NLPIR_JNI.dll檔案和一個demo,這個NLPIR_JNI.dll檔案是NLPIR漢語分詞系統(又名ICTCLAS2013)是在32位Windows環境下,是供Java呼叫的API,

第一步:將此NLPIR_JNI.dll檔案將替換NLPIR漢語分詞系統中bin檔案中的dll檔案。

第二步:在eclipse中建立以工程檔案,然後將漢語分詞系統整個檔案複製到工程檔案的根目錄下。

第三步:將補充包中的例子中的testNLPIT.java直接複製到src下,然後將kevin/zhang/NLPIR.java,連帶著資料夾一同拷到src下,注:不要改動資料夾和檔名,否則將不能執行,至於為什麼,不清楚,肯定包中有目錄限定,但不影響使用

第四步:將NLPIR_JNI.dll拷出一份放到根目錄下,然後修改demo中的帶碼testNLPIT.java中初始化目錄檔案這樣寫String argu = ".",一般目錄不好選擇

第五步:執行testNLPIT.java將得到可以分詞結果,有帶詞性標註的結果,如果只分詞,可以將NLPIR_ParagraphProcess(sInput.getBytes("GB2312"), 1)改為零,就可以得到分詞的效果

注:在eclipse中可以吧NLPIR_JNI。dll放到bin目錄下,但在web工程下,請放在web編譯好的檔案中,一般在build/classes/下,如果web工程直接放在檔案下,如果不知道編譯的檔案輸出目錄在哪,可以開啟工程下的 .classpath檔案,下面有輸出的目錄。

補充:在linux系統下,只需要在中科院網站地址下載支援linux系統到類庫,步驟和上面是一樣到,只是把支援linux類庫引進到上述dll位置即可!

注:如有不妥,還望批評指正!

相關推薦

中科院中文java呼叫ICTCLAS2013

在中文分詞的時候,現在流行的有很多,下面主要介紹中科院中文分詞,現在中科院地址是http://ictclas.nlpir.org/ 首先也是開始呼叫這個介面,呼叫成功後覺得應該共享出來,讓更多人去使用。 然後主要是介紹一下怎麼用使用漢語分詞系統怎麼去呼叫。必須先在上面那個網

【轉】中文之HMM模型

實現 含義 jieba 順序 清晰 bsp 中國 matrix 統計 關於HMM模型的介紹,網上的資料已經爛大街,但是大部分都是在背書背公式,本文在此針對HMM模型在中文分詞中的應用,講講實現原理。 盡可能的撇開公式,撇開推導。結合實際開源代碼作為例子,爭取做到雅俗共賞,

中文之HMM模型

關於HMM模型的介紹,網上的資料已經爛大街,但是大部分都是在背書背公式,本文在此針對HMM模型在中文分詞中的應用,講講實現原理。 儘可能的撇開公式,撇開推導。結合實際開原始碼作為例子,爭取做到雅俗共賞,童叟無欺。 沒有公式,就沒有傷害。 模型介紹 第一次聽說HMM模型是從李

Solr配置中文器IK Analyzer

歡迎掃碼加入Java高知群交流 配置的過程中出現了一些小問題,一下將詳細講下IK Analyzer的配置過程,配置非常的簡單,但是首先主要你的Solr版本是哪個,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4.x版本的用IK Analyzer 20

Solr6.4.1配置中文器IK Analyzer

Solr6.4.1配置中文分詞器IK Analyzer詳解 2.把IKAnalyzer.cfg.xml,mydict.dic,stopword.dic這三個檔案複製放入tomcat/solr專案web-info的classes下 3.把ik-analyz

JavaCAS悲觀鎖與樂觀鎖

前言:在JDK1.5之前Java語言是靠synchronized關鍵字保證同步的,這會導致有鎖鎖機制存在以下問題: (1)在多執行緒競爭下,加鎖、釋放鎖會導致比較多的上下文切換和排程延時,引起效能問題。 (2)一個執行緒持有鎖會導致其它所有需要此鎖的執行緒掛

Java Scanner 類附例子學習

在筆試程式設計過程中,關於資料的讀取如果迷迷糊糊,那後來的程式設計即使想法很對,實現很好,也是徒勞,於是在這裡認真總結了Java  Scanner 類的使用 通過 Scanner 類來獲取使用者的輸入,下面是建立 Scanner 物件的基本語法: Scanner s =

Java入門提高篇】Day34 Java容器類十五WeakHashMap

public class WeakHashMapTest { public static void main(String[] args){ testWeakHashMap(); } private static void testWeakHashMap

Java資料結構十二- HashMap

HashMap 基於雜湊表的 Map 介面的實現。此實現提供所有可選的對映操作,並允許使用 null 值和 null 鍵。(除了非同步和允許使用 null 之外,HashMap 類與 Hashtable 大致相同。)此類不保證對映的順序,特別是它不保證該順序恆

Java虛擬機器十一------雙親委派模型

  在上一篇部落格,我們介紹了類載入過程,包括5個階段,分別是“載入”,“驗證”,“準備”,“解析”,“初始化”,如下圖所示:        本篇部落格,我們來介紹Java虛

二十一狀態模式DOTA

作者:zuoxiaolong8810(左瀟龍),轉載請註明出處,特別說明:本博文來自博主原部落格,為保證新部落格中博文的完整性,特複製到此留存,如需轉載請註明新部落格地址即可。                本次LZ

在windows10下搭建Storm並執行WordCount單機

釋出時間:2018-04-10 來源:網路 上傳者:使用者 關鍵字: 單機版 搭建 詳解 WordCount windows10 執行 Storm 發表文章 摘要:作為主流的大資料處理平臺,不同於批處理的Hadoop,Storm的實時計算以及拓撲結構有其獨有的優勢(當然,只是

Jupyter安裝使用Windows

什麼是Jupyter Jupyter Notebook是一個開源的Web應用程式,可以建立和共享包含實時程式碼,方程式,視覺化和說明文字的文件。 Jupyter的官網: http://jupyter.org/index.html 環境準備 Jupyter的安裝需

Idea環境下使用JFinal開發Web專案入門圖文

       最近看到網上有人推薦使用JFinal(官網:http://www.jfinal.com/)開發WEB + ORM專案,自己於是到官網學習JFinal,官方文件提供了使用eclipse開發Jfinal專案的步驟,只是對Idea做了簡略說明,沒有詳細的介紹,對於智

新聞類APP模板iOS

- (UITableViewCell *)tableView:(UITableView *)tableView cellForRowAtIndexPath:(NSIndexPath *)indexPath { NSInteger row = indexPath.row; UITableView

新聞類APP模板android

<span style="font-size:12px;">package com.latu.qingcheng123.adapter; import java.io.File; import java.util.ArrayList; import java.util.List; import

常用的排序演算法C#

只要是搞程式設計的演算法、資料結構、作業系統、計算機組成原理這些東西都會有用到,就像醫生給人治病一樣,只有瞭解了人的內部機理、運作機制,才能很好的做到對症下藥,藥到病除。而上面所說的那些計算機理論課就好像人的內部機理一樣,我們往往都把這些東西給忽略了,而把更多的精力放在具體的程式語言實現上,當然我也是這樣,

中科院NLPIR中文java

摘要:為解決中文搜尋的問題,最開始使用PHP版開源的SCWS,但是處理人名和地名時,會出現截斷人名地名出現錯誤。開始使用NLPIR分詞,在分詞準確性上效果要比SCWS好。本文介紹如何在windows系統下編譯JAVA ,生成可以執行的jar檔案。 NLPIR的下載地

中文Java簡單實現

中文分詞Java簡單實現 存備忘 package helloJavaWorld; //用棧存取詞語 class StackTest { private Object[] stack; //元素個數; private int size; //預設長度

雙向最大匹配演算法——基於詞典規則的中文(Java實現)

目錄 一、中文分詞理論描述 二、演算法描述       1、正向最大匹配演算法       2、反向最大匹配演算法       3、雙劍合璧 三、案例描述 四、JAVA實現完整程式碼 五、組