solr8.6新增中文分詞器

阿新 • • 發佈：2020-11-27

1.新增solr8 自帶分詞工具
（1）在solr安裝資料夾下面找到這個lucene-analyzers-smartcn-8.6.0.jar包

（2）複製一份到 D:\solr-8.6.0\server\solr-webapp\webapp\WEB-INF\lib 這個目錄下面

（3）接下來在你的專案conf下的配置檔案managed-schema新增以下配置

<!-- ChineseAnalyzer 自帶的中文分詞器 -->
<fieldType name="solr_cnAnalyzer" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class 
="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>

這樣就配置好了型別名稱是 solr_cnAnalyzer 的分詞器。

2.外部分詞器配置
（1）先下載solr8版本的ik分詞器，下載地址：https://search.maven.org/search?q=com.github.magese

（2）將下載好的jar包放入solr-7.3.0/server/solr-webapp/webapp/WEB-INF/lib目錄中

（3）接下來在你的專案conf下的配置檔案managed-schema新增以下配置

<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class 
="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

3.給需要做分詞的的欄位指定分詞器

我給 name 欄位指定了solr_cnAnalyzer 分詞器、content欄位指定了text_ik 分詞器，其中 type 就是上面分詞器的name值。

<field name="name" type="solr_cnAnalyzer" indexed="true" stored="true"/>
<field name="content" type="text_ik" multiValued="true" indexed="false" stored="true"/>

4.配置完成後重啟一次solr服務

再次重新整理http://localhost:8983/solr頁面

選擇test-> Analysis -> 選擇分詞器 solr_cnAnalyzer輸入 "黑夜給了我黑色的眼睛"

點選"Analyse Values"按鈕可以看到結果已經分詞成功了。

solr8.6新增中文分詞器

1.新增solr8 自帶分詞工具（1）在solr安裝資料夾下面找到這個lucene-analyzers-smartcn-8.6.0.jar包

elasticsearch(v2.4.6)新增中文分詞器ik

一、參考 ik github文件將maven源改為國內阿里雲映象二、編譯安裝 analysis-ik 2.1 下載原始碼

北大開源中文分詞器被打臉現場...

有做過搜尋的朋友知道，分詞的好壞直接影響我們最終的搜尋結果。在分詞的領域，英文分詞要簡單很多，因為英文語句中都是通過一個個空格來劃分的，而我們的中文博大精深，同樣的詞在不同的語境中所代表的含義千差萬別

Elasticsearch 建立ik中文分詞器

一、建立ik中文分詞器 1、下載ik中文分詞器進入https://github.com/medcl/elasticsearch-analysis-ik

DockerFile構建ElasticSearch映象安裝IK中文分詞器外掛

DockerFile構建ElasticSearch映象安裝IK中文分詞器外掛為什麼要安裝IK中文分詞器？

中文分詞器

1.安裝外掛 [root@db01 ~]# /usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.6.0/elasticsearch-analysis-ik-6.6.0.zip

elasticsearch 安裝IK中文分詞器

1.去github下載zip包具體地址：https://github.com/medcl/elasticsearch-analysis-ik 因為我本地裝的是7.4.2版本，我ik分詞器也下載這個版本

linux 安裝ElasticSearch的中文分詞器IK

首先確保ElasticSearch映象已經啟動一定要保證ElasticSearch和ElasticSearch外掛的版本一致

【Elasticsearch】之中文分詞器ik

技術標籤：Elasticsearch 應用筆記elasticsearcheselk 安裝分詞外掛ik mkdir plugins/ik cp elasticsearch-analysis-ik-6.5.4.zip plugins/ik

elasticSearch~中文分詞器安裝及使用

技術標籤：elasticelasticsearch中文分詞分詞API 請求方式: post URL：http://192.168.18.129:9200/_analyze

Solr：Slor初識（概述、Windows版本的安裝、新增IK分詞器）

1、Solr概述（1）Solr與資料庫相比的優勢搜尋速度更快、搜尋結果能夠按相關度排序、搜尋內容格式不固定等

elk 改為使用 ik 中文分詞器

下文是在已經部署了 elk 的情況下，對中文內容加分詞。主要操作步驟 1. es 安裝 ik 外掛2. es 配置 logstash 模板，設定 message 欄位使用 ik 中文分詞器3. 重建已存在的索引

Elasticsearch-Analysis-IK中文分詞器安裝配置和使用（非常詳細）

技術標籤：ESelasticsearch Elasticsearch 預設已經含有的分詞法 Standard 分詞器英文的處理能力同於StopAnalyzer.支援中文采用的方法為單字切分。他會將詞彙單元轉換成小寫形式，並去除停用詞和標點符號simple

elasticsearch使用中文分詞器

1、首先我們要把對應的分詞器的版本下載下來，網址是：https://github.com/medcl/elasticsearch-analysis-ik/releases

elasticsearch中文分詞器IK的使用

IK中文分詞器的安裝 es中文分詞器IK的使用新增一個索引庫 PUT /test 利用該索引庫進行分詞測試

ES新增elasticsearch-analysis-ik分詞器

1、下載分詞器包 https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v5.4.3 2、將分詞器解壓並放入plugins目錄下。（一定要在plugins下面建立一個ik檔案，然後將解壓的elasticsearch-analysis-ik檔

新增分詞器(CentOS)

技術標籤：javasolrspring bootcentostomcat ---恢復內容開始--- 第一步：把中文分析器新增到solr工程中

Elasticsearch入門(1)-倒排索引和分詞器

這部分檔案主要包含：倒排索引 Analyzer分詞倒排索引舉例類比做個類比，看書時，我們看到了哪個章節，根據章節標題去目錄中檢索具體的內容。但是當我們回憶起一些隻言片語，一些句子，一些情節時，去定位它出

python中文分詞庫jieba使用方法詳解

安裝python中文分詞庫jieba 法1：Anaconda Prompt下輸入conda install jieba 法2：Terminal下輸入pip3 install jieba

Python中文分詞庫jieba,pkusegwg效能準確度比較

中文分詞(Chinese Word Segmentation)，將中文語句切割成單獨的片語。英文使用空格來分開每個單詞的，而中文單獨一個漢字跟詞有時候完全不是同個含義，因此，中文分詞相比英文分詞難度高很多。

solr8.6新增中文分詞器

相關推薦