solr7.4 配置ikanalyzer和自帶的中文分詞器

阿新 • • 發佈：2019-01-23

這裡寫圖片描述

將下載好的jar包放入solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib目錄中

2、複製新專案的配置檔案

cd /root/tar/solr-7.4.0
mkdir server/solr/ik
cp -r server/solr/configsets/_default/conf  server/solr/ik/

3、然後到server/solr/ik/conf目錄中開啟managed-schema檔案，增加如下程式碼

<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer 
 type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" 
 useSmart="true" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

4、重啟solr

bin/solr restart -force

solr7自帶分詞中文分詞器
1、複製jar包

 cp contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.4.0.jar  server/solr-webapp/webapp/WEB-INF/lib

2、複製新專案的配置檔案

cd /root/tar/solr-7.4.0
mkdir server/solr/test
cp -r server/solr/configsets/_default/conf  server/solr/test/

3、然後到server/solr/test/conf目錄中開啟managed-schema檔案，增加如下程式碼

<fieldType name="text_hmm_chinese" class="solr.TextField" positionIncrementGap="100">
        <analyzer type="index">
            <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
        </analyzer>
    </fieldType>

4、重啟solr

bin/solr restart -force

這裡寫圖片描述

對比兩個分詞的效果
IK分詞器

這裡寫圖片描述

自帶分詞

這裡寫圖片描述

個人感覺IK的語義分析更好些，如有不同意見或建議，歡迎回復。

solr7.4 配置ikanalyzer和自帶的中文分詞器

將下載好的jar包放入solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib目錄中 2、複製新專案的配置檔案 cd /root/tar/solr-7.4.0 mkdir server/solr/ik cp -

Solr-4.10 配置中文分詞器(IKAnalyzer)

1、下載IKAnalyzer http://pan.baidu.com/s/1i3eXhAH 密碼：34w6 2、將ik的相關檔案拷貝到 webapps\solr\WEB-INF\lib 目錄下 3、引入相應詞典配置放到&

mysql8使用自帶全文索引（帶中文分詞）

lte not null incr sdh values 自帶 var 科學全文索引修改配置文件：vim /etc/my.cnf [mysqld] ngram_token_size=2 創建表： create table test( id int(11) not nu

Solr6.2搭建和配置ik中文分詞器

首先需要的準備好ik分詞器,因為Solr6.0版本比較高,所以ik分詞器的版本最好高一點,我是用ikanalyzer-solr5來搭建的. 第一步解壓ikanalyzer-solr5. 第二步複製ik-analyzer-solr5-5.x.jar並將其放在solr-6.2.1\se

Linux下ElasticSearch6.4.x、ElasticSearch-Head、Kibana以及中文分詞器IK的安裝配置

ElasticSearch 安裝配置下載 # 官網下載壓縮包 [[email protected] /home]# wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.

Es學習第五課，分詞器介紹和中文分詞器配置

上課我們介紹了倒排索引，在裡面提到了分詞的概念，分詞器就是用來分詞的。分詞器是ES中專門處理分詞的元件，英文為Analyzer，定義為：從一串文字中切分出一個一個的詞條，並對每個詞條進行標準化。它由三部分組成， Character Filters：分詞之前進行預處

ElasticSearch 6.5.4 安裝中文分詞器 IK和pinyiin

ES的常用的中文分詞有基於漢字的ik和基於拼音的pinyin https://github.com/medcl/elasticsearch-analysis-ik/releases https://github.com/medcl/elasticsearch-analysis-pinyi

Elasticsearch之外掛es ik配置自定義中文分詞詞典

1. 首先需要安裝好ik 2. 配置自定義中文分詞詞典如果寶寶們已經安裝好ik,在es中測試分詞成功的,可以新增自己的熱詞庫與停止庫 ① cd 到自己的elasticsearch-6.2.2/config/analysis-ik目錄下,可以看到有

二、Solr配置中文分詞器IKAnalyzer並配置業務域

一、solr域的介紹在solr中域的概念與lucene中域的概念相同，資料庫的一條記錄或者一個檔案的資訊就是一個document，資料庫記錄的欄位或者檔案的某個屬性就是一個Field域，solr中對索引的檢索也是對Field的操作。lucene中對域的操作是通過程式碼，solr對域的管理是通過一個配置檔案

（四）Solr6.4.1配置中文分詞器IK Analyzer詳解

Solr6.4.1配置中文分詞器IK Analyzer詳解 2.把IKAnalyzer.cfg.xml，mydict.dic，stopword.dic這三個檔案複製放入tomcat/solr專案web-info的classes下 3.把ik-analyz

配置中文分詞器 IK-Analyzer-Solr7

剛才 tokenize .org 參考 apps https 標簽 manage con 先下載solr7版本的ik分詞器，下載地址：http://search.maven.org/#search%7Cga%7C1%7Ccom.github.magese分詞器GitHub源

IKAnalyzer結合Lucene實現中文分詞

++ reset utf-8 incr ttr 中文分詞擴展沒有 font 1、基本介紹　　隨著分詞在信息檢索領域應用的越來越廣泛，分詞這門技術對大家並不陌生。對於英文分詞處理相對簡單，經過拆分單詞、排斥停止詞、提取詞幹的過程基本就能實現英文分詞，單對於中文分詞而言，

solrcloud配置中文分詞器ik

lte config server field per str load fonts textfield 無論是solr還是luncene,都對中文分詞不太好，所以我們一般索引中文的話需要使用ik中文分詞器。三臺機器（192.168.1.236，192.168.1.237

Solr 配置中文分詞器 IK

host dex text class get mar con png 網址 1. 下載或者編譯 IK 分詞器的 jar 包文件，然後放入 ...\apache-tomcat-8.5.16\webapps\solr\WEB-INF\lib\ 這個 lib 文件目錄下；　

Django 【第八篇】Django自帶的分頁器

sso 得到 pen active iou lan 查看 ger .get Django的分頁器（paginator） view.py from django.shortcuts import render,HttpResponse # Create your view

IKAnalyzer中文分詞器V2012_FF使用手冊

nal nbsp 使用手冊 href 分詞 analyzer ref 使用中文分詞 IKAnalyzer中文分詞器V2012_FF使用手冊.pdfIKAnalyzer中文分詞器V2012_FF使用手冊

ElasticSearch搜索引擎安裝配置中文分詞器IK插件

art linux系統 nal smart 分享內容分詞 search dcl 一、IK簡介 ElasticSearch（以下簡稱ES）默認的分詞器是標準分詞器Standard，如果直接使用在處理中文內容的搜索時，中文詞語被分成了一個一個的漢字，因此引入中文分詞器IK就

ElasticSearch-6.4.1安裝中文分詞器Analysis-ik.

一：使用背景和安裝過程. 1. ElasticSearch-6.4.1.(Windows環境下) &nbs

elasticsearch教程--中文分詞器作用和使用

目錄概述環境準備認識中文分詞器常用的中文分詞器 IK Analyzer hanlp中文分詞器彩蛋概述上一篇博文

Coreseek安裝-帶中文分詞的Sphinx

什麼是Coreseek Sphinx預設不支援中文索引及檢索，基於Sphinx開發了Coreseek全文檢索伺服器，Coreseek應該是現在用的最多的Sphinx中文全文檢索，它提供了為Sphinx設計的中文分詞包LibMMSeg包含mmseg中文分詞。安裝

solr7.4 配置ikanalyzer和自帶的中文分詞器

相關推薦