1. 程式人生 > >Solr中文詞庫配置

Solr中文詞庫配置

Solr預設不支援中文分詞,需要單獨配置中文分詞外掛
這裡寫圖片描述
輸入中文測試
這裡寫圖片描述
新增中文分詞外掛:solr 7.3.1中自帶中文分詞外掛,
將solr-7.3.1\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.3.1.jar 複製到 solr-7.3.1\server\solr-webapp\webapp\WEB-INF\lib 目錄中
這裡寫圖片描述
配置Schema中文分詞
這裡寫圖片描述
新增如下
這裡寫圖片描述

  <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
  </fieldType>

重新Reload
這裡寫圖片描述
測試中文分詞
這裡寫圖片描述