Solr中文詞庫配置
阿新 • • 發佈:2019-01-07
Solr預設不支援中文分詞,需要單獨配置中文分詞外掛
輸入中文測試
新增中文分詞外掛:solr 7.3.1中自帶中文分詞外掛,
將solr-7.3.1\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.3.1.jar 複製到 solr-7.3.1\server\solr-webapp\webapp\WEB-INF\lib 目錄中
配置Schema中文分詞
新增如下
<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> </analyzer> </fieldType>
重新Reload
測試中文分詞