1. 程式人生 > >全文搜尋技術--Solr7.1之配置中文分析器

全文搜尋技術--Solr7.1之配置中文分析器

前言:中國文化博大精深,但是solr只能一個一個的識別,而是更加符合中國人的習慣,所以加了中文分析器。

1.安裝中文分詞器

第一步:把中文分詞器(ik-analyzer-solr7-7.x.jar)/usr/local/solr_tomcat/webapps/solr/WEB-INF/lib下

第二步:將stopword,ext.dic,IKAnalyzer.cfg.xml 放在/usr/local/solr_tomcat/webaapps/solr7/WEB-INF/class

第三步:在/usr/local/solrhome/new_core/conf/managed-schema檔案(schema.xml)中新增一個自定義的fieldType,使用中文分析器。

<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class
="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType>

第四步:定義field,指定field的type屬性為text_ik

<!--IKAnalyzer Field-->

       <field name="title_ik" type="text_ik" indexed="true" stored="true" />

       <field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

第四步:重啟tomcat

測試: