全文搜尋技術--Solr7.1之配置中文分析器
阿新 • • 發佈:2018-11-14
前言:中國文化博大精深,但是solr只能一個一個的識別,而是更加符合中國人的習慣,所以加了中文分析器。
1.安裝中文分詞器
第二步:將stopword,ext.dic,IKAnalyzer.cfg.xml 放在/usr/local/solr_tomcat/webaapps/solr7/WEB-INF/class
第三步:在/usr/local/solrhome/new_core/conf/managed-schema檔案(schema.xml)中新增一個自定義的fieldType,使用中文分析器。
<!-- ik分詞器 --> <fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType>
第四步:定義field,指定field的type屬性為text_ik
<!--IKAnalyzer Field--> <field name="title_ik" type="text_ik" indexed="true" stored="true" /> <field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>
第四步:重啟tomcat
測試: