solr6.6配置IK中文分詞、IK擴充套件詞、同義詞、pinyin4j拼音分詞

阿新 • • 發佈：2019-01-16

solr基本指令： jetty部署【推薦】：Linux: $ bin/solr start；Windows: bin\solr.cmd start 建立core： Linux: $ bin/solr create -c corehotel；Windows: bin\solr.cmd create -c corehotel 停止所有：bin/solr stop -all；重啟solr【指定埠】：bin/solr start 【 -p 8983】；檢視幫助：bin/solr -help ；狀態：bin/solr status 1、部署solr6.6（本教程基於solr自帶的jetty啟動），tomcat部署配置教程相似【由於solr解壓即用，部署簡單，此處省略詳細部署教程】。 2、下載支援solr6.6的ikanalyzer-6.6.0.jar，原始碼地址：

https://github.com/zxiaofan/ik-analyzer-solr6，可直接在target目錄（或release）下載已打包好的ikanalyzer-6.6.0.jar。 Note： ikanalyzer原作者已停止更新，上述程式碼根據網友描述修改了相關檔案使之相容sole6.6。 3、下載拼音外掛：pinyin4j-2.5.0.jar、pinyinAnalyzer4.3.1.jar，相關jar下載見文末。 4、將下載的3個外掛copy到\server\solr-webapp\webapp\WEB-INF\lib目錄。 5、修改managed-schema（server\solr\[coreName]\conf目錄），在</schema>節點前新增如下配置： text_ik：IK分詞，配置同義詞過濾器； text_pinyin：支援IK分詞，索引index支援拼音過濾器。

<fieldType name="text_pinyin" class="solr.TextField" positionIncrementGap="0">
        <analyzer type="index">
        <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
        <filter class="com.shentong.search.analyzers.PinyinTransformTokenFilterFactory" minTermLenght="2" />
        <filter class="com.shentong.search.analyzers.PinyinNGramTokenFilterFactory" minGram="1" maxGram="20" />
    </analyzer>
    <analyzer type="query">
        <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
        <filter class="solr.LowerCaseFilterFactory" />
    </analyzer>
    </fieldType>
 
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" useSmart="false" >
  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
  <filter class="solr.SynonymGraphFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
</analyzer>
<analyzer type="query" useSmart="true" >
   <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
   <filter class="solr.SynonymGraphFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
</analyzer>
</fieldType>

6、重啟solr，訪問http://localhost:8983/solr/#/【corehotel】/analysis Analyse Fieldname / FieldType選擇text_ik， 6.1、中文分詞：

6.2、IK擴充套件詞 “嗨咯”這個詞語我不想拆分怎麼辦呢，只需在server\solr-webapp\webapp\WEB-INF\classes目錄配置擴充套件詞即可。配置檔案包含：IKAnalyzer.cfg.xml、以及ext.dic，相關檔案可直接在附件下載。在ext.dic內容中新增一行資料“嗨咯”，然後重啟solr，再次查詢“嗨嘍朋友今天天氣真好”，就會發現“嗨嘍”並未被分詞了。

6.3、同義詞如果我想查詢“朋友”的時候也能搜尋到“zxiaofan”怎麼操作呢，只需在server\solr\【coreName】\conf\synonyms.txt檔案中新增一行資料（朋友,zxiaofan）即可。重啟solr，再次查詢“嗨嘍朋友今天天氣真好”，你就會發現分詞器結果中包含了“zxiaofan”這個詞語了。

6.4、pinyin4j拼音分詞 Analyse Fieldname / FieldType選擇text_pinyin，你會發現分詞結果中包含了拼音，並且前面配置的擴充套件詞、同義詞依然有效（因為text_pinyin依舊使用了IK分詞器）。

歡迎個人轉載，但須在文章頁面明顯位置給出原文連線；
未經作者同意必須保留此段宣告、不得隨意修改原文、不得用於商業用途，否則保留追究法律責任的權利。

【 CSDN 】：csdn.zxiaofan.com
【GitHub】：github.zxiaofan.com

如有任何問題，歡迎留言。祝君好運！
Life is all about choices！ 
將來的你一定會感激現在拼命的自己！

solr6.6配置IK中文分詞、IK擴充套件詞、同義詞、pinyin4j拼音分詞

solr6.6配置IK中文分詞、IK擴充套件詞、同義詞、pinyin4j拼音分詞

iOS 分類（category）、類擴充套件（extension）、協議（protocol）

solr 6.2.0系列教程（二）IK中文分詞器配置及新增擴充套件詞、停止詞、同義詞

Solr6.6.0添加IK中文分詞器

Solr6.2搭建和配置ik中文分詞器

Linux下ElasticSearch6.4.x、ElasticSearch-Head、Kibana以及中文分詞器IK的安裝配置

（四）Solr6.4.1配置中文分詞器IK Analyzer詳解

es5.4安裝head、ik中文分詞插件

solrcloud配置中文分詞器ik

Solr 配置中文分詞器 IK

ElasticSearch搜索引擎安裝配置中文分詞器IK插件

solr與ik中文分詞的配置，以及新增Core（Add Core）的方式

Solr6.5配置中文分詞IKAnalyzer和拼音分詞pinyinAnalyzer (二)

solr5.5版本中ik中文分詞配置

ElasticSearch 6.5.4 安裝中文分詞器 IK和pinyiin

Solr配置中文分詞器IK Analyzer詳解

【Elasticsearch】Elasticsearch 6.x 探索之路-中文分詞器IK

Solr 5.0.0配置中文分詞器IK Analyzer

Solr 7.2.1 配置中文分詞器 IK Analyzer

solr6.4+拼音分詞與ik中文分詞

solr6.6配置IK中文分詞、IK擴充套件詞、同義詞、pinyin4j拼音分詞

相關推薦