elasticsearch ik分詞實現 中文、拼音、同義詞搜尋
EasticSearch版本:1.5.2
2.1、在elasticsearch的plugins目錄下,新建analysis-pinyin資料夾,解壓上述壓縮包,將裡面的
放到analysis-pinyin資料夾。
2.2同時在elasticsearch.yml裡面配置好拼音分詞器的過濾器:
3、同義詞分詞器配置:
3.1、在elasticsearch.yml裡面配置好同義詞分詞器的過濾器:
3.2、配置同義詞詞庫,在elasticsearch的config目錄下新建sysnonym.txt。
4、配置ik+pinying+同義詞的分詞器:
index: analysis: analyzer: ik: alias: [news_analyzer_ik,ik_analyzer] type: org.elasticsearch.index.analysis.IkAnalyzerProvider ik_analyzer_pinyin: type: custom tokenizer: ik filter: [synonym_test_filter,pinyin_mcl] filter: synonym_test_filter: type: synonym_filter synonyms_path: synonym.txt dynamic_reload: true reload_interval: 10s expand: true pinyin_mcl: type: pinyin first_letter: none padding_char: ""
分詞器配置說明:
ik_analyzer_pinyin: //分詞器的名稱
type: custom //型別:custom 表示自己定製
tokenizer: ik //分割詞元的元件:這裡使用的是IK
filter: [synonym_test_filter,pinyin_mcl] //對分割的次元做處理:這裡使用的是拼音和同義詞