1. 程式人生 > >ElasticSearch官方預設的分詞外掛

ElasticSearch官方預設的分詞外掛

elasticsearch官方預設的分詞外掛,對中文分詞效果不理想。

  比如,我現在,拿個具體例項來展現下,驗證為什麼,es官網提供的分詞外掛對中文分詞而言,效果差


總結

     如果直接使用Elasticsearch的朋友在處理中文內容的搜尋時,肯定會遇到很尷尬的問題——中文詞語被分成了一個一個的漢字,當用Kibana作圖的時候,按照term來分組,結果一個漢字被分成了一組。

     這是因為使用了Elasticsearch中預設的標準分詞器,這個分詞器在處理中文的時候會把中文單詞切分成一個一個的漢字