1. 程式人生 > >Elasticsearch之中文分詞器

Elasticsearch之中文分詞器

Elasticsearch的中文分詞器

  1、單字分詞

    如:“我們是中國人”
    效果:“我”“們”“是”“中”“國”“人”

  2、二分法分詞:按兩個字進行切分。

    如:“我們是中國人”,效果:“我們”、“們是”、“是中”、“中國”、“國人”。

  3、詞庫分詞:按某種演算法構造詞,然後去匹配已建好的詞庫集合,如果匹配到就切分出來成為詞語。通常詞庫分詞被認為是最理想的中文分詞演算法。