1. 程式人生 > >ElasticSearch 解析機制常見用法庫 之 Character Filters常用用法

ElasticSearch 解析機制常見用法庫 之 Character Filters常用用法

以下三種Character Filter是elasticsearch官方提供的三種,(只有三種哦!)

Mapping Char Filter

通過給定的mappings資料來替換.

mappings

mappings資料.

mappings_path

         一個存放mappings資料的地址,可以把mappings資料寫到config配置檔案中,然後把             config存放到某個路徑下



HTML Strip Char Filter

html_strip 把資料中的html 標籤元素剝離出來。例如“<a>”就會變成“a

Pattern Replace Char Filter

 pattern_replace 用正則表示式的方式來替換資料。 pattern 正則表示式“引數” replacement 最後替換後的形式。借鑑了lucene的相關內容,詳情請參考:http://lucene.apache.org/core/4_3_1/analyzers-common/org/apache/lucene/analysis/pattern/PatternReplaceCharFilter.html

書寫格式:


例子:

1、元資料:"aa bb aa bb" 、pattern="(aa)\\s+(bb)"、    replacement="$1#$2"

輸出結果為:"aa#bb aa#bb"

2、元資料:"aa123bb" 、pattern="(aa)\\d+(bb)" 、  replacement="$1 $2"

輸出結果為:"aa bb"