ElasticSearch 解析機制常見用法庫 之 Character Filters常用用法
阿新 • • 發佈:2019-01-08
以下三種Character Filter是elasticsearch官方提供的三種,(只有三種哦!)
Mapping Char Filter
通過給定的mappings資料來替換.
|
mappings資料. |
|
一個存放mappings資料的地址,可以把mappings資料寫到config配置檔案中,然後把 config存放到某個路徑下 |
HTML Strip Char Filter
html_strip
把資料中的html
標籤元素剝離出來。例如“<a>”就會變成“a
Pattern Replace Char Filter
pattern_replace
用正則表示式的方式來替換資料。 pattern
正則表示式“引數” replacement
最後替換後的形式。借鑑了lucene的相關內容,詳情請參考:http://lucene.apache.org/core/4_3_1/analyzers-common/org/apache/lucene/analysis/pattern/PatternReplaceCharFilter.html
書寫格式:
例子:
1、元資料:"aa bb aa bb" 、pattern="(aa)\\s+(bb)"、 replacement="$1#$2"
輸出結果為:"aa#bb aa#bb"
2、元資料:"aa123bb" 、pattern="(aa)\\d+(bb)" 、 replacement="$1 $2"輸出結果為:"aa bb"