1. 程式人生 > 其它 >Elasticsearch官方文件翻譯-相似度模組

Elasticsearch官方文件翻譯-相似度模組

本系列文章翻譯ES官方8.0版本文件。本章對應內容地址Similarity module

因為水平有限,翻譯內容難免存在錯漏,歡迎大家指出

點選跳轉本系列目錄

相似度模組

  相似度(評分或排序模型)指的是文件與查詢條件的匹配度。相似度是欄位級別的,也就是可以為mapping中的每個欄位定義不同的相似度。

  自定義相似度是一個高階功能,大多數時候內建的相似就可以滿足需求,關於內建的相似度可參考similarity.

配置相似度

  絕大多數自定義或現有的相似度模型都可以在索引上進行配置,如下

PUT /index
{
  "settings": {
    "index": {
      "similarity": {
        
"my_similarity": { "type": "DFR", "basic_model": "g", "after_effect": "l", "normalization": "h2", "normalization.h2.c": "3.0" } } } } }

上述設定,我們配置了一個DFR相似度模型,在定義mapping時可以使用my_similarity指定該模型,如下

PUT /index/_mapping
{
  "properties" : {
    
"title" : { "type" : "text", "similarity" : "my_similarity" } } }