ElasticSearch學習筆記十二（複合查詢）

阿新 • • 發佈：2021-01-31

本學習筆記基於ElasticSearch 7.10版本，舊版本已經廢棄的查詢功能暫時不做筆記，以後有涉及到再做補充。
參考官方文件：https://www.elastic.co/guide/en/elasticsearch/reference/7.10/joining-queries.html

關係型資料庫中有表的關聯關係，在 ElasticSearch 中，也會有類似的需求，例如訂單表和商品表，我們可以使用以下兩種方式實現：

巢狀文件（nested）
父子文件

1、巢狀文件

巢狀文件 nested 在之前介紹欄位型別的筆記中有學習過：ElasticSearch學習筆記六（欄位型別 Field data types）

，這裡不重複介紹。

現在，假設有一個電影文件，每個電影都有演員資訊：

# 需要將 actors 定義為 nested 型別，否則欄位中的關聯關係會丟失
PUT movies
{
  "mappings": {
    "properties": {
      "actors": {
        "type": "nested"
      }
    }
  }
}

PUT movies/_doc/1
{
  "name": "霸王別姬",
  "actors" 
: [
    {
     "name": "張國榮",
     "gender": "男"
    },
    {
     "name": "鞏俐",
     "gender": "女"
    }
  ]
}

巢狀型別的缺點：
首先我們來看一下 movies 索引中的文件數量

GET _cat/indices?v

我們只插入了一篇文件，但是文件數量卻變成3：
在這裡插入圖片描述
這是因為 nested 文件在 ElasticSearch 內部其實也是獨立的 lucene 文件，也就是說actors 在內部單獨儲存為兩份文件。只是在我們查詢的時候，ElasticSearch 內部幫我們做了 join 處理，所以最終看起來就像一個獨立文件一樣。

如果 nested 文件中的資料比較多時，可能會生成多分巢狀文件，所以這種方案效能並不是特別好。

此外，nested 文件更新的時候，也會更新所有的巢狀文件，比較耗效能。

2、巢狀查詢

使用巢狀查詢 nested 來查詢巢狀文件：

GET movies/_search
{
  "query": {
    "nested": {
      "path": "actors",
      "query": {
        "bool": {
          "must": [
            {
              "match": {
                "actors.name": "張國榮"
              }
            },
            {
              "match": {
                "actors.gender": "男"
              }
            }
          ]
        }
      }
    }
  }
}

3、父子文件

nested 文件中，巢狀的文件只能是一對一的關係，不能複用。比如“張國榮”還演過其他電影，那隻能在每一部電影的 actors 中再新增一次。

而父子文件就可以解決這種問題，相比於巢狀文件，主要有如下優勢：

更新父文件時，不會重新索引子文件。
建立、修改或者刪除子文件時，不會影響父文件或其他子文件。
子文件可以作為搜尋結果獨立返回。

例如學生和班級的關係：

PUT stu_class
{
  "mappings": {
    "properties": {
      "name": {
        "type": "keyword"
      },
      "s_c": {
        "type": "join",
        "relations": {
          "class": "student"
        }
      }
    }
  }
}

解釋一下幾個引數的意義：

s_c ：表示定義父子文件的欄位名，可以自定義。
join ：表示這是一個父子文件。
relations ：裡面分別定義 class 是 parent 父文件，student 是 child 子文件。

插入兩個父文件：

PUT stu_class/_doc/1
{
  "name": "一班",
  "s_c": {
    "name": "class"
  }
}
PUT stu_class/_doc/2
{
  "name": "二班",
  "s_c": {
    "name": "class"
  }
}

插入三個子文件：

PUT stu_class/_doc/3?routing=1
{
  "name": "zhangsan",
  "s_c": {
    "name": "student",
    "parent": 1
  }
}
PUT stu_class/_doc/4?routing=1
{
  "name": "lisi",
  "s_c": {
    "name": "student",
    "parent": 1
  }
}
PUT stu_class/_doc/5?routing=2
{
  "name": "wangwu",
  "s_c": {
    "name": "student",
    "parent": 2
  }
}

注意： 子文件需要和父文件在同一個分片上，而 ElasticSearch 預設使用文件 _id 進行雜湊計算後決定存在哪個分片上，所以 routing 關鍵字的值為父文件的 id 即可。

另外，一個索引只能定義一個 join 欄位，可以向一個已經存在的 join 欄位上新增關係。

3.1、has_child

通過子文件查詢父文件使用 has_child 查詢：

GET stu_class/_search
{
  "query": {
    "has_child": {
      "type": "student",
      "query": {
        "match": {
          "name": "lisi"
        }
      }
    }
  }
}

3.2、has_parent

通過父文件查詢子文件使用 has_parent 查詢：

GET stu_class/_search
{
  "query": {
    "has_parent": {
      "parent_type": "class",
      "query": {
        "match": {
          "name": "一班"
        }
      }
    }
  }
}

注意： 使用 has_parent 查詢不進行評分，這時可以考慮使用 parent_id 查詢子文件：

GET stu_class/_search
{
  "query": {
    "parent_id": {
      "type": "student",
      "id": 1
    }
  }
}

4、小結

普通子物件實現一對多（不使用 nested 或父子文件），會損失子文件的邊界，子物件之間的關聯關係丟失。
nested 可以解決關聯關係丟失的問題，但是有兩個缺點：更新主文件的時候要全部更新，不支援子文件屬於多個主文件。
父子文件則可以解決 nested 的問題，但是主要適用於寫多讀少的場景。

版權宣告：

本文僅記錄ElasticSearch學習心得，如有侵權請聯絡刪除。
更多內容請訪問原創作者：江南一點雨
微信公眾號：江南一點雨

ElasticSearch學習筆記十二（複合查詢）

技術標籤：ElasticSearchelasticsearch 本學習筆記基於ElasticSearch 7.10版本，舊版本已經廢棄的查詢功能暫時不做筆記，以後有涉及到再做補充。參考官方文件：https://www.elastic.co/guide/en/elasticsearch

ElasticSearch學習筆記十（詞項查詢）

資料結構和演算法學習筆記十二:查詢

一.概述　　在工程中對資料庫的操作主要有增刪查改幾類,其中增刪改的操作都依賴查詢,畢竟得先找到資料才能進行其他操作.

學習筆記十二：MySQL手注之聯合查詢注入

原理 union select 聯合查詢，即合併（取交集，結果中沒有重複⾏）前後兩個查詢；前提是前後查詢檢視必須擁有相同數量的列，列也必需擁有相同的資料型別。

iOS逆向學習之十二（iOS簽名機制）

iOS簽名機制的作用在學習了上一章什麼是加密解密、數字簽名以及證書之後，現在我們再來學習iOS的簽名機制就事半功倍了。其實iOS簽名機制的作用就是保證安裝到使用者手機上的App都是經過Apple官方允許的。當然，越獄

MySQL學習筆記十二：鎖表解鎖與加行鎖

一、鎖表解鎖 #查詢是否鎖表 SHOW OPEN TABLES WHERE IN_USE>0; #查詢程序 SHOW PROCESSLIST

資料庫系統原理學習筆記十二(儲存過程)

技術標籤：資料庫系統原理 1.儲存過程的基本概念儲存過程是一組為了完成某項特定功能的SQL語句集，其實質就是一段儲存在資料庫中的程式碼。它可以由宣告式的sql語句(如)和過程式sql語句組成。

Django搭建開發‘學習筆記’專案二（建立應用程式）

Django專案由一系列應用程式組成，它們協同工作讓專案成為一個整體。進入目錄learn_log，並激活虛擬環境，再執行命令python3 manage.py startapp learning_logs，建立應用程式

逆向脫殼分析基礎學習筆記十二彙編全域性和區域性變數

本文為本人在大神論壇逆向破解脫殼學習筆記之一，為本人對以往所學的回顧和總結，可能會有謬誤之處，歡迎大家指出。

Java學習筆記十二：面向物件之static、抽象類、介面、內部類

一、static關鍵字 1. 靜態變數（多執行緒） 2. 靜態方法 3. 靜態程式碼塊用於載入初始化的資訊，類載入時就執行，永久只執行一次。

DP學習筆記——揹包專題（更新中）

01揹包 \\(dp[i][j]:=\\) 決策第\\(i\\)種物品、揹包總容量為\\(j\\)時的最大價值則\\(dp[i][j]\\)的取值有兩種：

Java全棧大資料學習筆記NO.4（CSS基礎）

技術標籤：JAVA全棧大資料css CSS基礎一、CSS簡介二、使用CSS的原因三、CSS優點四、CSS位置五、CSS種類六、CSS註釋七、樣式表優先順序八、CSS語句結構九、選擇器的種類

Django搭建開發‘學習筆記’專案一（建立專案）

一、建立虛擬環境目的：將專案的庫與其他專案分離，在後續將專案部署到伺服器，這也是必須的。

學習筆記二分圖（更新中）

定義有兩個點集合（A，B，且A ∩ B=Ø），對於任意一個點，沒有一條邊能夠到達於他同集的點。稱A，B為二分圖的左部和右部。

Java基礎學習筆記4.4（程式媛）

Java“徹底”採用面向物件的方式，即抽象化物件。特性：封裝、繼承、多型優勢：既可以在PC執行，又可以在伺服器端和客戶端執行，可以做模組，可以做網頁的互動

Java基礎學習筆記4.7（程式媛）

第一節運算子賦值運算子：= 算術運算子： ++a --a 先運算後用值 a++ a-- 先用值後運算

[學習筆記]基於paddle（飛槳）的手寫數字識別

放暑假了，但是還沒有期末考試。這個學期也算是學了不少神奇的東西，那就先回顧整理一下吧。

Elasticsearch學習筆記之（五）搜尋詳解補充 Suggest-查詢建議

技術標籤：elasticserach搜尋引擎目錄查詢建議介紹查詢建議是什麼？ ES中查詢建議的API

JPA(Java Persistence API)學習十二（多對多對映）

1.概述多對多對映表示集合值關聯，其中任何數量的實體可以與其他實體的集合關聯。

MySQL學習筆記十六：事件（定時任務）

一、事件概述 1.1、事件簡介事件（Event）是MySQL在相應的時刻呼叫的過程式資料庫物件。一個事件可呼叫一次，也可週期性的啟動，它由一個特定的執行緒來管理的，也就是所謂的\"事件排程器\"。

ElasticSearch學習筆記十二（複合查詢）

1、巢狀文件

2、巢狀查詢

3、父子文件

3.1、has_child

3.2、has_parent

4、小結

版權宣告：

相關推薦