ElasticSearch5.X搜尋條件的聚合（六）

阿新 • • 發佈：2019-01-21

範圍限定的聚合編輯

聚合可以與搜尋請求同時執行，但是我們需要理解一個新概念：範圍。預設情況下，聚合與查詢是對同一範圍進行操作的，也就是說，聚合是基於我們查詢匹配的文件集合進行計算的。

讓我們看看第一個聚合的示例：

GET /cars/transactions/_search
{
    "size" : 0,
    "aggs" : {
        "colors" : {
            "terms" : {
              "field" : "color"
            }
        }
    }
}

我們可以看到聚合是隔離的。現實中，Elasticsearch 認為 "沒有指定查詢" 和 "查詢所有文件" 是等價的。前面這個查詢內部會轉化成下面的這個請求：

GET /cars/transactions/_search
{
    "size" : 0,
    "query" : {
        "match_all" : {}
    },
    "aggs" : {
        "colors" : {
            "terms" : {
              "field" : "color"
            }
        }
    }
}

因為聚合總是對查詢範圍內的結果進行操作的，所以一個隔離的聚合實際上是在對 match_all 的結果範圍操作，即所有的文件。

一旦有了範圍的概念，我們就能更進一步對聚合進行自定義。我們前面所有的示例都是對所有

資料計算統計資訊的：銷量最高的汽車，所有汽車的平均售價，最佳銷售月份等等。

利用範圍，我們可以問“福特在售車有多少種顏色？”諸如此類的問題。可以簡單的在請求中加上一個查詢（本例中為 match 查詢）：

GET /cars/transactions/_search
{
    "query" : {
        "match" : {
            "make" : "ford"
        }
    },
    "aggs" : {
        "colors" : {
            "terms" : {
              "field" : "color"
            }
        }
    }
}

因為我們沒有指定 "size" : 0 ，所以搜尋結果和聚合結果都被返回了：

{
...
   "hits": {
      "total": 2,
      "max_score": 1.6931472,
      "hits": [
         {
            "_source": {
               "price": 25000,
               "color": "blue",
               "make": "ford",
               "sold": "2014-02-12"
            }
         },
         {
            "_source": {
               "price": 30000,
               "color": "green",
               "make": "ford",
               "sold": "2014-05-18"
            }
         }
      ]
   },
   "aggregations": {
      "colors": {
         "buckets": [
            {
               "key": "blue",
               "doc_count": 1
            },
            {
               "key": "green",
               "doc_count": 1
            }
         ]
      }
   }
}

看上去這並沒有什麼，但卻對高大上的儀表盤來說至關重要。加入一個搜尋欄可以將任何靜態的儀表板變成一個實時資料搜尋裝置。這讓使用者可以搜尋資料，檢視所有實時更新的圖形（由於聚合的支援以及對查詢範圍的限定）。這是 Hadoop 無法做到的！

Java程式碼實現：

/**
  	  * Description:帶有搜尋條件的聚合查詢
  	  * 例：bmw(寶馬)在售車有多少種顏色
  	  * 
  	  * @author wangweidong
  	  * CreateTime: 2017年11月10日 下午4:03:30
  	  *
  	 */
  	@Test
  	public void searchBucketsAggregation() {
  		String index = "cars";
  		String type = "transactions";
  		SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index).setTypes(type);
  		
  		//搜尋條件
  		BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();
  		queryBuilder.must(QueryBuilders.matchQuery("make", "bmw")); 
  		
  		//聚合
	    TermsAggregationBuilder field = AggregationBuilders.terms("popular_colors").field("color.keyword");
	    searchRequestBuilder.addAggregation(field);
//	    searchRequestBuilder.setSize(0);
	    searchRequestBuilder.setQuery(queryBuilder);
	    SearchResponse searchResponse = searchRequestBuilder.execute().actionGet();
	     
	    System.out.println(searchResponse.toString());
	    
	    Terms genders = searchResponse.getAggregations().get("popular_colors");
	    for (Terms.Bucket entry : genders.getBuckets()) {
	    	Object key = entry.getKey();      // Term
	        Long count = entry.getDocCount(); // Doc count
	        
	        System.out.println(key);
	        System.out.println(count);
	    }
  	}

全域性桶編輯

通常我們希望聚合是在查詢範圍內的，但有時我們也想要搜尋它的子集，而聚合的物件卻是所有資料。

例如，比方說我們想知道福特汽車與所有汽車平均售價的比較。我們可以用普通的聚合（查詢範圍內的）得到第一個資訊，然後用 全域性 桶獲得第二個資訊。

全域性 桶包含所有的文件，它無視查詢的範圍。因為它還是一個桶，我們可以像平常一樣將聚合巢狀在內：

GET /cars/transactions/_search
{
    "size" : 0,
    "query" : {
        "match" : {
            "make" : "ford"
        }
    },
    "aggs" : {
        "single_avg_price": {
            "avg" : { "field" : "price" } 
        },
        "all": {
            "global" : {}, 
            "aggs" : {
                "avg_price": {
                    "avg" : { "field" : "price" } 
                }

            }
        }
    }
}

	聚合操作在查詢範圍內（例如：所有文件匹配 `ford` ）
	`global` 全域性桶沒有引數。
	聚合操作針對所有文件，忽略汽車品牌。

single_avg_price 度量計算是基於查詢範圍內所有文件，即所有 福特 汽車。avg_price 度量是巢狀在 全域性 桶下的，這意味著它完全忽略了範圍並對所有文件進行計算。聚合返回的平均值是所有汽車的平均售價。

如果能一直堅持讀到這裡，應該知道我們有個真言：儘可能的使用過濾器。它同樣可以應用於聚合，在下一章中，我們會展示如何對聚合結果進行過濾而不是僅對查詢範圍做限定。

Java程式碼實現：

/**
  	 * Description:全域性桶
  	 * 例：想知道福特(ford)汽車與 所有 汽車平均售價的比較
  	 * 
  	 * @author wangweidong
  	 * CreateTime: 2017年11月10日 下午4:03:30
  	 *
  	 */
  	@Test
  	public void globalBucketsAggregation() {
  		try {
  			String index = "cars";
  	  		String type = "transactions";
  	  		SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index).setTypes(type);
  	  		
  	  		//搜尋條件
  	  		BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();
  	  		queryBuilder.must(QueryBuilders.matchQuery("make", "ford")); 
  	  		
  	  		//平均價格
  	  		AvgAggregationBuilder singleAvgPrice = AggregationBuilders.avg("single_avg_price").field("price");
  	  		
  	  		//聚合
  	  		GlobalAggregationBuilder field = AggregationBuilders.global("all");
  	        AvgAggregationBuilder avgPrice = AggregationBuilders.avg("avg_price").field("price");
  	        field.subAggregation(avgPrice);
  	  		
  	        searchRequestBuilder.addAggregation(singleAvgPrice);
  	  		searchRequestBuilder.addAggregation(field);
  		    searchRequestBuilder.setSize(0);
  	  		searchRequestBuilder.setQuery(queryBuilder);
  	  		SearchResponse searchResponse = searchRequestBuilder.execute().actionGet();
  	  		
  	  		System.out.println(searchResponse.toString());
  	  		
  	  		Avg avg = searchResponse.getAggregations().get("single_avg_price");
  	  		System.out.println("福特(ford)汽車平均價格：" + avg.getValue());
  	  		
  	  		Global global = searchResponse.getAggregations().get("all");
  	  		Avg allAvg = global.getAggregations().get("avg_price");
  	  		System.out.println("所有汽車平均價格：" + allAvg.getValue());
		} catch (Exception e) {
			e.printStackTrace();
		}
  	}

ElasticSearch5.X搜尋條件的聚合（六）

範圍限定的聚合編輯

全域性桶編輯

ElasticSearch5.X搜尋條件的聚合（六）

從PRISM開始學WPF（六）MVVM（三）事件聚合器EventAggregator？

Webpack 4.X 從入門到精通 - 第三方庫（六）

ElasticSearch最佳入門實踐（六）案例實戰之電商網站商品管理：多種搜尋方式

【遊戲開發】關於Direct X（六）繪製蝙蝠著色器

Cocos2d-x學習筆記（六）例項——多層佈景

從頭開始寫專案Makefile（六）：引數傳遞、條件判斷、include

（六）springboot + mybatis plus實現多表聯查分頁3.X版本

圖解演算法學習筆記（六）：廣度優先搜尋

pandas系列學習（六）：資料聚合

Spring Boot 2.x（六）：優雅的統一返回值

Vue（六）：條件與循環

Vue（六）：條件與迴圈

《Linux系統》之"皮毛系列"（六）檔案搜尋相關命令

Hadoop入門進階步步高（六）-Hadoop1.x與Hadoop2的區別

分散式搜尋elasticsearch java API 之（六）------批量新增刪除索引

elasticsearch5.x系列之四（索引模板的使用，詳細得不要不要的）

Elasticsearch（六）瞭解全文搜尋

遍歷聚合物件中的元素——迭代器模式（六）

ElasticStack學習（六）：ElasticSearch搜尋初探

ElasticSearch5.X搜尋條件的聚合（六）

範圍限定的聚合編輯

全域性桶編輯

相關推薦