Elasticsearch 中如何巧妙地使用聚合函式達到資料庫中having的效果

阿新 • • 發佈：2019-02-12

在現實開發中難免會遇到一些業務場景，通過聚合得出相應的頻次並進行篩選

1.使用 minDocCount 直接上程式碼，大家可自行根據業務場景更改

//正確答案
SearchRequestBuilder search = transportlient.prepareSearch("bigdata_idx_2").setTypes("captureCompare");
FilterAggregationBuilder sub= AggregationBuilders.filter("channel_longitudeC").filter(QueryBuilders.rangeQuery("fcmp_time").from(startTime).to(endTime));
//分組欄位是id，排序由多個欄位排序組成
TermsBuilder tb= AggregationBuilders.terms("fcmp_fobj_id").field("fcmp_fobj_id").valueType(Terms.ValueType.STRING).order(Terms.Order.compound(
Terms.Order.aggregation("channel_longitudeC",false)//先按count，降序排
//如果count相等情況下，使用code的和排序
));
//求和欄位1
ValueCountBuilder sb= AggregationBuilders.count("channel_longitudeC");
tb.subAggregation(sb).minDocCount(400);//新增到分組聚合請求中

//將分組聚合請求插入到主請求體重
// search.setPostFilter()
search.addAggregation(tb);

2.稍微複雜些，還有另外一種場景，就是我聚合的同時，需要把其他相應的欄位資訊也同時返回出來 Top Hits Aggregation

類似SQL ： select *，count(*) from XXX group by a ......

SearchResponse response = null;
		SearchRequestBuilder responsebuilder = transportlient.prepareSearch("syrk_bigdata_capturecmp_passer_idx")
				.setTypes("captureCompare").setFrom(0).setSize(100000);
		AggregationBuilder aggregation = AggregationBuilders
				.terms("agg")
				.field("idNumb")
				.subAggregation(
						AggregationBuilders.topHits("top").setFrom(0)
								.setSize(1)).size(100000);
		response = responsebuilder.setQuery(QueryBuilders.boolQuery()
				.must(QueryBuilders.rangeQuery("fcapTime").from(Long.valueOf(startTime)).to(Long.valueOf(endTime))))
				.addSort("idNumb", SortOrder.ASC)
				.addAggregation(aggregation)// .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)
				.setExplain(true).execute().actionGet();
		SearchHits hits = response.getHits();//最後取結果時不要使用此hits 

		Terms agg = response.getAggregations().get("agg");
		long end = System.currentTimeMillis();
		System.out.println("ES run time： " + (end - start) + "ms");
		/**插入之前首先清除當天資料，以免重複新增**/
		SyrkRegionFcapperPasserStatistics temp = new SyrkRegionFcapperPasserStatistics();
		temp.setDate(Long.valueOf(startTime));
		try{
			syrkRegionFcapperPasserStatisticsService.deletePasser(temp);
			for (Terms.Bucket entry : agg.getBuckets()) {
				String key = (String) entry.getKey(); // bucket key
				long docCount = entry.getDocCount(); // Doc count
				
				// We ask for top_hits for each bucket
				TopHits topHits = entry.getAggregations().get("top");
				for (SearchHit hit : topHits.getHits().getHits()) {
					compareUuid= (String) hit.getSource().get("idNumb");
					
				}
				/** 讀取資料寫入mysql **/
			}
			logger.info("All Analysis Data has insert : date is "+startTime);
		}catch (Exception e){
			logger.info("Analysis Result Data failed ,date is "+startTime);
		}

聚合後的總數取相應的 docCount 其他欄位資訊從hits 中獲取

切記，不要取最外層的hits ，因為外層的hits 和聚合的hits數量會不一致，遍歷取回造成資料不一致

Elasticsearch 中如何巧妙地使用聚合函式達到資料庫中having的效果

在現實開發中難免會遇到一些業務場景，通過聚合得出相應的頻次並進行篩選1.使用 minDocCount 直接上程式碼，大家可自行根據業務場景更改//正確答案 SearchRequestBuilder search = transportlient.prepareSearch(

mybatis 聚合函式在檔案中如何對映及賦值實體類

記錄帖 //查詢語句必須寫別名 <select id="selectNewsByOrder" resultMap="BaseResultMap"> SELECT n.category,MAX(n.newstime) m FROM news n

巧妙地利用時間（js中的Date物件）來生成絕對不會重複的id

接著上一篇部落格說，本來利用nodejs，操作本地json檔案的時候，如果是新增的話，肯定是要給新增的資料一個唯一識別的id，我上網查了很多方法，說是用陣列什麼的方法，我覺得太複雜，後來我看到電腦右下角的時間，靈機一動，為什麼不利用js 中的 Date物件來生成

伺服器中勒索病毒解密恢復 SQL資料庫中勒索病毒解密恢復 SQL資料庫被加密恢復

前天接到一位客戶求救說幾臺伺服器都中招了，這個也很常見了。客戶發來加密的MDF後，我們使用資料庫修復軟體任何一款都沒能掃描出資料,winhex開啟檔案看全被加密。經過分析此加密方式不是AES加密。完全可以破解演算法開發解密工具直接解密檔案。下圖是解密後的直接附加檢測完全沒問題。

將DataTable中的資料一次性提交到資料庫中

實現功能的核心程式碼 SqlConnection destinationConnection = new SqlConnection(connectionString);destinationConnection.Open(); SqlBulkCopy bulkCopy = ne

C++中帶有預設引數的宣告和定義。Qt中重寫預設建構函式。C++中函式呼叫時實參個數和函式定義時的形參個數不一致時的處理。

1、Qt中自動生成的建構函式（1）Qt中自動生成的建構函式的宣告 class Chat : public QWidget { Q_OBJECT public: explicit Chat(QWidget *parent = 0); //宣告建構函式，可以帶有初始值“=0”

如何將datagridview中修改的資料同步到資料庫中

C#WINFORM問題DATAGRIDVIEW中COMBOBOX選項改變觸發事件用哪個方法C#WINFORM問題DATAGRIDVIEW中COMBOBOX選項改變觸發事件用哪個方法C#WINFORM問題DATAGRIDVIEW中COMBOBOX選項改變觸發事件用哪個方法C#W

SQL中的where條件，在資料庫中提取與應用淺析

1 問題描述一條SQL，在資料庫中是如何執行的呢？相信很多人都會對這個問題比較感興趣。當然，要完整描述一條SQL在資料庫中的生命週期，這是一個非常巨大的問題，涵蓋了SQL的詞法解析、語法解析、許可權檢查、查詢優化、SQL執行等一系列的步驟，簡短的篇幅是絕對無

sql server中返回 result table 函式的倆中寫法

1，直接返回表結構資料 USE [CmxSystem] GO /****** Object: UserDefinedFunction [dbo].[Fun_CarsTransferList] Script Date: 2018/10/31 星期三 19:21:50

轉: SQL中的where條件，在資料庫中提取與應用淺析

SQL中的where條件，在資料庫中提取與應用淺析 http://hedengcheng.com/?p=577 1問題描述　　一條SQL，在資料庫中是如何執行的呢？相信很多人都會對這個問題比較感興趣。當然，要完整描述一條SQL在資料庫中的生命週期，這是一個非常巨大的問題，涵蓋了SQL的詞法解析、語

織夢繫統dedecms中一篇文章存放在資料庫中的哪些表中

一篇文章內容分別放在兩張表中，一張是他的主表,該主表是通用的 dede_archives , 另一張是附件表 dede_addonXXX. 預設包括： dede_addonarticle 文章附件表 dede_addonimages 圖片附件表 dede_

c#向SQL Server中儲存圖片並且再從資料庫中讀取圖片

前言資料庫課程設計答辯時，老師提出瞭如果資料是圖片或者其他檔案型別的時候，頓時覺得自己做的管理系統用到的較多的就是Char型別。於是，答辯結束後，就蒐集資料學習，在查詢資料的時候發現，有的一開始並不能看懂，找到一篇文件，自己做了一個測試，然後發現出現了一點小

按照一定的規格將XML檔案中的內容批量匯入至資料庫中

一、前臺點選按鈕 <li> asp:Button ID="ImportMember" runat="server" CssClass="btn btn-primary" Text="匯入會員" /> </li> 二、後臺按鈕宣告、編

將Excel中的資料匯入到oracle資料庫中

對於資料庫中的一張表,進行資料的批量新增,有幾種方法? 第一種:寫拼接sql. 第二種:程式讀取呼叫資料庫插入. 第三種:儲存過程. 第四種:一個個sql新增. 第五種:使用plsql客戶端進行新增. 第N種…… 那麼這裡介紹的就是使用plsql進

php 中幾種while迴圈輸出資料庫中的資料程式碼

連線到一個 url 地址為localhost 、埠為 3306 的mysql伺服器上。 mysql伺服器的帳號是"root"，密碼是"9999" mysql 伺服器上有一個數據庫 ok ，資料庫裡有一個表 abc。表 abc 一共為兩列，列名分別是 "id" 和 "name" ，將 abc 裡

sqlserver 查詢當前資料庫中的所有使用者表,當前資料庫中所有列

查詢當前資料庫中的所有使用者表 select * from INFORMATION_SCHEMA.TABLESsp_helptext 'INFORMATION_SCHEMA.TABLES' 查詢當前資料庫中所有列 select * from INFORMATION_SCH

利用filter()函式，巧妙地去除Array中的重複元素

利用filter()函式，巧妙地去除Array中的重複元素題目出自廖雪峰老師的JavaScript教程：利用filter()函式，巧妙地去除Array中的重複元素： 'use strict'; var r; var arr = ['apple', 'strawberry', 'b

mysql資料庫中的函式

函式表示對輸入引數值返回一個具有特定關係的值，在mysql中使用函式可以極大的提高使用者對資料庫的管理效率。Mysql中的函式主要有數學函式，字串函式，日期函式，時間函式以及條件判斷函式、系統資訊函式和加密函式等。 1、流程控制函式 &nbs

簡單介紹 numpy中的聚合函式

簡單介紹 numpy中的聚合函式使用numpy之前先匯入numpy import numpy as np np.sum() //求和 np.prod() //所有元素相乘 np.mean() //平均值 np.std() //標準差 np.var() //方差 np.medi

Django中聚合函式，F表示式和Q表示式詳解

學習聚合函式的準備工作新建一個專案，在新建一個app，名字隨意，然後在app中的models中定義幾個模型： from django.db import models # Create your models here. class Author(models.Model):

Elasticsearch 中如何巧妙地使用聚合函式達到資料庫中having的效果

相關推薦