mongodb系列（一）mongoose find普通查詢與aggregate聚合查詢的簡單效能對比

阿新 • • 發佈：2020-11-04

背景

mongodb 3.4，使用預設的配置（沒有調整記憶體限制或其他效能配置），資料庫有90萬+條資料

開始實驗

以下分別使用 find 查詢和 aggregate 聚合查詢

以下為dao層（server/dao/cmsResourceDao.js），基於mongoose查詢mongodb

getModel(){
return mongoose.model(this.model_name); //model_name 為collection名稱
}
/***
* 使用find 查詢，並且是分頁查詢
* @param limit_param 條件
* @param page_index 資料頁碼起始下標
* @param page_size 資料每頁數量
* @param sort 排序條件
* @returns {Promise.<{rows: *, total_count: *}>}
*/
async listPage(limit_param,page_index,page_size,sort){
let rows;
if(sort != null){
rows = await this.getModel().where(limit_param).skip(Number(page_index)).limit(Number(page_size)).sort(sort).exec();
}else{
rows = await this.getModel().where(limit_param).skip(Number(page_index)).limit(Number(page_size)).exec();
}
return {rows};
}
/***
* 使用aggregate聚合查詢，並且是分頁查詢
* @param limit_param 條件
* @param page_index 資料頁碼起始下標
* @param page_size 資料每頁數量
* @param sort 排序條件
* @returns {Promise.<{rows: *, total_count: *}>}
*/
async listAggregatePage(limit_param,page_index,page_size,sort){
let aggregate_limit = [{$match:limit_param},
{$skip:Number(page_index)},
{$limit:Number(page_size)}];
if(sort != null)aggregate_limit.push({$sort:sort});
let rows = await this.getModel().aggregate(aggregate_limit);
return {rows};
}

1.find查詢和aggregate查詢（不使用sort排序）

以下為使用find查詢50000條資料返回：

async list(ctx,next){
console.log('list!!!');
let type = ctx.request.query.type;
let page_index = ctx.request.query.page_index;
let page_size = ctx.request.query.page_size;
let where = {};
if(type != null)where.type = type;
let start_time = new Date().getTime();
let result = await dao.listPage(where,page_index,page_size);
// let result = await dao.listAggregatePage(where,page_index,page_size); //使用聚合查詢方式
let end_time = new Date().getTime();
console.log('查詢時間：');
console.log(end_time - start_time);
ctx.body = {
data : result,
time : new Date().getTime() - start_time
}
}

列印的時間是：8504ms

使用aggregate查詢50000條資料返回：

async list(ctx,next){
console.log('list!!!');
let type = ctx.request.query.type;
let page_index = ctx.request.query.page_index;
let page_size = ctx.request.query.page_size;
let where = {};
if(type != null)where.type = type;
let start_time = new Date().getTime();
// let result = await dao.listPage(where,page_index,page_size);
let result = await dao.listAggregatePage(where,page_index,page_size); //使用聚合查詢方式
let end_time = new Date().getTime();
console.log('查詢時間：');
console.log(end_time - start_time);
ctx.body = {
data : result,
time : new Date().getTime() - start_time
}
}

列印的時間是：2241ms

2.find查詢和aggregate查詢（使用sort排序）

使用sort排序挑戰效能極限

在剛才使用find查詢，新增sort條件

let result = await dao.listPage(where,page_index,page_size,{updated_at:-1});

結果控制檯報出，記憶體超出限制（最大值為 33554432 bytes 摺合為 32mb左右）：

service error { MongoError: Executor error during find command: OperationFailed: Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit.

使用aggregate查詢，新增sort條件

let result = await dao.listAggregatePage(where,page_index,page_size,{updated_at:-1}); //使用聚合查詢方式

列印的時間是：2298ms

那麼aggregate查詢的記憶體最大值究竟有多少呢？再玩大的，這次查詢10萬條

service error { MongoError: Sort exceeded memory limit of 104857600 bytes, but did not opt in to external sorting. Aborting operation. Pass allowDiskUse:true to opt in.

由此可見 aggregate對排序也是有記憶體限制的（最大值為104857600 bytes摺合為100mb左右）

總結

從查詢的速度看，aggregate效率更勝一籌。

從記憶體限制看，aggregate比find更高一點。

從上述實驗中，aggregate 好像比 find 查詢更勝一籌，但並不意味著 aggregate就是最好的，初步判斷這是由於aggregate更消耗記憶體換取查詢的速度。下一集，再深層次挖掘兩者區別

PS: 原始碼已提交到github

https://github.com/rcjjian/big_data_lab

mongodb系列（一）mongoose find普通查詢與aggregate聚合查詢的簡單效能對比

背景 mongodb 3.4，使用預設的配置（沒有調整記憶體限制或其他效能配置），資料庫有90萬+條資料

web爬蟲系列（一）- 爬取電影天堂迅雷地址

一、爬蟲介紹目前爬蟲框架層出不窮，當然很多公司也會根據自己的業務做二次開發，Java的有WebMagic和WebCollector等，Python的有PySpider和Scrapy等。不能說孰好孰壞，只能說根據自己的業務場景選擇不同框架，Pytho

Flink 系列（一）—— Flink 核心概念綜述

一、Flink 簡介 Apache Flink 誕生於柏林工業大學的一個研究性專案，原名 StratoSphere 。2014 年，由 StratoSphere 專案孵化出 Flink，並於同年捐贈 Apache，之後成為 Apache 的頂級專案。2019 年 1 年，阿里巴巴收

Kafka 系列（一）—— Kafka 簡介

一、簡介 ApacheKafka 是一個分散式的流處理平臺。它具有以下特點：支援訊息的釋出和訂閱，類似於 RabbtMQ、ActiveMQ 等訊息佇列；

ZooKeeper系列（一）—— ZooKeeper 簡介及核心概念

一、Zookeeper簡介 Zookeeper 是一個開源的分散式協調服務，目前由 Apache 進行維護。Zookeeper 可以用於實現分散式系統中常見的釋出/訂閱、負載均衡、命令服務、分散式協調/通知、叢集管理、Master 選舉、分散式鎖和

Hadoop 系列（一）—— 分散式檔案系統 HDFS

一、介紹 HDFS （Hadoop Distributed File System）是 Hadoop 下的分散式檔案系統，具有高容錯、高吞吐量等特性，可以部署在低成本的硬體上。

HBase 系列（一）—— HBase 簡介

一、Hadoop的侷限 HBase 是一個構建在 Hadoop 檔案系統之上的面向列的資料庫管理系統。

Spark 系列（一）—— Spark 簡介

一、簡介 Spark 於 2009 年誕生於加州大學伯克利分校 AMPLab，2013 年被捐贈給 Apache 軟體基金會，2014 年 2 月成為 Apache 的頂級專案。相對於 MapReduce 的批處理計算，Spark 可以帶來上百倍的效能提升，因此它成

Storm 系列（一）—— Storm和流處理簡介

一、Storm 1.1 簡介 Storm 是一個開源的分散式實時計算框架，可以以簡單、可靠的方式進行大資料流的處理。通常用於實時分析，線上機器學習、持續計算、分散式 RPC、ETL 等場景。Storm 具有以下特點：

Scala 系列（一）—— Scala 簡介及開發環境配置

一、Scala簡介 1.1 概念 Scala 全稱為 Scalable Language，即“可伸縮的語言”，之所以這樣命名，是因為它的設計目標是希望伴隨著使用者的需求一起成長。Scala 是一門綜合了面向物件和函式語言程式設計概念的靜態型別

Kafka系列（一）基本概念（概述、設計、叢集）

1、概述 Kafka是一種訊息中介軟體。舉個例子，一個網站在使用者進行註冊的時候，後臺的操作包括髮送郵箱、寫入使用者表、寫入日誌等等，但是一般都不會等這些完全處理完才告訴你註冊成功。這一系列的操作通常是非同步

KatalonRecorder系列（一）：基本使用+XPath元素定位

一、簡介 Katalon Recorder是基於selenium的瀏覽器外掛，支援火狐和chrome。可以錄製web上的操作並回放，還能匯入匯出指令碼。

Mybatis系列（一）：mybatis的入門

Mybatis是一款優秀的持久層框架，它支援自定義sql，儲存過程以及高階對映，幾乎不需要任何的JDBC程式碼以及設定引數和獲取結果集的工作。接下來看一下Mybatis的基本使用。

MSSQL系列（一）：資料庫的相關操作（增刪改查）

1.建立資料庫 --建立資料庫 create database stuDb on primary ( --表示屬於primary檔案組 name=\'stuDb\', --邏輯名稱

NoSQL資料庫-MongoDB 學習（一）

基本介紹 MongoDB 是為了快速開發網際網路 Web 應用而設計的資料庫系統 MongoDB 的設計目標是極簡、靈活、作為 Web 應用棧的一部分

SpringBoot系列（一）

SpringBoot簡述目錄SpringBoot簡述一. 什麼是SpringBoot？二. Springboot的特點三. SpringBoot核心註解四. 其他註解Ⅰ. Conditional的組合註解Ⅱ. @ConfigurationProperties五. 啟動原理（自動配置）

資料處理與分析實戰小案例系列（一）

本節目錄菸草掃碼資料統計實戰一、菸草掃碼資料統計條碼庫.xls 掃碼.xlsx scan_code_stat.py

Spring Boot系列（一）：Spring Boot快速開始

一、Spring Boot介紹　　Spring Boot可以很容易的建立可直接執行的獨立的基於Spring的應用程式。

spring 事物系列（一）事物的使用

一、使用方法 1、通過在xml中進行配置 //注入事物管理器 <bean id=\"transactionManager\" class=\"org.springframework.jdbc.datasource.DataSourceTransactionManager\">

PouchDB基礎系列（一）

寫在前面：　　公司的一個專案是用到PouchDB，這是我第一次接觸這個庫，為了上手專案，所以對PouchDB的基礎進行了學習，這個系列是簡單記錄PouchDB的常用API。

mongodb系列（一）mongoose find普通查詢與aggregate聚合查詢的 簡單效能對比

背景

開始實驗

1.find查詢和aggregate查詢（不使用sort排序）

2.find查詢和aggregate查詢（使用sort排序）

總結

相關推薦

mongodb系列（一）mongoose find普通查詢與aggregate聚合查詢的簡單效能對比