1. 程式人生 > >MongoDB的分組統計 group

MongoDB的分組統計 group

https://www.cnblogs.com/zhangzxl/p/4079641.html

mongodb中的分組聚合用$group,而且處理的最大資料量為100M如果超出需要寫入到磁碟,使用格式如下:

1

{ $group: { _id: <expression>, <field1>: { <accumulator1> : <expression1> }, ... } }

  其中_id屬性是必須要有的,目的是用來指定分組的欄位或依據,field1為自定義欄位,accumulator為累加器,下面以統計每天使用者註冊數為列

1

2

3

4

5

6

7

8

9

10

11

12

db.user.aggregate([

    {

        $group:{

            _id:{

                

year:{$year:{$add:["$time",28800000]}},//time為註冊時間 $year表示獲取年份,用add是因為mongodb存的是UTC時間需要增加8個小時

                month:{$month:{$add:["$time",28800000]}},//$month獲取月份

                

day:{$dayOfMonth:{$add:["$time",28800000]}}//$dayOfMonth獲取多少號

            }

            count:{$sum:1}//$sum為累計,1表示累加數

        }

    }

])

  如果只想註冊地區為四川的則在$goup前增加一個$match:

1

2

3

4

5

{

    $match:{

         location:"SiChuan"

    }

},

  以上兩個聚合操作的java實現方式:

複製程式碼

DBObject filterCond = new BasicDBObject();
filterCond.put("location", "SiChuan");
DBObject match = new BasicDBObject("$match", filterCond);

BasicDBList dateList = new BasicDBList();
dateList.add("$time");
dateList.add(28800000);//解決timezone 8小時時差
DBObject time = new BasicDBObject("$add", dateList);
DBObject group = new BasicDBObject(); 
DBObject groupDate = new BasicDBObject(); 
groupDate.put("year", new BasicDBObject("$year", time)); 
groupDate.put("month", new BasicDBObject("$month", time)); 
groupDate.put("day", new BasicDBObject("$dayOfMonth", time)); 
group.put("$group", new BasicDBObject("_id", groupDate));
AggregationOutput output = coll.aggregate(match, group); 
Iterator iterator = output.results().iterator();

複製程式碼

  更多的聚合操作請參見這》》》http://docs.mongodb.org/manual/reference/operator/aggregation-pipeline/