MongoDB的分組統計 group
阿新 • • 發佈:2018-12-28
https://www.cnblogs.com/zhangzxl/p/4079641.html
mongodb中的分組聚合用$group,而且處理的最大資料量為100M如果超出需要寫入到磁碟,使用格式如下:
1 |
|
其中_id屬性是必須要有的,目的是用來指定分組的欄位或依據,field1為自定義欄位,accumulator為累加器,下面以統計每天使用者註冊數為列
1 2 3 4 5 6 7 8 9 10 11 12 |
year:{$year:{$add:[ "$time" , 28800000 ]}}, //time為註冊時間 $year表示獲取年份,用add是因為mongodb存的是UTC時間需要增加8個小時
day:{$dayOfMonth:{$add:[ "$time" , 28800000 ]}} //$dayOfMonth獲取多少號
|
如果只想註冊地區為四川的則在$goup前增加一個$match:
1 2 3 4 5 |
|
以上兩個聚合操作的java實現方式:
DBObject filterCond = new BasicDBObject(); filterCond.put("location", "SiChuan"); DBObject match = new BasicDBObject("$match", filterCond);
BasicDBList dateList = new BasicDBList(); dateList.add("$time"); dateList.add(28800000);//解決timezone 8小時時差 DBObject time = new BasicDBObject("$add", dateList);
DBObject group = new BasicDBObject(); DBObject groupDate = new BasicDBObject(); groupDate.put("year", new BasicDBObject("$year", time)); groupDate.put("month", new BasicDBObject("$month", time)); groupDate.put("day", new BasicDBObject("$dayOfMonth", time)); group.put("$group", new BasicDBObject("_id", groupDate));
AggregationOutput output = coll.aggregate(match, group); Iterator iterator = output.results().iterator();
更多的聚合操作請參見這》》》http://docs.mongodb.org/manual/reference/operator/aggregation-pipeline/