標籤:
在之前的文章<Mongodb中資料彙總之MapReduce>中,我們提到過Mongodb中進行資料彙總操作的一種方式——MapReduce,但是在大多數日常使用過程中,我們並不需要使用MapReduce來進行操作,不然有點殺雞用牛刀的感覺,在這邊文章中,我們就簡單說說用內建的彙總函式進行資料彙總操作的實現。
Mongodb中內建的基本彙總函式有三種:count、distinct和group。下面我們分別來講述一下這三個基本彙總函式。
(1)count
作用:簡單統計集合中符合某種條件的文檔數量。
使用方式:db.collection.count(<query>)或者db.collection.find(<query>).count()
參數說明:其中<query>是用於查詢的目標條件。如果出了想限定查出來的最大文檔數,或者想統計後跳過指定條數的文檔,則還需要藉助於limit,skip。
舉例:
db.collection.find(<query>).limit();
db.collection.find(<query>).skip();
(2)distinct
作用:用於對集合中的文檔針進行去重處理
使用方式:db,collection.distinct(field,query)
參數說明:field是去重欄位,可以是單個的欄位名,也可以是嵌套的欄位名;query是查詢條件,可以為空白;
舉例:
db.collection.distinct("user",{“age":{$gt:28}});//用於查詢年齡age大於28歲的不同使用者名稱
除了上面的用法外,還可以使用下面的另外一種方法:
db.runCommand({"distinct":"collectionname","key":"distinctfied","query":<query>})
collectionname:去重統計的集合名,distinctfield:去重欄位,,<query>是可選的限制條件;
舉例:
這兩種方式的區別:第一種方法是對第二種方法的封裝,第一種只返回去重統計後的欄位值集合,但第二種方式既返回欄位值集合也返回統計時的細節資訊。
(3)group
作用:用於提供比count、distinct更豐富的統計需求,可以使用js函數控制統計邏輯
使用方式:db.collection.group(key,reduce,initial[,keyf][,cond][,finalize])
備忘說明:在2.2版本之前,group操作最多隻能返回10000條分組記錄,但是從2.2版本之後到2.4版本,mongodb做了最佳化,能夠支援返回20000條分組記錄返回,如果分組記錄的條數大於20000條,那麼可能你就需要其他方式進行統計了,比如彙總管道或者MapReduce;
上面對Mongodb中內建的三種三種彙總函式進行了簡單的描述,並對需要注意的地方進行了簡單的說明,如果需要深入使用,可以進入Mongodb官網查看相關細節資訊,謝謝。
Mongodb中資料彙總之基本彙總函式count、distinct、group