Mongodb中資料彙總之基本彙總函式count、distinct、group

來源:互聯網
上載者:User

標籤:

    在之前的文章<Mongodb中資料彙總之MapReduce>中,我們提到過Mongodb中進行資料彙總操作的一種方式——MapReduce,但是在大多數日常使用過程中,我們並不需要使用MapReduce來進行操作,不然有點殺雞用牛刀的感覺,在這邊文章中,我們就簡單說說用內建的彙總函式進行資料彙總操作的實現。


Mongodb中內建的基本彙總函式有三種:count、distinct和group。下面我們分別來講述一下這三個基本彙總函式。


(1)count

作用:簡單統計集合中符合某種條件的文檔數量。

使用方式:db.collection.count(<query>)或者db.collection.find(<query>).count()

參數說明:其中<query>是用於查詢的目標條件。如果出了想限定查出來的最大文檔數,或者想統計後跳過指定條數的文檔,則還需要藉助於limit,skip。

舉例:

db.collection.find(<query>).limit();

db.collection.find(<query>).skip();


(2)distinct

作用:用於對集合中的文檔針進行去重處理

使用方式:db,collection.distinct(field,query)

參數說明:field是去重欄位,可以是單個的欄位名,也可以是嵌套的欄位名;query是查詢條件,可以為空白;

舉例:

db.collection.distinct("user",{“age":{$gt:28}});//用於查詢年齡age大於28歲的不同使用者名稱

除了上面的用法外,還可以使用下面的另外一種方法:

db.runCommand({"distinct":"collectionname","key":"distinctfied","query":<query>})

collectionname:去重統計的集合名,distinctfield:去重欄位,,<query>是可選的限制條件;

舉例:


這兩種方式的區別:第一種方法是對第二種方法的封裝,第一種只返回去重統計後的欄位值集合,但第二種方式既返回欄位值集合也返回統計時的細節資訊。


(3)group

作用:用於提供比count、distinct更豐富的統計需求,可以使用js函數控制統計邏輯

使用方式:db.collection.group(key,reduce,initial[,keyf][,cond][,finalize])

備忘說明:在2.2版本之前,group操作最多隻能返回10000條分組記錄,但是從2.2版本之後到2.4版本,mongodb做了最佳化,能夠支援返回20000條分組記錄返回,如果分組記錄的條數大於20000條,那麼可能你就需要其他方式進行統計了,比如彙總管道或者MapReduce;


上面對Mongodb中內建的三種三種彙總函式進行了簡單的描述,並對需要注意的地方進行了簡單的說明,如果需要深入使用,可以進入Mongodb官網查看相關細節資訊,謝謝。



Mongodb中資料彙總之基本彙總函式count、distinct、group

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.