本文章先來給大家簡單介紹關於MongoDB 資料分頁和排序 limit,skip,sort使用者的一些基礎語句,然後用一個執行個體詳細介紹MongoDB 資料分頁和排序執行個體方法。
-
-
排序用sort,相當於order by,升序用1表示,降序用-1
比如,按age欄位升序排列:
代碼如下 複製代碼
db.user.find().sort({"age":1})
如果有多個欄位,按姓名降序,年齡升序
代碼如下 複製代碼
db.user.find().sort({"name":-1,"age":1})
limit和skip一起用,相當於mysql裡的limit:
代碼如下 複製代碼
b.user.find().skip(1).limit(1)
相當於mysql裡的limit(1,1),即跳過第0條,從第1條開始返回,只返回1條
skip和limit就能實現分頁,但是skip太多的話,會影響效能,應該盡量避免,比如說,擷取當前頁最後一個文檔的某個值作為條件(如日期)來查詢,就可以不用skip.
無論是採用什麼資料庫,通常都有一些常規的做分頁和排名的方法。本文就通過一些測試資料來向大家介紹MongoDB在這方面的效能。
分頁首先我們來做一個分頁,在MongoDB中樣本資料如下所未:
代碼如下 複製代碼
db.scores.find();
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 1, name: 'user_1'}
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 2, name: 'user_2'}
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 3, name: 'user_3'}
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 4, name: 'user_4'}
其中lid欄位用於區分不同的緯度,主要用在篩選上,在測試collection中,一共有五個不同的lid值,每一個對應1,200,000條資料,一共6,000,000條資料。索引在lid 和 score上。(下面的查詢能使用到索引)
然後我們進行下面的效能測試:
代碼如下 複製代碼
collection = Mongo::Connection.new.db('test').collection('scores')
Benchmark.bmbm do |x|
x.report("mongo small") do
100.times do |i|
collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => -1}).limit(20).skip(i * 20).to_a
end
end
x.report("mongo medium") do
100.times do |i|
collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => -1}).limit(20).skip(i * 1000).to_a
end
end
x.report("mongo large") do
100.times do |i|
collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => -1}).limit(20).skip(i * 10000).to_a
end
end
end
上面分別對skip條數比較小,中等大小和非常大三種情況進行了測試。而limit指定擷取的資料都一樣是20條。這三種情況下的測試結果分別是:0.6 秒, 17 秒,173 秒。
我們可以看到,對MongoDB來說,skip的大小嚴重影響效能,應該嚴格避免特別大的skip操作。
排名排名功能與分頁功能類似,不同的是排名是通過計算大於某個值的條數來做的。
比如:
代碼如下 複製代碼
//sql
select count(*) from scores where lid = $1 and score > $2
//mongo
db.scores.find({lid: lid, score: {$gt: score}}).count()
由於排名和分頁實現原理上類似,所以結果實際上差不多。測試結果如下:
mongo top rank 1.155847
mongo average 22.291007
結論上面做了對比,那麼本文要說一個什麼問題呢。
首先,在MongoDB中,盡量避免進行比較大的skip操作,比如在分頁中,如果你能知道需要擷取資料的上一條score是多少,那麼可能能夠用下面的方法來擷取你要的資料,而不是通過一次很大的skip操作。
db.scores.find({lid: lid, score: {$lt: last_score}}).sort({score: -1}).limit(20)另外,如果你需要進行比較大的skip操作或者count比較大的數量,那麼可以考慮採用Redis的Sorted Sets來做
更多詳細內容請查看:http://www.111cn.net/database/MongoDB/51017.htm