前幾天看到一個關於 MongoDB 深入索引的PPT
MongoDB Indexing: The Details
仔細的從頭看到尾, 裡面有個關於Compound Indexes的Range and Equality的講解,在ppt第129頁,重新回顧下這個例子.向一個collection中插入 9 條資料,像下面這樣:
> db.good.find(){ "_id" : ObjectId("4e8d629d8ad8bdf2ed6c1990"), "x" : 1, "y" : "b" }{ "_id" : ObjectId("4e8d62a38ad8bdf2ed6c1991"), "x" : 3, "y" : "d" }{ "_id" : ObjectId("4e8d62ad8ad8bdf2ed6c1992"), "x" : 4, "y" : "g" }{ "_id" : ObjectId("4e8d62b28ad8bdf2ed6c1993"), "x" : 5, "y" : "c" }{ "_id" : ObjectId("4e8d62ba8ad8bdf2ed6c1994"), "x" : 6, "y" : "a" }{ "_id" : ObjectId("4e8d62c18ad8bdf2ed6c1995"), "x" : 7, "y" : "e" }{ "_id" : ObjectId("4e8d62ce8ad8bdf2ed6c1996"), "x" : 8, "y" : "c" }{ "_id" : ObjectId("4e8d62d38ad8bdf2ed6c1997"), "x" : 9, "y" : "f" }{ "_id" : ObjectId("4e8d719a6cee6416a5a75a43"), "x" : 5, "y" : "d" }
然後給x 和 y進行聯合索引
db.good.ensureIndex({x:1,y:1})
我們來進行這樣的尋找
> db.good.find({x:{$gte:4}, y:'c'}).explain(){"cursor" : "BtreeCursor x_1_y_1","nscanned" : 7,"nscannedObjects" : 2,"n" : 2,"millis" : 0,"nYields" : 0,"nChunkSkips" : 0,"isMultiKey" : false,"indexOnly" : false,"indexBounds" : {"x" : [[4,1.7976931348623157e+308]],"y" : [["c","c"]]}}
可以看出 nscanned 非常高! 而 n只有 2 .官網上有這樣一句話:
If nscanned is
much higher than nreturned,
the database is scanning many objects to find the target objects. Consider creating an index to improve this.
這裡nscanned可以認為是掃描的記錄數.n為返回的記錄數
讓我們配合PPT看下 nscanned:7是怎麼來的:
這是MongoDB的B-tree索引樹,因為x>=4 && y='c',所以先選擇左枝搜尋,左枝搜尋了4/g 和 5/c ,(5/c符合條件),然後搜尋 右枝 搜尋了 7/e, 6/a ,8/c, 9/f ,(8/c符合條件). 任何 符合的 x都要被check一下.
延伸:
看了PPT後到此結尾了, 真遇到這種情況,效率可不樂觀,於是稍微思考了下, y 在 這顆樹中只有兩個節點含有,也就是說 既然是 '與' 那就只要先把 y 篩選出來 ,搜尋次數就大大減半了 .
我們在 y 上再進行Basic Indexes 的建立.
db.good.ensureIndex({y:1})
這樣如果搜尋時會先 搜尋 y ,也就只有2次搜尋了.看下實際情況:
> db.good.find({x:{$gte:4}, y:'c'}).explain(){"cursor" : "BtreeCursor y_1","nscanned" : 2,"nscannedObjects" : 2,"n" : 2,"millis" : 0,"nYields" : 0,"nChunkSkips" : 0,"isMultiKey" : false,"indexOnly" : false,"indexBounds" : {"y" : [["c","c"]]}}
正如預料的一樣. 直接走 基本索引了.