MongoDB中索引的建立和使用詳解

來源:互聯網
上載者:User

標籤:tar   tree   res   隨筆   struct   空間   提高   效率   word   

索引通常能夠極大的提高查詢的效率。在系統中使用查詢時,應該考慮建立相關的索引。在MongoDB中建立索引相對比較容易。

mongodb中的索引在概念上和大多數關係型資料庫如MySQL是一樣的。當你在某種情況下需要在MySQL中建立索引,這樣的情景同樣適合於MongoDB。

基本操作

索引是一種資料結構,他搜集一個集合中文檔特定欄位的值。MongoDB的查詢最佳化工具能夠使用這種資料結構來快速的對集合(collection)中的文檔(collection)進行尋找和排序.準確來說,這些索引是通過B-Tree索引來實現的。

在命令列中,可以通過調用ensureIndex()函數來建立索引,該函數指定一個到多個需要索引的欄位。沿用在前面的隨筆中的例子,我們再things集合中的j欄位上建立索引:

  1. > db.things.ensureIndex({j:1}) 

EnsureIndex()函數自是在索引不存在的情況下才會建立。

一旦集合在某一個欄位上建立索引後,對該欄位的隨機查詢的訪問速度會很快。如果沒有索引,MongoDB會在遍曆所有的索引值對,然後去對應檢查相關的欄位。

  1. > db.things.find({j:2}); //在建立了索引的欄位上查詢,速度快  
  2.  
  3. { "_id" : ObjectId("4e24433dcac1e3490b9033be"), "x" : 4, "j" : 2 }  
  4.  
  5. > db.things.find({x:3});//在未建立索引的欄位上查詢,需要逐個欄位匹配,速度慢  
  6.  
  7. { "_id" : ObjectId("4e244315cac1e3490b9033bc"), "x" : 3 } 

通過在命令列中輸入getIndexs()能夠查看當前集合中的所有索引。

  1. > db.things.getIndexes()  
  2.  
  3. [  
  4.  
  5. {  
  6.  
  7. "name" : "_id_",  
  8.  
  9. "ns" : "things.things",  
  10.  
  11. "key" : {  
  12.  
  13. "_id" : 1  
  14.  
  15. },  
  16.  
  17. "v" : 0  
  18.  
  19. },  
  20.  
  21. {  
  22.  
  23. "_id" : ObjectId("4e244382cac1e3490b9033d0  
  24.  
  25. "ns" : "things.things",  
  26.  
  27. "key" : {  
  28.  
  29. "j" : 1  
  30.  
  31. },  
  32.  
  33. "name" : "j_1",  
  34.  
  35. "v" : 0  
  36.  
  37. }  
  38.  

通過db.system.indexes.find()能夠返回當前資料庫中的所有索引

  1. > db.system.indexes.find()  
  2.  
  3. { "name" : "_id_", "ns" : "things.things", "key" : { "_id" : 1 }, "v" : 0 }  
  4.  
  5. { "_id" : ObjectId("4e244382cac1e3490b9033d0"), "ns" : "things.things", "key" :{ "j" : 1 }, "name" : "j_1", "v" : 0 } 

預設索引

對於每一個集合(除了capped集合),預設會在_id欄位上建立索引,而且這個特別的索引不能刪除。_id欄位是強制唯一的,由資料庫維護。

嵌套關鍵字

在MongoDB中,甚至能夠在一個嵌入的文檔上(embedded)建立索引.

  1. > db.things.ensureIndex({"address.city":1}) 

文檔作為索引

任何類型,包括文檔(document)都能作為索引:

  1. > db.factories.insert({name:"xyz",metro:{city:"New York",state:"NY"}});  
  2.  
  3. > db.factories.ensureIndex({metro:1});  
  4.  
  5. > db.factories.find({metro:{city:"New York",state:"NY"}});//能夠利用索引進行查詢  
  6.  
  7. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : < 
  8.  
  9. { "city" : "New York", "state" : "NY" } }  
  10.  
  11. > db.factories.find({metro:{$gte:{city:"New York"}}});//能夠利用索引進行查詢  
  12.  
  13. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  14.  
  15. > db.factories.find({metro:{state:"NY",city:"New York"}})//不能夠返回結果,欄位的順序不對 

建立文檔索引的一個替代方法是建立複合索引,例如:

  1. > db.factories.ensureIndex({"metro.city":1,"metro.state":1})  
  2.  
  3. > db.factories.find({"metro.city":"New York","metro.state":"NY"});  
  4.  
  5. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  6.  
  7. > db.factories.find({"metro.city":"New York"});  
  8.  
  9. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  10.  
  11. > db.factories.find().sort({"metro.city":1,"New York":1});  
  12.  
  13. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  14.  
  15. > db.factories.find().sort({"metro.city":1});  
  16.  
  17. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } } 

組合關鍵字索引

除了基本的以單個關鍵字作為索引外,MongoDB也支援多個關鍵字的複合式索引,和基本的索引一樣,也是用ensureIndex()函數,該函數可以指定多個鍵。

  1. > db.things.ensureIndex({j:1,name:-1}) 

當建立索引時,鍵後面的數字表明了索引的方向,取值為1或者-1,1表示升序,-1表示降序。升序或者降序在隨機訪問的時候關係不大,當時在做排序或者範圍查詢的時候就很重要了。

如果在建立了a,b,c這樣一個複合索引,那麼你可以在a,A,b和a,b,c上使用索引查詢。

 

 

 

稀疏索引

和疏鬆陣列類似,稀疏索引就是索引至包含被索引欄位的文檔。

任何一個稀疏的缺失某一個欄位的文檔將不會儲存在索引中,之所以稱之為稀疏索引就是說缺失欄位的文檔的值會丟失。

稀疏索引的建立和完全索引的建立沒有什麼不同。使用稀疏索引進行查詢的時候,某些由於缺失了欄位的文檔記錄可能不會被返回,這是由於稀疏索引子返回被索引了的欄位。可能比較難以理解,不過看幾個例子就好理解了。

  1. > db.people.ensureIndex({title:1},{sparse:true}) //在title欄位上建立稀疏索引  
  2.  
  3. > db.people.save({name:"Jim"})  
  4.  
  5. > db.people.save({name:"yang",title:"prince"})  
  6.  
  7. > db.people.find();  
  8.  
  9. { "_id" : ObjectId("4e244dc5cac1e3490b9033d7"), "name" : "Jim" }  
  10.  
  11. { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }  
  12.  
  13. > db.people.find().sort({title:1})//自有包含有索引欄位的記錄才被返回  
  14.  
  15. { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }  
  16.  
  17. > db.people.dropIndex({title:1})//刪除稀疏索引之後,所有的記錄均顯示  
  18.  
  19. { "nIndexesWas" : 2, "ok" : 1 }  
  20.  
  21. > db.people.find().sort({title:1})  
  22.  
  23. { "_id" : ObjectId("4e244dc5cac1e3490b9033d7"), "name" : "Jim" }  
  24.  
  25. { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" } 

唯一索引

MongoDB支援唯一索引,這使得不能插入在唯一索引項目上已經存在的記錄。例如,要保證firstname和lastname都是唯一的,命令如下

 

  1. > db.things.ensureIndex({firstname:1,lastname:1},{unique:true}) 

缺失的鍵

當一個文檔以唯一索引的方式儲存到集合中去的時候,任何缺失的索引欄位都會一null值代替,因此,不能在唯一索引上同時插入兩條預設的記錄。如下:

  1. >db.things.ensureIndex({firstname: 1}, {unique: true});  
  2.  
  3. >db.things.save({lastname: "Smith"});  
  4.  
  5. >db.things.save({lastname: "Jones"});// 會產生錯誤,因為firstname會有兩個null. 

重複值:

唯一索引不能夠建立在具有重複值的鍵上,如果你一定要在這樣的鍵上建立,那麼想系統將儲存第一條記錄,剩下的記錄會被刪除,只需要在建立索引的時候加上dropDups這個可選項即可

  1. >db.things.ensureIndex({firstname : 1}, {unique : true, dropDups : true})  
  2.  
  3. Dropping Indexes 

刪除一個特定集合上的索引:

  1. >db.collection.dropIndexes(); 

刪除集合中的某一個索引:

  1. db.collection.dropIndex({x: 1, y: -1}) 

也可以直接執行命令進性刪除

  1. db.runCommand({dropIndexes:‘foo‘, index : {y:1}})//刪除集合foo中{y:1}的索引  
  2.  
  3. // remove all indexes:  
  4.  
  5. db.runCommand({dropIndexes:‘foo‘, index : ‘*‘})//刪除集合foo中所有的索引 

重建索引:

可以所用如下命令重建索引:

  1. db.myCollection.reIndex()  
  2.  
  3. // same as:  
  4.  
  5. db.runCommand( { reIndex : ‘myCollection‘ } ) 

通常這是不必要的,但是在集合的大小變動很大及集合在磁碟空間上佔用很多空間時重建索引才有用。對於大資料量的集合來說,重建索引可能會很慢。

註:

MongoDB中索引是大小寫敏感的。

當更新對象是,只有在索引上的這些key發生變化時才會更新。著極大地提高了效能。當對象增長了或者必須移動時,所有的索引必須更新,這回很慢 。

索引資訊會儲存在system.indexes 集合中,運行 db.system.indexes.find() 能夠看到這些樣本資料。

索引的欄位的大小有最大限制,目前接近800 bytes. 可在大於這個值的欄位上建立索引是可以的,但是該欄位不會被索引,這種限制在以後的版本中可能被移除。

索引的效能

索引使得可以通過關鍵字段擷取資料,能夠使得快速查詢和更新資料。

但是,必須注意的是,索引也會在插入和刪除的時候增加一些系統的負擔。往集合中插入資料的時候,索引的欄位必須加入到B-Tree中去,因此,索引適合建立在讀遠多於寫的資料集上,對於寫入頻繁的集合,在某些情況下,索引反而有副作用。不過大多數集合都是讀頻繁的集合,所以集合在大多數情況下是有用的。

使用sort()而不需要索引

如果資料集合比較小(通常小於4M),使用sort()而不需要建立索引就能夠返回資料。在這種情況下,做好聯合使用limit()和sort()。

MongoDB中索引的建立和使用詳解

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.