MongoDB中的索引其實類似於關係型資料庫,都是為了提高查詢和排序的效率的,並且實現原理也基本一致。由於集合中的鍵(欄位)可以是普通資料類型,也可以是子文檔。MongoDB可以在各種類型的鍵上建立索引。下面分別講解各種類型的索引的建立,查詢,以及索引的維護等。
系列目錄
MongoDB學習筆記(一) MongoDB介紹及安裝
MongoDB學習筆記(二) 通過samus驅動實現基本資料操作
MongoDB學習筆記(三) 在MVC模式下通過Jqgrid表格操作MongoDB資料
MongoDB學習筆記(四) 用MongoDB的文檔結構描述資料關係
MongoDB學習筆記(五) MongoDB檔案存取操作
MongoDB學習筆記(六) MongoDB索引用法和效率分析
一、建立索引
1. 預設索引
MongoDB有個預設的“_id”的鍵,他相當於“主鍵”的角色。集合建立後系統會自動建立一個索引在“_id”鍵上,它是預設索引,索引名叫“_id_”,是無法被刪除的。我們可以通過以下方式查看:
var _idIndex = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_id_");Console.WriteLine(_idIndex);
2. 單列索引
在單個鍵上建立的索引就是單列索引,例如我們要在“UserInfo”集合上給“UserName”鍵建立一個單列索引,文法如下:(1表示正序,-1逆序)
mongoCollection.Metadata.CreateIndex(new Document { { "UserName", 1 } }, false);
接著,我們用同樣方法尋找名為“_UserName_”的索引
var _UserName_Index = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_UserName_");Console.WriteLine(_UserName_Index);
3.複合式索引
另外,我們還可以同時對多個鍵建立複合式索引。如下代碼建立了按照“UserId”正序,“UserName”逆序的複合式索引:
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 }, { "UserName", -1 } }, false);
4.子文檔索引
我們可以對文件類型的鍵建立各種索引,例如單列索引,如下建立使用者詳細資料“Detail”的單列索引:
mongoCollection.Metadata.CreateIndex(new Document { { "Detail", 1 } }, false);
對子文檔的鍵建立複合式索引:例如在“Detail.Address”和“Detail.Age”上建立複合式索引:
mongoCollection.Metadata.CreateIndex(new Document { { "Detail.Address", 1 }, { "Detail.Age", -1 } }, false);
5.唯一索引
唯一索引限制了對當前鍵添加值時,不能添加重複的資訊。值得注意的是,當文檔不存在指定鍵時,會被認為索引值是“null”,所以“null”也會被認為是重複的,所以一般被作為唯一索引的鍵,最好都要有索引值對。
對“UserId”建立唯一索引(這時候最後一個參數為“true”):
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 } }, true);
二、維護索引
1. 查詢索引
通過索引名查詢的方式已有介紹。但有時候,我們可能忘記了索引名,怎麼查詢呢?
下面提供一個遍曆全部索引的方法,列印全部索引資訊:
foreach (var index in mongoCollection.Metadata.Indexes) { Console.WriteLine(index.Value);}
輸出結果樣本:
{ "name": "_id_", "ns": "myDatabase.UserInfo", "key": { "_id": 1 } }{ "name": "_UserId_unique_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1 }, "unique": true, "_id": "4d8f406ab8a4730b78000005" }{ "name": "_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserName": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000006" }{ "name": "_Detail.Address_Detail.Age_", "ns": "myDatabase.UserInfo", "key": { "Detail.Address": 1, "Detail.Age": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000007" }{ "name": "_UserId_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1, "UserName": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000008" }{ "name": "_Detail_", "ns": "myDatabase.UserInfo", "key": { "Detail": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000009" }
可見,集合的索引也是通過一個集合來維護的。name表示索引名,ns表示索引屬於哪個庫哪個集合,key表示索引在哪個鍵上,正序還是逆序,unique表示是否為唯一索引,等等...
2. 刪除索引
新手常陷入的誤區是,認為集合被刪除,索引就不存在了。關係型資料庫中,表被刪除了,索引也不會存在。在MongoDB中不存在刪除集合的說法,就算集合資料清空,索引都是還在的,要移除索引還需要手工刪除。
例如,刪除名為“_UserName_”的索引:
mongoCollection.Metadata.DropIndex("_UserName_");
下面提供刪除除預設索引外其他全部索引的方法:
public void DropAllIndex(){ var listIndexes = mongoCollection.Metadata.Indexes.ToList(); for (int i = 0; i < listIndexes.Count; i++) { if (listIndexes[i].Key != "_id_") { mongoCollection.Metadata.DropIndex(listIndexes[i].Key); } }}
三、索引的效率
MongoDB的索引到底能不能提高查詢效率呢?我們在這裡通過一個例子來測試。比較同樣的資料在無索引和有索引的情況下的查詢速度。
首先,我們通過這樣一個方法插入10W條資料:
public void InsertBigData(){ var random = new Random(); for (int i = 1; i < 100000; i++) { Document doc = new Document(); doc["ID"] = i; doc["Data"] = "data" + random.Next(100000); mongoCollection.Save(doc); } Console.WriteLine("當前有" + mongoCollection.FindAll().Documents.Count() + "條資料");}
然後,實現一個方法用來建立索引:
public void CreateIndexForData(){ mongoCollection.Metadata.CreateIndex(new Document { { "Data", 1 } }, false);}
還有排序的方法:
public void SortForData(){ mongoCollection.FindAll().Sort(new Document { { "Data", 1 } });}
運行測試代碼如下:
static void Main(string[] args){ IndexBLL indexBll = new IndexBLL(); indexBll.DropAllIndex(); indexBll.DeleteAll(); indexBll.InsertBigData(); Stopwatch watch1 = new Stopwatch(); watch1.Start(); for (int i = 0; i < 1; i++) indexBll.SortForData(); Console.WriteLine("無索引排序執行時間:" + watch1.Elapsed); indexBll.CreateIndexForData(); Stopwatch watch2 = new Stopwatch(); watch2.Start(); for (int i = 0; i < 1; i++) indexBll.SortForData(); Console.WriteLine("有索引排序執行時間:" + watch2.Elapsed);}
最後執行程式查看結果:
多次測試表明在有索引的情況下,查詢效率要高於無索引的效率。
作者:李盼(Lipan)
出處:[Lipan] (http://www.cnblogs.com/lipan/)
著作權聲明:本文的著作權歸作者與部落格園共有。轉載時須註明本文的詳細連結,否則作者將保留追究其法律責任。