MongoDB中的索引其實類似於關係型資料庫,都是為了提高查詢和排序的效率的,並且實現原理也基本一致。由於集合中的鍵(欄位)可以是普通資料類型,也可以是子文檔。MongoDB可以在各種類型的鍵上建立索引。下面分別講解各種類型的索引的建立,查詢,以及索引的維護等。
一、建立索引
1. 預設索引
MongoDB有個預設的“_id”的鍵,他相當於“主鍵”的角色。集合建立後系統會自動建立一個索引在“_id”鍵上,它是預設索引,索引名叫“_id_”,是無法被刪除的。我們可以通過以下方式查看:
複製代碼 代碼如下:
var _idIndex = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_id_");
Console.WriteLine(_idIndex);
2. 單列索引
在單個鍵上建立的索引就是單列索引,例如我們要在“UserInfo”集合上給“UserName”鍵建立一個單列索引,文法如下:(1表示正序,-1逆序)
複製代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "UserName", 1 } }, false);
接著,我們用同樣方法尋找名為“_UserName_”的索引
複製代碼 代碼如下:
var _UserName_Index = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_UserName_");
Console.WriteLine(_UserName_Index);
3.複合式索引
另外,我們還可以同時對多個鍵建立複合式索引。如下代碼建立了按照“UserId”正序,“UserName”逆序的複合式索引:
複製代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 }, { "UserName", -1 } }, false);
4.子文檔索引
我們可以對文件類型的鍵建立各種索引,例如單列索引,如下建立使用者詳細資料“Detail”的單列索引:
複製代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "Detail", 1 } }, false);
對子文檔的鍵建立複合式索引:例如在“Detail.Address”和“Detail.Age”上建立複合式索引:
複製代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "Detail.Address", 1 }, { "Detail.Age", -1 } }, false);
5.唯一索引
唯一索引限制了對當前鍵添加值時,不能添加重複的資訊。值得注意的是,當文檔不存在指定鍵時,會被認為索引值是“null”,所以“null”也會被認為是重複的,所以一般被作為唯一索引的鍵,最好都要有索引值對。
對“UserId”建立唯一索引(這時候最後一個參數為“true”):
複製代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 } }, true);
二、維護索引
1. 查詢索引
通過索引名查詢的方式已有介紹。但有時候,我們可能忘記了索引名,怎麼查詢呢?
下面提供一個遍曆全部索引的方法,列印全部索引資訊:
複製代碼 代碼如下:
foreach (var index in mongoCollection.Metadata.Indexes)
{
Console.WriteLine(index.Value);
}
輸出結果樣本:
複製代碼 代碼如下:
{ "name": "_id_", "ns": "myDatabase.UserInfo", "key": { "_id": 1 } }
{ "name": "_UserId_unique_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1 }, "unique": true, "_id": "4d8f406ab8a4730b78000005" }
{ "name": "_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserName": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000006" }
{ "name": "_Detail.Address_Detail.Age_", "ns": "myDatabase.UserInfo", "key": { "Detail.Address": 1, "Detail.Age": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000007" }
{ "name": "_UserId_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1, "UserName": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000008" }
{ "name": "_Detail_", "ns": "myDatabase.UserInfo", "key": { "Detail": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000009" }
可見,集合的索引也是通過一個集合來維護的。name表示索引名,ns表示索引屬於哪個庫哪個集合,key表示索引在哪個鍵上,正序還是逆序,unique表示是否為唯一索引,等等...
2. 刪除索引
新手常陷入的誤區是,認為集合被刪除,索引就不存在了。關係型資料庫中,表被刪除了,索引也不會存在。在MongoDB中不存在刪除集合的說法,就算集合資料清空,索引都是還在的,要移除索引還需要手工刪除。
例如,刪除名為“_UserName_”的索引:
複製代碼 代碼如下:
mongoCollection.Metadata.DropIndex("_UserName_");
下面提供刪除除預設索引外其他全部索引的方法:
複製代碼 代碼如下:
public void DropAllIndex()
{
var listIndexes = mongoCollection.Metadata.Indexes.ToList();
for (int i = 0; i < listIndexes.Count; i++)
{
if (listIndexes[i].Key != "_id_")
{
mongoCollection.Metadata.DropIndex(listIndexes[i].Key);
}
}
}
三、索引的效率
MongoDB的索引到底能不能提高查詢效率呢?我們在這裡通過一個例子來測試。比較同樣的資料在無索引和有索引的情況下的查詢速度。
首先,我們通過這樣一個方法插入10W條資料:
複製代碼 代碼如下:
public void InsertBigData()
{
var random = new Random();
for (int i = 1; i < 100000; i++)
{
Document doc = new Document();
doc["ID"] = i;
doc["Data"] = "data" + random.Next(100000);
mongoCollection.Save(doc);
}
Console.WriteLine("當前有" + mongoCollection.FindAll().Documents.Count() + "條資料");
}
然後,實現一個方法用來建立索引:
複製代碼 代碼如下:
public void CreateIndexForData()
{
mongoCollection.Metadata.CreateIndex(new Document { { "Data", 1 } }, false);
}
還有排序的方法:
複製代碼 代碼如下:
public void SortForData()
{
mongoCollection.FindAll().Sort(new Document { { "Data", 1 } });
}
運行測試代碼如下:
複製代碼 代碼如下:
static void Main(string[] args)
{
IndexBLL indexBll = new IndexBLL();
indexBll.DropAllIndex();
indexBll.DeleteAll();
indexBll.InsertBigData();
Stopwatch watch1 = new Stopwatch();
watch1.Start();
for (int i = 0; i < 1; i++) indexBll.SortForData();
Console.WriteLine("無索引排序執行時間:" + watch1.Elapsed);
indexBll.CreateIndexForData();
Stopwatch watch2 = new Stopwatch();
watch2.Start();
for (int i = 0; i < 1; i++) indexBll.SortForData();
Console.WriteLine("有索引排序執行時間:" + watch2.Elapsed);
}
最後執行程式查看結果:
多次測試表明在有索引的情況下,查詢效率要高於無索引的效率。
作者:李盼(Lipan)
出處:[Lipan] (http://www.cnblogs.com/lipan/)