我們來簡單地看看SQL SERVER索引是如何工作的,關於索引的一些概念就不說了。
聚簇索引:
(圖A)
我們來看圖A,聚簇索引的結構圖。
資料頁就是資料庫裡實際儲存資料的地方,可以看到是按頁1頁1頁存的。假設那個列是”LastName”。
因為是叢集索引,所以它是按照順序排下來的。可以看到,索引是一棵樹,首先先看一下這棵樹是怎麼形成的。
先看Page100和Page110的最上面,由它們形成了Page141,Page141的第一條資料是Page100的第一條資料,Page141的最後一條資料是Page110的第一條資料。同理由Page120和Page130形成Page145,Page141和Page145形成根Page140.
好了,然後來看看它是如何尋找資料的。我們來找”Rudd”這個姓。
首先它會從根即Page140開始找,因為”Rudd”的值比”Martin”大(只要比較一下他們首字母就知道了,按26個字母順序R排在M的後面),所以會往”Martin”的後面找,即找到Page145,然後在比較一下”Rudd”和”Smith”,”Rudd”比”Smith”小,所以會往左邊找即Page120,然後在Page120漸進式掃描下來直到找到”Rudd”。
如果不建索引的話,SQL SERVER會從第一頁開始按順序每頁漸進式掃描過去,直到找到”Rudd”。顯然如果對於一個百萬行的表來說,效率是極其低下的,如果建了索引,非常快就能找到。
非聚簇索引:
(圖B)
看圖B,非聚簇索引的結構圖。
聚簇索引和非聚簇索引的區別就是:聚簇索引的資料實體儲存體順序和索引順序一致的,也就是它的資料就是按順序排下來的。非聚簇索引的資料存放區是無序的,不按索引順序排列。
從圖B可以看到資料頁裡是無序的。那麼它的索引是如何建立的呢?
再看圖B,它是把這個索引列的資料複製了一份然後按順序排下來,再建立索引。每行資料都有一個指標。
我們再來找”Rudd”.首先從索引頁的根開始找,尋找原理跟叢集索引是一樣的。在索引頁的Page61找到”Rudd”,它的指標是470501,然後在資料頁的Page5找到470501,這個位置就是”Rudd”在資料庫中的實際位置,這樣就找到了”Rudd”。
好了,索引的基本工作原理就是這樣,可能實際上要複雜些。