在應用系統中,尤其在聯機交易處理系統中,對資料查詢及處理速度已成為衡量應用系統成敗的標準。而採用索引來加快資料處理速度也成為廣大資料庫使用者所接受的最佳化方法。
在良好的資料庫設計基礎上,能有效地使用索引是SQL Server取得高效能的基礎,SQL Server採用基於代價的最佳化模型,它對每一個提交的有關表的查詢,決定是否使用索引或用哪一個索引。因為查詢執行的大部分開銷是磁碟I/O,使用索引提高效能的一個主要目標是避免全表掃描,因為全表掃描需要從磁碟上讀表的每一個資料頁,如果有索引指向資料值,則查詢只需讀幾次磁碟就可以了。所以如果建立了合理的索引,最佳化器就能利用索引加速資料的查詢過程。但是,索引並不總是提高系統的效能,在增、刪、改操作中索引的存在會增加一定的工作量,因此,在適當的地方增加適當的索引並從不合理的地方刪除次優的索引,將有助於最佳化那些效能較差的SQL Server應用。實踐表明,合理的索引設計是建立在對各種查詢的分析和預測上的,只有正確地使索引與程式結合起來,才能產生最佳的最佳化方案。本文就SQL Server索引的效能問題進行了一些分析和實踐。
一、聚簇索引(clustered indexes)的使用
聚簇索引是一種對磁碟上實際資料重新組織以按指定的一個或多個列的值排序。由於聚簇索引的索引頁面指標指向資料頁面,所以使用聚簇索引尋找資料幾乎總是比使用非聚簇索引快。每張表只能建一個聚簇索引,並且建聚簇索引需要至少相當該表120%的附加空間,以存放該表的副本和索引中間頁。建立聚簇索引的思想是:
1、大多數表都應該有聚簇索引或使用分區來降低對錶尾頁的競爭,在一個高事務的環境中,對最後一頁的封鎖嚴重影響系統的輸送量。
2、在聚簇索引下,資料在物理上按順序排在資料頁上,重複值也排在一起,因而在那些包含範圍檢查(between、<、<=、>、>=)或使用group by或order by的查詢時,一旦找到具有範圍中第一個索引值的行,具有後續索引值的行保證物理上毗連在一起而不必進一步搜尋,避免了大範圍掃描,可以大大提高查詢速度。