本文主要向大家介紹的是正確最佳化SQL Server資料庫的經驗總結,其中包括在對其進行最佳化的實際操作中值得大家注意的地方描述,以及對SQL語句進行最佳化的最基本原則,以下就是文章的主要內容描述。
最佳化資料庫的注意事項:
1、關鍵字段建立索引。
2、使用預存程序,它使SQL變得更加靈活和高效。
3、備份資料庫和清除垃圾資料。
4、SQL語句文法的最佳化。(可以用Sybase的SQL Expert,可惜我沒找到unexpired的序號)
5、清理刪除日誌。
SQL語句最佳化的基本原則:
1、使用索引來更快地遍曆表。
預設情況下建立的索引是非群集索引,但有時它並不是最佳的。在非群集索引下,資料在物理上隨機存放在資料頁上。合理的索引設計要建立在對各種查詢的分析和預測上。
一般來說:
①.有大量重複值、且經常有範圍查詢(between, >,< ,>=,< =)和order by、group by發生的列,可考慮建立群集索引
②.經常同時存取多列,且每列都含有重複值可考慮建立複合式索引;
③.複合式索引要盡量使關鍵查詢形成索引覆蓋,其前置列一定是使用最頻繁的列。
2、IS NULL 與 IS NOT NULL
不能用null作索引,任何包含null值的列都將不會被包含在索引中。即使索引有多列這樣的情況下,只要這些列中有一列含有null,該列就會從索引中排除。也就是說如果某列存在空值,即使對該列建索引也不會提高效能。任何在where子句中使用is null或is not null的語句最佳化器是不允許使用索引的。
3、IN和EXISTS
EXISTS要遠比IN的效率高。裡面關係到full table scan和range scan。幾乎將所有的IN操作符子查詢改寫為使用EXISTS的子查詢。
4、在海量查詢時盡量少用格式轉換。
5、當在SQL SERVER 2000中
如果預存程序只有一個參數,並且是OUTPUT類型的,必須在調用這個預存程序的時候給這個參數一個初始的值,否則會出現調用錯誤。
6、ORDER BY和GROPU BY
使用ORDER BY和GROUP BY短語,任何一種索引都有助於SELECT的效能提高。注意如果索引列裡面有NULL值,Optimizer將無法最佳化。
7、任何對列的操作都將導致表掃描,它包括SQL Server資料庫函數、計算運算式等等,查詢時要儘可能將操作移至等號右邊。
8、IN、OR子句常會使用工作表,使索引失效。如果不產生大量重複值,可以考慮把子句拆開。拆開的子句中應該包含索引。
9、SET SHOWPLAN_ALL>10、謹慎使用遊標
在某些必須使用遊標的場合,可考慮將合格資料行轉入暫存資料表中,再對暫存資料表定義遊標進行操作,這樣可使效能得到明顯提高。
注釋:所謂的最佳化就是WHERE子句利用了索引,不可最佳化即發生了表掃描或額外開銷。經驗顯示,SQL Server資料庫效能的最大改進得益於邏輯的資料庫設計、索引設計和查詢設計方面。反過來說,最大的效能問題常常是由其中這些相同方面中的不足引起的。
其實SQL最佳化的實質就是在結果正確的前提下,用最佳化器可以識別的語句,充份利用索引,減少表掃描的I/O次數,盡量避免表搜尋的發生。其實SQL的效能最佳化是一個複雜的過程,上述這些只是在應用程式層次的一種體現,深入研究還會涉及SQL Server資料庫層的資源配置、網路層的流量控制以及作業系統層的總體設計。