SQL Server資料庫最佳化方案
查詢速度慢的原因很多,常見如下幾種:
1、沒有索引或者沒有用到索引(這是查詢慢最常見的問題,是程式設計的缺陷)
2、I/O輸送量小,形成了瓶頸效應。
3、沒有建立計算資料行導致查詢不最佳化。
4、記憶體不足
5、網路速度慢
6、查詢出的資料量過大(可以採用多次查詢,其他的方法降低資料量)
7、鎖或者死結(這也是查詢慢最常見的問題,是程式設計的缺陷)
8、sp_lock,sp_who,活動的使用者查看,原因是讀寫競爭資源。
9、返回了不必要的行和列
10、查詢語句不好,沒有最佳化
可以通過如下方法來最佳化查詢 :
1、把資料、日誌、索引放到不同的I/O裝置上,增加讀取速度,以前可以將Tempdb應放在RAID0上,SQL2000不在支援。資料量(尺寸)越大,提高I/O越重要.
2、縱向、橫向分割表,減少表的尺寸(sp_spaceuse)
3、升級硬體
4、根據查詢條件,建立索引,最佳化索引、最佳化訪問方式,限制結果集的資料量。注意填滿因數要適當(最好是使用預設值0)。索引應該盡量小,使用位元組數小的列建索引好(參照索引的建立),不要對有限的幾個值的欄位建單一索引如性別欄位
5、提高網速;
6、擴大伺服器的記憶體,Windows 2000和SQL server 2000能支援4-8G的記憶體。配置虛擬記憶體:虛擬記憶體大小應基於電腦上並發啟動並執行服務進行配置。運行 Microsoft SQL Server? 2000 時,可考慮將虛擬記憶體大小設定為電腦中安裝的實體記憶體的 1.5 倍。如果另外安裝了全文檢索索引功能,並打算運行 Microsoft 搜尋服務以便執行全文索引和查詢,可考慮:將虛擬記憶體大小配置為至少是電腦中安裝的實體記憶體的 3 倍。將 SQL Server max server memory 伺服器配置選項配置為實體記憶體的 1.5 倍(虛擬記憶體大小設定的一半)。
7、增加伺服器 CPU個數;但是必須明白平行處理串列處理更需要資源例如記憶體。使用並行還是串列程是MsSQL自動評估選擇的。單個任務分解成多個任務,就可以在處理器上運行。例如耽擱查詢的排序、串連、掃描和GROUP BY字句同時執行,SQL SERVER根據系統的負載情況決定最優的並行等級,複雜的需要消耗大量的CPU的查詢最適合并行處理。但是更新操作Update,Insert, Delete還不能平行處理。
8、如果是使用like進行查詢的話,簡單的使用index是不行的,但是全文索引,耗空間。 like 'a%' 使用索引 like '%a' 不使用索引用 like '%a%' 查詢時,查詢耗時和欄位值總長度成正比,所以不能用CHAR類型,而是VARCHAR。對於欄位的值很長的建全文索引。
9、DB Server 和APPLication Server 分離;OLTP和OLAP分離
10、分散式資料分割檢視可用於實現資料庫伺服器聯合體。聯合體是一組分開管理的伺服器,但它們相互協作分擔系統的處理負荷。這種通過分區資料形成資料庫伺服器聯合體的機制能夠擴大一組伺服器,以支援大型的多層 Web 網站的處理需要。有關更多資訊,參見設計聯盟資料庫伺服器。(參照SQL協助檔案'分區視圖')
a、在實現分區視圖之前,必須先水平資料分割表
b、在建立成員表後,在每個成員伺服器上定義一個分散式資料分割檢視,並且每個視圖具有相同的名稱。這樣,引用分散式資料分割檢視名的查詢可以在任何一個成員伺服器上運行。系統操作如同每個成員伺服器上都有一個原始表的複本一樣,但其實每個伺服器上只有一個成員表和一個分散式資料分割檢視。資料的位置對應用程式是透明的。
11、重建索引 DBCC REINDEX ,DBCC INDEXDEFRAG,收縮資料和日誌 DBCC SHRINKDB,DBCC SHRINKFILE. 設定自動收縮日誌.對於大的資料庫不要設定資料庫自動成長,它會降低伺服器的效能。在T-sql的寫法上有很大的講究,下面列出常見的要點:首先,DBMS處理查詢計劃的過程是這樣的:
1、 查詢語句的詞法、語法檢查
2、 將語句提交給DBMS的查詢最佳化工具
3、 最佳化器做代數最佳化和存取路徑的最佳化
4、 由先行編譯模組產生查詢規劃
5、 然後在合適的時間提交給系統處理執行
6、 最後將執行結果返回給使用者其次,看一下SQL SERVER的資料存放的結構:一個頁面的大小為8K(8060)位元組,8個頁面為一個盤區,按照B樹存放。
12、Commit和rollback的區別 Rollback:復原所有的事物。 Commit:提交當前的事物. 沒有必要在動態SQL裡寫事物,如果要寫請寫在外面如: begin tran exec(@s) commit trans 或者將動態SQL 寫成函數或者預存程序。
13、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,如果返回不必要的資料,浪費了伺服器的I/O資源,加重了網路的負擔降低效能。如果表很大,在表掃描的期間將表鎖住,禁止其他的聯結訪問表,後果嚴重。
14、SQL的注釋申明對執行沒有任何影響
15、儘可能不使用游標,它佔用大量的資源。如果需要row-by-row地執行,盡量採用非游標技術,如:在用戶端迴圈,用暫存資料表,Table變數,用子查詢,用Case語句等等。遊標可以按照它所支援的提取選項進行分類: 只進 必須按照從第一行到最後一行的順序提取行。FETCH NEXT 是唯一允許的提取操作,也是預設。可滾動性可以在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大,他的目的是支援迴圈。有四個並發選項 READ_ONLY:不允許通過遊標定點更新(Update),且在組成結果集的行中沒有鎖。 OPTIMISTIC WITH valueS:開放式並行存取控制是事務控制理論的一個標準部分。開放式並行存取控制用於這樣的情形,即在開啟遊標及更新行的間隔中,只有很小的機會讓第二個使用者更新某一行。當某個遊標以此選項開啟時,沒有鎖控制其中的行,這將有助於最大化其處理能力。如果使用者試圖修改某一行,則此行的當前值會與最後一次提取此行時擷取的值進行比較。如果任何值發生改變,則伺服器就會知道其他人已更新了此行,並會返回一個錯誤。如果值是一樣的,伺服器就執行修改。選擇這個並發選項OPTIMISTIC WITH ROW VERSIONING:此開放式並行存取控制選項基於資料列版本設定。使用資料列版本設定,其中的表必須具有某種版本標識符,伺服器可用它來確定該行在讀入遊標後是否有所更改。在 SQL Server 中,這個效能由 timestamp 資料類型提供,它是一個位元字,表示資料庫中更改的相對順序。每個資料庫都有一個全域目前時間戳值:@@DBTS。每次以任何方式更改帶有 timestamp 列的行時,SQL Server 先在時間戳記列中儲存當前的 @@DBTS 值,然後增加 @@DBTS 的值。如果某 個表具有 timestamp 列,則時間戳記會被記到行級。伺服器就可以比較某行的目前時間戳值和上次提取時所儲存的時間戳記值,從而確定該行是否已更新。伺服器不必比較所有列的值,只需比較 timestamp 列即可。如果應用程式對沒有 timestamp 列的表要求基於資料列版本設定的開放式並行存取,則遊標預設為基於數值的開放式並行存取控制。 SCROLL LOCKS 這個選項實現封閉式並行存取控制。在封閉式並行存取控制中,在把資料庫的行讀入遊標結果集時,應用程式將試圖鎖定資料庫行。在使用伺服器資料指標時,將行讀入遊標時會在其上放置一個更新鎖定。如果在事務內開啟遊標,則該事務更新鎖定將一直保持到事務被提交或復原;當提取下一行時,將除去遊標鎖。如果在事務外開啟遊標,則提取下一行時,鎖就被丟棄。因此,每當使用者需要完全的封閉式並行存取控制時,遊標都應在事務內開啟。更新鎖定將阻止任何其它任務擷取更新鎖定或排它鎖,從而阻止其它任務更新該行。然而,更新鎖定並不阻止共用鎖定,所以它不會阻止其它任務讀取行,除非第二個任務也在要求帶更新鎖定的讀取。滾動鎖根據在遊標定義的 Select 語句中指定的鎖提示,這些遊標並發選項可以產生滾動鎖。滾動鎖在提取時在每行上擷取,並保持到下次提取或者遊標關閉,以先發生者為準。下次提取時,伺服器為新提取中的行擷取滾動鎖,並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖,並可以保持到一個提交或復原操作之後。如果提交時關閉遊標的選項為關,則 COMMIT 語句並不關閉任何開啟的遊標,而且滾動鎖被保留到提交之後,以維護對所提取資料的隔離。所擷取滾動鎖的類型取決於遊標並發選項和遊標 Select 語句中的鎖提示。鎖提示 唯讀 樂觀數值 樂觀資料列版本設定 鎖定無提示 未鎖定 未鎖定 未鎖定 更新 NOLOCK 未鎖定 未鎖定未鎖定 未鎖定 HOLDLOCK 共用 共用 共用 更新 UPDLOCK 錯誤 更新 更新 更新 TABLOCKX 錯誤 未鎖定 未鎖定更新其它 未鎖定 未鎖定 未鎖定 更新 *指定 NOLOCK 提示將使指定了該提示的表在遊標內是唯讀。
16、用Profiler來跟蹤查詢,得到查詢所需的時間,找出SQL的問題所在;用索引最佳化器最佳化索引
17、注意UNion和UNion all 的區別。UNION all好
18、注意使用DISTINCT,在沒有必要時不要用,它同UNION一樣會使查詢變慢。重複的記錄在查詢裡是沒有問題的
19、查詢時不要返回不需要的行、列
20、用sp_configure 'query governor cost limit'或者SET QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時,伺服器自動取消查詢,在查詢之前就扼殺掉。 SET LOCKTIME設定鎖的時間
21、用select top 100 / 10 Percent 來限制使用者返回的行數或者SET ROWCOUNT來限制操作的行
22、在SQL2000以前,一般不要用如下的字句: "IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT EXISTS", "NOT IN", "NOT LIKE", and "LIKE '%500'",因為他們不走索引全是表掃描。也不要在Where字句中的列名加函數,如Convert,substring等,如果必須用函數的時候,建立計算資料行再建立索引來替代.還可以變通寫法:Where SUBSTRING(firstname,1,1) = 'm'改為Where firstname like 'm%'(索引掃描),一定要將函數和列名分開。並且索引不能建得太多和太大。NOT IN會多次掃描表,使用EXISTS、NOT EXISTS ,IN , LEFT OUTER JOIN 來替代,特別是左串連,而Exists比IN更快,最慢的是NOT操作.如果列的值含有空,以前它的索引不起作用,現在2000的最佳化器能夠處理了。相同的是IS NULL,"NOT", "NOT EXISTS", "NOT IN"能最佳化她,而"<>"等還是不能最佳化,用不到索引。
23、使用Query Analyzer,查看SQL語句的查詢計劃和評估分析是否是最佳化的SQL。一般的20%的代碼佔據了80%的資源,我們最佳化的重點是這些慢的地方。
24、如果使用了IN或者OR等時發現查詢沒有走索引,使用顯示申明指定索引: Select * FROM PersonMember (INDEX = IX_Title) Where processid IN ('男','女')
25、將需要查詢的結果預先計算好放在表中,查詢的時候再Select。這在SQL7.0以前是最重要的手段。例如醫院的住院費計算。
26、MIN() 和 MAX()能使用到合適的索引。
27、資料庫有一個原則是代碼離資料越近越好,所以優先選擇Default,依次為Rules,Triggers, Constraint(約束如外健主健CheckUNIQUE……,資料類型的最大長度等等都是約束),Procedure.這樣不僅維護工作小,編寫程式品質高,並且執行的速度快。
28、如果要插入大的二進位值到Image列,使用預存程序,千萬不要用內嵌Insert來插入(不知JAVA是否)。因為這樣應用程式首先將二進位值轉換成字串(尺寸是它的兩倍),伺服器受到字元後又將他轉換成二進位值.預存程序就沒有這些動作: 方法:Create procedure p_insert as insert into table(Fimage) values (@image), 在前台調用這個預存程序傳入二進位參數,這樣處理速度明顯改善。
29、Between在某些時候比IN 速度更快,Between能夠更快地根據索引找到範圍。用查詢最佳化工具可見到差別。 select * from chineseresume where title in ('男','女') Select * from chineseresume where between '男' and '女' 是一樣的。由於in會在比較多次,所以有時會慢些。
30、在必要是對全域或者局部暫存資料表建立索引,有時能夠提高速度,但不是一定會這樣,因為索引也耗費大量的資源。他的建立同是實際表一樣。
31、不要建沒有作用的事物例如產生報表時,浪費資源。只有在必要使用事物時使用它。
32、用OR的字句可以分解成多個查詢,並且通過UNION 串連多個查詢。他們的速度只同是否使用索引有關,如果查詢需要用到聯合索引,用UNION all執行的效率更高.多個OR的字句沒有用到索引,改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。
33、盡量少用視圖,它的效率低。對視圖操作比直接對錶操作慢,可以用stored procedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增加了尋找原始資料的難度。我們看視圖的本質:它是存放在伺服器上的被最佳化好了的已經產生了查詢規劃的SQL。對單個表檢索資料時,不要使用指向多個表的視圖,直接從表檢索或者僅僅包含這個表的視圖上讀,否則增加了不必要的開銷,查詢受到幹擾.為了加快視圖的查詢,MsSQL增加了視圖索引的功能。
34、沒有必要時不要用DISTINCT和ORDER BY,這些動作可以改在用戶端執行。它們增加了額外的開銷。這同UNION 和UNION ALL一樣的道理。
select top 20 ad.companyname,comid,position,ad.referenceid,worklocation, convert(varchar(10),ad.postDate,120) as postDate1,workyear,degreedescription FROM jobcn_query.dbo.COMPANYAD_query ad where referenceID in('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345',
'JCNAD00333138','JCNAD00303570','JCNAD00303569',
'JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933',
'JCNAD00254567','JCNAD00254585','JCNAD00254608',
'JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618',
'JCNAD00279196','JCNAD00268613') order by postdate desc
35、在IN後面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最後面,減少判斷的次數。
36、當用Select INTO時,它會鎖住系統資料表(sysobjects,sysindexes等等),阻塞其他的串連的存取。建立暫存資料表時用顯示申明語句,而不是 select INTO. drop table t_lxh begin tran select * into t_lxh from chineseresume where name = 'XYZ' --commit 在另一個串連中Select * from sysobjects可以看到 Select INTO 會鎖住系統資料表,Create table 也會鎖系統資料表(不管是暫存資料表還是系統資料表)。所以千萬不要在事物內使用它!!!這樣的話如果是經常要用的暫存資料表請使用實表,或者暫存資料表變數。
37、一般在GROUP BY 個HAVING字句之前就能剔除多餘的行,所以盡量不要用它們來做剔除行的工作。他們的執行順序應該如下最優:select 的Where字句選擇所有合適的行,Group By用來分組個統計行,Having字句用來剔除多餘的分組。這樣Group By 個Having的開銷小,查詢快.對於大的資料行進行分組和Having十分消耗資源。如果Group BY的目的不包括計算,只是分組,那麼用Distinct更快
38、一次更新多條記錄比分多次更新每次一條快,就是說批處理好
39、少用暫存資料表,盡量用結果集和Table類性的變數來代替它,Table 類型的變數比暫存資料表好
40、在SQL2000下,計算欄位是可以索引的,需要滿足的條件如下:
a、計算欄位的表達是確定的
b、不能用在TEXT,Ntext,Image資料類型
c、必須配製如下選項 ANSI_NULLS = ON, ANSI_PADDINGS = ON, …….
41、盡量將資料的處理工作放在伺服器上,減少網路的開銷,如使用預存程序。預存程序是編譯好、最佳化過、並且被組織到一個執行規劃裡、且儲存在資料庫中的SQL語句,是流程控制語言的集合,速度當然快。反覆執行的動態SQL,可以使用暫存預存程序,該過程(暫存資料表)被放在Tempdb中。以前由於SQL SERVER對複雜的數學計算不支援,所以不得不將這個工作放在其他的層上而增加網路的開銷。SQL2000支援UDFs,現在支援複雜的數學計算,函數的傳回值不要太大,這樣的開銷很大。使用者自訂函數象游標一樣執行的消耗大量的資源,如果返回大的結果採用預存程序
42、不要在一句話裡再三的使用相同的函數,浪費資源,將結果放在變數裡再調用更快
43、Select COUNT(*)的效率教低,盡量變通他的寫法,而EXISTS快.同時請注意區別: select count(Field of null) from Table 和 select count(Field of NOT null) from Table 的傳回值是不同的!!!
44、當伺服器的記憶體夠多時,配製線程數量 = 最大串連數+5,這樣能發揮最大的效率;否則使用 配製線程數量<最大串連數啟用SQL SERVER的線程池來解決,如果還是數量 = 最大串連數+5,嚴重的損害伺服器的效能。
45、按照一定的次序來訪問你的表。如果你先鎖住表A,再鎖住表B,那麼在所有的預存程序中都要按照這個順序來鎖定它們。如果你(不經意的)某個預存程序中先鎖定表B,再鎖定表A,這可能就會導致一個死結。如果鎖定順序沒有被預先詳細的設計好,死結很難被發現
46、通過SQL Server Performance Monitor監視相應硬體的負載 Memory: Page Faults / sec計數器如果該值偶爾走高,表明當時有線程競爭記憶體。如果持續很高,則記憶體可能是瓶頸。
Process:
1、% DPC Time 指在範例間隔期間處理器用在緩延程式調用(DPC)接收和提供服務的百分比。(DPC 正在啟動並執行為比標準間隔優先權低的間隔)。 由於 DPC 是以特權模式執行的,DPC 時間的百分比為特權時間百分比的一部分。這些時間單獨計算並且不屬於間隔計算總數的一部 分。這個總數顯示了作為執行個體時間百分比的平均忙時。
2、%Processor Time計數器 如果該參數值持續超過95%,表明瓶頸是CPU。可以考慮增加一個處理器或換一個更快的處理器。
3、% Privileged Time 指非閑置處理器時間用於特權模式的百分比。(特權模式是為作業系統組件和操縱硬體驅動程式而設計的一種處理模式。它允許直接存取硬體和所有記憶體。另一種模式為使用者模式,它是一種為應用程式、環境分系統和整數分系統設計的一種有限處理模式。作業系統將應用程式線程轉換成特權模式以訪問作業系統服務)。特權時間的 % 包括為間斷和 DPC 提供服務的時間。特權時間比率高可能是由於失敗裝置產生的大數量的間隔而引起的。這個計數器將平均忙時作為樣本時間的一部分顯示。
4、% User Time表示耗費CPU的資料庫操作,如排序,執行aggregate functions等。如果該值很高,可考慮增加索引,盡量使用簡單的表聯結,水平分割大表格等方法來降低該值。 Physical Disk: Curretn Disk Queue Length計數器該值應不超過磁碟數的1.5~2倍。要提高效能,可增加磁碟。 SQLServer:Cache Hit Ratio計數器該值越高越好。如果持續低於80%,應考慮增加記憶體。 注意該參數值是從SQL Server啟動後,就一直累加記數,所以運行經過一段時間後,該值將不能反映系統當前值。
47、分析select emp_name form employee where salary > 3000 在此語句中若salary是Float類型的,則最佳化器對其進行最佳化為Convert(float,3000),因為3000是個整數,我們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。同樣字元和整型資料的轉換。
48、查詢的關聯同寫的順序
select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' (A = B ,B = '號碼')
select a.personMemberID, * from chineseresume a,personmember b where a.personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' and b.referenceid = 'JCNPRH39681' (A = B ,B = '號碼', A = '號碼')
select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = 'JCNPRH39681' and a.personMemberID = 'JCNPRH39681' (B = '號碼', A = '號碼')
49、
(1)IF 沒有輸入負責人代碼 THEN code1=0 code2=9999 ELSE code1=code2=負責人代碼 END IF 執行SQL語句為: Select 負責人名 FROM P2000 Where 負責人代碼>=:code1 AND負責人代碼 <=:code2
(2)IF 沒有輸入負責人代碼 THEN Select 負責人名 FROM P2000 ELSE code= 負責人代碼 Select 負責人代碼 FROM P2000 Where 負責人代碼=:code END IF 第一種方法只用了一條SQL語句,第二種方法用了兩條SQL語句。在沒有輸入負責人代碼時,第二種方法顯然比第一種方法執行效率高,因為它沒有限制條件; 在輸入了負責人代碼時,第二種方法仍然比第一種方法效率高,不僅是少了一個限制條件,還因相等運算是最快的查詢運算。我們寫程式不要怕麻煩
50、關於JOBCN現在查詢分頁的新方法(如下),用效能最佳化器分析效能的瓶頸,如果在I/O或者網路的速度上,如下的方法最佳化切實有效,如果在CPU或者記憶體上,用現在的方法更好。請區分如下的方法,說明索引越小越好。
begin
DECLARE @local_variable table (FID int identity(1,1),ReferenceID varchar(20))
insert into @local_variable (ReferenceID)
select top 100000 ReferenceID from chineseresume order by ReferenceID
select * from @local_variable where Fid > 40 and fid <= 60
end 和
begin
DECLARE @local_variable table (FID int identity(1,1),ReferenceID varchar(20))
insert into @local_variable (ReferenceID)
select top 100000 ReferenceID from chineseresume order by updatedate
select * from @local_variable where Fid > 40 and fid <= 60
end 的不同
begin
create table #temp (FID int identity(1,1),ReferenceID varchar(20))
insert into #temp (ReferenceID)
select top 100000 ReferenceID from chineseresume order by updatedate
select * from #temp where Fid > 40 and fid <= 60 drop table #temp
end
另附:預存程序編寫經驗和最佳化措施 From:網頁教學網
一、適合讀者對象:資料庫開發程式員,資料庫的資料量很多,涉及到對SP(預存程序)的最佳化的項目開發人員,對資料庫有濃厚興趣的人。
二、介紹:在資料庫的開發過程中,經常會遇到複雜的商務邏輯和對資料庫的操作,這個時候就會用SP來封裝資料庫操作。如果項目的SP較多,書寫又沒有一定的規範,將會影響以後的系統維護困難和大SP邏輯的難以理解,另外如果資料庫的資料量大或者項目對SP的效能要求很,就會遇到最佳化的問題,否則速度有可能很慢,經過親身經驗,一個經過最佳化過的SP要比一個效能差的SP的效率甚至高几百倍。
三、內容:
1、開發人員如果用到其他庫的Table或View,務必在當前庫中建立View來實現跨庫操作,最好不要直接使用“databse.dbo.table_name”,因為sp_depends不能顯示出該SP所使用的跨庫table或view,不方便校正。
2、開發人員在提交SP前,必須已經使用set showplan on分析過查詢計劃,做過自身的查詢最佳化檢查。
3、高程式運行效率,最佳化應用程式,在SP編寫過程中應該注意以下幾點:
a)SQL的使用規範:
i. 盡量避免大事務操作,慎用holdlock子句,提高系統並發能力。
ii. 盡量避免反覆訪問同一張或幾張表,尤其是資料量較大的表,可以考慮先根據條件提取資料到暫存資料表中,然後再做串連。
iii. 盡量避免使用遊標,因為遊標的效率較差,如果遊標操作的資料超過1萬行,那麼就應該改寫;如果使用了遊標,就要盡量避免在遊標迴圈中再進行表串連的操作。
iv. 注意where字句寫法,必須考慮語句順序,應該根據索引順序、範圍大小來確定條件子句的前後順序,儘可能的讓欄位順序與索引順序相一致,範圍從大到小。
v. 不要在where子句中的“=”左邊進行函數、算術運算或其他運算式運算,否則系統將可能無法正確使用索引。
vi. 盡量使用exists代替select count(1)來判斷是否存在記錄,count函數只有在統計表中所有行數時使用,而且count(1)比count(*)更有效率。
vii. 盡量使用“>=”,不要使用“>”。
viii. 注意一些or子句和union子句之間的替換
ix. 注意表之間串連的資料類型,避免不同類型資料之間的串連。
x. 注意預存程序中參數和資料類型的關係。
xi. 注意insert、update操作的資料量,防止與其他應用衝突。如果資料量超過200個資料頁面(400k),那麼系統將會進行鎖定擴大,頁級鎖會升級成表級鎖。
b)索引的使用規範:
i. 索引的建立要與應用結合考慮,建議大的OLTP表不要超過6個索引。
ii. 儘可能的使用索引欄位作為查詢條件,尤其是聚簇索引,必要時可以通過index index_name來強制指定索引
iii. 避免對大表查詢時進行table scan,必要時考慮建立索引。
iv. 在使用索引欄位作為條件時,如果該索引是聯合索引,那麼必須使用到該索引中的第一個欄位作為條件時才能保證系統使用該索引,否則該索引將不會被使用。
v. 要注意索引的維護,周期性重建索引,重新編譯預存程序。
c)tempdb的使用規範:
i. 盡量避免使用distinct、order by、group by、having、join、cumpute,因為這些語句會加重tempdb的負擔。
ii. 避免頻繁建立和刪除暫存資料表,減少系統資料表資源的消耗。
iii. 在建立暫存資料表時,如果一次性插入資料量很大,那麼可以使用select into代替create table,避免log,提高速度;如果資料量不大,為了緩和系統資料表的資源,建議先create table,然後insert。
iv. 如果暫存資料表的資料量較大,需要建立索引,那麼應該將建立暫存資料表和建立索引的過程放在單獨一個子預存程序中,這樣才能保證系統能夠很好的使用到該暫存資料表的索引。
v. 如果使用到了暫存資料表,在預存程序的最後務必將所有的暫存資料表顯式刪除,先truncate table,然後drop table,這樣可以避免系統資料表的較長時間鎖定。
vi. 慎用大的暫存資料表與其他大表的串連查詢和修改,減低系統資料表負擔,因為這種操作會在一條語句中多次使用tempdb的系統資料表。
d)合理的演算法使用:
根據上面已提到的SQL最佳化技術和ASE Tuning手冊中的SQL最佳化內容,結合實際應用,採用多種演算法進行比較,以獲得消耗資源最少、效率最高的方法。具體可用ASE調優命令:set statistics io on, set statistics time on , set showplan on 等。