轉:SQL語句最佳化技術分析

來源:互聯網
上載者:User

SQL語句最佳化技術分析

操作符最佳化 

IN 操作符 

用IN寫出來的SQL的優點是比較容易寫及清晰易懂,這比較適合現代軟體開發的風格。 

但是用IN的SQL效能總是比較低的,從ORACLE執行的步驟來分析用IN的SQL與不用IN的SQL有以下區別: 

     ORACLE試圖將其轉換成多個表的串連,如果轉換不成功則先執行IN裡面的子查詢,再查詢外層的表記錄,如果轉換成功則直接採用多個表的串連方式 查詢。由此可見用IN的SQL至少多了一個轉換的過程。一般的SQL都可以轉換成功,但對於含有分組統計等方面的SQL就不能轉換了。 

    推薦方案:在業務密集的SQL當中盡量不採用IN操作符。 

NOT IN操作符 

    此操作是強列推薦不使用的,因為它不能應用表的索引。 

    推薦方案:用NOT EXISTS 或(外串連+判斷為空白)方案代替 

<> 操作符(不等於) 

    不等於操作符是永遠不會用到索引的,因此對它的處理只會產生全表掃描。 

推薦方案:用其它相同功能的操作運算代替,如 

    a<>0 改為 a>0 or a<0 

    a<>’’ 改為 a>’’ 

IS NULL 或IS NOT NULL操作(判斷欄位是否為空白) 

    判斷欄位是否為空白一般是不會應用索引的,因為B樹索引是不索引空值的。 

    推薦方案: 

用其它相同功能的操作運算代替,如 

    a is not null 改為 a>0 或a>’’等。 

    不允許欄位為空白,而用一個預設值代替空值,如業擴申請中狀態欄位不允許為空白,預設為申請。 

    建立位元影像索引(有分區的表不能建,位元影像索引比較難控制,如欄位值太多索引會使效能下降,多人更新操作會增加資料區塊鎖的現象) 

> 及 < 操作符(大於或小於操作符) 

     大於或小於操作符一般情況下是不用調整的,因為它有索引就會採用索引尋找,但有的情況下可以對它進行最佳化,如一個表有100萬記錄,一個數值型欄位 A,30萬記錄的A=0,30萬記錄的A=1,39萬記錄的A=2,1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了,因 為A>2時ORACLE會先找出為2的記錄索引再進行比較,而A>=3時ORACLE則直接找到=3的記錄索引。 

LIKE操作符 

LIKE 操作符可以應用萬用字元查詢,裡面的萬用字元組合可能達到幾乎是任意的查詢,但是如果用得不好則會產生效能上的問題,如LIKE ‘%5400%’ 這種查詢 不會引用索引,而LIKE ‘X5400%’則會引用範圍索引。一個實際例子:用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編 號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描,如果改成 YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢,效能肯定大大提 高。 

UNION操作符 

UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,重複資料刪除的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與曆史表UNION。如: 

select * from gc_dfys 

union 

select * from ls_jg_dfys 

這個SQL在運行時先取出兩個表的結果,再用排序空間進行排序重複資料刪除的記錄,最後返回結果集,如果表資料量大的話可能會導致用磁碟進行排序。 

推薦方案:採用UNION ALL操作符替代UNION,因為UNION ALL操作只是簡單的將兩個結果合并後就返回。 

select * from gc_dfys 

union all 

select * from ls_jg_dfys 

SQL書寫的影響 

同一功能同一效能不同寫法SQL的影響 

如一個SQL在A程式員寫的為 

    Select * from zl_yhjbqk 

B程式員寫的為 

    Select * from dlyx.zl_yhjbqk(帶表所有者的首碼) 

C程式員寫的為 

    Select * from DLYX.ZLYHJBQK(大寫表名) 

D程式員寫的為 

    Select * from DLYX.ZLYHJBQK(中間多了空格) 

以 上四個SQL在ORACLE分析整理之後產生的結果及執行的時間是一樣的,但是從ORACLE共用記憶體SGA的原理,可以得出ORACLE對每個 SQL 都會對其進行一次分析,並且佔用共用記憶體,如果將SQL的字串及格式寫得完全相同則ORACLE只會分析一次,共用記憶體也只會留下一次的分析結 果,這不僅可以減少分析SQL的時間,而且可以減少共用記憶體重複的資訊,ORACLE也可以準確統計SQL的執行頻率。 

WHERE後面的條件順序影響 

WHERE子句後面的條件順序對大資料量表的查詢會產生直接的影響,如 

Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1 

Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下' 

以 上兩個SQL中dy_dj(電壓等級)及xh_bz(銷戶標誌)兩個欄位都沒進行索引,所以執行的時候都是全表掃描,第一條SQL的 dy_dj = '1KV以下'條件在記錄集內比率為99%,而xh_bz=1的比率只為0.5%,在進行第一條SQL的時候99%條記錄都進行 dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU佔用率 明顯比第一條低。 

查詢表順序的影響 

在FROM後面的表中的列表順序會對SQL執行效能影響,在沒有 索引及ORACLE沒有對錶進行統計分析的情況下ORACLE會按表出現的順序進行連結,由此因為表的順序不對會產生十分耗伺服器資源的資料交叉。(註: 如果對錶進行了統計分析,ORACLE會自動先進小表的連結,再進行大表的連結)

SQL語句索引的利用 

對操作符的最佳化(見上節) 

對條件欄位的一些最佳化 

採用函數處理的欄位不能利用索引,如: 

substr(hbs_bh,1,4)=’5400’,最佳化處理:hbs_bh like ‘5400%’ 

trunc(sk_rq)=trunc(sysdate), 最佳化處理: 

sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1) 

進行了顯式或隱式的運算的欄位不能進行索引,如: 

ss_df+20>50,最佳化處理:ss_df>30 

‘X’||hbs_bh>’X5400021452’,最佳化處理:hbs_bh>’5400021542’ 

sk_rq+5=sysdate,最佳化處理:sk_rq=sysdate-5 

hbs_bh=5401002554,最佳化處理:hbs_bh=’ 5401002554’,註:此條件對hbs_bh 進行隱式的to_number轉換,因為hbs_bh欄位是字元型。 

條件內包括了多個本表的欄位運算時不能進行索引,如: 

ys_df>cx_df,無法進行最佳化 

qc_bh||kh_bh=’5400250000’,最佳化處理:qc_bh=’5400’ and kh_bh=’250000’ 

應用ORACLE的HINT(提示)處理 

提示處理是在ORACLE產生的SQL分析執行路徑不滿意的情況下要用到的。它可以對SQL進行以下方面的提示 

目標方面的提示: 

COST(按成本最佳化) 

RULE(按規則最佳化) 

CHOOSE(預設)(ORACLE自動選擇成本或規則進行最佳化) 

ALL_ROWS(所有的行儘快返回) 

FIRST_ROWS(第一行資料儘快返回) 

執行方法的提示: 

USE_NL(使用NESTED LOOPS方式聯合) 

USE_MERGE(使用MERGE JOIN方式聯合) 

USE_HASH(使用HASH JOIN方式聯合) 

索引提示: 

INDEX(TABLE INDEX)(使用提示的表索引進行查詢) 

其它進階提示(如平行處理等等)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.