SQL SERVER全面最佳化-------索引有多重要?

來源:互聯網
上載者:User

標籤:

  想了好久索引的重要性應該怎麼寫?講原理結構?我估計大部分人不願意看,也不願意花那麼多時間仔細研究。光寫應用?感覺不明白原理一樣不會用。舉例說明?情況太多也寫不全....到底該怎麼寫呢?

  隨便寫吧,想到哪寫到哪!

   前面很多篇不管CPU、記憶體、磁碟、語句等等等都提到了索引的重要,我想剛剛開始學資料庫的在校學生都知道索引對語句效能的重要性。但他們可能不知道,對語句的重要性就是對系統的重要性!

 

  

  拋出一個問題 :你相信一條語句就能讓你的大系統掛掉嗎?

 

 

  帶著問題,首先還是貼出我的座駕

 

  最近不太喜歡紅色換了一輛!

 

--------------部落格地址---------------------------------------------------------------------------------------

Expert 診斷最佳化系列 http://www.cnblogs.com/double-K/

 

 

廢話不多說,直接開整-----------------------------------------------------------------------------------------

 

  • 開篇小測驗

  下面這樣一個小SQL 你該怎麼樣添加最優索引

  兩個表上現在只有叢集索引

  bigproduct 表上已經有叢集索引 ProductID

 

  bigtransactionhistory 表上已經有叢集索引 TransactionID

  

select p.productnumber,p.reorderpoint,th.Quantityfrom bigproduct as pjoin bigtransactionhistory as th on th.productid=p.productid and th.TransactionDate > p.SellStartDatewhere p.name in (‘LL Crankarm1000‘,‘ML Crankarm1000‘) and th.TransactionDate > ‘2010-01-01‘

 

 

  你是否一眼就能看出來呢?

  

  答案將在文章中逐步揭曉~~~

  • 簡單粗暴的添加索引

  看過我前面文章的看官們一定會發現我很喜歡用“簡單粗暴”這個詞,一是因為詞彙量小文筆也差,真心用不出高大上的詞兒! 再一個,你們不喜歡簡單粗暴麼~~乾貨最重要,不是嗎?

  

  首先我們看一下沒有最佳化前的執行計畫

  

  

  

  clustered index scan 這其實就是表掃描,不是table scan 只是因為表上有叢集索引

  可以看出這個查詢倆表都使用了表掃描!  

  

  where 條件添加索引

  首先大多數人都知道 where 條件中的欄位需要添加索引! 我們添加一下看看效果建立 

  在 bigproduct 表上建立 name 列索引 ,在bigtransactionhistory表上建立 TransactionDate 列索引。

  再次執行語句看一下效果!

  

  

  

  添加where索引以後可以看到以下幾個現象

  1. bigproduct 從原來的clustered index scan 變成 index seek
  2. 另外多出來個KEY Lookup(clustered)
  3. bigproduct 上添加的索引起了作用,邏輯讀bigproduct 由 601 變成 10。
  4. bigtransactionhistory 沒啥變化啊 還是clustered index scan

  

  解釋一下出現的現象 : 首先一點bigproduct 邊添加的where 條件索引,起到了作用,執行的時候不是全表掃描了,邏輯讀有明顯的下降,出現的 KEY Lookup 是因為選擇(select)的列,在索引中沒有,而需要通過叢集索引再尋找一次,再找一次也意味著多一部分開銷!

  那麼同樣添加了where 條件索引的bigtransactionhistory 表為什麼沒起作用呢? 那是因為SQL最佳化器在選擇計劃的時候認為,不使用TransactionDate 列索引尋找效率會更好! 

  真的嗎? 我們來驗證一下,通過指定選擇索引,來讓最佳化器選擇索引尋找!

  

 

  

 

   強制使用索引以後,可以看出邏輯讀由 14W 變成1961W,語句時間也變得很長,這就是最佳化器為什麼不選用你加的索引!最佳化器還是很智能的吧。

 

  高能預警:最佳化器可不是什麼時候都這麼智能的...由於緩衝計劃或最佳化器抽風等原因,也會出現最佳化器用了這種索引,導致你的語句奇慢,讀飆升直接影響到你的記憶體、磁碟、CPU資源!另外如果這樣一條語句是系統中一條很頻繁啟動並執行語句,你的系統就掛了!沒錯就掛了!這就是開篇拋出的問題就是因為一條語句!

 

 

  消滅Key Lookup 添加select 欄位

   這就是傳說中的覆蓋索引! 

   看到執行計畫中存在Key Lookup 而且消耗佔比很高,如上面強制索引的計劃,那麼我們就要想到的 在索引中包含那些SELECT 的列!如果消耗低,邏輯讀少,如上面bigproduct 表中的Key Lookup 就可以忽略(如果你追求完美,也一樣最佳化就可以了)。

   包含列的圖形化建立 : @秋仙 特意給你的說明

   

   

   語句建立就是 :

   

CREATE NONCLUSTERED INDEX TransactionDate包含ProductID_QuantityON [dbo].[bigTransactionHistory] ([TransactionDate])------INCLUDE 就是包含列INCLUDE ([ProductID],[Quantity])GO

 

 

 

   下面我們添加一下看看效果 :

   

 

   

 

  添加select 索引欄位後可以看出的現象:

  1. 最佳化器自己選擇了index seek
  2. bigtransactionhistory佔比最高的Key Lookup消失了
  3. 邏輯讀由原來無索引的14W變成1W
  4. bigtransactionhistory表還提示缺少索引?

   

   通過最佳化索引添加select 欄位,我們看出語句又一次得到了提升 bigtransactionhistory 從表掃描變成索引尋找,邏輯讀由14W變成 1W!這是一個質的飛躍啊!

CREATE NONCLUSTERED INDEX TransactionDate包含ProductID_QuantityON [dbo].[bigTransactionHistory] ([TransactionDate])------INCLUDE 就是包含列INCLUDE ([ProductID],[Quantity])GO

   那為什麼還提示缺少索引呢? 建立一下試試吧!

  索引再最佳化加入表關聯列

  按照提示我們建立索引 : 和上一個索引的不同 ProductID 列由包含列變成了索引列!

USE [AdventureWorks2012]GOCREATE NONCLUSTERED INDEX ProductID_TransactionDate包含QuantityON [dbo].[bigTransactionHistory] ([ProductID],[TransactionDate])INCLUDE ([Quantity])

 

  我們看一下效果:

  

 

  

 

  再次最佳化索引以後可以看到以下幾個現象

  1. bigtransactionhistory表還是索引尋找index seek
  2. bigtransactionhistory依然沒有了Key Lookup
  3. 兩表關聯的hash join 變成了nested loops
  4. 並行計劃變成了串列
  5. 邏輯讀又從1W 變成18

 

  又一次質的飛躍!讀從原來的14W 變成1W 又變成18,這樣大大減少了記憶體和IO的消耗,另外並行計劃也變成了串列,無疑又減少了大量CPU的消耗!語句時間,我想這裡就不用多說了吧?

  

  高能預警:這裡所說的hash join,並行變串列,不懂的朋友可以在百度自行學習,這裡只是針對當前語句的情況,不能一概而論!

 

 

 

  精簡你的索引

  大家都知道,索引會導致update、insert、delete操作變慢!那麼盡量精簡你的索引就是一個很重要的話題了!

   上面的最佳化過程中我們建立了幾個索引,以bigTransactionHistory為例來看一下:

  

   指令碼這裡就不貼了,其實我們最後建立的索引 ProductID_TransactionDate包含Quantity 已經包含了前兩個索引,而且可以說無論任何類似語句都使用ProductID_TransactionDate包含Quantity 就可以了!

   那麼我們就可以清除前兩個索引!

    

   

 

 

 

 

--------------部落格地址---------------------------------------------------------------------------------------

Expert 診斷最佳化系列 http://www.cnblogs.com/double-K/

 

 

-----------------------------------------------------------------------------------------------------

 

  至此語句的最佳化算是結束了,留下的就是bigproduct 依然有一個Key Lookup可以最佳化,可以仿照上面的繼續最佳化,這裡就不細說了。語句只是經過了簡單的索引最佳化就從一輛2手QQ變成了法拉利,是不是很神奇?

  這就是索引的重要性!

 

  開篇小測試你做對了嗎?如果沒做對那麼這麼請你自行類比一個情境再現本篇的話題吧!

 

-----------------------------------------------------------------------------------------------------

  總結 : 往往一個系統的整體緩慢都是因為索引問題導致的,最佳化索引是對你系統最簡單的保養!

      不要小看一條語句的威力,一條語句足可以讓你的系統徹底無法工作!

     

     一個問題隨之而來語句一條一條漫無目的的最佳化嗎?我怎麼找出系統的問題語句?怎麼樣的一個優先順序? 

     請參見前文 : Expert 診斷最佳化系列------------------語句調優三板斧

     後一篇我將使用 Expert for sqlserver  工具講述怎麼樣針對重點語句調索引,喜歡的看官請mark了! Expert 診斷最佳化系列-------------針對重點語句調索引

 

 ----------------------------------------------------------------------------------------------------

註:此文章為原創,歡迎轉載,請在文章頁面明顯位置給出此文連結!
若您覺得這篇文章還不錯請點擊下右下角的推薦,非常感謝!

  引用高大俠的一句話 :“拒絕SQL Server背鍋,從我做起!”

為了方便閱讀給出系列文章的導讀連結:

SQL SERVER全面最佳化-------Expert for SQL Server 診斷系列

 

 

 

 

 

 

----------------------深入索引原理推薦部落格--------------------------

目測這幾篇文章每篇的編寫時間都要超過10小時,非常值得閱讀!

pursuer.chen 的部落格

SQL Server 深入解析索引儲存(上)SQL Server 深入解析索引儲存(中)SQL Server 深入解析索引儲存(下)

 

樺仔的部落格

SQLSERVER叢集索引與非叢集索引的再次研究(上)SQLSERVER叢集索引與非叢集索引的再次研究(下)

     

SQL SERVER全面最佳化-------索引有多重要?

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.