Oracle 資料庫中建立合理的資料庫索引

來源:互聯網
上載者:User

筆者認為,在建立索引時要做到三個適當,即在適當的表上、適當的列上建立適當數量的索引。雖然這可以通過一句話來概括最佳化的索引的基本準則,但是要做到這一點的話,需要資料庫管理員做出很大的努力。具體的來說,要做到這個三個適當有如下幾個要求。
  一、 根據表的大小來建立索引。
  雖然給表建立索引,可以提高查詢的效率。但是資料庫管理員需要注意的是,索引也需要一定的開銷的。為此並不是說給所有的表都建立索引,那麼就可以提高資料庫的效能。這個認識是錯誤的。恰恰相反,如果不管三七二十一,給所有的表都建立了索引,那麼其反而會給資料庫的效能造成負面的影響。因為此時濫用索引的開銷可能已經遠遠大於由此帶來的效能方面的收益。所以筆者認為,資料庫管理員首先需要做到,為合適的表來建立索引,而不是為所有的表建立索引。
  一般來說,不需要為比較小的表建立索引。如在一個ERP系統的資料庫中,department表用來儲存企業部門的資訊。一般企業的部分也就十幾個,最多不會超過一百個。這100條記錄對於人來說,可能算是比較多了。但是對於電腦來說,這給他塞塞牙縫都還不夠。所以,對類似的小表沒有必要建立索引。因為即使建立了索引,其效能也不會得到很大的改善。相反索引建立的開銷,如維護成本等等,要比這個要大。也就是說,付出的要比得到的多,顯然違反常理。
  另外,就是對於超大的表,也不一定要建立索引。有些表雖然比較大,記錄數量非常的多。但是此時為這個表建立索引並一定的合適。如系統中有一張表,其主要用來儲存資料庫中的一些變更資訊。往往這些資訊只給資料庫管理員使用。此時為這張表建立索引的話,反而不合適。因為這張表很少用到,只有在出問題的時候才需要查看。其次其即使查看,需要查詢的紀錄也不會很多,可能就是最近一周的更新記錄等等。對於對於一些超大的表,建立索引有時候往往不能夠達到預計的效果。而且在打表上建立索引,其索引的開銷要比普通的表大的多。那麼到底是否給大表建立索引呢?筆者認為,主要是看兩個方面的內容。首先是需要關注一下,在這張大表中經常需要查詢的記錄數量。一般來說,如果經常需要查詢的資料不超過10%到15%的話,那就沒有必要為其建立索引的必要。因為此時建立索引的開銷可能要比效能的改善大的多。這個比例只是一個經驗的資料。如果資料庫管理員需要得出一個比較精確的結論,那麼就需要進行測試分析。即資料庫管理員需要測試一下全表掃描的時間,看看其是否比建立索引後的查詢時間要長或者短。如果是長的話,則說明有建立索引的必要。但是如果沒有的話,則說明還是全表掃描速度來的快。此時也就沒有必要建立索引了。
  總之,在考慮是否該為表建立索引時,一般來說小表沒有建立索引的必要。而對於打表的話,則需要進行實際情況實際分析。簡單一點的,可以根據大致的比率來確定。如果要精確一點的,則可以進行全表掃描效能分析,以判斷建立索引後是否真的如預期那樣改善了資料庫效能。
  二、 根據列的特徵來建立索引。
  列的特點不同,索引建立的效果也不同。資料庫管理員需要瞭解為哪些列建立索引可以起到事倍功半的效果。同時也需要瞭解為哪些列建立索引反而起到的是事倍功半的效果。這有利於他們瞭解到底給為怎麼樣的欄位建立索引。
  根據筆者的經驗,往往為如下特徵的列建立索引能夠起到比較明顯的效果。如對於一些重複內容比較少的列,特別是對於那些定義了唯一約束的列。在這些列上建立索引,往往可以起到非常不錯的效果。如對於一些null值的列與非Null值的列混合情況下,如果使用者需要經常查詢所有的非Null值記錄的列,則最好為其設定索引。如果經常需要多表串連查詢,在用與串連的列上設定索引可以達到事半功倍的效果。
  可見,索引設定的是否恰當,不僅跟資料庫設計架構有關,而且還跟企業的經濟業務相關。為此,對於一些套裝軟體,雖然一開始資料庫管理員已經做了索引的最佳化工作。但是隨著後來經濟資料的增加,這個索引的效果會越來越打折扣。這主要是因為記錄的表化影響到了索引最佳化的效果。所以筆者建議各位元據庫管理員,即使採用的是大牌軟體公司的套裝軟體,也需要隔一段時間,如一年,對資料庫的索引進行最佳化。該去掉的去掉,該調整的調整,以提高資料庫的效能。
  如在資料庫中有一張表是用來儲存使用者資訊的。其中有個欄位社會安全號碼碼,這是一個唯一的欄位。在資料庫設計時,給這個欄位建立了索引。但是當這個資料庫投入使用之後,使用者不怎麼輸入使用者的社會安全號碼碼。而且平時也基本不按這個號碼來進行查詢。當記錄月來月多時,這個社會安全號碼碼上的索引欄位不但不能夠改善資料庫的查詢效能,反而成了雞肋。對於這些有很多NULL值的列,而且不會經常查詢所有的非NULL值記錄的列,資料庫管理員要下決心,即使清除這些列上的索引。
  所以說索引的最佳化與調整是一個動態過程,並不是說資料庫設計好之後就不需要經過調整。資料庫管理員往往需要根據記錄的變化情況,來進行適當的變更。以提高索引的效果。
  三、 在一個表上建立多少索引合適?
  雖然說,在表上建立索引的數量沒有限制,但是決不是越多越好。也就是說,在建立索引這項事情上,1+1〉2往往不成立。有時候,建立索引越多,其可能會得到適得其反的效果。那麼在一個表上,到底給建立多少索引合適呢?這個沒有一個明確的標準。而是需要資料庫管理員根據實際的用途以及資料庫中記錄的情況,來進行判斷。
  通常來說,表的索引越多,其查詢的速度也就越快。但是,表的更新速度則會降低。這主要是因為表的更新(如往表中插入一條記錄)速度,反而隨著索引的增加而增加。這主要是因為,在更新記錄的同時需要更新相關的索引資訊。為此,到底在表中建立多少索引合適,就需要在這個更新速度與查詢速度之間取得一個均衡點。如對於一些資料倉儲或者決策型資料庫系統,其主要用來進行查詢。相關的記錄往往是在資料庫初始化的時候倒入。此時,設定的索引多一點,可以提高資料庫的查詢效能。同時因為記錄不怎麼更新,所以索引比較多的情況下,也不會影響到更新的速度。即使在起初的時候需要匯入大量的資料,此時也可以先將索引禁用掉。等到資料匯入完畢後,再啟用索引。可以通過這種方式來減少索引對資料更新的影響。相反,如果那些表中經常需要更新記錄,如一些事務型的應用系統,資料更新操作是家常便飯的事情。此時如果在一張表中建立過多的索引,則會影響到更新的速度。由於更新操作比較頻繁,所以對其的負面影響,要比查詢效率提升要大的多。此時就需要限制索引的數量,只在一些必要的欄位上建立索引。
  筆者在平時資料庫最佳化時,往往會根據這些表的用途來為列設定索引。可以查詢相關的動態視圖,看看對於這張表的操作,是更新操作(包括更新、刪除、插入等等)占的比例大,還是查詢操作占的比例大。當過多的索引已經影響到更新操作的速度時,則資料庫管理員就需要先禁用某些索引,以提高資料庫的效能。
  總之,在適當的表、適當的列上建立適當的索引。這一句話包含的意思有很多,以上內容只是一部分內容。俗話說,師傅領進門,修行靠自身。筆者在這裡指能夠點到為止。一些具體的索引最佳化內容還是需要各位讀者在日常工作中去體會與總結。
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.