資料庫效能最佳化二:資料庫表最佳化

來源:互聯網
上載者:User
  資料庫最佳化包含以下三部分,資料庫自身的最佳化,資料庫表最佳化,程式操作最佳化.此文為第二部分  資料庫效能最佳化二:資料庫表最佳化

 

  最佳化①:設計正常化表,消除資料冗餘

  資料庫範式是確保資料庫結構合理,滿足各種查詢需要、避免資料庫操作異常的資料庫設計方式。滿足範式要求的表,稱為正常化表,範式產生於20世紀70年代初,一般表設計滿足前三範式就可以,在這裡簡單介紹一下前三範式

先給大家看一下百度百科給出的定義:

第一範式(1NF)無重複的列

  所謂第一範式(1NF)是指在關聯式模式中,對域添加的一個規範要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子資料項目,而不能是集合,數組,記錄等非原子資料項目。   

第二範式(2NF)屬性

  在1NF的基礎上,非碼屬性必須完全依賴於碼[在1NF基礎上消除非主屬性對主碼的部分函數依賴] 

第三範式(3NF)屬性

在1NF基礎上,任何非主屬性不依賴於其它非主屬性[在2NF基礎上消除傳遞依賴] 

通俗的給大家解釋一下(可能不是最科學、最準確的理解)

  第一範式:屬性(欄位)的原子性約束,要求屬性具有原子性,不可再分割;
  第二範式:記錄的惟一性約束,要求記錄有惟一標識,每條記錄需要有一個屬性來做為實體的唯一標識。
  第三範式:屬性(欄位)冗餘性的約束,即任何欄位不能由其他欄位派生出來,在通俗點就是:主鍵沒有直接關係的資料列必須消除(消除的辦法就是再建立一個表來存放他們,當然外鍵除外)

如果資料庫設計達到了完全的標準化,則把所有的表通過關鍵字串連在一起時,不會出現任何資料的複本(repetition)。標準化的優點是明顯的,它避免了資料冗餘,自然就節省了空間,也對資料的一致性(consistency)提供了根本的保障,杜絕了資料不一致的現象,同時也提高了效率。 

 

最佳化②:適當的冗餘,增加計算資料行

  資料庫設計的實用原則是:在資料冗餘和處理速度之間找到合適的平衡點 

滿足範式的表一定是正常化的表,但不一定是最佳的設計。很多情況下會為了提高資料庫的運行效率,常常需要降低範式標準:適當增加冗餘,達到以空間換時間的目的。比如我們有一個表,產品名稱,單價,庫存量,總價值。這個表是不滿足第三範式的,因為“總價值”可以由“單價”乘以“數量”得到,說明“金額”是冗餘欄位。但是,增加“總價值”這個冗餘欄位,可以提高查詢統計的速度,這就是以空間換時間的作法。合理的冗餘可以分散資料量大的表的並發壓力,也可以加快特殊查詢的速度,冗餘欄位可以有效減少資料庫表的串連,提高效率。

其中"總價值"就是一個計算資料行,在資料庫中有兩種類型:資料列和計算資料行,資料列就是需要我們手動或者程式給予賦值的列,計算資料行是源於表中其他的資料計算得來,比如這裡的"總價值"

在SQL中建立計算資料行:

create table table1
 (
   number decimal(18,4),
   price money,
   Amount as number*price --這裡就是計算資料行
 ) 

也可以再表設計中,直接手動添加或修改列屬性即可:如

 

是否持久性,我們也需要注意:

如果是'否',說明這列是虛擬列,每次查詢的時候計算一次,而且那麼它是不可以用來做check,foreign key或not null約束。 

如果是'是',就是真實的列,不需要每次都計算,可以再此列上建立索引等等。

 

最佳化③:索引

索引是一個表最佳化的重要指標,在表最佳化中佔有極其重要的成分,所以將單獨寫一章”SQL索引一步到位“去告訴大家如何建立和最佳化索引

 

最佳化④:主鍵和外鍵的必要性

主鍵與外鍵的設計,在全域資料庫的設計中,佔有重要地位。 因為:主鍵是實體的抽象,主鍵與外鍵的配對,表示實體之間的串連。

主鍵:根據第二範式,需要有一個欄位去標識這條記錄,主鍵無疑是最好的標識,但是很多表也不一定需要主鍵,但是對於資料量大,查詢頻繁的資料庫表,一定要有主鍵,主鍵可以增加效率、防止重複等優點。

主鍵的選擇也比較重要,一般選擇總的長度小的鍵,小的鍵的比較速度快,同時小的鍵可以使主鍵的B樹結構的層次更少。
主鍵的選擇還要注意組合主鍵的欄位次序,對於組合主鍵來說,不同的欄位次序的主鍵的效能差別可能會很大,一般應該選擇重複率低、單獨或者組合查詢可能性大的欄位放在前面。

外鍵:外鍵作為資料庫物件,很多人認為麻煩而不用,實際上,外鍵在大部分情況下是很有用的,理由是:外鍵是最高效的一致性維護方法

資料庫的一致性要求,依次可以用外鍵、CHECK約束、規則約束、觸發器、用戶端程式,一般認為,離資料越近的方法效率越高。
謹慎使用串聯刪除和串聯更新,串聯刪除和串聯更新作為SQL SERVER 2000當年的新功能,在2005作了保留,應該有其可用之處。我這裡說的謹慎,是因為串聯刪除和串聯更新有些突破了傳統的關於外鍵的定義,功能有點太過強大,使用前必須確定自己已經把握好其功能範圍,否則,串聯刪除和串聯更新可能讓你的資料莫名其妙的被修改或者丟失。從效能看串聯刪除和串聯更新是比其他方法更高效的方法。

 

最佳化⑤:預存程序、視圖、函數的適當使用

很多人習慣將複雜操作都放在應用程式層,但如果你要最佳化資料訪問效能,將SQL代碼移植到資料庫上(使用預存程序,視圖,函數和觸發器)也是一個很大的改進原因如下:

1. 預存程序減少了網路傳輸、處理及儲存的工作量,且經過編譯和最佳化,執行速度快,易於維護,且表的結構改變時,不影響用戶端的應用程式 

2、使用預存程序,視圖,函數有助於減少應用程式中SQL複製的弊端,因為現在只在一個地方集中處理SQL

3、使用資料庫物件實現所有的TSQL有助於分析TSQL的效能問題,同時有助於你集中管理TSQL代碼,更好的重構TSQL代碼

 

最佳化⑥:傳說中的‘三少原則’

①:資料庫的表越少越好

②:表的欄位越少越好

③:欄位中的組合主鍵、複合式索引越少越好

當然這裡的少是相對的,是減少資料冗餘的重要設計理念。

 

最佳化⑦:分割你的表,減小表尺寸

  如果你發現某個表的記錄太多,例如超過一千萬條,則要對該表進行水平分割。水平分割的做法是,以該表主鍵的某個值為界線,將該表的記錄水平分割為兩個表。

如果你若發現某個表的欄位太多,例如超過八十個,則垂直分割該表,將原來的一個表分解為兩個表

 

最佳化⑧:欄位設計原則

欄位是資料庫最基本的單位,其設計對效能的影響是很大的。需要注意如下:

A、資料類型盡量用數字型,數字型的比較比字元型的快很多。

B、 資料類型盡量小,這裡的盡量小是指在滿足可以預見的未來需求的前提下的。

C、 盡量不要允許NULL,除非必要,可以用NOT NULL+DEFAULT代替。

D、少用TEXT和IMAGE,二進位欄位的讀寫是比較慢的,而且,讀取的方法也不多,大部分情況下最好不用。

E、 自增欄位要慎用,不利於資料移轉

 

 

  以上可能部分文章借鑒了其他的網路文章,本文僅為學習使用,轉載請註明出處

                                   --------------AK(老K):2012-12-28  

 

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.