若符合這兩個條件,則可以說明這個資料庫的正常化水平還是比較高的。當然這是兩個泛泛而談的指標。為了達到資料庫設計正常化的要求,一般來說,需要符合以下五個要求。
要求一:表中應該避免可為空白的列。
雖然表中允許空列,但是,空欄位是一種比較特殊的資料類型。資料庫在處理的時候,需要進行特殊的處理。如此的話,就會增加資料庫處理記錄的複雜性。當表中有比較多的空欄位時,在同等條件下,資料庫處理的效能會降低許多。
所以,雖然在資料庫表設計的時候,允許表中具有空欄位,但是,我們應該盡量避免。若確實需要的話,我們可以通過一些折中的方式,來處理這些空欄位,讓其對資料庫效能的影響降低到最少。
一是通過設定預設值的形式,來避免空欄位的產生。如在一個人事管理系統中,有時候社會安全號碼碼欄位可能允許為空白。因為不是每個人都可以記住自己的社會安全號碼碼。而在員工報到的時候,可能身份證沒有帶在身邊。所以,社會安全號碼碼欄位往往不能及時提供。為此,社會安全號碼碼欄位可以允許為空白,以滿足這些特殊情況的需要。但是,在資料庫設計的時候,則可以做一些處理。如當使用者沒有輸入內容的時候,則把這個欄位的預設值設定為0或者為N/A。以避免空欄位的產生。
二是若一張表中,允許為空白的列比較多,接近表全部列數的三分之一。而且,這些列在大部分情況下,都是可有可無的。若資料庫管理員遇到這種情況,筆者建議另外建立一張副表,以儲存這些列。然後通過關鍵字把主表跟這張副表關聯起來。將資料存放區在兩個獨立的表中使得主表的設計更為簡單,同時也能夠滿足儲存空值資訊的需要。
要求二:表不應該有重複的值或者列。
如現在有一個進銷存管理系統,這個系統中有一張產品基本資料表中。這個產品開發有時候可以是一個人完成,而有時候又需要多個人合作才能夠完成。所以,在產品基本資料表產品開發人員這個欄位中,有時候可能需要填入多個開發人員的名字。
如進銷存管理中,還需要對客戶的連絡人進行管理。有時候,企業可能只知道客戶一個採購員的姓名。但是在必要的情況下,企業需要對客戶的採購代表、倉庫人員、財務人員共同進行管理。因為在訂單上,可能需要填入採購代表的名字;可是在出貨單上,則需要填入倉庫管理員的名字等等。
為瞭解決這個問題,有多種實現方式。但是,若設計不合理的話在,則會導致重複的值或者列。如我們也可以這麼設計,把客戶資訊、連絡人都放入同一張表中。為瞭解決多個連絡人的問題,可以設定第一連絡人、第一連絡人電話、第二連絡人、第二連絡人電話等等。若還有第三連絡人、第四連絡人等等,則往往還需要加入更多的欄位。
可是這麼設計的話,會產生一系列的問題。如客戶的採購員流動性比較大,在一年內換了六個採購員。此時,在系統中該如何管理呢?難道就建立六個連絡人欄位?這不但會導致空欄位的增加,還需要頻繁的更改資料庫表結構。明顯,這麼做是不合理的。也有人說,可以直接修改採購員的名字呀。可是這麼處理的話,會把原先採購訂單上採購員的名字也改變了。因為採購單上客戶採購員資訊在資料庫中儲存的不是採購員的名字,而只是採購員對應的一個編號。在編號不改而名字改變了的情況下,採購訂單上顯示的就是更改後的名字。這不利於時候的追蹤。
所以,在資料庫設計的時候要盡量避免這種重複的值或者列的產生。筆者建議,若資料庫管理員遇到這種情況,可以改變一下策略。如把客戶連絡人另外設定一張表。然後通過客戶ID把供應商資訊表跟客戶連絡人資訊表串連起來。也就是說,盡量將重複的值放置到一張獨立的表中進行管理。然後通過視圖或者其他手段把這些獨立的表聯絡起來。
要求三:表中記錄應該有一個唯一的標識符。
在資料庫表設計的時候,資料庫管理員應該養成一個好習慣,用一個ID號來唯一的標識行記錄,而不要通過名字、編號等欄位來對紀錄進行區分。每個表都應該有一個ID列,任何兩個記錄都不可以共用同一個ID值。另外,這個ID值最好有資料庫來進行自動管理,而不要把這個任務給前台應用程式。否則的話,很容易產生ID值不統一的情況。
另外,在資料庫設計的時候,最好還能夠加入行號。如在銷售訂單管理中,ID號是使用者不能夠維護的。但是,行號使用者就可以維護。如在銷售訂單的行中,使用者可以通過調整行號的大小來對訂單行進行排序。通常情況下,ID列是以1為單位遞進的。但是,行號就要以10為單位累進。如此,正常情況下,行號就以10、20、30依次擴充下去。若此時使用者需要把行號為30的紀錄調到第一行顯示。此時,使用者在不能夠更改ID列的情況下,可以更改行號來實現。如可以把行號改為1,在排序時就可以按行號來進行排序。如此的話,原來行號為30的紀錄現在行號變為了1,就可以在第一行中顯示。這是在實際應用程式設計中對ID列的一個有效補充。這個內容在教科書上是沒有的。需要在實際應用程式設計中,才會掌握到這個技巧。
要求四:資料庫物件要有統一的首碼名。
一個比較複雜的應用系統,其對應的資料庫表往往以千計。若讓資料庫管理員看到對象名就瞭解這個資料庫物件所起的作用,恐怕會比較困難。而且在資料庫物件引用的時候,資料庫管理員也會為不能迅速找到所需要的資料庫物件而頭疼。
為此,筆者建立,在開發資料庫之前,最好能夠花一定的時間,去制定一個資料庫物件的首碼命名規範。如筆者在資料庫設計時,喜歡跟前台應用程式協商,確定合理的命名規範。筆者最常用的是根據前台應用程式的模組來定義後台資料庫物件首碼名。如跟物料管理模組相關的表可以用M為首碼;而以訂單管理相關的,則可以利用C作為首碼。具體採用什麼首碼可以以使用者的愛好而定義。但是,需要注意的是,這個命名規範應該在資料庫管理員與前台應用程式開發人員之間達成共識,並且嚴格按照這個命名規範來定義對象名。
其次,表、視圖、函數等最好也有統一的首碼。如視圖可以用V為首碼,而函數則可以利用F為首碼。如此資料庫管理員無論是在日常管理還是對象引用的時候,都能夠在最短的時間內找到自己所需要的對象。
要求五:盡量只儲存單一實體類型的資料。
這裡將的實體類型跟資料類型不是一回事,要注意區分。這裡講的實體類型是指所需要描述對象的本身。筆者舉一個例子,估計大家就可以明白其中的內容了。如現在有一個圖書館裡系統,有圖書基本資料、作者資訊兩個實體物件。若使用者要把這兩個實體物件資訊放在同一張表中也是可以的。如可以把表設計成圖書名字、圖書作者等等。可是如此設計的話,會給後續的維護帶來不少的麻煩。
如當後續有圖書出版時,則需要為每次出版的圖書增加作者資訊,這無疑會增加額外的儲存空間,也會增加記錄的長度。而且若作者的情況有所改變,如住址改變了以後,則還需要去更改每本書的記錄。同時,若這個作者的圖書從資料庫中全部刪除之後,這個作者的資訊也就蕩然無存了。很明顯,這不符合資料庫設計正常化的需求。
遇到這種情況時,筆者建議可以把上面這張表分解成三種獨立的表,分別為圖書基本資料表、作者基本資料表、圖書與作者對應表等等。如此設計以後,以上遇到的所有問題就都引刃而解了。
以上五條是在資料庫設計時達到正常化水平的基本要求。除了這些另外還有很多細節方面的要求,如資料類型、預存程序等等。而且,資料庫規範往往沒有技術方面的嚴格限制,主要依靠資料庫管理員日常工作經驗的累積。