1. 設計資料庫之前(需求分析階段)
1) 理解客戶需求,詢問使用者如何看待未來需求變化。讓客戶解釋其需求,而且隨著開發的繼續,還要經常詢問客戶保證其需求仍然在開發的目的之中。
2) 瞭解企業業務可以在以後的開發階段節約大量的時間。
3) 重視輸入輸出。
在定義資料庫表和欄位需求(輸入)時,首先應檢查現有的或者已經設計出的報表、查詢和視圖(輸出)以決定為了支援這些輸出哪些是必要的表和欄位。
舉例:假如客戶需要一個報表按照郵遞區號排序、分段和求和,你要保證其中包括了單獨的郵遞區號欄位而不要把郵遞區號糅進地址欄位裡。
4) 建立資料字典和ER 圖表
ER 圖表和資料字典可以讓任何瞭解資料庫的人都明確如何從資料庫中獲得資料。ER圖對錶明表之間關係很有用,而資料字典則說明了每個欄位的用途以及任何可能存在的別名。對SQL 運算式的文檔化來說這是完全必要的。
5) 定義標準的對象命名規範
資料庫各種對象的命名必須規範。
2. 表和欄位的設計(資料庫邏輯設計)
表設計原則
1) 標準化和正常化
資料的標準化有助於消除資料庫中的資料冗餘。標準化有好幾種形式,但Third Normal Form(3NF)通常被認為在效能、擴充性和資料完整性方面達到了最好平衡。簡單來說,遵守3NF 標準的資料庫的表設計原則是:“One Fact in One Place”即某個表只包括其本身基本的屬性,當不是它們本身所具有的屬性時需進行分解。表之間的關係通過外鍵相串連。它具有以下特點:有一組表專門存放通過鍵串連起來的關聯資料。
舉例:某個存放客戶及其有關定單的3NF 資料庫就可能有兩個表:Customer 和Order。Order 表不包含定單關聯客戶的任何資訊,但表內
會存放一個索引值,該鍵指向Customer 表裡包含該客戶資訊的那一行。
事實上,為了效率的緣故,對錶不進行標準化有時也是必要的。
2) 資料驅動
採用資料驅動而非硬式編碼方式,許多策略變更和維護都會方便得多,大大增強系統的靈活性和擴充性。
舉例,假如使用者介面要訪問外部資料源(檔案、XML 文檔、其他資料庫等),不妨把相應的串連和路徑資訊儲存在使用者介面支援表裡。還有,如果使用者介面執行工作流程之類的任務(發送郵件、列印信箋、修改選項組等),那麼產生工作流程的資料也可以存放在資料庫裡。角色許可權管理也可以通過資料驅動來完成。事實上,如果過程是資料驅動的,你就可以把相當大的責任推給使用者,由使用者來維護自己的工作流程過程。
3) 考慮各種變化
在設計資料庫的時候考慮到哪些資料欄位將來可能會發生變更。
舉例,姓氏就是如此(注意是西方人的姓氏,比如女性結婚後從夫姓等)。所以,在建立系統儲存客戶資訊時,在單獨的一個資料表裡儲存姓氏欄位,而且還附加起始日和終止日等欄位,這樣就可以跟蹤這一資料條目的變化。
欄位設計原則
4) 每個表中都應該添加的3 個有用的欄位
dRecordCreationDate,在VB • 下預設是Now(),而在SQL Server 下預設為GETDATE()
sRecordCreator,在SQL Server 下預設為NOT • NULL DEFAULT USER
nRecordVersion,記錄的版本戳記;有助於準確說明記錄中出現null • 資料或者遺失資料的原因
5) 對地址和電話採用多個欄位
描述街道地址就短短一行記錄是不夠的。Address_Line1、Address_Line2 和Address_Line3 可以提供更大的靈活性。還有,電話號碼和郵件地址最好擁有自己的資料表,其間具有自身的類型和標記類別。
6) 使用角色實體定義屬於某類別的列
在需要對屬於特定類別或者具有特定角色的事物做定義時,可以用角色實體來建立特定的時間關聯關係,從而可以實現自我文檔化。
舉例:用PERSON 實體和PERSON_TYPE 實體來描述人員。比方說,當John Smith, Engineer 提升為John Smith, Director 乃至最後爬到John Smith, CIO 的高位,而所有你要做的不過是改變兩個表PERSON 和PERSON_TYPE 之間關係的索引值,同時增加一個日期/時間欄位來知道變化是何時發生的。這樣,你的PERSON_TYPE 表就包含了所有PERSON 的可能類型,比如Associate、Engineer、Director、CIO 或者CEO 等。還有個替代辦法就是改變PERSON 記錄來反映新頭銜的變化,不過這樣一來在時間上無法跟蹤個人所處位置的具體時間。
7) 選擇數字類型和文本類型盡量充足
在SQL 中使用smallint 和tinyint 類型要特別小心。比如,假如想看看月銷售總額,總額欄位類型是smallint,那麼,如果總額超過了$32,767 就不能進行計算操作了。
而ID 類型的文字欄位,比如客戶ID 或定單號等等都應該設定得比一般想象更大。假設客戶ID 為10 位元長。那你應該把資料庫表欄位的長度設為12 或者13 個字元長。但這額外佔據的空間卻無需將來重構整個資料庫就可以實現資料庫規模的增長了。
8) 增加刪除標記欄位
在表中包含一個“刪除標記”欄位,這樣就可以把行標記為刪除。在關聯式資料庫裡不要單獨刪除某一行;最好採用清除資料程式而且要仔細維護索引整體性。
3. 選擇鍵和索引(資料庫邏輯設計)
鍵選擇原則:
1) 鍵設計4 原則
為關聯欄位建立外鍵。 •
所有的鍵都必須唯一。•
避免使用複合鍵。 •
外鍵總是關聯唯一的鍵欄位。 •
2) 使用系統產生的主鍵
設計資料庫的時候採用系統產生的鍵作為主鍵,那麼實際控制了資料庫的索引完整性。這樣,資料庫和非人工機制就有效地控制了對儲存資料中每一行的訪問。採用系統產生鍵作為主鍵還有一個優點:當擁有一致的鍵結構時,找到邏輯缺陷很容易。
3) 不要用使用者的鍵(不讓主鍵具有可更新性)
在確定採用什麼欄位作為表的鍵的時候,可一定要小心使用者將要編輯的欄位。通常的情況下不要選擇使用者可編輯的欄位作為鍵。
4) 可選鍵有時可做主鍵
把可選鍵進一步用做主鍵,可以擁有建立強大索引的能力。
索引使用原則:
索引是從資料庫中擷取資料的最高效方式之一。95%的資料庫效能問題都可以採用索引技術得到解決。
1) 邏輯主鍵使用唯一的成組索引,對系統鍵(作為預存程序)採用唯一的非成組索引,對任何外鍵列採用非成組索引。考慮資料庫的空間有多大,表如何進行訪問,還有這些訪問是否主要用作讀寫。
2) 大多數資料庫都索引自動建立的主鍵欄位,但是可別忘了索引外鍵,它們也是經常使用的鍵,比如執行查詢顯示主表和所有關聯表的某條記錄就用得上。
3) 不要索引memo/note 欄位,不要索引大型欄位(有很多字元),這樣作會讓索引佔用太多的儲存空間。
4) 不要索引常用的小型表
不要為小型資料表設定任何鍵,假如它們經常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的索引維護可能比掃描資料表空間消耗更多的時間。
4. 資料完整性設計(資料庫邏輯設計)
1) 完整性實現機制:
實體完整性:主鍵
參照完整性:
父表中刪除資料:串聯刪除;受限刪除;置空值
父表中插入資料:受限插入;遞迴插入
父表中更新資料:串聯更新;受限更新;置空值
DBMS對參照完整性可以有兩種方法實現:外鍵實現機制(約束規則)和觸發器實現機制
使用者定義完整性:
NOT NULL;CHECK;觸發器
2) 用約束而非商務規則強制資料完整性
採用資料庫系統實現資料的完整性。這不但包括通過標準化實現的完整性而且還包括資料的功能性。在寫資料的時候還可以增加觸發器來保證資料的正確性。不要依賴於商務層保證資料完整性;它不能保證表之間(外鍵)的完整性所以不能強加於其他完整性規則之上。
3) 強制指示完整性
在有害資料進入資料庫之前將其剔除。啟用資料庫系統的指示完整性特性。這樣可以保持資料的清潔而能迫使開發人員投入更多的時間處理錯誤條件。
4) 使用尋找控制資料完整性
控制資料完整性的最佳方式就是限制使用者的選擇。只要有可能都應該提供給使用者一個清晰的價值列表供其選擇。這樣將減少鍵入代碼的錯誤和誤解同時提供資料的一致性。某些公用資料特別適合尋找:國家代碼、狀態碼等。
5) 採用視圖
為了在資料庫和應用程式代碼之間提供另一層抽象,可以為應用程式建立專門的視圖而不必非要應用程式直接存取資料表。這樣做還等於在處理資料庫變更時給你提供了更多的自由。
5. 其他設計技巧
1) 避免使用觸發器
觸發器的功能通常可以用其他方式實現。在偵錯工具時觸發器可能成為幹擾。假如你確實需要採用觸發器,你最好集中對它文檔化。
2) 使用常用英語(或者其他任何語言)而不要使用編碼
在建立下拉式功能表、列表、報表時最好按照英語名排序。假如需要編碼,可以在編碼旁附上使用者知道的英語。
3) 儲存常用資訊
讓一個表專門存放一般資料庫資訊非常有用。在這個表裡存放資料庫目前的版本、最近檢查/修複(對Access)、關聯設計文檔的名稱、客戶等資訊。這樣可以實現一種簡單機制追蹤資料庫,當客戶抱怨他們的資料庫沒有達到希望的要求而與你聯絡時,這樣做對非客戶機/伺服器環境特別有用。
4) 包含版本機制
在資料庫中引入版本控制機制來確定使用中的資料庫的版本。時間一長,使用者的需求總是會改變的。最終可能會要求修改資料庫結構。把版本資訊直接存放到資料庫中更為方便。
5) 編製文檔
對所有的捷徑、命名規範、限制和函數都要編製文檔。
採用給表、列、觸發器等加註釋的資料庫工具。對開發、支援和跟蹤修改非常有用。
對資料庫文檔化,或者在資料庫自身的內部或者單獨建立文檔。這樣,當過了一年多時間後再回過頭來做第2 個版本,犯錯的機會將大大減少。
6) 測試、測試、反覆測試
建立或者修訂資料庫之後,必須用使用者新輸入的資料測試資料欄位。最重要的是,讓使用者進行測試並且同使用者一道保證選擇的資料類型滿足商業要求。測試需要在把新資料庫投入實際服務之前完成。
7) 檢查設計
在開發期間檢查資料庫設計的常用技術是通過其所支援的應用程式原型檢查資料庫。換句話說,針對每一種最終表達資料的原型應用,保證你檢查了資料模型並且查看如何取出資料。
三、資料庫命名規範
1. 實體(表)的命名
1) 表以名詞或名詞短語命名,確定表名是採用複數還是單數形式,此外給表的別名定義簡單規則(比方說,如果表名是一個單詞,別名就取單詞的前4 個字母;如果表名是兩個單詞,就各取兩個單詞的前兩個字母組成4 個字母長的別名;如果表的名字由3 個單片語成,從頭兩個單詞中各取一個然後從最後一個單詞中再取出兩個字母,結果還是組成4 字母長的別名,其餘依次類推)
對工作用表來說,表名可以加上首碼WORK_ 後面附上採用該表的應用程式的名字。在命名過程當中,根據語義拼湊縮寫即可。注意,由於ORCLE會將欄位名稱統一成大寫或者小寫中的一種,所以要求加上底線。
舉例:
定義的縮寫 Sales: Sal 銷售;
Order: Ord 訂單;
Detail: Dtl 明細;
則銷售訂單明細表命名為:Sal_Ord_Dtl;
2) 如果表或者是欄位的名稱僅有一個單詞,那麼建議不使用縮寫,而是用完整的單詞。
舉例:
定義的縮寫 Material Ma 物品;
物品表名為:Material, 而不是 Ma.
但是欄位物品編碼則是:Ma_ID;而不是Material_ID
3) 所有的儲存值列表的表前面加上首碼Z
目的是將這些值列表類排序在資料庫最後。
4) 所有的冗餘類的命名(主要是累計表)前面加上首碼X
冗餘類是為了提高資料庫效率,非正常化資料庫的時候加入的欄位或者表
5) 關聯類別通過用底線串連兩個基本類之後,再加首碼R的方式命名,後面按照字母順序羅列兩個表名或者表名的縮寫。
關聯表用於儲存多對多關係。
如果被關聯的表名大於10個字母,必須將原來的表名的進行縮寫。如果沒有其他原因,建議都使用縮寫。
舉例:表Object與自身存在多對多的關係,則儲存多對多關係的表命名為:R_Object;
表 Depart和Employee;存在多對多的關係;則關聯表命名為R_Dept_Emp
2. 屬性(列)的命名
1) 採用有意義的列名,表內的列要針對鍵採用一整套設計規則。每一個表都將有一個自動ID作為主健,邏輯上的主健作為第一組候選主健來定義,如果是資料庫自動產生的編碼,統一命名為:ID;如果是自訂的邏輯上的編碼則用縮寫加“ID”的方法命名。如果鍵是數字類型,你可以用_NO 作為尾碼;如果是字元類型則可以採用_CODE 尾碼。對列名應該採用標準的首碼和尾碼。
舉例:銷售訂單的編號欄位命名:Sal_Ord_ID;如果還存在一個資料庫產生的自動編號,則命名為:ID。
2) 所有的屬性加上有關類型的尾碼,注意,如果還需要其它的尾碼,都放在類型尾碼之前。
注: 資料類型是文本的欄位,類型尾碼TX可以不寫。有些類型比較明顯的欄位,可以不寫類型尾碼。
3) 採用首碼命名
給每個表的列名都採用統一的首碼,那麼在編寫SQL運算式的時候會得到大大的簡化。這樣做也確實有缺點,比如破壞了自動表串連工具的作用,後者把公用列名同某些資料庫聯絡起來。
3. 視圖的命名
1) 視圖以V作為首碼,其他命名規則和表的命名類似;
2) 命名應盡量體現各視圖的功能。
4. 觸發器的命名
觸發器以TR作為首碼,觸發器名為相應的表名加上尾碼,Insert觸發器加"_I",Delete觸發器加"_D",Update觸發器加"_U",如: TR_Customer_I,TR_Customer_D,TR_Customer_U。
5. 預存程序名
預存程序應以"UP_"開頭,和系統的預存程序區分,後續部分主要以動賓形式構成,並用底線分割各個組成部分。如增加代理商的帳戶的預存程序為"UP_Ins_Agent_Account"。
6. 變數名
變數名採用小寫,若屬於片語形式,用底線分隔每個單詞,如@my_err_no。
7. 命名中其他注意事項
1) 以上命名都不得超過30個字元的系統限制。變數名的長度限制為29(不包括標識字元@)。
2) 資料對象、變數的命名都採用英文字元,禁止使用中文命名。絕對不要在對象名的字元之間留空格。
3) 小心保留詞,要保證你的欄位名沒有和保留詞、資料庫系統或者常用存取方法衝突
5) 保持欄位名和類型的一致性,在命名欄位並為其指定資料類型的時候一定要保證一致性。假如資料類型在一個表裡是整數,那在另一個表裡可就別變成字元型了