戲談資料庫三範式,資料庫範式
資料庫三範式想必大家並不陌生,官方的解釋很抽象,初學者比較難理解。對於這塊知識,我是看了會,會了忘,忘了再看。每當別人問我的時候,必須先看看教材,回顧一段時間才能理清。
為什麼當別人提問時不能立馬把三範式的經典思想說出來呢?通過聽米老師的“如何高效學習”這堂課,我發現原因是我自己沒有融入到三範式中,三範式沒有和自己發生關係。下面,我用三個有趣的小故事協助大家快速、深刻的理解三範式的含義。
第一範式,官方解釋:關係模式R的每個關係r的屬性值都是不可分的原子值。這個官方解釋還不算太難,比如我們想把“電話號碼”作為資料庫欄位,在“電話號碼”下面又分“手機號碼”和“有線電話號碼”,這就違反了第一範式,用我的話說就是“把事說清了”。你只說“電話號碼”,我知道你說的是“手機號碼”還是“有線電話號碼”?
第二範式,官方解釋:非主屬性必須完全函數依賴於R的主關係鍵。怎麼樣,有點暈了吧!比如:在SCD表中,有欄位SNO,SN,Age,Dept,MN,CNo,Score。知道SNo可以確定SN、Age、Dept、MN,知道SNo、CNo可以確定Score。這個事好比土匪們選大哥,小弟SN、Age、Dept、MN選舉SNo當土匪頭子,Score選舉SNo、CNo兩個人共同當土匪頭子。結果意見達不成一致,土匪們鬧分裂,一句話“只要有一個人不同意,這事就不能通過”。大哥SNo帶著小弟SN、Age、Dept、MN成立土匪旗號SD,大哥SNo又和CNo帶著小弟Score合夥成立土匪旗號SC,到此,故事告一段落。
第三範式,官方解釋:每個非主屬性都不傳遞函數依賴於R的主關係鍵。這個怎麼樣,徹底暈了吧!比如:在SD表中,知道SNo可以確定Dept,知道Dept可以確定MN(系主任名)。這事咱接著上面第二範式的土匪故事接著講,大哥SNo有小弟SN、Age、Dept、MN,但Dept特別有才,又把MN招為自己的小弟,天天忽悠MN,給MN灌輸反動思想,終於有一天Dept帶著MN獨立了,成立了土匪旗號D。大哥SNo感覺SD已經不完整了,把土匪旗號改為S。SNo經過這次教訓,決定下道命令:“一個人只能扮演一個角色”,否則就是不符合三範式,造成關係模式分解。
到此故事講完了,想必通過這個小故事,大家肯定把三範式的精髓深深的刻在了腦中。
資料庫三範式
關聯式資料庫的幾種設計範式介紹
1、第一範式(1NF)
在任何一個關聯式資料庫中,第一範式(1NF)是對關係模式的基本要求,不滿足第一範式(1NF)的資料庫就不是關聯式資料庫。
所謂第一範式(1NF)是指資料庫表的每一列都是不可分割的基本資料項目,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性,就可能需要定義一個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關聯性。在第一範式(1NF)中表的每一行只包含一個執行個體的資訊。例如,對於圖3-2 中的員工資訊表,不能將員工資訊都放在一列中顯示,也不能將其中的兩列或多列在一列中顯示;員工資訊表的每一行只表示一個員工的資訊,一個員工的資訊在表中只出現一次。簡而言之,第一範式就是無重複的列。
2、第二範式(2NF)
第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求資料庫表中的每個執行個體或行必須可以被唯一地區分。為實現區分通常需要為表加上一個列,以儲存各個執行個體的唯一標識。3-2 員工資訊表中加上了員工編號(emp_id)列,因為每個員工的員工編號是唯一的,因此每個員工可以被唯一區分。這個唯一屬性列被稱為主關鍵字或主鍵、主碼。
第二範式(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上一個列,以儲存各個執行個體的唯一標識。簡而言之,第二範式就是非主屬性非部分依賴於主關鍵字。
3、第三範式(3NF)
滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個資料庫表中不包含已在其它表中已包含的非主關鍵字資訊。例如,存在一個部門資訊表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等資訊。那麼在圖3-2的員工資訊表中列出部門編號後就不能再將部門名稱、部門簡介等與部門有關的資訊再加入員工資訊表中。如果不存在部門資訊表,則根據第三範式(3NF)也應該構建它,否則就會有大量的資料冗餘。簡而言之,第三範式就是屬性不依賴於其它非主屬性。
資料庫三範式
通俗地理解三個範式,對於資料庫設計大有好處。在資料庫設計中,為了更好地應用三個範式,就必須通俗地理解三個範式(通俗地理解是夠用的理解,並不是最科學最準確的理解):
第一範式:1NF是對屬性的原子性約束,要求屬性具有原子性,不可再分解;
第二範式:2NF是對記錄的惟一性約束,要求記錄有惟一標識,即實體的惟一性;
第三範式:3NF是對欄位冗餘性的約束,即任何欄位不能由其他欄位派生出來,它要求欄位沒有冗餘。
沒有冗餘的資料庫設計可以做到。但是,沒有冗餘的資料庫未必是最好的資料庫,有時為了提高運行效率,就必須降低範式標準,適當保留冗餘資料。具體做法是: 在概念資料模型設計時遵守第三範式,降低範式標準的工作放到物理資料模型設計時考慮。降低範式就是增加欄位,允許冗餘。