1. 程式人生 > >資料庫-三正規化總結

資料庫-三正規化總結

【前言】
設計關係資料庫時,遵從不同的規範要求,設計出合理的關係型資料庫,這些不同的規範要求被稱為不同的正規化,各種正規化呈遞次規範,越高的正規化資料庫冗餘越小。
目前關係資料庫有六種正規化:第一正規化(1NF)、第二正規化(2NF)、第三正規化(3NF)、巴斯-科德正規化(BCNF)、第四正規化(4NF)和第五正規化(5NF,又稱完美正規化)。
滿足最低要求的正規化是第一正規化(1NF)。在第一正規化的基礎上進一步滿足更多規範要求的稱為第二正規化(2NF),其餘正規化以次類推。
一般說來,資料庫只需滿足第三正規化(3NF)就行了。
【內容】
第一正規化(1NF)消除重複列
所謂第一正規化(1NF)是指在關係模型中,對域新增的一個規範要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子資料項,而不能是集合,陣列,記錄等非原子資料項。
即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一正規化(1NF)表中的每個域值只能是實體的一個屬性或一個屬性的一部分。

第二正規化(2NF)消除部分函式依賴
在1NF的基礎上,非碼屬性必須完全依賴於候選碼(在1NF基礎上消除非主屬性對主碼的部分函式依賴)
第二正規化(2NF)是在第一正規化(1NF)的基礎上建立起來的,即滿足第二正規化(2NF)必須先滿足第一正規化(1NF)。第二正規化(2NF)要求資料庫表中的每個例項或記錄必須可以被唯一地區分。選取一個能區分每個實體的屬性或屬性組,作為實體的唯一標識。
第二正規化(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上一個列,以儲存各個例項的唯一標識。簡而言之,第二正規化就是在第一正規化的基礎上屬性完全依賴於主鍵。
例如:
首先我們考慮,把所有這些資訊放到一個表中(學號,學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話)下面存在如下的依賴關係。
(學號, 課程名稱) → (姓名, 年齡, 成績, 學分)
問題分析
姓名和年齡不依於課程,即不完全依賴於主屬性因此不滿足第二正規化的要求,會產生如下問題:
資料冗餘:同一門課程由n個學生選修,"學分"就重複n-1次;同一個學生選修了m門課程,姓名和年齡就重複了m-1次。
更新異常:
1)若調整了某門課程的學分,資料表中所有行的"學分"值都要更新,否則會出現同一門課程學分不同的情況。
2)假設要開設一門新的課程,暫時還沒有人選修。這樣,由於還沒有"學號"關鍵字,課程名稱和學分也無法記錄入資料庫。
刪除異常 :假設一批學生已經完成課程的選修,這些選修記錄就應該從資料庫表中刪除。但是,與此同時,課程名稱和學分資訊也被刪除了。很顯然,這也會導致插入異常。
解決方案
把選課關係表SelectCourse改為如下三個表:
學生:Student(學號,姓名,年齡,性別,系別,系辦地址、系辦電話);
課程:Course(課程名稱,學分);
選課關係:SelectCourse(學號,課程名稱,成績)。

第三正規化(3NF)消除傳遞依賴
在2NF基礎上,任何非主屬性不依賴於其它非主屬性(在2NF基礎上消除傳遞依賴)
第三正規化(3NF)是第二正規化(2NF)的一個子集,即滿足第三正規化(3NF)必須滿足第二正規化(2NF)。簡而言之,第三正規化(3NF)要求一個關係中不包含已在其它關係已包含的非主關鍵字資訊。
例如:
接著看上面的學生表Student(學號,姓名,年齡,性別,系別,系辦地址、系辦電話),關鍵字為單一關鍵字"學號",因為存在如下決定關係:
(學號)→ (姓名,年齡,性別,系別,系辦地址、系辦電話
但是還存在下面的決定關係:
(學號) → (系別)→(系辦地點,系辦電話)
即存在非關鍵欄位"系辦地點"、"系辦電話"對關鍵欄位"學號"的傳遞函式依賴。
它也會存在資料冗餘、更新異常、插入異常和刪除異常的情況。
根據第三正規化把學生關係表分為如下兩個表就可以滿足第三正規化了:
學生:(學號,姓名,年齡,性別,系別);
系別:(系別,系辦地址、系辦電話)。
上面的資料庫表就是符合I,Ⅱ,Ⅲ正規化的,消除了資料冗餘、更新異常、插入異常和刪除異常