第一正規化 第二正規化 第三正規化 BC正規化
第一正規化 第一正規化:所有屬性都是不可分割的原子值。 也就是每個屬性都是不可再分的。 例如下圖就不符合第一正規化的要求
實際上,1NF是所有關係型資料庫的最基本要求,你在關係型資料庫管理系統(RDBMS),例如SQL Server,Oracle,MySQL中建立資料表的時候,如果資料表的設計不符合這個最基本的要求,那麼操作一定是不能成功的。如果我們要在RDBMS中表現表中的資料,就得設計為下圖的形式:
第二正規化(2NF) 第二正規化:在第一正規化的基礎上,要求非主屬性都要和碼有完全依賴關係 所謂完全依賴是指不能存在僅依賴碼一部分的屬性,必須是依賴全部屬性。(區別於部分依賴) 如果有哪些資料只和碼的一部份有關的話,它就不符合第二正規化。同時可以得出:如果一個數據表的碼只有單一一個欄位的話,它就一定符合第二正規化(前提是該資料表符合第一正規化)。 (碼可以由多個欄位組成聯合碼,所以碼可以是多屬性) 2NF在1NF的基礎之上,消除了非主屬性對於碼的部分屬性依賴。
首先來看看下圖
(1)每一名學生的學號、姓名、系名、系主任這些資料重複多次。每個系與對應的系主任的資料也重複多次——資料冗餘過大
(2)假如學校新建了一個系,但是暫時還沒有招收任何學生(比如3月份就新建了,但要等到8月份才招生),那麼是無法將系名與系主任的資料單獨地新增到資料表中去的 ——插入異常
(3)假如將某個系中所有學生相關的記錄都刪除,那麼所有系與系主任的資料也就隨之消失了(一個系所有學生都沒有了,並不表示這個系就沒有了)。——刪除異常
(4)假如李小明轉系到法律系,那麼為了保證資料庫中資料的一致性,需要修改三條記錄中系與系主任的資料。——修改異常
所以這張表肯定不符合設計規範。我們來通過第二正規化修改。 首先什麼是依賴?
依賴 若在一張表中,在屬性(或屬性組)X的值確定的情況下,必定能確定屬性Y的值,那麼就可以說Y函式依賴於X,寫作 X → Y。 例如,對於上圖中的資料,找不到任何一條記錄,它們的學號相同而對應的姓名不同。所以我們可以說姓名函式依賴於學號,寫作 學號 → 姓名。但是反過來,因為可能出現同名的學生,所以有可能不同的兩條學生記錄,它們在姓名上的值相同,但對應的學號不同,所以我們不能說學號函式依賴於姓名。
然後什麼是碼?
碼 設 K 為某表中的一個屬性或屬性組,若除 K 之外的所有屬性都完全函式依賴於 K(這個“完全”不要漏了),那麼我們稱 K 為候選碼,簡稱為碼。在實際中我們通常可以理解為:假如當 K 確定的情況下,該表除 K 之外的所有屬性的值也就隨之確定,那麼 K 就是碼。一張表中可以有超過一個碼。(實際應用中為了方便,通常選擇其中的一個碼作為主碼) 如圖中我們可以知道該表的碼是(學號、課名)
對於第二正規化,所有的非主屬性要依賴於全部主屬性。 由圖中我們可以得到兩個主屬性:學號 和 課程 “學號“和”課程“就組成了聯合主鍵。(一個表只有一個主鍵。 主鍵可以由一個欄位,也可以由多個欄位組成)
因為我們可以通過學號來確定一個學生的姓名 系名 系主任 這三個屬性,無法確定課程和分數屬性。 通過學生的學號和課程兩個屬性,可以確定分數。
對於(學號,課名) → 姓名,有 學號 → 姓名,存在非主屬性 姓名 對碼(學號,課名)的部分依賴。 對於(學號,課名) → 系名,有 學號 → 系名,存在非主屬性 系名 對碼(學號,課名)的部依賴。 對於(學號,課名) → 系主任,有 學號 → 系主任,存在非主屬性 系主任 對碼(學號,課名)的部分依賴。
所以表3存在非主屬性對於碼的部分函式依賴,最高只符合1NF的要求,不符合2NF的要求。
所以做出修改
刪除某個系中所有的學生記錄 該系的資訊仍然全部丟失。——無改進 所以我們要使用第三正規化。
第三正規化(3NF) 第三正規化:任何非主屬性不依賴於其它非主屬性。 3NF在2NF的基礎之上,消除了非主屬性對於碼的傳遞函式依賴。
對於選課表,碼為(學號,課名),主屬性為學號和課名,非主屬性只有一個,為分數,不可能存在傳遞函式依賴,所以選課表的設計,符合3NF的要求。
對於學生表,主碼為學號,主屬性為學號,非主屬性為姓名、系名和系主任。因為 學號 → 系名,同時 系名 → 系主任,所以存在非主屬性系主任對於碼學號的傳遞函式依賴,所以學生表的設計,不符合3NF的要求。
為了讓資料表設計達到3NF,我們必須進一步進行模式分解為以下形式: 選課(學號,課名,分數) 學生(學號,姓名,系名) 系(系名,系主任)
新的函式依賴關係如圖
修改後的表
第二正規化和第三正規化就是為了消除非主屬性對碼的部分函式依賴和傳遞函式依賴
BC正規化 BC正規化在 3NF 的基礎上消除主屬性對於碼的部分與傳遞函式依賴。 要了解 BCNF 正規化,那麼先看這樣一個問題: 若: 某公司有若干個倉庫; 每個倉庫只能有一名管理員,一名管理員只能在一個倉庫中工作; 一個倉庫中可以存放多種物品,一種物品也可以存放在不同的倉庫中。每種物品在每個倉庫中都有對應的數量。 那麼關係模式 倉庫(倉庫名,管理員,物品名,數量) 屬於哪一級正規化?
答:已知函式依賴集:倉庫名 → 管理員,管理員 → 倉庫名,(倉庫名,物品名)→ 數量 碼:(管理員,物品名),(倉庫名,物品名) 主屬性:倉庫名、管理員、物品名 非主屬性:數量 ∵ 不存在非主屬性對碼的部分函式依賴和傳遞函式依賴。∴ 此關係模式屬於3NF。
基於此關係模式的關係(具體的資料)可能如圖所示:
好,既然此關係模式已經屬於了 3NF,那麼這個關係模式是否存在問題呢?我們來看以下幾種操作: 先新增加一個倉庫,但尚未存放任何物品,是否可以為該倉庫指派管理員?——不可以,因為物品名也是主屬性,根據實體完整性的要求,主屬性不能為空。 某倉庫被清空後,需要刪除所有與這個倉庫相關的物品存放記錄,會帶來什麼問題?——倉庫本身與管理員的資訊也被隨之刪除了。 如果某倉庫更換了管理員,會帶來什麼問題?——這個倉庫有幾條物品存放記錄,就要修改多少次管理員資訊。 從這裡我們可以得出結論,在某些特殊情況下,即使關係模式符合 3NF 的要求,仍然存在著插入異常,修改異常與刪除異常的問題,仍然不是 ”好“ 的設計。
造成此問題的原因:存在著主屬性對於碼的部分函式依賴與傳遞函式依賴。(在此例中就是存在主屬性【倉庫名】對於碼【(管理員,物品名)】的部分函式依賴。
解決辦法就是要在 3NF 的基礎上消除主屬性對於碼的部分與傳遞函式依賴。
倉庫(倉庫名,管理員) 庫存(倉庫名,物品名,數量)這樣,之前的插入異常,修改異常與刪除異常的問題就被解決了。