MySQL三正規化
1.確保每列的原子性.
第一正規化是最基本的正規化。資料庫表中的欄位都是單一屬性的,不可再分。只要是關係資料庫都滿足第一正規化
如果每列(或者每個屬性)都是不可再分的最小資料單元(也稱為最小的原子單元),則滿足第一正規化.
例如:顧客表(姓名、編號、地址、……)其中"地址"列還可以細分為國家、省、市、區等。
2確保表中的每列都和主鍵相關.
如果一個關係滿足第一正規化,並且除了主鍵以外的其它列,都依賴於該主鍵,則滿足第二正規化.
例如:訂單表(訂單編號、產品編號、定購日期、價格、……),"訂單編號"為主鍵,"產品編號"和主鍵列沒有直接的關係,即"產品編號"列不依賴於主鍵列,應刪除該列。
***********************************************************
不滿足第二正規化,複合主鍵中的A與欄位C組合重複
+------------+-----------+-------------------+
pk pk row
+------------+-----------+-------------------+
A B C
+------------+-----------+-------------------+
A D C
+------------+-----------+-------------------+
A E C
+------------+-----------+-------------------+
改為這樣滿足第二正規化(但是不滿足第三正規化,欄位A與欄位C是組合重複):
+---------+------------+-----------+-------------------+
pk row row row
+---------+------------+-----------+-------------------+
1 A B C
+---------+------------+-----------+-------------------+
2 A D C
+---------+------------+-----------+-------------------+
3 A E C
+---------+------------+-----------+-------------------+
****************************************************************
3.確保每列都和主鍵列直接相關,而不是間接相關.
如果一個關係滿足第二正規化,並且除了主鍵以外的其它列都不依賴於主鍵列,則滿足第三正規化.
為了理解第三正規化,需要根據Armstrong公里之一定義傳遞依賴。假設A、B和C是關係R的三個屬性,如果A-〉B且B-〉C,則從這些函式依賴中,可以得出A-〉C,如上所述,依賴A-〉C是傳遞依賴。
例如:訂單表(訂單編號,定購日期,顧客編號,顧客姓名,……),初看該表沒有問題,滿足第二正規化,每列都和主鍵列"訂單編號"相關,再細看你會發現"顧客姓名"和"顧客編號"相關,"顧客編號"和"訂單編號"又相關,最後經過傳遞依賴,"顧客姓名"也和"訂單編號"相關。為了滿足第三正規化,應去掉"顧客姓名"列,放入客戶表中。
**********************************************************************
不滿足第三正規化,欄位A與欄位C組合重複
+---------+------------+-----------+-------------------+---------------+
pk row row row row
+---------+------------+-----------+-------------------+---------------+
1 A B C F
+---------+------------+-----------+-------------------+---------------+
2 A D C G
+---------+------------+-----------+-------------------+---------------+
3 A E C K
+---------+------------+-----------+-------------------+---------------+
改為這樣滿足第三正規化:
表1
+---------+------------+-----------+
pk row row
+---------+------------+-----------+
1 A B
+---------+------------+-----------+
2 A D
+---------+------------+-----------+
3 A E
+---------+------------+-----------+
和表2
+---------+-------------------+------------+
pk row row
+---------+-------------------+------------+
1 C F
+---------+-------------------+------------+
2 C G
+---------+-------------------+------------+
3 C K
+---------+-------------------+------------+
************************原則:************************************
原則:當出現欄位與欄位的組合重複,如上的A和C的組合重複,首先要考慮的就是把他們拆分為2個表,具體是C拆到表1, 還是A拆到表1,看情況而定
關鍵要理解定義這種正規化標準的主要目的是為了減少資料冗餘,資料冗餘產生的本質就是在一個表中存在欄位與欄位之間的一對多,或者多對多關係。解決這個幾對幾的關係問題,就能輕易實現滿足第三正規化的資料庫設計。
總結:
1NF:欄位不可分;
2NF:有主鍵,非主鍵欄位依賴主鍵;
3NF:非主鍵欄位不能相互依賴;
解釋:
1NF:原子性 欄位不可再分,否則就不是關係資料庫;
2NF:唯一性 一個表只說明一個事物;
3NF:每列都與主鍵有直接關係,不存在傳遞依賴;
不符合第一正規化的例子(關係資料庫中create不出這樣的表):
表:欄位1, 欄位2(欄位2.1, 欄位2.2), 欄位3 ......
存在的問題: 因為設計不出這樣的表, 所以沒有問題;
不符合第二正規化的例子:
表:學號, 姓名, 年齡, 課程名稱, 成績, 學分;
這個表明顯說明了兩個事務:學生資訊, 課程資訊;
***********************存在問題: *********************
資料冗餘,每條記錄都含有相同資訊;
刪除異常:刪除所有學生成績,就把課程資訊全刪除了;
插入異常:學生未選課,無法記錄進資料庫;
更新異常:調整課程學分,所有行都調整。
***********************修正:******************************
學生:Student(學號, 姓名, 年齡);
課程:Course(課程名稱, 學分);
選課關係:SelectCourse(學號, 課程名稱, 成績)。
滿足第2正規化只消除了插入異常。
不符合第三正規化的例子:
學號, 姓名, 年齡, 所在學院, 學院聯絡電話,關鍵字為單一關鍵字"學號";
存在依賴傳遞: (學號) → (所在學院) → (學院地點, 學院電話)
存在問題:
資料冗餘:有重複值;
更新異常:有重複的冗餘資訊,修改時需要同時修改多條記錄,否則會出現資料不一致的情況
刪除異常
修正:
學生:(學號, 姓名, 年齡, 所在學院);
學院:(學院, 地點, 電話)。