1. 程式人生 > >MySQL三正規化

MySQL三正規化

1.確保每列的原子性.

第一正規化是最基本的正規化。資料庫表中的欄位都是單一屬性的,不可再分。只要是關係資料庫都滿足第一正規化

如果每列(或者每個屬性)都是不可再分的最小資料單元(也稱為最小的原子單元),則滿足第一正規化.

例如:顧客表(姓名、編號、地址、……)其中"地址"列還可以細分為國家、省、市、區等。

2確保表中的每列都和主鍵相關.

如果一個關係滿足第一正規化,並且除了主鍵以外的其它列,都依賴於該主鍵,則滿足第二正規化.

例如:訂單表(訂單編號、產品編號、定購日期、價格、……),"訂單編號"為主鍵,"產品編號"和主鍵列沒有直接的關係,即"產品編號"列不依賴於主鍵列,應刪除該列。

***********************************************************

不滿足第二正規化,複合主鍵中的A與欄位C組合重複
+------------+-----------+-------------------+
    pk                pk             row
+------------+-----------+-------------------+
    A                  B                  C
+------------+-----------+-------------------+
    A                  D                  C
+------------+-----------+-------------------+
    A                  E                  C
+------------+-----------+-------------------+

改為這樣滿足第二正規化(但是不滿足第三正規化,欄位A與欄位C是組合重複):
+---------+------------+-----------+-------------------+
    pk            row             row             row
+---------+------------+-----------+-------------------+
      1              A               B                  C
+---------+------------+-----------+-------------------+
      2              A               D                  C
+---------+------------+-----------+-------------------+
      3              A               E                  C
+---------+------------+-----------+-------------------+

****************************************************************

3.確保每列都和主鍵列直接相關,而不是間接相關.

 

如果一個關係滿足第二正規化,並且除了主鍵以外的其它列都不依賴於主鍵列,則滿足第三正規化.

為了理解第三正規化,需要根據Armstrong公里之一定義傳遞依賴。假設A、B和C是關係R的三個屬性,如果A-〉B且B-〉C,則從這些函式依賴中,可以得出A-〉C,如上所述,依賴A-〉C是傳遞依賴。

例如:訂單表(訂單編號,定購日期,顧客編號,顧客姓名,……),初看該表沒有問題,滿足第二正規化,每列都和主鍵列"訂單編號"相關,再細看你會發現"顧客姓名"和"顧客編號"相關,"顧客編號"和"訂單編號"又相關,最後經過傳遞依賴,"顧客姓名"也和"訂單編號"相關。為了滿足第三正規化,應去掉"顧客姓名"列,放入客戶表中。

**********************************************************************

不滿足第三正規化,欄位A與欄位C組合重複

+---------+------------+-----------+-------------------+---------------+
    pk            row             row             row                        row
+---------+------------+-----------+-------------------+---------------+
      1              A               B                  C                           F
+---------+------------+-----------+-------------------+---------------+
      2              A               D                  C                          G
+---------+------------+-----------+-------------------+---------------+
      3              A               E                  C                           K
+---------+------------+-----------+-------------------+---------------+

改為這樣滿足第三正規化:
表1
+---------+------------+-----------+
    pk            row            row        
+---------+------------+-----------+
      1              A               B              
+---------+------------+-----------+
      2              A               D                
+---------+------------+-----------+
      3              A               E                
+---------+------------+-----------+
和表2
+---------+-------------------+------------+
    pk             row                       row
+---------+-------------------+------------+
      1              C                           F
+---------+-------------------+------------+
      2              C                           G
+---------+-------------------+------------+
      3              C                           K
+---------+-------------------+------------+

************************原則:************************************

原則:當出現欄位與欄位的組合重複,如上的A和C的組合重複,首先要考慮的就是把他們拆分為2個表,具體是C拆到表1, 還是A拆到表1,看情況而定

關鍵要理解定義這種正規化標準的主要目的是為了減少資料冗餘,資料冗餘產生的本質就是在一個表中存在欄位與欄位之間的一對多,或者多對多關係。解決這個幾對幾的關係問題,就能輕易實現滿足第三正規化的資料庫設計。

總結:

1NF:欄位不可分; 
2NF:有主鍵,非主鍵欄位依賴主鍵; 
3NF:非主鍵欄位不能相互依賴; 

解釋: 
1NF:原子性 欄位不可再分,否則就不是關係資料庫; 
2NF:唯一性 一個表只說明一個事物; 
3NF:每列都與主鍵有直接關係,不存在傳遞依賴; 

不符合第一正規化的例子(關係資料庫中create不出這樣的表): 

表:欄位1, 欄位2(欄位2.1, 欄位2.2), 欄位3 ...... 

存在的問題: 因為設計不出這樣的表, 所以沒有問題; 

不符合第二正規化的例子: 

表:學號, 姓名, 年齡, 課程名稱, 成績, 學分; 

這個表明顯說明了兩個事務:學生資訊, 課程資訊; 

***********************存在問題: *********************

資料冗餘,每條記錄都含有相同資訊; 
刪除異常:刪除所有學生成績,就把課程資訊全刪除了; 
插入異常:學生未選課,無法記錄進資料庫; 
更新異常:調整課程學分,所有行都調整。 

***********************修正:****************************** 

學生:Student(學號, 姓名, 年齡); 

課程:Course(課程名稱, 學分); 

選課關係:SelectCourse(學號, 課程名稱, 成績)。 

滿足第2正規化只消除了插入異常。 


不符合第三正規化的例子: 

學號, 姓名, 年齡, 所在學院, 學院聯絡電話,關鍵字為單一關鍵字"學號"; 

存在依賴傳遞: (學號) → (所在學院) → (學院地點, 學院電話) 

存在問題: 

資料冗餘:有重複值; 

更新異常:有重複的冗餘資訊,修改時需要同時修改多條記錄,否則會出現資料不一致的情況 

刪除異常 

修正: 
學生:(學號, 姓名, 年齡, 所在學院); 
學院:(學院, 地點, 電話)。