1. 程式人生 > >資料庫設計需要注意什麼

資料庫設計需要注意什麼

一、基礎規範:

1. 必須使用InnoDB儲存引擎

   解讀:支援事務、行級鎖、併發效能更好、CPU及記憶體快取頁優化使得資源利用率更高

2. 新庫預設使用utf8mb4字符集

   解讀:utf8mb4是utf8的超集,emoji表情以及部分不常見漢字在utf8下會表現為亂碼,故需要升級至utf8mb4。

            預設使用這個字符集的原因是:“標準,萬國碼,無需轉碼,無亂碼風險”,並不“節省空間”。

3. 資料表、資料欄位必須加入中文註釋

    解讀:N年後誰tm知道這個r1,r2,r3欄位是幹嘛的

4. 禁止使用儲存過程、檢視、觸發器、Event

    解讀:高併發大資料的網際網路業務,架構設計思路是“解放資料庫CPU,將計算轉移到服務層”,併發量大的情況下,這些功能很可能將資料庫拖死,

    業務邏輯放到服務層具備更好的擴充套件性,能夠輕易實現“增機器就加效能”。資料庫擅長儲存與索引,CPU計算還是上移吧

5. 禁止儲存大檔案或者大照片 

    解讀:為何要讓資料庫做它不擅長的事情?大檔案和照片儲存在檔案系統,資料庫裡存URI多好

 

二、命名規範

1. 只允許使用內網域名,而不是ip連線資料庫

2. 線上環境、開發環境、測試環境資料庫內網域名遵循命名規範

   業務名稱:xxx

   線上環境:dj.xxx.db

   開發環境:dj.xxx.rdb

   測試環境:dj.xxx.tdb

   從庫在名稱後加-s標識,備庫在名稱後加-ss標識

   線上從庫:dj.xxx-s.db

   線上備庫:dj.xxx-sss.db

3. 庫名、表名、欄位名:小寫,下劃線風格,不超過32個字元,必須見名知意,禁止拼音英文混用

4. 表名t_xxx,非唯一索引名idx_xxx,唯一索引名uniq_xxx

 

三、表設計規範

1. 單例項表數目必須小於500

2. 單表列數目必須小於30

3. 表必須有主鍵,例如自增主鍵

    解讀:

    a)主鍵遞增,資料行寫入可以提高插入效能,可以避免page分裂,減少表碎片提升空間和記憶體的使用

    b)主鍵要選擇較短的資料型別, Innodb引擎普通索引都會儲存主鍵的值,較短的資料型別可以有效的減少索引的磁碟空間,提高索引的快取效率

    c) 無主鍵的表刪除,在row模式的主從架構,會導致備庫夯住

4. 禁止使用外來鍵,如果有外來鍵完整性約束,需要應用程式控制

   解讀:外來鍵會導致表與表之間耦合,update與delete操作都會涉及相關聯的表,十分影響sql 的效能,甚至會造成死鎖。高併發情況下容易造成資料庫效能,

   大資料高併發業務場景資料庫使用以效能優先

 

四、欄位設計規範

1. 必須把欄位定義為NOT NULL並且提供預設值

   解讀:

   a)null的列使索引/索引統計/值比較都更加複雜,對MySQL來說更難優化

   b)null 這種型別MySQL內部需要進行特殊處理,增加資料庫處理記錄的複雜性;同等條件下,表中有較多空欄位的時候,資料庫的處理效能會降低很多

   c)null值需要更多的儲存空,無論是表還是索引中每行中的null的列都需要額外的空間來標識

   d)對null 的處理時候,只能採用is null或is not null,而不能採用=、in、<、<>、!=、not in這些操作符號。如:where name!=’shenjian’,如果存在name

        為null值的記錄,查詢結果就不會包含name為null值的記錄

2. 禁止使用TEXT、BLOB型別

    解讀:會浪費更多的磁碟和記憶體空間,非必要的大量的大欄位查詢會淘汰掉熱資料,導致記憶體命中率急劇降低,影響資料庫效能

3. 禁止使用小數儲存貨幣

    解讀:使用整數吧,小數容易導致錢對不上

4. 必須使用varchar(20)儲存手機號

   解讀:

   a)涉及到區號或者國家代號,可能出現+-()

   b)手機號會去做數學運算麼?

   c)varchar可以支援模糊查詢,例如:like“138%”

5. 禁止使用ENUM,可使用TINYINT代替

    解讀:

    a)增加新的ENUM值要做DDL操作

    b)ENUM的內部實際儲存就是整數,你以為自己定義的是字串?

 

五、索引設計規範

1. 單表索引建議控制在5個以內

2. 單索引欄位數不允許超過5個

   解讀:欄位超過5個時,實際已經起不到有效過濾資料的作用了

3. 禁止在更新十分頻繁、區分度不高的屬性上建立索引

   解讀:

   a)更新會變更B+樹,更新頻繁的欄位建立索引會大大降低資料庫效能

   b)“性別”這種區分度不大的屬性,建立索引是沒有什麼意義的,不能有效過濾資料,效能與全表掃描類似

4. 建立組合索引,必須把區分度高的欄位放在前面

    解讀:能夠更加有效的過濾資料