一分鐘掌握資料庫垂直拆分

阿新 • • 發佈：2019-02-10

一、緣起

當資料庫的資料量非常大時，水平切分和垂直拆分是兩種常見的降低資料庫大小，提升效能的方法。假設有使用者表：

user(

uid bigint,

name varchar(16),

pass varchar(16),

age int,

sex tinyint,

flag tinyint,

sign varchar(64),

intro varchar(256)

…);

水平切分是指，以某個欄位為依據（例如uid），按照一定規則（例如取模），將一個庫（表）上的資料拆分到多個庫（表）上，以降低單庫（表）大小，達到提升效能的目的的方法，水平切分後，各個庫（表）的特點是：

（1）每個庫（表）的結構都一樣

（2）每個庫（表）的資料都不一樣，沒有交集

（3）所有庫（表）的並集是全量資料

二、什麼是垂直拆分

垂直拆分是指，將一個屬性較多，一行資料較大的表，將不同的屬性拆分到不同的表中，以降低單庫（表）大小，達到提升效能的目的的方法，垂直切分後，各個庫（表）的特點是：

（1）每個庫（表）的結構都不一樣

（2）一般來說，每個庫（表）的屬性至少有一列交集，一般是主鍵

（3）所有庫（表）的並集是全量資料

還是以上文提到的使用者表為例，如果要垂直拆分，可能拆分結果會是這樣的：

user_base(

uid bigint,

name varchar(16),

pass varchar(16),

age int,

sex tinyint,

flag tinyint,

…);

user_ext(

uid bigint,

sign varchar(64),

intro varchar(256)

…);

三、垂直切分的依據是什麼

當一個表屬性很多時，如何來進行垂直拆分呢？如果沒有特殊情況，拆分依據主要有幾點：

（1）將長度較短，訪問頻率較高的屬性儘量放在一個表裡，這個表暫且稱為主表

（2）將欄位較長，訪問頻率較低的屬性儘量放在一個表裡，這個表暫且稱為擴充套件表

如果1和2都滿足，還可以考慮第三點：

（3）經常一起訪問的屬性，也可以放在一個表裡

優先考慮1和2，第3點不是必須。另，如果實在屬性過多，主表和擴充套件表都可以有多個。

一般來說，資料量併發量比較大時，資料庫的上層都會有一個服務層。需要注意的是，當應用方需要同時訪問主表和擴充套件表中的屬性時，服務層不要使用join來連表訪問，而應該分兩次進行查詢：

原因是，大資料高併發網際網路場景下，一般來說，吞吐量和擴充套件性是主要矛盾：

（1）join更消損耗資料庫效能

（2）join會讓base表和ext表耦合在一起（必須在一個數據庫例項上），不利於資料量大時拆分到不同的資料庫例項上（機器上）。畢竟減少資料量，提升效能才是垂直拆分的初衷。

四、為什麼要這麼這麼拆分

為何要將欄位短，訪問頻率高的屬性放到一個表內？為何這麼垂直拆分可以提升效能？因為：

（1）資料庫有自己的記憶體buffer，會將磁碟上的資料load到記憶體buffer裡（暫且理解為程序內快取吧）

（2）記憶體buffer快取資料是以row為單位的

（3）在記憶體有限的情況下，在資料庫記憶體buffer裡快取短row，就能快取更多的資料

（4）在資料庫記憶體buffer裡快取訪問頻率高的row，就能提升快取命中率，減少磁碟的訪問

舉個例子就很好理解了：

假設資料庫記憶體buffer為1G，未拆分的user表1行資料大小為1k，那麼只能快取100w行資料。

如果垂直拆分成user_base和user_ext，其中：

（1）user_base訪問頻率高（例如uid, name, passwd, 以及一些flag等），一行大小為0.1k

（2）user_ext訪問頻率低（例如簽名, 個人介紹等），一行大小為0.9k

那邊記憶體buffer就就能快取近乎1000w行user_base的記錄，訪問磁碟的概率會大大降低，資料庫訪問的時延會大大降低，吞吐量會大大增加。

五、總結

（1）水平拆分和垂直拆分都是降低資料量大小，提升資料庫效能的常見手段

（2）流量大，資料量大時，資料訪問要有service層，並且service層不要通過join來獲取主表和擴充套件表的屬性

（3）垂直拆分的依據，儘量把長度較短，訪問頻率較高的屬性放在主表裡

一分鐘掌握資料庫垂直拆分

一分鐘掌握資料庫垂直拆分

一分鐘掌握Linux系統grub.conf配置核心知識

效能測試手冊：一分鐘掌握LoadRunner關聯函式應該放在那

一分鐘理解資料庫連線池

資料庫垂直拆分，水平拆分利器，cobar升級版mycat

斷網不要慌，掌握這兩條命令，一分鐘就可以定位網絡問題

擷取拼接成新的字串System.arraycopy()如何一分鐘快速掌握（示例程式碼詳解）

用Spider引擎解決資料庫垂直和水平拆分的問題

資料庫的垂直拆分和水平拆分

淺談資料庫讀寫分離、垂直拆分、水平拆分

MySQL資料庫表如何水平拆分和垂直拆分

關於資料庫表的水平拆分和垂直拆分

Python基礎知識細節點總結，零基礎一分鐘也能掌握

如果這篇文章不能讓你十分鐘掌握Python資料庫，我腿給你打折！

linux 執行任務crontab 安裝以及備份資料庫一分鐘備份一次以及刪除5分鐘之前的資料好測試

可能只需要花費你一分鐘就能掌握的 Mysql 主鍵約束！

如何拆分PDF文件，一分鐘學會拆分PDF文件

資料庫的垂直拆分與水平拆分

一張圖助你分分鐘掌握用photoshop將圖片轉化為背景透明的png技能-ps2017

一分鐘解決上網速度慢的問題

一分鐘掌握資料庫垂直拆分

相關推薦