資料庫分片（Sharding）技術

阿新 • • 發佈：2019-01-24

假如您有一個應用程式，隨著業務越來越有起色，系統所牽涉到的資料量也就越來越大，此時您要涉及到對系統進行伸縮（Scale）的問題了。

一種典型的擴充套件方法叫做“向上伸縮（Scale Up）”，它的意思是通過使用更好的硬體來提高系統的效能引數。

而另一種方法則叫做“向外伸縮（Scale Out）”，它是指通過增加額外的硬體（如伺服器）來達到相同的效果。

從“硬體成本”還是“系統極限”的角度來說，“向外伸縮”一般都會優於“向上伸縮”，因此大部分上規模的系統都會在一定程度上考慮“向外”的方式。由於許多系統的瓶頸都處在資料儲存上，因此一種叫做“資料分片（Database Sharding）”的資料架構方式應運而生，本文便會討論這種資料架構方式的一種比較典型的實現方式。

簡介

資料分片，是將整體資料分攤在多個儲存裝置（下文統稱為“資料分割槽”或“分割槽”）上，這樣每個儲存裝置的資料量相對就會小很多，以此滿足系統的效能需求。

值得注意的是，系統分片的策略有很多，例如常見的有以下幾種：

　　（1）根據ID特徵：例如對記錄的ID取模，得到的結果是幾，那麼這條記錄就放在編號為幾的資料分割槽上。

　　（2）根據時間範圍：例如前100萬個使用者資料在第1個分割槽中，第二個100萬用戶資料放在第2個分割槽中。

基於檢索表：根據ID先去一個表內找到它所在的分割槽，然後再去目標分割槽進行查詢。

　　在這些資料分片策略之中沒有哪個有絕對的優勢，選擇哪種策略完全是根據系統的業務或是資料特徵來確定的。值得強調的是：資料分片不是銀彈，它對系統的效能和伸縮性（Scalability）帶來一定好處的同時，也會對系統開發帶來許多複雜度。例如，有兩條記錄分別處在不同的伺服器上，那麼如果有一個業務是為它們建立一個“關聯”，那麼很可能表示“關聯”的記錄就必須在兩個分割槽內各放一條。另外，如果您重視資料的完整性，那麼跨資料分割槽的事務又立即變成了效能殺手。最後，如果有一些需要進行全域性查詢的業務，光有資料分片策略也很難對系統性能帶來什麼優勢。

資料分片
　　在ORACLE 中，【全域性關係】是一個【檢視】，而資料分片是通過關係資料的基本運算實現的，這一點在全域性檢視的定義中體現。

資料分片主要有兩種方式：
(1) 水平分片
　　按一定條件將全域性關係的所有元組劃分成若干個相交的子集，每個子集為關係的一個片段。
　　例如，一個公司下屬兩個子公司，每個子公司建有自己的資料庫，並存放本公司的職員資訊。在總公司的資料庫上建立一個全域性關係，可以看到全公司的全體職員資訊。建立全域性關係emp（檢視）的語句如下：
　　CREARTE VIEW emp AS
　　（SELECT* FROM [email protected]

D1）
　　UNION
　　（SELECT *FROM [email protected] D2）；
　　這樣，全域性關係emp中的元組實際上是分佈在另外兩個不同的資料庫上。

(2) 垂直分片
　　把全域性關係的屬性集分成若干子集，形成幾個垂直片段。
　　例如，全域性關係emp中，有關職工的人事資訊在資料庫D1上，而職工的業務資訊在資料庫D2上。當然，有些屬性（如職工號這樣的關鍵字屬性）應出現在每個垂直片中。建立全域性關係EMP（檢視）的語句如下：
　　CREATTE VIEW emp AS
　　SELECRT emp1.eno， emp1.ename， emp2.sal，…
　　FROM [email protected], [email protected]
　　WHERE emp1.eno=emp2.eno;
　　全域性關係實際上是將分佈在不同資料庫中的一個職工記錄的各部分重新連線起來,然後投影出所要的屬性。
實際上,我們可以通過檢視的定義,實現全域性關係資料的多種分佈要求，全域性關係遮蔽了資料的物理分佈,提供了資料分佈的又一個透明性。

--------------------------------------------------------------------------------------------------

“Shard”字面意思為碎片，Sharding可以譯為【分片】。

MySQL5以後提供了Sharding的能力，其目的就是為突破單節點資料伺服器I/O能力限制，解決資料庫Scale Out水平擴充套件的問題。通過Sharding可以將資料按照物理位置貼合用戶分佈，得到更加快速的響應；操作龐然大物總是讓人頭疼，Sharding將資料分塊，更小的資料集操作彙總能夠得到更加的體驗；

分片使得資料分攤在各個資料節點，對其操作實現負載均衡！

Sharding按【方向】可以分為兩類。（1）垂直分片：以表為單位，把不同的表分散到不同的資料庫或主機上。特點是規則簡單，實施方便，適合業務之間耦合度低的系統。（2）水平分片：以行為單位，將同一個表中的資料按照某種條件拆分到不同的資料庫或主機上。特點是相對複雜，適合單表巨大的系統。 Sharding按【模式】可以分為兩大模式。（1）靜態分片模式，即【分割槽鍵】是靜態分配的，一般使用範圍或雜湊函式，例如深圳團隊放到一個分片，北京團隊放到另外一個分片；或者編號為0096開頭的員工放到一個分片，而0199開頭的員工放到另外一個分片。這種模式雖然實現簡單，但明顯的缺陷便是存在資料不均勻的情況。（2）動態分片模式，即分割槽函式將從字典中查詢【分割槽鍵】，然後定位具體哪個分片儲存了資料。這種模式比靜態模式更加靈活，但是需要一個集中儲存來存放字典，每次查詢資料都需要執行2次查詢，並且集中儲存本身還可能存在單點故障。

資料庫分片（Sharding）技術

資料庫分片（Sharding）技術

MongoDB分片（sharding）/分割槽（partitioning）介紹

分片技術（sharding）——區塊鏈擴容問題的良方

分片技術（Sharding）：化整為零，分而治之

MySQL 高可用：mysql+mycat實現資料庫分片（分庫分表）

MySQL資料庫分片（分庫分表）

Mycat之資料庫分片（分片列舉）-yellowcong

資料庫分庫分表（sharding）(一)——基本思想、拆分策略和拆分所帶來的問題

MySQL的分片（一）——分散式資料庫概述

Mycat之資料庫分片（取模分片）-yellowcong

Python從菜鳥到高手（13）：分片（Slicing）

VB6基本資料庫應用（三）：連線資料庫與SQL語句的Select語句初步

***資料庫基礎（重點）

資料庫應用（金融）

SQL Sever 資料庫視訊（二） 1024節日快樂！

redis叢集與分片（1）-redis伺服器叢集、客戶端分片 redis叢集與分片（1）-redis伺服器叢集、客戶端分片

redis集群與分片（1）-redis服務器集群、客戶端分片

流水線、超流水線、超標量（superscalar）技術對比（轉）

Mysql資料庫學習（4）階段性完結

Mysql資料庫學習（3）DQL

資料庫分片（Sharding）技術

相關推薦