分散式唯一ID（三）--Leaf-Segment資料庫方案

阿新 • • 發佈：2022-03-01

一、改進：
二、資料庫表設計：
三、優點：
四、缺點：
五、雙buffer優化：
- 實現圖：
六、高可用：

本文來自官方文件的簡單總結，非原創！！！

一、改進：

原始方案每次獲取ID都要讀寫資料庫，資料庫壓力比較大。
每次獲取一個號段的值(step決定大小)，用完之後再去資料庫獲取新的號段，很大減輕資料庫的壓力。
各個業務不同的需求用biz_tag欄位來區分。
如果以後因為效能等原因需要分庫分表，只需要對biz_tag分庫分表。

二、資料庫表設計：

+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field       | Type         | Null | Key | Default           | Extra                       |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag     | varchar(128) | NO   | PRI |                   |                             |
| max_id      | bigint(20)   | NO   |     | 1                 |                             |
| step        | int(11)      | NO   |     | NULL              |                             |
| desc        | varchar(256) | YES  |     | NULL              |                             |
| update_time | timestamp    | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+

欄位說明：

biz_tag：區分業務。

max_id：表示該biz_tag目前所被分配的ID號段的最大值。

step：表示每次分配的號段長度。

優勢：

原來獲取ID每次都需要寫資料庫，現在只需要把step設定得足夠大，比如1000。

那麼只有當1000個號被消耗完了之後才會去重新讀寫一次資料庫。

架構圖：

test_tag在第一臺Leaf機器上的號段為1~1000，當號段用完時，會去載入另一個號段。
假設另外兩臺機器號段都沒有更新，這個時候第一臺機器重新載入的號段應該是3001~4000。
同時資料庫對應的biz_tag這條資料的max_id會從3000被更新成4000。

Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit

三、優點：

Leaf服務方便拓展，效能方便是OK的。
ID號碼是趨勢遞增的64位數字，滿足資料庫儲存的主鍵要求。
Leaf服務內部有號段快取，即使DB宕機，短時間內Leaf仍能正常對外提供服務。
自定義max_id，非常方便業務從原有的ID方式上遷移過來。

四、缺點：

ID號碼不夠隨機，可以被競對根據ID號碼得到一些資訊。
當號段使用完之後會hang在更新資料庫的I/O上，TP99資料會出現偶爾的尖刺。
DB一段時間宕機會造成整個系統不可用。

五、雙buffer優化：

針對第二個缺點，Leaf做了雙buffer優化。

希望DB取號段的過程能夠做到無阻塞，即當號段消費到某個閾值時就非同步的把下一個號段載入到記憶體中。

而不是等到號段用盡的時候才去更新號段，這樣做可以很大程度上的降低突刺問題。

實現圖：

每個biz-tag都有消費速度監控，推薦segment長度設定為服務高峰期發號QPS的600倍（10分鐘）。

這樣即使DB宕機，Leaf仍能持續發號10-20分鐘不受影響。

六、高可用：

針對"DB可用性"的問題，採用一主兩從且分機房部署，Master和Slave之間採用半同步方式同步資料。

同時使用DBProxy資料庫中介軟體做主從切換。

這種非同步模式在非常極端情況下仍然會造成資料不一致的情況，但是出現的概率非常小。

如果系統要保證100%的資料強一致，可以選擇使用“類Paxos演算法”實現的強一致MySQL方案，如MySQL 5.7的Group Replication。

但是運維成本和精力都會相應的增加，根據實際情況選型即可。

同時Leaf服務分IDC部署，內部的服務化框架是“MTthrift RPC”。

服務呼叫的時候，根據負載均衡演算法會優先呼叫同機房的Leaf服務。

在該IDC內Leaf服務不可用的時候才會選擇其他機房的Leaf服務。

同時服務治理平臺OCTO還提供了針對服務的過載保護、一鍵截流、動態流量分配等對服務的保護措施。

分散式唯一ID（三）--Leaf-Segment資料庫方案

目錄一、改進：二、資料庫表設計：欄位說明：優勢：架構圖：三、優點：四、缺點：五、雙buffer優化：實現圖：六、高可用：

分散式唯一ID（四）--Leaf-Snowflake方案

目錄一、背景：二、Leaf-snowflake啟動步驟：三、弱依賴ZooKeeper：四、解決時鐘問題：1、流程：2、程式碼實現：3、表現：五、Leaf現狀：

Oracle 獲取表唯一ID（字串）-函式（按日期）

create or replace function FN_GETSEQNOFIXLEN(v_SEQCODE in varchar2) return varchar2 is FunctionResult VARCHAR2(24);

免費開源的伺服器虛擬化Proxmox+分散式儲存Ceph（三）

在我們新建虛擬機器之前，我們先要將系統模板下載到伺服器的相關目錄，這一點跟之前的版本是一樣的。方法1：在新建前，我們需要將系統模板放入指定目錄，OpenVZ的系統模板大家可以到OpenVZ官網去下載，他

Redis分散式快取系列（三）- Redis中的Hash型別

本系列將和大家分享Redis分散式快取，本章主要簡單介紹下Redis中的Hash型別。

（三）GORM連線資料庫

一、gorm連線mysql資料庫 gorm支援多種資料庫，這裡主要介紹mysql,連線mysql主要有兩個步驟:

分散式唯一ID生成系列（4）——Redis叢集實現的分散式ID適合做分散式ID嗎

今天我們來講一下Redis叢集實現的分散式ID的過程，總結一下Redis叢集是否適合做分散式ID？

分散式唯一ID生成系列（5）——Twitter的雪法演演算法Snowflake適合做分散式ID嗎

寫到這裡，分散式Id算是寫到最後一篇了，在這一篇裡，我會講到目前網上最適合分散式Id的方法，什麼方法呢，請您往下看：

分散式唯一ID系列（4）——Redis叢集實現的分散式ID適合做分散式ID嗎

首先是專案地址： https://github.com/maqiankun/distributed-id-redis-generator 關於Redis叢集生成分散式ID，這裡要先了解redis使用lua指令碼的時候的EVAL，EVALSHA命令：

Hadoop 系列（三）—— 分散式計算框架 MapReduce

一、MapReduce概述 Hadoop MapReduce 是一個分散式計算框架，用於編寫批處理應用程式。編寫好的程式可以提交到 Hadoop 叢集上用於並行處理大規模的資料集。

Redis分散式鎖（三）：支援鎖可重入，避免鎖遞迴呼叫時死鎖

使用現狀 Redis分散式鎖的基礎內容，我們已經在Redis分散式鎖：基於AOP和Redis實現的簡易版分散式鎖這篇文章中講過了，也在文章中示範了正常的加鎖和解鎖方法。

雪花演算法生成分散式ID（java）

/** 雪花演算法生成分散式ID /// 共64位第1位不使用，242位為時間戳，4352位為工作機器id,53~64 位為序列號

微服務分散式電商專案學習筆記（三）---- docker介紹安裝以及使用docker安裝軟體（2020/7/1）

其實在介紹docker的使用和安裝之前應該還要介紹虛擬機器的安裝與配置，以及虛擬網路的配置，但是我使用的是vmware，而視訊課使用的是vagrant，這一塊我簡看的，因此沒有過多的介紹，至於vmware的安裝配置和虛擬網路

部署標準交換機和分散式交換機（三）

實驗目標：部署標準交換機和分散式交換機實驗要求：標準交換機的配置：分別在兩臺esxi主機中新增6塊物理網絡卡，橋接到vmnet1。

微服務架構下分散式事務方案（三）之 RocketMQ之事務訊息

由於工作流引擎專案中，工作流引擎服務和業務服務是分開的，所以就涉及到了分散式事務的問題。綜合考慮到併發量和分散式事務的保障，最終選擇了事務訊息的方式。

分散式事務（三）mysql對XA協議的支援

引子從Mysql5開始，innoDB引擎支援XA協議的分散式事務。DTP模型中，一個TM（事務管理器管理）管理多個RM（資源管理器），每個RM維護自己的事務分支。在看原始碼之前我們看一下底層DB mysql對XA事務的支援。

Zookeeper 學習（三）Zookeeper 分散式應用

1、分散式安裝部署 1、叢集規劃在虛擬 hadoop103、hadoop104、hadoop105 三個節點上部署 Zookeeper；

分散式系統（三）（譯）

3. 時間和順序分散式系統中的順序是什麼？為什麼它重要？正如前文描述過的，分散式程式設計就是將在多伺服器上解決單機問題的藝術。

C#學習細節（三）託管執行緒ID\跨執行緒操作動態集合SourceCollection\Nuget包版本問題\目標框架版本問題\自定義依賴項屬性

1、託管執行緒ID 　　(1)獲取當前執行的託管執行緒ID 　　Console.WriteLine(\"當前執行緒:\"+ System.Threading.Thread.CurrentThread.ManagedThreadId);

穀粒商城分散式基礎（三）—— 開發配置統一 & 服務構建

四、開發環境統一 & 服務搭建 1、IDEA配置統一　　注意：關於idea的安裝破解和基礎資訊這裡就不做介紹了

分散式唯一ID（三）--Leaf-Segment資料庫方案

一、改進：

二、資料庫表設計：

欄位說明：

優勢：

架構圖：

三、優點：

四、缺點：

五、雙buffer優化：

實現圖：

六、高可用：

相關推薦