分散式ID生成器 | 架構師之路

阿新 • • 發佈：2019-02-18

一、需求緣起

幾乎所有的業務系統，都有生成一個唯一記錄標識的需求，例如：

訊息標識：message-id
訂單標識：order-id
帖子標識：tiezi-id

這個記錄標識往往就是資料庫中的主鍵，資料庫上會建立聚集索引（cluster index），即在物理儲存上以這個欄位排序。

這個記錄標識上的查詢，往往又有分頁或者排序的業務需求，例如：

拉取最新的一頁訊息

select message-id/ order by time/ limit 100
拉取最新的一頁訂單

select order-id/ order by time/ limit 100
拉取最新的一頁帖子

select tiezi-id/ order by time/ limit 100

所以往往要有一個time欄位，並且在time欄位上建立普通索引（non-cluster index）。

普通索引儲存的是實際記錄的指標，其訪問效率會比聚集索引慢，如果記錄標識在生成時能夠基本按照時間有序，則可以省去這個time欄位的索引查詢：

select message-id/ (order by message-id)/limit 100

強調，能這麼做的前提是，message-id的生成基本是趨勢時間遞增的。

這就引出了記錄標識生成（也就是上文提到的三個XXX-id）的兩大核心需求：

全域性唯一
趨勢有序

這也是本文要討論的核心問題：如何高效生成趨勢有序的全域性唯一ID。

二、常見方法、不足與優化

方法一：使用資料庫的 auto_increment 來生成全域性唯一遞增ID

優點：

簡單，使用資料庫已有的功能
能夠保證唯一性
能夠保證遞增性
步長固定

缺點：

可用性難以保證：資料庫常見架構是一主多從+讀寫分離，生成自增ID是寫請求，主庫掛了就玩不轉了
擴充套件性差，效能有上限：因為寫入是單點，資料庫主庫的寫效能決定ID的生成效能上限，並且難以擴充套件

改進方法：

冗餘主庫，避免寫入單點
資料水平切分，保證各主庫生成的ID不重複

如上圖所述，由1個寫庫變成3個寫庫，每個寫庫設定不同的auto_increment初始值，以及相同的增長步長，以保證每個資料庫生成的ID是不同的（上圖中庫0生成0,3,6,9…，庫1生成1,4,7,10，庫2生成2,5,8,11…）

改進後的架構保證了可用性，但缺點是：

喪失了ID生成的“絕對遞增性”：先訪問庫0生成0,3，再訪問庫1生成1，可能導致在非常短的時間內，ID生成不是絕對遞增的（這個問題不大，目標是趨勢遞增，不是絕對遞增）
資料庫的寫壓力依然很大，每次生成ID都要訪問資料庫

為了解決上述兩個問題，引出了第二個常見的方案。

方法二：單點批量ID生成服務

分散式系統之所以難，很重要的原因之一是“沒有一個全域性時鐘，難以保證絕對的時序”，要想保證絕對的時序，還是隻能使用單點服務，用本地時鐘保證“絕對時序”。

資料庫寫壓力大，是因為每次生成ID都訪問了資料庫，可以使用批量的方式降低資料庫寫壓力。

如上圖所述，資料庫使用雙master保證可用性，資料庫中只儲存當前ID的最大值，例如0。

ID生成服務假設每次批量拉取6個ID，服務訪問資料庫，將當前ID的最大值修改為5，這樣應用訪問ID生成服務索要ID，ID生成服務不需要每次訪問資料庫，就能依次派發0,1,2,3,4,5這些ID了。

當ID發完後，再將ID的最大值修改為11，就能再次派發6,7,8,9,10,11這些ID了，於是資料庫的壓力就降低到原來的1/6。

優點：

保證了ID生成的絕對遞增有序
大大的降低了資料庫的壓力，ID生成可以做到每秒生成幾萬幾十萬個

缺點：

服務仍然是單點
如果服務掛了，服務重啟起來之後，繼續生成ID可能會不連續，中間出現空洞（服務記憶體是儲存著0,1,2,3,4,5，資料庫中max-id是5，分配到3時，服務重啟了，下次會從6開始分配，4和5就成了空洞，不過這個問題也不大）
雖然每秒可以生成幾萬幾十萬個ID，但畢竟還是有效能上限，無法進行水平擴充套件

改進方法：

單點服務的常用高可用優化方案是“備用服務”，也叫“影子服務”，所以我們能用以下方法優化上述缺點（1）：

如上圖，對外提供的服務是主服務，有一個影子服務時刻處於備用狀態，當主服務掛了的時候影子服務頂上。

這個切換的過程對呼叫方是透明的，可以自動完成，常用的技術是vip+keepalived，具體就不在這裡展開。

另外，ID-gen-service也可以實施水平擴充套件，以解決上述缺點（3），但會引發一致性問題，具體解決方案詳見《淺談CAS在分散式ID生成方案上的應用》。

方法三：uuid/guid

不管是通過資料庫，還是通過服務來生成ID，業務方Application都需要進行一次遠端呼叫，比較耗時。

有沒有一種本地生成ID的方法，即高效能，又時延低呢？

uuid是一種常見的方案：

string ID =GenUUID();

優點：

本地生成ID，不需要進行遠端呼叫，時延低
擴充套件性好，基本可以認為沒有效能上限

缺點：

無法保證趨勢遞增
uuid過長，往往用字串表示，作為主鍵建立索引查詢效率低，常見優化方案為“轉化為兩個uint64整數儲存”或者“折半儲存”（折半後不能保證唯一性）

方法四：取當前毫秒數

uuid是一個本地演算法，生成效能高，但無法保證趨勢遞增，且作為字串ID檢索效率低，有沒有一種能保證遞增的本地演算法呢？

取當前毫秒數是一種常見方案：

uint64 ID = GenTimeMS();

優點：

本地生成ID，不需要進行遠端呼叫，時延低
生成的ID趨勢遞增
生成的ID是整數，建立索引後查詢效率高

缺點：

如果併發量超過1000，會生成重複的ID

這個缺點要了命了，不能保證ID的唯一性。當然，使用微秒可以降低衝突概率，但每秒最多隻能生成1000000個ID，再多的話就一定會衝突了，所以使用微秒並不從根本上解決問題。

方法五：類snowflake演算法

snowflake是twitter開源的分散式ID生成演算法，其核心思想為，一個long型的ID：

41bit作為毫秒數
10bit作為機器編號
12bit作為毫秒內序列號

演算法單機每秒內理論上最多可以生成1000*(2^12)，也就是400W的ID，完全能滿足業務的需求。

借鑑snowflake的思想，結合各公司的業務邏輯和併發量，可以實現自己的分散式ID生成演算法。

舉例，假設某公司ID生成器服務的需求如下：

單機高峰併發量小於1W，預計未來5年單機高峰併發量小於10W
有2個機房，預計未來5年機房數量小於4個
每個機房機器數小於100臺
目前有5個業務線有ID生成需求，預計未來業務線數量小於10個
…

分析過程如下：

高位取從2017年1月1日到現在的毫秒數（假設系統ID生成器服務在這個時間之後上線），假設系統至少執行10年，那至少需要10年*365天*24小時*3600秒*1000毫秒=320*10^9，差不多預留39bit給毫秒數
每秒的單機高峰併發量小於10W，即平均每毫秒的單機高峰併發量小於100，差不多預留7bit給每毫秒內序列號
5年內機房數小於4個，預留2bit給機房標識
每個機房小於100臺機器，預留7bit給每個機房內的伺服器標識
業務線小於10個，預留4bit給業務線標識

這樣設計的64bit標識，可以保證：

每個業務線、每個機房、每個機器生成的ID都是不同的
同一個機器，每個毫秒內生成的ID都是不同的
同一個機器，同一個毫秒內，以序列號區區分保證生成的ID是不同的
將毫秒數放在最高位，保證生成的ID是趨勢遞增的

缺點：

由於“沒有一個全域性時鐘”，每臺伺服器分配的ID是絕對遞增的，但從全域性看，生成的ID只是趨勢遞增的（有些伺服器的時間早，有些伺服器的時間晚）

思路比方案重要，順手幫轉喲。

分散式ID生成器 | 架構師之路

一、需求緣起幾乎所有的業務系統，都有生成一個唯一記錄標識的需求，例如：訊息標識：message-id 訂單標識：order-id 帖子標識：tiezi-id 這個記錄標識往往就是資料庫中的主鍵，資料庫上會建立聚集索引（cluster

Java高架構師、分散式架構、高可擴充套件、高效能、高併發、效能優化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分散式專案實戰學習架構師之路

工作1-5年開發經驗，當你們提出漲工資的時候，或者要offer的時候底氣怎麼樣，是不是底氣十足，不給漲工資就辭職，是不是有自信提出來主管、或者是專案經理都能同意，他們相當設法把你留住。如果這樣你才是成功。什麼技術都沒有何談工資！給你分析一下這些技術，給大家羅列一些技術，看

架構師之路--從業務角度談緩存的選型

inno 基於時間限制更新負載聚集穿透同步寫入　　想起來幾年前挺火的前島國國民女神學霸-小島方晴子。當時替她說話的人都很慘，導師被逼自殺。她收到的壓力侮辱不是常人可以想象的。但是她卻堅強的活著，去年還出了書。我去日本的時候，下了新幹線，前面有一群女學生，她們

【架構師之路】集群/分布式環境下5種session處理策略

復制協調部分 ont 描述分析 bsp 優化 vol 轉自：http://www.cnblogs.com/jhli/p/6557929.html 在搭建完集群環境後，不得不考慮的一個問題就是用戶訪問產生的session如何處理。如果不做任何處理的話，用戶將出現頻繁

JAVA架構師之路----maven001---何為Maven

maven本人犯了猴子掰玉米的錯誤；現在從頭開始：成功=可行的計劃+執行力何為Maven？答：1>關鍵字：構建、依賴、項目信息、解決方案/gav、誇平臺、開源/apache、分布式開發集群式部署、本地倉庫、遠程倉庫、中央倉庫、私服/nexus、插件；2>2個url：http://mvnreposi

架構師之路--從原理角度來分析性能

獲得 clas 思維一體化活性數據拷貝行業經驗靈活性時間　　埃及艷後Cleopatra，很小的時候看過媽媽買的一本書裏把她的名字翻譯成克婁巴特拉，裏面有很多描寫她美貌的場景描寫。然而這個以美貌著稱的奇女子，我看到書裏，凱撒和安東尼真正傾心的是Cleopatra

架構師之路--視頻業務介紹，離線服務架構和各種集群原理

目的 -- 自己的超過覆蓋基本上添加節點電視是我　　先聊聊業務。我們媒資這邊目前的核心數據是樂視視頻的樂視meta和專門存儲電視劇，綜藝節目，體育賽事這種長視頻的作品庫。樂視視頻的數據都是多方審核的，需要很多運營。但是作品庫部分卻是弱運營的，運營都不超過10個

架構師之路--搜索業務和技術介紹及容錯機制

朋友單節點 adb 一致性公司一個 memcache 消息通知包括　今天和搜索部門一起做了一下MQ的遷移，順便交流一下業務和技術。發現現在90後小夥都挺不錯。我是指能力和探究心。我家男孩，不招女婿。　　在前面的文章中也提到，我們有媒資庫（樂視視頻音頻本身內容）

程序員養成架構師之路

二叉排序樹初級程序員其他 json 隔離適合 tro cat hash表怎樣學習才能從一名Java初級程序員成長為一名合格的架構師，或者說一名合格的架構師應該有怎樣的技術知識體系，這是不僅一個剛剛踏入職場的初級程序員也是工作三五年之後開始迷茫的老程序員經常會問到的問

安全架構師之路

隨感其實前面說過，作為一個乙方工作多年的安全人員突然到了甲方公司，也有一種憋了勁使不出來的感覺。畢竟甲方都是專門針對某個領域的。雖然我做的領域很多，但都是賣不同的產品和服務給不同的甲方。產品和服務之間又橫跨不同供應商。整理下來，我不是某個安全領域的專家，但是從跨度來說橫跨不少區域。列舉如下：1.防火墻和vpn

架構師之路-如何建立高可用消息中間件kafka

特點查看支持多語言服務器端 c++ 偏移量 2.4 name space Kafka 一、熟悉kafka l Server-1 broker其實就是kafka的server，因為producer和consumer都要去連它。Broker主要還是做存儲用。 l

史上最好程序員的職業規劃：五年從程序員到架構師之路！

最好淘寶好的項目 com 職業消息關於技術學收獲第一部分：對於參加工作一年以內的同學。恭喜你，這個時候，你已經擁有了一份Java的工作。這個階段是你成長極快的階段，而且你可能會經常加班。但是加班不代表你就可以松懈了，永遠記得我說的那句話，從你入行那一刻起，你就

架構師之路總結01

線上總結估計曲線圖根據運營互聯 bsp 設計 1. 互聯網架構設計如何進行容量評估：【步驟一：評估總訪問量】 -> 詢問業務、產品、運營【步驟二：評估平均訪問量QPS】-> 除以時間，一天算4w秒【步驟三：評估高峰QPS】 ->

Android架構師之路網絡層架構設計與實戰

安卓第1章課前須知介紹如何去學習，課程適合的人群、怎麽才能融會貫通第2章主流網絡框架分析常用網絡框架介紹，分析volley 、Android-async-http、Afinal框架、xUtils、okhttp、retrofit、優有點缺點、教會選擇一個框架的標準是什麽？第3章 http協議詳解介紹htt

2018年給自己運維架構師之路總結（半年）

src ces water OS 圖片 blog 初心 TE com 一轉眼2018年已過去一半，現在很多高大上的技術不斷湧現而出，不過我一直都相信，根基不牢，地動山搖，所有希望我自己能堅持自己的初心，不要心浮氣躁，談事下來，一步步走向我的架構師之路。下面就來總結一下我的

MySql資料庫-58沈劍架構師之路

最近在看 “58沈劍架構師之路”的公眾號，寫的非常簡練，乾貨很多。但裡面也充斥了很多廣告和管理類的文章，本文主要是對裡面的資料庫文章做一個彙總： InnoDB，5項最佳實踐，知其所以然？ InnoDB行鎖，如何鎖住一條不存在的記錄？ InnoDB併發如此高，原因竟然在這？ Inno

架構師之路第一天

Volatile關鍵字用處：Volatile修飾的變數能夠在多執行緒之間可見。也就是可用此關鍵字實現變數在多執行緒之間的資料一致性。在沒有Volatile之前，是通過在變數或者方法上面進行加鎖實現的。那樣的話，效率不高。案例： public class VolatileTes

架構師之路再刷一下思路記錄-2

TCP接入層負載均衡高可用擴充套件性架構瀏覽器請求，dns解析，反向代理伺服器負載均衡，http短連線以及web應用無狀態特性，但tcp有狀態，如何均衡單機->客戶端繫結IP之類的，但更新不及時->服務端負載均衡->心跳上報保證可用->伺服器拉取tcp-server的狀態

架構師之路-分析混亂的日誌體系

提起日誌，可能大家腦中會瞬間彈出很多關鍵字，比如log4j，jul，jcl，slf4j啊等等，但是在我們做一個系統架構時，在處理日誌這塊內容的時候，我們可能會面臨具體的日誌選用。而且在我們系統中難免會使用各種各樣的第三方jar包，比如我們的spring，mybatis等等，由於這些第三方

架構師之路：一個架構師需要掌握的知識技能

沒有設計的思想，你就不能成為一名架構師。架構師是一個能擼的了一手好程式碼，畫的了一個漂亮的UML/原型，寫的了一篇技術文件，更加能解決好專案關鍵技術的綜合人才。架構師=前端工程師+後端程式設計師+系統分析師+關鍵技術解決+各種技術搭配+設計模式+部署調優+其他，可見架構師是多面手，在專案當中起到連線

分散式ID生成器 | 架構師之路

相關推薦