Leaf：美團分散式ID生成服務開源

開發十年，就只剩下這套架構體系了！ >>>

Leaf是美團基礎研發平臺推出的一個分散式ID生成服務，名字取自德國哲學家、數學家萊布尼茨的一句話：“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全域性唯一等特點。目前已經廣泛應用於美團金融、美團外賣、美團酒旅等多個部門。具體的技術細節，可參考此前美團技術部落格的一篇文章：

《Leaf美團分散式ID生成服務》。近日，Leaf專案已經在Github上開源：https://github.com/Meituan-Dianping/Leaf，希望能和更多的技術同行一起交流、共建。

Leaf特性

Leaf在設計之初就秉承著幾點要求：

全域性唯一，絕對不會出現重複的ID，且ID整體趨勢遞增。
高可用，服務完全基於分散式架構，即使MySQL宕機，也能容忍一段時間的資料庫不可用。
高併發低延時，在CentOS 4C8G的虛擬機器上，遠端呼叫QPS可達5W+，TP99在1ms內。
接入簡單，直接通過公司RPC服務或者HTTP呼叫即可接入。

Leaf誕生

Leaf第一個版本採用了預分發的方式生成ID，即可以在DB之上掛N個Server，每個Server啟動時，都會去DB拿固定長度的ID List。這樣就做到了完全基於分散式的架構，同時因為ID是由記憶體分發，所以也可以做到很高效。接下來是資料持久化問題，Leaf每次去DB拿固定長度的ID List，然後把最大的ID持久化下來，也就是並非每個ID都做持久化，僅僅持久化一批ID中最大的那一個。這個方式有點像遊戲裡的定期存檔功能，只不過存檔的是未來某個時間下發給使用者的ID，這樣極大地減輕了DB持久化的壓力。

整個服務的具體處理過程如下：

Leaf Server 1：從DB載入號段[1，1000]。
Leaf Server 2：從DB載入號段[1001，2000]。
Leaf Server 3：從DB載入號段[2001，3000]。

使用者通過Round-robin的方式呼叫Leaf Server的各個服務，所以某一個Client獲取到的ID序列可能是：1，1001，2001，2，1002，2002......也可能是：1，2，1001，2001，2002，2003，3，4......當某個Leaf Server號段用完之後，下一次請求就會從DB中載入新的號段，這樣保證了每次載入的號段是遞增的。

Leaf資料庫中的號段表格式如下：

+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field       | Type         | Null | Key | Default           | Extra                       |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag     | varchar(128) | NO   | PRI |                   |                             |
| max_id      | bigint(20)   | NO   |     | 1                 |                             |
| step        | int(11)      | NO   |     | NULL              |                             |
| desc        | varchar(256) | YES  |     | NULL              |                             |
| update_time | timestamp    | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+

Leaf Server載入號段的SQL語句如下：

Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit

整體上，V1版本實現比較簡單，主要是為了儘快解決業務層DB壓力的問題，而快速迭代出的一個版本。因而在生產環境中，也發現了些問題。比如：

在更新DB的時候會出現耗時尖刺，系統最大耗時取決於更新DB號段的時間。
當更新DB號段的時候，如果DB宕機或者發生主從切換，會導致一段時間的服務不可用。

Leaf雙Buffer優化

為了解決這兩個問題，Leaf採用了非同步更新的策略，同時通過雙Buffer的方式，保證無論何時DB出現問題，都能有一個Buffer的號段可以正常對外提供服務，只要DB在一個Buffer的下發的週期內恢復，就不會影響整個Leaf的可用性。

這個版本程式碼在線上穩定運行了半年左右，Leaf又遇到了新的問題：

號段長度始終是固定的，假如Leaf本來能在DB不可用的情況下，維持10分鐘正常工作，那麼如果流量增加10倍就只能維持1分鐘正常工作了。
號段長度設定的過長，導致快取中的號段遲遲消耗不完，進而導致更新DB的新號段與前一次下發的號段ID跨度過大。

Leaf動態調整Step

假設服務QPS為Q，號段長度為L，號段更新週期為T，那麼Q * T = L。最開始L長度是固定的，導致隨著Q的增長，T會越來越小。但是Leaf本質的需求是希望T是固定的。那麼如果L可以和Q正相關的話，T就可以趨近一個定值了。所以Leaf每次更新號段的時候，根據上一次更新號段的週期T和號段長度step，來決定下一次的號段長度nextStep：

T < 15min，nextStep = step * 2
15min < T < 30min，nextStep = step
T > 30min，nextStep = step / 2

至此，滿足了號段消耗穩定趨於某個時間區間的需求。當然，面對瞬時流量幾十、幾百倍的暴增，該種方案仍不能滿足可以容忍資料庫在一段時間不可用、系統仍能穩定執行的需求。因為本質上來講，Leaf雖然在DB層做了些容錯方案，但是號段方式的ID下發，最終還是需要強依賴DB。

MySQL高可用

在MySQL這一層，Leaf目前採取了半同步的方式同步資料，通過公司DB中介軟體Zebra加MHA做的主從切換。未來追求完全的強一致，會考慮切換到MySQL Group Replication。

現階段由於公司資料庫強一致的特性還在演進中，Leaf採用了一個臨時方案來保證機房斷網場景下的資料一致性：

多機房部署資料庫，每個機房一個例項，保證都是跨機房同步資料。
半同步超時時間設定到無限大，防止半同步方式退化為非同步複製。

Leaf監控

針對服務自身的監控，Leaf提供了Web層的記憶體資料對映介面，可以實時看到所有號段的下發狀態。比如每個號段雙buffer的使用情況，當前ID下發到了哪個位置等資訊都可以在Web介面上檢視。

Leaf Snowflake

Snowflake，Twitter開源的一種分散式ID生成演算法。基於64位數實現，下圖為Snowflake演算法的ID構成圖。

第1位置為0。
第2-42位是相對時間戳，通過當前時間戳減去一個固定的歷史時間戳生成。
第43-52位是機器號workerID，每個Server的機器ID不同。
第53-64位是自增ID。

這樣通過時間+機器號+自增ID的組合來實現了完全分散式的ID下發。

在這裡，Leaf提供了Java版本的實現，同時對Zookeeper生成機器號做了弱依賴處理，即使Zookeeper有問題，也不會影響服務。Leaf在第一次從Zookeeper拿取workerID後，會在本機檔案系統上快取一個workerID檔案。即使ZooKeeper出現問題，同時恰好機器也在重啟，也能保證服務的正常執行。這樣做到了對第三方元件的弱依賴，一定程度上提高了SLA。

未來規劃

號段載入優化：Leaf目前重啟後的第一次請求還是會同步載入MySQL，之所以這麼做而非服務初始化載入號段的原因，主要是MySQL中的Leaf Key並非一定都被這個Leaf服務節點所載入，如果每個Leaf節點都在初始化載入所有的Leaf Key會導致號段的大量浪費。因此，未來會在Leaf服務Shutdown時，備份這個服務節點近一天使用過的Leaf Key列表，這樣重啟後會預先從MySQL載入Key List中的號段。
單調遞增：簡易的方式，是隻要保證同一時間、同一個Leaf Key都從一個Leaf服務節點獲取ID，即可保證遞增。需要注意的問題是Leaf服務節點切換時，舊Leaf 服務用過的號段需要廢棄。路由邏輯，可採用主備的模型或者每個Leaf Key 配置路由表的方式來實現。

關於開源

分散式ID生成的方案有很多種，Leaf開源版本提供了兩種ID的生成方式：

號段模式：低位趨勢增長，較少的ID號段浪費，能夠容忍MySQL的短時間不可用。
Snowflake模式：完全分散式，ID有語義。

讀者可以按需選擇適合自身業務場景的ID下發方式。希望美團的方案能給予大家一些幫助，同時也希望各位能夠一起交流、共建。

Leaf專案Github地址：https://github.com/Meituan-Dianping/Leaf 。

如有任何疑問和問題，歡迎提交至Github issues。

Leaf：美團分散式ID生成服務開源

Leaf特性

Leaf誕生

Leaf雙Buffer優化

Leaf動態調整Step

MySQL高可用

Leaf監控

Leaf Snowflake

未來規劃

關於開源

Leaf：美團分散式ID生成服務開源

美團分散式ID生成框架Leaf原始碼分析及優化改進

分散式ID生成服務，真的有必要搞一個

9種分散式ID生成之美團（Leaf）實戰

海盜中間件：美團服務體驗平臺對接業務數據的最佳實踐

分散式唯一ID生成服務

美團張志桐：美團 HTTP 服務治理實踐

前端黑科技：美團網頁首幀優化實踐

【人物誌】技術十年：美團第一位前端工程師潘魏增

鐐銬之舞：美團安全工程師Black Hat USA演講

Logan：美團點評的開源移動端基礎日誌庫

美團技術分享：美團深度學習系統的工程實踐

ID生成服務

分散式ID生成策略(1)_snowflake演算法

實戰 Python 網路爬蟲：美團美食商家資訊和使用者評論

智慧運維：美團SQL Advisor的自動化SQL優化實現

基於TwitterSnowflake分散式id生成工具類實現

美團點評運維總監鍾紅軍：美團運維的工具化、產品化、運營化

分散式ID生成系統 UUID與雪花（snowflake）演算法

技術年貨：美團技術沙龍合輯大放送——85個演講，70+小時視訊

Leaf：美團分散式ID生成服務開源

Leaf特性

Leaf誕生

Leaf雙Buffer優化

Leaf動態調整Step

MySQL高可用

Leaf監控

Leaf Snowflake

未來規劃

關於開源

相關推薦