Leaf:美團分散式ID生成服務開源
Leaf是美團基礎研發平臺推出的一個分散式ID生成服務,名字取自德國哲學家、數學家萊布尼茨的一句話:“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全域性唯一等特點。目前已經廣泛應用於美團金融、美團外賣、美團酒旅等多個部門。具體的技術細節,可參考此前美團技術部落格的一篇文章:
Leaf特性
Leaf在設計之初就秉承著幾點要求:
- 全域性唯一,絕對不會出現重複的ID,且ID整體趨勢遞增。
- 高可用,服務完全基於分散式架構,即使MySQL宕機,也能容忍一段時間的資料庫不可用。
- 高併發低延時,在CentOS 4C8G的虛擬機器上,遠端呼叫QPS可達5W+,TP99在1ms內。
- 接入簡單,直接通過公司RPC服務或者HTTP呼叫即可接入。
Leaf誕生
Leaf第一個版本採用了預分發的方式生成ID,即可以在DB之上掛N個Server,每個Server啟動時,都會去DB拿固定長度的ID List。這樣就做到了完全基於分散式的架構,同時因為ID是由記憶體分發,所以也可以做到很高效。接下來是資料持久化問題,Leaf每次去DB拿固定長度的ID List,然後把最大的ID持久化下來,也就是並非每個ID都做持久化,僅僅持久化一批ID中最大的那一個。這個方式有點像遊戲裡的定期存檔功能,只不過存檔的是未來某個時間下發給使用者的ID,這樣極大地減輕了DB持久化的壓力。
整個服務的具體處理過程如下:
- Leaf Server 1:從DB載入號段[1,1000]。
- Leaf Server 2:從DB載入號段[1001,2000]。
- Leaf Server 3:從DB載入號段[2001,3000]。
使用者通過Round-robin的方式呼叫Leaf Server的各個服務,所以某一個Client獲取到的ID序列可能是:1,1001,2001,2,1002,2002......也可能是:1,2,1001,2001,2002,2003,3,4......當某個Leaf Server號段用完之後,下一次請求就會從DB中載入新的號段,這樣保證了每次載入的號段是遞增的。
Leaf資料庫中的號段表格式如下:
+-------------+--------------+------+-----+-------------------+-----------------------------+ | Field | Type | Null | Key | Default | Extra | +-------------+--------------+------+-----+-------------------+-----------------------------+ | biz_tag | varchar(128) | NO | PRI | | | | max_id | bigint(20) | NO | | 1 | | | step | int(11) | NO | | NULL | | | desc | varchar(256) | YES | | NULL | | | update_time | timestamp | NO | | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP | +-------------+--------------+------+-----+-------------------+-----------------------------+
Leaf Server載入號段的SQL語句如下:
Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit
整體上,V1版本實現比較簡單,主要是為了儘快解決業務層DB壓力的問題,而快速迭代出的一個版本。因而在生產環境中,也發現了些問題。比如:
- 在更新DB的時候會出現耗時尖刺,系統最大耗時取決於更新DB號段的時間。
- 當更新DB號段的時候,如果DB宕機或者發生主從切換,會導致一段時間的服務不可用。
Leaf雙Buffer優化
為了解決這兩個問題,Leaf採用了非同步更新的策略,同時通過雙Buffer的方式,保證無論何時DB出現問題,都能有一個Buffer的號段可以正常對外提供服務,只要DB在一個Buffer的下發的週期內恢復,就不會影響整個Leaf的可用性。
這個版本程式碼在線上穩定運行了半年左右,Leaf又遇到了新的問題:
- 號段長度始終是固定的,假如Leaf本來能在DB不可用的情況下,維持10分鐘正常工作,那麼如果流量增加10倍就只能維持1分鐘正常工作了。
- 號段長度設定的過長,導致快取中的號段遲遲消耗不完,進而導致更新DB的新號段與前一次下發的號段ID跨度過大。
Leaf動態調整Step
假設服務QPS為Q,號段長度為L,號段更新週期為T,那麼Q * T = L。最開始L長度是固定的,導致隨著Q的增長,T會越來越小。但是Leaf本質的需求是希望T是固定的。那麼如果L可以和Q正相關的話,T就可以趨近一個定值了。所以Leaf每次更新號段的時候,根據上一次更新號段的週期T和號段長度step,來決定下一次的號段長度nextStep:
- T < 15min,nextStep = step * 2
- 15min < T < 30min,nextStep = step
- T > 30min,nextStep = step / 2
至此,滿足了號段消耗穩定趨於某個時間區間的需求。當然,面對瞬時流量幾十、幾百倍的暴增,該種方案仍不能滿足可以容忍資料庫在一段時間不可用、系統仍能穩定執行的需求。因為本質上來講,Leaf雖然在DB層做了些容錯方案,但是號段方式的ID下發,最終還是需要強依賴DB。
MySQL高可用
在MySQL這一層,Leaf目前採取了半同步的方式同步資料,通過公司DB中介軟體Zebra加MHA做的主從切換。未來追求完全的強一致,會考慮切換到MySQL Group Replication。
現階段由於公司資料庫強一致的特性還在演進中,Leaf採用了一個臨時方案來保證機房斷網場景下的資料一致性:
- 多機房部署資料庫,每個機房一個例項,保證都是跨機房同步資料。
- 半同步超時時間設定到無限大,防止半同步方式退化為非同步複製。
Leaf監控
針對服務自身的監控,Leaf提供了Web層的記憶體資料對映介面,可以實時看到所有號段的下發狀態。比如每個號段雙buffer的使用情況,當前ID下發到了哪個位置等資訊都可以在Web介面上檢視。
Leaf Snowflake
Snowflake,Twitter開源的一種分散式ID生成演算法。基於64位數實現,下圖為Snowflake演算法的ID構成圖。
- 第1位置為0。
- 第2-42位是相對時間戳,通過當前時間戳減去一個固定的歷史時間戳生成。
- 第43-52位是機器號workerID,每個Server的機器ID不同。
- 第53-64位是自增ID。
這樣通過時間+機器號+自增ID的組合來實現了完全分散式的ID下發。
在這裡,Leaf提供了Java版本的實現,同時對Zookeeper生成機器號做了弱依賴處理,即使Zookeeper有問題,也不會影響服務。Leaf在第一次從Zookeeper拿取workerID後,會在本機檔案系統上快取一個workerID檔案。即使ZooKeeper出現問題,同時恰好機器也在重啟,也能保證服務的正常執行。這樣做到了對第三方元件的弱依賴,一定程度上提高了SLA。
未來規劃
- 號段載入優化:Leaf目前重啟後的第一次請求還是會同步載入MySQL,之所以這麼做而非服務初始化載入號段的原因,主要是MySQL中的Leaf Key並非一定都被這個Leaf服務節點所載入,如果每個Leaf節點都在初始化載入所有的Leaf Key會導致號段的大量浪費。因此,未來會在Leaf服務Shutdown時,備份這個服務節點近一天使用過的Leaf Key列表,這樣重啟後會預先從MySQL載入Key List中的號段。
- 單調遞增:簡易的方式,是隻要保證同一時間、同一個Leaf Key都從一個Leaf服務節點獲取ID,即可保證遞增。需要注意的問題是Leaf服務節點切換時,舊Leaf 服務用過的號段需要廢棄。路由邏輯,可採用主備的模型或者每個Leaf Key 配置路由表的方式來實現。
關於開源
分散式ID生成的方案有很多種,Leaf開源版本提供了兩種ID的生成方式:
- 號段模式:低位趨勢增長,較少的ID號段浪費,能夠容忍MySQL的短時間不可用。
- Snowflake模式:完全分散式,ID有語義。
讀者可以按需選擇適合自身業務場景的ID下發方式。希望美團的方案能給予大家一些幫助,同時也希望各位能夠一起交流、共建。
Leaf專案Github地址:https://github.com/Meituan-Dianping/Leaf 。
如有任何疑問和問題,歡迎提交至Github issues。
相關推薦
Leaf:美團分散式ID生成服務開源
開發十年,就只剩下這套架構體系了! >>>
美團分散式ID生成框架Leaf原始碼分析及優化改進
最近做了一個面試題解答的開源專案,大家可以看一看,如果對大家有幫助,希望大家幫忙給一個star,謝謝大家了! 《面試指北》專案地址:https://github.com/NotFound9/interviewGuide ![image.png](https://images.xiaozhuanlan.co
分散式ID生成服務,真的有必要搞一個
## 目錄 1. 闡述背景 2. Leaf snowflake 模式介紹 3. Leaf segment 模式介紹 4. Leaf 改造支援RPC ## 闡述背景 不吹噓,不誇張,專案中用到ID生成的場景確實挺多。比如業務要做冪等的時候,如果沒有合適的業務欄位去做唯一標識,那就需要單獨生成一個唯一的標識,
9種分散式ID生成之 美團(Leaf)實戰
整理了一些Java方面的架構、面試資料(微服務、叢集、分散式、中介軟體等),有需要的小夥伴可以關注公眾號【程式設計師內點事】,無套路自行領取 更多優選 一口氣說出 9種 分散式ID生成方式,面試官有點懵了 面試總被問分庫分表怎麼辦?你可以這樣懟他 3萬字總結,Mysql優化之精髓 為了不復制貼上,我被逼
海盜中間件:美團服務體驗平臺對接業務數據的最佳實踐
com href 多條 iba agent pack cunit 支付 實的 背景 移動互聯網時代,用戶體驗為王。美團服務體驗平臺希望能夠幫助客戶解決在選、購、用美團產品過程中遇到的各種問題,真正做到“以客戶為中心”,為客戶排憂解難。 但服務體驗平臺內部只維護客戶的客訴數據
分散式唯一ID生成服務
SNService是一款基於分散式的唯一ID生成服務,主要用於提供大數量業務資料建立唯一ID的需要;服務提供最低10K/s的唯一ID請求處理.如果你部署服務的CPU資源達到4核的情況下那該服務最低可以提供100K/s的請求處理能力.服務支援部署到Linux mono 3.2.3和Windows .
美團張志桐:美團 HTTP 服務治理實踐
2019 年 7 月 6 日,OpenResty 社群聯合又拍雲,舉辦 OpenResty × Open Talk 全國巡迴沙龍·上海站,美團基礎架構部技術專家張志桐在活動上做了《美團 HTTP 服務治理實踐》的分享。 OpenResty x Open Talk 全國巡迴沙龍是由 OpenResty 社群、又
前端黑科技:美團網頁首幀優化實踐
前言 自JavaScript誕生以來,前端技術發展非常迅速。移動端白屏優化是前端介面體驗的一個重要優化方向,Web 前端誕生了 SSR 、CSR、預渲染等技術。在美團支付的前端技術體系裡,通過預渲染提升網頁首幀優化,從而優化了白屏問題,提升使用者體驗,並形成了最佳實踐。 在前端渲染領域,主要有以下幾種方式
【人物誌】技術十年:美團第一位前端工程師潘魏增
導讀 潘魏增,2006年畢業於南開大學電子系,2008年加入早期飯否團隊。美團第一位前端工程師,現在是X專案組終端研發部的負責人。處女座,INTJ,喜歡Linux和Vim,崇尚開源,相信開源可以讓世界變得更美好。 從飯否到美團,潘魏增用十年的技術生涯,詮釋了“長期有耐心”這句話
鐐銬之舞:美團安全工程師Black Hat USA演講
背景 2018年8月9日,全球頂級安全會議——Black Hat USA在美國拉斯維加斯的曼德勒海灣會議中心落下了帷幕,這場盛會在全球黑客心中幾乎等同於“世界盃”和“奧斯卡”一樣的存在。這場一年一度的盛會已經有著21年的悠久歷史,也被公認為世界資訊保安行業的最高盛會之一。 作為在國內安全領域擁有多年的實戰經
Logan:美團點評的開源移動端基礎日誌庫
前言 Logan是美團點評集團移動端基礎日誌元件,這個名稱是Log和An的組合,代表個體日誌服務。同時Logan也是“金剛狼”大叔的名號,當然我們更希望這個產品能像金剛狼大叔一樣犀利。 Logan已經穩定迭代了一年多的時間。目前美團點評絕大多數App已經接入並使用Logan進行日誌收集、上傳、分析。近日,我
美團技術分享:美團深度學習系統的工程實踐
背景 深度學習作為AI時代的核心技術,已經被應用於多個場景。在系統設計層面,由於其具有計算密集型的特性,所以與傳統的機器學習演算法在工程實踐過程中存在諸多的不同。本文將介紹美團平臺在應用深度學習技術的過程中,相關係統設計的一些經驗。 本文將首先列舉部分深度學習演算法所需的計算量,然後再介紹為滿足這些計算量,
ID生成服務
業務系統對ID的要求 全域性唯一性 趨勢遞增,保證有序 單調遞增,保證下一個ID一定大於上個ID,滿足排序等 無規則不規則,保證資訊保安,不能連續,防止扒取,比如訂單號可以計算單量 高可用性,一崩全崩 低延遲,高效能(QPS) 常見方法 UUID(Universally U
分散式ID生成策略(1)_snowflake演算法
轉載: 最近在研究分散式ID的生成方法,發現Twitter的snowflake演算法挺有意思,因此親自動手用Java進行了實現。 snowflake演算法的原理就是用64位整數來表示主鍵,其結構如下圖: 1 bit符號位:設計者不喜歡負數主鍵?方便使用負數標識不正確
實戰 Python 網路爬蟲:美團美食商家資訊和使用者評論
實戰 Python 網路爬蟲美團美食商家資訊和使用者評論作者簡介:Hyx,多年系統研發經驗,主要
智慧運維:美團SQL Advisor的自動化SQL優化實現
2017年10月19日,網際網路+生活服務平臺美團點評宣佈完成新一輪40億美元融資,投後估值300億美元。 在技術上,美團點評技術團隊以及成為業界一流的研發組織,形成了比較完整的技術體系。在2017第七屆資料技術嘉年華大會上,我們有幸邀請了美團點評的技術專家龍雪剛進行主題分享,將全面介紹和解讀他們獨
基於TwitterSnowflake分散式id生成工具類實現
1、 什麼是TwitterSnowflake? 簡介: TwitterSnowflake演算法是用來在分散式場景下生成唯一ID的。 舉個栗子:我們有10臺分散式MySql伺服器,我們的系統每秒能生成10W條資料插入到這10臺機器裡,現在我們需要為每一條資料生成一個全域性唯一的ID,
美團點評運維總監鍾紅軍:美團運維的工具化、產品化、運營化
本次分享嘉賓是美團點評運維中心高階總監鍾紅軍,他向我們詳細介紹了美團點評近3年來在大規模運維的理念和實踐方面的探索,尤其是在運維自動化和資料運營方面的工作和效果。 鍾紅軍 / 美團點評運維中心高階總監 美團點評集團運維中心高階總監,此前曾工作於百度,騰訊,PPTV等網際網路公司,熟悉系統、網路、運
分散式ID生成系統 UUID與雪花(snowflake)演算法
Leaf——美團點評分散式ID生成系統 -https://tech.meituan.com/MT_Leaf.html 網遊伺服器中的GUID(唯一標識碼)實現-基於snowflake演算法-雲棲社群-阿里雲https://yq.aliyun.com/articles/229420 UUID_STRING
技術年貨:美團技術沙龍合輯大放送——85個演講,70+小時視訊
你好,2019 再見,2018 又到了一年辭舊迎新的時候,大家應該也和美美一樣,在忙著總結回顧和展望規劃吧。 按老慣例,我們該獻上技術年貨了。今年首先出場的,是我們的技術沙龍大套餐! 美團技術沙龍是由美團技術團隊和美團科協主辦的線下技術活動,每期沙龍邀請美團和同行公司的技術專家分享來