依賴zookeeper元件的一種高可用實踐

阿新 • • 發佈：2019-01-14

背景

電子商務系統大量使用mysql資料庫作為其交易和儲存的系統；隨著商戶和使用者量的不斷增長，mysql中儲存的資料量會越來越大，這時把所有資料儲存在一張表或者一個數據庫中會極大的影響系統的效能和安全。分庫分表是業界一個比較通用的方案，並且也比較成熟。

為了進行分庫分表，我們需要為業務表中設定一個唯一的id；舉個商品中心的例子：為了把一個租戶下的所有菜品，菜價，菜品分類放在一下，會在所有這些表上加上一個全域性唯一的租戶id。

全域性id演算法

經過我們前期的調研和討論，我們最終選擇了twitter的snowflake（詳細介紹請參考

分散式自增ID服務。）, 演算法生成64位的id如下：

未用	毫秒數	datacenterId	workId	毫秒內序列號
1bit	41bit	5bit	5bit	12bit

該演算法在本地程序執行效率非常高，但datacenterId，和workId需要在一個叢集中被分配成唯一的；在實際應用中，datacenterId可能沒有，那workId就是10個bit。

下面章節將重點介紹唯一workId的生成過程。

zookeeper生成唯一的workId

workId分配演算法在zookeeper中的節點

0 001001

invoicing標識進銷存服務的節點。

lock是實現分散式鎖的節點，Lock_i是臨時順序節點。

workId節點下儲存每一個機器節點，key=ip1, data＝workId1 (演算法保證workId不重複)，為永久節點。

zookeeper的節點型別

型別	描述
持久節點（PERSISTENT）	在節點建立後，就一直存在，直到有刪除操作來主動清除這個節點——不會因為建立該節點的客戶端會話失效而消失
持久順序節點（PERSISTENT_SEQUENTIAL）	這類節點包含持久節點的特性；額外的特性是，每個父節點會為他的第一級子節點維護一份時序，會記錄每個子節點建立的先後順序。在建立此類節點中，ZK會自動為給定節點名加上一個數字字尾，作為新的節點名。這個數字字尾的範圍是整型的最大值。
臨時節點（EPHEMERAL）	和持久節點不同的是，臨時節點的生命週期和客戶端會話繫結。也就是說，如果客戶端會話失效，那麼這個節點就會自動被清除掉。注意，這裡提到的是會話失效，而非連線斷開。另外，在臨時節點下面不能建立子節點。
臨時順序節點（EPHEMERAL_SEQUENTIAL）	臨時自動編號節點；當客戶端和伺服器的session超時後，節點被刪除；在被建立時每個節點被自動的編號。

生成唯一workId的流程圖

其中在zookeeper中實現互斥鎖是演算法的難點。

Zookeeper實現互斥鎖的流程圖

zookeeper原始碼中分散式鎖的原始碼分析(/zookeeper-3.5.1-alpha/src/recipes/lock/src/c/src/zoo_lock.c)

主要的邏輯程式碼在zkr_lock_operation()中，解釋主要邏輯

staticintzkr_lock_operation(zkr_lock_mutex_t *mutex, struct timespec *ts) {
－－－－－－－－－－－－－－－－－－－－  //省略部分程式碼
//獲取Locks下所有的節點
ret = retry_getchildren(zh, path, &vectorst, ts, retry);
if(ret != ZOK)
returnret;
struct String_vector *vector = &vectorst;
mutex->id = lookupnode(vector, prefix);    // 獲取當前節點的id
if(mutex->id == NULL) {  
//當前id不存在，則建立一個臨時順序節點
ret = zoo_create(zh, buf, NULL, 0,  mutex->acl,
ZOO_EPHEMERAL|ZOO_SEQUENCE, retbuf, (len+20));
}
if(mutex->id != NULL) {
ret = ZCONNECTIONLOSS;
ret = retry_getchildren(zh, path, vector, ts, retry);
if(ret != ZOK) {
LOG_WARN(("could not connect to server"));
returnret;
}
//sort this list, 按照節點的編號排序，
sort_children(vector);
owner_id = vector->data[0];  //獲取最小編號的節點
mutex->ownerid = strdup(owner_id);
id = mutex->id;
char* lessthanme = child_floor(vector->data, vector->count, id);   // 獲取比自己編號小的節點
if(lessthanme != NULL){ //證明當前最小編號的節點不是我自己， 該程式不能獲得鎖
－－－－－－－－－－  //省略部分程式碼
ret = retry_zoowexists(zh, last_child, &lock_watcher_fn, mutex,                                        | }
&stat, ts, retry);  //比自己編號小的節點是一個列表，觀察該列表中編號最大的節點
//這樣比觀察父節點/Locks的變化有優勢，能夠有效的減少“驚群效應”
－－－－－－－－－－  //省略部分程式碼
} else{
//獲得了該鎖
}
}

zookeeper高可用實踐

Zookeeper中的幾個重要角色

角色名	描述	參與寫	參與讀
領導者(Leader)	Leader作為整個ZooKeeper叢集的主節點，負責響應所有對ZooKeeper狀態變更的請求；領導者負責進行投票的發起和決議，更新系統狀態，處理寫請求。	必然參與	可以參與
跟隨者(Follwer)	響應本伺服器上的讀請求外，follower還要處理leader的提議，並在leader提交該提議時在本地進行提交。	必然參與	可以參與
觀察者（Observer）	觀察者可以接收客戶端的讀寫請求，並將寫請求轉發給Leader，但Observer節點不參與投票過程，只同步leader狀態，Observer的目的是為了，擴充套件系統，提高讀取速度；3.3.0版本以上才有這個角色。	不參與	主要參與
客戶端(Client)	執行讀寫請求的發起方。

某公司之前的部署模式（在同一機房部署Follow, Leader節點）：

缺點：當client讀量增加後，可以通過增加叢集的Follower來提升系統的讀效能；

但隨著Follower節點資料的增加，系統的寫效能會有很大的影響（所有的follower都要參與提議的投票過程，這樣follower節點越多，參與的決議投票的follower就越多）；

zookeeper叢集之前有過讀流量和使用者亂用client，導致拖垮主叢集的casestudy。

基礎架構組反饋某部門的讀流量特別小，當前zookeeper叢集按照按這種模式部署的。

美團公司當前的部署模式（優化後）：

叢集部署的說明：

型別	描述	職責	是否儲存資料
主機房	由Leader/Follower構成的投票叢集（對應之前的部署模式）	負責叢集的讀寫請求	儲存
機房A	由Observer構成的ZK叢集	負責處理讀請求，轉發client的寫請求到主機房	儲存
機房B	由Observer構成的ZK叢集	負責處理讀請求，轉發client的寫請求到主機房	儲存

優點：

客戶端能夠在本機房讀取所需要的資料，減少跨機房的呼叫延遲。

Observer機器發生故障，或者機房之間的鏈路發生故障，不會影響到zookeeper主叢集的使用

workId生成演算法弱依賴zookeeper的實踐

因為workId生成演算法只在程式初次部署，或者重啟的時候需要訪問zookeeper，並且該配置後續一直都不會更改，可以考慮儲存在zookeeper中的資訊，也在本地檔案或者配置中心中儲存一份。

初始化邏輯：

容錯邏輯：

配置中心在設計的時候就有本地快取（快取檔案），可以直接複用配置中心寫本地檔案的邏輯，而不用額外的寫一個新的本地檔案。

參考文獻：

zookeeper的整體介紹： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/

zookeeper的部署實踐： http://www.cnblogs.com/sunddenly/p/4143306.html

zookeeper sre: zookeeper叢集架構

依賴zookeeper元件的一種高可用實踐

背景電子商務系統大量使用mysql資料庫作為其交易和儲存的系統；隨著商戶和使用者量的不斷增長，mysql中儲存的資料量會越來越大，這時把所有資料儲存在一張表或者一個數據庫中會極大的影響系統的效能和安全。分庫分表是業界一個比較通用

一種高可用性、高效能、高實時性的伺服器架構設計

【主要從期貨市場的需求獲取靈感】一、需求 (一)、高可用性 1、持續執行無間斷 2、單點故障不影響 3、執行期間可監控 4、故障可跟蹤排查 5、失敗恢復無間隔 (二)、高效能 6、負載均衡高並行 (三)、高實時性 7、請求響應低時延 8、變化可主動通知二、關鍵點分析

十一.keepalived高可用服務實踐部署

-s ash app The bind vim bin shel 全局期中集群架構-第十一章-keepalived高可用集群章節======================================================================01

一套高可用、易伸縮、高併發的IM群聊架構方案設計實踐

本文原題為“一套高可用群聊訊息系統實現”，由作者“於雨氏”授權整理和釋出，內容有些許改動，作者部落格地址：alexstocks.github.io。應作者要求，如需轉載，請聯絡作者獲得授權。一、引言要實現一整套能用於大使用者量、高併發場景下的IM群聊，技術難度遠超IM系統中的其它功能，原

架構設計：一種遠端呼叫服務的設計構思（zookeeper的一種應用實踐）

在深入學習zookeeper我想先給大家介紹一個和zookeeper相關的應用例項，我把這個例項命名為遠端呼叫服務。通過對這種應用例項的描述，我們會對zookeeper應用場景會有深入的瞭解。　　遠端呼叫是系統與系統之間的通訊機制，它的另一種理解就是程序間的通訊。做分散式

一種高級的DoS攻擊-Hash碰撞攻擊

讀取 turn variable 重寫我們 targe count http 返回結果原文鏈接這是迄今為止第一個讓我覺得後怕的攻擊方式，涉及的範圍廣難以防禦，攻擊效果立竿見影。大量的網站和Web接口都未做Hash碰撞攻擊的防禦，一拿一個準。隨著RESTful風格的接

一臉懵逼學習KafKa集群的安裝搭建--（一種高吞吐量的分布式發布訂閱消息系統）

zkserver 搜索 block virtual 文件內容 ava use 問題 1：KafKa的官方網址：http://kafka.apache.org/ 開發流程圖，如： 2：KafKa的基礎知識： 2.1：kafka是一個分布式的消息緩存系統2.2：

.Net中集合排序的一種高級玩法

void nullable strong init .html ace 文章 tab center 背景：學生有名稱、學號，班級有班級名稱、班級序號學校有學校名稱、學校編號（序號）需求現在需要對學生進行排序第一排序邏輯按學

nginx高可用實踐

SM etc 利用分享 VR color hand tool httpd 利用keepalived實現nginx調度器高可用； 1.在兩臺主機IP地址分別為（172.16.0.152 172.16.0.151）上分別配置keepalived 1.

如何構建一套高可用的 APP 訊息推送平臺

轉載自如何構建一套高可用的 APP 訊息推送平臺訊息推送作為移動 APP 運營中的一項關鍵技術，已經被越來越廣泛的運用。本文追溯了推送技術的發展歷史，剖析了其核心原理，並對推送服務的關鍵技術進行深入剖析，圍繞訊息推送時產生的服務不穩定性，訊息丟失、延遲，接入複雜性，統計

SpringCloud元件：Eureka高可用叢集部署

高可用叢集部署 Eureka 服務註冊中心。構建專案使用 idea 開發工具建立一個 SpringBoot 專案，新增 Eureka Server 依賴即可， pom.xml 配置檔案如下所示： .

mysql主主複製+Keepalived高可用實踐

最近領導交給我一個任務，說是研究一下mysql的高可用方案，方向為keepalived+mysql的主主複製功能。剛開始一臉懵逼，竟然連“高可用”、“主主複製”、“keepalived”這些詞都是第一次聽說，真是汗顏。於是，趕緊惡補，原來複制（replication）功能

如何構建一套高可用的移動訊息推送平臺？

作者:李曉清、董澤光編輯:小智訊息推送作為移動 APP 運營中的一項關鍵技術，已經被越來越廣泛的運用。本文追溯了推送技術的發展歷史，剖析了其核心原理，並對推送服務的關鍵技術進行深入剖析，圍繞訊息推送時產生的服務不穩定性，訊息丟失、延遲，接入複雜性，統計缺失等問題，提供了一整套平臺級的高可用訊

MySQL分散式資料庫高可用實踐：架構、複製機制、多機房

大家好！我是網易資料運維工程師杜明友，大家可以叫我老杜。首先介紹一下網易雲，是網易集團旗下雲端計算和大資料品牌，本文要深入分析的案例是網易雲旗下的即時通訊雲平臺業務，開發者通過整合客戶端SDK和雲端OPEN API，即可快速實現強大的IM功能，作為PaaS服務模式的網易雲信全面支援Android、iOS、We

hadoop+Zookeeper叢集安裝配置高可用-HadoopHA

1、請看：https://blog.csdn.net/sunxiaoju/article/details/85222290，此處只是配置系統的：硬體配置以及作業系統、節點需要安裝的工具、安裝JDK環境、建立hadoop使用者、建立ssh無密碼登入本機前五部分，第6部分的hadoop安裝在此博文中

iOS一種高斯模糊漸變動畫的實現

關於高斯模糊的方式有很多種，但是如果需要模糊漸變，那麼對這種高斯模糊演算法的效能要求是比較高的，今天這裡重點不討論演算法，只是提供一個動畫實現的思路。動畫效果如下：高斯模糊漸變動畫 //高斯模糊 -(UIImage )boxblurImage:(UI

靜態庫依賴關係的一種情況

首先確定的一個概念：lib檔案和obj檔案都是原始碼生成的中間檔案，只不過lib檔案可能是由多個obj檔案集合而來。靜態庫是一個或多個obj檔案的打包。最終都會連結到可執行程式中去。假設下面一種情況：應用程式TestCallLib依賴靜態連結庫Tes

Linux下keepalived+Mysql主主同步實現資料庫高可用實踐

1）：編輯mysql配置檔案/etc/my.cnf，選定主主同步的資料庫 [mysqld] datadir=/var/lib/mysql socket=/var/lib/mysql/mysql.sock user=mysql symbolic-links=0 lo

zookeeper示例--（主從高可用）實時更新server列表

和balance高可用可以設計出很穩定的後臺任務架構。http://sling2007.blog.163.com/blog/static/84732713201362563350363/ 場景描述在分散式應用中, 我們經常同時啟動多個server, 呼叫方(client

Mysql學習總結（54）——MySQL 叢集常用的幾種高可用架構方案

前言高可用架構對於網際網路服務基本是標配，無論是應用服務還是資料庫服務都需要做到高可用。對於一個系統而言，可能包含很多模組，比如前端應用，快取，資料庫，搜尋，訊息佇列等，每個模組都需要做到高可用，才能保

依賴zookeeper元件的一種高可用實踐

背景

全域性id演算法

zookeeper生成唯一的workId

zookeeper高可用實踐

Zookeeper中的幾個重要角色

某公司之前的部署模式（在同一機房部署Follow, Leader節點）：

美團公司當前的部署模式（優化後）：

workId生成演算法弱依賴zookeeper的實踐

相關推薦