zookeeper 基本原理

阿新 • • 發佈：2020-10-29

一。zookeeper簡介

zookeeper 是apache旗下的hadoop子專案，它一個開源的，分散式的服務協調器。同樣通過zookeeper可以實現服務間的同步與配置維護。通常情況下，在分散式應用開發中，協調服務這樣的工作不是件容易的事，很容易出現死鎖，不恰當的選舉競爭等。zookeeper就是擔負起了分散式協調的重擔。
zookeeper選舉機制

zookeeper 預設的演算法是 FastLeaderElection，採用投票數大於半數則勝出的邏輯。

相關內容：Zab協議、資料可以兩階段提交協議

 1. 與選舉相關的概念

伺服器 ID

比如有三臺伺服器，編號分別是 1,2,3。
編號越大在選擇演算法中的權重越大。

選舉狀態

LOOKING，競選狀態。
FOLLOWING，隨從狀態，同步 leader 狀態，參與投票。
OBSERVING，觀察狀態,同步 leader 狀態，不參與投票。
LEADING，領導者狀態。

資料 ID

伺服器中存放的最新資料 version。
值越大說明資料越新，在選舉演算法中資料越新權重越大。

邏輯時鐘

也叫投票的次數，同一輪投票過程中的邏輯時鐘值是相同的。每投完一次票這個資料就會增加，然後與接收到的其它伺服器返回的投票資訊中的數值相比，根據不同的值做出不同的判斷。

2. 全新叢集選舉

假設目前有 5 臺伺服器，每臺伺服器均沒有資料，它們的編號分別是1,2,3,4,5,按編號依次啟動，它們的選擇舉過程如下：
1. 伺服器 1 啟動，給自己投票，然後發投票資訊，由於其它機器還沒有啟動所以它收不到反饋資訊，伺服器 1 的狀態一直屬於 Looking。
2. 伺服器 2 啟動，給自己投票，同時與之前啟動的伺服器 1 交換結果，由於伺服器 2 的編號大所以伺服器 2 勝出，但此時投票數沒有大於半數，所以兩個伺服器的狀態依然是 LOOKING。
3. 伺服器 3 啟動，給自己投票，同時與之前啟動的伺服器 1,2 交換資訊，由於伺服器 3 的編號最大所以伺服器 3 勝出，此時投票數正好大於半數，所以伺服器 3 成為領導者，伺服器 1,2 成為小弟。
4. 伺服器 4 啟動，給自己投票，同時與之前啟動的伺服器 1,2,3 交換資訊，儘管伺服器 4 的編號大，但之前伺服器 3 已經勝出，所以伺服器 4 只能成為小弟。
5. 伺服器 5 啟動，後面的邏輯同伺服器 4 成為小弟。
3. 非全新叢集選舉（大約耗時200毫秒）

對於執行正常的 zookeeper 叢集，中途有機器 down 掉，需要重新選舉時，選舉過程就需要加入資料 ID、伺服器 ID 和邏輯時鐘。
**資料 ID：**資料新的 version 就大，資料每次更新都會更新 version。
**伺服器 ID：**就是我們配置的 myid 中的值，每個機器一個。
**邏輯時鐘：**這個值從 0 開始遞增,每次選舉對應一個值。如果在同一次選舉中,這個值是一致的。
這樣選舉的標準就變成：
1. 邏輯時鐘小的選舉結果被忽略，重新投票；
2. 統一邏輯時鐘後，資料 id 大的勝出；
3. 資料 id 相同的情況下，伺服器 id 大的勝出；
4. 原子廣播

所有的寫操作請求被傳送給領導者，並通過廣播將更新資訊告訴跟隨者。當大部分跟隨者執行了修改之後，領導者就提交更新操作，客戶端將得到更新成功的迴應。未獲得一致性的協議被設計為原子的，因此無論修改失敗與否，他都分兩階段提交。

如果領導者出故障了，剩下存活的機器將會再次進行領導者選舉，並在新領導被選出前繼續執行任務。如果在不久後老的領導者恢復了，那麼它將以跟隨者的身份繼續執行。領導者選舉非常快，由釋出的結果所知，大約是200毫秒，因此在選舉是效能不會明顯減慢。

所有在ensemble中的機器在更新它們記憶體中的Znode樹之前會先將更新資訊寫入磁碟。讀操作請求可由任何機器服務，同時，由於他們只涉及記憶體查詢，因此非常快。

5. 疑惑

zookeeper是怎麼知道叢集大小的？

之前我們在搭建zookeeper叢集時，有一個檔案記錄了zookeeper叢集數量，忘記的可以看一下我之前的部落格：Linux上搭建zookeeper叢集，裡面有一個步驟是添加了node-1，node-2，node-3，到配置檔案中。

6. Zookeeper怎麼實現它的特性的（淺顯的理解）
```
1. 全域性資料一致：資料一致性是靠Paxos演算法保證的
    假設有一個社團，其中有社長、社員（決議小組成員）兩個角色，
    每個社員都可以接受外來的訊息，然後將訊息遞給社長處理。
    然後社長向社員申請提案來修改社團制度
    社員坐在一起，拿出自己收到的提案，對每個提案進行投票表決，超過半數通過即可生效
    為了秩序，規定每個提案都有編號ID，按順序自增
    每個社員都有一個社團制度筆記本，上面記著所有社團制度，和最近處理的提案編號，初始為0
    投票通過的規則：
        新提案ID 是否大於社員本中的ID，是社員舉手贊同
        如果舉手人數大於社員人數的半數，即讓新提案生效
    
    例如：
    剛開始，每個社員本子上的ID都為0，現在有一個社員想社長提出：團費改為100元，社長收到後將這個提案的ID增加 1
    每個社員都和自己ID對比，一看1>0，舉手贊同，同時修改自己本中的ID為1
    發出提案的社長一看超過半數同意，就宣佈：1號提案生效
    然後所有社員都修改自己筆記本中的團費為100元
    以後任何一個社員諮詢任何一個社員："團費是多少？"，社員可以直接開啟筆記本檢視，並回答：團費為100元
    
    可能會有極端的情況，就是多個社員一起發出了提案，就是併發的情況
    例如
    剛開始，每個議員本子上的編號都為0，現在有兩個議員（A和B）同時發出了提案，社長根據收到的先後順序對編號進行賦值(佇列)，
    那麼根據自增規則，這兩個提案的編號都為1，但只會有一個被先處理
    假設A的提案在B的上面，議員們先處理A提案並通過了，這時，議員們的本子上的ID已經變為了1，
    接下來處理B的提案，由於它的ID是1，不大於議員本子上的ID，B提案就被拒絕了，B議員需要重新發起提案  
    
    Paxos演算法解決的什麼問題呢，解決的就是保證每個節點執行相同的操作序列。好吧，這還不簡單，master維護一個全域性寫佇列，所有寫操作都必須 放入這個佇列編號，那麼無論我們寫多少個節點，只要寫操作是按編號來的，就能保證一致性。沒錯，就是這樣，可是如果master掛了呢。
    Paxos演算法通過投票來對寫操作進行全域性編號，同一時刻，只有一個寫操作被批准，同時併發的寫操作要去爭取選票，只有獲得過半數選票的
```
zookeeper的特點：
1. 使用簡單:ZooKeeper允許分散式程式通過一個類似於標準檔案系統的共享的層次化名稱空間來相互協調。名稱空間由資料暫存器(稱為znode)組成，在ZooKeeper中，它們類似於檔案和目錄。與為儲存而設計的典型檔案系統不同，ZooKeeper資料儲存在記憶體中，這意味著ZooKeeper可以達到高吞吐量和低延遲數
2. 同步與複製：組成ZooKeeper服務的伺服器必須互相有感知。客戶端連線到一個ZooKeeper伺服器。客戶端維護一個TCP連線，通過它傳送請求、獲取響應、獲取觀察事件和傳送心跳。如果連線到伺服器的TCP連線中斷，客戶端將連線到另一個伺服器。
3. 有序
4. 在進行大量讀操作時，執行速度奇快
ZooKeeper提供的名稱空間非常類似於標準檔案系統。名稱是由斜槓(/)分隔的路徑元素序列。在ZooKeeper的名稱空間中，每一個節點都是通過一條路徑來標識的。如圖所示：
當然zookeeper與標準檔案系統不同的是，它的節點分為永久節點和臨時節點(隨著會話斷開而消失)
　注意以下幾點：

　　　　a.不能刪除已經存在子節點的節點

　　　　b.不能再臨時節點上建立節點
客戶端的節點都會被設定一個監控，當znode發生更改時，這個變化會通知所有客戶端然後刪除
zookeeper與eureka淺談

　　一個分散式系統不可能同時滿足C(一致性)、A(可用性)和P(分割槽容錯性)

　　zookeeper優先保證CP，當服務發生故障會進行leader的選舉，整個期間服務處在不可用狀態，如果選舉時間過長勢必會大幅度降低效能，另外就用途來說zookeeper偏向於服務的協調，當然含有註冊中心的作用

　　eureka優先保證AP, 即服務的節點各個都是平等的，沒有leader不leader一說，當服務發生故障時，其餘的節點仍然可以提供服務，因此在出現故障時，效能表現優於zookeeper，但是可能會造成資料不一致的情況。

zookeeper 基本原理

一。zookeeper簡介 zookeeper 是apache旗下的hadoop子專案，它一個開源的，分散式的服務協調器。同樣通過zookeeper可以實現服務間的同步與配置維護。通常情況下，在分散式應用開發中，協調服務這樣的工作不是件容易

Zookeeper學習（2）：基本原理

一、ZooKeeper 資料模型 ZooKeeper 的資料模型是層次模型(Google Chubby 也是這麼做的)。層次模型常見於檔案系統。層次模型和 key-value 模型是兩種主流的資料模型。ZooKeeper 使用檔案系統模型主要基於以下兩

Spark Shuffle的基本原理分析

這篇主要根據官網對Shuffle的介紹做了梳理和分析，並參考下面資料中的部分內容加以理解，對英文官網上的每一句話應該細細體味，目前的能力還有欠缺，以後慢慢補。

服務發現的基本原理以及如何實現？

一、什麼是服務發現？服務發現並沒有怎樣的高深莫測，它的原理再簡單不過。只是市面上太多文章將服務發現的難度妖魔化，讀者被繞的雲裡霧裡，頓覺自己智商低下不敢高攀。

JAVA基於靜態陣列實現棧的基本原理與用法詳解

本文例項講述了JAVA基於靜態陣列實現棧。分享給大家供大家參考，具體如下：

Java連結串列（Linked List）基本原理與實現方法入門示例

本文例項講述了Java連結串列（Linked List）基本原理與實現方法。分享給大家供大家參考，具體如下：

Spring AOP註解案例及基本原理詳解

切面：Aspect 切面=切入點+通知。在老的spring版本中通常用xml配置，現在通常是一個類帶上@Aspect註解。切面負責將橫切邏輯（通知）編織到指定的連線點中。

Kerberos基本原理、安裝部署及用法

1. 概述　　Kerberos是一種認證機制。　　目的是，通過金鑰系統為客戶端/伺服器應用程式提供強大的認證系統：保護伺服器防止錯誤的使用者使用，同時保護它的使用者使用正確的伺服器，即支援雙向驗證；Kerberos協議

理解babel的基本原理和使用方法

　　babel是一個編譯器，用於將ECMA2015+程式碼轉換為向後相容的javascript語法，其原因在於目前瀏覽器並不能及時的相容js的新語法，而開發過程中我們往往會選擇es6、jsx、typescript進行開發，而瀏覽器並不能識別並

BGP協議基本原理

一、自治區系 AS 　　自治系統（Autonomous System，AS），指的是在同一個組織管理下、使用相同策略的裝置的集合。

Activiti7的基本原理和使用

什麼是工作流？工作流介紹工作流（Workflow），就是通過計算機對業務流程自動化執行管理。它主要解決的是“使在多個參與者之間按照某種預定義的規則自動進行傳遞文件、資訊或任務的過程，從而實現某個預期的業務目

Git科普文，Git基本原理&各種騷操作

Git簡單介紹 Git是一個分散式版本控制軟體，最初由Linus Torvalds創作，於2005年以GPL釋出。最初目的是為更好地管理Linux核心開發而設計。

Git科普文,Git基本原理及各種騷操作(推薦)

Git簡單介紹 Git是一個分散式版本控制軟體，最初由Linus Torvalds創作，於2005年以GPL釋出。最初目的是為更好地管理Linux核心開發而設計。

作業系統基本原理筆記

作業系統基本原理程序管理程序的狀態執行：所有資源已經準備，並且CPU資源也準備好。

（stm32學習總結）—spi基本原理

SPI的基本介紹 SPI的簡介 SPI，是英語Serial Peripheral interface的縮寫，顧名思義就是序列外圍裝置介面，是Motorola首先在其MC68HCXX系列處理器上定義的。

Python爬蟲的基本原理

我們可以把網際網路比作一張大網，而爬蟲（即網路爬蟲）便是在網上爬行的蜘蛛。把網的節點比作一個個網頁，爬蟲爬到這就相當於訪問了該頁面，獲取了其資訊。可以把節點間的連線比作網頁與網頁之間的連結關係，這樣蜘

分治演算法基本原理和實踐

一、基本概念在電腦科學中，分治法是一種很重要的演算法。字面上的解釋是“分而治之”，就是把一個複雜的問題分成兩個或更多的相同或相似的子問題，再把子問題分成更小的子問題……直到最後子

【趣味設計模式系列】之【代理模式1--基本原理、實戰及框架應用】

1. 簡介代理模式（Proxy Pattern）：為其他物件提供一種代理以控制對這個物件的訪問。簡而言之，既能使被代理物件無入侵，又能附加代理自己的操作，使方法增強功能。

滑動視窗演算法基本原理與實踐

學過計算機網路的同學，都知道滑動視窗協議（Sliding Window Protocol），該協議是TCP協議的一種應用，用於網路資料傳輸時的流量控制，以避免擁塞的發生。該協議允許傳送方在停止並等待確認前傳送多個數據分組。由於

RPC基本原理

RPC基本原理 RPC簡介定義遠端過程呼叫（英語：Remote Procedure Call，縮寫為 RPC，也叫遠端程式呼叫）是一個計算機通訊協議。該協議允許運行於一臺計算機的程式呼叫另一臺計算機的子程式，而程式設計師無需額外

zookeeper 基本原理

一。zookeeper簡介

zookeeper選舉機制

1. 與選舉相關的概念

伺服器 ID

選舉狀態

資料 ID

邏輯時鐘

2. 全新叢集選舉

3. 非全新叢集選舉（大約耗時200毫秒）

4. 原子廣播

5. 疑惑

6. Zookeeper怎麼實現它的特性的（淺顯的理解）

zookeeper與eureka淺談

相關推薦