1. 程式人生 > >5分鐘讓你瞭解 ZooKeeper 的功能和原理

5分鐘讓你瞭解 ZooKeeper 的功能和原理

目錄 
  一 .Zookeeper功能簡介 
  二 . ZooKeeper基本概念 
    2.1  叢集角色 
    2.2 叢集節點分工 
    2.3  session 
    2.4 資料節點 
    2.5 狀態資訊 
    2.6 事物操作 
    2.7  Watcher(事件監聽器) 
  三 .zookeeper應用的典型場景 
    3.1 資料釋出與訂閱(配置中心) 
    3.2 命名服務 
    3.3 分散式協調服務/通知 
    3.4 Master選舉 
    3.5 分散式鎖 
  四 .總結

一 .Zookeeper功能簡介

    ZooKeeper 是一個開源的分散式協調服務,由雅虎建立,是 Google Chubby 的開源實現。
分散式應用程式可以基於 ZooKeeper 實現諸如資料釋出/訂閱、負載均衡、命名服務、分散式協
調/通知、叢集管理、Master 選舉、配置維護,名字服務、分散式同步、分散式鎖和分散式佇列
等功能。
1
2
3
4
二 . ZooKeeper基本概念

本節將介紹 ZooKeeper 的幾個核心概念 
因此有必要預先了解這些概念。

叢集角色


一個 ZooKeeper 叢集同一時刻只會有一個 Leader,其他都是 Follower 或 Observer。

ZooKeeper 配置很簡單,每個節點的配置檔案(zoo.cfg)都是一樣的,只有 myid 檔案不一樣。myid 的值必須是 zoo.cfg中server.{數值} 的{數值}部分。

zoo.cfg配置檔案示例 


     在裝有 ZooKeeper 的機器的終端執行 zookeeper-server status 可以看當前節點的 
  ZooKeeper是什麼角色(Leader or Follower)。
1
2
ZooKeeper 預設只有 Leader 和 Follower 兩種角色,沒有 Observer 角色。為了使用 Observer 模式,在任何想變成Observer的節點的配置檔案中加入:peerType=observer 並在所有 server 的配置檔案中,配置成 observer 模式的 server 的那行配置追加 :observer

2 . 節點讀寫服務分工

   1.ZooKeeper 叢集的所有機器通過一個 Leader 選舉過程來選定一臺被稱為『Leader』
   的機器,Leader伺服器為客戶端提供讀和寫服務。

   2.Follower 和 Observer 都能提供讀服務,不能提供寫服務。兩者唯一的區別在於,
   Observer機器不參與 Leader 選舉過程,也不參與寫操作的『過半寫成功』策略,因
   此 Observer 可以在不影響寫效能的情況下提升叢集的讀效能。
1
2
3
4
5
6
3 . Session

      Session 是指客戶端會話,在講解客戶端會話之前,我們先來了解下客戶端連線。在
  ZooKeeper 中,一個客戶端連線是指客戶端和 ZooKeeper 伺服器之間的TCP長連線。

       ZooKeeper 對外的服務埠預設是2181,客戶端啟動時,首先會與伺服器建立一個TCP
  連線,從第一次連線建立開始,客戶端會話的生命週期也開始了,通過這個連線,客戶端能夠通
  過心跳檢測和伺服器保持有效的會話,也能夠向 ZooKeeper 伺服器傳送請求並接受響應,同
  時還能通過該連線接收來自伺服器的 Watch 事件通知。

      Session 的 SessionTimeout 值用來設定一個客戶端會話的超時時間。當由於伺服器
  壓力太大、網路故障或是客戶端主動斷開連線等各種原因導致客戶端連線斷開時,只要在 
  SessionTimeout 規定的時間內能夠重新連線上叢集中任意一臺伺服器,那麼之前建立的會話
  仍然有效。
1
2
3
4
5
6
7
8
9
10
11
12
4 . 資料節點

    zookeeper的結構其實就是一個樹形結構,leader就相當於其中的根結點,其它節點就相當於
 follow節點,每個節點都保留自己的內容。

     zookeeper的節點分兩類:持久節點和臨時節點
     - 持久節點:
             所謂持久節點是指一旦這個 樹形結構上被建立了,除非主動進行對樹節點的移除操
        作,否則這個 節點將一直儲存在 ZooKeeper 上。

     - 臨時節點:
             臨時節點的生命週期跟客戶端會話繫結,一旦客戶端會話失效,那麼這個客戶端創
        建的所有臨時節點都會被移除。
1
2
3
4
5
6
7
8
9
10
11
5 . 狀態資訊

    每個 節點除了儲存資料內容之外,還儲存了 節點本身的一些狀態資訊。用 get 命令可以
同時獲得某個 節點的內容和狀態資訊
    在 ZooKeeper 中,version 屬性是用來實現樂觀鎖機制中的『寫入校驗』的(保證分佈
式資料原子性操作)。
1
2
3
4
6 .事物操作

    在ZooKeeper中,能改變ZooKeeper伺服器狀態的操作稱為事務操作。一般包括資料節點
建立與刪除、資料內容更新和客戶端會話建立與失效等操作。對應每一個事務請求,ZooKeeper
都會為其分配一個全域性唯一的事務ID,用 ZXID 表示,通常是一個64位的數字。每一個 ZXID
對應一次更新操作,從這些 ZXID 中可以間接地識別出 ZooKeeper 處理這些事務操作請求的
全域性順序。
1
2
3
4
5
7 .Watcher(事件監聽器)

    是 ZooKeeper 中一個很重要的特性。ZooKeeper允許使用者在指定節點上註冊一些 Watcher,
並且在一些特定事件觸發的時候,ZooKeeper 服務端會將事件通知到感興趣的客戶端上去。該
機制是 ZooKeeper 實現分散式協調服務的重要特性。
1
2
3
三 .ZooKeeper應用的典型場景

    ZooKeeper 是一個高可用的分散式資料管理與協調框架。基於對ZAB演算法的實現,該框架
能夠很好地保證分散式環境中資料的一致性。也是基於這樣的特性,使得 ZooKeeper 成為了
解決分散式一致性問題的利器。
1
2
3
1 . 資料釋出與訂閱(配置中心)

  資料釋出與訂閱,即所謂的配置中心,顧名思義就是釋出者將資料釋出到 ZooKeeper 節點上,
供訂閱者進行資料訂閱,進而達到動態獲取資料的目的,實現配置資訊的集中式管理和動態更新。

    對於:資料量通常比較小。資料內容在執行時動態變化。叢集中各機器共享,配置一致。
這樣的全域性配置資訊就可以釋出到 ZooKeeper上,讓客戶端(叢集的機器)去訂閱該訊息。

釋出/訂閱系統一般有兩種設計模式,分別是推(Push)和拉(Pull)模式。
      - 推模式
          服務端主動將資料更新發送給所有訂閱的客戶端
      - 拉模式
          客戶端主動發起請求來獲取最新資料,通常客戶端都採用定時輪詢拉取的方式

ZooKeeper 採用的是推拉相結合的方式:
    客戶端想服務端註冊自己需要關注的節點,一旦該節點的資料發生變更,那麼服務端就會向相應
的客戶端傳送Watcher事件通知,客戶端接收到這個訊息通知後,需要主動到服務端獲取最新的資料
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2 . 命名服務

    命名服務也是分散式系統中比較常見的一類場景。在分散式系統中,通過使用命名服務,客戶端
應用能夠根據指定名字來獲取資源或服務的地址,提供者等資訊。被命名的實體通常可以是叢集中的
機器,提供的服務,遠端物件等等——這些我們都可以統稱他們為名字。

其中較為常見的就是一些分散式服務框架(如RPC)中的服務地址列表。通過在ZooKeepr裡
建立順序節點,能夠很容易建立一個全域性唯一的路徑,這個路徑就可以作為一個名字。

ZooKeeper 的命名服務即生成全域性唯一的ID。      
1
2
3
4
5
6
7
8
3 . 分散式協調服務/通知

    ZooKeeper 中特有 Watcher 註冊與非同步通知機制,能夠很好的實現分散式環境下不同機器,
甚至不同系統之間的通知與協調,從而實現對資料變更的實時處理。使用方法通常是不同的客戶端
如果 機器節點 發生了變化,那麼所有訂閱的客戶端都能夠接收到相應的Watcher通知,並做出相應
的處理。

ZooKeeper的分散式協調/通知,是一種通用的分散式系統機器間的通訊方式。
1
2
3
4
5
6
4 . Master選舉

Master 選舉可以說是 ZooKeeper 最典型的應用場景了。比如 HDFS 中 Active NameNode 的選舉、YARN 中 Active ResourceManager 的選舉和 HBase 中 Active HMaster 的選舉等。

    針對 Master 選舉的需求,通常情況下,我們可以選擇常見的關係型資料庫中的主鍵特性來
實現:希望成為 Master 的機器都向資料庫中插入一條相同主鍵ID的記錄,資料庫會幫我們進行
主鍵衝突檢查,也就是說,只有一臺機器能插入成功——那麼,我們就認為向資料庫中成功插入資料
的客戶端機器成為Master。

    依靠關係型資料庫的主鍵特性確實能夠很好地保證在叢集中選舉出唯一的一個Master。

    但是,如果當前選舉出的 Master 掛了,那麼該如何處理?誰來告訴我 Master 掛了呢?
顯然,關係型資料庫無法通知我們這個事件。但是,ZooKeeper 可以做到!

    利用 ZooKeepr 的強一致性,能夠很好地保證在分散式高併發情況下節點的建立一定能夠
保證全域性唯一性,即 ZooKeeper 將會保證客戶端無法建立一個已經存在的 資料單元節點。
    也就是說,如果同時有多個客戶端請求建立同一個臨時節點,那麼最終一定只有一個客戶端
請求能夠建立成功。利用這個特性,就能很容易地在分散式環境中進行 Master 選舉了。

    成功建立該節點的客戶端所在的機器就成為了 Master。同時,其他沒有成功建立該節點的
客戶端,都會在該節點上註冊一個子節點變更的 Watcher,用於監控當前 Master 機器是否存
活,一旦發現當前的Master掛了,那麼其他客戶端將會重新進行 Master 選舉。

    這樣就實現了 Master 的動態選舉。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
5 . 分散式鎖

分散式鎖是控制分散式系統之間同步訪問共享資源的一種方式 
分散式鎖又分為排他鎖和共享鎖兩種

排它鎖 
ZooKeeper如何實現排它鎖?

定義鎖 
ZooKeeper 上的一個 機器節點 可以表示一個鎖
獲得鎖 
把ZooKeeper上的一個節點看作是一個鎖,獲得鎖就通過建立臨時節點的方式來實現。 
ZooKeeper 會保證在所有客戶端中,最終只有一個客戶端能夠建立成功,那麼就可以 
認為該客戶端獲得了鎖。同時,所有沒有獲取到鎖的客戶端就需要到/exclusive_lock 
節點上註冊一個子節點變更的Watcher監聽,以便實時監聽到lock節點的變更情況。
釋放鎖 
因為鎖是一個臨時節點,釋放鎖有兩種方式

當前獲得鎖的客戶端機器發生宕機或重啟,那麼該臨時節點就會被刪除,釋放鎖
正常執行完業務邏輯後,客戶端就會主動將自己建立的臨時節點刪除,釋放鎖。
無論在什麼情況下移除了lock節點,ZooKeeper 都會通知所有在 /exclusive_lock 節點上註冊了節點變更 Watcher 監聽的客戶端。這些客戶端在接收到通知後,再次重新發起分散式鎖獲取,即重複『獲取鎖』過程。

共享鎖

共享鎖在同一個程序中很容易實現,但是在跨程序或者在不同 Server 之間就不好實現了。Zookeeper 卻很容易實現這個功能,實現方式也是需要獲得鎖的 Server 建立一個 EPHEMERAL_SEQUENTIAL 目錄節點,然後呼叫 getChildren方法獲取當前的目錄節點列表中最小的目錄節點是不是就是自己建立的目錄節點,如果正是自己建立的,那麼它就獲得了這個鎖,如果不是那麼它就呼叫 exists(String path, boolean watch) 方法並監控 Zookeeper 上目錄節點列表的變化,一直到自己建立的節點是列表中最小編號的目錄節點,從而獲得鎖,釋放鎖很簡單,只要刪除前面它自己所建立的目錄節點就行了。

總結

    本文介紹的 Zookeeper 的基本知識,以及介紹了幾個典型的應用場景。這些都是 Zookeeper
 的基本功能,最重要的是 Zoopkeeper 提供了一套很好的分散式叢集管理的機制,就是它這種基於
 層次型的目錄樹的資料結構,並對樹中的節點進行有效管理,從而可以設計出多種多樣的分散式的數
 據管理模型,而不僅僅侷限於上面提到的幾個常用應用場景
--------------------- 
作者:WeiJiFeng_ 
來源:CSDN 
原文:https://blog.csdn.net/weijifeng_/article/details/79775738 
版權宣告:本文為博主原創文章,轉載請附上博文連結!

轉載:https://blog.csdn.net/weijifeng_/article/details/79775738#3.5