1. 程式人生 > >Zookeeper基礎概念和原理

Zookeeper基礎概念和原理

釋放 不同 apach 單機 單位 允許 執行 三種 這樣的

1、zookeeper概念介紹

  在介紹ZooKeeper之前,先來介紹一下分布式協調技術,所謂分布式協調技術主要是用來解決分布式環境當中多個進程之間的同步控制,讓他們有序的去訪問某種共享資源,防止造成資源競爭(腦裂)的後果。

  這裏首先介紹下什麽是分布式系統,所謂分布式系統就是在不同地域分布的多個服務器,共同組成的一個應用系統來為用戶提供服務,在分布式系統中最重要的是進程的調度,這裏假設有一個分布在三個地域的服務器組成的一個應用系統,在第一臺機器上掛載了一個資源,然後這三個地域分布的應用進程都要競爭這個資源,但我們又不希望多個進程同時進行訪問,這個時候就需要一個協調器,來讓它們有序的來訪問這個資源。這個協調器就是分布式系統中經常提到的那個“鎖”,例如”進程1“在使用該資源的時候,會先去獲得這把鎖,”進程1“獲得鎖以後會對該資源保持獨占,此時其它進程就無法訪問該資源,“進程1”;在用完該資源以後會將該鎖釋放掉,以便讓其它進程來獲得鎖。由此可見,通過這個“鎖”機制,就可以保證分布式系統中多個進程能夠有序的訪問該共享資源。這裏把這個分布式環境下的這個“鎖”叫作分布式鎖。這個分布式鎖就是分布式協調技術實現的核心內容。

  目前,在分布式協調技術方面做得比較好的有Google的Chubby,還有Apache的ZooKeeper,它們都是分布式鎖的實現者。ZooKeeper所提供鎖服務在分布式領域久經考驗,它的可靠性、可用性都是經過理論和實踐驗證的。

  ZooKeeper是一種為分布式應用所設計的高可用、高性能的開源協調服務,它提供了一項基本服務:分布式鎖服務,同時,也提供了數據的維護和管理機制,如:統一命名服務、狀態同步服務、集群管理、分布式消息隊列、分布式應用配置項的管理等等。

2、zookeeper應用舉例

1)什麽是單點故障問題呢?

  所謂單點故障,就是在一個主從的分布式系統中,主節點負責任務調度分發,從節點負責任務的處理,而當主節點發生故障時,整個應用系統也就癱瘓了,那麽這種故障就稱為單點故障。那我們的解決方法就是通過對集群master角色的選取,來解決分布式系統單點故障的問題。

2)傳統的方式是怎麽解決單點故障的?以及有哪些缺點呢?

  傳統的方式是采用一個備用節點,這個備用節點定期向主節點發送ping包,主節點收到ping包以後向備用節點發送回復Ack信息,當備用節點收到回復的時候就會認為當前主節點運行正常,讓它繼續提供服務。而當主節點故障時,備用節點就無法收到回復信息了,此時,備用節點就認為主節點宕機,然後接替它成為新的主節點繼續提供服務。

  這種傳統解決單點故障的方法,雖然在一定程度上解決了問題,但是有一個隱患,就是網絡問題,可能會存在這樣一種情況:主節點並沒有出現故障,只是在回復ack響應的時候網絡發生了故障,這樣備用節點就無法收到回復,那麽它就會認為主節點出現了故障,接著,備用節點將接管主節點的服務,並成為新的主節點,此時,分布式系統中就出現了兩個主節點(雙Master節點)的情況,雙Master節點的出現,會導致分布式系統的服務發生混亂。這樣的話,整個分布式系統將變得不可用。為了防止出現這種情況,就需要引入ZooKeeper來解決這種問題。

3)zookeeper的工作原理是什麽?

  下面通過三種情形來講解:

  (1)master啟動

  在分布式系統中引入Zookeeper以後,就可以配置多個主節點,這裏以配置兩個主節點為例,假定它們是 主節點A 和 主節點B,當兩個主節點都啟動後,它們都會向ZooKeeper中註冊節點信息。我們假設 主節點A 鎖註冊的節點信息是 master00001 , 主節點B 註冊的節點信息是 master00002 ,註冊完以後會進行選舉,選舉有多種算法,這裏以編號最小作為選舉算法,那麽編號最小的節點將在選舉中獲勝並獲得鎖成為主節點,也就是 主節點A 將會獲得鎖成為主節點,然後 主節點B 將被阻塞成為一個備用節點。這樣,通過這種方式Zookeeper就完成了對兩個Master進程的調度。完成了主、備節點的分配和協作。

  (2)master故障

  如果 主節點A 發生了故障,這時候它在ZooKeeper所註冊的節點信息會被自動刪除,而ZooKeeper會自動感知節點的變化,發現 主節點A 故障後,會再次發出選舉,這時候 主節點B 將在選舉中獲勝,替代 主節點A 成為新的主節點,這樣就完成了主、被節點的重新選舉。

  (3)master恢復

  如果主節點恢復了,它會再次向ZooKeeper註冊自身的節點信息,只不過這時候它註冊的節點信息將會變成 master00003 ,而不是原來的信息。ZooKeeper會感知節點的變化再次發動選舉,這時候 主節點B 在選舉中會再次獲勝繼續擔任 主節點 , 主節點A 會擔任備用節點。

  zookeeper就是通過這樣的協調、調度機制如此反復的對集群進行管理和狀態同步的。

4)zookeeper集群架構

  zookeeper一般是通過集群架構來提供服務的,下圖是zookeeper的基本架構圖。

  技術分享圖片

  zookeeper集群主要角色有server和client,其中server又分為leader、follower和observer三個三絕,每個角色的含義如下:

Leader:領導者角色,主要負責投票的發起和決議,以及更新系統狀態。
follower:跟隨著角色,用於接收客戶端的請求並返回結果給客戶端,在選舉過程中參與投票。
observer:觀察者角色,用戶接收客戶端的請求,並將寫請求轉發給leader,同時同步leader狀態,但是不參與投票。Observer目的是擴展系統,提高伸縮性。
client:客戶端角色,用於向zookeeper發起請求。

  Zookeeper集群中每個Server在內存中存儲了一份數據,在Zookeeper啟動時,將從實例中選舉一個Server作為leader,Leader負責處理數據更新等操作,當且僅當大多數Server在內存中成功修改數據,才認為數據修改成功。

  Zookeeper寫的流程為:客戶端Client首先和一個Server或者Observe通信,發起寫請求,然後Server將寫請求轉發給Leader,Leader再將寫請求轉發給其它Server,其它Server在接收到寫請求後寫入數據並響應Leader,Leader在接收到大多數寫成功回應後,認為數據寫成功,最後響應Client,完成一次寫操作過程。

3、Kafka基礎與入門

1)kafka基本概念

  Kafka是一種高吞吐量的分布式發布/訂閱消息系統,這是官方對kafka的定義,這樣說起來,可能不太好理解,這裏簡單舉個例子:現在是個大數據時代,各種商業、社交、搜索、瀏覽都會產生大量的數據。那麽如何快速收集這些數據,如何實時的分析這些數據,是一個必須要解決的問題,同時,這也形成了一個業務需求模型,即生產者生產(produce)各種數據,消費者(consume)消費(分析、處理)這些數據。那麽面對這些需求,如何高效、穩定的完成數據的生產和消費呢?這就需要在生產者與消費者之間,建立一個通信的橋梁,這個橋梁就是消息系統。從微觀層面來說,這種業務需求也可理解為不同的系統之間如何傳遞消息。

  kafka是Apache組織下的一個開源系統,它的最大的特性就是可以實時的處理大量數據以滿足各種需求場景:比如基於hadoop平臺的數據分析、低時延的實時系統、storm/spark流式處理引擎等。kafka現在它已被多家大型公司作為多種類型的數據管道和消息系統使用。

2)kafka角色術語

  kafka的一些核心概念和角色

Broker:Kafka集群包含一個或多個服務器,每個服務器被稱為broker。
Topic:每條發布到Kafka集群的消息都有一個分類,這個類別被稱為Topic(主題)。
Producer:指消息的生產者,負責發布消息到kafka broker。
Consumer:指消息的消費者,從kafka broker拉取數據,並消費這些已發布的消息。
Partition:Partition是物理上的概念,每個Topic包含一個或多個Partition,每個partition都是一個有序的隊列。partition中的每條消息都會被分配一個有序的id(offset)。
Consumer Group:消費者組,可以給每個Consumer指定消費組,若不指定消費者組,則屬於默認的group。
Message:消息,通信的基本單位,每個producer可以向一個topic發布一些消息。

3)kafka拓撲架構

  一個典型的Kafka集群包含若幹Producer,若幹broker、若幹Consumer Group,以及一個Zookeeper集群。Kafka通過Zookeeper管理集群配置,選舉leader,以及在Consumer Group發生變化時進行rebalance。Producer使用push模式將消息發布到broker,Consumer使用pull模式從broker訂閱並消費消息。典型架構如下圖所示:

技術分享圖片

  從圖中可以看出,典型的消息系統有生產者(Producer),存儲系統(broker)和消費者(Consumer)組成,Kafka作為分布式的消息系統支持多個生產者和多個消費者,生產者可以將消息分布到集群中不同節點的不同Partition上,消費者也可以消費集群中多個節點上的多個Partition。在寫消息時允許多個生產者寫到同一個Partition中,但是讀消息時一個Partition只允許被一個消費組中的一個消費者所消費,而一個消費者可以消費多個Partition。也就是說同一個消費組下消費者對Partition是互斥的,而不同消費組之間是共享的

  kafka支持消息持久化存儲,持久化數據保存在kafka的日誌文件中,在生產者生產消息後,kafka不會直接把消息傳遞給消費者,而是先要在broker中進行存儲,為了減少磁盤寫入的次數,broker會將消息暫時緩存起來,當消息的個數或尺寸、大小達到一定閥值時,再統一寫到磁盤上,這樣不但提高了kafka的執行效率,也減少了磁盤IO調用次數。

  kafka中每條消息寫到partition中,是順序寫入磁盤的,這個很重要,因為在機械盤中如果是隨機寫入的話,效率將是很低的,但是如果是順序寫入,那麽效率卻是非常高,這種順序寫入磁盤機制是kafka高吞吐率的一個很重要的保證。

4)Topic和partition  

  Kafka中的topic是以partition的形式存放的,每一個topic都可以設置它的partition數量,Partition的數量決定了組成topic的log的數量。推薦partition的數量一定要大於同時運行的consumer的數量。另外,建議partition的數量要小於等於集群broker的數量,這樣消息數據就可以均勻的分布在各個broker中

  那麽,Topic為什麽要設置多個Partition呢,這是因為kafka是基於文件存儲的,通過配置多個partition可以將消息內容分散存儲到多個broker上,這樣可以避免文件尺寸達到單機磁盤的上限。同時,將一個topic切分成任意多個partitions,可以保證消息存儲、消息消費的效率,因為越多的partitions可以容納更多的consumer,可有效提升Kafka的吞吐率。因此,將Topic切分成多個partitions的好處是可以將大量的消息分成多批數據同時寫到不同節點上,將寫請求分擔負載到各個集群節點。

  在存儲結構上,每個partition在物理上對應一個文件夾,該文件夾下存儲這個partition的所有消息和索引文件。partiton命名規則為topic名稱+序號,第一個partiton序號從0開始,序號最大值為partitions數量減1。

  在每個partition(文件夾)中有多個大小相等的segment(段)數據文件,每個segment的大小是相同的,但是每條消息的大小可能不相同,因此segment<br/>數據文件中消息數量不一定相等。segment數據文件有兩個部分組成,分別為index file和data file,此兩個文件是一一對應,成對出現,後綴&quot;.index&quot;和“.log”分別表示為segment索引文件和數據文件。

5)Producer生產機制

  Producer是消息和數據的生產者,它發送消息到broker時,會根據Paritition機制選擇將其存儲到哪一個Partition。如果Partition機制設置的合理,所有消息都可以均勻分布到不同的Partition裏,這樣就實現了數據的負載均衡。如果一個Topic對應一個文件,那這個文件所在的機器I/O將會成為這個Topic的性能瓶頸,而有了Partition後,不同的消息可以並行寫入不同broker的不同Partition裏,極大的提高了吞吐率。

6)Consumer消費機制

  Kafka發布消息通常有兩種模式:隊列模式(queuing)和發布/訂閱模式(publish-subscribe)。在隊列模式下,只有一個消費組,而這個消費組有多個消費者,一條消息只能被這個消費組中的一個消費者所消費;而在發布/訂閱模式下,可有多個消費組,每個消費組只有一個消費者,同一條消息可被多個消費組消費。  

Kafka中的Producer和consumer采用的是push、pull的模式,即producer向 broker進行push消息,comsumer從bork進行pull消息,push和pull對於消息的生產和消費是異步進行的。pull模式的一個好處是consumer可自主控制消費消息的速率,同時consumer還可以自己控制消費消息的方式是批量的從broker拉取數據還是逐條消費數據。

Zookeeper基礎概念和原理