kafka的副本機制

阿新 • • 發佈：2018-12-09

partition的副本被稱為replica，每個分割槽可以有多個副本，並且在副本集中會存在一個leader副本，所有的讀寫請求都會通過leader完成，follower複製只負責備份資料。

副本會均勻分配到多臺broker上，當leader節點掛掉之後，會從副本集中重新選出一個副本作為leader繼續提供服務

副本分配演算法：

n個broker 將第i個partition的第j個副本分配到第（（i+j）mod n）個broker上

kafka副本機制中的概念：

leader副本：響應客戶端的讀寫請求
follow副本：備份leader的資料，不進行讀寫操作
ISR副本：leader副本和所有能夠與leader副本保持基本同步的follow副本，如果follow副本和leader副本資料同步速度過慢，該follow將會被T出ISR副本

ISR集合中的副本必須滿足的條件：

副本所在的節點與zk相連
副本的最後一條訊息和leader副本的最後一條訊息的差值不能超過閾值replica.lag.time.max.ms:如果該follower在此時間間隔之內沒有追上leader,則該follower將會被T出ISR

副本同步時的兩個重要概念

LEO（Last end offset）記錄了該副本底層日誌中的下一條訊息的offset，例如LEO為10，那麼當前的offset為9
HW （High water）標記著可消費的訊息，對於同一個副本而言HW不會大於LEO，小於等於HW的訊息將會被認為是已備份的。

副本協同機制

producer將訊息傳送到該partition的leader上，leader會把訊息寫入其本地log，每個follower都從leader pull資料。在follower收到訊息並且將訊息寫入本地log之後會向leader傳送ack，一旦leader收到了ISR中所有replica的ACK，該訊息就被認為已經commit了，leader會增加HW並向producer傳送ACK

過程如下所示這裡寫圖片描述

follower傳送fetch請求，並帶上自己的LEO leader端的操作 1.當producer傳送一個訊息給leader之後，leader會把訊息寫入磁碟 2.然後leader會更新LEO，這時候嘗試更新HW，HW是取LEO和remoteLEO的較小值，這時候HW依然為0.（remoteLEO取所有Follower發過來的offset中最小的一個） 3.把訊息內容和當前的HW值傳送給follower副本

當收到響應之後，follower端的操作 1.將訊息寫入本地log，同時更新LEO 2.比較本地LEO和返回的HW,比較他們取小值賦值給HW

第二次傳送fetch請求之後這裡寫圖片描述

leader 1.更新remoteLEO=1 2.更新HW為1 3.把資料和當前HW返回給follower，如果這時候沒有資料，則返回空

follower收到response之後 1.如果有資料則寫入本地日誌，並且更新LEO 2.更新HW的值到目前為止，consumer就可以消費offset=0的訊息了

kafka的副本機制

副本分配演算法：

kafka副本機制中的概念：

ISR集合中的副本必須滿足的條件：

副本同步時的兩個重要概念

副本協同機制

kafka副本機制之數據可靠性

深入理解 Kafka 副本機制

Kafka 系列（五）—— 深入理解 Kafka 副本機制

kafka 副本機制和容錯處理 -2

Kafka副本同步機制

kafka的副本機制

kafka的工作原理分析（三） -- 高可用副本機制

Kafka 入門（二）--資料日誌、副本機制和消費策略

kafka備份機制——zk選舉leader，leader在broker裏負責備份

副本機制與副本同步------《Designing Data-Intensive Applications》讀書筆記6

實戰Kafka ACL機制

kafka rebalance 機制與Consumer多種消費模式案例應用實戰-kafka 商業環境實戰

Kafka分割槽機制介紹與示例

Hyperledger fabric基於kafka共識機制單機搭建

6年資深開發帶你10分鐘瞭解Kafka ACL機制

kafka儲存機制

kafka rebalance機制

三.kafka 備份機制

菜鳥學習Fabric原始碼學習 — kafka共識機制

Redis高可用——副本機制

kafka的副本機制

副本分配演算法：

kafka副本機制中的概念：

ISR集合中的副本必須滿足的條件：

副本同步時的兩個重要概念

副本協同機制

相關推薦