kafka訊息分發策略分析

阿新 • • 發佈：2019-09-06

當我們使用kafka向指定Topic傳送訊息時，如果該Topic具有多個partition，無論消費者有多少，最終都會保證一個partition內的訊息只會被一個Consumer group中的一個Consumer消費，也就是說同一Consumer group中的多個Consumer自動會起到負載均衡的效果。

1、訊息構造

下面我們就針對呼叫kafka API傳送訊息到Topic時partition的分配策略，分析下其內部具體的原始碼碼實現。

首先看下kafka API中訊息體ProducerRecord類的建構函式，可以看到構造訊息時可指定該訊息要傳送的Topic、partition、key、value等關鍵資訊。

    /**
     * Creates a record to be sent to a specified topic and partition
     *
     * @param topic The topic the record will be appended to
     * @param partition The partition to which the record should be sent
     * @param key The key that will be included in the record
     * @param value The record contents
     * @param headers The headers that will be included in the record
     */
    public ProducerRecord(String topic, Integer partition, K key, V value, Iterable<Header> headers) {
        this(topic, partition, null, key, value, headers);
    }
    
    /**
     * Creates a record to be sent to a specified topic and partition
     *
     * @param topic The topic the record will be appended to
     * @param partition The partition to which the record should be sent
     * @param key The key that will be included in the record
     * @param value The record contents
     */
    public ProducerRecord(String topic, Integer partition, K key, V value) {
        this(topic, partition, null, key, value, null);
    }
    
    /**
     * Create a record to be sent to Kafka
     * 
     * @param topic The topic the record will be appended to
     * @param key The key that will be included in the record
     * @param value The record contents
     */
    public ProducerRecord(String topic, K key, V value) {
        this(topic, null, null, key, value, null);
    }

2、分發策略

在實際使用中，我們一般不會指定訊息傳送的具體partition，最多隻會傳入key值，類似下面這種方式：

producer.send(new ProducerRecord<Object, Object>(topic, key, data));

而kafka也會根據你傳入key的hash值，通過取餘的方法，儘可能保證訊息能夠相對均勻的分攤到每個可用的partition上；

下面是kafka內部預設的分發策略：

public class DefaultPartitioner implements Partitioner {

    private final ConcurrentMap<String, AtomicInteger> topicCounterMap = new ConcurrentHashMap<>();

    public void configure(Map<String, ?> configs) {}

    /**
     * Compute the partition for the given record.
     *
     * @param topic The topic name
     * @param key The key to partition on (or null if no key)
     * @param keyBytes serialized key to partition on (or null if no key)
     * @param value The value to partition on or null
     * @param valueBytes serialized value to partition on or null
     * @param cluster The current cluster metadata
     */
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        //獲取該topic的分割槽列表
        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        //如果key值為null
        if (keyBytes == null) {
            //維護一個key為topic的ConcurrentHashMap，並通過CAS操作的方式對value值執行遞增+1操作
            int nextValue = nextValue(topic);
            //獲取該topic的可用分割槽列表
            List<PartitionInfo> availablePartitions = cluster.availablePartitionsForTopic(topic);
            if (availablePartitions.size() > 0) {//如果可用分割槽大於0
                //執行求餘操作，保證訊息落在可用分割槽上
                int part = Utils.toPositive(nextValue) % availablePartitions.size();
                return availablePartitions.get(part).partition();
            } else {
                // 沒有可用分割槽的話，就給出一個不可用分割槽
                return Utils.toPositive(nextValue) % numPartitions;
            }
        } else {
            // 通過計算key的hash，確定訊息分割槽
            return Utils.toPositive(Utils.murmur2(keyBytes)) % numPartitions;
        }
    }

    private int nextValue(String topic) {
        //獲取一個AtomicInteger物件
        AtomicInteger counter = topicCounterMap.get(topic);
        if (null == counter) {//如果為空
            //生成一個隨機數
            counter = new AtomicInteger(ThreadLocalRandom.current().nextInt());
            //維護到topicCounterMap中
            AtomicInteger currentCounter = topicCounterMap.putIfAbsent(topic, counter);
            if (currentCounter != null) {
                counter = currentCounter;
            }
        }
        //返回值並執行遞增
        return counter.getAndIncrement();
    }

    public void close() {}

}

3、自定義負載策略

我們也可以通過實現Partitioner介面，自定義分發策略，看下具體實現

自定義實現Partitioner介面

/**
 * 自定義實現Partitioner介面
 *
 */
public class KeyPartitioner implements Partitioner {

    /**
     * 實現具體分發策略
     */
    @Override
    public int partition(String topic, Object key, byte[] bytes, Object o1, byte[] bytes1, Cluster cluster) {
        List<PartitionInfo> availablePartitions = cluster.availablePartitionsForTopic(topic);//拉取可用的partition
        if (key == null||key.equals("")) {
            int random =  (int) (Math.random() * 10);
            int part = random % availablePartitions.size();
            return availablePartitions.get(part).partition();
        }
        return  Math.abs(key.toString().hashCode() % 6);
    }

    @Override
    public void configure(Map<String, ?> configs) {
        // TODO Auto-generated method stub

    }

    @Override
    public void close() {
        // TODO Auto-generated method stub

    }

}

同時在初始化kafka生產者時，增加自定義配置

Properties properties = new Properties();
properties.put(ProducerConfig.PARTITIONER_CLASS_CONFIG,KeyPartitioner.class); //加入自定義的配置
producer = new KafkaProducer<Object, Object>(properties);

4、總結

以上是對kafka訊息分發的策略進行一定的分析與自定義擴充套件，希望對大家在使用kafka時有所幫助，其中如有不足與不正確的地方還望指出與海涵。

關注微信公眾號，檢視更多技術文章。

kafka訊息分發策略分析

Kafka訊息保留策略

Kafka Broker預設的訊息保留策略是：要麼保留一定時間，要麼保留到訊息達到一定大小的位元組數。當訊息達到設定的條件上限時，舊訊息就會過期並被刪除，所以，在任何時刻，可用訊息的總量都不會超過配置引數所指定的大小。 topic可以配置自己的保留策略，可以將訊息保留到不再使用他們為止。

Kafka整體結構圖 Consumer與topic關係 Kafka訊息分發 Consumer的負載均衡 Kafka檔案存

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

RabbitMQ札記-訊息分發策略

今天來學習RabbitMQ的訊息分發策略。在RabbitMQ札記-RabbitMQ入門一文中，我們曾學習過RabbitMQ的概念模型，其中就介紹過訊息分發策略。 Exchange表示交換器，用來接收生產者傳送的訊息並將這些訊息路由給佇列。從圖中可以看出，Pr

Kafka分割槽分配策略分析——重點：StickyAssignor

“ 為什麼Kafka在RangeAssigor、RoundRobinAssignor的基礎上，又新增了PartitionAssignor，它解決了什麼問題？” 背景用過Kafka的同學應該都知道Kafka的分割槽和消費組的概念。在Kafka中，每個Top

Objective-C映客房間訊息策略分析與實現

最近直播這麼火，今天分析一下映客的房間訊息模組。映客的房間訊息策略大體上是這樣的: • 訊息積累到一定量之後，便把之前的訊息丟棄掉。 • 訊息的顯示是有訊息則自動滾動到底部，如果使用者滑動訊息，則暫時停止滾動，5秒內不作操作則繼續自動滾動。 • 訊息在最

ELK日誌分析平臺加入Kafka訊息佇列

在之前的搭建elk環境中，日誌的處理流程為：filebeat --> logstash --> elasticsearch,隨著業務量的增長，需要對架構做進一步的擴充套件，引入kafka叢集。日誌的處理流程變為：filebeat --> kaf

Android藍芽原始碼分析——BTA層訊息分發

這裡BTA是Bluetooth Application的縮寫，從上層下來的請求都要經過這個BTA層，通過傳送訊息的方式將請求丟到BTA層中處理。這個傳送訊息的函式定義在bta_sys_main.c中，如下： void bta_sys_sendmsg(voi

kafka訊息交付語義的分析

在kafka中，在producer和consumer這兩個維度上都有三種訊息交付的語義： At most once ---- 訊息可能會丟失但絕不重傳. At least once ---- 訊息可以重傳但絕不丟失. Exactly once ---- 每

原始碼分析 Kafka 訊息傳送流程(文末附流程圖)

溫馨提示：本文基於 Kafka 2.2.1 版本。本文主要是以原始碼的手段一步一步探究訊息傳送流程，如果對原始碼不感興趣，可以直接跳到文末檢視訊息傳送流程圖與訊息傳送本地快取儲存結構。從上文初識 Kafka Producer 生產者，可以通過 KafkaProducer 的 send 方法傳送訊息，s

原始碼分析Kafka 訊息拉取流程

目錄１、KafkaConsumer poll 詳解 2、Fetcher 類詳解本節重點討論 Kafka 的訊息拉起流程。 @(本節目錄) １、KafkaConsumer poll 詳解訊息拉起主要入口為：

ExoPlayer Talk 01 緩存策略分析與優化

sca google mes efi allocator method policy 類型 let 操作系統:Windows8.1 顯卡:Nivida GTX965M 開發工具：Android studio 2.3.3 | ExoPlayer r2.5.1 使用 ExoP

Kafka網絡模型分析

idt width 接收 class roc thread sel 響應 tor 　　Kafka基於高吞吐率和效率考慮，並沒有使用第三方網絡框架，而且自己基於java nio封裝的，總體網絡模型如下：　　　　Broker的內部按照SEDA模型處理網絡請求，處理過程如下：

讀書筆記博客實戰之搜索引擎索引和流量漲跌策略分析[圖]

讀書筆記寫在前面：最近百度動作頻繁，變化十分大，以至於很多網站都出現了流量的大範圍波動，引起了站長們的思考和分析猜測，但通過數據來分析是最可靠的觀點，那麽我們今天就來分析一下這幾天百度在流量漲跌方面有什麽變化吧。實戰分析：讀書筆記博客，主要用於教育類話題的寫作和學習，采用老域名制作的新站，通過該網頁的排名變化

springboot kafka整合（包括java程式碼不能傳送和消費kafka訊息的採坑記錄）

kafka採坑記錄： 1、kafka服務端server.properties中的broker.id叢集內需要唯一。 2、kafka config檔案中listeners和advertised.listeners需要配置本機ip:9092

KOA + egg.js 整合 kafka 訊息佇列

Egg.js ：基於KOA2的企業級框架 Kafka：高吞吐量的分散式釋出訂閱訊息系統本文章將整合egg + kafka + mysql 的日誌系統例子系統要求：日誌記錄，通過kafka進行訊息佇列控制思路圖：這裡消費者和生產者都由日誌系統提供 λ.1 環境準備 ①Ka

[藍芽] 6、基於nRF51822的藍芽心率計工程訊息流Log分析（詳細）

轉載自： http://www.cnblogs.com/zjutlitao/p/5051166.html 開機初始化Log Log編號

Kafka訊息順序保證

Kafka可以保證同一個分割槽裡的訊息是有序的。生產者按照一定的順序傳送訊息，broker會按照這個順序將訊息寫入分割槽的批次快取中，消費者也會按照同樣的順序讀取它們。如果把retries設定為非零整數，同時把max.in.flight.requests.per.connection設定為大於

關於Kafka日誌留存策略的討論

關於Kafka日誌留存(log retention)策略的介紹，網上已有很多文章。不過目前其策略已然發生了一些變化，故本文針對較新版本的Kafka做一次統一的討論。如果沒有顯式說明，本文一律以Kafka 1.0.0作為分析物件。所謂日誌留存策略，就是Kafka儲存topic資料的規則，我將

kafka 訊息格式設計實現

目前kafka訊息格式有三個版本（假定v0,v1,v2），0.10.0之前使用的是v0版本，之後慢慢演變出v1,v2，後兩個版本在設計方式上沒有什麼特別大的區別，只是做了些空間上的優化，同樣的訊息，新版本的使用儲存空間會更小，優化主要在於訊息頭部的壓縮，當然還有些功能上的優化，例如添加了

kafka訊息分發策略分析

相關推薦