Producer的client端

示例程式碼

Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("client.id", "DemoProducer");props.put("key.serializer", "org.apache.kafka.common.serialization.ByteArraySerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.

ByteArraySerializer");producer = new KafkaProducer<Integer, String>(props);this.topic = topic;this.isAsync = isAsync;

String messageStr = "Message_";long startTime = System.currentTimeMillis();if (isAsync) {

非同步處理，這個過程需要定義一個回撥函式來監聽傳送的訊息的響應結果

// Send asynchronouslyproducer.send(new ProducerRecord<byte[]

, byte[]>(topic,messageNo.getBytes()/*key*/,messageNo.getBytes()/*value*/),

/*非同步處理,回撥函式*/

new DemoCallBack(startTime, messageNo, messageStr));} else {

同步處理，傳送完成後，等待發送的響應結果。

// Send synchronouslytry {producer.send(new ProducerRecord<Integer, String>(topic,messageNo.getBytes()/*key*/,messageNo.getBytes()/*value*/)).get()

;System.out.println("Sent message: (" + messageNo + ", " + messageStr + ")");} catch (InterruptedException e) { e.printStackTrace();} catch (ExecutionException e) { e.printStackTrace();}}

關於非同步處理的回撥函式定義：

這個回撥函式實現需要實現org.apache.kafka.clients.producer.Callback介面。

class DemoCallBack implements Callback

並實現介面中的函式：

public void onCompletion(RecordMetadata metadata, Exception exception) {

這裡的startTime是傳送這條訊息時，生成回撥函式時傳入的訊息傳送的開始時間，

計算出來了這次傳送這條訊息共花的時間long elapsedTime = System.currentTimeMillis() - startTime;if (metadata != null) {

如果metadata資訊不為空，表示訊息新增成功，可以得到當前新增成功的訊息的offset. System.out.println("message(" + key + ", " + message + ") sent to partition("

+ metadata.partition() +"), " +"offset(" + metadata.offset() + ") in " + elapsedTime + " ms");} else {

這種情況下，表示exception有值，也就是新增訊息失敗了，可以直接列印這個失敗的訊息的內容。 exception.printStackTrace();}}

Client端的生成與處理流程

生成KafkaProducer例項

1,首先看看KafkaProducer例項生成:

根據傳入的properties配置資訊，生成用於Producer的config例項。

this(new ProducerConfig(properties), null, null);

2,解析必要的配置項：

2,1,配置項client.id，用於標記client端的一個編碼值，預設值為producer-1。在同一個程序內，多個client端時，如果沒有指定，預設根據1這個值向後增加。

2,2,配置項partitioner.class，配置用於producer寫入資料時用於計算這條資料對應的partition的分配運算元例項，這個例項必須是的Partitioner實現。例項初始化時會呼叫configure函式把配置檔案傳入進去，用於例項生成時使用，預設情況下分割槽運算元是DefaultPartitioner。這個預設運算元根據當前的key值進行murmur2 hash並與對應的topic的個數於模，如果key為null時，根據一個自增的integer的值與partition的個數取模.

2,3,配置項retry.backoff.ms，用於在向broker傳送資料失敗後的重試間隔時間，預設值為100ms

2,4,配置項metadata.max.age.ms，用於配置每個producer端快取topic的metadata的過期時間，預設值為5分鐘。配置上面的2,3，與2,4的配置，生成一個Metadata例項。

2,5,配置項max.request.size，用於配置每次producer請求的最大的位元組數，預設值為1MB。

2,6,配置項buffer.memory，用於配置producer端等待向server傳送的資料的緩衝區的大小，預設值為32MB。

2,7,配置項compression.type，預設值none，用於配置資料的壓縮演算法，預設為不壓縮，可配置的值為none,gzip,snappy,lz4。

2,8,配置項max.block.ms，用於配置send資料或partitionFor函式得到對應的leader時，最大的等待時間，預設值為60秒。

2,9,配置項request.timeout.ms，用於配置socket請求的最大超時時間，預設值為30秒。

3,生成record的累加器，這是一個用於對producer要傳送的資料進行緩衝的例項：

this.accumulator = new RecordAccumulator(

config.getInt(ProducerConfig.BATCH_SIZE_CONFIG),this.totalMemorySize,this.compressionType,config.getLong(ProducerConfig.LINGER_MS_CONFIG),retryBackoffMs,metrics,time,metricTags);

3,1,RecordAccumulator例項需要的配置：

3,1,1配置項batch.size，用於批量提交的batch位元組大小，預設值為16384。

3,1,2配置項linger.ms，這個配置與3,1,1配合使用，用於配置資料快取的最大延遲時間,預設值0.

3,1,3依賴的其它配置項：2,6 2,7 2,3。

4,根據配置項bootstrap.servers，多個配置使用逗號分開，

生成用於socket請求的InetSocketAddress例項集合。

4,1並根據配置的broker的連線地址集合，生成Cluster的例項。把cluster例項更新到metadata的例項中。

5,生成NetworkClient例項，這個例項用於與各個broker進行socket通訊,生成用於進行資料傳送的Sender例項，並生成用於資料傳送的KafkaThread執行緒並啟動。

6,根據配置項key.serializer/value.serializer，生成key與value的序列化例項，這例項必須是Serializer的實現。

KafkaThread執行緒初始化

生成NetworkClient例項需要的配置項：

1,配置項connections.max.idle.ms，預設值為9分鐘，用於設定連線最大的空閒時間，

2,配置項max.in.flight.requests.per.connection，預設值5,用於設定每個連線最大的請求個數

3,配置項reconnect.backoff.ms，預設值50ms，用於設定重新嘗試連線的等待時間。

4,配置項send.buffer.bytes，預設值128kb，用於設定socket的傳送緩衝區SO_SNDBUF的大小。

5,配置項receive.buffer.bytes，預設值32kb,用於設定socket的接收響應的緩衝區SO_RCVBUF的大小。

6,配置項request.timeout.ms，用於配置socket請求的最大超時時間，預設值為30秒。

NetworkClient client = new NetworkClient(new Selector(

config.getLong(ProducerConfig.CONNECTIONS_MAX_IDLE_MS_CONFIG),

this.metrics, time, "producer", metricTags, channelBuilder),this.metadata,clientId,config.getInt(ProducerConfig.MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION),config.getLong(ProducerConfig.RECONNECT_BACKOFF_MS_CONFIG),config.getInt(ProducerConfig.SEND_BUFFER_CONFIG),config.getInt(ProducerConfig.RECEIVE_BUFFER_CONFIG),this.requestTimeoutMs, time);

Sender是一個用於傳送資料的執行緒。

需要的配置項：

1,配置項max.request.size，用於配置每次producer請求的最大的位元組數，預設值為1MB。

2,配置項acks，預設值1,用於配置請求的ack的型別,-1,0,1三種。

3,配置項retries，預設值0,用於配置傳送失敗的重試次數。this.sender = new Sender(client,this.metadata,this.accumulator,config.getInt(ProducerConfig.MAX_REQUEST_SIZE_CONFIG),(short) parseAcks(config.getString(ProducerConfig.ACKS_CONFIG)),config.getInt(ProducerConfig.RETRIES_CONFIG),this.metrics,new SystemTime(),clientId,this.requestTimeoutMs);String ioThreadName = "kafka-producer-network-thread"

+ (clientId.length() > 0 ? " | " + clientId : "");

這裡用於啟動用於對producer中的資料進行傳送的執行緒Sender例項。this.ioThread = new KafkaThread(ioThreadName, this.sender, true);this.ioThread.start();

通過producer傳送資料

Producer的send函式

public Future<RecordMetadata> send(ProducerRecord<K, V> record) {return send(record, null);}

如果需要考慮資料傳送成功的回撥處理時，需要實現Callback。public Future<RecordMetadata> send(ProducerRecord<K, V> record,

Callback callback) {try {

這裡根據請求的記錄的topic的名稱，得到這個topic對應的metadata資訊,這裡通過Metadata例項來得到。函式返回值是讀取topic的metadata資訊的讀取時間。

1,從metadata例項中的topics集合中檢查這個topic是否存在，如果不存在，把這個topic新增到集合中，

2,從metadata對應的Cluster例項（這裡儲存有每個broker的連線資訊）中的partitionsByTopic集合中根據topic得到topic對應的partition資訊的集合，如果partitionsByTopic中已經存在有對應的partitions的記錄，說明這個topic的metadata資訊已經被加載出來，函式直接返回0。

3,如果當前的topic在metadata中沒有對應的partitions的資訊，根據max.block.ms配置的最大等待時間，通過每個broker的連線，隨機取出一個broker的連線，如果broker的連線不存在時，會建立這個連線並向broker發起一個TopicMetadataRequest請求得到這個topic對應的metadata資訊。// first make sure the metadata for the topic is availablelong waitedOnMetadataMs = waitOnMetadata(record.topic(),

this.maxBlockTimeMs);

這裡得到總的等待時間除去得到metadata資訊用去的時間後還可以用於等待新增資料到傳送佇列處理的等待時間。long remainingWaitMs = Math.max(0, this.maxBlockTimeMs -

waitedOnMetadataMs);

對傳入的key與value進行序列化操作,並得到序列化後的byte array的key與value.byte[] serializedKey;try { serializedKey = keySerializer.serialize(record.topic(), record.key());} catch (ClassCastException cce) {throw new SerializationException("Can't convert key of class "

+ record.key().getClass().getName() +" to class " + producerConfig.getClass(

ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG).getName() +" specified in key.serializer");}byte[] serializedValue;try { serializedValue = valueSerializer.serialize(record.topic(),

record.value());} catch (ClassCastException cce) {throw new SerializationException("Can't convert value of class " +

record.value().getClass().getName() +" to class " + producerConfig.getClass(

ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG).getName() +" specified in value.serializer");}

得到這條記錄對應的partition,並根據這個partition生成TopicPartition,

在得到對應的partition時，如果傳入引數中包含有partition的id時，判斷這個partition的值是否在指定的範圍內，必須在指定的範圍內，如果partition沒有傳入時，通過指定的partitioner的例項，根據record的kv資訊，生成一個partition的id值。int partition = partition(record, serializedKey, serializedValue,

metadata.fetch());

得到一條記錄的長度，這個記錄的長度為size(4)，offset(8)，crc(4),magic(1),attr(1),

Keysize(4),key,valuesize(4),valueint serializedSize = Records.LOG_OVERHEAD + Record.recordSize(serializedKey,

serializedValue);ensureValidRecordSize(serializedSize);TopicPartition tp = new TopicPartition(record.topic(), partition);

log.trace("Sending record {} with callback {} to topic {} partition {}",

record, callback, record.topic(), partition);

向client端的訊息緩衝區內寫入這條訊息。RecordAccumulator.RecordAppendResult result = accumulator.append(tp,

serializedKey, serializedValue, callback, remainingWaitMs);

if (result.batchIsFull || result.newBatchCreated) {

如果當前的緩衝區的batch的大小已經滿了，或者說這個緩衝區中重新生成了一個batch時，喚醒sender的執行緒，讓sender的run函式繼續執行，完成對資料的傳送操作。log.trace("Waking up the sender since topic {} partition {} is either full

or getting a new batch", record.topic(), partition);

this.sender.wakeup();}return result.future;// handling exceptions and record the errors; // for API exceptions return them in the future, // for other exceptions throw directly} catch (ApiException e) {log.debug("Exception occurred during message send:", e);if (callback != null) callback.onCompletion(null, e);this.errors.record();return new FutureFailure(e);} catch (InterruptedException e) {this.errors.record();throw new InterruptException(e);} catch (BufferExhaustedException e) {this.errors.record();this.metrics.sensor("buffer-exhausted-records").record();throw e;} catch (KafkaException e) {this

相關推薦

kafka原始碼分析之producer

Producer的client端示例程式碼 Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("client.id", "De

Kafka 原始碼分析之LogSegment

這裡分析kafka LogSegment原始碼通過一步步分析LogManager,Log原始碼之後就會發現,最終的log操作都在LogSegment上實現.LogSegment負責分片的讀寫恢復重新整理刪除等動作都在這裡實現.LogSegment程式碼同樣在原始碼目錄log下. LogSe

kafka原始碼分析之consumer的原始碼

Consumer的client端示例程式碼 Properties props = new Properties();props.put(ConsumerConfig.BOOTSTRAP_SER

kafka原始碼分析之kafkaApis

KafkaApis 說明:用於處理對kafka的訊息請求的中心轉發元件,kafkaapis需要依賴於如下幾個元件: apis = new KafkaApis(socketServer.requestChannel, replicaManager, consumer

kafka原始碼分析之kafkacluster的管理-KafkaController

KafkaController 說明,這個例項主要用於對kafka cluster進行管理，一個kafka的cluster表示同一個zk環境下所有的broker的集合，在這個cluster中需要有一個broker被選舉成為leader,用於管理其它的broker的上線與

Kafka原始碼分析及圖解原理之Producer端

一.前言　　任何訊息佇列都是萬變不離其宗都是3部分，訊息生產者（Producer）、訊息消費者（Consumer）和服務載體（在Kafka中用Broker指代）。那麼本篇主要講解Producer端，會有適當的圖解幫助理解底層原理。　一.開發應用　　首先介紹一下開發應用，如何構建一個KafkaP

Kafka原始碼分析及圖解原理之Broker端

一.前言　　https://www.cnblogs.com/GrimMjx/p/11354987.html 　　上一節說過，任何訊息佇列都是萬變不離其宗都是3部分，訊息生產者（Producer）、訊息消費者（Consumer）和服務載體（在Kafka中用Broker指代）。上一節講了kafka prod

Spark原始碼分析之Spark Shell（上）

https://www.cnblogs.com/xing901022/p/6412619.html 文中分析的spark版本為apache的spark-2.1.0-bin-hadoop2.7。 bin目錄結構： -rwxr-xr-x. 1 bigdata bigdata 1089 Dec

Netty 原始碼分析之拆包器的奧祕

為什麼要粘包拆包為什麼要粘包首先你得了解一下TCP/IP協議，在使用者資料量非常小的情況下，極端情況下，一個位元組，該TCP資料包的有效載荷非常低，傳遞100位元組的資料，需要100次TCP傳送，100次ACK，在應用及時性要求不高的情況下，將這100個有效資料拼接成一個數據包，那會縮短到一個TCP資

Android原始碼分析之為什麼在onCreate() 和 onResume() 獲取不到 View 的寬高

轉載自：https://www.jianshu.com/p/d7ab114ac1f7 先來看一段很熟悉的程式碼，可能在最開始接觸安卓的時候，大部分人都寫過的一段程式碼；即嘗試在 onCreate() 和 onResume() 方法中去獲取某個 View 的寬高資訊：但是列印輸出後，我們會發

netty原始碼分析之服務端啟動

ServerBootstrap與Bootstrap分別是netty中服務端與客戶端的引導類，主要負責服務端與客戶端初始化、配置及啟動引導等工作，接下來我們就通過netty原始碼中的示例對ServerBootstrap與Bootstrap的原始碼進行一個簡單的分析。首先我們知道這兩個類都繼承自AbstractB

SNMP原始碼分析之（一）配置檔案部分

snmpd.conf想必不陌生。在程序啟動過程中會去讀取配置檔案中各個配置。其中幾個引數需要先知道是幹什麼的： token：配置檔案的每行的開頭，例如 group MyROGroup v1 readSec 這行token的引數是group。

【kubernetes/k8s原始碼分析】kubelet原始碼分析之cdvisor原始碼分析

資料流 UnsecuredDependencies -> run 1. cadvisor.New初始化 if kubeDeps.CAdvisorInterface == nil { imageFsInfoProvider := cadv

【kubernetes/k8s原始碼分析】kubelet原始碼分析之容器網路初始化原始碼分析

一. 網路基礎 1.1 網路名稱空間的操作建立網路名稱空間： ip netns add 名稱空間內執行命令： ip netns exec 進入名稱空間： ip netns exec bash 1.2 bridge-nf-c

【kubernetes/k8s原始碼分析】kubelet原始碼分析之資源上報

0. 資料流路徑： pkg/kubelet/kubelet.go Run函式（） -> syncNodeStatus () -> registerWithAPIServer() ->

【kubernetes/k8s原始碼分析】kubelet原始碼分析之啟動容器

主要是呼叫runtime，這裡預設為docker 0. 資料流 NewMainKubelet（cmd/kubelet/app/server.go） -> NewKubeGenericRuntimeManager(pkg/kubelet/kuberuntime/kuberuntime

Android系統原始碼分析之-ContentProvider

距離上一次寫部落格已經半年多了，這半年發生了很多事情，也有了很多感觸，最主要是改變了忙碌了工作，更加重視身體的健康，為此也把工作地點從深圳這個一線城市換到了珠海，工作相對沒有那麼累，身體感覺也好了很多。所以在工作完成之餘，也有了更多的時間來自我學習和提高，後續會用更多時間來寫更多實用的東西，幫助我們理解

Vue 原始碼分析之proxy代理

Vue 原始碼分析之proxy代理當我們在使用Vue進行資料設定時，通常初始化格式為: let data = { age: 12, name: 'yang' } // 例項化Vue物件 let vm = new Vue({ data })

Qt原始碼分析之事件分發器QEventDispatcherWin32

分析Qt原始碼一則想自己在開發學習中有積累，同時自己也一直有一種理念，使用她那麼就更深入的認識她。如果有分析不正確的，還煩請各位看官指正。事件分發器建立在QCoreApplication建構函式中 if (!QCoreApplicationPrivate

lodash原始碼分析之isArguments

lodash原始碼分析之isArguments 有人命中註定要過平庸的生活，默默無聞，因為他們經歷了痛苦或不幸；有人卻故意這樣做，那是因為他們得到的幸福超過了他們的承受能力。 ——卡爾維諾《煙雲》本文為讀 lodash 原始碼的第二十一篇，後續文章會更新到這個倉庫中，歡迎 star：poc