1. 程式人生 > >kafka訊息會不會丟失?為什麼?看了這個你就清楚了

kafka訊息會不會丟失?為什麼?看了這個你就清楚了

訊息傳送方式

想清楚Kafka傳送的訊息是否丟失,需要先了解Kafka訊息的傳送方式。

Kafka訊息傳送分同步(sync)、非同步(async)兩種方式

預設是使用同步方式,可通過producer.type屬性進行配置;

Kafka保證訊息被安全生產,有三個選項分別是0,1,-1

通過request.required.acks屬性進行配置:

0代表:不進行訊息接收是否成功的確認(預設值);

1代表:當Leader副本接收成功後,返回接收成功確認資訊;

-1代表:當Leader和Follower副本都接收成功後,返回接收成功確認資訊;

六種傳送場景

兩個維度相交,生成六種情況,如下圖:

訊息丟失的場景

網路異常

acks設定為0時,不和Kafka叢集進行訊息接受確認,當網路發生異常等情況時,存在訊息丟失的可能;

客戶端異常

非同步傳送時,訊息並沒有直接傳送至Kafka叢集,而是在Client端按一定規則快取並批量傳送。在這期間,如果客戶端發生宕機等情況,都會導致訊息的丟失;

緩衝區滿了

非同步傳送時,Client端快取的訊息超出了緩衝池的大小,也存在訊息丟失的可能;

Leader副本異常

acks設定為1時,Leader副本接收成功,Kafka叢集就返回成功確認資訊,而Follower副本可能還在同步。這時Leader副本突然出現異常,新Leader副本(原Follower副本)未能和其保持一致,就會出現訊息丟失的情況;

以上就是訊息丟失的幾種情況,在日常應用中,我們需要結合自身的應用場景來選擇不同的配置。

想要更高的吞吐量就設定:非同步、ack=0;想要不丟失訊息資料就選:同步、ack=-1策略

附:Kafka備份策略,不理解的可以看我的另一篇文章《Kafka訊息的備份策略》