kafka學習之-server.properties詳細說明

阿新 • • 發佈：2021-12-24

每個kafka broker中配置檔案server.properties預設必須配置的屬性如下：

broker.id=0
num.network.threads=2
num.io.threads=8
socket.send.buffer.bytes=1048576
socket.receive.buffer.bytes=1048576
socket.request.max.bytes=104857600
log.dirs=/tmp/kafka-logs
num.partitions=2
log.retention.hours=168

log.segment.bytes=536870912
log.retention.check.interval.ms=60000
log.cleaner.enable=false

zookeeper.connect=localhost:2181
zookeeper.connection.timeout.ms=1000000

server.properties中所有配置引數說明(解釋)如下列表：
引數

說明(解釋)

broker.id =0

每一個broker在叢集中的唯一表示，要求是正數。當該伺服器的IP地址發生改變時，broker.id沒有變化，則不會影響consumers的訊息情況

log.dirs=/data/kafka-logs

kafka資料的存放地址，多個地址的話用逗號分割,多個目錄分佈在不同磁碟上可以提高讀寫效能 /data/kafka-logs-1，/data/kafka-logs-2

port =9092

broker server服務埠

message.max.bytes =6525000

表示訊息體的最大大小，單位是位元組

num.network.threads =4

broker處理訊息的最大執行緒數，一般情況下數量為cpu核數

num.io.threads =8

broker處理磁碟IO的執行緒數，數值為cpu核數2倍

background.threads =4

一些後臺任務處理的執行緒數，例如過期訊息檔案的刪除等，一般情況下不需要去做修改

queued.max.requests =500

等待IO執行緒處理的請求佇列最大數，若是等待IO的請求超過這個數值，那麼會停止接受外部訊息，應該是一種自我保護機制。

host.name

broker的主機地址，若是設定了，那麼會繫結到這個地址上，若是沒有，會繫結到所有的介面上，並將其中之一發送到ZK，一般不設定

socket.send.buffer.bytes=100*1024

socket的傳送緩衝區，socket的調優引數SO_SNDBUFF

socket.receive.buffer.bytes =100*1024

socket的接受緩衝區，socket的調優引數SO_RCVBUFF

socket.request.max.bytes =100*1024*1024

socket請求的最大數值，防止serverOOM，message.max.bytes必然要小於socket.request.max.bytes，會被topic建立時的指定引數覆蓋

log.segment.bytes =1024*1024*1024

topic的分割槽是以一堆segment檔案儲存的，這個控制每個segment的大小，會被topic建立時的指定引數覆蓋

log.roll.hours =24*7

這個引數會在日誌segment沒有達到log.segment.bytes設定的大小，也會強制新建一個segment會被 topic建立時的指定引數覆蓋

log.cleanup.policy = delete

日誌清理策略選擇有：delete和compact主要針對過期資料的處理，或是日誌檔案達到限制的額度，會被 topic建立時的指定引數覆蓋

log.retention.minutes=300

或

log.retention.hours=24

資料檔案保留多長時間，儲存的最大時間超過這個時間會根據log.cleanup.policy設定資料清除策略

log.retention.bytes和log.retention.minutes或log.retention.hours任意一個達到要求，都會執行刪除

有2刪除資料檔案方式：

按照檔案大小刪除：log.retention.bytes

按照2中不同時間粒度刪除：分別為分鐘，小時

log.retention.bytes=-1

topic每個分割槽的最大檔案大小，一個topic的大小限制 = 分割槽數*log.retention.bytes。-1沒有大小限log.retention.bytes和log.retention.minutes任意一個達到要求，都會執行刪除，會被topic建立時的指定引數覆蓋

log.retention.check.interval.ms=5minutes

檔案大小檢查的週期時間，是否處罰 log.cleanup.policy中設定的策略

log.cleaner.enable=false

是否開啟日誌清理

log.cleaner.threads = 2

日誌清理執行的執行緒數

log.cleaner.io.max.bytes.per.second=None

日誌清理時候處理的最大大小

log.cleaner.dedupe.buffer.size=500*1024*1024

日誌清理去重時候的快取空間，在空間允許的情況下，越大越好

log.cleaner.io.buffer.size=512*1024

日誌清理時候用到的IO塊大小一般不需要修改

log.cleaner.io.buffer.load.factor =0.9

日誌清理中hash表的擴大因子一般不需要修改

log.cleaner.backoff.ms =15000

檢查是否處罰日誌清理的間隔

log.cleaner.min.cleanable.ratio=0.5

日誌清理的頻率控制，越大意味著更高效的清理，同時會存在一些空間上的浪費，會被topic建立時的指定引數覆蓋

log.cleaner.delete.retention.ms =1day

對於壓縮的日誌保留的最長時間，也是客戶端消費訊息的最長時間，同log.retention.minutes的區別在於一個控制未壓縮資料，一個控制壓縮後的資料。會被topic建立時的指定引數覆蓋

log.index.size.max.bytes =10*1024*1024

對於segment日誌的索引檔案大小限制，會被topic建立時的指定引數覆蓋

log.index.interval.bytes =4096

當執行一個fetch操作後，需要一定的空間來掃描最近的offset大小，設定越大，代表掃描速度越快，但是也更好記憶體，一般情況下不需要搭理這個引數

log.flush.interval.messages=None

例如log.flush.interval.messages=1000

表示每當訊息記錄數達到1000時flush一次資料到磁碟

log檔案”sync”到磁碟之前累積的訊息條數,因為磁碟IO操作是一個慢操作,但又是一個”資料可靠性"的必要手段,所以此引數的設定,需要在"資料可靠性"與"效能"之間做必要的權衡.如果此值過大,將會導致每次"fsync"的時間較長(IO阻塞),如果此值過小,將會導致"fsync"的次數較多,這也意味著整體的client請求有一定的延遲.物理server故障,將會導致沒有fsync的訊息丟失.

log.flush.scheduler.interval.ms =3000

檢查是否需要固化到硬碟的時間間隔

log.flush.interval.ms = None

例如：log.flush.interval.ms=1000

表示每間隔1000毫秒flush一次資料到磁碟

僅僅通過interval來控制訊息的磁碟寫入時機,是不足的.此引數用於控制"fsync"的時間間隔,如果訊息量始終沒有達到閥值,但是離上一次磁碟同步的時間間隔達到閥值,也將觸發.

log.delete.delay.ms =60000

檔案在索引中清除後保留的時間一般不需要去修改

log.flush.offset.checkpoint.interval.ms =60000

控制上次固化硬碟的時間點，以便於資料恢復一般不需要去修改

auto.create.topics.enable =true

是否允許自動建立topic，若是false，就需要通過命令建立topic

default.replication.factor =1

是否允許自動建立topic，若是false，就需要通過命令建立topic

num.partitions =1

每個topic的分割槽個數，若是在topic建立時候沒有指定的話會被topic建立時的指定引數覆蓋

以下是kafka中Leader,replicas配置引數

controller.socket.timeout.ms =30000

partition leader與replicas之間通訊時,socket的超時時間

controller.message.queue.size=10

partition leader與replicas資料同步時,訊息的佇列尺寸

replica.lag.time.max.ms =10000

replicas響應partition leader的最長等待時間，若是超過這個時間，就將replicas列入ISR(in-sync replicas)，並認為它是死的，不會再加入管理中

replica.lag.max.messages =4000

如果follower落後與leader太多,將會認為此follower[或者說partition relicas]已經失效

##通常,在follower與leader通訊時,因為網路延遲或者連結斷開,總會導致replicas中訊息同步滯後

##如果訊息之後太多,leader將認為此follower網路延遲較大或者訊息吞吐能力有限,將會把此replicas遷移

##到其他follower中.

##在broker數量較少,或者網路不足的環境中,建議提高此值.

replica.socket.timeout.ms=30*1000

follower與leader之間的socket超時時間

replica.socket.receive.buffer.bytes=64*1024

leader複製時候的socket快取大小

replica.fetch.max.bytes =1024*1024

replicas每次獲取資料的最大大小

replica.fetch.wait.max.ms =500

replicas同leader之間通訊的最大等待時間，失敗了會重試

replica.fetch.min.bytes =1

fetch的最小資料尺寸,如果leader中尚未同步的資料不足此值,將會阻塞,直到滿足條件

num.replica.fetchers=1

leader進行復制的執行緒數，增大這個數值會增加follower的IO

replica.high.watermark.checkpoint.interval.ms =5000

每個replica檢查是否將最高水位進行固化的頻率

controlled.shutdown.enable =false

是否允許控制器關閉broker ,若是設定為true,會關閉所有在這個broker上的leader，並轉移到其他broker

controlled.shutdown.max.retries =3

控制器關閉的嘗試次數

controlled.shutdown.retry.backoff.ms =5000

每次關閉嘗試的時間間隔

leader.imbalance.per.broker.percentage =10

leader的不平衡比例，若是超過這個數值，會對分割槽進行重新的平衡

leader.imbalance.check.interval.seconds =300

檢查leader是否不平衡的時間間隔

offset.metadata.max.bytes

客戶端保留offset資訊的最大空間大小

kafka中zookeeper引數配置

zookeeper.connect = localhost:2181

zookeeper叢集的地址，可以是多個，多個之間用逗號分割 hostname1:port1,hostname2:port2,hostname3:port3

zookeeper.session.timeout.ms=6000

ZooKeeper的最大超時時間，就是心跳的間隔，若是沒有反映，那麼認為已經死了，不易過大

zookeeper.connection.timeout.ms =6000

ZooKeeper的連線超時時間

zookeeper.sync.time.ms =2000

ZooKeeper叢集中leader和follower之間的同步實際那

轉載請註明來自:http://blog.csdn.net/lizhitao/article/details/25667831
————————————————
版權宣告：本文為CSDN博主「幽靈之使」的原創文章，遵循CC 4.0 BY-SA版權協議，轉載請附上原文出處連結及本宣告。
原文連結：https://blog.csdn.net/lizhitao/article/details/25667831

kafka學習之-server.properties詳細說明

kafka學習之-server.properties詳細說明

Kafka學習之配置檔案詳解

Kafka學習之核心原理剖析

kafka學習之Exactly Once

kafka學習總結017 --- consumer配置引數之max.poll.interval.ms

Flink 從 0 到 1 學習之（13）Flink 讀取 Kafka 資料寫入到 RabbitMQ FlinkKafkaRabbitMQ大資料流式計算

Flink 從 0 到 1 學習之（12）Flink 讀取 Kafka 資料批量寫入到 MySQL

Flink 從 0 到 1 學習之（14）Flink 讀取kafka資料，寫入到Hbase

Flink 從 0 到 1 學習之（16）Flink DataStream之Kafka資料寫入HDFS，並分割槽到Hive

Flink 從 0 到 1 學習之（18）Flink SQL讀取kafka資料並通過JDBC方式寫入Clickhouse實時場景的簡單例項

Flink 從 0 到 1 學習之（24）Flink將kafka的資料存到redis中

Flink 從 0 到 1 學習之（26）Flink採集kafka資料後存到mongodb

SparkStreaming專案實戰從 0 到 1 學習之（1）使用 Kafka + Spark Streaming + Cassandra 構建資料實時處理引擎

Kafka學習筆記之分割槽Partition和副本Replicator的區別

Kafka學習筆記之kafka高版本Client連線0.9Server引發的血案排查

Kafka學習筆記之Kakfa異常分析-Magic v0 does not support record headers

Kafka學習筆記之Kafka命令列操作topic+producer+consumer詳解

史上最全、最詳細的 kafka 學習筆記！

kafka配置檔案：server.properties

大資料學習之kafka

kafka學習之-server.properties詳細說明

相關推薦