Kafka 配置引數（非常好的總結）

阿新 • • 發佈：2019-01-02

轉載自：http://ju.outofmemory.cn/entry/119243

Kafka為broker,producer和consumer提供了很多的配置引數。瞭解並理解這些配置引數對於我們使用kafka是非常重要的。
本文列出了一些重要的配置引數。

官方的文件 Configuration比較老了，很多引數有所變動，有些名字也有所改變。我在整理的過程中根據0.8.2的程式碼也做了修正。

Boker配置引數

name	預設值	描述
brokerid	none	每一個boker都有一個唯一的id作為它們的名字。這就允許boker切換到別的主機/埠上， consumer依然知道
enable.zookeeper	true	允許註冊到zookeeper
log.flush.interval.messages	Long.MaxValue	在資料被寫入到硬碟和消費者可用前最大累積的訊息的數量
log.flush.interval.ms	Long.MaxValue	在資料被寫入到硬碟前的最大時間
log.flush.scheduler.interval.ms	Long.MaxValue	檢查資料是否要寫入到硬碟的時間間隔。
log.retention.hours	168	控制一個log保留多長個小時
log.retention.bytes	-1	控制log檔案最大尺寸
log.cleaner.enable	false	是否log cleaning
log.cleanup.policy	delete	delete還是compat. 其它控制引數還包括log.cleaner.threads，log.cleaner.io.max.bytes.per.second，log.cleaner.dedupe.buffer.size，log.cleaner.io.buffer.size，log.cleaner.io.buffer.load.factor，log.cleaner.backoff.ms，log.cleaner.min.cleanable.ratio，log.cleaner.delete.retention.ms
log.dir	/tmp/kafka-logs	指定log檔案的根目錄
log.segment.bytes	110241024*1024	單一的log segment檔案大小
log.roll.hours	24 * 7	開始一個新的log檔案片段的最大時間
message.max.bytes	1000000 + MessageSet.LogOverhead	一個socket 請求的最大位元組數
num.network.threads	3	處理網路請求的執行緒數
num.io.threads	8	處理IO的執行緒數
background.threads	10	後臺執行緒序
num.partitions	1	預設分割槽數
socket.send.buffer.bytes	102400	socket SO_SNDBUFF引數
socket.receive.buffer.bytes	102400	socket SO_RCVBUFF引數
zookeeper.connect	localhost:2182/kafka	指定zookeeper連線字串，格式如hostname:port/chroot。chroot是一個namespace
zookeeper.connection.timeout.ms	6000	指定客戶端連線zookeeper的最大超時時間
zookeeper.session.timeout.ms	6000	連線zk的session超時時間
zookeeper.sync.time.ms	2000	zk follower落後於zk leader的最長時間

High-level Consumer配置引數

name	預設值	描述
groupid	groupid	一個字串用來指示一組consumer所在的組
socket.timeout.ms	30000	socket超時時間
socket.buffersize	64*1024	socket receive buffer
fetch.size	300 * 1024	控制在一個請求中獲取的訊息的位元組數。這個引數在0.8.x中由fetch.message.max.bytes,fetch.min.bytes取代
backoff.increment.ms	1000	這個引數避免在沒有新資料的情況下重複頻繁的拉資料。如果拉到空資料，則多推後這個時間
queued.max.message.chunks	2	high level consumer內部快取拉回來的訊息到一個佇列中。這個值控制這個佇列的大小
auto.commit.enable	true	如果true,consumer定期地往zookeeper寫入每個分割槽的offset
auto.commit.interval.ms	10000	往zookeeper上寫offset的頻率
auto.offset.reset	largest	如果offset出了返回，則 `smallest`: 自動設定reset到最小的offset. `largest` : 自動設定offset到最大的offset. 其它值不允許，會丟擲異常.
consumer.timeout.ms	-1	預設-1,consumer在沒有新訊息時無限期的block。如果設定一個正值，一個超時異常會丟擲
rebalance.retries.max	4	rebalance時的最大嘗試次數

Producer配置引數

name	預設值	描述
serializer.class	kafka.serializer.DefaultEncoder	必須實現kafka.serializer.Encoder介面，將T型別的物件encode成kafka message
key.serializer.class	serializer.class	key物件的serializer類
partitioner.class	kafka.producer.DefaultPartitioner	必須實現kafka.producer.Partitioner，根據Key提供一個分割槽策略
producer.type	sync	指定訊息傳送是同步還是非同步。非同步asyc成批發送用kafka.producer.AyncProducer，同步sync用kafka.producer.SyncProducer
metadata.broker.list	boker list	使用這個引數傳入boker和分割槽的靜態資訊，如host1:port1,host2:port2, 這個可以是全部boker的一部分
compression.codec	NoCompressionCodec	訊息壓縮，預設不壓縮
compressed.topics	null	在設定了壓縮的情況下，可以指定特定的topic壓縮，為指定則全部壓縮
message.send.max.retries	3	訊息傳送最大嘗試次數
retry.backoff.ms	300	每次嘗試增加的額外的間隔時間
topic.metadata.refresh.interval.ms	600000	定期的獲取元資料的時間。當分割槽丟失，leader不可用時producer也會主動獲取元資料，如果為0，則每次傳送完訊息就獲取元資料，不推薦。如果為負值，則只有在失敗的情況下獲取元資料。
queue.buffering.max.ms	5000	在producer queue的快取的資料最大時間，僅僅for asyc
queue.buffering.max.message	10000	producer 快取的訊息的最大數量，僅僅for asyc
queue.enqueue.timeout.ms	-1	0當queue滿時丟掉，負值是queue滿時block,正值是queue滿時block相應的時間，僅僅for asyc
batch.num.messages	200	一批訊息的數量，僅僅for asyc
request.required.acks	0	0表示producer毋須等待leader的確認，1代表需要leader確認寫入它的本地log並立即確認，-1代表所有的備份都完成後確認。僅僅for sync
request.timeout.ms	10000	確認超時時間

kafka.serializer.DefaultEncoder
預設的這個Encoder事實上不做任何處理，接收到什麼byte[]就返回什麼byte[]:

classDefaultEncoder(props:VerifiableProperties=null)extendsEncoder[Array[Byte]]{overridedef toBytes(value:Array[Byte]):Array[Byte]= value
}

NullEncoder則不管接收什麼都返回null:

classNullEncoder[T](props:VerifiableProperties=null)extendsEncoder[T]{overridedef toBytes(value: T):Array[Byte]=null}

StringEncoder則返回字串，預設UTF-8格式：

classStringEncoder(props:VerifiableProperties=null)extendsEncoder[String]{
  val encoding =if(props ==null)"UTF8"else 
      props.getString("serializer.encoding","UTF8")overridedef toBytes(s:String):Array[Byte]=if(s ==null)nullelse
      s.getBytes(encoding)}

kafka.producer.DefaultPartitioner
預設的分割槽函式為DefaultPartitioner,它根據key的hashcode與分割槽數取餘，得到相應的分割槽。

classDefaultPartitioner(props:VerifiableProperties=null)extendsPartitioner{private val random =new java.util.Randomdef partition(key:Any, numPartitions:Int):Int={Utils.abs(key.hashCode)% numPartitions
  }}

但是如果key為null時會發送到哪個分割槽？在一定時間內往一個特定的分割槽傳送，超過一定時間又會隨機選擇一個，請參考key為null時Kafka會將訊息傳送給哪個分割槽? .所以推薦你傳送Kafka訊息時總是指定一個key,以便訊息能均勻的分到每個分割槽上。

Kafka為broker,producer和consumer提供了很多的配置引數。瞭解並理解這些配置引數對於我們使用kafka是非常重要的。
本文列出了一些重要的配置引數。

官方的文件 Configuration比較老了，很多引數有所變動，有些名字也有所改變。我在整理的過程中根據0.8.2的程式碼也做了修正。

Kafka 配置引數（非常好的總結）

轉載自：http://ju.outofmemory.cn/entry/119243 Kafka為broker,producer和consumer提供了很多的配置引數。瞭解並理解這些配置引數對於我們使用kafka是非常重要的。本文列出了一些重要的配置引數。官方的文

給你的JAVA程式配置引數（Properties的使用）

我們在寫JAVA程式時，很多時候執行程式的引數是需要動態改變的測試時一系列引數，執行時一系列引數又或者資料庫地址也需要配一套引數，以方便今後的動態部署這些變數的初始化，我們在寫小DEMO時完全可以寫死在JAVA檔案中但程式需要釋出或者區域性部署時，這些引數

Binder機制（非常好理解）

Binder是一種程序間通訊機制，用來實現不同程序之間的通訊。 Binder機制主要由四大塊組成，分別是客戶空間的client、server，serverManager，還有核心的Binder驅動。下面我先看下圖，利於理解Binder內部工作機制：伺服器端。一

hadoop埠使用配置總結（非常好的總結）

轉自http://www.aboutyun.com/thread-7513-1-1.html Hadoop叢集的各部分一般都會使用到多個埠，有些是daemon之間進行互動之用，有些是用於RPC訪問以及HTTP訪問。而隨著Hadoop周邊元件的增多，完全記不住哪個埠對應哪個應用，

總結一下各種IO方式（非常好的文章！）

同步（synchronous） IO和非同步（asynchronous） IO，阻塞（blocking） IO和非阻塞（non-blocking）IO分別是什麼，到底有什麼區別？這個問題其實不同的人給出的答案都可能不同，有人認為asynchronous IO和non-bl

深入理解JVM——配置引數（三）；垃圾回收演算法（四）

深入理解JVM（三）——配置引數 1、跟蹤引數 2、堆分配引數 3、棧分配引數這三類引數分別用於跟蹤監控JVM狀態，分配堆記憶體、棧記憶體。跟蹤引數跟蹤監控JVM，用於JVM調優以及故障排查。 1、當發生GC時，列印GC簡要資訊使

Joomla - T3模板（非常好用的4屏響應式模板）

一、下載 T3 模板下載地址（需要註冊登入才能下載）：https://www.joomlart.com/member/downloads/joomlart/t3-framework/t3-blank 下載完得到兩個壓縮包二、安裝 T3 模板進入後臺

Mariadb配置檔案優化引數（僅供參考）

[client] #password= your_password port= 3306 socket= /tmp/mysql.sock !includedir /opt/local/mysql/wsr

Jetson TX2 開箱配置+刷機+跑demo（常見坑總結）

杰特森系列是英偉達公司推出的面向無人智慧化領域的嵌入式平臺，這塊嵌入式板子的出現使得我們可以在邊緣裝置上處理複雜資料，實現人工智慧。 sudo apt-get install libpng 更換步驟以根身份開啟/etc/apt/sources.list，至於用什麼開啟隨意

Java虛擬機器--堆的配置引數（四）

最大堆和初始堆的設定說明： Java程序啟動時，虛擬機器就會分配一塊初始堆空間，可以使用引數-Xms指定這塊空間的大小；如果初始堆空間耗盡，虛擬機器會對堆空間繼續擴充套件，其擴充套件上限為最大堆空間，最大堆空間可以使用引數-Xmx指定；示例1：通過此例，說明最大堆，初始堆

source insight 配置檔案（超好）

下載地址：http://www.rayfile.com/zh-cn/files/fc8b2fdc-ce9b-11df-bc91-0015c55db73d/ 0. 此為C/C++的SourceInsight配置檔案，其他語言的為預設。（字型顏色在其他程式語言有效） 1.

【掃盲貼】淺談38K紅外發射接受編碼（非常好）

http://blog.sina.com.cn/s/blog_4ca9659e0101i9nn.html 轉自Doctor_A 壇友的筆記！之前做接觸過一次紅外遙控器，現在有空想用簡單的話來聊一聊，下面有錯誤的地方歡迎改正指出：1：紅外的概念不聊，那是一種物理存在。以下聊

OpenCV中矩陣資料的訪問（非常好）非常全

在OpenCV中有三種方式訪問矩陣中的資料元素：容易的方式，困難的方式，以及正確的方式。以下先講容易的方式和困難的方式。容易的方式最容易的方式是使用巨集CV_MAT_ELEM( matrix, elemtype, row, col ),輸入引數是矩陣的指標，矩陣元素型別，行

source insight 配置檔案（超好） --轉載

http://zhuang0393.blog.163.com/blog/static/9285104201093111912636/ 0. 此為C/C++的SourceInsight配置檔案，其他語言的為預設。（字型顏色在其他程式語言有效） 1. 主要就是給那些習慣於

JAVA中如何用介面實現多繼承和多型（非常好）

---------------------------------------------------------------多型1.JAVA裡沒有多繼承，一個類之能有一個父類。而繼承的表現就是多型。一個父類可以有多個子類，而在子類裡可以重寫父類的方法（例如方法print()

nginx 高併發配置引數（轉載）

/dev/poll：使用於 Solaris 7 11/99+, HP/UX 11.22+(eventport), IRIX 6.5.15+ 和 Tru64 UNIX 5.1A+。 Eventport：使用於 Solaris 10. 為了防止出現核心崩潰的問題，有必要安裝安全補丁。 ) 5. w

如何在三年內獲得十年工作經驗？（非常好的一片文章）

作者 think12 關注在如今的工作和生活中，“天下武功，唯快不破”成了我們的追求目標。我們都希望在短期內速成，什麼“21天成就xxx”、“xxx技能100天速成”廣受歡迎，我們甚至期望一夜之間變得學富五車、才高八斗、一夜暴富。我們都知道這是不符合常理的

openstack controller ha測試環境搭建記錄（十四）——配置cinder（存儲節點）

nbsp 設置 ntp reason script snap rate 文件 esc 先簡述cinder存儲節點的配置： 1、IP地址是10.0.0.41； 2、主機名被設置為block1； 3、所有節點的hosts文件已添加相應條目； 4、已經配置了ntp時間同

openstack controller ha測試環境搭建記錄（十一）——配置neutron（網絡節點）

efault delete none _for set ext ranges tar edr 在網絡節點配置內核參數：vi /etc/sysctl.confnet.ipv4.ip_forward=1net.ipv4.conf.all.rp_filter=0net.ipv4.

PPP的兩種配置方法（pap和chap）

pap chapPAP的配置R1上的配置[R1]int s4/0/0[R1-Serial4/0/0]ppp authentication-mode pap[R1-Serial4/0/0]q[R1]aaa[R1-aaa]local-user huawei password cipher 123456Info:

Kafka 配置引數（非常好的總結）

Boker配置引數

High-level Consumer配置引數

Producer配置引數

相關推薦