kafka中配置引數的說明

阿新 • • 發佈：2018-12-01

每個kafka broker中配置檔案server.properties預設必須配置的屬性如下：

broker.id=0
num.network.threads=2
num.io.threads=8
socket.send.buffer.bytes=1048576
socket.receive.buffer.bytes=1048576
socket.request.max.bytes=104857600
log.dirs=/tmp/kafka-logs

num.partitions=2
log.retention.hours=168
log.segment.bytes=536870912
log.retention.check.interval.ms=60000
log.cleaner.enable=false
zookeeper.connect=localhost:2181
zookeeper.connection.timeout.ms=1000000

server.properties中所有配置引數說明(解釋)如下列表：

引數	說明(解釋)
broker.id =0	每一個broker在叢集中的唯一表示，要求是正數。當該伺服器的IP地址發生改變時，broker.id沒有變化，則不會影響consumers的訊息情況
log.dirs=/data/kafka-logs	kafka資料的存放地址，多個地址的話用逗號分割/data/kafka-logs-1，/data/kafka-logs-2
port =9092	broker server服務埠
message.max.bytes =6525000	表示訊息體的最大大小，單位是位元組
num.network.threads =4	broker處理訊息的最大執行緒數，一般情況下不需要去修改
num.io.threads =8	broker處理磁碟IO的執行緒數，數值應該大於你的硬碟數
background.threads =4	一些後臺任務處理的執行緒數，例如過期訊息檔案的刪除等，一般情況下不需要去做修改
queued.max.requests =500	等待IO執行緒處理的請求佇列最大數，若是等待IO的請求超過這個數值，那麼會停止接受外部訊息，應該是一種自我保護機制。
host.name	broker的主機地址，若是設定了，那麼會繫結到這個地址上，若是沒有，會繫結到所有的介面上，並將其中之一發送到ZK，一般不設定
socket.send.buffer.bytes=100*1024	socket的傳送緩衝區，socket的調優引數SO_SNDBUFF
socket.receive.buffer.bytes =100*1024	socket的接受緩衝區，socket的調優引數SO_RCVBUFF
socket.request.max.bytes =10010241024	socket請求的最大數值，防止serverOOM，message.max.bytes必然要小於socket.request.max.bytes，會被topic建立時的指定引數覆蓋
log.segment.bytes =102410241024	topic的分割槽是以一堆segment檔案儲存的，這個控制每個segment的大小，會被topic建立時的指定引數覆蓋
log.roll.hours =24*7	這個引數會在日誌segment沒有達到log.segment.bytes設定的大小，也會強制新建一個segment會被 topic建立時的指定引數覆蓋
log.cleanup.policy = delete	日誌清理策略選擇有：delete和compact主要針對過期資料的處理，或是日誌檔案達到限制的額度，會被 topic建立時的指定引數覆蓋
log.retention.minutes=3days	資料儲存的最大時間超過這個時間會根據log.cleanup.policy設定的策略處理資料，也就是消費端能夠多久去消費資料 log.retention.bytes和log.retention.minutes任意一個達到要求，都會執行刪除，會被topic建立時的指定引數覆蓋
log.retention.bytes=-1	topic每個分割槽的最大檔案大小，一個topic的大小限制 =分割槽數*log.retention.bytes。-1沒有大小限log.retention.bytes和log.retention.minutes任意一個達到要求，都會執行刪除，會被topic建立時的指定引數覆蓋
log.retention.check.interval.ms=5minutes	檔案大小檢查的週期時間，是否處罰 log.cleanup.policy中設定的策略
log.cleaner.enable=false	是否開啟日誌壓縮
log.cleaner.threads = 2	日誌壓縮執行的執行緒數
log.cleaner.io.max.bytes.per.second=None	日誌壓縮時候處理的最大大小
log.cleaner.dedupe.buffer.size=50010241024	日誌壓縮去重時候的快取空間，在空間允許的情況下，越大越好
log.cleaner.io.buffer.size=512*1024	日誌清理時候用到的IO塊大小一般不需要修改
log.cleaner.io.buffer.load.factor =0.9	日誌清理中hash表的擴大因子一般不需要修改
log.cleaner.backoff.ms =15000	檢查是否處罰日誌清理的間隔
log.cleaner.min.cleanable.ratio=0.5	日誌清理的頻率控制，越大意味著更高效的清理，同時會存在一些空間上的浪費，會被topic建立時的指定引數覆蓋
log.cleaner.delete.retention.ms =1day	對於壓縮的日誌保留的最長時間，也是客戶端消費訊息的最長時間，同log.retention.minutes的區別在於一個控制未壓縮資料，一個控制壓縮後的資料。會被topic建立時的指定引數覆蓋
log.index.size.max.bytes =1010241024	對於segment日誌的索引檔案大小限制，會被topic建立時的指定引數覆蓋
log.index.interval.bytes =4096	當執行一個fetch操作後，需要一定的空間來掃描最近的offset大小，設定越大，代表掃描速度越快，但是也更好記憶體，一般情況下不需要搭理這個引數
log.flush.interval.messages=None	log檔案”sync”到磁碟之前累積的訊息條數,因為磁碟IO操作是一個慢操作,但又是一個”資料可靠性"的必要手段,所以此引數的設定,需要在"資料可靠性"與"效能"之間做必要的權衡.如果此值過大,將會導致每次"fsync"的時間較長(IO阻塞),如果此值過小,將會導致"fsync"的次數較多,這也意味著整體的client請求有一定的延遲.物理server故障,將會導致沒有fsync的訊息丟失.
log.flush.scheduler.interval.ms =3000	檢查是否需要固化到硬碟的時間間隔
log.flush.interval.ms = None	僅僅通過interval來控制訊息的磁碟寫入時機,是不足的.此引數用於控制"fsync"的時間間隔,如果訊息量始終沒有達到閥值,但是離上一次磁碟同步的時間間隔達到閥值,也將觸發.
log.delete.delay.ms =60000	檔案在索引中清除後保留的時間一般不需要去修改
log.flush.offset.checkpoint.interval.ms =60000	控制上次固化硬碟的時間點，以便於資料恢復一般不需要去修改
auto.create.topics.enable =true	是否允許自動建立topic，若是false，就需要通過命令建立topic
default.replication.factor =1	是否允許自動建立topic，若是false，就需要通過命令建立topic
num.partitions =1	每個topic的分割槽個數，若是在topic建立時候沒有指定的話會被topic建立時的指定引數覆蓋

以下是kafka中Leader,replicas配置引數
controller.socket.timeout.ms =30000	partition leader與replicas之間通訊時,socket的超時時間
controller.message.queue.size=10	partition leader與replicas資料同步時,訊息的佇列尺寸
replica.lag.time.max.ms =10000	replicas響應partition leader的最長等待時間，若是超過這個時間，就將replicas列入ISR(in-sync replicas)，並認為它是死的，不會再加入管理中
replica.lag.max.messages =4000	如果follower落後與leader太多,將會認為此follower[或者說partition relicas]已經失效 ##通常,在follower與leader通訊時,因為網路延遲或者連結斷開,總會導致replicas中訊息同步滯後 ##如果訊息之後太多,leader將認為此follower網路延遲較大或者訊息吞吐能力有限,將會把此replicas遷移 ##到其他follower中. ##在broker數量較少,或者網路不足的環境中,建議提高此值.
replica.socket.timeout.ms=30*1000	follower與leader之間的socket超時時間
replica.socket.receive.buffer.bytes=64*1024	leader複製時候的socket快取大小
replica.fetch.max.bytes =1024*1024	replicas每次獲取資料的最大大小
replica.fetch.wait.max.ms =500	replicas同leader之間通訊的最大等待時間，失敗了會重試
replica.fetch.min.bytes =1	fetch的最小資料尺寸,如果leader中尚未同步的資料不足此值,將會阻塞,直到滿足條件
num.replica.fetchers=1	leader進行復制的執行緒數，增大這個數值會增加follower的IO
replica.high.watermark.checkpoint.interval.ms =5000	每個replica檢查是否將最高水位進行固化的頻率
controlled.shutdown.enable =false	是否允許控制器關閉broker ,若是設定為true,會關閉所有在這個broker上的leader，並轉移到其他broker
controlled.shutdown.max.retries =3	控制器關閉的嘗試次數
controlled.shutdown.retry.backoff.ms =5000	每次關閉嘗試的時間間隔
leader.imbalance.per.broker.percentage =10	leader的不平衡比例，若是超過這個數值，會對分割槽進行重新的平衡
leader.imbalance.check.interval.seconds =300	檢查leader是否不平衡的時間間隔
offset.metadata.max.bytes	客戶端保留offset資訊的最大空間大小
kafka中zookeeper引數配置
zookeeper.connect = localhost:2181	zookeeper叢集的地址，可以是多個，多個之間用逗號分割hostname1:port1,hostname2:port2,hostname3:port3
zookeeper.session.timeout.ms=6000	ZooKeeper的最大超時時間，就是心跳的間隔，若是沒有反映，那麼認為已經死了，不易過大
zookeeper.connection.timeout.ms =6000	ZooKeeper的連線超時時間
zookeeper.sync.time.ms =2000	ZooKeeper叢集中leader和follo

kafka中配置引數的說明

每個kafka broker中配置檔案server.properties預設必須配置的屬性如下： broker.id=0 num.network.threads=2 num.io.threads=8

kafka所有配置引數說明

轉自：http://blog.csdn.net/lizhitao/article/details/25667831 apache kafka中國社群QQ群:162272557 每個kafka broker中配置檔案server.properties預設必須配置的屬性

Spring Boot Admin 更換應用管理埠後在Environment中配置引數

最近在使用Spring Boot Admin的時候發現一個問題，當修改了應用的管理埠後，在Environment功能中的引數編輯框就消失了：本人提供的解決辦法如下：@ManagementContextConfiguration public class ExceptionRe

kafka常用配置引數及解釋

auto.create.topics.enable=true #自動建立topic auto.leader.rebalance.enable=true compression.type=producer controlled.shutdown.enable=true con

kafka中重要的引數配置（記錄）

replica.fetch.max.bytes：在kafka的配置中，如果沒有定義 replica.fetch.max.bytes的值，server 會給一個預設值(1M),在短訊息的應用場景下通常是不會有什麼問題的，但是在訊息比較大的情況下，雖然可以在to

啟動伺服器時將配置引數從資料庫中載入到快取

最近做專案，碰到這樣的需求：在伺服器啟動的時候從資料庫讀取引數，將引數儲存到記憶體快取中由於使用的是spring的自動注入方式，一開始用@component註解在啟動的時候載入查詢配置引數的bean,由於bean中要用到其他bean來查詢，但此時都為null 查詢相關資料，發現@PostC

Redis的配置檔案redis.conf中的引數說明

redis.conf 配置項說明如下：原文連結:菜鳥教程--http://www.runoob.com/redis/redis-conf.html 1. Redis預設不是以守護程序的方式執行，可以通過該配置項修改，使用yes啟用守護程序 d

分散式系統中處理引數配置的 4 種方案

一個系統中包含有各種各樣的配置資訊，如一個日誌檔案需要配置以下幾個資訊。日誌檔案生成主目錄日誌檔名稱，不同的日誌級別對應不同的檔案當前日誌級別還有其他各種業務引數、系統引數等，大多單一系統是直接把這些配置寫死在配置檔案中，當部署到測試、生產環境就再修

kafka 中的內網和公網IP配置

當使用阿里雲或者有公網IP和內網IP的伺服器時，搭建kafka叢集，使用公網接受資料，通過內網傳輸到hdfs等供消費。 1、/etc/hosts裡配置內網IP 10.161.241.171 yourhostname 2、kafka的server端配置如下

Spring-boot 配置Aop獲取controller裡的request中的引數以及其返回值

轉自：http://ysj5125094.iteye.com/blog/2151855 前提條件：除了spring相關jar包外，還需要引入aspectj包。 Xml程式碼 <dependency>

通過properties檔案配置web.xml中的引數

前言因為公司專案需要，目前有本地環境、測試環境、開發環境。每次在將專案打包成war包的時候，都需要修改多處的配置，而使用maven的profile打包專案的時候，可以根據執行打包命令時所帶的引數來進行自動修改。但是這種方式只對properties檔案生效，即可以自動修改

kafka實戰 - 處理大檔案需要注意的配置引數

概述　　kafka配置引數有很多，可以做到高度自定義。但是很多使用者拿到kafka的配置檔案後，基本就是配置一些host，port，id之類的資訊，其他的配置項採用預設配置，就開始使用了。這些預設配置是經過kafka官方團隊經過嚴謹寬泛的測試之後，求到的最優值。在單條資訊很小，大部分場景下都能得到優異的效

專案中的引數化配置

import java.io.IOException; import java.io.InputStream; import java.util.Properties; import com.retail.supmarket.http.controller.SweepCodePaymentCo

執行中的Storm叢集修，改配置引數後重啟失敗的問題

一、問題描述：對於已經搭建好的Storm叢集，啟動後上面已經執行很多topology，此時想要修改storm的叢集配置引數（storm.yarm）後重新啟動叢集，雖然storm中nimbus和web-ui程序能夠正常啟動，但是實際後臺ui的日誌總是報錯，而且嘗試在localhost:8

Ubuntu中安裝zookeeper及kafka並配置環境變數

首先安裝zookeeper zookeeper需要jdk環境，請在jdk安裝完成的情況下安裝zookeeper 1.從官網下載zookeeper http://mirror.bit.edu.cn/apache/zookeeper/，版本可以根據自己需要選擇使用，

redis中aof備份策略中的配置引數

在使用redis時，都會配置相應的儲存策略，以保證redis並不會由於意外掛掉，在短時間內重啟時資料不會消失。在當前的版本中,redis提供了bgsave和aof兩種策略，本文主要描述了aof中的相關引數以及為什麼這樣是可以足夠安全的。本文的描述主要參考redis的conf檔案以及各項網路 appendo

Kafka 配置引數（非常好的總結）

轉載自：http://ju.outofmemory.cn/entry/119243 Kafka為broker,producer和consumer提供了很多的配置引數。瞭解並理解這些配置引數對於我們使用kafka是非常重要的。本文列出了一些重要的配置引數。官方的文

監聽器listener.ora中HOST引數配置

Oracle Net是我們使用Oracle過程中不可缺少的元件環節。對於初學者而言，三個配置檔案tnsname.ora、listener.ora和sqlnet.ora是最容易混亂的部分。而且，由於採用ASCII文字格式編輯，非常容易出現配置錯誤。監聽器控制檔案list

Flume中的HDFS Sink配置引數說明

關鍵字：flume、hdfs、sink、配置引數轉自：http://lxw1234.com/archives/2015/10/527.htm Flume中的HDFS Sink應該是非常常用的，其中的配置引數也比較多，在這裡記錄備忘一下。 channeltype hd

kafka配置引數說明及工作原理

訊息佇列的效能好壞，其檔案儲存機制設計是衡量一個訊息佇列服務技術水平和最關鍵指標之一。下面將從Kafka檔案儲存機制和物理結構角度，分析Kafka是如何實現高效檔案儲存，及實際應用效果。 1.1 Kafka的特性:- 高吞吐量、低延遲：kafka每秒可以處理幾十萬條訊息，它的延遲最低只有幾毫秒，每個topi

kafka中配置引數的說明

相關推薦