flume + kafka 日誌採集

阿新 • • 發佈：2019-01-06

將系統產生日誌資訊通過flume採集，推送至kafka進行消費處理

架構圖

服務	ip	port	備註
flume collectors	10.200.132.181	6333	flume collectors
flume agent	10.200.132.168	flume採集器(目前使用一個agent)
kafka	10.200.132.181	9092 2181	kafka和zookeeper

一臺機器部署一個flume agent，如果需要採集多個服務的日誌，在配置檔案裡面可以配置多個collect，

本文主要安裝flume和如何實現日誌採集

一、安裝部署

1、下載安裝flume

[[email protected] opt]# tar -zxvf apache-flume-1.8.0-bin.tar.gz

2、10.200.132.181機器上配置

新建 flume-collecters.properties ，用於將收集到flume agent日誌推送到kafka

[[email protected] apache-flume-1.8.0-bin]#  cd conf

[[email protected] conf]# vim flume-collecters.properties 
#flume collecters
agent.sources = s1Flume
agent.channels = c1
agent.sinks =sinkKafka
 
# For each one of the sources, the type is defined
agent.sources.s1Flume.channels = c1
agent.sources.s1Flume.type = avro

#flume ip

agent.sources.s1Flume.bind = 10.200.132.181

# flume 埠
agent.sources.s1Flume.port = 6333
 
# The channel can be defined as follows.
agent.sources.s1Flume.channels = c1
 
# Each sink's type must be defined
agent.sinks.sinkKafka.type = org.apache.flume.sink.kafka.KafkaSink

# kafka訊息佇列名稱
agent.sinks.sinkKafka.topic = topic-pear

# kafka ip:port
agent.sinks.sinkKafka.brokerList = 10.200.132.181:9092 
agent.sinks.sinkKafka.requiredAcks = 1
agent.sinks.sinkKafka.batchSize = 20
agent.sinks.sinkKafka.channel = c1
#Specify the channel the sink should use
#agent.sinks.loggerSink.channel = memoryChannel
# Each channel's type is defined.
agent.channels.c1.type = memory
 
# Other config values specific to each type of channel(sink or source)
# can be defined as well
# In this case, it specifies the capacity of the memory channel
agent.channels.c1.capacity = 100

啟動flume

[[email protected] apache-flume-1.8.0-bin]#  bin/flume-ng agent -c conf -f conf/flume-collecters.properties -n agent -Dflume.root.logger=INFO,console,LOGFILE &

檢視6333埠是否已啟動

3、10.200.132.168上flume配置

[[email protected] conf]# vim flume-test-collect.properties
agent.sources = fileSource
agent.channels = memoryChannel
agent.sinks = collecter1
 
agent.sinkgroups = gCollecters
agent.sinkgroups.gCollecters.sinks = collecter1
 
#sink排程模式 load_balance  failover
agent.sinkgroups.gCollecters.processor.type = failover
#負載均衡模式  輪詢  random  round_robin
agent.sinkgroups.gCollecters.processor.selector=round_robin
#失效降級
agent.sinkgroups.gCollecters.processor.backoff=true
#降級時間30秒
agent.sinkgroups.gCollecters.processor.maxTimeOut=30000
 
 
agent.sources.fileSource.type = exec
# 監控的日誌檔案
agent.sources.fileSource.command = tail -F /opt/test/logs/test.log
#agent.sources.fileSource.charset=utf-8
agent.sources.fileSource.channels = memoryChannel
 
agent.sources.fileSource.restartThrottle = 10000
agent.sources.fileSource.restart = true
agent.sources.fileSource.logStdErr = true
 
# Each sink's type must be defined
agent.sinks.collecter1.channel = memoryChannel
agent.sinks.collecter1.type = avro
# flume 服務ip
agent.sinks.collecter1.hostname = 10.200.132.181
# flume 埠
agent.sinks.collecter1.port = 6333
agent.sinks.collecter1.batch-size = 10
# Each channel's type is defined.
agent.channels.memoryChannel.type = memory
 
# Other config values specific to each type of channel(sink or source)
#The max number of events stored in the channel
agent.channels.memoryChannel.capacity = 100
#The max number of events stored in the channel per transaction
agent.channels.memoryChannel.transactionCapacity = 100
#Timeout in seconds for adding or removing an event
agent.channels.memoryChannel.keep-alive=30

建立日誌目錄（如果沒有就建立）

[[email protected] conf]# mkdir -p /opt/test/logs/

啟動服務

[[email protected] apache-flume-1.8.0-bin]# bin/flume-ng agent -c conf -f conf/flume-test-collect.properties -n agent -Dflume.root.logger=INFO,console,LOGFILE

部署配置基本完成

二、驗證

登入10.200.132.181伺服器，執行kafka消費訊息

[[email protected] ~]# /opt/kafka_2.12-2.0.0/bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic topic-pear --from-beginning

登入10.200.132.168伺服器，往日誌檔案寫日誌

[[email protected] logs]# echo "hello world" >>test.log

寫入完成之後，大概等幾秒鐘，就可以看到kafka消費者消費的佇列資訊了。

自己也可以寫一個springboot程式產生日誌，修改flume agent 監控的日誌目錄檔案，就可以實時的將日誌通過flume推送至kafka

flume + kafka 日誌採集

將系統產生日誌資訊通過flume採集，推送至kafka進行消費處理架構圖服務 ip port 備註 flume collectors 10.200.132.181 6333 flume collectors flum

flume分散式日誌採集系統實戰-陳耀武-專題視訊課程

flume分散式日誌採集系統實戰—4303人已學習課程介紹隨著公司業務的不斷增長，劃分了許多應用，不同應用的日誌在不同伺服器上面，很難進行統一管理，通過學習該課程，你可以自己搭建日誌採集系統，可以進行資料分析，挖掘等工作課程收益通過學習該課程，可以快

Flume+Kafka雙劍合璧玩轉大資料平臺日誌採集

概述大資料平臺每天會產生大量的日誌，處理這些日誌需要特定的日誌系統。一般而言，這些系統需要具有以下特徵：構建應用系統和分析系統的橋樑，並將它們之間的關聯解耦；支援近實時的線上分析系統和類似於Hadoop之類的離線分析系統；具有高可擴充套件性。即：當資料量增加時，可以通過增加節點

日誌採集系統flume和kafka有什麼區別及聯絡？

日誌採集系統flume和kafka有什麼區別及聯絡，它們分別在什麼時候使用，什麼時候又可以結合？觀點一：簡言之：這兩個差別很大，使用場景區別也很大。先說flume：日誌採集。線上資料一般主要是落地檔案或者通過socket傳輸給另外一個系統。這種情況下，你很難推動線上應用或服務去修改介

基於Flume+Log4j+Kafka的日誌採集架構方案

Flume 基本概念 Flume是一個完善、強大的日誌採集工具，關於它的配置，在網上有很多現成的例子和資料，這裡僅做簡單說明不再詳細贅述。 Flume包含Source、Channel、Sink三個最基本的概念： Source——日誌來源，其中包括：Avro Source、

開源日誌採集系統比較：scribe、chukwa、kafka、flume

1. 背景介紹許多公司的平臺每天會產生大量的日誌（一般為流式資料，如，搜尋引擎的pv，查詢等），處理這些日誌需要特定的日誌系統，一般而言，這些系統需要具有以下特徵：（1）構建應用系統和分析系統的橋樑，並將它們之間的關聯解耦；（2）支援近實時的線上分析系統和類似於

Flume + kafka + HDFS構建日誌採集系統

本文轉載自：http://shift-alt-ctrl.iteye.com/blo

flume-kafka整合--實時日誌採集

flume採用架構 exec-source + memory-channel + avro-sink avro-source + memory-channel + kafka-sink

Flume+Kafka+Zookeeper搭建大數據日誌采集框架

flume+kafka+zookeeper1. JDK的安裝參考jdk的安裝，此處略。2. 安裝Zookeeper 參考我的Zookeeper安裝教程中的“完全分布式”部分。3. 安裝Kafka 參考我的Kafka安裝教程中的“完全分布式搭建”部分。4. 安裝Flume 參考

SparkStreaming（14）：log4j日誌-flume-kafka-SparkStreaming的整合

一、功能實現模擬log4j的日誌生產，將日誌輸出到flume伺服器。然後，通過flume將日誌資訊輸出到kafka，進而Streaming可以從kafka獲得日誌，並且進行簡單的處理。二、步驟 1.目的：使用log4j將日誌輸按照一定格式輸出，並且傳遞給flume伺服器特定埠接

kafkaChannel實現一個source下，不同日誌採集到kafka不同主題中

1.需求使用flume採集資料，在使用一個source情況下，將不同的日誌採集到指定的kafka的主題中。例如：有兩個日誌檔案：error.log和info.log error.log採集到kafka的kafka_channel主題 info.log採集到kafka的kafk

Apache flume+Kafka獲取實時日誌資訊

Flume簡介以及安裝 Flume是一個分散式的對海量日誌進行採集，聚合和傳輸的系統。Flume系統分為三個元件，分別是source,sink,channel：source表明資料的來源，可能來自檔案，Avro等，channel作為source和sink的橋樑，作為資料的臨時儲存地，channal是

Spark Streaming實時流處理筆記（3）——日誌採集Flume

1 Flume介紹 1.1 設計目標可靠性擴充套件性管理性 1.2 同類產品 Flume: Cloudera/Apache,Java Scribe: Facebook ,C/C++(不維護了) Chukwa: Yahoo

大資料技術學習筆記之網站流量日誌分析專案：Flume日誌採集系統1

一、網站日誌流量專案 -》專案開發階段： -》可行性分析 -》需求分析

通過flume把日誌檔案內容寫入kafka主題

首先自行安裝flume和 kafka當然還要jdk，我flume版本是1.6的kafka版本2.11，jdk1.8。首先在路徑flume下的conf裡面建立一個logtokafka.conf檔案進行配置配置內容如下。 agent.sources=r1 agent.sinks=k1 agen

flume 1.6 安裝及配置日誌採集配置

1.下載flume1.6 2.安裝jdk和Hadoop 具體參照以前wen'文章 3.flume 配置檔案修改修改conf目錄下的flume-env.sh檔案 export JA

用Nginx採集日誌通過flume將日誌檔案儲存到HDFS上

安裝Tomcat 到官網下載apache-tomcat-7.0.69 開啟eclipse->window->preferences->server->runtime environments 編寫專案 Nginx

日誌採集框架Flume

在一個完整的大資料處理系統中，除了hdfs+mapreduce+hive組成分析系統的核心之外，還需要資料採集、結果資料匯出、任務排程等不可或缺的輔助系統，而這些輔助工具在hadoop生態體系中都有便捷的開源框架，如圖所示： 1、Flume介紹 1.1、概述 Flu

業務系統日誌採集：logstash+kafka

業務系統，可以是一個APP，也可以是一個應用網站。通常業務系統所使用的伺服器有很多臺，業務系統伺服器即有可能是Linux伺服器，也可能是windows伺服器，比如一些遊戲開發所選用的伺服器是window伺服器。通常

頁面日誌採集：ngix+logstash+kafka

頁面日誌採集是指從頁面上採集使用者行為，將使用者行為資訊記錄成日誌，並將日誌資訊讀取到訊息佇列的過程。一種比較常用的日誌採集技術工具是：ngix+logstash+kafka。進行頁面日

flume + kafka 日誌採集

一、安裝部署

二、驗證

相關推薦