Flume各種採集日誌方式與輸出目錄

阿新 • • 發佈：2018-12-15

1、從網路埠採集資料輸出到控制檯

一個簡單的socket 到 console配置

# 定義這個agent中各元件的名字
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# 描述和配置source元件：r1
a1.sources.r1.type = netcat
a1.sources.r1.bind = bigdata01
a1.sources.r1.port = 44444

# 描述和配置sink元件：k1
a1.sinks.k1.type = logger

# 描述和配置channel元件，此處使用是記憶體快取的方式
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# 描述和配置source  channel   sink之間的連線關係
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

啟動flume：bin/flume-ng agent -c conf -f myconf/socket-console.conf -n a1 -Dflume.root.logger=INFO,console

監聽44444埠：

telnet anget-hostname port （telnet localhost 44444）

監聽結果：

2、從網路端採集資料輸出到檔案

# 定義這個agent中各元件的名字
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# 描述和配置source元件：r1
a1.sources.r1.type = netcat
a1.sources.r1.bind = hadoop01
a1.sources.r1.port = 44444

# 描述和配置sink元件：k1
a1.sinks.k1.type = file_roll
a1.sinks.k1.sink.directory = /usr/local/apache-flume-1.7.0-bin/flumelog

# 描述和配置channel元件，此處使用是記憶體快取的方式
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# 描述和配置source  channel   sink之間的連線關係
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

注：a1.sinks.k1.sink.directory = /usr/local/apache-flume-1.7.0-bin/flumelog中檔案目錄必須是存在的，不存在會報錯

啟動Flume：

bin/flume-ng agent -c conf -f myconf/netcat-disk.conf -n a1 -Dflume.root.logger=INFO,console

給監聽的埠傳送資料：

telnet hadoop01 44444

會發現此時控制檯並沒有輸出資訊，而且存入了檔案中

3、從本地目錄寫入到HDFS

# 定義這個agent中各元件的名字
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# 描述和配置source元件：r1
a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir = /usr/local/apache-flume-1.7.0-bin/flumedata

# 描述和配置sink元件：k1
#寫hdfshdfs必須是配置好環境變數的
a1.sinks.k1.type = hdfs
#寫入到hdfs的目錄
a1.sinks.k1.hdfs.path = /flumedata/events
#寫檔案的字首
a1.sinks.k1.hdfs.filePrefix = events-
#滾動時間
a1.sinks.k1.hdfs.rollInterval = 60
#滾動大小
a1.sinks.k1.hdfs.rollSize = 1048576
#滾動數量
a1.sinks.k1.hdfs.rollCount = 100

# 描述和配置channel元件，此處使用是記憶體快取的方式
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# 描述和配置source  channel   sink之間的連線關係
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

注：a1.sinks.k1.hdfs.path = /flumedata/events寫入到HDFS的目錄不需要自己建立

啟動Flume：

bin/flume-ng agent -c conf -f myconf/directory-hdfs.conf -n a1 -Dflume.root.logger=INFO,console

左邊在傳

上傳成功

採集成功以後，檔名字尾變了.COMPLETED

注：如果再往目錄裡面放一個同名檔案，會報錯，不會上傳到HDFS

4、Flume監控一個檔案實時寫到Kafka

# 定義這個agent中各元件的名字
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# 描述和配置source元件：r1
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /opt/datas/tmp.log

# 描述和配置sink元件：k1
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.topic = flumetopic
a1.sinks.k1.kafka.bootstrap.servers = hadoop01:9092,hadoop02:9092,hadoop03:9092,hadoop04:9092
a1.sinks.k1.kafka.flumeBatchSize = 20
a1.sinks.k1.kafka.producer.acks = 1
a1.sinks.k1.kafka.producer.linger.ms = 1
a1.sinks.ki.kafka.producer.compression.type = snappy

# 描述和配置channel元件，此處使用是記憶體快取的方式
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# 描述和配置source  channel   sink之間的連線關係
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

while true;
> do
> echo `date`>>/opt/datas/tmp.log
> sleep 0.5
> done

注：這裡連線了四個機器，第一個用於啟動Flume，第二臺用於檢視是否建立主題，第三臺用於不斷給tmp.log檔案追加內容，用於Kafka消費，第四臺用於檢視檔案大小，以證明檔案在一直寫入

啟動Flume：

bin/flume-ng agent -c conf -f myconf/exec-kafka.conf -n a1 -Dflume.root.logger=INFO,console

啟動成功，且已建立Topic為配置檔案中flumeTopic。

接下來，給檔案tmp.log一直追加內容。可以看到檔案大小一直在變大，說明追加成功

消費Kafka中的資料：

kafka-console-consumer.sh --bootstrap-server hadoop01:9092 --from-beginning --topic flumeTopic

消費成功，且資料為實時時間，說明Flume成功的將檔案寫入到Kafka

Flume各種採集日誌方式與輸出目錄

1、從網路埠採集資料輸出到控制檯一個簡單的socket 到 console配置 # 定義這個agent中各元件的名字 a1.sources = r1 a1.sinks = k1 a1.

Flume實戰二，tail -F的方式監控一個檔案實時採集新增的資料輸出到控制檯

在cd $FLUME_HOME/conf vim exec-memory-logger.conf #exec-memory-logger.conf內容 # a1可以看做是flume服務的名稱，每個flume都由sources、channels和sinks三部分組成 # sources可以

軟件開發的目錄規範/定制程序的入口/引用配置文件/引用自定義模塊/logging模塊/日誌繼承與propagate屬性/通過字典導入配置/日誌模塊在項目中的使用

clas common 邏輯導入字典 pro gpo 項目日誌模塊 02.軟件開發的目錄規範單獨的文件放單獨的東西py文件src 程序的核心有關setting 配置有關common 常用功能的集合體文件夾lib 　　　　　　庫log 　　　　日誌conf 配

log4j不列印sql，不輸出日誌檔案到指定目錄

#log4j.rootLogger=CONSOLE,info,error,DEBUG log4j.rootLogger=infoA,errorA,CONSOLE,DEBUGA //注意這裡不要用INFO，DEBUG等改個名字 log4j.appender.CONSOLE=org.apach

Linux系統中各種系統日誌檔案主要存放在系統中哪個目錄

/var/log/message 系統啟動後的資訊和錯誤日誌，是Red Hat Linux中最常用的日誌之一 /var/log/secure 與安全相關的日誌資訊 /var/log/maillog 與郵件相關的日誌資訊 /var/log/cron 與定時任務相關的日誌資訊 /va

用Nginx採集日誌通過flume將日誌檔案儲存到HDFS上

安裝Tomcat 到官網下載apache-tomcat-7.0.69 開啟eclipse->window->preferences->server->runtime environments 編寫專案 Nginx

Flume+HBase採集和儲存日誌資料

轉自：http://blog.csdn.net/yaoyasong/article/details/39400829 前言大資料時代，誰掌握了足夠的資料，誰就有可能掌握未來，而其中的資料採集就是將來的流動資產積累。幾乎任何規模企業，每時每刻也都在產生大量的資料，但這些

使用flume+hive採集Web伺服器的access日誌

1、配置伺服器格式博主這裡用的是tomcat的combined預設格式，格式如下 127.0.0.1 - - [28/Mar/2017:09:23:10 +0800] "GET /manager/html HTTP/1.1" 401 2536 "-" "Mozilla

flume採集日誌，放到kafka中

實打實的程式碼，拷了就能用！！！！！！！！！！！！tier1.sources = HbaseAuditSources HbaseRunSources HdfsAuditSources HdfsRunSources HiveAuditSources HiveRunSource

Flume資料採集各種配置詳解

Flume簡介 Flume是Cloudera提供的一個高可用的，高可靠的，分散式的海量日誌採集、聚合和傳輸的系統，Flume支援在日誌系統中定製各類資料傳送方，用於收集資料；同時，Flume提供對資料進行簡單處理，並寫到各種資料接受方（可定製）的能力。系統功能

大資料技術應用(一) 應用Flume+HBase採集和儲存日誌資料

前言大資料時代，誰掌握了足夠的資料，誰就有可能掌握未來，而其中的資料採集就是將來的流動資產積累。幾乎任何規模企業，每時每刻也都在產生大量的資料，但這些資料如何歸集、提煉始終是一個困擾。而大資料技

Filebeat 關鍵字多行匹配日誌採集（multiline與include_lines）

很多同事認為filebeat採集日誌不能做到多行處理，今天這裡討論下filebeat的multiline與include_lines。先來個案例，以下日誌，我們只要求採集error的欄位，2017/06/22 11:26:30 [error] 26067#0: *17918

flume採集日誌到hdfs遇到採集一會不採集

環境4c 4G虛擬機器，上面部署應用業務，flume採集應用日誌，幾乎機器可用記憶體就幾十M,還有4Gswap交換記憶體，硬體環境就這樣，提好幾次新增記憶體，資源有限一直沒加。之前業務日誌小flume也可以正常採集日誌，但是最近公司flume經常假死，

TCP通訊中，BufferedWriter和PrintWriter用來實現輸出流的實現方式與區別

區別： 1. PrintWriter的print、println方法可以接受任意型別的引數，而BufferedWriter的write方法只能接受字元、字元陣列和字串； 2. PrintWriter的println方法自動新增換行，BufferedWrite

flume安裝配置-採集日誌到hadoop儲存

一、整體架構 flume其實就是一個日誌採集agent，在每臺應用伺服器安裝一個flume agent，然後事實採集日誌到HDFS叢集環境儲存，以便後續使用hive或者pig等大資料分析日誌，然後可轉存到mysql供運維查詢或分析使用者行為等。叢集規劃

簡單shell指令碼，與日誌重定向輸出

linux crontab定時任務： */5 * * * * flock -xn /tmp/kettle_job_sjgz_server.lock -c '/bin/bash /opt/pdi-ce-6.1.0.1-196/kettle_job_sjgz_server.s

二叉樹的建立與各種遍歷方式

#include<cstdlib> #include<string> #include<iostream> #include<cmath> #include<cstring> #include<algorit

android junit 單元測試與輸出日誌資訊檢視處理

專業Android Java 技術解答群嚴禁無關技術內容聊天一經發現立即清退單元測試 1.搭建專案測試環境在主檔案 AndroidMainfest.xml中的application標籤

這麼香的日誌動態級別與輸出，你確定不進來看看？——生產環境動態輸入日誌級別、檔案

本文是一個系列，歡迎關注更新本文全篇高能，請做好心理準備後再食用，讀完請記得點贊。前言上一篇我們討論了日誌的效能以及日誌的優缺點，有朋友說我沒有乾貨，痛定思痛，決定來一篇乾貨，讓小夥伴們見識一下員外真正的實力

使用PHP實現水仙花數及各種特殊有趣數的輸出

php 水仙花數特殊數據有趣算法尊敬的讀者，見文好。本文包含以下內容：1，為什麽要寫這篇文章！2，具體的方案及代碼實現！3，你可能遇到的問題！4，文末本文測試用源碼網盤地址！特殊說明：本文使用的語言是PHP;本文運行的環境是：Apache2.4, PHP5.6 。第一部分：為什麽要寫這篇文章！因為經常會

Flume各種採集日誌方式與輸出目錄

1、從網路埠採集資料輸出到控制檯

2、從網路端採集資料輸出到檔案

3、從本地目錄寫入到HDFS

4、Flume監控一個檔案實時寫到Kafka

相關推薦