1. 程式人生 > >理解flume hdfs sink round 和roll

理解flume hdfs sink round 和roll

我們在配置flume hdfs sink 的時候注意這兩個配置項,比如: collector1.sinks.sink_hdfs.hdfs.rollSize = 2048000000 
collector1.sinks.sink_hdfs.hdfs.rollCount = 0 
collector1.sinks.sink_hdfs.hdfs.rollInterval = 21600
collector1.sinks.sink_hdfs.hdfs.round = true 
collector1.sinks.sink_hdfs.hdfs.roundValue = 6 collector1.sinks.sink_hdfs.hdfs.roundUnit = hour rollsize的配置表示到2G大小的時候回滾到下一個檔案,也就是到了這個時間 hdfs就會rename正在寫的檔案到已經寫完。日誌是這樣的:
Renaming hdfs://192.168.2.231:8020/staging/xxx/app.news.test/dt=2015-10-20/events.20151020152500.1445326173233.log.tmp to hdfs://192.168.2.231:8020/staging/xxx/app.news.test/dt=2015-10-20/events.20151020152500.1445326173233.log rollInterval的配置表示每個6小時回滾到下一個檔案,但是round的理解是,每6小時產生一個新檔案,比如把24小時分成4份,假設現在的時間是15:40,如果這時候有新的日誌到來,那麼hdfs 會建立一個新的hdfs檔案,檔名稱是
2015102012,就是15:40 是分佈在12-18這個區間的,flume 日誌: Creating hdfs://nameservice1/staging/xxx/app.news.test/dt=2015-10-20/events.20151020120000.1445326460544.log.tmp。

相關推薦

理解flume hdfs sink round roll

我們在配置flume hdfs sink 的時候注意這兩個配置項,比如: collector1.sinks.sink_hdfs.hdfs.rollSize = 2048000000  collector1.sinks.sink_hdfs.hdfs.rollCount = 0

Flume + HDFS Sink採集資料及如何新增第三方JAR

Flume預設情況下是沒有引入HDFS,Kafka,Elasticsearch,Hbase等sink的相關jar包,如果使用,需要自行新增相關jar包。 下面我以使用HDFS Sink為例,在Flume中加入第三方JAR包。 Flume支援一種特殊的目錄結構:plugins

Flume HDFS Sink使用及原始碼分析

HDFS Sink介紹 Flume匯入資料HDFS,目前只支援建立序列化(sequence)檔案和文字(text)檔案。還支援這兩個檔案的壓縮。檔案可以根據執行的時間,資料的大小和時間的數量來進行週期性的滾動(關閉當前檔案產生新的檔案)。也可以根據資料屬性分割槽,例如根據時

Hadoop實戰-FlumeHdfs Sink(十)

pac esc path ref times buffers ogg events nts a1.sources = r1 a1.sinks = k1 a1.channels = c1 # Describe/configure the source a1.sources

FlumeHDFS sink學習

前言:HDFS sink原生的解析時間戳的程式碼效能不高,可以通過修改原始碼提升效能。具體操作參考連結:http://www.cnblogs.com/lxf20061900/p/4014281.html HDFS sink常用配置項: type –

Flume 原始碼解析:HDFS Sink

Apache Flume 資料流程的最後一部分是 Sink,它會將上游抽取並轉換好的資料輸送到外部儲存中去,如本地檔案、HDFS、ElasticSearch 等。本文將通過分析原始碼來展現 HDFS Sink 的工作流程。 Sink 元件的生命週期 在上一篇文章

理解HDFS的架構原理

(一) HDFS主要是用於做什麼的?  HDFS(Hadoop Distributed File System)是Hadoop專案的核心子專案,是分散式計算中資料儲存管理的基礎,是基於流資料模式訪問和處理超大檔案的需求而開發的,可以運行於廉價的商用伺服器上。它所具有的高

Flume(ng) 自定義sink實現屬性注入

最近需要利用flume來做收集遠端日誌,所以學習一些flume最基本的用法。這裡僅作記錄。 遠端日誌收集的整體思路是遠端自定義實現log4j的appender把訊息傳送到flume端,flume端自定義實現一個sink來按照我們的規則儲存日誌。

Flume】【原始碼分析】flumesinkhdfs,檔案系統頻繁產生檔案,檔案滾動配置不起作用?

本人在測試hdfs的sink,發現sink端的檔案滾動配置項起不到任何作用,配置如下: a1.sinks.k1.type=hdfs a1.sinks.k1.channel=c1 a1.sinks.k1.hdfs.useLocalTimeStamp=true a1.sink

flume自定義interceptorhbase sink

      在flume的實際應用中,可能會遇到對日誌進行簡單的過濾和處理。flume在source端有其內建的interceptor類可以對主機、IP、靜態標記做處理,如果想自定義處理邏輯該如何處理?在不規則的日誌資料進入hbase之前想做處理又該如何處理? 1.自定義

Flume中的HDFS Sink配置引數說明

關鍵字:flume、hdfs、sink、配置引數 轉自:http://lxw1234.com/archives/2015/10/527.htm Flume中的HDFS Sink應該是非常常用的,其中的配置引數也比較多,在這裡記錄備忘一下。 channeltype hd

Flumehdfs sink配置引數詳解

type hdfs path 寫入hdfs的路徑,需要包含檔案系統標識,比如:hdfs://namenode/flume/webdata/ 可以使用flume提供的日期及%{host}表示式。 filePrefix 預設值:

flume使用hdfs sink時需要注意的幾點

最近接觸了flume,這個日誌收集器在擴充套件性方面確實很便捷,相信這與其架構的設計有密切的關係。書歸正傳,這次用到了hdfs sink在使用時還是有幾點需要注意的,在此和大家分享一下。 第一部分windows下搭建單機的hdfs 如果你和我一樣沒有linux的測試環境,想在windows搭建hdfs,可

理解什麽是類對象

bsp switch 操作 方法名 屬性 創建 sca eclips void 一、理解什麽是類和對象 萬事萬物皆對象 1、屬性——對象具有的特征(特點) 2、方法——對象可執行的操作(能幹什麽事) 3、對象的定義: 是一個客觀存在的,看的見或摸得著的實體,由屬性和方法構成

理解angular中的moduleinjector,即依賴註入

特性 onf nco evel 容器 意義 log 需要 ica 依賴註入(DI)的好處不再贅言,使用過spring框架的都知道。angularjs作為前臺js框架,也提供了對DI的支持,這是javascript/jquery不具備的特性。angularjs中與DI相關有a

特重要又特難理解應用的——數組集合

視頻 數組 集合 問題 練習作業 if語句 分析 學習 這一 這一章的學習,在視頻學習中,感覺已經快懵了,可以說是懵懂,知識點太多,應用繁雜,再結合上章尚未完全消化的if語句和循環利用,考驗自己對於問題的邏輯思維能力。這一章的練習作業多,有一定的復雜程度,還未做

深入理解SVG坐標體系transformations- viewport, viewBox,preserveAspectRatio

less orm 高度 第一篇 元素 pixel 特點 mat coo 本文翻譯自blog: https://www.sarasoueidan.com/blog/svg-coordinate-systems/ SVG元素不像其他HTML元素一樣受css盒子模型所制約。這個特

鏈接:深入理解javascript構造函數原型對象

原型對象 函數 href 深入理解java asc 構造 rip spa tar 鏈接:深入理解javascript構造函數和原型對象http://www.jb51.net/article/55539.htm 鏈接:深入理解javascript構造函數和原型對象

(轉載)深入理解java的接口抽象類

final類 轉載 如何實現 靜態 參考 種類型 tar 發現 是否 本文轉自地址:http://www.cnblogs.com/dolphin0520/p/3811437.html 作者:海子 出處:http://www.cnblogs.com/dolphin0520/

如何理解Swift中Optional的!?

很多人在剛上手swift時對於Optional中 ‘!’ 和 ‘?’ 的使用十分不理解,接下來我會談一談自己對於這兩個符號的使用方式的理解。 先來說說Optional的概念,以方便之後的理解。來看一下下面的代碼: ``` var a : String = nil