1. 程式人生 > >Flume1.4 相關引數設定,將收集的資料彙總到hdfs,解決許多小檔案問題

Flume1.4 相關引數設定,將收集的資料彙總到hdfs,解決許多小檔案問題

參照官方文件,將 flume client 收集的日誌檔案 彙總到  flume sink收集端,然後儲存到hdfs 中,預設會按生成許多小檔案,如圖所示


實際中可能只需要生成一個檔案即可,這就涉及到了幾個相關引數設定如下即可

需要修改的檔案位於 flume/conf/ 下面,

agent.sinks.sink1.hdfs.round=true

agent.sinks.sink1.hdfs.roundValue=5

agent.sinks.sink1.hdfs.roundUnit=minute

agent.sinks.sink1.hdfs.rollInterval=30      

agent.sinks.sink1.hdfs.rollSize=0

agent.sinks.sink1.hdfs.rollCount=0

相關引數的具體含義可以參考 flume1.4 的 官方文件。

設定之後重新啟動flume叢集,即可


相關推薦

Flume1.4 相關引數設定收集資料彙總hdfs解決許多檔案問題

參照官方文件,將 flume client 收集的日誌檔案 彙總到  flume sink收集端,然後儲存到hdfs 中,預設會按生成許多小檔案,如圖所示 實際中可能只需要生成一個檔案即可,這就涉及到了幾個相關引數設定如下即可 需要修改的檔案位於 flume/con

輸入一個int型整數其逆序輸出每個數字後有一個空格。 n按其逆序輸出每個數字後有一個空格輸出佔一行。例如輸入12354輸出4 5 3 2 1

#include<stdio.h>#include<math.h> int main(){ int n,a; scanf("%d",&n); while(1) { if(n>=10)  {  a=n%10;  n=n/10;  print

Hadoop MapReduce Job 相關引數設定 概念介紹與理解

Hadoop MapReduce  Job 相關引數設定 概念介紹與理解 InputFormat: 作用:將輸入的檔案分成 一個個split,並且將split 拆分成一個個<key,value

opencv2-攝像頭獲取影象相關引數設定

Get和Set方法的引數如下 C++: boolVideoCapture::set(int propId, double value)和 double VideoCapture::get(intpro

後臺封裝復雜數據數據轉json傳前臺

utils start 效果 return color gen 復雜 show 技術 前臺需要的數據是 function showCurve(dee,daa) { $(‘#container‘).highcharts( { titl

前端動態載入(ajax介面連線後臺資料後臺資料返回到前端頁面)。

’ text +=’ ‘+result[0].projectCategory+’’ text +=’ ‘+result[0].projectCategory+’’ text +=’ ‘+result[0].projectCategory+’ ’ text +=’ ‘+result[0].project

在spring boot 專案中使用thymeleaf模板後臺資料傳遞給前臺介面。

1、將後臺資料傳遞給前臺有很多種方式,可以將後臺要傳遞的資料轉換成json格式,去傳遞給前臺,也可以通過model形式去傳遞出去,這篇部落格主要是使用thymeleaf模板,將後臺資料傳遞給前臺。 2、首先要在spring boot 專案中新增如下依賴:

在請求資料回來時字串序列化成物件頁面渲染思路

var vm = new Vue({ el: "#searchApp", data: { ly, search:{}, goodsList :[], total :0,

C語言陣列元素中的數字從大到排列

#include <stdio.h> void main() { int scores[] = {543, 323, 32, 554, 11, 3, 112}; int i; int j; int k; for(i=0;i<7;i++) {

通過C#輸入輸出重定向與OutputDataReceived cmd的執行程式隱藏到後臺執行

問題:   有個exe程式,執行後會顯示cmd介面,將需要輸入兩次"K"進行確認。才會全部執行完畢。現需要將其cmd介面及輸入過程全部隱藏到後臺執行。 解法:通過C#輸入輸出重定向,並在OutputDataReceived ()中實現輸入C的動作來實現,可詳見具體程式碼如下

配置sparksql讀hivedataframe和RDDRDD轉換成Dataframe檢視withcolumn

文章目錄 退出spark-shell 使用spark自帶檔案建立dataframe 退出安全模式 配置spark讀hive 1.pom檔案增加 2.resource下加檔案 3.修改h

發一波很6的程式碼 EntityUtils 陣列資料轉換為實體類

package cn.fht.carsys.component.util.common; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import java.lang.reflect.Construct

前端html自動撥打電話傳送簡訊號碼存到通訊錄安卓錯誤net::err unknown url scheme

一、一般的web處理 1、撥打電話 <a href="tel:10086">撥打10086</a> 2、傳送簡訊 <a href="sms:10086"&g

python 讀取資料夾下檔案檔名作為製作標籤訓練樣本

# -*- coding: utf-8 -*- import os import re path = "F:\\data\\test_Data" # 更改檔名 def Rename_file(path

輸入一字串其反著輸出如輸入abc則輸出cba。

程式碼實現: #include <iostream.h>#include <stdio.h>#include <string.h>int main(){ char buffer[32]; char str[32]; cout<<

面試題 編寫一個程式e:\project\java目錄下的所有.java檔案複製到 e:\project\jad目錄下原來檔案的副檔名從.java改為.jad。

public class Copy { public static void main(String[] args) throws IOException { String oldPath = "E:\\project\\java"; File file = n

利用Struts2框架後臺資料轉化為JSON資料並返回到前臺

1、第一步,配置web.xml,配置程式碼如下<?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee"

給定一個正整數n其分成m段每段為n1n2...nm求怎麼劃分使得n1*n2*...*nm最大

#include <iostream> #include <fstream> #include <math.h> using namespace std; #define SIZE 1000 unsigned long m[SIZE], t[SIZE]; //m

python爬取網站m3u8視訊ts解密成mp4合併成整體視訊

一些網站會提供m3u8視訊地址,以供下載觀看。或者一些網站經過分析後發現是使用m3u8格式進行播放的,這時使用m3u8的地址連結就可以下載到相應的視訊。一、關於m3u8:(https://blog.csdn.net/baidu_34418350/article/details