Flume的SpoolDirSource優化，自定義Deserializer

阿新 • • 發佈：2018-11-27

SpoolDirSource採集資料預設是按行採集的，在官網的配置中有LINE和AVRO兩種配置。AVRO尚未了解

在採集單行資料量少的日誌檔案時，使用Line採集慢

檢視原始碼後發現實現原理非常簡單

直接 copy了LineDeserializer的程式碼將主要邏輯改為如下

private String readLine() throws IOException {
StringBuilder sb = new StringBuilder();
int c;
int readChars = 0;
while ((c = in.readChar()) != -1) {
readChars++;

sb.append((char)c);

if (readChars >= maxCharLength) {
break;
}
}

if (readChars > 0) {
return sb.toString();
} else {
return null;
}
}

設定每次讀取的最大長度maxCharLength=10*1024，這樣我的event每次都是10k,而不是按行讀取。這樣採集速度得到了較大提升。

Flume的SpoolDirSource優化，自定義Deserializer

SpoolDirSource採集資料預設是按行採集的，在官網的配置中有LINE和AVRO兩種配置。AVRO尚未了解在採集單行資料量少的日誌檔案時，使用Line採集慢檢視原始碼後發現實現原理非常簡單直接 copy了LineDeserializer的程式碼將

pytorch中的L2和L1正則化，自定義優化器設定等操作

在pytorch中進行L2正則化，最直接的方式可以直接用優化器自帶的weight_decay選項指定權值衰減率，相當於L2正則化中的λλ，也就是： Lreg=||y−y^||2+λ||W||2(1)(

jQuery基礎（鼠標事件，表單事件，鍵盤事件，自定義事件篇）

1.7 傳遞 ret 文本 leave 右鍵 page content gree 1.jQuery鼠標事件之click與dbclick事件方法一：$ele.click()（不帶參數） <div id="test">點擊觸發<div> $(

jQuery基礎（常用插件表單驗證，圖片放大鏡，自定義對象級，jQuery UI，面板折疊）

此外 cookie值添加圖標 tor 列表需要 droppable 使用 ddn 1.表單驗證插件——validate 該插件自帶包含必填、數字、URL在內容的驗證規則，即時顯示異常信息，此外，還允許自定義驗證規則，插件調用方法如下： $(form).vali

[php]微信測試號調取acces_token，自定義菜單以及被動響應消息

個人中心 res keyword environ 變量 pri exist ron 數據 1 <?php 2 /**自己寫的　　*/ 3 $wechatObj = new wechatCallbackapiTest(); 4 $wechatObj-&

iOS 根據字符串數目，自定義Label等控件的高度

rect 復制代碼設置高度 uifont ios oat size hsi 利用分類，NSString，增加一個方法。 #import <Foundation/Foundation.h> #import <UIKit/UIKit.h> @

XAF 框架中，自定義參數動作（Action），輸入參數的控件可定義，用於選擇組織及項目

示例 app frame tro href express documents 定義 ron XAF 框架中，如何生成一個自定義參數動作（Action），輸入參數的控件可定義？參考文檔：https://documentation.devexpress.com/eXpres

c++primer，自定義一個復數類

opera 指針隨著 per call 拷貝構造函數會銷局部變量 eal 1 #include<iostream> 2 #include<string> 3 #include<vector> 4 #include<a

C# 更新控件四部曲，自定義的用戶控件無法更新怎麽辦

添加項備份如果重新目的新的用戶 c# 用戶控件用戶控件如果在其他的項目被引用，希望更新控件後，所引用的項目同步更新效果，一開始難免失敗，特別是更換了控件所在的文件夾。這個時候，四部曲來解決控件的更新。 1.運行一下控件的項目，使控件生成一下。 2.在要引用的

18)django-模板的過濾器和tag，自定義simple_tag和filter

hello 直接結果 from simple 使用 span 裝飾 san 模板過濾器是在變量被顯示前修改它的值的一個簡單方法。過濾器使用管道字符 . 模板標簽(template tag) 。標簽(tag)定義比較明確，即：僅通知模板系統完成某些工作的標簽。一：d

哈希表，隊列集合，棧集合，自定義函數

哈希 var 定義函數 each val ret htable 值類型 turn 1 1）哈希表定義：（不規定長度，不規定類型，不規定鍵的類型） Hashtable ht=new hashtable(); (點擊

django 的模板語言template ，自定義過濾器，自定義標簽，模板繼承

test block src view -- back def 其他 init 後端views文件傳來的字符串和對象，到前端頁面後需要進行渲染， {{ 變量 }}{{ 變量| filter:參數 }}filter可以有很多函數 {#對後端傳來的數據進行渲染，add 就是過濾

源碼包安裝和快捷的管理nginx，自定義命令管理服務

定義開啟服務的函數編寫一個啟動腳本管理軟件源碼包安裝與管理服務函數安裝線上的生產服務器軟件包時大多會用源碼安裝，這是因為源碼安裝可以選擇最新的軟件包，而Linux系統自帶的軟件包一般都是最穩定的版本，但不能保證是最新的。源碼安裝還可以自行調整編譯參數，最大化地定制安裝結果。相對而言，源

IntelliJ IDEA如何設置頭註釋，自定義author和date

技術分享 spa 分享圖片 es2017 log tel auth bsp image 下面這張圖，保證你一看就會：下面這個模板，你拿去改一改就行了。 1 /** 2 * @Author: Gosin 3 * @Date: ${DATE} ${TIME} 4 */

css自定義滾動條樣式，自定義文字選擇樣式，設置文字不被選擇

sed 分享 play gpo radi https cal hid 右移 ::-webkit-scrollbar 滾動條整體部分 ::-webkit-scrollbar-thumb 滾動條裏面的小方塊，能向上向下移動（或往左往右移動，取決於是垂直滾動條還是水平滾動條）

模仿CyclicBarrier，自定義自己屏障類

on() exc urn oid lee rand () pri rup 簡介在這裏模仿CyclicBarrier,自定義一個自己多線程屏障類，裏面有個計時器count，count為0時，才喚醒線程，否則就await掛起，（沒錯就是用的object類的掛起和喚醒全部線程方

微信開發——測試號申請，接口配置，JS接口安全域名，自定義菜單

acc contents term 集中 from 調試工具 AR 賬號下載 1、申請測試賬號：先申請公眾號後，點擊進入公從號的管理頁面；找到“開發者工具”，找到“公眾平臺測試賬號”，點擊“進入”。 2、接口配置信息設置必須要外網哦，也就是微信服務器要能

ueditor 編輯器，自定義圖片上傳

action () scree val ech idt tof height 使用 <div> <h1>完整demo</h1> <form method="post" name="form">

ASP.Net Core 返回的json數據，自定義日期格式

AR 定義序列 lec www configure 所有序列化都在 //代碼位置：Startup.cs public void ConfigureServices(IServiceCollection services) { services.AddMvc(

Gradle實現自動打包，簽名，自定義apk文件名

回車應用 types 背包 sdn 部署密鑰對另一個密鑰庫 Gradle實現自動打包，簽名，自定義apk文件名什麽是簽名，簽名有什麽用 Android APP都需要我們用一個證書對應用進行數字簽名，不然的話是無法安裝到Android手機上的，平時我們調試運行時到手

Flume的SpoolDirSource優化，自定義Deserializer

相關推薦