Filebeat如何保證在日誌檔案被切割(或滾動rolling)時依然正確讀取檔案

阿新 • • 發佈：2019-02-01

我們的日誌收集系統使用Filebeat來收集日誌檔案，部署時並沒有多想，只配置了一下監控的日誌檔名。上線幾個月，日誌監控從沒出過問題。後來想想其實這裡面有很多點需要考慮的，沒出問題真是感謝Filebeat預設配置下想的就很周全。

業務系統使用logback作為日誌框架。通過檢視原始碼，發現logback日誌切割用的是JDK裡File#renameTo()方法。如果該方法失敗，就再嘗試使用複製資料的方式切割日誌。查詢該方法相關資料得知，只有當原始檔和目標目錄處於同一個檔案系統、同volumn(即windows下的C, D盤)下該方法才會成功，切不會為重新命名的後的檔案分配新的inode值。也就是說，如果程式裡一直儲存著該檔案的描述符，那麼當程式再寫日誌時，就會向重新命名後的檔案中寫。那麼問題來了，filebeat是會一直開啟並儲存檔案描述符的，那麼它是怎麼得知日誌被切割這件事的呢？

如果只用當前檔案描述符一路監控到天黑的話，那麼當logback把日誌重新命名後，filebeat仍然會監控重新命名後的日誌，新建立的日誌檔案就看不到了。實際上，filebeat是通過close_inactive和scan_frequency兩個引數(機制)來應對這種情況的：

close_inactive
該引數指定當被監控的檔案多長時間沒有變化後就關閉檔案控制代碼(file handle)。官方建議將這個引數設定為一個比檔案最大更新間隔大的值。比如檔案最長5s更新一次，那就設定成1min。預設值為5min.
scan_frequency
該引數指定Filebeat搜尋新檔案的頻率(時間間隔)。當發現新的檔案被建立時， Filebeat會為它再啟動一個 harvester 進行監控。預設為10s。

綜合以上兩個機制，當logback完成日誌切割後(即重新命名)，此時老的harvester仍然在監控重新命名後的日誌檔案，但是由於該檔案不會再更新，因此會在close_inactive時間後關閉這個檔案的 harvester。當scan_frequency時間過後，Filebeat會發現目錄中出現了新檔案，於是為該檔案啟動 harvester 進行監控。這樣就保證了切割日誌時也能不丟不重的傳輸資料。(不重是通過為每個日誌檔案儲存offset實現的)

Filebeat如何保證在日誌檔案被切割(或滾動rolling)時依然正確讀取檔案

Filebeat如何保證在日誌檔案被切割(或滾動rolling)時依然正確讀取檔案

Android 開發之Service 探索如何保證Service不被殺死或被kill之後自動重啟

ubuntu 掛載硬碟時，只能讀取檔案，不能寫入的解決辦法

訪問日誌不記錄靜態檔案、切割和靜態元素過期時間

ubuntu桌面被刪除或home檔案跑到桌面問題

C# 刪除或修改檔案時提示檔案被佔用

修復被木馬或病毒隱藏的檔案

Java 檔案刪除失敗或檔案被佔用總結

C# Aspose.Cells匯出xlsx格式Excel，開啟檔案報“Excel 已完成檔案級驗證和修復。此工作簿的某些部分可能已被修復或丟棄”

父級overflow為scroll時，絕對定位的子元素會被隱藏或一起滾動

如何防止標頭檔案被重複包含或引用?

開啟會影X3提示錯誤:38-Corel VideoStudio檔案已損壞或被修改,請重新安裝原始來源

C# 影象居中縮放（自動裁剪保證影象不被壓扁或變長）

log4j日誌輸出分級別或模組到不同檔案

42.訪問日誌不記錄靜態檔案及切割靜態元素過期時間

centos 7如何因對日誌風暴和保證日誌及時落盤

EntityFrameWork使用TransactionScope分布式事務，存儲區更新、插入或刪除語句影響到了意外的行數(0)。實體在加載後可能被修改或刪除。刷新 ObjectStateManager 項錯誤

保證Service不被Kill的解決方案

asp.net NPOI導出xlsx格式文件，打開文件報“Excel 已完成文件級驗證和修復。此工作簿的某些部分可能已被修復或丟棄”

Windows搭建Log4Net+FileBeat+ELK日誌分析系統過程以及問題總結

Filebeat如何保證在日誌檔案被切割(或滾動rolling)時依然正確讀取檔案

相關推薦