Filebeat 關鍵字多行匹配日誌采集（multiline與include_lines）

阿新 • • 發佈：2017-06-23

filebeat 關鍵字多行匹配日誌采集（multiline與include_lines）

很多同事認為filebeat采集日誌不能做到多行處理，今天這裏討論下filebeat的multiline與include_lines。

先來個案例，以下日誌，我們只要求采集error的字段，

2017/06/22 11:26:30 [error] 26067#0: *17918 connect() failed (111: Connection refused) while connecting to upstream, client: 192.168.32.17, server: localhost, request: "GET /wss/ HTTP/1.1", upstream: "http://192.168.12.106:8010/", host: "192.168.12.106"
2017/06/22 11:26:30 [info] 26067#0:
2017/06/22 12:05:10 [error] 26067#0: *17922 open() "/data/programs/nginx/html/ws" failed (2: No such file or directory), client: 192.168.32.17, server: localhost, request: "GET /ws HTTP/1.1", host: "192.168.12.106"

filebeat.yml文件配置如下：

filebeat.prospectors:
- input_type: log
  paths:
    - /tmp/test.log
  include_lines: [‘error‘]
output.kafka:
  enabled: true
  hosts: ["192.168.12.105:9092"]
  topic: logstash-errors-log

查看下kafka隊列

果然只有“error”關鍵字的日誌被采集了

{"@timestamp":"2017-06-23T08:57:25.227Z","beat":{"name":"192.168.12.106"},"input_type":"log","message":"2017/06/22 12:05:10 [error] 26067#0: *17922 open() /data/programs/nginx/html/ws failed (2: No such file or directory), client: 192.168.32.17, server: localhost, request: GET /ws HTTP/1.1, host: 192.168.12.106","offset":30926,"source":"/tmp/test.log","type":"log"}
{"@timestamp":"2017-06-23T08:57:32.228Z","beat":{"name":"192.168.12.106"},"input_type":"log","message":"2017/06/22 12:05:10 [error] 26067#0: *17922 open() /data/programs/nginx/html/ws failed (2: No such file or directory), client: 192.168.32.17, server: localhost, request: GET /ws HTTP/1.1, host: 192.168.12.106","offset":31342,"source":"/tmp/test.log","type":"log"}

再來多行案例：

[2016-05-25 12:39:04,744][DEBUG][action.bulk              ] [Set] [***][3] failed to execute bulk item (index) index {[***][***][***], source[{***}}
MapperParsingException[Field name [events.created] cannot contain ‘.‘]
    at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseProperties(ObjectMapper.java:273)
    at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseObjectOrDocumentTypeProperties(ObjectMapper.java:218)
    at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parse(ObjectMapper.java:193)
    at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseProperties(ObjectMapper.java:305)
    at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseObjectOrDocumentTypeProperties(ObjectMapper.java:218)
    at org.elasticsearch.index.mapper.object.RootObjectMapper$TypeParser.parse(RootObjectMapper.java:139)
    at org.elasticsearch.index.mapper.DocumentMapperParser.parse(DocumentMapperParser.java:118)
    at org.elasticsearch.index.mapper.DocumentMapperParser.parse(DocumentMapperParser.java:99)
    at org.elasticsearch.index.mapper.MapperService.parse(MapperService.java:498)
    at org.elasticsearch.cluster.metadata.MetaDataMappingService$PutMappingExecutor.applyRequest(MetaDataMappingService.java:257)
    at org.elasticsearch.cluster.metadata.MetaDataMappingService$PutMappingExecutor.execute(MetaDataMappingService.java:230)
    at org.elasticsearch.cluster.service.InternalClusterService.runTasksForExecutor(InternalClusterService.java:468)
    at org.elasticsearch.cluster.service.InternalClusterService$UpdateTask.run(InternalClusterService.java:772)
    at org.elasticsearch.common.util.concurrent.PrioritizedEsThreadPoolExecutor$TieBreakingPrioritizedRunnable.runAndClean(PrioritizedEsThreadPoolExecutor.java:231)
    at org.elasticsearch.common.util.concurrent.PrioritizedEsThreadPoolExecutor$TieBreakingPrioritizedRunnable.run(PrioritizedEsThreadPoolExecutor.java:194)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
    at java.lang.Thread.run(Thread.java:745)

filebeat.yml文件配置如下：

filebeat.prospectors:
- input_type: log
  paths:
    - /tmp/test.log
   multiline:
        pattern: ‘^\[‘
        negate:  true
        match:   after
  fields:
    beat.name: 192.168.12.106
  fields_under_root: true
output.kafka:
  enabled: true
  hosts: ["192.168.12.105:9092"]
  topic: logstash-errors-log

kafka隊列如下：

{"@timestamp":"2017-06-23T09:09:02.887Z","beat":{"name":"192.168.12.106"},"input_type":"log",
"message":"[2016-05-25 12:39:04,744][DEBUG][action.bulk              ] [Set] [***][3] failed to execute bulk item (index) index {[***][***][***], source[{***}}\n
MapperParsingException[Field name [events.created] cannot contain ‘.‘]\n    at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseProperties(ObjectMapper.java:273)\n    
at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseObjectOrDocumentTypeProperties(ObjectMapper.java:218)\n    
at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parse(ObjectMapper.java:193)\n    
at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseProperties(ObjectMapper.java:305)\n    
at org.elasticsearch.index.mapper.object.ObjectMapper$TypeParser.parseObjectOrDocumentTypeProperties(ObjectMapper.java:218)\n    
at org.elasticsearch.index.mapper.object.RootObjectMapper$TypeParser.parse(RootObjectMapper.java:139)\n    
at org.elasticsearch.index.mapper.DocumentMapperParser.parse(DocumentMapperParser.java:118)\n    
at org.elasticsearch.index.mapper.DocumentMapperParser.parse(DocumentMapperParser.java:99)\n    
at org.elasticsearch.index.mapper.MapperService.parse(MapperService.java:498)\n    
at org.elasticsearch.cluster.metadata.MetaDataMappingService$PutMappingExecutor.applyRequest(MetaDataMappingService.java:257)\n    
at org.elasticsearch.cluster.metadata.MetaDataMappingService$PutMappingExecutor.execute(MetaDataMappingService.java:230)\n   
at org.elasticsearch.cluster.service.InternalClusterService.runTasksForExecutor(InternalClusterService.java:468)\n    
at org.elasticsearch.cluster.service.InternalClusterService$UpdateTask.run(InternalClusterService.java:772)\n    
at org.elasticsearch.common.util.concurrent.PrioritizedEsThreadPoolExecutor$TieBreakingPrioritizedRunnable.runAndClean(PrioritizedEsThreadPoolExecutor.java:231)\n    
at org.elasticsearch.common.util.concurrent.PrioritizedEsThreadPoolExecutor$TieBreakingPrioritizedRunnable.run(PrioritizedEsThreadPoolExecutor.java:194)\n   
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)\n    
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)\n    
at java.lang.Thread.run(Thread.java:745)\n\n\n\n","offset":35737,"source":"/tmp/test.log","type":"log"}

可以看出multiline將多行日誌匯總。

multiline與include_lines，結合使用。

filebeat.yml文件配置如下：

filebeat.prospectors:
- input_type: log
  paths:
    - /tmp/test.log
  include_lines: [‘error‘]
  multiline:
        pattern: ‘^\[‘
        negate:  true
        match:   after
output.kafka:
  enabled: true
  hosts: ["192.168.12.105:9092"]
  topic: logstash-errors-log

即日誌中如果有"error"關鍵字的日誌，進行多行合並，發送至kafka.

經驗證，在日誌不斷輸入的情況，會把不含"error"的行也進行合並，日誌有間隔的情況輸入，過濾效果比較好，具體結合業務情況實用吧。

總之一句話，filebeat可以多行合並和進行關鍵字日誌采集。

本文出自 “xiangcun168” 博客，請務必保留此出處http://xiangcun168.blog.51cto.com/4788340/1941401

Filebeat 關鍵字多行匹配日誌采集（multiline與include_lines）

filebeat 關鍵字多行匹配日誌采集（multiline與include_lines）很多同事認為filebeat采集日誌不能做到多行處理，今天這裏討論下filebeat的multiline與include_lines。先來個案例，以下日誌，我們只要求采集error的字段，2017/06/22 11:2

Filebeat 關鍵字多行匹配日誌採集（multiline與include_lines）

很多同事認為filebeat採集日誌不能做到多行處理，今天這裡討論下filebeat的multiline與include_lines。先來個案例，以下日誌，我們只要求採集error的欄位，2017/06/22 11:26:30 [error] 26067#0: *17918

Filebeat+Kafka+Logstash+ElasticSearch+Kibana 日誌采集方案

其他 ref 使用上下 htm true bat 目前輕量級前言　　　　Elastic Stack 提供 Beats 和 Logstash 套件來采集任何來源、任何格式的數據。其實Beats 和 Logstash的功能差不多，都能夠與 Elasticsearch 產

css多行超出部分用...代替（span、div）

css樣式 /*超出指定行*/ overflow:hidden; text-overflow:ellipsis; display: -webkit-box; -webkit-line-clamp:2; -webkit-box-orient

Net分布式系統之七：日誌采集系統（1）

高並發 log4 並發自動化發送高可用性微信預警 div 　　日誌對大型應用系統或者平臺尤其重要，系統日誌采集、分析是系統運維、維護及用戶分析的基礎。一、系統日誌分類　　一般系統日誌可分為三大類：　　1、用戶行為日誌：通過采集系統用戶使用系統過程中，一

Net分布式系統之七：日誌采集系統（1）(轉)

常見數據抽取 htm elastics nbsp 調用 res 化運維分布式系統 http://www.cnblogs.com/Andon_liu/p/7508107.html 日誌對大型應用系統或者平臺尤其重要，系統日誌采集、分析是系統運維、維護及用戶分析的基礎。

日誌采集框架Flume

transacti 單元 table 需求解壓數據傳輸取數據 event 事件概述 Flume是一個分布式、可靠、和高可用的海量日誌采集、聚合和傳輸的系統。 Flume可以采集文件，socket數據包等各種形式源數據，又可以將采集到的數據輸出到HDFS、hb

關於html的多行匹配，正則re.S的使用（爬取豆瓣電影短評）

htm detail 3.1 port encoding 關於 color tel frame 參考鏈接：http://www.python(tab).com/html/2017/pythonhexinbiancheng_0904/1170.html(去除括號) 　　　　

Hadoop-Flume日誌采集系統

各類 events exec 外部 lec deb sources 高可用性通信 Flume是Cloudera提供的日誌收集系統，具有分布式、高可靠、高可用性等特點，對海量日誌采集、聚合和傳輸，Flume支持在日誌系統中制定各類數據發送，同時，Flume提供對數據進行簡單

Flume+Kafka+Zookeeper搭建大數據日誌采集框架

flume+kafka+zookeeper1. JDK的安裝參考jdk的安裝，此處略。2. 安裝Zookeeper 參考我的Zookeeper安裝教程中的“完全分布式”部分。3. 安裝Kafka 參考我的Kafka安裝教程中的“完全分布式搭建”部分。4. 安裝Flume 參考

nxlog 日誌采集

products 接口 pat 環境 epo style linu art fin 主要用於各業務後端服務的日誌采集，windows環境和linux環境都支持。 rpm -ivh http://nxlog.co/system/files/products/files/1/n

Python: 正則表達式匹配多行，實現多行匹配模式

post 表達式包括實現 body 表達捕獲 blog class 1) 點（.）去匹配任意字符的時候，不能匹配換行符在這個模式中(?:.|\n)是指定了一個非捕獲組（僅僅用來做匹配，部能通過單獨捕獲或者編號的組） 2) re.DOTALL 　　re

《基於插件的日誌采集技術實踐》幻燈片下載

日誌插件OSSIM長期以來，大家在收集華為交換機日誌是往往通過syslog協議轉發的方式，將華為＆思科交換機日誌轉發到日誌收集器上，簡單存儲，但這樣並沒有將日誌標準化，也就是OSSIM中對日誌的歸一化處理，本課程對這種過程進行了詳細分析。 PDF下載地址：　http://down.51cto.com/3509

2018年ElasticSearch6.2.2教程ELK搭建日誌采集分析系統（目錄）

1.2 安裝包接口語句參數配置介紹 ofo 計劃裝包章節一 2018年 ELK課程計劃和效果演示 1、課程安排和效果演示簡介：課程介紹和主要知識點說明，ES搜索接口演示，部署的ELK項目演示章節二 elasticSearch 6.2版本基礎講

2018年ElasticSearch6.2.2教程ELK搭建日誌采集分析系統（教程詳情）

domain 服務器日誌環境解決對比修改 tst 阿裏雲服務們的章節一 2018年 ELK課程計劃和效果演示1、課程安排和效果演示簡介：課程介紹和主要知識點說明，ES搜索接口演示，部署的ELK項目演示es: localhost:9200kibana http:

如何用istio實現監控和日誌采集

bec warning alt ply 0ms ima .cn 發送 times 大家都知道istio可以幫助我們實現灰度發布、流量監控、流量治理等一些功能。每一個功能都幫助我們在不同場景中實現不同的業務。那我們Istio是如何幫助我們實現監控和日誌采集的呢？這裏我們依然以

使用Logstash multiline 收集PHP、tomcat等應用服務多行堆疊日誌

很多時候應用程式出錯是都是丟擲一堆堆疊資訊（即在日誌檔案輸出多行），此時logstash可以使用multiline的外掛收集日誌時需要把錯誤堆疊資訊收集為一個記錄。multiline字面意思是多行,顧名思義就是對多行日誌進行處理。 multiline配置與用法 i

大數據日誌采集系統

通過 ket 進入 src post elastic image alt lec ELK提供了一系列采集方案。但對於從app端過來的日誌，沒有接收模塊。一種方案可以用logstash打開socket端口接收，需要客戶端配合。這裏提供通過http的方案。接收服務器采用spri

C# 正則表示式多行匹配的問題

需要匹配的項：columns[0][data]:S61BHcolumns[1][data]:S61MC在The Regulator中，可以正常匹配到資料^columns\[(?<colIndex>\d+)\]\[data\]:(?<colName>\S

idou老師教你學Istio 25：如何用istio實現監控和日誌采集

設置時間信息 Kubernete 標準每一個搜索 warning 打印日誌度量標準大家都知道istio可以幫助我們實現灰度發布、流量監控、流量治理等功能。每一個功能都幫助我們在不同場景中實現不同的業務。那Istio是如何幫助我們實現監控和日誌采集的呢？這裏我們依

Filebeat 關鍵字多行匹配日誌采集（multiline與include_lines）

相關推薦