詳解SpringBoot+Dubbo整合ELK實戰

阿新 • • 發佈：2020-01-07

前言

一直以來，日誌始終伴隨著我們的開發和運維過程。當系統出現了Bug，往往就是通過Xshell連線到伺服器，定位到日誌檔案，一點點排查問題來源。

隨著網際網路的快速發展，我們的系統越來越龐大。依賴肉眼分析日誌檔案來排查問題的方式漸漸凸顯出一些問題：

分散式叢集環境下，伺服器數量可能達到成百上千，如何準確定位？
微服務架構中，如何根據異常資訊，定位其他各服務的上下文資訊？
隨著日誌檔案的不斷增大，可能面臨在伺服器上不能直接開啟的尷尬。
文字搜尋太慢、無法多維度查詢等

面臨這些問題，我們需要集中化的日誌管理，將所有伺服器節點上的日誌統一收集，管理，訪問。

而今天，我們的手段的就是使用 Elastic Stack

來解決它們。

一、什麼是Elastic Stack ？

或許有人對Elastic感覺有一點點陌生，它的前生正是ELK ，Elastic Stack 是ELK Stack的更新換代產品。

Elastic Stack分別對應了四個開源專案。

Beats

Beats 平臺集合了多種單一用途資料採集器，它負責採集各種型別的資料。比如檔案、系統監控、Windows事件日誌等。

Logstash

Logstash 是伺服器端資料處理管道，能夠同時從多個來源採集資料，轉換資料。沒錯，它既可以採集資料，也可以轉換資料。採集到了非結構化的資料，通過過濾器把他格式化成友好的型別。

Elasticsearch

Elasticsearch 是一個基於 JSON 的分散式搜尋和分析引擎。作為 Elastic Stack 的核心，它負責集中儲存資料。我們上面利用Beats採集資料，通過Logstash轉換之後，就可以儲存到Elasticsearch。

Kibana

最後，就可以通過 Kibana，對自己的 Elasticsearch 中的資料進行視覺化。

本文的例項是通過 SpringBoot+Dubbo 的微服務架構，結合 Elastic Stack 來整合日誌的。架構如下：

注意，閱讀本文需要了解ELK元件的基本概念和安裝。本文不涉及安裝和基本配置過程，重點是如何與專案整合，達成上面的需求。

二、採集、轉換

1、FileBeat

在SpringBoot專案中，我們首先配置Logback，確定日誌檔案的位置。

<appender name="FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
	<file>${user.dir}/logs/order.log</file>
	<rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
	 <fileNamePattern>${user.dir}/logs/order.%d{yyyy-MM-dd}.log</fileNamePattern>
	 <maxHistory>7</maxHistory>
	</rollingPolicy>
	<encoder>
	 <pattern></pattern>
	</encoder>
</appender>

Filebeat 提供了一種輕量型方法，用於轉發和彙總日誌與檔案。

所以，我們需要告訴 FileBeat 日誌檔案的位置、以及向何處轉發內容。

如下所示，我們配置了 FileBeat 讀取 usr/local/logs 路徑下的所有日誌檔案。

- type: log
 # Change to true to enable this input configuration.
 enabled: true
 # Paths that should be crawled and fetched. Glob based paths.
 paths:
 - /usr/local/logs/*.log

然後，告訴 FileBeat 將採集到的資料轉發到 Logstash 。

#----------------------------- Logstash output --------------------------------
output.logstash:
 # The Logstash hosts
 hosts: ["192.168.159.128:5044"]

另外， FileBeat 採集檔案資料時，是一行一行進行讀取的。但是 FileBeat 收集的檔案可能包含跨越多行文字的訊息。

例如，在開源框架中有意的換行：

2019-10-29 20:36:04.427 INFO org.apache.dubbo.spring.boot.context.event.WelcomeLogoApplicationListener 
 :: Dubbo Spring Boot (v2.7.1) : https://github.com/apache/incubator-dubbo-spring-boot-project
 :: Dubbo (v2.7.1) : https://github.com/apache/incubator-dubbo
 :: Discuss group : [email protected]

或者Java異常堆疊資訊：

2019-10-29 21:30:59.849 INFO com.viewscenes.order.controller.OrderController http-nio-8011-exec-2 開始獲取陣列內容...
java.lang.IndexOutOfBoundsException: Index: 3,Size: 0
	at java.util.ArrayList.rangeCheck(ArrayList.java:657)
	at java.util.ArrayList.get(ArrayList.java:433)

所以，我們還需要配置 multiline ，以指定哪些行是單個事件的一部分。

multiline.pattern 指定要匹配的正則表示式模式。

multiline.negate 定義是否為否定模式。

multiline.match 如何將匹配的行組合到事件中，設定為after或before。

聽起來可能比較饒口，我們來看一組配置：

# The regexp Pattern that has to be matched. The example pattern matches all lines starting with [
multiline.pattern: '^\<|^[[:space:]]|^[[:space:]]+(at|\.{3})\b|^java.'

# Defines if the pattern set under pattern should be negated or not. Default is false.
multiline.negate: false

# Match can be set to "after" or "before". It is used to define if lines should be append to a pattern
# that was (not) matched before or after or as long as a pattern is not matched based on negate.
# Note: After is the equivalent to previous and before is the equivalent to to next in Logstash
multiline.match: after

上面配置檔案說的是，如果文字內容是以 < 或空格或空格+at+包路徑或 java. 開頭，那麼就將此行內容當做上一行的後續，而不是當做新的行。

就上面的Java異常堆疊資訊就符合這個正則。所以， FileBeat 會將

java.lang.IndexOutOfBoundsException: Index: 3,Size: 0
	at java.util.ArrayList.rangeCheck(ArrayList.java:657)
	at java.util.ArrayList.get(ArrayList.java:433)

這些內容當做 開始獲取陣列內容... 的一部分。

2、Logstash

在 Logback 中，我們列印日誌的時候，一般會帶上日誌等級、執行類路徑、執行緒名稱等資訊。

有一個重要的資訊是，我們在 ELK 檢視日誌的時候，是否希望將以上條件單獨拿出來做統計或者精確查詢？

如果是，那麼就需要用到 Logstash 過濾器，它能夠解析各個事件，識別已命名的欄位以構建結構，並將它們轉換成通用格式。

那麼，這時候就要先看我們在專案中，配置了日誌以何種格式輸出。

比如，我們最熟悉的JSON格式。先來看 Logback 配置：

<pattern>
 {"log_time":"%d{yyyy-MM-dd HH:mm:ss.SSS}","level":"%level","logger":"%logger","thread":"%thread","msg":"%m"}
</pattern>

沒錯， Logstash 過濾器中正好也有一個JSON解析外掛。我們可以這樣配置它：

input{ 
 stdin{}
}
filter{
 json {
 source => "message"
 }
}
output {
 stdout {}
}

這麼一段配置就是說利用JSON解析器格式化資料。我們輸入這樣一行內容：

{
 "log_time":"2019-10-29 21:45:12.821","level":"INFO","logger":"com.viewscenes.order.controller.OrderController","thread":"http-nio-8011-exec-1","msg":"接收到訂單資料."
}

Logstash 將會返回格式化後的內容：

但是JSON解析器並不太適用，因為我們列印的日誌中msg欄位本身可能就是JSON資料格式。

比如：

{
 "log_time":"2019-10-29 21:57:38.008","msg":"接收到訂單資料.{"amount":1000.0,"commodityCode":"MK66923","count":5,"id":1,"orderNo":"1001"}"
}

這時候JSON解析器就會報錯。那怎麼辦呢？

Logstash 擁有豐富的過濾器外掛庫，或者你對正則有信心，也可以寫表示式去匹配。

正如我們在 Logback 中配置的那樣，我們的日誌內容格式是已經確定的，不管是JSON格式還是其他格式。

所以，筆者今天推薦另外一種：Dissect。

Dissect過濾器是一種拆分操作。與將一個定界符應用於整個字串的常規拆分操作不同，此操作將一組定界符應用於字串值。Dissect不使用正則表示式，並且速度非常快。

比如，筆者在這裡以 | 當做定界符。

input{ 
 stdin{}
}
filter{ 
 dissect {
  mapping => {
	 "message" => "%{log_time}|%{level}|%{logger}|%{thread}|%{msg}"
  }
 } 
}
output {
 stdout {}
}

然後在 Logback 中這樣去配置日誌格式：

<pattern>
 %d{yyyy-MM-dd HH:mm:ss.SSS}|%level|%logger|%thread|%m%n
</pattern>

最後同樣可以得到正確的結果：

到此，關於資料採集和格式轉換都已經完成。當然，上面的配置都是控制檯輸入、輸出。

我們來看一個正兒八經的配置，它從 FileBeat 中採集資料，經由 dissect 轉換格式，並將資料輸出到 elasticsearch 。

input {
 beats {
 port => 5044
 }
}
filter{
 dissect {
  mapping => {
  "message" => "%{log_time}|%{level}|%{logger}|%{thread}|%{msg}"
  }
 }
 date{
  match => ["log_time","yyyy-MM-dd HH:mm:ss.SSS"]
  target => "@timestamp"
 }
}
output {
 elasticsearch {
 hosts => ["192.168.216.128:9200"]
 index => "logs-%{+YYYY.MM.dd}"
 }
}

不出意外的話，開啟瀏覽器我們在Kibana中就可以對日誌進行檢視。比如我們檢視日誌等級為 DEBUG 的條目：

三、追蹤

試想一下，我們在前端傳送了一個訂單請求。如果後端系統是微服務架構，可能會經由庫存系統、優惠券系統、賬戶系統、訂單系統等多個服務。如何追蹤這一個請求的呼叫鏈路呢？

1、MDC機制

首先，我們要了解一下MDC機制。

MDC - Mapped Diagnostic Contexts ，實質上是由日誌記錄框架維護的對映。其中應用程式程式碼提供鍵值對，然後可以由日誌記錄框架將其插入到日誌訊息中。

簡而言之，我們使用了 MDC.PUT(key,value) ，那麼 Logback 就可以在日誌中自動列印這個value。

在 SpringBoot 中，我們就可以先寫一個 HandlerInterceptor ，攔截所有的請求，來生成一個 traceId 。

@Component
public class TraceIdInterceptor implements HandlerInterceptor {

 Snowflake snowflake = new Snowflake(1,0);

 @Override
 public boolean preHandle(HttpServletRequest request,HttpServletResponse response,Object handler){
  MDC.put("traceId",snowflake.nextIdStr());
  return true;
 }

 @Override
 public void postHandle(HttpServletRequest request,Object handler,ModelAndView modelAndView){
  MDC.remove("traceId");
 }

 @Override
 public void afterCompletion(HttpServletRequest request,Exception ex){}
}

然後在 Logback 中配置一下，讓這個 traceId 出現在日誌訊息中。

<pattern>
 %d{yyyy-MM-dd HH:mm:ss.SSS}|%level|%logger|%thread|%X{traceId}|%m%n
</pattern>

2、Dubbo Filter

另外還有一個問題，就是在微服務架構下我們怎麼讓這個 traceId 來回透傳。

熟悉 Dubbo 的朋友可能就會想到隱式引數。是的，我們就是利用它來完成 traceId 的傳遞。

@Activate(group = {Constants.PROVIDER,Constants.CONSUMER},order = 99)
public class TraceIdFilter implements Filter {
 @Override
 public Result invoke(Invoker<?> invoker,Invocation invocation) throws RpcException {

  String tid = MDC.get("traceId");
  String rpcTid = RpcContext.getContext().getAttachment("traceId");

  boolean bind = false;
  if (tid != null) {
   RpcContext.getContext().setAttachment("traceId",tid);
  } else {
   if (rpcTid != null) {
    MDC.put("traceId",rpcTid);
    bind = true;
   }
  }
  try{
   return invoker.invoke(invocation);
  }finally {
   if (bind){
    MDC.remove("traceId");
   }
  }
 }
}

這樣寫完，我們就可以愉快的檢視某一次請求所有的日誌資訊啦。比如下面的請求，訂單服務和庫存服務兩個系統的日誌。

四、總結

本文介紹了 Elastic Stack 的基本概念。並通過一個 SpringBoot+Dubbo 專案，演示如何做到日誌的集中化管理、追蹤。

事實上， Kibana 具有更多的分析和統計功能。所以它的作用不僅限於記錄日誌。

另外 Elastic Stack 效能也很不錯。筆者在一臺虛擬機器上，記錄了100+萬條使用者資料，index大小為1.1G，查詢和統計速度也不遜色。

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

詳解SpringBoot+Dubbo整合ELK實戰

前言一直以來，日誌始終伴隨著我們的開發和運維過程。當系統出現了Bug，往往就是通過Xshell連線到伺服器，定位到日誌檔案，一點點排查問題來源。

SpringBoot+Dubbo整合ELK實戰

前言一直以來，日誌始終伴隨著我們的開發和運維過程。當系統出現了Bug，往往就是通過Xshell連線到伺服器，定位到日誌檔案，一點點排查問題來源。

詳解SpringBoot結合策略模式實戰套路

1.1. 前言我們都知道設計模式好，可以讓我們的程式碼更具可讀性，擴充套件性，易於維護，但大部分程式猿一開始都學過至少一遍設計模式吧，實戰中不知用到了幾成。接下來讓我介紹一個結合SpringBoot的策略模式套路，

詳解Springboot整合ActiveMQ（Queue和Topic兩種模式）

寫在前面：從2018年底開始學習SpringBoot，也用SpringBoot寫過一些專案。這裡對學習Springboot的一些知識總結記錄一下。如果你也在學習SpringBoot，可以關注我，一起學習，一起進步。

詳解springboot整合ueditor踩過的坑

有一天老闆突然找我讓我改富文字（一臉懵逼，不過也不能推啊默默地接下了），大家都知道現在的富文字視訊功能都是隻有上傳連結的沒有從本地上傳這一說（就連現在的csdn的也是）於是我找了好多個，最終發現百度的uedi

詳解SpringBoot中的引數校驗(專案實戰)

Java後端發工作中經常會對前端傳遞過來的引數做一些校驗，在業務中還要丟擲異常或者不斷的返回異常時的校驗資訊,充滿了if-else這種校驗程式碼,在程式碼中相當冗長。例如說，使用者註冊時，會校驗手機格式的正確性，使

詳解SpringBoot基於Dubbo和Seata的分散式事務解決方案

1. 分散式事務初探一般來說，目前市面上的資料庫都支援本地事務，也就是在你的應用程式中，在一個數據庫連線下的操作，可以很容易的實現事務的操作。

詳解SpringBoot整合MyBatis詳細教程

1. 匯入依賴首先新建一個springboot專案，勾選元件時勾選Spring Web、JDBC API、MySQL Driver

詳解Springboot整合sentinel實現介面限流入門

Sentinel是阿里巴巴開源的限流器熔斷器，並且帶有視覺化操作介面。在日常開發中，限流功能時常被使用，用於對某些介面進行限流熔斷，譬如限制單位時間內介面訪問次數；或者按照某種規則進行限流，如限制ip的單位時間

詳解SpringBoot時間引數處理完整解決方案

在JavaWeb程式的開發過程中，介面是前後端對接的主要視窗，而介面引數的接收有時候是一個令人頭疼的事情，這其中最困擾程式猿的，應該是時間引數的接收。

詳解SpringBoot工程的三種搭建方式

SpringBoot的主要目的是簡化配置檔案，通過少量配置即可執行Java程式，其強大的自動配置功能幫助開發者輕鬆實現配置裝配，通過引入SpringBoot的 starter 就能實現想要的功能，不需要額外的配置。

詳解SpringBoot中RestTemplate的幾種實現

RestTemplate的多種實現使用JDK預設的http library 使用Apache提供的httpclient 使用Okhttp3

詳解SpringBoot構建的Web專案如何在服務端校驗表單輸入

這個例子用於演示在Spring Boot應用中如何驗證Web 應用的輸入，我們將會建立一個簡單的Spring MVC應用，來讀取使用者輸入並使用validation註解來檢查，並且當用戶輸入錯誤時，應用需要再螢幕上顯示錯誤資訊提示使用者

詳解springboot中使用非同步的常用兩種方式及其比較

一般對於業務複雜的流程，會有一些處理邏輯不需要及時返回，甚至不需要返回值，但是如果充斥在主流程中，佔用大量時間來處理，就可以通過非同步的方式來優化。

詳解SpringBoot獲得Maven-pom中版本號和編譯時間戳

這篇文章首先介紹了在SpringBoot中如何獲得專案的編譯時間和版本號，並向外提供介面，然後介紹了介紹了新版maven獲得時間戳時區錯誤的解決方案，最後介紹了把時間戳加到包名的兩種方法。

詳解SpringBoot中Controller接收物件列表實現

如果Spring Boot中對應的Controller要接收一個物件，該物件中又存放了一個List列表，那麼頁面該如何傳遞相關應的引數資訊呢。

詳解springboot+aop+Lua分散式限流的最佳實踐

一、什麼是限流？為什麼要限流？不知道大家有沒有做過帝都的地鐵，就是進地鐵站都要排隊的那種，為什麼要這樣擺長龍轉圈圈？答案就是為了限流！因為一趟地鐵的運力是有限的，一下擠進去太多人會造成站臺的擁擠、列車

詳解springboot啟動時是如何載入配置檔案application.yml檔案

今天啟動springboot時，明明在resources目錄下面配置了application.yml的檔案，但是卻讀不出來，無奈看了下原始碼，總結一下springboot查詢配置檔案路徑的過程，能力有限，歡迎各位大牛指導！！！

詳解SpringBoot 應用如何提高服務吞吐量

意外和明天不知道哪個先來。沒有危機是最大的危機，滿足現狀是最大的陷阱。

詳解SpringBoot Redis自適應配置(Cluster Standalone Sentinel)

核心程式碼段提供一個JedisConnectionFactory 根據配置來判斷單點叢集還是哨兵

詳解SpringBoot+Dubbo整合ELK實戰

相關推薦