微服務架構學習與思考(09)：分散式鏈路追蹤系統-dapper論文學習

阿新 • • 發佈：2022-04-04

一、技術產生的背景

1.1 背景

先來了解一下分散式鏈路追蹤技術產生的背景。

在現在這個發達的網際網路世界，網際網路的規模越來越大，比如 google 的搜尋，Netflix 的視訊流直播，淘寶的購物等。

像這種大規模的應用，我們每點選一下滑鼠，搜尋一個關鍵字，背後可能會有幾百臺伺服器上的N個服務來為我們提供服務。

我們用谷歌搜尋：分散式 3 個字，搜尋一些文章來學習分散式的知識。假如，查詢時結果返回耗時 5 秒之多。

作為使用者的你，等待這麼長時間才返回結果，心裡肯定不滿意。

那作為一項服務來說，公司為了更好的服務使用者，讓使用者滿意，就必須要縮短使用者等待返回查詢結果的時間，要儘可能快的返回結果。

這樣使用者使用時才會感覺滿意。

當然，這個優化任務就落在了產品技術研發人身上了。- -！

作為開發服務的產品技術人員，要怎麼樣做，才能讓使用者搜尋時返回結果很快呢？

這時，產品研發人就思考在思考：

使用者的一次搜尋背後可能有幾百個後端服務來提供服務。比如現在流行的微服務架構。

如果後端有一條服務比較慢，那麼就可能會拖慢這整個搜尋結果。

在這麼多的服務中，要怎麼樣做，才能找出慢的服務呢？怎麼找出是哪一條後端服務比較慢呢？

產品技術研發研究人員為了解決這個問題，慢慢想出了分散式鏈路追蹤的技術，在到具體的技術實踐，這是一個漫長的過程。

他們把研究成果匯聚在了 dapper 論文裡。

當然它也借鑑了前人的研究成果，尤其是

Magpie 和 X-Trace，還有 Pinpoint。

說明：這裡的 Pinpoint 並不是 pinpoint-apm，而是一篇論文

在 [dapper](https://research.google/pubs/pub36356/) 論文開頭有這樣一段描述：

Modern Internet services are often implemented as complex, large-scale distributed systems. These applications are constructed from collections of software modules that may be developed by different teams, perhaps in different programming languages, and could span many thousands of machines across multiple physical facili- ties. Tools that aid in understanding system behavior and reasoning about performance issues are invaluable in such an environment.

from: https://research.google/pubs/pub36356/

大意是說現代互連網服務，通常都是用複雜的、大規模分散式叢集來實現。這些應用構建在不同的模組上，這些軟體模組，可能由不同的團隊開發，可能使用不同的開發語言，可能部署在幾千臺伺服器上，橫跨多個數據中心。因此，需要一些可以理解這個複雜系統的行為，用於分析效能找出效能問題的工具。

1.2 一個請求的鏈路圖示

Dapper 論文裡的一張圖，表示一個請求可能經過的路徑節點：

(圖 1：這個路徑由user使用者的RequestX發起請求，穿過一個簡單的服務系統。用字母標識的節點代表分散式系統中的不同處理過程,

來自：https://research.google/pubs/pub36356/)

這張圖是由 5 臺伺服器提供相關的一個服務，它包含：A-前端，B,C-2個服務中間層，以及 2 個後端 D 和 E。

當一個使用者發起一個請求，首先是到達前端 A，然後傳送 2 個 RPC 請求到伺服器 B 和 C。B 馬上會響應請求，但是 C 需要和

後端的 D 和 E 互動之後在返回給 A，最後由 A 來響應最初的請求。

上圖的呼叫鏈經過了不同的系統，這個系統可能是不同團隊維護，並且使用不同的語言開發。如果服務中出現了問題，比如請求異常，請求超時，那麼怎麼定位是哪個系統的哪一步出現了問題呢？

還有，對系統的監控是 7x24 小時不間斷的。持續的對系統進行監控。

二、Dapper 的分散式追蹤

2.1 怎麼定義圖1鏈路資訊

對於上面圖 1 的一個請求響應路徑，怎麼定義、怎麼能實現分散式追蹤呢？

簡單實現：為伺服器每一次的傳送和接收請求來收集追蹤標識（message identifiers）和時間戳（timestamped events）。

從入口開始發起 Request 的請求者（圖 1 中的 RequestX），與這個請求者相關的資訊都要關聯上，並記錄下來分析鏈路關係，有什麼好的方案呢？

2 種方案：黑盒（black-box）和基於標註（annotation-based）的監控方案。

黑盒方案：

假定需要追蹤的除了上述資訊之外沒有額外的資訊，這樣使用統計迴歸技術來推斷兩者之間的關係。

基於標註方案：

依賴於應用程式或中介軟體明確地標記一個全域性 ID，從而連線每一條記錄與發起者的請求。

2種方案的比較：

黑盒方案比標註方案跟輕便，但是它需要更多的資料，以獲得足夠的精度，因為他們依賴於統計推論。

標註方案最主要缺點，需要程式碼植入。

Google的選擇：

在 google 的生產環境中，所有的應用程式都使用相同的執行緒模型，控制流和RPC系統，他們可以把程式碼植入限制在一個很小的通用元件庫中，從而實現了監測系統的應用對開發人員是有效且透明。

dapper 的追蹤架構是內嵌在 RPC 呼叫鏈的屬性結構裡。當然這個呼叫鏈路監控，還可以追蹤其他行為，比如外界的 HTTP 請求，Gmail的 SMTP 會話和外部對 SQL 伺服器查詢等。

2.2 Dapper 資料結構模型

1、樹形結構，追蹤樹

2、Span 以及 Annotation

（圖 2：來自dapper論文：https://research.google/pubs/pub36356/）

圖 2，是一個樹形結構，每一個樹節點是整個架構的基本單元，這個節點單元叫做 span，每個節點 span 都有一個唯一的 id：span id，還有一個 name：span name。

節點之間的關係可以用父子來表示，parent id 和 span id，parent id 就是它上一個 span 的 id；如果一個 span 沒有父 id，那麼它就是根節點，root span。

所有的 span 都有一個追蹤請求 id，叫 trace id，作用是標識出一次完整請求。這個 trace id 是全域性唯一。

最後，每個 span 還有一個 Annotations，記錄每個 span 中的其他相關資訊，比如 span 的開始時間戳，結束時間戳，傳送資訊等等資訊，客戶端和服務端資訊都可以記錄。

（圖3：表示一個單獨的 span 結構資訊圖，來自 dapper 論文）

// 偽碼錶示結構
struct span {
    id        // 當前 span 的 id
    parent_id // 父 id，上一層 span id
    name      // 當前 span 的 name
    trace_id  // 標識一次完整請求的 trace_id
    Annotations []annotation // 表示 span 中的其它相關資訊
}

struct annotation {
    star_time  // 此次 span 開始時間戳
    end_time   // 此次 span 結束時間戳
    client_send_info  // 客戶端傳送資訊
    client_recv_info  // 客戶端接收資訊
    server_send_info  // 服務端傳送資訊
    .. ...
}

2.3 怎麼把追蹤程式碼值入相關程式中

dapper 裡面叫植入點。

怎麼把相關追蹤程式碼放入到程式中？並且能比較少的改動程式碼，又能達到下面三個設計目標。

dapper 裡提了 3 個設計目標：

低損耗

追蹤系統對線上服務的影響最小化。因為在一些效能比較敏感的服務裡，一點點的效能消耗也可能影響使用者體驗。

對應用程式透明

對於應用程式來說，它根本覺察不到追蹤系統的存在。

一個追蹤系統，如果需要應用開發者主動配合植入追蹤程式碼，那麼追蹤系統的存在不僅會導致眾多額外程式碼的修改，最重要的是可能會使

執行良好的系統產生bug。

擴充套件性

google 在未來幾年隨著業務規模增長而擴充套件叢集規模，追蹤系統也能夠應對這種情況。

對於上面 3 點中最重要的一點就是追蹤系統對**應用程式透明**。

那怎麼做才能對應用程式透明？

Dapper 可以近乎零浸入的成本對應用程式鏈路進行追蹤，得益於 google 的服務設施依賴幾個少數的通用元件庫，只要改造這

幾個元件庫就可以了。比如 google 中幾乎所有程序間通訊都是建立在 C++ 和 Java 開發的 RPC 框架上，那麼我們只用改造這個 RPC 框架，追蹤系統就能在依賴這個 RPC 框架的應用程式裡生效。

當然 dapper 也允許應用開發人員給鏈路追蹤系統新增額外的資訊，以監控更高級別的系統行為，或幫助除錯問題。它允許使用者通過一個簡單的 API 定義帶時間戳的 Annotation。

2.4 取樣率和追蹤資訊的收集

低損耗是 dapper 的一個設計目標，所以 dapper 對系統鏈路資訊收集工作對基本元件效能損耗要儘可能的小。還有就是遇到大量請求時只記錄其中一小部分。

(圖4：dapper 收集管道總覽，來自 dapper 論文)

dapper 追蹤系統記錄和收集資訊過程分為三個階段（如上圖4）：

span 的資料寫入(1)本地日誌檔案，

然後 dapper 的 daemon 程序和收集元件把追蹤的資料從生產環境讀取處理(2)。

最後一些(3)的 bigtable 倉庫中。

看上面圖4：一次追蹤資訊被儲存為 bigtable 的一行，每一列相當於一個 span。

引用參考

dapper 論文：https://research.google/pubs/pub36356/，

作者：Benjamin H. Sigelman, Luiz Andr´e Barroso, Mike Burrows, Pat Stephenson, Manoj Plakal, Donald Beaver, Saul Jaspan, Chandan Shanbhag
- https://bigbully.github.io/Dapper-translation/ 中文翻譯版，bigbully
X-Trace 論文：https://www.usenix.org/legacy/event/nsdi07/tech/full_papers/fonseca/fonseca_html/index.html，

作者：Rodrigo Fonseca George Porter Randy H. Katz Scott Shenker Ion Stoica
Magpie 論文：https://www.usenix.org/legacy/publications/library/proceedings/hotos03/tech/full_papers/barham/barham_html/paper.html，作者：Paul Barham, Rebecca Isaacs, Richard Mortier, and Dushyanth Narayanan
Microsoft Research Ltd., Cambridge, UK.
Pinpoint 論文：http://roc.cs.berkeley.edu/papers/roc-pinpoint-ipds.pdf，

作者：Mike Y. Chen, Emre Kıcıman, Eugene Fratkin, Armando Fox*, Eric Brewer

(Computer Science Division, University of California, Berkeley)

(*Computer Science Department, Stanford University)

微服務架構學習與思考(09)：分散式鏈路追蹤系統-dapper論文學習

一、技術產生的背景 1.1 背景先來了解一下分散式鏈路追蹤技術產生的背景。在現在這個發達的網際網路世界，網際網路的規模越來越大，比如 google 的搜尋，Netflix 的視訊流直播，淘寶的購物等。

微服務：分散式鏈路追蹤系統-jaeger

簡介 jaeger是一個比較有名的分散式鏈路追蹤系統，底層用golang實現，相容opentracing標準。

Go微服務架構實戰下篇：1. gRPC + Opentracing + Zipkin實現分散式鏈路追蹤系統

Go微服務架構實戰-【公粽號：堆疊future】原文 Go微服務架構實戰目錄 1. 微服務架構上篇

微服務架構學習與思考(08)：服務註冊中心（服務註冊與服務發現）

為什麼會有服務註冊中心為什麼會有服務註冊中心？在 client-server 服務-請求模式中，客戶的傳送請求到服務端，完成一次服務請求。這時候，開發也比較簡單，寫服務端程式碼就可以完成這種模式了。

微服務架構-高效能Netty伺服器-067：手寫RPC負載均衡器五種演算法

技術標籤：螞蟻課堂第6期視訊筆記javanetty 067：手寫RPC負載均衡器五種演算法 1 手寫RPC負載均衡器五種演算法演示2 負載均衡器在RPC框架實現的作用3 手寫負載均衡器輪詢機制第一種演算法4 手寫負載均衡器輪詢

穩定性實踐：全鏈路跟蹤系統，技術運營能力的體現

穩定性實踐：全鏈路跟蹤系統，技術運營能力的體現今天我們來分享全鏈路跟蹤系統建設方面的內容。我們知道，隨著微服務和分散式架構的引入，各類應用和基礎元件形成了網狀的分散式呼叫關係，這種複雜的呼叫關係就大大

各大廠分散式鏈路跟蹤系統架構對比

隨著網際網路架構的擴張，分散式系統變得日趨複雜，越來越多的元件開始走向分散式化，如微服務、訊息收發、分散式資料庫、分散式快取、分散式物件儲存、跨域呼叫，這些元件共同構成了繁雜的分散式網路，那現在的問題

微服務架構之服務發現：選型與思考

導語：本文圍繞服服務呼叫模式、一致性取捨、服務提供者的健康檢查模式等方面，討論了服務發現的技術選型和設計的各種優缺點，希望能夠幫助大家在選擇或者使用服務發現系統的時候更加順暢。

微服務架構實戰學習（六）：實現服務間呼叫（RestTemplate方式）

技術標籤：SpringCloud 關注微信公眾號，檢視私密內容介紹了註冊中心的搭建和服務的註冊，本文將介紹下服務消費者呼叫服務提供者的過程。

怎麼設計樹狀管理後臺_微服務架構實戰：商家管理後臺與sso設計：SSO設計

技術標籤：怎麼設計樹狀管理後臺 SSO設計 Spring Security是一個功能強大、可定製的身份驗證和訪問控制框架.Spring Security OAuth2是一個基於Spring框架支援第三方應用授權的工具元件。通過使用Spring Securit

微服務架構學習（五）：Eureka 總結及注意事項（非VIP可通過我的訂閱號檢視）

技術標籤：SpringCloudEurekaEureka叢集廢話不多說，上碼：我們已經有過將 Eureka Client 註冊到本地 Eureka Server 服務上的介紹，但當時的本地 Eureka Server 服務是個單節點服務，在上篇中我們實現了 Eure

微服務架構學習（五）：註冊中心叢集（非VIP可通過微信公眾號學習）

技術標籤：SpringCloudEurekaEureka叢集註冊中心廢話不多說，先來掃碼關注一下吧：

【轉載】.NET Core微服務架構學習與實踐系列文章索引目錄

.NET Core微服務架構學習與實踐系列文章索引目錄一、為啥要總結和收集這個系列？

springboot學習02：什麼是微服務架構

springboot學習02：什麼是微服務架構什麼是微服務：微服務是一種架構風格，它要求我們在開發一個應用的時候，這個應用必須構建成一系列小服務的組合，可以通過http的方式進行互通，要說微服務架構，先要明白什

微服務架構的前世今生（八）：微服務架構的技術支援

上次我們說到微服務架構的前世今生（七）：微服務架構生態體系，這次我們在說說微服務架構的技術支援。作者哈嘍沃德先生，歡迎關注。

《微服務架構設計模式》-學習總結01

最近，新的啟動專案準備考慮採用微服務架構來設計和開發。知乎文章推薦了一本好書《微服務架構設計模式》，該書是微服務架構大牛Chris Richardson親筆力作。剛看完前幾章就覺得書中提到的問題和解決方案，

《微服務架構設計模式》-學習總結07

本篇主要總結第七章：在微服務架構中實現查詢在微服務架構中查詢資料的挑戰何時以及如何使用API組合模式實現查詢何時以及如何使用CQRS模式實現查詢

springcloud微服務架構學習01

springcloud微服務架構學習 1. 微服務架構1.1 微服務是什麼（定義）1.2 微服務架構的好處1.3 微服務架構面臨的挑戰（缺點）1.4 微服務架構的集合（元件）

架構設計-微服務架構初步學習

參考： https://www.cnblogs.com/skabyy/p/11396571.html https://www.cnblogs.com/xiao2shiqi/p/11298663.html

微服務架構與SOA架構的區別與聯絡

場景: 如果我們開啟支付寶首頁，去看我們的餘額，它會展示你的總資產，昨日收益、累計收益等資訊。假如這個頁面所展示的資訊，都來自各個不同的系統/應用，我們通過各個介面把這些資料展示出來。如果我們現在要在前

微服務架構學習與思考(09)：分散式鏈路追蹤系統-dapper論文學習

一、技術產生的背景

1.1 背景

1.2 一個請求的鏈路圖示

二、Dapper 的分散式追蹤

2.1 怎麼定義圖1鏈路資訊

2.2 Dapper 資料結構模型

2.3 怎麼把追蹤程式碼值入相關程式中

2.4 取樣率和追蹤資訊的收集

引用參考

相關推薦