點選下載《不一樣的雙11 技術：阿里巴巴經濟體雲原生實踐》

本文節選自《不一樣的雙11 技術：阿里巴巴經濟體雲原生實踐》一書，點選上方圖片即可下載！

作者 | 方克明（溪翁）阿里雲中間件技術部技術專家

導讀：雲原生已成為整個阿里巴巴經濟體構建面向未來的技術基礎設施，Service Mesh 作為雲原生的關鍵技術之一，順利完成在雙11 核心應用嚴苛而複雜場景下的落地驗證。本文作者將與大家分享在完成這一目標過程中我們所面臨和克服的挑戰。

部署架構

切入主題前，需要交代一下在雙11 核心應用上落地的部署架構，如下圖所示。在這篇文章中，我們主要聚焦於 Service A 和 Service B 之間 RPC 協議的 Mesh 化。

圖中示例說明了 Service Mesh 所包含的三大平面：即資料平面（Data Plane）、控制平面（Control Plane）和運維平面（Operation Plane）。資料平面我們採用的是開源的 Envoy（上圖中的 Sidecar，請讀者注意這兩個詞在本文中可以互換使用），控制平面採用的是開源的 Istio（目前只使用了其中的 Pilot 元件），運維平面則完全自研。

與半年前落地時不同，這次雙11 核心應用上落地我們採用了 Pilot 叢集化部署的模式，即 Pilot 不再與 Envoy 一起部署到業務容器中，而是搭建了一個獨立的叢集。這一變化使得控制平面的部署方式演進到了 Service Mesh 應有的終態。

挑戰

落地所選擇的雙11 核心應用都是採用 Java 程式語言實現的，在落地的過程中我們面臨了以下挑戰。

1. 在 SDK 無法升級的情形下如何實現應用的 Mesh 化

在決定要在雙11 的核心應用上落地 Mesh 時，Java 應用依賴的 RPC SDK 版本已經定稿，為了 Mesh 化完全沒有時間去開發一個適用於 Mesh 的 RPC SDK 並做升級。那時，擺在團隊面前的技術問題是：如何在不升級 SDK 的情形下，實現 RPC 協議的 Mesh 化？

熟悉 Istio 的讀者想必清楚，Istio 是通過 iptables 的 NAT 表去做流量透明攔截的，通過流量透明攔截可在應用無感的情形下將流量劫持到 Envoy 中從而實現 Mesh 化。但很不幸，NAT 表所使用到的 nf_contrack 核心模組因為效率很低，在阿里巴巴的線上生產機器中被去除了，因此無法直接使用社群的方案。好在年初開始不久我們與阿里巴巴 OS 團隊達成了合作共建，由他們負責承擔 Service Mesh 所需的流量透明攔截和網路加速這兩塊基礎能力的建設。經過兩個團隊的緊密合作，OS 團隊探索了通過基於 userid 和 mark 標識流量的透明攔截方案，基於 iptables 的 mangle 表實現了一個全新的透明攔截元件。

下圖示例說明了存在透明攔截元件的情形下，RPC 服務呼叫的流量走向。其中，Inbound 流量是指調進來的流量（流量的接受者是 Provider 角色），而 Outbound 是指調出去的流量（流量的發出者是 Consumer 角色）。通常一個應用會同時承擔兩個角色，所以有 Inbound 和 Outbound 兩股流量並存。

有了透明攔截元件之後，應用的 Mesh 化完全能做到無感，這將極大地改善 Mesh 落地的便利性。當然，由於 RPC 的 SDK 仍存在以前的服務發現和路由邏輯，而該流量被劫持到 Envoy 之後又會再做一次，這將導致 Outbound 的流量會因為存在兩次服務發現和路由而增加 RT，這在後面的資料部分也將有所體現。顯然，以終態落地 Service Mesh 時，需要去除 RPC SDK 中的服務發現與路由邏輯，將相應的 CPU 和記憶體開銷給節約下來。

2.短時間內支援電商業務複雜的服務治理功能

路由

在阿里巴巴電商業務場景下的路由特性豐富多樣，除了要支援單元化、環境隔離等路由策略，還得根據 RPC 請求的方法名、呼叫引數、應用名等完成服務路由。阿里巴巴內部的 Java RPC 框架是通過嵌入 Groovy 指令碼來支援這些路由策略的，業務方在運維控制檯上配置 Groovy 路由模板，SDK 發起呼叫時會執行該指令碼完成路由策略的運用。

未來的 Service Mesh 並不打算提供 Groovy 指令碼那麼靈活的路由策略定製方案，避免因為過於靈活而給 Service Mesh 自身的演進帶去掣肘。因此，我們決定借 Mesh 化的機會去除 Groovy 指令碼。通過落地應用所使用 Groovy 指令碼的場景分析，我們抽象出了一套符合雲原生的解決方案：擴充套件 Istio 原生的 CRD 中的 VirtualService 和 DestinationRule，增加 RPC 協議所需的路由配置段去表達路由策略。

目前阿里巴巴環境下的單元化、環境隔離等策略都是在 Istio/Envoy 的標準路由模組內做了定製開發，不可避免地存在一些 hack 邏輯。未來計劃在 Istio/Envoy 的標準路由策略之外，設計一套基於 Wasm 的路由外掛方案，讓那些簡單的路由策略以外掛的形式存在。如此一來，既減少了對標準路由模組的侵入，也在一定程度上滿足了業務方對服務路由定製的需要。設想的架構如下圖所示：

限流

出於效能考慮，阿里巴巴內部落地的 Service Mesh 方案並沒有採用 Istio 中的 Mixer 元件，限流這塊功能借助阿里巴巴內部廣泛使用的 Sentinel 元件來實現，不僅可以與已經開源的 Sentinel 形成合力，還可以減少阿里巴巴內部使用者的遷移成本（直接相容業務的現有配置來限流）。為了方便 Mesh 整合，內部多個團隊合作開發了 Sentinel 的 C++版本，整個限流的功能是通過 Envoy 的 Filter 機制來實現的，我們在 Dubbo 協議之上構建了相應的 Filter（Envoy 中的術語，代表處理請求的一個獨立功能模組），每個請求都會經過 Sentinel Filter 做處理。限流所需的配置資訊則是通過 Pilot 從 Nacos 中獲取，並通過 xDS 協議下發到 Envoy 中。

3. Envoy 的資源開銷過大

Envoy 誕生之初要解決的一個核心問題就是服務的可觀測性，因此 Envoy 一開始就內建了大量的 stats（即統計資訊），以便更好地對服務進行觀測。

Envoy 的 stats 粒度很細，甚至細到整個叢集的 IP 級別，在阿里巴巴環境下，某些電商應用的 Consumer 和 Provider 服務加起來達到了幾十萬之多的 IP（每個 IP 在不同的服務下攜帶的元資訊不同，所以不同的服務下的相同 IP 是各自獨立的）。如此一來，Envoy 在這塊的記憶體開銷甚是巨大。為此，我們給 Envoy 增加了 stats 開關，用於關閉或開啟 IP 級別的 stats，關閉 IP 級別的 stats 直接帶來了記憶體節約 30% 成果。下一步我們將跟進社群的 stats symbol table 的方案來解決 stats 指標字串重複的問題，那時的記憶體開銷將進一步減少。

4. 解耦業務與基礎設施，實現基礎設施升級對業務無感

Service Mesh 落地的一項核心價值就是讓基礎設施與業務邏輯完全解耦，兩者可以獨立演進。為了實現這個核心價值，Sidecar 需要具備熱升級能力，以便升級時不會造成業務流量中斷，這對方案設計和技術實現的挑戰還是蠻大的。

我們的熱升級採用雙程序方案，先拉起新的 Sidecar 容器，由它與舊的 Sidecar 進行執行時資料交接，在新的 Sidecar 準備發接管流量後，讓舊的 Sidecar 等待一定時間後退出，最終實現業務流量無損。核心技術主要是運用了 Unix Domain Socket 和 RPC 的節點優雅下線功能。下圖大致示例了關鍵過程。

資料表現

公佈效能資料一不小心就會引發爭議和誤解，因為效能資料的場景存在很多變數。比如，併發度、QPS、payload 大小等對最終的資料表現將產生關鍵影響。也正因如此，Envoy 官方從來沒有提供過本文所列出的這些資料，背後的原因正是其作者 Matt Klein 擔心引發誤解。值得強調的是，在時間非常緊迫的情形下，我們所落地的 Service Mesh 並非處於最優狀態，甚至不是最終方案（比如 Consumer 側存在兩次路由的問題）。我們之所以選擇分享出來，是希望讓更多的同行瞭解我們的進展和狀態。

本文只列出了雙11 所上線核心應用中某一個的資料。從單機 RT 抽樣的角度，部署了 Service Mesh 的某臺機器，其 Provider 側的 RT 均值是 5.6ms，Consumer 側的是 10.36ms。該機器在雙11 零點附近的 RT 表現如下圖所示：

沒有部署 Service Mesh 的某臺機器，Provider 側的均值為 5.34ms，Consumer 側的則是 9.31ms。下圖示例了該機器在雙11 零點附件的 RT 表現。

相比之下，Provider 側的 RT 在 Mesh 化前後增加了 0.26ms，Consumer 側則增加了 1.05ms。注意，這個 RT 差是包含了業務應用到 Sidecar，以及 Sidecar 處理的所有時間在內的，下圖示例說明了帶來時延增加的鏈路。

整體上，該核心應用所有上線了 Service Mesh 的機器和沒有上線 Service Mesh 的機器在某個時間段的整體均值資料做了對比。Provider 側 Mesh 化後的 RT 增加了 0.52ms，而 Consumer 側增加了 1.63ms。

在 CPU 和記憶體開銷方面，Mesh 化之後，Envoy 所消耗的 CPU 在所有核心應用上都維持在 0.1 核左右，會隨著 Pilot 推送資料而產生毛刺。未來需要藉助 Pilot 和 Envoy 之間的增量推送去對毛刺做優化。記憶體的開銷隨著應用的服務和叢集規模不同而存在巨大差異，目前看來 Envoy 在記憶體的使用上仍存在很大的優化空間。

從所有雙11 上線的核心應用的資料表現來看，Service Mesh 的引入對於 RT 的影響和帶來的 CPU 開銷是基本一樣的，而記憶體開銷則因為依賴服務和叢集規模的不同而有相當大的差異。

展望

在雲原生的浪潮下，阿里巴巴借這波技術浪潮致力於打造面向未來的技術基礎設施。在發展的道路上將貫徹“借力開源，反哺開源”的發展思路，通過開源實現技術普惠，為未來的雲原生技術在更大範圍的普及做出自己的貢獻。

接下來，我們的整體技術著力點在於：

與 Istio 開源社群共同增強 Pilot 的資料推送能力。在阿里巴巴具備雙11 這種超大規模的應用場景下，我們對於Pilot 的資料推送能力有著極致的要求，相信在追求極致的過程中，能與開源社群一道加速全球事實標準的共建。從阿里巴巴內部來看，我們目前拉通了與 Nacos 團隊的共建，將通過社群的 MCP 協議與 Nacos 對接，讓阿里巴巴所開源的各種技術元件能體系化地協同工作；
以 Istio 和 Envoy 為一體，進一步優化兩者的協議以及各自的管理資料結構，通過更加精煉、更加合理的資料結構去減少各自的記憶體開銷；
著力解決大規模 Sidecar 的運維能力建設。讓 Sidecar 的升級做到可灰度、可監控和可回滾；
兌現 Service Mesh 的價值，讓業務與技術設施能以更高的效率彼此獨立演進。

本書亮點

雙11 超大規模 K8s 叢集實踐中，遇到的問題及解決方法詳述
雲原生化最佳組合：Kubernetes+容器+神龍，實現核心系統 100% 上雲的技術細節
雙 11 Service Mesh 超大規模落地解決方案

“阿里巴巴雲原生微信公眾號（ID：Alicloudnative）關注微服務、Serverless、容器、Service Mesh等技術領域、聚焦雲原生流行技術趨勢、雲原生大規模的落地實踐，做最懂雲原生開發者的技術公眾號。”

相關推薦

阿里巴巴 Service Mesh 落地的架構與挑戰

點選下載《不一樣的雙11 技術：阿里巴巴經濟體雲原生實踐》本文節選自《不一樣的雙11 技術：阿里巴巴經濟體雲原生實踐》一書，點選上方圖片即可下載！作者 | 方克明（溪翁）阿里雲中間件技術部技術專家導讀：雲原生已成為整個阿里巴巴經濟體構建面向未來的技術基礎設施，Service Mesh 作為雲原

《企業IT架構轉型之道-阿里巴巴中臺戰略思想與架構實戰》筆記

《企業IT架構轉型之道-阿里巴巴中臺戰略思想與架構實戰》讀後感轉至簡書：讀《阿里巴巴中臺戰略》-思企業IT架構之轉型 2015年阿里巴巴集團啟動了中臺戰略，目標是要構建符合網際網路大資料時代的，具有創新性、靈活性的“大中臺、小前臺”的機制，即作為前臺的一線業務會更敏捷、更快速的適用瞬息

企業 IT 架構轉型之道：阿里巴巴中臺戰略思想與架構實戰

內容簡介本書從阿里巴巴啟動中臺戰略說起，詳細闡述共享服務體系如何給企業的業務發展提供了支援。介紹阿里巴巴在建設共享服務體系時如何進行技術框架選擇，構建了哪些重要的技術平臺等，此外，還介紹了組織架構和體制如何更好地支援共享服務體系的持續發展。主要內容分為三大部分：第一部分介紹阿里巴巴

《企業IT架構轉型之道-阿里巴巴中臺戰略思想與架構實戰》讀書筆記

1 出發點：企業IT系統建設普遍面臨的問題和處境很多企業面臨的問題和處境： 1.1 『煙囪式』系統建設模式。當業務部門提出業務需求，資訊中心部門進行系統整合商的招投標，再進入到需求收集、需求分析、開發、測試、上線的專案週期中。某種程度上，每個新系統

003-讀書筆記-企業IT架構轉型之道-阿里巴巴中臺戰略思想與架構實戰-分散式服務框架的選擇

3.1、淘寶平臺“服務化”歷程大約2007年，淘寶500人團隊，維護一個war包，200多個功能模組。 1）專案團隊協同成本高，業務響應越來越慢 2）應用複雜度超出人的認知負載。 3）錯誤難於隔離【同一個環境，一個jvm】 4）資料庫連線能力很難擴充套件：每一個機器只有10個，但是應用機器過於多，

004-讀書筆記-企業IT架構轉型之道-阿里巴巴中臺戰略思想與架構實戰-共享服務中心建設原則

　　一般來說服務能力包括兩個層次，一個是底層paas的能力，PaaS層結局大型架構在分散式、可靠性、可用性、容錯、監控以及運維層面上的通用需求；第二個層次是業務能力，業務能力提供雲化的核心業務支撐能力，這層能力建設的好壞，直接決定了能否真正支援上層業務達到敏捷、穩定、高效。 1.1、淘寶的共享中心概貌使

《企業IT架構轉型之道：阿里巴巴中臺戰略思想與架構實戰》PDF版

點選下載：《企業IT架構轉型之道：阿里巴巴中臺戰略思想與架構實戰》內容簡介 · · · · · · 在當今整個中國社會都處於網際網路轉型的浪潮中，不管是政府職能單位、業務規模龐大的央企，還是面臨最激烈競爭的零售行業都處於一個重要的轉折點，這個轉折

阿里巴巴飛天大資料架構體系與Hadoop生態系統

很多人問阿里的飛天大資料平臺、雲梯2、MaxCompute、實時計算到底是什麼，和自建Hadoop平臺有什麼區別。先說Hado

取之開源，用之開源-深度剖析阿里巴巴對Flink的優化與改進

作者 | 阿里巴巴實時計算團隊導讀：隨著人工智慧時代的降臨，資料量的爆發，阿里巴巴的商品資料處理就經常需要面對增量和全量兩套不同的業務流程問題，所以阿里巴巴就在想：能不能有一套統一的大資料引擎技術，使用者只需要根據自己的業務邏輯開發一套程式碼。這樣在各種不同的場景下，不管是全量資料還是增量資料，亦或者實時處

阿里巴巴十年Java架構師分享，會了這些知識點的人都去BAT了

近期都是在做一個專案，專案是一個大型的多節點部署的專案，做了好幾個版本，中間用到了很多技術和框架，也用了一些管理工具和敏捷實踐。我這裡不是來說專案的，因為最近看了一些招聘資訊，結合專案中用到的一些知識和管理措施，作為一個程式設計師，需要去實時評估下自己當前的能力是否能跟上時代的步伐，所以

華為多年實踐：ServiceComb在Service Mesh的探索與思考

內容來源：2018 年 6 月 27 日，華為微服務架構師田曉亮在“LC3微服務Workshop | 深入解讀ServiceComb”進行《ServiceComb的ServiceMesh思考及在華為雲的實踐》的演講分享。IT 大咖說作為獨家視訊合作方，經主辦方和講者審閱授權釋出。閱讀字數：3606 | 10

阿里巴巴敏捷研發的探索與實踐

今天你敏捷了嗎？敏捷產品開發提倡快速迭代、小步快跑，以便更靈活地應對變化，目前逐漸演變為行業潮流。阿里巴巴內部也在不斷進行敏捷實踐。3月15日雲效開啟敏捷專場沙龍，特邀阿里巴巴敏捷教練何勉、張迎輝、張燎原為大家分享阿里巴巴的敏捷實踐，從中大家可以瞭解到網際網路產品全生命週期的

阿里巴巴十年Java架構師分享，會了這個知識點的人都去BAT了

類似於課程大綱 1.原始碼分析專題詳細介紹原始碼中所用到的經典設計思想，看看大牛是如何寫程式碼的，提升技術審美、提高核心競爭力。幫助大家尋找分析原始碼的切入點，在思想上來一次巨大的昇華。知其然，並知其所以然。把知識變成自己的 2.分散式架構網

微服務（Microservices）和服務網格（Service Mesh）架構概念整理

注：文章內容為摘錄性文字，自己閱讀的一些筆記，方便日後檢視。微服務（Microservices）在過去的 2016 年和 2017 年，微服務技術迅猛普及，和容器技術一起成為這兩年中最吸引眼球的技術熱點。而以 Spring Cloud 為代表的傳統侵入式開發框架，佔據著微服務市場的主流地位。微服務（Mi

阿里巴巴Java規約p3c-pmd與maven整合

阿里巴巴規約使用的是pmd程式碼靜態分析工具，且是通過maven-pmd-plugin這個maven外掛實現的。所以主要配置maven-pmd-plugin這個外掛就能實現使用p3c對程式碼檢查。配置pom.xml 1 屬性配置：配置propertie

深入淺出Istio:Service mesh快速入門與實踐-讀書筆記(By GisonWin)

什麽分配 mem ces 轉換成初始化 virt 會有 ilo 01 服務網格歷史 (以後補充) 02 服務網格的基本特性連接微服務錯綜復雜,要完成其業務目標,連接問題是首要問題.連接存在於所有服務的整個lifcecycle中,用於維持服務的運行. 安全

DataPipeline丨DataOps的組織架構與挑戰

作者：DataPipeline CEO 陳誠前兩週，我們分別探討了“資料的資產負債表與現狀”及“DataOps理念與設計原則”。接下來，本文會在前兩篇文章的基礎上繼續探討由DataOps設計原則衍生出的具體組織架構。讓資料快速從負債變成資產，絕不僅僅是某種軟體

《阿里巴巴Java Spring Boot 2.0開發實戰課程》05課：三層MVC網站與架構分層誤區、Java面試題

《阿里巴巴Java Spring Boot 2.0開發實戰課程》05課本期分享專家：徐雷—阿里特邀Java講師，MongoDB講師本期分享主題：三層架構MVC網站與分層架構誤區、Java面試題國內系統架構設計的文章和書籍。經常會搞錯分層的概念，本課程進行了講解。還有關於model概念的解析，以及Jav

雙11超級工程—阿里巴巴資料庫技術架構演進與阿里雲技術

【阿里巴巴資料庫技術架構演進】每年電商雙11大促對阿里技術人都是一次大考，對阿里資料庫團隊更是如此。經過9年的發展，雙11單日交易額從2009年的0.5億一路攀升到2017年的1682億，秒級交易建立峰值達到了32.5萬筆/秒。支撐這一切業務指標的背後，是底層技術體系的一次次迭代升級。阿里巴巴資料

微服務架構下 Service Mesh 會是閃亮的明天嗎？

在一起 7月部署服務發現代理負載開源項目 images 我們 7月7日，時速雲企業級容器 PaaS 技術沙龍第 10 期在上海成功舉辦，時速雲容器架構負責人魏巍為大家詳細講解了 Service Mesh 中代表性的實踐方案、並以 Istio 為例詳細講解了 Ser