1. 程式人生 > 其它 >阿里雲中間件首席架構師李小平:企業為什麼需要雲原生?

阿里雲中間件首席架構師李小平:企業為什麼需要雲原生?

作者|李小平

前天我參加了信通院的雲原生產業大會,參加會議的企業非常多,並且來自於各行各業,我在會場上非常感慨。我想起 2019 年的時候,我在搜尋引擎上搜索“雲原生”這個詞,那時的搜尋頻率還比較低,而 2019 年又是雲原生在國內開始飛速發展的一年。而今年的雲原生會場上,已經有非常多的企業來參加,這些企業在技術、產品、生態中都在應用雲原生,所以說,整個雲原生已經從最開始的技術變成了行業,現在發展成了比較大的產業,並且這個產業的規模每年以非常快的速度在增長。

在今天,可能有很多諮詢機構、企業,或者是個人開發者都在解讀雲原生,也許很多人對雲原生都有比較深入的認識了。大家都可以認同的是,雲原生肯定與雲有關,但是它改變了什麼,為企業帶來什麼價值呢?最核心的點應該是可以改變企業的應用架構;還有一種可能是不改變應用架構,只是把整個運維體系基於雲原生進行重塑。但所有的這些,背後的目的都是為了加速企業的價值創造過程,簡單的說,和製造企業改良生產線是一樣的,核心點就是改良我們作為軟體企業的生產線。


阿里在雲原生的實踐從 2006 年就開始了。我們在做雲原生的過程中積累了很多經驗,我們認為,今天雲原生對於企業數字創新主要提供了多個價值:

一是資源彈性。彈性這個詞大家很容易理解,實際上彈性有不同的層面。比如說基於虛擬機器的彈性,提供的彈效能力是分鐘級的。如果基於這些技術的應用是毫秒級的,那麼分鐘級只解決了資源彈性問題,整個應用高可用問題還需要進一步解決。如果說彈性到了應用的層面,到了毫秒級,高可用問題也得到一定程度的解決。

除此以外,系統的穩定性也是大家非常關注的方面。雲原生就是把整個軟體構造過程中非功能性特性拉出來放到雲原生產品上去,幫助應用開發從非功能性處理過程中解脫出來,更多的專注在功能性。同樣的,雲原生有很多工具理念,可以讓我們變得更好,整個軟體開發從程式碼到上線的時間大幅縮短。同樣的,今天在基於雲原生可觀測性上面我們會積累非常多的資料,這些資料可以結合機器學習這些能力,幫助我們改善企業的使用者體驗。這些對於業務來講會帶來比較大的價值。

阿里雲原生的實踐歷程


今天,雲原生在 CNCF、國內相關的開源、還有三方組織的推動下,可以使得一家企業在做技術選型的時候有非常多的選項。大家通常會面臨一個問題,在這麼多選擇裡面,要真正達到生產可用的目的到底選誰?特別是當我們的業務需要在非常短的時間內就上線,在業務高速發展的階段,我們應該選什麼樣的架構,選什麼樣的開源開放的產品,這個是擺在廣大企業技術決策者以及架構師面前的難題。

在雲原生領域中,阿里雲是相對比較早開始做自研的。從 2006 年到 2009 年網際網路的中介軟體開始發展,到阿里雲正式成立,整個過程中我們通過雲原生解決很多業務問題。通過應用雲原生相關技術,從早期很好地支援了淘寶的高速發展,到了 2015 年以後很好地支援了阿里的中臺建設,以及到今天隨著阿里巴巴整個生產系統、核心系統全部 100% 上雲,這個過程中我們運用的雲原生技術,像容器技術、微服務技術支援的規模都是百萬級以上。

相關調研顯示,這樣的雲原生落地規模在全球範圍內都是非常領先的。實際上,對於很多企業來講,也許用不到這些規模,但是阿里通過解決這樣的大規模下的效能、穩定性問題,積累了非常多的硬核技術,最終能夠把這些技術轉變成了產品,通過阿里雲對外輸出,服務於各行各業的廣大客戶。

我們認為,雲原生對於整個軟體的改變,或者對軟體公司的開發流程的改變是非常深刻的。首先 K8s 已經變成了軟體交付的標準介面,它改變的不止是運維,而是從 CICD 到後續釋出上線整個生產鏈條。由於所有生產流程得到改變,以及很多企業通過雲原生技術重塑了軟體架構,使得軟體架構從傳統架構變成了新的、我們稱之為現代化的應用架構,因此雲原生可以通過這種生產工具的改良進一步改變企業的生產關係,最終影響企業,使得企業在軟體開發過程中得到了極大的提速。

阿里雲在雲原生實踐過程中,積累了很強的技術競爭力,體現在這些方面:

一、我們有非常多領先的技術解決雲原生領域裡面的穩定性問題、可靠性問題,大規模下的高併發問題等。同時,我們會把所有的這些技術通過開源開放的形式輸出。我們知道,在雲原生的世界,企業需要的是開源開放的技術,而不是被像阿里這樣單獨一個廠商所鎖定的技術。這個過程中我們基於開源開放技術標準積累了很多產品的硬核能力。在產品上,除了大家看到的基於雲原生應用架構裡,還包括雲原生資料庫、雲原生大資料等。

在雲原生相關的領域有比較多的測評,在這些測評裡,例如阿里雲容器產品 ACK,在去年 Gartner 評測中拿到滿分,全球廠商中只有兩個廠商拿到滿分,阿里雲是其中之一。今年,阿里雲再次入選 Gartner 容器競爭格局。在新興的計算形態領域中,今年阿里雲進入 Forrester FaaS 領導者象限,函式計算獲得了全球 FaaS 產品最高分。

在可觀測性裡,阿里雲代表國內雲廠商進入 Gartner APM 象限。所有這些三方評估從另外一個層面反映了阿里雲產品的能力。容器架構上,我們基於開源開放的 K8s 技術體系,基於阿里雲的硬體做深度的優化,在比較多的領域和場景裡為廣大 K8s 應用提供服務。我們把在 K8s 叢集裡面超大規模叢集管理的能力輸出到 ACK 產品裡面,使得阿里雲的客戶在管理叢集的時候,可以擺脫大規模叢集的管理複雜性問題。

比如完美日記,作為美妝行業的獨角獸公司,他們的業務發展速度非常快,但在業務快速發展過程中,他們面臨的問題就是在大促的場景中怎麼更好地預留資源,以及在大促時怎麼樣比較好地解決新上線的功能,以及需求的穩定性問題。在這個過程中,他們利用 PTS 作為壓測,所有應用跑在 ACK 平臺上面,通過壓測模擬大促的流量,從而能夠把整個大促從需要投入較大的狀態提升到具備可以常態化的做大促壓測的能力,也通過這個能力使得系統穩定性相關問題得到快速收斂。

雲原生中介軟體


從微服務、訊息到各種應用工具以外,根據企業常見的 IT 場景,雲原生中介軟體也提供了很多解決方案。阿里雲中間件誕生於集團內的大規模呼叫場景,同時相容開源,並且融入了更多產品能力,例如在整個大促過程中表現優異的可觀測性、高可用能力等,都屬於雲原生中介軟體產品體系。

同樣在中介軟體領域裡,我們也和較多企業客戶有相應的合作。暢捷通是一家做 SaaS 的企業,迄今已經為超過四百萬的小微企業做了雲管。ToB 型別的應用複雜度較高,最大的問題就是整個軟體的釋出頻率是非常快的,怎麼樣在高頻軟體釋出下面能夠比較好的解決軟體的各種 BUG,或者解決設計上的不足帶來的穩定性的問題,這是在前期探討過程中暢捷通提出來的關注點。通過應用雲原生中介軟體,不僅解決了整個應用的可觀測性問題,並且讓應用具備 360 度無死角可觀測能力,通過應用探測能夠快速發現在整個壓測過程中各種可能的不穩定風險,從而使得相應風險得到快速的收斂。

Serverless


很多學術機構在 Serverless 領域深入研究,我們預感 Serverless 極有可能會成為下一代主流技術趨勢。阿里雲在 Serverless 領域裡做到業界領先的毫秒級計費,以及在整個阿里雲底層做深度優化,使客戶的應用真正達到了智慧的彈性、極致的運維和大幅提升開發效率。阿里雲也和許多企業客戶達成深度合作,進行 Serverless 落地實踐,通過幫助客戶將應用遷到 Serverless 技術體系上,達到比較快的應用部署;同時,把應用的穩定性問題、運維都委託給 Serverless 這樣的雲產品去解決。

解決方案


雲原生在快速發展過程中,只有通過不斷的技術創新、產品創新,才有可能使得雲原生技術更好的服務於廣大的企業客戶。今天,阿里雲對外發布四大解決方案:全鏈路壓測解決方案、異地多活解決方案、資源混部解決方案、可觀測解決方案。這些解決方案可以高效地解決在傳統領域裡還沒有很好解決的問題。比如全鏈路壓測,大家都知道全鏈路壓測是個好東西,比較大的問題是在應用壓測過程中使應用改造最小,甚至不要做改造,所以這次阿里雲升級的全鏈路壓測就可以幫助企業應用解決這些問題。

今天企業在不斷深入地使用雲以後,不管公有云還是專有云上,都會碰到整體 CPU 利用率不高的問題,混部就使得各種離線任務和線上任務可以部署在一起,各自享用資源排程的優勢,使得整體機房的 CPU 利用率得到比較大的提升。在這個過程中要解決混部之後帶來的穩定性問題、資源佔用問題。阿里是比較早地應用大規模的混部,像支撐電商雙十一的雲原生產品。今天我們也是把混部能力變成解決方案對外輸出。

大家都知道,阿里是比較早實現了單元化的架構,通過單元化架構實現了多活。今天我們把單元化整體的架構能力作為多活的解決方案。同時,這樣的多活不僅可以支援自有資料中心、私有云的場景,也能夠支援公有云和混合雲場景實現整個應用的多活。

可觀測性一直都是大家特別關注的話題,因為通過可觀測性使得我們可以主動發現在系統的執行過程中可能出現的各類風險。今天,阿里雲升級的可觀測性方案包括從撥測到各種前端的效能監控,一直延伸到後端應用,甚至延伸到雲服務裡。

產品升級


除了解決方案的創新以外,我們在相應的雲原生產品上面也做了比較多的升級。容器 ACK 備份容災中心全新發布,為容器使用者提供叢集、應用和資料的完整性保護:

1、支援自動分析應用依賴的元資料及儲存,實現秒級建立應用+資料的一致性快照;
2、支援建立備份計劃,自動按預設時間點建立備份;
3、完全相容 Kubernetes,並支援多叢集、多地域、跨資料中心進行備份和恢復。

容器映象 ACR 釋出企業級 Serverless 構建服務,大幅提升雲原生製品的構建效率和體驗:

1、支援多作業系統、多架構映象的矩陣構建,支援大規模併發任務構建。
2、支援多級快取的構建加速,平均構建提速 30%。
3、支援自動構建加速映象,實現 AI 等大映象秒級按需載入,平均啟動時間減少 60 %。

在微服務領域,越來越多的應用考慮採用服務網格技術。使用者希望服務網格在開源技術之上有更強的微服務治理能力,因此阿里雲推出專業版 ASM Pro,具備增強多協議支援,提升動態擴充套件能力,精細化服務治理,完善零信任安全體系。專業版相比去年釋出的普通版,在效能及規模上均有顯著提升,與開源的差異化競爭力進一步增強,降低使用者在生產環境落地服務網格的門檻。

Gartner 預測,未來事件驅動將成為業務開發的主流架構。企業客戶上雲過程中對於低程式碼、無伺服器彈性應用架構,如何輕量整合眾多異構雲服務的資料流有著明確的痛點和訴求。基於此趨勢,阿里雲釋出了事件匯流排 EventBridge 這款產品,其目標在於統一阿里云云服務、第三方 SaaS 廠商、使用者自定義的事件標準,通過標準、彈性、輕量的核心能力幫助使用者快速低成本獲取並處理海量事件,驅動業務開發。

在過去的一段時間,我們對 EventBridge 的產品能力做了進一步的擴充和升級:

  • 在事件生態整合的規模方面,新增 60+ 雲產品官方事件源接入,涵蓋計算、儲存、網路、資料庫等主流雲產品;
  • 在事件觸達和處理方式上,內建了十多種過濾匹配轉換邏輯,並且新增了跨網路、跨地域、跨賬號等深度觸達方式,方便企業大客戶做深層次的安全、隔離等定製;
  • 在此基礎上,阿里雲 EventBridge 首次推出事件驅動應用中心,內建常見的事件驅動應用模板,使用者無需程式碼和部署即可簡單配置完成常見的事件 ETL 處理、資料同步等場景功能。

阿里雲擁有最廣泛的雲原生客戶群體。隨著更多的企業客戶上雲,將有更多複雜的場景,對於雲原生技術、產品以及雲原生理念提出更高的要求。阿里雲希望跟社會各界的朋友一起在雲原生領域裡面做更多的探索,希望通過雲原生技術,真正為企業帶來更多的業務價值,助力企業整體的業務創新。