1. 程式人生 > >多研究些架構,少談些框架——一名阿裏架構師的筆記

多研究些架構,少談些框架——一名阿裏架構師的筆記

pos 不同的 還原 don eva art 同步 限制 it行業

微服務架構和SOA區別

微服務現在辣麽火,業界流行的對比的卻都是所謂的Monolithic單體應用,而大量的系統在十幾年前都是已經是分布式系統了,那麽微服務作為新的理念和原來的分布式系統,或者說SOA(面向服務架構)是什麽區別呢?

我們先看相同點:

1.需要Registry,實現動態的服務註冊發現機制;

2.需要考慮分布式下面的事務一致性,CAP原則下,兩段式提交不能保證性能,事務補償機制需要考慮;

3.同步調用還是異步消息傳遞,如何保證消息可靠性?SOA由ESB來集成所有的消息;

4.都需要統一的Gateway來匯聚、編排接口,實現統一認證機制,對外提供APP使用的RESTful接口;

5.同樣的要關註如何再分布式下定位系統問題,如何做日誌跟蹤,就像我們電信領域做了十幾年的信令跟蹤的功能;

那麽差別在哪?

1.是持續集成、持續部署?對於CI、CD(持續集成、持續部署),這本身和敏捷、DevOps是交織在一起的,我認為這更傾向於軟件工程的領域而不是微服務技術本身;

2.使用不同的通訊協議是不是區別?微服務的標桿通訊協議是RESTful,而傳統的SOA一般是SOAP,不過目前來說采用輕量級的RPC框架Dubbo、Thrift、gRPC非常多,在Spring Cloud中也有Feign框架將標準RESTful轉為代碼的API這種仿RPC的行為,這些通訊協議不應該是區分微服務架構和SOA的核心差別;

3.是流行的基於容器框架還是虛擬機為主?Docker和虛擬機還是物理機都是架構實現的一種方式,不是核心區別;

微服務架構的精髓在切分

1.服務的切分上有比較大的區別,SOA原本是以一種“集成”技術出現的,很多技術方案是將原有企業內部服務封裝為一個獨立進程,這樣新的業務開發就可重用這些服務,這些服務很可能是類似供應鏈、CRM這樣的非常大的顆粒;而微服務這個“微”,就說明了他在切分上有講究,不妥協。無數的案例證明,如果你的切分是錯誤的,那麽你得不到微服務承諾的“低耦合、升級不影響、可靠性高”之類的優勢,而會比使用Monolithic有更多的麻煩。

2.不拆分存儲的微服務是偽服務:在實踐中,我們常常見到一種架構,後端存儲是全部和在一個數據庫中,僅僅把前端的業務邏輯拆分到不同的服務進程中,本質上和一個Monolithic一樣,只是把模塊之間的進程內調用改為進程間調用,這種切分不可取,違反了分布式第一原則,模塊耦合沒有解決,性能卻受到了影響。

分布式設計第一原則 — “不要分布你的對象”

.微服務的“Micro”這個詞並不是越小越好,而是相對SOA那種粗粒度的服務,我們需要更小更合適的粒度,這種Micro不是無限制的小。

如果我們將兩路(同步)通信與小/微服務結合使用,並根據比如“1個類=1個服務”的原則,那麽我們實際上回到了使用Corba、J2EE和分布式對象的20世紀90年代。遺憾的是,新生代的開發人員沒有使用分布式對象的經驗,因此也就沒有認識到這個主意多麽糟糕,他們正試圖重復歷史,只是這次使用了新技術,比如用HTTP取代了RMI或IIOP。

微服務和Domain Driven Design

一個簡單的圖書管理系統肯定無需微服務架構。既然采用了微服務架構,那麽面對的問題空間必然是比較宏大,比如整個電商、CRM。

如何拆解服務呢?

使用什麽樣的方法拆解服務?業界流行1個類=1個服務、1個方法=1個服務、2 Pizza團隊、2周能重寫完成等方法,但是這些都缺乏實施基礎。我們必須從一些軟件設計方法中尋找,面向對象和設計模式適用的問題空間是一個模塊,而函數式編程的理念更多的是在代碼層面的微觀上起作用。

Eric Evans 的《領域驅動設計》這本書對微服務架構有很大借鑒意義,這本書提出了一個能將一個大問題空間拆解分為領域和實體之間的關系和行為的技術。目前來說,這是一個最合理的解決拆分問題的方案,透過限界上下文(Bounded Context,下文簡稱為BC)這個概念,我們能將實現細節封裝起來,讓BC都能夠實現SRP(單一職責)原則。而每個微服務正是BC在實際世界的物理映射,符合BC思路的微服務互相獨立松耦合。

微服務架構是一件好事,逼著大家關註設計軟件的合理性,如果原來在Monolithic中領域分析、面向對象設計做不好,換微服務會把這個問題成倍的放大

以電商中的訂單和商品兩個領域舉例,按照DDD拆解,他們應該是兩個獨立的限界上下文,但是訂單中肯定是包含商品的,如果貿然拆為兩個BC,查詢、調用關系就耦合在一起了,甚至有了麻煩的分布式事務的問題,這個關聯如何拆解?BC理論認為在不同的BC中,即使是一個術語,他的關註點也不一樣,在商品BC中,關註的是屬性、規格、詳情等等(實際上商品BC這個領域有價格、庫存、促銷等等,把他作為單獨一個BC也是不合理的,這裏為了簡化例子,大家先認為商品BC就是商品基礎信息), 而在訂單BC中更關註商品的庫存、價格。所以在實際編碼設計中,訂單服務往往將關註的商品名稱、價格等等屬性冗余在訂單中,這個設計解脫了和商品BC的強關聯,兩個BC可以獨立提供服務,獨立數據存儲

小結
微服務架構首先要關註的不是RPC/ServiceDiscovery/Circuit Breaker這些概念,也不是Eureka/Docker/SpringCloud/Zipkin這些技術框架,而是服務的邊界、職責劃分,劃分錯誤就會陷入大量的服務間的相互調用和分布式事務中,這種情況微服務帶來的不是便利而是麻煩。

DDD給我們帶來了合理的劃分手段,但是DDD的概念眾多,晦澀難以理解,如何抓住重點,合理的運用到微服務架構中呢?

我認為如下的幾個架構思想是重中之重
1.充血模型

2.事件驅動

上文我們聊了微服務的DDD之間的關系,很多人還是覺得很虛幻,DDD那麽復雜的理論,聚合根、值對象、事件溯源,到底我們該怎麽入手呢?

實際上DDD和面向對象設計、設計模式等等理論有千絲萬縷的聯系,如果不熟悉OOA、OOD,DDD也是使用不好的。不過學習這些OO理論的時候,大家往往感覺到無用武之地,因為大部分的Java程序員開發生涯是從學習J2EE經典的分層理論開始的(Action、Service、Dao),在這種分層理論中,我們基本沒有啥機會使用那些所謂的“行為型”的設計模式,這裏的核心原因,就是J2EE經典分層的開發方式是“貧血模型”。

Martin Fowler在他的《企業應用架構模式》這本書中提出了兩種開發方式“事務腳本”和“領域模型”,這兩種開發分別對應了“貧血模型”和“充血模型”。

事務腳本開發模式

事務腳本的核心是過程,可以認為大部分的業務處理都是一條條的SQL,事務腳本把單個SQL組織成為一段業務邏輯,在邏輯執行的時候,使用事務來保證邏輯的ACID。最典型的就是存儲過程。當然我們在平時J2EE經典分層架構中,經常在Service層使用事務腳本。
技術分享圖片

使用這種開發方式,對象只用於在各層之間傳輸數據用,這裏的對象就是“貧血模型”,只有數據字段和Get/Set方法,沒有邏輯在對象中。

我們以一個庫存扣減的場景來舉例:

業務場景

首先談一下業務場景,一個下訂單扣減庫存(鎖庫存),這個很簡單
先判斷庫存是否足夠,然後扣減可銷售庫存,增加訂單占用庫存,然後再記錄一個庫存變動記錄日誌(作為憑證)

貧血模型的設計

首先設計一個庫存表 Stock,有如下字段
技術分享圖片

設計一個Stock對象(Getter和Setter省略)
技術分享圖片

Service入口

設計一個StockService,在其中的lock方法中寫邏輯

入參為(spuId, skuId, num)

實現偽代碼
技術分享圖片

ok,打完收工,如果做的好一些,可以把update和select count合一,這樣可以利用一條語句完成自旋,解決並發問題(高手)。

小結一下:
有沒有發現,在這個業務領域非常重要的核心邏輯 — 下訂單扣減庫存中操作過程中,Stock對象根本不用出現,全部是數據庫操作SQL,所謂的業務邏輯就是由多條SQL構成。Stock只是CRUD的數據對象而已,沒邏輯可言。

馬丁福勒定義的“貧血模型”是反模式,面對簡單的小系統用事務腳本方式開發沒問題,業務邏輯復雜了,業務邏輯、各種狀態散布在大量的函數中,維護擴展的成本一下子就上來,貧血模型沒有實施微服務的基礎。

雖然我們用Java這樣的面向對象語言來開發,但是其實和過程型語言是一樣的,所以很多情況下大家用數據庫的存儲過程來替代Java寫邏輯反而效果會更好,(ps:用了Spring boot也不是微服務).

如果你也想在IT行業拿高薪,可以參加我們的訓練營課程,選擇最適合自己的課程學習,技術大牛親授,7個月後,進入名企拿高薪。我們的課程內容有:Java工程化、高性能及分布式、高性能、深入淺出。高架構。性能調優、Spring,MyBatis,Netty源碼分析和大數據等多個知識點。如果你想拿高薪的,想學習的,想就業前景好的,想跟別人競爭能取得優勢的,想進阿裏面試但擔心面試不過的,你都可以來,群號為:575745314

領域模型的開發模式

領域模型是將數據和行為封裝在一起,並與現實世界的業務對象相映射。各類具備明確的職責劃分,使得邏輯分散到合適對象中。這樣的對象就是“充血模型” 。

在具體實踐中,我們需要明確一個概念,就是領域模型是有狀態的,他代表一個實際存在的事物。還是接著上面的例子,我們設計Stock對象需要代表一種商品的實際庫存,並在這個對象上面加上業務邏輯的方法.

技術分享圖片

這樣做下單鎖庫存業務邏輯的時候,每次必須先從Repository根據主鍵load還原Inventory這個對象,然後執行對應的lock(num)方法改變這個Inventory對象的狀態(屬性也是狀態的一種),然後再通過Repository的save方法把這個對象持久化到存儲去。

完成上述一系列操作的是Application,Application對外提供了這種集成操作的接口

技術分享圖片

領域模型開發方法最重要的是把扣減造成的狀態變化的細節放到了Inventory對象執行,這就是對業務邏輯的封裝。

Application對象的lock方法可以和事務腳本方法的StockService的lock來做個對比,StockService是完全掌握所有細節,一旦有了變化(比如庫存為0也可以扣減),Service方法要跟著變;而Application這種方式不需要變化,只要在Inventory對象內部計算就可以了。代碼放到了合適的地方,計算在合適層次,一切都很合理。這種設計可以充分利用各種OOD、OOP的理論把業務邏輯實現的很漂亮。

充血模型的缺點

從上面的例子,在Repository的load 到執行業務方法,再到save回去,這是需要耗費一定時間的,但是這個過程中如果多個線程同時請求對Inventory庫存的鎖定,那就會導致狀態的不一致,麻煩的是針對庫存的並發不僅難處理而且很常見。

貧血模型完全依靠數據庫對並發的支撐,實現可以簡化很多,但充血模型就得自己實現了,不管是在內存中通過鎖對象,還是使用Redis的遠程鎖機制,都比貧血模型復雜而且可靠性下降,這是充血模型帶來的挑戰。更好的辦法是可以通過事件驅動的架構來取消並發。

領域模型和微服務的關系

上面講了領域模型的實現,但是他和微服務是什麽關系呢?在實踐中,這個Inventory是一個限界上下文的聚合根,我們可以認為一個聚合根就是一個微服務進程。

不過問題又來了,一個庫存的Inventory一定和商品信息是有關聯的,僅僅靠Inventory中的冗余那點商品ID是不夠的,商品的上下架狀態等等都是業務邏輯需要的,那不是又把商品Sku這樣的重型對象引入了這個微服務?兩個重型的對象在一個服務中?這樣的微服務拆不開啊,還是必須依靠商品庫?!

接上文,我們采用了領域驅動的開發方式,使用了充血模型,享受了他的好處,但是也不得不面對他帶來的弊端。這個弊端在分布式的微服務架構下面又被放大。

事務一致性

事務一致性的問題在Monolithic下面不是大問題,在微服務下面卻是很致命,我們回顧一下所謂的ACID原則

1:Atomicity – 原子性,改變數據狀態要麽是一起完成,要麽一起失敗

2:Consistency – 一致性,數據的狀態是完整一致的

3:Isolation – 隔離線,即使有並發事務,互相之間也不影響

4:Durability – 持久性, 一旦事務提交,不可撤銷

在單體服務和關系型數據庫的時候,我們很容易通過數據庫的特性去完成ACID。但是一旦你按照DDD拆分聚合根-微服務架構,他們的數據庫就已經分離開了,你就要獨立面對分布式事務,要在自己的代碼裏面滿足ACID。

對於分布式事務,大家一般會想到以前的JTA標準,2PC兩段式提交。我記得當年在Dubbo群裏面,基本每周都會有人詢問Dubbo啥時候支撐分布式事務。實際上根據分布式系統中CAP原則,當P(分區容忍)發生的時候,強行追求C(一致性),會導致(A)可用性、吞吐量下降,此時我們一般用最終一致性來保證我們系統的AP能力。當然不是說放棄C,而是在一般情況下CAP都能保證,在發生分區的情況下,我們可以通過最終一致性來保證數據一致。

例:

在電商業務的下訂單凍結庫存場景。需要根據庫存情況確定訂單是否成交。

假設你已經采用了分布式系統,這裏訂單模塊和庫存模塊是兩個服務,分別擁有自己的存儲(關系型數據庫),

技術分享圖片

在一個數據庫的時候,一個事務就能搞定兩張表的修改,但是微服務中,就沒法這麽做了。

在DDD理念中,一次事務只能改變一個聚合內部的狀態,如果多個聚合之間需要狀態一致,那麽就要通過最終一致性。訂單和庫存明顯是分屬於兩個不同的限界上下文的聚合,這裏需要實現最終一致性,就需要使用事件驅動的架構。

事件驅動實現最終一致性

事件驅動架構在領域對象之間通過異步的消息來同步狀態,有些消息也可以同時發布給多個服務,在消息引起了一個服務的同步後可能會引起另外消息,事件會擴散開。嚴格意義上的事件驅動是沒有同步調用的。

例子:
在訂單服務新增訂單後,訂單的狀態是“已開啟”,然後發布一個Order Created事件到消息隊列上

技術分享圖片

庫存服務在接收到Order Created 事件後,將庫存表格中的某sku減掉可銷售庫存,增加訂單占用庫存,然後再發送一個Inventory Locked事件給消息隊列

技術分享圖片

訂單服務接收到Inventory Locked事件,將訂單的狀態改為“已確認.
技術分享圖片

有人問,如果庫存不足,鎖定不成功怎麽辦? 簡單,庫存服務發送一個Lock Fail事件, 訂單服務接收後,把訂單置為“已取消”。

好消息,我們可以不用鎖!

事件驅動有個很大的優勢就是取消了並發,所有請求都是排隊進來,這對我們實施充血模型有很大幫助,我們可以不需要自己來管理內存中的鎖了。取消鎖,隊列處理效率很高,事件驅動可以用在高並發場景下,比如搶購。

是的,用戶體驗有改變,

用了這個事件驅動,用戶的體驗有可能會有改變,比如原來同步架構的時候沒有庫存,就馬上告訴你條件不滿足無法下單,不會生成訂單;但是改了事件機制,訂單是立即生成的,很可能過了一會系統通知你訂單被取消掉。 就像搶購“小米手機”一樣,幾十萬人在排隊,排了很久告訴你沒貨了,明天再來吧。如果希望用戶立即得到結果,可以在前端想辦法,在BFF(Backend For Frontend)使用CountDownLatch這樣的鎖把後端的異步轉成前端同步,當然這樣BFF消耗比較大。

沒辦法,產品經理不接受,

產品經理說用戶的體驗必須是沒有庫存就不會生成訂單,這個方案會不斷的生成取消的訂單,他不能接受,怎麽辦?那就在訂單列表查詢的時候,略過這些cancel狀態的訂單吧,也許需要一個額外的視圖來做。我並不是一個理想主義者,解決當前的問題是我首先要考慮的,我們設計微服務的目的是本想是解決業務並發量。而現在面臨的卻是用戶體驗的問題,所以架構設計也是需要妥協的:( 但是至少分析完了,我知道我妥協在什麽地方,為什麽妥協,未來還有可能改變。
推薦一個交流學習群:575745314裏面會分享一些資深架構師錄制的視頻錄像:有Spring,MyBatis,Netty源碼分析,高並發、高性能、分布式、微服務架構的原理,JVM性能優化這些成為架構師必備的知識體系。還能領取免費的學習資源,目前受益良多:
技術分享圖片

多個領域多表Join查詢

我個人認為聚合根這樣的模式對修改狀態是特別合適,但是對搜索數據的確是不方便,比如篩選出一批符合條件的訂單這樣的需求,本身聚合根對象不能承擔批量的查詢任務,因為這不是他的職責。那就必須依賴“領域服務(Domain Service)”這種設施。

當一個方法不便放在實體或者值對象上,使用領域服務便是最佳的解決方法,請確保領域服務是無狀態的。

我們的查詢任務往往很復雜,比如查詢商品列表,要求按照上個月的銷售額進行排序; 要按照商品的退貨率排序等等。但是在微服務和DDD之後,我們的存儲模型已經被拆離開,上述的查詢都是要涉及訂單、用戶、商品多個領域的數據。如何搞? 此時我們要引入一個視圖的概念。比如下面的,查詢用戶名下訂單的操作,直接調用兩個服務自己在內存中join效率無疑是很低的,再加上一些filter條件、分頁,沒法做了。於是我們將事件廣播出去,由一個單獨的視圖服務來接收這些事件,並形成一個物化視圖(materialized view),這些數據已經join過,處理過,放在一個單獨的查詢庫中,等待查詢,這是一個典型的以空間換時間的處理方式。

技術分享圖片

經過分析,除了簡單的根據主鍵Find或者沒有太多關聯的List查詢,我們大部分的查詢任務可以放到單獨的查詢庫中,這個查詢庫可以是關系數據庫的ReadOnly庫,也可以是NoSQL的數據庫,實際上我們在項目中使用了ElasticSearch作為專門的查詢視圖,效果很不錯

限界上下文(Bounded Context)和數據耦合

除了多領域join的問題,我們在業務中還會經常碰到一些場景,比如電商中的商品信息是基礎信息,屬於單獨的BC,而其他BC,不管是營銷服務、價格服務、購物車服務、訂單服務都是需要引用這個商品信息的。但是需要的商品信息只是全部的一小部分而已,營銷服務需要商品的id和名稱、上下架狀態;訂單服務需要商品id、名稱、目錄、價格等等。這比起商品中心定義一個商品(商品id、名稱、規格、規格值、詳情等等)只是一個很小的子集。這說明不同的限界上下文的同樣的術語,但是所指的概念不一樣。 這樣的問題映射到我們的實現中,每次在訂單、營銷模塊中直接查詢商品模塊,肯定是不合適,因為商品中心需要適配每個服務需要的數據,提供不同的接口並發量必然很大,服務之間的耦合嚴重,一旦宕機、升級影響的範圍很大。

特別是最後一條,嚴重限制了我們獲得微服務提供的優勢“松耦合、每個服務自己可以頻繁升級不影響其他模塊”。這就需要我們通過事件驅動方法,適當冗余一些數據到不同的BC去,把這種耦合拆解開。這種耦合有時候是通過Value Object嵌入到實體中的方式,在生成實體的時候就冗余,比如訂單在生成的時候就冗余了商品的信息;有時候是通過額外的Value Object列表方式,營銷中心冗余一部分相關的商品列表數據,並隨時關註監聽商品的上下級狀態,同步替換掉本限界上下文的商品列表。

下圖一個下單場景分析,在電商系統中,我們可以認為會員和商品是所有業務的基礎數據,他們的變更應該是通過廣播的方式發布到各個領域,每個領域保留自己需要的信息。

技術分享圖片

保證最終一致性

最終一致性成功依賴很多條件

1:依賴消息傳遞的可靠性,可能A系統變更了狀態,消息發到B系統的時候丟失了,導致AB的狀態不一致

2:依賴服務的可靠性,如果A系統變更了自己的狀態,但是還沒來得及發送消息就掛了。也會導致狀態不一致

我記得JavaEE規範中的JMS中有針對這兩種問題的處理要求,一個是JMS通過各種確認消息(Client Acknowledge等)來保證消息的投遞可靠性,另外是JMS的消息投遞操作可以加入到數據庫的事務中-即沒有發送消息,會引起數據庫的回滾(沒有查資料,不是很準確的描述,請專家指正)。不過現在符合JMS規範的MQ沒幾個,特別是保一致性需要降低性能,現在標榜高吞吐量的MQ都把問題拋給了我們自己的應用解決。所以這裏介紹幾個常見的方法,來提升最終一致性的效果。

使用本地事務還是以上面的訂單扣取信用的例子

訂單服務開啟本地事務,首先新增訂單;然後將Order Created事件插入一張專門Event表,事務提交;有一個單獨的定時任務線程,定期掃描Event表,掃出來需要發送的就丟到MQ,同時把Event設置為“已發送”。

技術分享圖片

方案的優勢是使用了本地數據庫的事務,如果Event沒有插入成功,那麽訂單也不會被創建;線程掃描後把event置為已發送,也確保了消息不會被漏發(我們的目標是寧可重發,也不要漏發,因為Event處理會被設計為冪等)。

缺點是需要單獨處理Event發布在業務邏輯中,繁瑣容易忘記;Event發送有些滯後;定時掃描性能消耗大,而且會產生數據庫高水位隱患;我們稍作改進,使用數據庫特有的MySQL Binlog跟蹤(阿裏的Canal)或者Oracle的GoldenGate技術可以獲得數據庫的Event表的變更通知,這樣就可以避免通過定時任務來掃描了.

技術分享圖片

不過用了這些數據庫日誌的工具,會和具體的數據庫實現(甚至是特定的版本)綁定,決策的時候請慎重。

使用Event Sourcing 事件溯源

事件溯源對我們來說是一個特別的思路,他並不持久化Entity對象,而是只把初始狀態和每次變更的Event記錄下來,並在內存中根據Event還原Entity對象的最新狀態,具體實現很類似數據庫的Redolog的實現,只是他把這種機制放到了應用層來。

雖然事件溯源有很多宣稱的優勢,引入這種技術要特別小心,首先他不一定適合大部分的業務場景,一旦變更很多的情況下,效率的確是個大問題;另外一些查詢的問題也是困擾。

我們僅僅在個別的業務上探索性的使用Event Souring和AxonFramework,由於實現起來比較復雜,具體的情況還需要等到實踐一段時間後再來總結,也許需要額外的一篇文章來詳細描述

多研究些架構,少談些框架——一名阿裏架構師的筆記