1. 程式人生 > 實用技巧 >關於分散式事務、兩階段提交、一階段提交、Best Efforts 1PC模式和事務補償機制的研究...

關於分散式事務、兩階段提交、一階段提交、Best Efforts 1PC模式和事務補償機制的研究...

>>> hot3.png

1.XA

XA是由X/Open組織提出的分散式事務的規範。XA規範主要 定義了(全域性)事務管理器(Transaction Manager)和(區域性)資源管理器(Resource Manager)之間的介面。XA介面是雙向的系統介面,在事務管理器(Transaction Manager)以及一個或多個資源管理器(Resource Manager)之間形成通訊橋樑。XA之所以需要引入事務管理器是因為,在分散式系統中,從理論上講(參考Fischer等的論文),兩臺機器理論上無 法達到一致的狀態,需要引入一個單點進行協調。事務管理器控制著全域性事務,管理事務生命週期,並協調資源。資源管理器負責控制和管理實際資源(如資料庫或 JMS佇列)。下圖說明了事務管理器、資源管理器,與應用程式之間的關係:


圖1.XA規範下的分散式事務各類參與者之間的關係


2.JTA

作 為java平臺上事務規範JTA(Java Transaction API)也定義了對XA事務的支援,實際上,JTA是基於XA架構上建模的,在JTA 中,事務管理器抽象為javax.transaction.TransactionManager介面,並通過底層事務服務(即JTS)實現。像很多其他 的java規範一樣,JTA僅僅定義了介面,具體的實現則是由供應商(如J2EE廠商)負責提供,目前JTA的實現主要由以下幾種:


1.J2EE容器所提供的JTA實現(JBoss)
2.獨立的JTA實現:如JOTM,Atomikos.這些實現可以應用在那些不使用J2EE應用伺服器的環境裡用以提供分佈事事務保證。如Tomcat,Jetty以及普通的java應用。

3.兩階段提交

所有關於分散式事務的介紹中都必然會講到兩階段提交,因為它是實現XA分散式事務的關鍵(確切地說:兩階段提交主要保證了分散式事務的原子性:即所有結點要麼全做要麼全不做)。所謂的兩個階段是指:第一階段:準備階段和第二階段:提交階段。


圖2.兩階段提交示意圖(摘自info釋出的《java事務設計策略》一文)

1.準備階段: 事務協調者(事務管理器)給每個參與者(資源管理器)傳送Prepare訊息,每個參與者要麼直接返回失敗(如許可權驗證失敗),要麼在本地執行事務,寫本 地的redo和undo日誌,但不提交,到達一種“萬事俱備,只欠東風”的狀態。(關於每一個參與者在準備階段具體做了什麼目前我還沒有參考到確切的資 料,但是有一點非常確定:參與者在準備階段完成了幾乎所有正式提交的動作,有的材料上說是進行了“試探性的提交”,只保留了最後一步耗時非常短暫的正式提 交操作給第二階段執行。)


2.提交階段:如果協調者收到了參與者的失敗訊息或者超時,直接給每個參與者傳送回滾(Rollback)訊息;否則,傳送提交(Commit)訊息;參與者根據協調者的指令執行提交或者回滾操作,釋放所有事務處理過程中使用的鎖資源。(注意:必須在最後階段釋放鎖資源)

將 提交分成兩階段進行的目的很明確,就是儘可能晚地提交事務,讓事務在提交前儘可能地完成所有能完成的工作,這樣,最後的提交階段將是一個耗時極短的微小操 作,這種操作在一個分散式系統中失敗的概率是非常小的,也就是所謂的“網路通訊危險期”非常的短暫,這是兩階段提交確保分散式事務原子性的關鍵所在。(唯 一理論上兩階段提交出現問題的情況是當協調者發出提交指令後當機並出現磁碟故障等永久性錯誤,導致事務不可追蹤和恢復)

從兩階段提交的工 作方式來看,很顯然,在提交事務的過程中需要在多個節點之間進行協調,而各節點對鎖資源的釋放必須等到事務最終提交時,這樣,比起一階段提交,兩階段提交 在執行同樣的事務時會消耗更多時間。事務執行時間的延長意味著鎖資源發生衝突的概率增加,當事務的併發量達到一定數量的時候,就會出現大量事務積壓甚至出 現死鎖,系統性能就會嚴重下滑。這就是使用XA事務

4.一階段提交(Best Efforts 1PC模式)

不 像兩階段提交那樣複雜,一階段提交非常直白,就是從應用程式向資料庫發出提交請求到資料庫完成提交或回滾之後將結果返回給應用程式的過程。一階段提交不需 要“協調者”角色,各結點之間不存在協調操作,因此其事務執行時間比兩階段提交要短,但是提交的“危險期”是每一個事務的實際提交時間,相比於兩階段提 交,一階段提交出現在“不一致”的概率就變大了。但是我們必須注意到:只有當基礎設施出現問題的時候(如網路中斷,當機等),一階段提交才可能會出現“不 一致”的情況,相比它的效能優勢,很多團隊都會選擇這一方案。關於在spring環境下如何實現一階段提交,有一篇非常優秀的文章值得參考:http://www.javaworld.com/javaworld/jw-01-2009/jw-01-spring-transactions.html?page=5

5.事務補償機制

像best efforts 1PC這種模式,前提是應用程式能獲取所有的資料來源,然後使用同一個事務管理器(這裡指是的spring的事務管理器)管理事務。這種模式最典型的應用場 景非資料庫sharding莫屬。但是對於那些基於web service/rpc/jms等構建的高度自治(autonomy)的分散式系統介面,best efforts 1PC模式是無能為力的,此類場景下,還有最後一種方法可以幫助我們實現“最終一致性”,那就是事務補償機制。關於事務補償機制是一個大話題,本文只簡單 提及,以後會作專門的研究和介紹。

6.在基於兩階段提交的標準分散式事務和Best Efforts 1PC兩者之間如何選擇

一 般而言,需要互動的子系統數量較少,並且整個系統在未來不會或很少引入新的子系統且負載長期保持穩定,即無伸縮要求的話,考慮到開發複雜度和工作量,可以 選擇使用分散式事務。對於時間需求不是很緊,對效能要求很高的系統,應考慮使用Best Efforts 1PC或事務補償機制。對於那些需要進行sharding改造的系統,基本上不應再考慮分散式事務,因為sharding打開了資料庫水平伸縮的視窗,使 用分散式事務看起來好像是為新開啟的視窗又加上了一把枷鎖。

補充:關於網路通訊的危險期

由 於網路通訊故障隨時可能發生,任何發出請求後等待迴應的程式都會有失去聯絡的危險。這種危險發生在發出請求之後,伺服器返回應答之前,如果在這個期間網 絡通訊發生故障,發出請求一方無法收到迴應,於是無法判斷伺服器是否已經成功地處理請求,因為收不到迴應可能是請求沒有成功地傳送到伺服器,也可能是服務 器處理完成後的迴應無法傳回請求方。這段時間稱為網路通訊的危險期(In-doubt Time)。很顯然,網路通訊的危險期是分散式系統除單點可靠性之外需要考慮的另一個可靠性問題。

參考資料:

1.百度百科
2.http://en.wikipedia.org/wiki/Java_Transaction_API
3.http://www.nosqlnotes.net/archives/62#more-62
4.http://hi.baidu.com/javaopensource/blog/item/0a2b764ec501b10cb3de05ba.html


轉載於:https://my.oschina.net/piorcn/blog/354942