分散式系統的CAP理論

阿新 • • 發佈：2020-10-21

2000年7月，加州大學伯克利分校的Eric Brewer教授在ACM PODC會議上提出CAP猜想。2年後，麻省理工學院的Seth Gilbert和Nancy Lynch從理論上證明了CAP。之後，CAP理論正式成為分散式計算領域的公認定理。

CAP理論概述

一個分散式系統最多隻能同時滿足一致性（Consistency）、可用性（Availability）和分割槽容錯性（Partition tolerance）這三項中的兩項。

CAP的定義

Consistency 一致性

一致性指“all nodes see the same data at the same time”，即更新操作成功並返回客戶端完成後，所有節點在同一時間的資料完全一致。

分散式的一致性

對於一致性，可以分為從客戶端和服務端兩個不同的視角。從客戶端來看，一致性主要指的是多併發訪問時更新過的資料如何獲取的問題。從服務端來看，則是更新如何複製分佈到整個系統，以保證資料最終一致。一致性是因為有併發讀寫才有的問題，因此在理解一致性的問題時，一定要注意結合考慮併發讀寫的場景。

從客戶端角度，多程序併發訪問時，更新過的資料在不同程序如何獲取的不同策略，決定了不同的一致性。對於關係型資料庫，要求更新過的資料能被後續的訪問都能看到，這是強一致性。如果能容忍後續的部分或者全部訪問不到，則是弱一致性。如果經過一段時間後要求能訪問到更新後的資料，則是最終一致性。

Availability 可用性

可用性指“Reads and writes always succeed”，即服務一直可用，而且是正常響應時間。

對於一個可用性的分散式系統，每一個非故障的節點必須對每一個請求作出響應。也就是，該系統使用的任何演算法必須最終終止。當同時要求分割槽容忍性時，這是一個很強的定義：即使是嚴重的網路錯誤，每個請求必須終止。

好的可用性主要是指系統能夠很好的為使用者服務，不出現使用者操作失敗或者訪問超時等使用者體驗不好的情況。可用性通常情況下可用性和分散式資料冗餘，負載均衡等有著很大的關聯。

Partition Tolerance分割槽容錯性

分割槽容錯性指“the system continues to operate despite arbitrary message loss or failure of part of the system

”，即分散式系統在遇到某節點或網路分割槽故障的時候，仍然能夠對外提供滿足一致性和可用性的服務。

分割槽容錯性和擴充套件性緊密相關。在分散式應用中，可能因為一些分散式的原因導致系統無法正常運轉。好的分割槽容錯性要求能夠使應用雖然是一個分散式系統，而看上去卻好像是在一個可以運轉正常的整體。比如現在的分散式系統中有某一個或者幾個機器宕掉了，其他剩下的機器還能夠正常運轉滿足系統需求，或者是機器之間有網路異常，將分散式系統分隔未獨立的幾個部分，各個部分還能維持分散式系統的運作，這樣就具有好的分割槽容錯性。

CAP的證明

如上圖，是我們證明CAP的基本場景，網路中有兩個節點N1和N2，可以簡單的理解N1和N2分別是兩臺計算機，他們之間網路可以連通，N1中有一個應用程式A，和一個數據庫V，N2也有一個應用程式B2和一個數據庫V。現在，A和B是分散式系統的兩個部分，V是分散式系統的資料儲存的兩個子資料庫。

在滿足一致性的時候，N1和N2中的資料是一樣的，V0=V0。在滿足可用性的時候，使用者不管是請求N1或者N2，都會得到立即響應。在滿足分割槽容錯性的情況下，N1和N2有任何一方宕機，或者網路不通的時候，都不會影響N1和N2彼此之間的正常運作。

如上圖，是分散式系統正常運轉的流程，使用者向N1機器請求資料更新，程式A更新資料庫Vo為V1，分散式系統將資料進行同步操作M，將V1同步的N2中V0，使得N2中的資料V0也更新為V1，N2中的資料再響應N2的請求。

這裡，可以定義N1和N2的資料庫V之間的資料是否一樣為一致性；外部對N1和N2的請求響應為可用行；N1和N2之間的網路環境為分割槽容錯性。這是正常運作的場景，也是理想的場景，然而現實是殘酷的，當錯誤發生的時候，一致性和可用性還有分割槽容錯性，是否能同時滿足，還是說要進行取捨呢？

作為一個分散式系統，它和單機系統的最大區別，就在於網路，現在假設一種極端情況，N1和N2之間的網路斷開了，我們要支援這種網路異常，相當於要滿足分割槽容錯性，能不能同時滿足一致性和響應性呢？還是說要對他們進行取捨。

假設在N1和N2之間網路斷開的時候，有使用者向N1傳送資料更新請求，那N1中的資料V0將被更新為V1，由於網路是斷開的，所以分散式系統同步操作M，所以N2中的資料依舊是V0；這個時候，有使用者向N2傳送資料讀取請求，由於資料還沒有進行同步，應用程式沒辦法立即給使用者返回最新的資料V1，怎麼辦呢？有二種選擇，第一，犧牲資料一致性，響應舊的資料V0給使用者；第二，犧牲可用性，阻塞等待，直到網路連線恢復，資料更新操作M完成之後，再給使用者響應最新的資料V1。

這個過程，證明了要滿足分割槽容錯性的分散式系統，只能在一致性和可用性兩者中，選擇其中一個。

CAP權衡

通過CAP理論，我們知道無法同時滿足一致性、可用性和分割槽容錯性這三個特性，那要捨棄哪個呢？

CA without P：如果不要求P（不允許分割槽），則C（強一致性）和A（可用性）是可以保證的。但其實分割槽不是你想不想的問題，而是始終會存在，因此CA的系統更多的是允許分割槽後各子系統依然保持CA。

CP without A：如果不要求A（可用），相當於每個請求都需要在Server之間強一致，而P（分割槽）會導致同步時間無限延長，如此CP也是可以保證的。很多傳統的資料庫分散式事務都屬於這種模式。

AP wihtout C：要高可用並允許分割槽，則需放棄一致性。一旦分割槽發生，節點之間可能會失去聯絡，為了高可用，每個節點只能用本地資料提供服務，而這樣會導致全域性資料的不一致性。現在眾多的NoSQL都屬於此類。

對於多數大型網際網路應用的場景，主機眾多、部署分散，而且現在的叢集規模越來越大，所以節點故障、網路故障是常態，而且要保證服務可用性達到N個9，即保證P和A，捨棄C（退而求其次保證最終一致性）。雖然某些地方會影響客戶體驗，但沒達到造成使用者流程的嚴重程度。

對於涉及到錢財這樣不能有一絲讓步的場景，C必須保證。網路發生故障寧可停止服務，這是保證CA，捨棄P。貌似這幾年國內銀行業發生了不下10起事故，但影響面不大，報到也不多，廣大群眾知道的少。還有一種是保證CP，捨棄A。例如網路故障事只讀不寫。

孰優孰略，沒有定論，只能根據場景定奪，適合的才是最好的。

轉載於:https://my.oschina.net/wugong/blog/1784836

分散式系統的CAP理論

CAP理論概述

CAP的定義

Consistency 一致性

Availability 可用性

Partition Tolerance分割槽容錯性

CAP的證明

CAP權衡

【分散式】CAP理論及其應用

分散式的CAP理論

分散式系統的CAP理論

分散式系統架構中關於切分資料庫事務的 ACID 性質的可用性與效能-BASE 理論和CAP 定理

5.分散式系統中的CAP的原理

分散式系統中的 CAP 定理

分散式系統理論之Quorum機制

分散式系統中ACID和CAP有什麼區別？超詳細

分散式系統中ACID和CAP有什麼區別？大廠直通車！

分散式系統下的CAP定理

[分散式]分散式CAP理論

分散式系統主從高可用實踐

分散式系統系列學習筆記:MapReduce程式設計模型（附程式碼實現）

如何基於RocketMQ的事務訊息特性實現分散式系統的最終一致性？

Spring Cloud Alibaba | Sentinel：分散式系統的流量防衛兵基礎實戰

分散式系統、微服務架構的一致性和冪等性問題相關概念解析

Brooklin: LinkedIn開源的近實時資料流大規模可擴充套件可靠分散式系統

[譯] 可靠地運維一個大型分散式系統：我的學習實踐

分散式系統-分割槽(partition)

一文詳解分散式系統的分割槽

分散式系統的CAP理論

CAP理論概述

CAP的定義

Consistency 一致性

Availability 可用性

Partition Tolerance分割槽容錯性

CAP的證明

CAP權衡

相關推薦