1. 程式人生 > >高可用高並發常用到的9種技術

高可用高並發常用到的9種技術

本地 多個 代碼管理 單位 負責 定期 低耦合 發生 分布式計算框架

1、分層

分層是企業應用系統中最常見的一種架構模式,將系統在橫向維度上切分成幾個部分,每個部分負責一部分相對簡單並比較單一的職責,然後通過上層對下層的依賴和調度組成一個完整的系統。

在網站的分層架構中,常見的為3層,即應用層、服務層、數據層。應用層具體負責業務和視圖的展示;服務層為應用層提供服務支持;數據庫提供數據存儲訪問服務,如數據庫、緩存、文件、搜索引擎等。

分層架構是邏輯上的,在物理部署上,三層架構可以部署在同一個物理機器上,但是隨著網站業務的發展,必然需要對已經分層的模塊分離部署,即三層結構分別部署在不同的服務器上,是網站擁有更多的計算資源以應對越來越多的用戶訪問。

所以雖然分層架構模式最初的目的是規劃軟件清晰的邏輯結構以便於開發維護,但在網站的發展過程中,分層結構對網站支持高並發向分布式方向的發展至關重要。

2、冗余

網站需要7×24小時連續運行,那麽就得有相應的冗余機制,以防某臺機器宕掉時無法訪問,而冗余則可以通過部署至少兩臺服務器構成一個集群實現服務高可用。數據庫除了定期備份還需要實現冷熱備份。甚至可以在全球範圍內部署災備數據中心。

3、分隔

如果說分層是將軟件在橫向方面進行切分,那麽分隔就是在縱向方面對軟件進行切分。

網站越大,功能越復雜,服務和數據處理的種類也越多,將這些不同的功能和服務分隔開來,包裝成高內聚低耦合的模塊單元,不僅有助於軟件的開發維護也便於不同模塊的分布式部署,提高網站的並發處理能力和功能擴展能力。

大型網站分隔的粒度可能會很小。比如在應用層,將不同業務進行分隔,例如將購物、論壇、搜索、廣告分隔成不同的應用,有對立的團隊負責,部署在不同的服務器上。

4、異步

使用異步,業務之間的消息傳遞不是同步調用,而是將一個業務操作分成多個階段,每個階段之間通過共享數據的方法異步執行進行協作。

具體實現則在單一服務器內部可用通過多線程共享內存對了的方式處理;在分布式系統中可用通過分布式消息隊列來實現異步。

異步架構的典型就是生產者消費者方式,兩者不存在直接調用。

5、分布式

對於大型網站,分層和分隔的一個主要目的是為了切分後的模塊便於分布式部署,即將不同模塊部署在不同的服務器上,通過遠程調用協同工作。分布式意味著可以使用更多的計算機完同樣的工作,計算機越多,CPU、內存、存儲資源就越多,能過處理的並發訪問和數據量就越大,進而能夠為更多的用戶提供服務。

在網站應用中,常用的分布式方案有一下幾種.

分布式應用和服務:將分層和分隔後的應用和服務模塊分布式部署,可以改善網站性能和並發性、加快開發和發布速度、減少數據庫連接資源消耗。

分布式靜態資源:網站的靜態資源如JS、CSS、Logo圖片等資源對立分布式部署,並采用獨立的域名,即人們常說的動靜分離。靜態資源分布式部署可以減輕應用服務器的負載壓力;通過使用獨立域名加快瀏覽器並發加載的速度。

分布式數據和存儲:大型網站需要處理以P為單位的海量數據,單臺計算機無法提供如此大的存儲空間,這些數據庫需要分布式存儲。

分布式計算:目前網站普遍使用Hadoop和MapReduce分布式計算框架進行此類批處理計算,其特點是移動計算而不是移動數據,將計算程序分發到數據所在的位置以加速計算和分布式計算。

6、安全

網站在安全架構方面有許多模式:通過密碼和手機校驗碼進行身份認證;登錄、交易需要對網絡通信進行加密;為了防止機器人程序濫用資源,需要使用驗證碼進行識別;對常見的XSS攻擊、SQL註入需要編碼轉換;垃圾信息需要過濾等。

7、自動化

具體有自動化發布過程,自動化代碼管理、自動化測試、自動化安全檢測、自動化部署、自動化監控、自動化報警、自動化失效轉移、自動化失效恢復等。

8、集群

對於用戶訪問集中的模塊需要將獨立部署的服務器集群化,即多臺服務器部署相同的應用構成一個集群,通過負載均衡設備共同對外提供服務。

服務器集群能夠為相同的服務提供更多的並發支持,因此當有更多的用戶訪問時,只需要向集群中加入新的機器即可;另外可以實現當其中的某臺服務器發生故障時,可以通過負載均衡的失效轉移機制將請求轉移至集群中其他的服務器上,因此可以提高系統的可用性。

9、緩存

緩存目的就是減輕服務器的計算,使數據直接返回給用戶。在現在的軟件設計中,緩存已經無處不在。具體實現有CDN、反向代理、本地緩存、分布式緩存等。

使用緩存有兩個條件:訪問數據熱點不均衡,即某些頻繁訪問的數據需要放在緩存中;數據在某個時間段內有效,不過很快過期,否在會因為數據過期而臟讀,影響數據的正確性。

高可用高並發常用到的9種技術