1. 程式人生 > >用 Hystrix 構建高可用服務架構

用 Hystrix 構建高可用服務架構

1.Hystrix 是什麼?

在分散式系統中,每個服務都可能會呼叫很多其他服務,被呼叫的那些服務就是依賴服務,有的時候某些依賴服務出現故障也是很正常的。

Hystrix 可以讓我們在分散式系統中對服務間的呼叫進行控制,加入一些呼叫延遲或者依賴故障容錯機制

Hystrix 通過將依賴服務進行資源隔離,進而阻止某個依賴服務出現故障時在整個系統所有的依賴服務呼叫中進行蔓延;同時Hystrix 還提供故障時的 fallback 降級機制。

總而言之,Hystrix 通過這些方法幫助我們提升分散式系統的可用性和穩定性。

 

2.Hystrix 的歷史

Hystrix 是高可用性保障的一個框架。Netflix(可以認為是國外的優酷或者愛奇藝之類的視訊網站)的 API 團隊從 2011 年開始做一些提升系統可用性和穩定性的工作,Hystrix 就是從那時候開始發展出來的。

在 2012 年的時候,Hystrix 就變得比較成熟和穩定了,Netflix 中,除了 API 團隊以外,很多其他的團隊都開始使用 Hystrix。

時至今日,Netflix 中每天都有數十億次的服務間呼叫,通過 Hystrix 框架在進行,而 Hystrix 也幫助 Netflix 網站提升了整體的可用性和穩定性。

2018 年 11 月,Hystrix 在其 Github 主頁宣佈,不再開放新功能,推薦開發者使用其他仍然活躍的開源專案。維護模式的轉變絕不意味著 Hystrix 不再有價值。相反,Hystrix 激發了很多偉大的想法和專案,我們高可用的這一塊知識還是會針對 Hystrix 進行講解。

 

3.Hystrix 的設計原則

  • 對依賴服務呼叫時出現的呼叫延遲和呼叫失敗進行控制和容錯保護
  • 在複雜的分散式系統中,阻止某一個依賴服務的故障在整個系統中蔓延。比如某一個服務故障了,導致其它服務也跟著故障。
  • 提供 fail-fast(快速失敗)和快速恢復的支援。
  • 提供 fallback 優雅降級的支援。
  • 支援近實時的監控、報警以及運維操作。

舉個栗子。

有這樣一個分散式系統,服務 A 依賴於服務 B,服務 B 依賴於服務 C/D/E。在這樣一個成熟的系統內,比如說最多可能只有 100 個執行緒資源。正常情況下,40 個執行緒併發呼叫服務 C,各 30 個執行緒併發呼叫 D/E。

呼叫服務 C,只需要 20ms,現在因為服務 C 故障了,比如延遲,或者掛了,此時執行緒會 hang 住 2s 左右。40 個執行緒全部被卡住,由於請求不斷湧入,其它的執行緒也用來呼叫服務 C,同樣也會被卡住。這樣導致服務 B 的執行緒資源被耗盡,無法接收新的請求,甚至可能因為大量執行緒不斷的運轉,導致自己宕機。服務 A 也掛。

 

原文:Java架構筆記

免費Java高階資料需要自己領取,涵蓋了Java、Redis、MongoDB、MySQL、Zookeeper、Spring Cloud、Dubbo高併發分散式等教程,一共30G。          
傳送門:           https://mp.weixin.qq.com/s/JzddfH-7yNudmkj