斷路器hystrix
在微服務架構中,我們將系統拆分成了一個個的服務單元,各單元間通過服務註冊與訂閱的方式互相依賴。由於每個單元都在不同的進程中運行,依賴通過遠程調用的方式執行,這樣就有可能因為網絡原因或是依賴服務自身問題出現調用故障或延遲,而這些問題會直接導致調用方的對外服務也出現延遲,若此時調用方的請求不斷增加,最後就會出現因等待出現故障的依賴方響應而形成任務積壓,最終導致自身服務的癱瘓。
舉個例子,在一個電商網站中,我們可能會將系統拆分成,用戶、訂單、庫存、積分、評論等一系列的服務單元。用戶創建一個訂單的時候,在調用訂單服務創建訂單的時候,會向庫存服務來請求出貨(判斷是否有足夠庫存來出貨)。此時若庫存服務因網絡原因無法被訪問到,導致創建訂單服務的線程進入等待庫存申請服務的響應,在漫長的等待之後用戶會因為請求庫存失敗而得到創建訂單失敗的結果。如果在高並發情況之下,因這些等待線程在等待庫存服務的響應而未能釋放,使得後續到來的創建訂單請求被阻塞,最終導致訂單服務也不可用。
在微服務架構中,存在著那麽多的服務單元,若一個單元出現故障,就會因依賴關系形成故障蔓延,最終導致整個系統的癱瘓,這樣的架構相較傳統架構就更加的不穩定。為了解決這樣的問題,因此產生了斷路器模式。
什麽是斷路器
斷路器模式源於Martin Fowler的Circuit Breaker一文。“斷路器”本身是一種開關裝置,用於在電路上保護線路過載,當線路中有電器發生短路時,“斷路器”能夠及時的切斷故障電路,防止發生過載、發熱、甚至起火等嚴重後果。
在分布式架構中,斷路器模式的作用也是類似的,當某個服務單元發生故障(類似用電器發生短路)之後,通過斷路器的故障監控(類似熔斷保險絲),向調用方返回一個錯誤響應,而不是長時間的等待。這樣就不會使得線程因調用故障服務被長時間占用不釋放,避免了故障在分布式系統中的蔓延。
Netflix Hystrix
在Spring Cloud中使用了Hystrix 來實現斷路器的功能。Hystrix是Netflix開源的微服務框架套件之一,該框架目標在於通過控制那些訪問遠程系統、服務和第三方庫的節點,從而對延遲和故障提供更強大的容錯能力。Hystrix具備擁有回退機制和斷路器功能的線程和信號隔離,請求緩存和請求打包,以及監控和配置等功能。
下面我們來看看如何使用Hystrix。
準備工作
在開始加入斷路器之前,我們先拿之前構建兩個微服務為基礎進行下面的操作,主要使用下面幾個工程:
- chapter9-1-1
- eureka-server工程:服務註冊中心,端口1111
- compute-service工程:服務單元,端口2222
- chapter9-1-2
- eureka-ribbon:通過ribbon實現的服務單元,依賴compute-service的服務,端口3333
- eureka-feign:通過feign實現的服務單元,依賴compute-service的服務,端口3333
若您還沒有使用Spring Cloud的經驗,可以先閱讀《服務註冊與發現》與《服務消費者》,對Spring Cloud構建的微服務有一個初步的認識。
Ribbon中引入Hystrix
- 依次啟動eureka-server、compute-service、eureka-ribbon工程
- 訪問http://localhost:1111/可以看到註冊中心的狀態
- 訪問http://localhost:3333/add,調用eureka-ribbon的服務,該服務會去調用compute-service的服務,計算出10+20的值,頁面顯示30
- 關閉compute-service服務,訪問http://localhost:3333/add,我們獲得了下面的報錯信息
1 2 3 4 5 6 7 | Whitelabel Error Page This application has no explicit mapping for /error, so you are seeing this as a fallback. Sat Jun 25 21:16:59 CST 2016 There was an unexpected error (type=Internal Server Error, status=500). I/O error on GET request for "http://COMPUTE-SERVICE/add?a=10&b=20": Connection refused: connect; nested exception is java.net.ConnectException: Connection refused: connect |
pom.xml
中引入依賴hystrix依賴
1 2 3 4 | <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-hystrix</artifactId> </dependency> |
- 在eureka-ribbon的主類
RibbonApplication
中使用@EnableCircuitBreaker
註解開啟斷路器功能:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | public class RibbonApplication { RestTemplate restTemplate() { return new RestTemplate(); } public static void main(String[] args) { SpringApplication.run(RibbonApplication.class, args); } } |
- 改造原來的服務消費方式,新增
ComputeService
類,在使用ribbon消費服務的函數上增加@HystrixCommand
註解來指定回調方法。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | public class ComputeService { RestTemplate restTemplate; public String addService() { return restTemplate.getForEntity("http://COMPUTE-SERVICE/add?a=10&b=20", String.class).getBody(); } public String addServiceFallback() { return "error"; } } |
註意:fallbackMethod的方法和原方法的參數個數個類型以及返回類型必須一致
- 提供rest接口的Controller改為調用ComputeService的addService
1 2 3 4 5 6 7 8 9 10 11 12 | public class ConsumerController { private ComputeService computeService; public String add() { return computeService.addService(); } } |
- 驗證斷路器的回調
- 依次啟動eureka-server、compute-service、eureka-ribbon工程
- 訪問http://localhost:1111/可以看到註冊中心的狀態
- 訪問http://localhost:3333/add,頁面顯示:30
- 關閉compute-service服務後再訪問http://localhost:3333/add,頁面顯示:error
更多關於Hystrix的使用可參考How To Use
Feign使用Hystrix
註意這裏說的是“使用”,沒有錯,我們不需要在Feigh工程中引入Hystix,Feign中已經依賴了Hystrix,我們可以在未做任何改造前,嘗試下面你的操作:
- 依次啟動eureka-server、compute-service、eureka-feign工程
- 訪問http://localhost:1111/可以看到註冊中心的狀態
- 訪問http://localhost:3333/add,調用eureka-feign的服務,該服務會去調用compute-service的服務,計算出10+20的值,頁面顯示30
- 關閉compute-service服務,訪問http://localhost:3333/add,我們獲得了下面的報錯信息
1 2 3 4 5 6 7 | Whitelabel Error Page This application has no explicit mapping for /error, so you are seeing this as a fallback. Sat Jun 25 22:10:05 CST 2016 There was an unexpected error (type=Internal Server Error, status=500). add timed-out and no fallback available. |
如果您夠仔細,會發現與在ribbon中的報錯是不同的,看到add timed-out and no fallback available
這句,或許您已經猜到什麽,看看我們的控制臺,可以看到報錯信息來自hystrix-core-1.5.2.jar
,所以在這個工程中,我們要學習的就是如何使用Feign中集成的Hystrix。
- 使用
@FeignClient
註解中的fallback屬性指定回調類
1 2 3 4 5 6 7 | public interface ComputeClient { Integer add(@RequestParam(value = "a") Integer a, @RequestParam(value = "b") Integer b); } |
- 創建回調類
ComputeClientHystrix
,實現@FeignClient
的接口,此時實現的方法就是對應@FeignClient
接口中映射的fallback函數。
1 2 3 4 5 6 7 8 9 | public class ComputeClientHystrix implements ComputeClient { public Integer add(@RequestParam(value = "a") Integer a, @RequestParam(value = "b") Integer b) { return -9999; } } |
- 再用之前的方法驗證一下,是否在compute-service服務不可用的情況下,頁面返回了-9999。
在feign以及ribbon的application.properties中可以添加hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=5000來設置斷路器的超時時間,超過5秒後,斷路器才認為調用的方法超時,則立即返回fallback方法。同時也可以防止feign和ribbon第一次被訪問出現無法訪問的情況,因為spring的懶加載機制。
斷路器hystrix