Dubbo詳細介紹與安裝使用過程
1 Dubbo介紹
1.1 dubbox簡介
隨著網際網路的發展,網站應用的規模不斷擴大,常規的垂直應用架構已無法應對,分散式服務架構以及流動計算架構勢在必行,亟需一個治理系統確保架構有條不紊的演進。
-
單一應用架構
當網站流量很小時,只需一個應用,將所有功能都部署在一起,以減少部署節點和成本。
此時,用於簡化增刪改查工作量的 資料訪問框架(ORM) 是關鍵。 -
垂直應用架構
當訪問量逐漸增大,單一應用增加機器帶來的加速度越來越小,將應用拆成互不相干的幾個應用,以提升效率。
此時,用於加速前端頁面開發的 Web框架(MVC) 是關鍵。 -
分散式服務架構
當垂直應用越來越多,應用之間互動不可避免,將核心業務抽取出來,作為獨立的服務,逐漸形成穩定的服務中心,使前端應用能更快速的響應多變的市場需求。
此時,用於提高業務複用及整合的 分散式服務框架(RPC) 是關鍵。 -
流動計算架構
當服務越來越多,容量的評估,小服務資源的浪費等問題逐漸顯現,此時需增加一個排程中心基於訪問壓力實時管理叢集容量,提高叢集利用率。
此時,用於提高機器利用率的 資源排程和治理中心(SOA) 是關鍵。
dubbox是dubbo的擴充套件,主要在dubbo的基礎上進行了一下的改進:
1、支援REST風格遠端呼叫(HTTP + JSON/XML):基於非常成熟的JBoss RestEasy框架,在dubbo中實現了REST風格(HTTP + JSON/XML)的遠端呼叫,以顯著簡化企業內部的跨語言互動,同時顯著簡化企業對外的Open API、無線API甚至AJAX服務端等等的開發。事實上,這個REST呼叫也使得Dubbo可以對當今特別流行的“微服務”架構提供基礎性支援。 另外,REST呼叫也達到了比較高的效能,在基準測試下,HTTP + JSON與Dubbo 2.x預設的RPC協議(即TCP + Hessian2二進位制序列化)之間只有1.5倍左右的差距,詳見文件中的基準測試報告。
2、支援基於Kryo和FST的Java高效序列化實現:基於當今比較知名的Kryo和FST高效能序列化庫,為Dubbo預設的RPC協議新增新的序列化實現,並優化調整了其序列化體系,比較顯著的提高了Dubbo RPC的效能,詳見文件中的基準測試報告。
3、支援基於Jackson的JSON序列化:基於業界應用最廣泛的Jackson序列化庫,為Dubbo預設的RPC協議新增新的JSON序列化實現。
4、支援基於嵌入式Tomcat的HTTP remoting體系:基於嵌入式tomcat實現dubbo的HTTP remoting體系(即dubbo-remoting-http),用以逐步取代Dubbo中舊版本的嵌入式Jetty,可以顯著的提高REST等的遠端呼叫效能,並將Servlet API的支援從2.5升級到3.1。(注:除了REST,dubbo中的WebServices、Hessian、HTTP Invoker等協議都基於這個HTTP remoting體系)。
5、升級Spring:將dubbo中Spring由2.x升級到目前最常用的3.x版本,減少版本衝突帶來的麻煩。
6、升級ZooKeeper客戶端:將dubbo中的zookeeper客戶端升級到最新的版本,以修正老版本中包含的bug。
7、支援完全基於Java程式碼的Dubbo配置:基於Spring的Java Config,實現完全無XML的純Java程式碼方式來配置dubbo
8、調整Demo應用:暫時將dubbo的demo應用調整並改寫以主要演示REST功能、Dubbo協議的新序列化方式、基於Java程式碼的Spring配置等等。
9、修正了dubbo的bug 包括配置、序列化、管理介面等等的bug。
1.2 dubbo架構構成
dubbo執行架構如下圖示:
- 節點角色說明:
- 1
- 2
- 3
- 呼叫關係說明:
1、服務容器負責啟動,載入,執行服務提供者。
2、服務提供者在啟動時,向註冊中心註冊自己提供的服務。
3、服務消費者在啟動時,向註冊中心訂閱自己所需的服務。
4、註冊中心返回服務提供者地址列表給消費者,如果有變更,註冊中心將基於長連線推送變更資料給消費者。
5、服務消費者,從提供者地址列表中,基於軟負載均衡演算法,選一臺提供者進行呼叫,如果呼叫失敗,再選另一臺呼叫。
6、服務消費者和提供者,在記憶體中累計呼叫次數和呼叫時間,定時每分鐘傳送一次統計資料到監控中心。
1.3 dubbo的特性
(1) 連通性:
註冊中心負責服務地址的註冊與查詢,相當於目錄服務,服務提供者和消費者只在啟動時與註冊中心互動,註冊中心不轉發請求,壓力較小監控中心負責統計各服務呼叫次數,呼叫時間等,統計先在記憶體彙總後每分鐘一次傳送到監控中心伺服器,並以報表展示服務提供者向註冊中心註冊其提供的服務,並彙報呼叫時間到監控中心,此時間不包含網路開銷服務消費者向註冊中心獲取服務提供者地址列表,並根據負載演算法直接呼叫提供者,同時彙報呼叫時間到監控中心,此時間包含網路開銷註冊中心,服務提供者,服務消費者三者之間均為長連線,監控中心除外註冊中心通過長連線感知服務提供者的存在,服務提供者宕機,註冊中心將立即推送事件通知消費者註冊中心和監控中心全部宕機,不影響已執行的提供者和消費者,消費者在本地快取了提供者列表
註冊中心和監控中心都是可選的,服務消費者可以直連服務提供者
(2) 健狀性:
監控中心宕掉不影響使用,只是丟失部分取樣資料資料庫宕掉後,註冊中心仍能通過快取提供服務列表查詢,但不能註冊新服務註冊中心對等叢集,任意一臺宕掉後,將自動切換到另一臺註冊中心全部宕掉後,服務提供者和服務消費者仍能通過本地快取通訊服務提供者無狀態,任意一臺宕掉後,不影響使用服務提供者全部宕掉後,服務消費者應用將無法使用,並無限次重連等待服務提供者恢復
(3) 伸縮性:
註冊中心為對等叢集,可動態增加機器部署例項,所有客戶端將自動發現新的註冊中心
服務提供者無狀態,可動態增加機器部署例項,註冊中心將推送新的服務提供者資訊給消費者
(4) 升級性:
當服務叢集規模進一步擴大,帶動IT治理結構進一步升級,需要實現動態部署,進行流動計算,現有分散式服務架構不會帶來阻力:
1.4 dubbo的呼叫方式
- 非同步呼叫
基於NIO的非阻塞實現並行呼叫,客戶端不需要啟動多執行緒即可完成並行呼叫多個遠端服務,相對多執行緒開銷較小。
- 本地呼叫
本地呼叫,使用了Injvm協議,是一個偽協議,它不開啟埠,不發起遠端呼叫,只在JVM內直接關聯,但執行Dubbo的Filter鏈。
Define injvm protocol:
- 1
Set default protocol:
- 1
Set service protocol:
- 1
Use injvm first:
- 1
- 2
- 3
- 4
- 5
- 6
注意:服務暴露與服務引用都需要宣告injvm=“true”
1.5 dubbo支援的註冊中心
Dubbo提供的註冊中心有如下幾種型別可供選擇:
- Multicast註冊中心
- Zookeeper註冊中心
- Redis註冊中心
- Simple註冊中心
ZooKeeper是一個開源的分散式服務框架,它是Apache Hadoop專案的一個子專案,主要用來解決分散式應用場景中存在的一些問題,如:統一命名服務、狀態同步服務、叢集管理、分散式應用配置管理等,它支援Standalone模式和分散式模式,在分散式模式下,能夠為分散式應用提供高效能和可靠地協調服務,而且使用ZooKeeper可以大大簡化分散式協調服務的實現,為開發分散式應用極大地降低了成本。
ZooKeeper總體架構
ZooKeeper叢集由一組Server節點組成,這一組Server節點中存在一個角色為Leader的節點,其他節點都為Follower。當客戶端Client連線到ZooKeeper叢集,並且執行寫請求時,這些請求會被髮送到Leader節點上,然後Leader節點上資料變更會同步到叢集中其他的Follower節點。
1.6 dubbo支援的遠端通訊協議
遠端通訊需要指定通訊雙方所約定的協議,在保證通訊雙方理解協議語義的基礎上,還要保證高效、穩定的訊息傳輸。Dubbo繼承了當前主流的網路通訊框架,主要包括如下幾個:
- Mina
- Netty
- Grizzly
1.7 dubbo支援的遠端呼叫協議
Dubbo支援多種協議,如下所示:
- Dubbo協議
- Hessian協議
- HTTP協議
- RMI協議
- WebService協議
- Thrift協議
- Memcached協議
- Redis協議
在通訊過程中,不同的服務等級一般對應著不同的服務質量,那麼選擇合適的協議便是一件非常重要的事情。你可以根據你應用的建立來選擇。例如,使用RMI協議,一般會受到防火牆的限制,所以對於外部與內部進行通訊的場景,就不要使用RMI協議,而是基於HTTP協議或者Hessian協議。
1.8 dubbo叢集容錯和負載均衡
1、叢集容錯
在叢集呼叫失敗時,Dubbo提供了多種容錯方案,預設為failover重試。
-
Failover Cluster
失敗自動切換,當出現失敗,重試其它伺服器。(預設)
通常用於讀操作,但重試會帶來更長延遲。
可通過retries=“2”來設定重試次數(不含第一次)。 -
Failfast Cluster
快速失敗,只發起一次呼叫,失敗立即報錯。
通常用於非冪等性的寫操作,比如新增記錄。 -
Failsafe Cluster
失敗安全,出現異常時,直接忽略。
通常用於寫入審計日誌等操作。 -
Failback Cluster
失敗自動恢復,後臺記錄失敗請求,定時重發。
通常用於訊息通知操作。 -
Forking Cluster
並行呼叫多個伺服器,只要一個成功即返回。
通常用於實時性要求較高的讀操作,但需要浪費更多服務資源。
可通過forks=“2”來設定最大並行數。 -
Broadcast Cluster
廣播呼叫所有提供者,逐個呼叫,任意一臺報錯則報錯。(2.1.0開始支援)
通常用於通知所有提供者更新快取或日誌等本地資源資訊。
2、負載均衡
- Random LoadBalance隨機,按權重設定隨機概率。
在一個截面上碰撞的概率高,但呼叫量越大分佈越均勻,而且按概率使用權重後也比較均勻,有利於動態調整提供者權重。
-
RoundRobin LoadBalance 輪循,按公約後的權重設定輪循比率。
存在慢的提供者累積請求問題,比如:第二臺機器很慢,但沒掛,當請求調到第二臺時就卡在那,久而久之,所有請求都卡在調到第二臺上。 -
LeastActive LoadBalance 最少活躍呼叫數,相同活躍數的隨機,活躍數指呼叫前後計數差。
使慢的提供者收到更少請求,因為越慢的提供者的呼叫前後計數差會越大。 -
ConsistentHash LoadBalance 一致性Hash,相同引數的請求總是發到同一提供者。
當某一臺提供者掛時,原本發往該提供者的請求,基於虛擬節點,平攤到其它提供者,不會引起劇烈變動。
配置如:
- 1
1.9 dubbo原始碼結構
Dubbo以包結構來組織各個模組,各個模組及其關係,如圖所示:
-
dubbo-common 公共邏輯模組,包括Util類和通用模型。
-
dubbo-remoting 遠端通訊模組,相當於Dubbo協議的實現,如果RPC用RMI協議則不需要使用此包。
-
dubbo-rpc 遠端呼叫模組,抽象各種協議,以及動態代理,只包含一對一的呼叫,不關心叢集的管理。
-
dubbo-cluster 叢集模組,將多個服務提供方偽裝為一個提供方,包括:負載均衡、容錯、路由等,叢集的地址列表可以是靜態配置的,也可以是由註冊中心下發。
-
dubbo-registry 註冊中心模組,基於註冊中心下發地址的叢集方式,以及對各種註冊中心的抽象。
-
dubbo-monitor 監控模組,統計服務呼叫次數,呼叫時間的,呼叫鏈跟蹤的服務。
-
dubbo-config 配置模組,是Dubbo對外的API,使用者通過Config使用Dubbo,隱藏Dubbo所有細節。
-
dubbo-container 容器模組,是一個Standalone的容器,以簡單的Main載入Spring啟動,因為服務通常不需要Tomcat/JBoss等Web容器的特性,沒必要用Web容器去載入服務。
1.10 Dubbo核心實現之SPI簡單介紹
Dubbo採用微核心+外掛體系,使得設計優雅,擴充套件性強。那所謂的微核心+外掛體系是如何實現的呢!即我們定義了服務介面標準,讓廠商去實現(如果不瞭解spi的請谷歌百度下), jdk通過ServiceLoader類實現spi機制的服務查詢功能。
JDK實現spi服務查詢: ServiceLoader
首先定義下示例介面
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
ServiceLoader會遍歷所有jar查詢META-INF/services/com.example.Spi檔案
A廠商提供實現
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
在A廠商提供的jar包中的META-INF/services/com.example.Spi檔案內容為:
com.a.example.SpiAImpl #廠商A的spi實現全路徑類名
B廠商提供實現
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
在B廠商提供的jar包中的META-INF/services/com.example.Spi檔案內容為:
com.b.example.SpiBImpl #廠商B的spi實現全路徑類名
ServiceLoader.load(Spi.class)讀取廠商A、B提供jar包中的檔案,ServiceLoader實現了Iterable介面可通過while for迴圈語句遍歷出所有實現。
一個介面多種實現,就如策略模式一樣提供了策略的實現,但是沒有提供策略的選擇, 使用方可以根據isSupport方法根據業務傳入廠商名來選擇具體的廠商。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
SPI介面定義
定義了@SPI註解
- 1
- 2
- 3
只有在介面打了@SPI註解的介面類才會去查詢擴充套件點實現,會依次從這幾個檔案中讀取擴充套件點
- 1
- 2
- 3
- 4
- 5
我們以Protocol介面為例, 介面上打上SPI註解,預設擴充套件點名字為dubbo
- 1
- 2
- 3
- 4
具體實現的類有:
所以說:Remoting實現是Dubbo協議的實現
2 Dubbo架構部署搭建
2.1 準備工作
在開始搭建dubbox服務架構前需要完成以下準備工作:
2.2 build dubbox原始碼
下載好dubbox的原始碼之後,可以看到dubbox的專