八年!效能提升10倍,阿里雲HBase 2.0首發商用
阿里雲HBase 2.0成長手記,含著金湯匙出身
HBase本身是一個分散式儲存、資料庫引擎,可以支援千萬的QPS、PB級別的儲存,這些都已經在生產環境驗證,並且在阿里得以驗證。
早在2010年開始,阿里巴巴集團開始研究並把HBase投入生產環境使用,從最初的淘寶曆史交易記錄,到螞蟻安全風控資料儲存,HBase在幾代阿里專家的不懈努力下,已經表現得執行更穩定、效能更高效,內部HBase叢集超過萬臺的規模,單叢集超過千臺,是集團核心資料庫產品之一,也是國內甚至國際上絕對的HBase大戶。
為什麼HBase會受到大客戶的青睞。首先在這個上雲的時代,在雲上,對於引擎最為核心的就是儲存計算分離,儲存可以按需計費,起碼得彈性伸縮。計算則按節點儲存提供,完全按照QPS計費,要麼費用高得嚇人,要麼難以滿足更多的場景。
比如儲存10M,到底算一次QPS,還是多少次。 由於HBase天生就是儲存計算分離,天然比較適配雲上的架構,可以說到了雲上,HBase更加具有優勢。
所以國內大型網際網路企業內部都有大量的HBase叢集,尤其阿里更甚。自2012年誕生第一位“東八區” HBase committer,到今天,阿里巴巴已經擁有3個PMC,6個committer,是中國擁有最多HBase committer的公司,其中HBase核心中超過200+重要的feature是阿里貢獻。除了擁有強大的核心團隊和核心能力,HBase在內部經過雙十一等超級業務的千錘百煉,鍛煉出一系列的完善的產品形態和企業級能力。
潛心修煉八年,終成HBase2.0
基於阿里長達8年和超萬臺實踐經驗和技術積累的延伸,ApsaraDB for HBase在基於社群的HBase的基礎上,推出了雲HBase服務。建立在阿里雲龐大生態體系下,根據雲環境生態和HBase儲存系統的特點,推出適合企業嚴苛要求的雲HBase儲存系統。
HBase 2.0在效能,穩定性上做了一系列核心架構級別優化。這次阿里雲基於社群HBase 2.0穩定版本基礎上,進行了進一步一系列效能和穩定性優化和測試驗證。
此次首發雲HBase 2.0雲服務,讓使用者可以第一時間體驗到阿里技術加持的HBase 2.0新版本。
首先是針對企業不同的使用環境,不同的SLA訴求,雲HBase一共提供3個版本,分別滿足開發環境,線上業務,以及金融級業務的訴求。單節點版本,低廉的價格用於開發測試場景,叢集版本,99.9%可用,滿足企業線上業務訴求,支援最高5000萬的QPS和10P的資料。還有支援金融級高可用的雙活版本。所有版本都支援11個9的資料可靠性,無需擔心資料丟失。
除了完善的產品形態,針對企業應用中成本、安全、穩定性、易用性等諸多訴求,阿里雲HBase提供了強大的能力,例如儲存計算分離,按需彈效能力; 資料備份恢復能力;資料冷熱分離和分級儲存能力;SQL介面和強大的二級索引和倒排索引能力;多層次安全能力等等。
細數ApsaraDB HBase典型場景
雲HBase已經通過阿里雲的公共雲、專有云及混合雲的形態對外服務,使用者覆蓋社交、金融、車聯網、物流、零售、電商、共享出行等數十個行業,幫助使用者頂住千萬級QPS的業務壓力,以及PB級資料高效儲存和處理。
HBase2.0支援多region replicas服務,充分利用叢集資源支援更高併發隨機讀。進一步加強了HBase高併發多讀能力,因此非常適合車聯網等物聯網場景。
除了在物聯網場景的應用,我們知道不少的頭條類、新聞類的的新聞、網頁、圖片儲存在HBase之中。HBase2.0支援中等物件儲存,相容原生api讀寫訪問以及bulkload等,合適企業儲存一些附件文件、圖片資料,而不需要企業另選其它物件儲存系統,大大簡化企業後臺資料架構。在儲存上支援各類資料,包括日誌、訂單、交易資料、訊息等,線上實時寫入,實時查詢。
通過對讀寫全鏈路優化,rpc改進等,比隨機讀寫延時更低。同時滿足了金融級分控,推薦等核心場景的極致時延和穩定性要求。
小結
歷經近8年的技術沉澱,阿里巴巴大資料NoSQL資料庫處理技術的精華沉澱在HBase上,後者成功支撐了成功支撐了阿里經濟體中最大的NoSQL業務體量,是阿里大資料處理技術的核心組成部分,當前將這項技術應用到廣大企業中,助力企業發現數據價值。
瞭解更多關於阿里雲HBase 2.0請戳:https://promotion.aliyun.com/ntms/act/hbaseproduct20.html?tlog=out_aiticai_feature_20181128