雲棲大會之HBase多模式的機遇與挑戰
什麼是Apache HBase
Hadoop Database,是一個基於Google BigTable論文設計的高可靠性、高效能、可伸縮的分散式儲存系統。
-
鬆散表結構(Schema free)
-
原生海量資料分散式儲存
-
隨機查詢、範圍查詢
-
高吞吐,低延遲
-
線上分散式資料庫
-
多版本,增量匯入,多維刪除
ApsaraDB HBase Platform
-
平臺架構
-
平臺優勢
Item |
ApsaraDB ForHBase (Aliyun Product) |
ApacheHBase(Software) |
|
Basic |
High availability |
99.9%~ 99.99% |
N/A |
Data reliability |
99.999999999% |
N/A |
|
Online Ability |
Multi-master clustering |
Multi-master clustering,Multi-AZ/Regon |
NO |
GC |
FGCNO,YGC5ms |
GC 20s~100s,YGC100ms+ |
|
Reduce Cost |
Storage Cost |
Cut by 50%+on share cloud disk,Total3 Copy |
Maybe on Cloud Disk,Total9 Copy |
SupportCold Storage |
SupportOSS,Cut by 70% atless read |
NO |
|
Multi-model DB |
Multi-model DB |
KV,Tabular,SQL,Graph,Time Series,Geospatial Full Text index, Search |
KV,Tabular |
Enterprise Characteristics |
Disaster recovery |
Backup and Restore |
NO,maybe3.0 |
Security |
user/password,ACL |
Kerberos,ACL |
|
Analytics |
SparkonHBase ,Moreoptimization |
SparkonHBase |
|
Version upgrade |
Automatic upgrade |
N/A |
|
Self-driven |
Database control system |
15min Createa DB/Monitor Online add storage and node/ElasticPowerinfuture |
N/A |
Diagnostic System |
Big request ,Big Table merge,HotRegion…… |
NO |
-
使用場景
資料型別 |
儲存物件 |
代表場景 |
元件 |
優勢 |
KV/表格儲存 |
稀疏表 |
簡單kv資訊 風控 畫像表等稀疏表 |
HBase API |
動態列 |
SQL |
帶型別的 |
替換單機關係資料庫 |
HBase-Phoenix |
SQL語法 具備Hbase 所有的優勢 |
文件資料 |
json/xml/html |
新聞 |
HBaseAPI |
儲存空間大 |
物件資料 |
圖片/視訊等 |
小物件儲存 |
HBase |
效能與儲存空間 兼備 |
時序資料 |
感測器資料 |
監控資料 |
HBase HBase-OpenTSDB |
寫效能高、儲存量大 |
時空資料 |
軌跡 |
軌跡、時空資料 |
HBase HBase-GeoMesa |
寫效能高、儲存量大 |
圖關係資料 |
關係 |
欺詐場景 |
Hbase-HGraphDB |
分散式圖 |
OLAP |
cube |
報表 |
Kylin或自己構建 |
計算前置 實時查詢 |
人才的成長
-
成長曆程
-
2-3年夯實基礎
-
4-6年成為專家
-
7-10年無中生有
-
引領-帶領
-
-
成長建議
-
關注社群,多寫文章
-
請教高手
-
專案中成長
-
保持敬畏
-
堅持
-
附上HBase多模式的機遇與挑戰PPT: