1. 程式人生 > >03 今天我不知道的事情 HBase

03 今天我不知道的事情 HBase

技術分享 支持 cos down images 導入 計算 能力 數據庫

== 1 Hbase==Hadoop Database 是Apache的Hadoop項目的子項目。

HBase是一個分布式的、面向列的開源數據庫,該技術來源於 Fay Chang 所撰寫的Google論文“Bigtable:一個結構化數據的分布式存儲系統”。

  • 適合於非結構化數據存儲的數據庫。
  • 高可靠性、高性能、面向列、可伸縮的分布式存儲系統
    技術分享圖片
1.1 HBase是Google Bigtable的開源實現,類似Google Bigtable利用GFS作為其文件存儲系統,HBase利用Hadoop HDFS作為其文件存儲系統
1.2 Google運行MapReduce來處理Bigtable中的海量數據,HBase同樣利用Hadoop MapReduce來處理HBase中的海量數據
1.3 Google Bigtable利用 Chubby作為協同服務,HBase利用Zookeeper作為對應。
1.4 
1)HBase位於結構化存儲層
2)Hadoop HDFS為HBase提供了高可靠性的底層存儲支持
3)Hadoop MapReduce為HBase提供了高性能的計算能力
4)Zookeeper為HBase提供了穩定服務和failover機制。
此外:
Pig和Hive還為HBase提供了高層語言支持,使得在HBase上進行數據統計處理變的非常簡單。 
Sqoop則為HBase提供了方便的RDBMS數據導入功能,使得傳統數據庫數據向HBase中遷移變的非常方便。

03 今天我不知道的事情 HBase