阿里雲上cdh5 hbase搭建(單機版)
一、簡介
HBase是一種構建在HDFS之上的分散式、面向列的儲存系統。在需要實時讀寫、隨機訪問超大規模資料集時,可以使用HBase。
儘管已經有許多資料儲存和訪問的策略和實現方法,但事實上大多數解決方案,特別是一些關係型別的,在構建時並沒有考慮超大規模和分散式的特點。許多商家通過複製和分割槽的方法來擴充資料庫使其突破單個節點的界限,但這些功能通常都是事後增加的,安裝和維護都和複雜。同時,也會影響RDBMS的特定功能,例如聯接、複雜的查詢、觸發器、檢視和外來鍵約束這些操作在大型的RDBMS上的代價相當高,甚至根本無法實現。
hbase的特點是:
大:一個表可以有上億行,上百萬列。
面向列:面向列表(簇)的儲存和許可權控制,列(簇)獨立檢索。
稀疏:對於為空(NULL)的列,並不佔用儲存空間,因此,表可以設計的非常稀疏。
無模式:每一行都有一個可以排序的主鍵和任意多的列,列可以根據需要動態增加,同一張表中不同的行可以有截然不同的列。
資料多版本:每個單元中的資料可以有多個版本,預設情況下,版本號自動分配,版本號就是單元格插入時的時間戳。
資料型別單一:HBase中的資料都是字串,沒有型別。
二、安裝
1.下載hbase安裝包
http://archive.cloudera.com/cdh5/cdh/5/
選擇與你安裝的hadoop cdh5.xxxx對應的hbase cdh5.xxx即可
2.tar -zxvf 解壓,修改hbase-env.sh
指定java的安裝路徑
export JAVA_HOME=/usr/java/jdk1.8.0/
還有一個是export HBASE_MANAGES_ZK=true
因為是單機版所以並沒有zookeeper
預設應該就是true
3.修改hbase-site.xml檔案
<configuration> <!--指定臨時目錄的存放位置,和hadoop.tmp.dir相似--> <property> <name>hbase.tmp.dir</name> <value>/usr/local/hadoop/app/hbase-1.2.0/tmp</value> </property> <!--注意一定要是你的主機名不能填地址--> <property> <name>hbase.rootdir</name> <value>hdfs://centos7:9000/hbase</value> </property> </configuration>
4.啟動hbase
./bin/start-hbase.sh