大資料環境---hbase的安裝
前面已經搭建好了zookeeper主機叢集,hadoop叢集。 現子看來,zookeeper貌似提供了一種簡便的方法來解決hadoop叢集的問題,比如免密登陸,時間同步等。 但是二者都是分散式架構解決方案,所以應該不存在耦合關係! 今天繼續繼續環境下的hbase的安裝筆記!
背景:
百度百科釋義:
可見它的本質是一個數據庫。 一個分散式,基於列的資料庫。 這就夠了。
安裝環境準備:
1. 解壓並配置環境變數:
2. 配置hbase環境:conf/hbase-env.sh
補充說明: 一個分散式執行的hbase依賴一個zookeeper叢集。 預設情況下,hbase會管理一個zookeeper叢集(hbase預設自帶一個zookeeper叢集。該叢集隨hbase的啟動而啟動。 HBASE_MANAGES_ZK屬性可以用於單獨執行zookeeper叢集。 其預設值為true。
3. 配置conf/hbase-site.xml
解釋說明: hbase.cluster.distributed指示hbase的執行模式。 false是單機模式,true是分散式模式。 單機模式下,hbase 與 zookeeper會執行在同一個JVM中。
hbase.rootdir是 region server的共享目錄,用來持久化Hbase。 url需嚴格限制,並且要包含檔案系統的sheme。 如這裡的檔案系統是: hdfs。
hbase.zookeeper.property.dataDir指明zookeeper的配置位置。 獨立的zookeeper需要配置主機和埠。
4. 配置 conf/regionservers:
說明: 這裡列出希望執行的全部:Hbase Region server。 它們會隨著server的啟動而啟動,停止而停止。
5. 將 hadoop 配置檔案拷入 hbase的conf目錄:
6. 分發至其它虛擬機器並配置環境變數。
7. 在配置 hbase.master所在的主機執行hbase。 (保證hadoop和 zookeeper已經開啟)。
訪問hbase主端的hbase web介面: http://ip:16010/master-status,即可檢視到相關資訊。
進入hbase互動介面:
通過status 與 version可以檢視到相關的資訊。
補充資料: