NoSQL 複習 (二)HBase基本原理
阿新 • • 發佈:2020-12-28
HBase
是一個高可靠、高效能、面向列、可伸縮的分散式資料庫,是谷歌BigTable的開源實現,主要用來儲存非結構化和半結構化的鬆散資料。
Hbase優點:
採用面向列(列族)加鍵值對的儲存模式
實現橫向擴充套件
自動資料分片
嚴格的讀寫一致性和自動的故障轉移
全文檢索與過濾
支援命令列、Java、Python等語言操作
表:HBase採用表來組織資料,表由行和列組成,列劃分為若干個列族
行:每個HBase表都由若干行組成,每個行由行鍵(row key)來標識。
列族:一個HBase表被分組成許多“列族”(Column Family)的集合,它是基本的訪問控制單元
列限定符:列族裡的資料通過列限定符(或列)來定位
時間戳:每個單元格都儲存著同一份資料的多個版本,這些版本採用時間戳進行索引
客戶端
是整個HBase系統的入口,使用者通過客戶端操作HBase。
使用HBase的RPC機制與Hmaster和RegionServer進行通訊。
Zookeeper
提供分散式協調服務、監控叢集、維護資料總入口,記錄Master節點地址
Master
所有RegionServer管理者、對RegionServer負責的資料範圍進行分配、不負責管理使用者資料表Region
根據行健對錶中行的分割槽
預設大小:100M—200M
新增HBase節點
(1)在新節點部署配置HBase軟體,並配置RegionServer
(2)在HMaster的regionserver配置檔案中新增新節點的host
(3)在新節點中通過下面命令啟動HRegionServer: hbase-daemon.sh start regionserver
(4)在新啟動的節點上,開啟hbase shell,如下設定: balance_switch true
刪除HBase節點
在需要刪除的節點執行命令
hbase-daemon.sh stop regionserver 或 graceful_stop.sh HOSTNAME