HBase(2):hbase物理模型結構
阿新 • • 發佈:2018-12-02
一.物理結構圖
二.關鍵概念
1.儲存單元Cell
(1)儲存單元cell:rowkey+列簇+timestamp+version,確定一個單元格的值
(2)資料無型別,以位元組碼的形式進行儲存
2.Region
(1)列分割:table中所有的行都是按照字典序進行排列,可以在行的方向分割為多個region
(2)region是hbase中分散式儲存和負載均衡的最小單元,儲存的最小單元是cell
(3)原來表只有一個region,當資料量非常大達到一定的條件後。會進行等分操作,劃分為兩個新的region,之後會越來越多。
(4)Region分散式儲存的結構
-》region由一個或者多個store組成,每個store儲存一個columns family列簇
-》store又由一個memstore和0至多個storefile組成
memstore是記憶體中劃分的空間,儲存在記憶體中
storefile指的是底層的儲存檔案(儲存在hdfs上的檔案),又叫hfile
3.對應hdfs的目錄結構
/hbase/data /nstest/student/ 86ad8bcce944a691868684916456eb8b /info /2c9baee3f6464a0c9f8b79bf2a8ef3c7 rootdir屬性設定 namespace/table region 列簇 storefile
4.Write Ahead Log預寫日誌
(1)使用者每次寫入資料到Hlog檔案中,然後再寫入memstore
(2)寫入成功後才會通知客戶端該操作成功
(3)每個regionserver只有一個Hlog檔案
(4)Hlog檔案定期的重新整理,刪除舊的檔案
(5)避免記憶體中丟失資料,可以在日誌檔案中恢復