1. 程式人生 > >HBase(2):hbase物理模型結構

HBase(2):hbase物理模型結構

一.物理結構圖

二.關鍵概念

1.儲存單元Cell

(1)儲存單元cell:rowkey+列簇+timestamp+version,確定一個單元格的值 
(2)資料無型別,以位元組碼的形式進行儲存

2.Region

(1)列分割:table中所有的行都是按照字典序進行排列,可以在行的方向分割為多個region

(2)region是hbase中分散式儲存和負載均衡的最小單元,儲存的最小單元是cell

(3)原來表只有一個region,當資料量非常大達到一定的條件後。會進行等分操作,劃分為兩個新的region,之後會越來越多。

(4)Region分散式儲存的結構

    -》region由一個或者多個store組成,每個store儲存一個columns family列簇

    -》store又由一個memstore和0至多個storefile組成

            memstore是記憶體中劃分的空間,儲存在記憶體中

            storefile指的是底層的儲存檔案(儲存在hdfs上的檔案),又叫hfile

3.對應hdfs的目錄結構

/hbase/data         /nstest/student/    86ad8bcce944a691868684916456eb8b   /info    /2c9baee3f6464a0c9f8b79bf2a8ef3c7
rootdir屬性設定    namespace/table       region          		列簇    storefile

4.Write Ahead Log預寫日誌

(1)使用者每次寫入資料到Hlog檔案中,然後再寫入memstore
(2)寫入成功後才會通知客戶端該操作成功
(3)每個regionserver只有一個Hlog檔案
(4)Hlog檔案定期的重新整理,刪除舊的檔案
(5)避免記憶體中丟失資料,可以在日誌檔案中恢復