1. 程式人生 > >Hbase學習

Hbase學習

ddl 列式存儲 必須 tab 聚合 null pos middle 結構

1.特點

Hadoop擅長存儲任意的、半結構化數據,甚至非結構化數據。

列式存儲:以列為單位聚合數據,然後列值順序存入磁盤。

col1 id1 id2 id3
col2 name1 null name3

列式存儲的需要:對於特定的查詢,不是所有的值都是必須的;減少IO是主要因素;列的數據類型相似,有利於壓縮,提高了壓縮比,返回結果時能降低帶寬的消耗。

從RDBMS角度看,HBase不是一個列式存儲的數據庫,但是他利用了磁盤的列式存儲格式。

Hbase適用於鍵值對數據存取,或有序數據存取。

Hbase學習