Hbase 表預分割槽----手動分割槽

阿新 • • 發佈：2019-01-06

預設情況下，在建立HBase表的時候會自動建立一個region分割槽，當匯入資料的時候，所有的HBase客戶端都向這一個region寫資料，直到這個region足夠大了才進行切分。一種可以加快批量寫入速度的方法是通過預先建立一些空的regions，這樣當資料寫入HBase時，會按照region分割槽情況，在叢集內做資料的負載均衡。
命令方式:
create ‘t1’, ‘f1’, {NUMREGIONS => 15, SPLITALGO => ‘HexStringSplit’}
也可以使用api的方式:
bin/hbase org.apache.hadoop.hbase.util.RegionSplitter test_table HexStringSplit -c 10 -f info
引數：
test_table是表名
HexStringSplit 是split 方式
-c 是分10個region
-f 是family

 這樣就可以將表預先分為15個區，減少資料達到storefile 大小的時候自動分割槽的時間消耗，並且還有以一個優勢，就是合理設計rowkey 能讓各個region 的併發請求平均分配(趨於均勻) 使IO 效率達到最高，但是預分割槽需要將filesize 設定一個較大的值，設定哪個引數呢, hbase.hregion.max.filesize 這個值預設是10G 也就是說單個region 預設大小是10G,
 這個引數的預設值在0.90 到0.92到0.94.3各版本的變化：256M--1G--10G 
 但是如果MapReduce Input型別為TableInputFormat 使用hbase作為輸入的時候，就要注意了，每個region一個map，如果資料小於10G 那隻會啟用一個map 造成很大的資源浪費，這時候可以考慮適當調小該引數的值，或者採用預分配region的方式，並將檢測如果達到這個值，再手動分配region。

Hbase 表預分割槽----手動分割槽

Hbase 表預分割槽----手動分割槽

hbase建表create高級屬性 //hbase 表預分區也就是手動分區這個很重要

HBase表設計----預分割槽和雜湊儲存

Hbase 建表預分割槽

HBase的預分割槽設計（很實用的一篇文章）

Hive 分割槽表初始化歷史分割槽操作

PostgreSQL 11 新特性解讀: 分割槽表增加雜湊分割槽

Ubuntu 16.04安裝手動分割槽配置

Oracle建立表分割槽----範圍分割槽

Oracle 分割槽表的索引、分割槽索引

oracle 建立分割槽表以及自動新增分割槽

Hive 7、Hive 的內表、外表、分割槽

MySQL表的四種分割槽型別

製作ubuntu16.04 （12.04）自動安裝iso映象（只需要手動分割槽，其他自動）

優化SQLServer--表和索引的分割槽(二)

MYSQL表分割槽,檢視分割槽

hive按當天日期建立分割槽表 | 動態往日期分割槽插入資料

centos 5 手動分割槽 lvm 來安裝系統的方法

ORA-14404:分割槽表包含不同表空間中的分割槽

greenplum 表管理及檢視分割槽表佔空間大小

Hbase 表預分割槽----手動分割槽

相關推薦