1. 程式人生 > >HBase shell

HBase shell

時間 itblog 接口 amp 修飾符 import computer turn dsl

HBase 為用戶提供了一個非常方便的使用方式, 我們稱之為“HBase Shell”。
HBase Shell 提供了大多數的 HBase 命令, 通過 HBase Shell 用戶可以方便地創建、刪除及修改表, 還可以向表中添加數據、列出表中的相關信息等。
備註:寫錯 HBase Shell 命令時用鍵盤上的“Delete”進行刪除,“Backspace”不起作用。
在啟動 HBase 之後,用戶可以通過下面的命令進入 HBase Shell 之中,命令如下所示:

[email protected]:~$ hbase shell
HBase Shell; enter help<RETURN>
for list of supported commands. Type "exit<RETURN>" to leave the HBase Shell Version 0.94.3, r1408904, Wed Nov 14 19:55:11 UTC 2012 hbase(main):001:0>

具體的 HBase Shell 命令如下表 1.1-1 所示:

技術分享

下面我們將以“一個學生成績表”的例子來詳細介紹常用的 HBase 命令及其使用方法。

技術分享
這裏 grad 對於表來說是一個列,course 對於表來說是一個列族,這個列族由三個列組成 china、math 和 english,當然我們可以根據我們的需要在 course 中建立更多的列族,如computer,physics 等相應的列添加入 course 列族。(備註:列族下面的列也是可以沒有名字的。)


1). create 命令
創建一個具有兩個列族“grad”和“course”的表“scores”。其中表名、行和列都要用單引號括起來,並以逗號隔開。
hbase(main):012:0> create ‘scores‘, ‘name‘, ‘grad‘, ‘course‘

2). list 命令
查看當前 HBase 中具有哪些表。
hbase(main):012:0> list

3). describe 命令
查看表“scores”的構造。
hbase(main):012:0> describe ‘scores‘

4). put 命令
使用 put 命令向表中插入數據,參數分別為表名、行名、列名和值,其中列名前需要列族最為前綴,時間戳由系統自動生成。

格式: put 表名,行名,列名([列族:列名]),值
例子:
a. 加入一行數據,行名稱為“xiapi”,列族“grad”的列名為”(空字符串)”,值位 1。
hbase(main):012:0> put ‘scores‘, ‘xiapi‘, ‘grad:‘, ‘1‘
hbase(main):012:0> put ‘scores‘, ‘xiapi‘, ‘grad:‘, ‘2‘ --修改操作(update)
b. 給“xiapi”這一行的數據的列族“course”添加一列“<china,97>”。
hbase(main):012:0> put ‘scores‘, ‘xiapi‘, ‘course:china‘, ‘97‘
hbase(main):012:0> put ‘scores‘, ‘xiapi‘, ‘course:math‘, ‘128‘
hbase(main):012:0> put ‘scores‘, ‘xiapi‘, ‘course:english‘, ‘85‘

5). get 命令
a.查看表“scores”中的行“xiapi”的相關數據。
hbase(main):012:0> get ‘scores‘, ‘xiapi‘
b.查看表“scores”中行“xiapi”列“course :math”的值。
hbase(main):012:0> get ‘scores‘, ‘xiapi‘, ‘course :math‘
或者
hbase(main):012:0> get ‘scores‘, ‘xiapi‘, {COLUMN=>‘course:math‘}
hbase(main):012:0> get ‘scores‘, ‘xiapi‘, {COLUMNS=>‘course:math‘}
備註:COLUMN 和 COLUMNS 是不同的,scan 操作中的 COLUMNS 指定的是表的列族, get操作中的 COLUMN 指定的是特定的列,COLUMNS 的值實質上為“列族:列修飾符”。COLUMN 和 COLUMNS 必須為大寫。

6). scan 命令
a. 查看表“scores”中的所有數據。
hbase(main):012:0> scan ‘scores‘
註意:
scan 命令可以指定 startrow,stoprow 來 scan 多個 row。
例如:
scan ‘user_test‘,{COLUMNS =>‘info:username‘,LIMIT =>10, STARTROW => ‘test‘, STOPROW=>‘test2‘}
b.查看表“scores”中列族“course”的所有數據。
hbase(main):012:0> scan ‘scores‘, {COLUMN => ‘grad‘}
hbase(main):012:0> scan ‘scores‘, {COLUMN=>‘course:math‘}
hbase(main):012:0> scan ‘scores‘, {COLUMNS => ‘course‘}
hbase(main):012:0> scan ‘scores‘, {COLUMNS => ‘course‘}

7). count 命令
hbase(main):068:0> count ‘scores‘

8). exists 命令
hbase(main):071:0> exists ‘scores‘

9). incr 命令(賦值)

10). delete 命令
刪除表“scores”中行為“xiaoxue”, 列族“course”中的“math”。
hbase(main):012:0> delete ‘scores‘, ‘xiapi‘, ‘course:math‘

11). truncate 命令
hbase(main):012:0> truncate ‘scores‘

12). disbale、drop 命令
通過“disable”和“drop”命令刪除“scores”表。
hbase(main):012:0> disable ‘scores‘ --enable ‘scores‘
hbase(main):012:0> drop ‘scores‘

13). status命令
hbase(main):072:0> status

14). version命令
hbase(main):073:0> version

另外,在 shell 中,常量不需要用引號引起來,但二進制的值需要雙引號引起來,而其他值則用單引號引起來。HBase Shell 的常量可以通過在 shell 中輸入“Object.constants”。



引言
HBase提供了豐富的訪問接口。
  ? HBase Shell
  ? Java clietn API
  ? Jython、Groovy DSL、Scala
  ? REST
  ? Thrift(Ruby、Python、Perl、C++…)
  ? MapReduce
  ? Hive/Pig
其中HBase Shell是常用的便捷方式

首先你需要一個HBase的環境,如果需要自己搭建可以參考http://hbase.apache.org/book/quickstart.html 和http://hbase.apache.org/book/notsoquick.html

如果你在windows環境下配置cygwin及ssh遇到問題可以參考 http://qa.taobao.com/?p=10633。

進入HBase shell控制臺
>bin/hbase shell
輸入“help”可以快速掃描下支持那些命令。

創建表
> create ‘blog‘,‘article‘,‘author‘
知識點回顧:Column Family是schema的一部分,而Column不是。這裏的article和author是Column Family。

查詢所有表

>list

技術分享

增加記錄
>put ‘blog‘,‘1‘,‘article:title,‘ Head First HBase ‘
>put ‘blog‘,‘1‘,‘article:content‘,‘HBase is the Hadoop database. Use it when you need random, realtime read/write access to your Big Data.‘
> put ‘blog‘,‘1‘,‘article:tags‘,‘Hadoop,HBase,NoSQL‘
> put ‘blog‘,‘1‘,‘author:name‘,‘hujinjun‘
> put ‘blog‘,‘1‘,‘author:nickname‘,’一葉渡江’
知識點回顧:Column完全動態擴展,每行可以有不同的Columns。

根據RowKey查詢
> get ‘blog‘,‘1‘

技術分享

知識點回顧:HTable按RowKey字典序(1,10,100,11,2)自動排序,每行包含任意數量
的Columns,Columns按ColumnKey(article:content,article:tags,article:title,author:name,author:nickname)自動排序

查詢列族

>get ‘blog‘,‘1‘,‘author

技術分享

查看表內容

>scan ‘blog‘

技術分享

更新練習

  • 查詢下更新前的值:

> get ‘blog’,’1’,’author:nickname’

技術分享

  • 更新nickname為’yedu’:

> put ‘blog’,’1’,’ahthor:nickname’,’yedu’

  • 查詢更新後的結果:

> get ‘blog’,’1’,’author:nickname’

技術分享

知識點回顧:查詢默認返回最近的值。

  • 查詢nickname的多個(本示例為2個)版本值

> get ‘blog‘,‘1‘,{COLUMN => ‘author:nickname‘,VERSIONS => 2}

技術分享
知識點回顧:每個Column可以有任意數量的Values,按Timestamp倒序自動排序。

當修改多次(大於3次,修改2次時也就有3個VERSIONS)時:VERSIONS默認最高為3

> get ‘blog‘,‘1‘,{COLUMN => ‘author:nickname‘,VERSIONS => 4}

技術分享

  • 如何只查詢到以前的舊版本呢,需要借助Timestamp

>get ‘blog‘,‘1‘,{COLUMN => ‘author:nickname‘, TIMESTAMP => 1333690828877}
技術分享

知識點回顧:TabelName+RowKey+Column+Timestamp=>Value

刪除記錄

  • delete只能刪除一個column

>delete ‘blog‘,‘1‘,‘author:nickname‘

  • 刪除RowKey的所有column用deleteall

>deleteall ‘blog’,’1’
刪除表
練習完畢,把練習表刪了吧,刪除之前需要先disable
>disable ‘blog’
>drop ‘blog’

小結
本文演示了通過HBase shell創建、刪除表及對記錄的增刪改查,可以參照操作結果對回顧的知識點進一步理解掌握,在本系列下一篇文章中講演示如何通過Java api來與HBase交互。


HBase shell