HBase Shell

转载

爱是与世界平行 2021-06-03 22:59:48

文章标签 HBase 文章分类 Hbase 数据库

HBase Shell

1.Hbase的访问方式
2.Hbase shell基本用法
3.Hbase shell命令

1.Hbase的访问方式

1、Native Java API：最常规和高效的访问方式；
2、HBase Shell：HBase的命令行工具，最简单的接口，适合HBase管理使用；
3、Thrift Gateway：利用Thrift序列化技术，支持C++，PHP，Python等多种语言，适合其他异构系统在线访问HBase表数据；
4、REST Gateway：支持REST 风格的Http API访问HBase, 解除了语言限制；
5、MapReduce：直接使用MapReduce作业处理Hbase数据；
6、使用Pig/hive处理Hbase数据。

2.Hbase shell基本用法

Group name commands

general	status, table_help, version, whoami
ddl	alter, alter_async, alter_status, create, describe, disable, disable_all, drop, drop_all, enable, enable_all, exists, get_table, is_disabled, is_enabled, list, show_filters
namespace	alter_namespace, create_namespace, describe_namespace, drop_namespace, list_namespace, list_namespace_tables
dml	append, count, delete, deleteall, get, get_counter, incr, put, scan, truncate, truncate_preserve
tools	assign, balance_switch, balancer, catalogjanitor_enabled, catalogjanitor_run, catalogjanitor_switch, close_region, compact, compact_rs, flush, major_compact, merge_region, move, split, trace, unassign, wal_roll, zk_dump
replication	add_peer, append_peer_tableCFs, disable_peer, disable_table_replication, enable_peer, enable_table_replication, list_peers, list_replicated_tables, remove_peer, remove_peer_tableCFs, set_peer_tableCFs, show_peer_tableCFs
snapshots	clone_snapshot, delete_all_snapshot, delete_snapshot, list_snapshots, restore_snapshot, snapshot
configuration	update_all_config, update_config
security	grant, revoke, user_permission
visibility labels	add_labels, clear_auths, get_auths, list_labels, set_auths, set_visibility

3.Hbase shell命令

3.1general

3.1.1status

作用：查询当前服务器状态。
实例：

hbase(main):006:0> status
1 servers, 0 dead, 5.0000 average load

更多用法：

hbase(main):002:0> help 'status'
  hbase> status    
  hbase> status 'simple'
  hbase> status 'summary'
  hbase> status 'detailed'
  hbase> status 'replication'
  hbase> status 'replication', 'source'
  hbase> status 'replication', 'sink'

3.1.2version

作用：查看hbase版本
实例：

hbase(main):010:0> version
1.0.3, rf1e1312f9790a7c40f6a4b5a1bab2ea1dd559890, Tue Jan 19 19:26:53 PST 2016

3.1.3whoami

作用：查询当前hbase用户
实例：

hbase(main):011:0> whoami
datanode1 (auth:SIMPLE)
    groups: datanode1

3.2ddl

3.2.1create

作用：创建一个表
实例：

#在命名空间ns1下，创建表t1，其中有一个列族f1，f1的版本数为5
hbase> create 'ns1:t1', {NAME => 'f1', VERSIONS => 5}

#在默认命名空间下，创建表t1，有三个列族f1,f2,f3
  hbase> create 't1', {NAME => 'f1'}, {NAME => 'f2'}, {NAME => 'f3'}
#等价于
  hbase> create 't1', 'f1', 'f2', 'f3'

#创建表t1，列族f1，并设置f1的版本数为1，属性TTL为2592000，属性BLOCKCACHE为true。属性的含义在这就不解释了。
  hbase> create 't1', {NAME => 'f1', VERSIONS => 1, TTL => 2592000, BLOCKCACHE => true}

# 创建表t1,列族f1，并设置f1的配置hbase.hstore.blockingStoreFiles 为 10
  hbase> create 't1', {NAME => 'f1', CONFIGURATION => {'hbase.hstore.blockingStoreFiles' => '10'}}


#创建表时，配置信息可以放在最后，例如：
  hbase> create 'ns1:t1', 'f1', SPLITS => ['10', '20', '30', '40']
  hbase> create 't1', 'f1', SPLITS => ['10', '20', '30', '40']
  hbase> create 't1', 'f1', SPLITS_FILE => 'splits.txt', OWNER => 'johndoe'
  hbase> create 't1', {NAME => 'f1', VERSIONS => 5}, METADATA => { 'mykey' => 'myvalue' }
  hbase> # Optionally pre-split the table into NUMREGIONS, using
  hbase> # SPLITALGO ("HexStringSplit", "UniformSplit" or classname)

#指定Pre-splitting的region的块数，和分割函数。
  hbase> create 't1', 'f1', {NUMREGIONS => 15, SPLITALGO => 'HexStringSplit'}
  hbase> create 't1', 'f1', {NUMREGIONS => 15, SPLITALGO => 'HexStringSplit', REGION_REPLICATION => 2, CONFIGURATION => {'hbase.hregion.scan.loadColumnFamiliesOnDemand' => 'true'}}

#也可以用另一个表t2的引用去创建一个新表t1，t1表具有t2的所有列族，并且加上f1列族。
  hbase> t1 = create 't2', 'f1'

3.2.2alter

作用：可以修改，增加，删除表的列族信息、属性、配置等。
实例：

#对于表t1，如果t1含有f1列族，则将f1列族的版本数设为5.
#         如果t1不含f1列数，则添加f1列族到表t1上。并将f1的版本数设置为5.
  hbase> alter 't1', NAME => 'f1', VERSIONS => 5

#添加或修改多个列族
  hbase> alter 't1', 'f1', {NAME => 'f2', IN_MEMORY => true}, {NAME => 'f3', VERSIONS => 5}

#删除 命名空间ns1 中的 表t1 的 列族f1 的两种方法
  hbase> alter 'ns1:t1', NAME => 'f1', METHOD => 'delete'
  hbase> alter 'ns1:t1', 'delete' => 'f1'

#修改表t1的MAX_FILESIZE属性的值。
  hbase> alter 't1', MAX_FILESIZE => '134217728'

# 修改表t1或者列族f2的配置
  hbase> alter 't1', CONFIGURATION => {'hbase.hregion.scan.loadColumnFamiliesOnDemand' => 'true'}
  hbase> alter 't1', {NAME => 'f2', CONFIGURATION => {'hbase.hstore.blockingStoreFiles' => '10'}}

#删除属性
  hbase> alter 't1', METHOD => 'table_att_unset', NAME => 'MAX_FILESIZE'

  hbase> alter 't1', METHOD => 'table_att_unset', NAME => 'coprocessor$1'

#一次性修改多个属性值
  hbase> alter 't1', { NAME => 'f1', VERSIONS => 3 }, 
   { MAX_FILESIZE => '134217728' }, { METHOD => 'delete', NAME => 'f2' },
   OWNER => 'johndoe', METADATA => { 'mykey' => 'myvalue' }
hbase(main):014:0>

3.2.3alter_async

作用：异步更新，与alter的作用相同。

3.2.4describe / desc

作用：显示表的属性，表的列族的属性。
实例：

# 命令：显示表t1信息
  hbase> describe 't3'
# 显示出的信息：
Table t3 is ENABLED                                                                
t3                                                                                 
COLUMN FAMILIES DESCRIPTION                                                        
{NAME => 'colfa', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP
_DELETED_CELLS => 'false', DATA_BLOCK_ENCODING => 'NONE', COMPRESSION => 'NONE', TT
L => 'FOREVER', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', RE
PLICATION_SCOPE => '0'}                                                            
1 row(s) in 0.0200 seconds

3.2.5disable

作用：disable表，删除一个表之前，必须把表disable
实例：

#disable表t1
  hbase> disable 't1'

3.2.6disable_all

作用： disable多个表，接受正则表达好似。
实例：

# disable 所有以t开头的表
hbase> disable_all 't.*'

3.2.7drop

作用：删除表。但是删除之前，必须disable该表
实例：

# 删除表t2
hbase(main):005:0> disable 't2'
0 row(s) in 1.2270 seconds
hbase(main):006:0> drop 't2'
0 row(s) in 0.1750 seconds

3.2.8drop_all

作用：删除多个表，接受正则表达式。
实例：

# 删除所有表名以t开头的表
hbase> drop_all 't.*'

3.2.9enable

作用：与disble相反，enable表

3.2.10enable_all

作用：enable多个表，接受正则表达式

3.2.11exists

作用：查询表是否存在
实例：

# 查询表名为t1的表是否存在
hbase(main):003:0>  exists 't1'
Table t1 does exist                                                                
0 row(s) in 0.3170 seconds

3.2.12get_table

作用：返回一个表引用对象
实例

# 将表t1的应用对象赋给t1d
  hbase> t1d = get_table 't1'
#t1d操作
t1d.scan
t1d.describe
...

3.2.13is_disabled

作用：查询表是否disable

3.2.14is_enabled

作用：查询表是否enable

3.2.15list

作用：显示出hbase中的表，接受正则表达式
实例:

#显示所有命名空间的所有表
  hbase> list
#显示表名以abc开头的表
  hbase> list 'abc.*'
#显示命名空间ns下的表名以abc开头的表
  hbase> list 'ns:abc.*'
#显示命名空间ns下的所有表
  hbase> list 'ns:.*'

3.2.16show_filters

作用：显示出所有过滤器
实例：

#显示出所有过滤器
  hbase> show_filters

3.3namespace

3.3.1create_namespace

作用：创建命名空间
实例：

# 创建命名空间ns1
  hbase> create_namespace 'ns1'

# 创建命名空间ns1，并且配置ns1
  hbase> create_namespace 'ns1', {'PROPERTY_NAME'=>'PROPERTY_VALUE'}

3.3.2alter_namespace

作用：修改，添加，删除命名空间的属性
实例：

设置命名空间ns1的属性
  hbase> alter_namespace 'ns1', {METHOD => 'set', 'PROPERTY_NAME' => 'PROPERTY_VALUE'}
删除命名空间ns1的属性
  hbase> alter_namespace 'ns1', {METHOD => 'unset', NAME=>'PROPERTY_NAME'}

3.3.3describe_namespace

作用：描述命名空间
实例：
描述命名空间ns1

hbase(main):008:0> describe_namespace 'ns1'
DESCRIPTION                                                                        
{NAME => 'ns1', PROPERTY_NAME => 'PROPERTY_VALUE'}                                 
1 row(s) in 0.0040 seconds

3.3.4drop_namespace

作用：删除命名空间，命名空间必须为空， 不包含表

3.3.5list_namespace

作用：列出所有命名空间
实例：

列出所有命名空间
hbase(main):008:0> describe_namespace 'ns1'
DESCRIPTION                                                                        
{NAME => 'ns1', PROPERTY_NAME => 'PROPERTY_VALUE'}                                 
1 row(s) in 0.0040 seconds

3.3.6list_namespace_tables

作用：显示出某一个命名空间下的所有表
实例：

显示出默认命名空间下的所有表
hbase(main):004:0> list_namespace_tables 'default'
TABLE                                                                              
peoples                                                                            
t1                                                                                 
t3                                                                                 
3 row(s) in 0.0210 seconds

3.4dml

3.4.1scan

作用：扫描某一个表
实例：

# 扫描命名空间hbase下的meta表，显示出meta表的所有数据
  hbase> scan 'hbase:meta'

# 扫描命名空间hbase下的meta表的列族info的列regioninfo，显示出meta表的列族info下的regioninfo列的所有数据
  hbase> scan 'hbase:meta', {COLUMNS => 'info:regioninfo'}

# 扫描命名空间ns1下表t1的列族'c1'和'c2'。显示出命名空间ns1下表t1的列族'c1'和'c2'的所有数据
     hbase> scan 'ns1:t1', {COLUMNS => ['c1', 'c2']}

# 扫描命名空间ns1下表t1的列族'c1'和'c2'。显示出命名空间ns1下表t1的列族'c1'和'c2'，且只显示前10个rowkey的数据。
  hbase> scan 'ns1:t1', {COLUMNS => ['c1', 'c2'], LIMIT => 10}

# 扫描命名空间ns1下表t1的列族'c1'和'c2'。显示出命名空间ns1下表t1的列族'c1'和'c2'，且只显示从rowkey=“xyz”开始的前10个rowkey的数据。
  hbase> scan 'ns1:t1', {COLUMNS => ['c1', 'c2'], LIMIT => 10, STARTROW => 'xyz'} 

# 扫描默认命名空间下表t1的列族c1时间戳从'1303668804'到'1303668904'的数据
  hbase> scan 't1', {COLUMNS => 'c1', TIMERANGE => [1303668804, 1303668904]}

# 反向显示表t1的数据
  hbase> scan 't1', {REVERSED => true}

# 过滤显示表t1的数据
  hbase> scan 't1', {FILTER => "(PrefixFilter ('row2') AND
    (QualifierFilter (>=, 'binary:xyz'))) AND (TimestampsFilter ( 123, 456))"}

# RAW为true，显示出表t1的所有数据，包括已经删除的
  hbase> scan 't1', {RAW => true, VERSIONS => 10}

# 表t1的引用的扫描
  hbase> t11 = get_table 't1'
  hbase> t11.scan

3.4.2append

作用：
实例：

# 向表t1的rowkey为r1的列c1的值后面添加字符串value
  hbase> append 't1', 'r1', 'c1', 'value'

#表t1的引用对象t11使用append。
  hbase> t11.append 'r1', 'c1', 'value'

3.4.3count

作用：统计表的行数
实例：

#统计表t1的行数
count 't1'

#统计表t1的行数，其中参数的含义如下
# INTERVAL设置多少行显示一次及对应的rowkey，默认1000；CACHE每次去取的缓存区大小，默认是10，调整该参数可提高查询速度
# 例如，查询表t1中的行数，每10条显示一次，缓存区为1000
count 't1', INTERVAL => 10, CACHE => 1000


#对应的表应用对象的用法
 hbase> t.count
 hbase> t.count INTERVAL => 100000
 hbase> t.count CACHE => 1000
 hbase> t.count INTERVAL => 10, CACHE => 1000

3.4.4delete

作用：删除表中cell数据
实例：

# 删除命名空间ns1下的表t1的rowkey的r1的列c1，时间戳为ts1 
 hbase> delete 'ns1:t1', 'r1', 'c1', ts1

# 删除默认命名空间下的表t1的rowkey的r1的列c1，时间戳为ts1 
 hbase> delete 't1', 'r1', 'c1', ts1

#应用对象的用法
 hbase> t.delete 'r1', 'c1',  ts1

3.4.5deleteall

作用：一次性删除多个cell数据
实例：

#删除命名空间ns1下表t1的rowkey为r1的所有数据
  hbase> deleteall 'ns1:t1', 'r1'

#删除默认命名空间下表t1的rowkey为r1的所有数据
  hbase> deleteall 't1', 'r1'

#删除命名空间ns1下表t1的rowkey为r1的列c1的所有数据
  hbase> deleteall 't1', 'r1', 'c1'

# 删除默认命名空间下的表t1的rowkey的r1的列c1，时间戳为ts1 
  hbase> deleteall 't1', 'r1', 'c1', ts1

#应用对象的用法
  hbase> t.deleteall 'r1'
  hbase> t.deleteall 'r1', 'c1'
  hbase> t.deleteall 'r1', 'c1', ts1

3.4.6get

作用：得到某一列或cell的数据。
实例：

#得到命名空间ns1下表t1的rowkey为r1的数据
  hbase> get 'ns1:t1', 'r1'

#得到默认命名空间下表t1的rowkey为r1的数据
  hbase> get 't1', 'r1'

#得到默认命名空间下表t1的rowkey为r1，时间戳范围在ts1和ts2之间的数据
  hbase> get 't1', 'r1', {TIMERANGE => [ts1, ts2]}

#得到默认命名空间下表t1的rowkey为r1的c1列的数据
  hbase> get 't1', 'r1', {COLUMN => 'c1'}

#得到默认命名空间下表t1的rowkey为r1的c1,c2,c3列的数据
  hbase> get 't1', 'r1', {COLUMN => ['c1', 'c2', 'c3']}

#得到默认命名空间下表t1的rowkey为r1的c1列，时间戳为ts1的数据
  hbase> get 't1', 'r1', {COLUMN => 'c1', TIMESTAMP => ts1}

#得到默认命名空间下表t1的rowkey为r1的c1列，时间戳范围为ts1到ts2，版本数为4的数据
  hbase> get 't1', 'r1', {COLUMN => 'c1', TIMERANGE => [ts1, ts2], VERSIONS => 4}

#应用对象的用法
  hbase> t.get 'r1'
  hbase> t.get 'r1', {TIMERANGE => [ts1, ts2]}
  hbase> t.get 'r1', {COLUMN => 'c1'}
  hbase> t.get 'r1', {COLUMN => ['c1', 'c2', 'c3']}
  hbase> t.get 'r1', {COLUMN => 'c1', TIMESTAMP => ts1}
  hbase> t.get 'r1', {COLUMN => 'c1', TIMERANGE => [ts1, ts2], VERSIONS => 4}
  hbase> t.get 'r1', {COLUMN => 'c1', TIMESTAMP => ts1, VERSIONS => 4}

3.4.7put

作用：添加cell
实例：

# 向命名空间ns1下表t1的rowkey为r1的列c1添加数据
  hbase> put 'ns1:t1', 'r1', 'c1', 'value'

# 向默认命名空间下表t1的rowkey为r1的列c1添加数据
  hbase> put 't1', 'r1', 'c1', 'value'

# 向默认命名空间下表t1的rowkey为r1的列c1添加数据，并设置时间戳为ts1
  hbase> put 't1', 'r1', 'c1', 'value', ts1

# 向默认命名空间下表t1的rowkey为r1的列c1添加数据，并设置时间戳为ts1，并设置属性
  hbase> put 't1', 'r1', 'c1', 'value', ts1, {ATTRIBUTES=>{'mykey'=>'myvalue'}}

#引用对象的用法
t.put 'r1', 'c1', 'value', ts1, {ATTRIBUTES=>{'mykey'=>'myvalue'}}

3.4.8truncate

作用：删除表，不用disable
实例：

#删除表t3，不用disable
truncate 't3'

上一篇：HBase的Write Ahead Log (WAL)

下一篇：HBase基本知识介绍及典型案例分析

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

HBase Shell

HBase Shell

HBase Shell

3.1general

3.1.1status

3.1.2version

3.1.3whoami

3.2ddl

3.2.1create

3.2.2alter

3.2.3alter_async

3.2.4describe / desc

3.2.5disable

3.2.6disable_all

3.2.7drop

3.2.8drop_all

3.2.9enable

3.2.10enable_all

3.2.11exists

3.2.12get_table

3.2.13is_disabled

3.2.14is_enabled

3.2.15list

3.2.16show_filters

3.3namespace

3.3.1create_namespace

3.3.2alter_namespace

3.3.3describe_namespace

3.3.4drop_namespace

3.3.5list_namespace

3.3.6list_namespace_tables

3.4dml

3.4.1scan

3.4.2append

3.4.3count

3.4.4delete

3.4.5deleteall

3.4.6get

3.4.7put

3.4.8truncate

51CTO博客