文章目录
- HBase常用shell操作
- (一)运行HBase
- (二)表操作
- (三)添加数据操作
- (四)查询数据操作★
- Get查询
- Scan查询
- (五)删除操作
- (六)HBase预分区建表操作
HBase常用shell操作
(一)运行HBase
1.启动HBase集群
#在node01上执行
cd /export/servers/hbase-1.2.0-cdh5.14.0
bin/start-hbase.sh
#进入HBase客户端命令操作界面
bin/hbase shell
2.关闭HBase集群
#在node01上执行
cd /export/servers/hbase-1.2.0-cdh5.14.0
bin/stop-hbase.sh
3.仅在一台机上启动HBase
#在node01上执行
cd /export/servers/hbase-1.2.0-cdh5.14.0
#启动HMaster命令
bin/hbase-daemon.sh start master
#启动HRegionServer命令
bin/hbase-daemon.sh start regionserver
4.集成hue时, 需使用thrift server服务
#启动thrift server服务
cd /export/servers/hbase-1.2.0-cdh5.14.0
bin/hbase-daemon.sh start thrift
#关闭thrift server服务
bin/hbase-daemon.sh stop thrift
(二)表操作
注意: Shell客户端的操作区分大小写,退格键是往右缩进。
#创建user表,包含info、data两个列族(默认只保留1个版本号)
create 'user', 'info', 'data'
#创建user1表,包含info、data两个列族,数据均保留3个版本号
create 'user2', {NAME => 'info', VERSIONS => '3'}, {NAME => 'data'}
#查看数据库中有哪些表
list
#检查数据库中是否有user1这张表(当表特别多的时候用)
exists 'user1'
#展示user1表的结构信息
describe 'user1'
#分别添加一条数据用作演示
put 'user', 'rk0001', 'info:name', 'zhangsan'
put 'user1', 'rk0001', 'info:name', 'zhangsan'
#查看user1表中的所有数据
scan 'user1'
#统计user1表中有多少行数据
count 'user1'
#禁用表|检查表是否被禁用
disable 'user1'
is_disabled 'user1'
#启用表|检查表是否被启用
enable 'user1'
is_enabled 'user1'
#将user1表的info列族版本号改为5
alter 'user1', NAME => 'info', VERSIONS => 5
#为user1表增加列族desc,保留2个版本号
alter 'user1', NAME => 'desc', VERSIONS => 2
#删除user1表的dwsc列族:
alter 'user1', 'delete' => 'desc'
#删除user1表的info列族
alter 'user1', NAME => 'info',METHOD => 'delete'
#删除user1表,删除前必须先禁用
disable 'user1'
drop 'user1'
#清空user表(本质上是对表进行3个操作: 禁用→删除→创建)
truncate 'user'
(三)添加数据操作
注意: 更新操作同插入操作一模一样,当插入的数据已存在就更新,不存在就添加
#向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan
put 'user','rk0001','info:name','zhangsan'
#向user表中插入信息,row key为rk0001,列族info中添加gender列标示符,值为female
put 'user','rk0001','info:gender','female'
#向user表中插入信息,row key为rk0001,列族info中添加age列标示符,值为20
put 'user','rk0001','info:age',20
#向user表中插入信息,row key为rk0001,列族data中添加pic列标示符,值为picture
put 'user','rk0001','data:pic','picture'
(四)查询数据操作★
Get查询
①通过rowkey进行查询
#获取user表中row key为rk0001的所有信息
get 'user','rk0001'
②查看rowkey下面的某个列族的信息
#获取user表中row key为rk0001,info列族的所有信息
get 'user','rk0001','info'
③查看rowkey指定列族指定字段的值
#获取user表中row key为rk0001,info列族的name、pic列标示符的信息
get 'user','rk0001','info:name','data:pic'
④查看rowkey指定多个列族的信息
#获取user表中row key为rk0001,info、data列族的信息
get 'user','rk0001','info','data'
get 'user','rk0001',{COLUMN => ['info','data']}
get 'user','rk0001',{COLUMN => ['info:name','data:pic']}
⑤指定rowkey与列值查询
#获取user表中row key为rk0001,cell的值为zhangsan的信息
get 'user','rk0001',{FILTER => "ValueFilter(=,'binary:zhangsan')"}
⑥指定rowkey与列值模糊查询
#获取user表中row key为rk0001,列名中含有a的信息
get 'user','rk0001',{FILTER => "QualifierFilter(=,'substring:a')"}
Scan查询
继续插入一批数据
put 'user', 'rk0002', 'info:name', 'fanbingbing'
put 'user', 'rk0002', 'info:gender', 'female'
put 'user', 'rk0002', 'info:nationality', '中国'
①查询所有数据
#查询user表中的所有信息
scan 'user'
②列族查询
#查询user表中列族为info的信息
scan 'user',{COLUMN => 'info'}
③多列族查询
#查询user表中列族为info和data的信息
scan 'user', {COLUMNS => ['info', 'data']}
④指定列族与某个列名查询
#查询user表中列族为info、列标示符为name以及列族为data、列标示符为pic的信息
scan 'user', {COLUMNS => ['info:name', 'data:pic']}
⑤指定列族与列名以及限定版本查询
#查询user表中列族为info、列标示符为name的信息,并且版本最新的5个
scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}
⑥指定多个列族与按照列标示符含有字符信息模糊查询
#查询user表中列族为info和data且列标示符中含有a字符的信息
scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}
⑦指定rowkey的范围值查询
#查询user表中列族为info,rk范围是[rk0001, rk0003)的数据
scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
⑧指定rowkey模糊查询
#查询user表中row key以rk字符开头的
scan 'user',{FILTER=>"PrefixFilter('rk')"}
⑨指定数据的时间范围值查询
#查询user表中指定范围的数据
scan 'user', {TIMERANGE => [1566441175655, 1566452975655]}
(五)删除操作
1.指定rowkey以及列名进行删除
#删除user表row key为rk0001,列标示符为info:name的数据
delete 'user', 'rk0001', 'info:name'
2.指定rowkey,列名以及字段值进行删除
#删除user表row key为rk0002,列标示符为info:name,timestamp为1566443512710的数据
delete 'user', 'rk0001', 'info:name', 1566443512710
删除列族、删除表的操作已在表操作中介绍过了。
(六)HBase预分区建表操作