hbase获取所有版本(时间戳)的数据
首先,每一个cell里,可能包含多个时间戳的数据,
系统默认显示在时间范围内最新的那个。
在hbase里建立一个测试库,
根据网上的资料,实验如下,
首先我们要修改库的version,默认是1,当默认的情况下,是不会保留以前时间戳的数据的。
hbase shell
put 'lyx_test','wanglei','info:age','100'
put 'lyx_test','wanglei','info:age','101'
put 'lyx_test','wanglei','info:age','102'
当没设置version时,下行代码只显示了一行
get 'lyx_test','wanglei',{COLUMN=>'info:age',TIMERANGE=>[0,1487745602769],VERSIONS=>2}
设置version:
alter 'lyx_test',{NAME=>'info',VERSIONS=>2}
再执行上述put以及get后,发现能够显示两行
那么我要如何在java的MR代码中获取到包含所有版本时间戳的完整cell数据呢
在main里(或run里),在TableMapReduceUtil.initTableMapperJob之前声明的
Scan myscan=new Scan();后面增加此行代码
myscan.setMaxVersions();即可
原来的数据是这样的:
--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0}
增加以后,kv输出的数据格式变成这样
--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0, 2f1109b71037ae8ea86980/H:contact/86402/Put/vlen=2/seqid=0}