http://wiki.pentaho.com/display/BAD/Extracting+Data+from+HBase+to+Load+an+RDBMS

 

1)新建转换——Big Data——Hbase Input双击打开

 

2)在hbase中创建表

kettle hbase kettle hbase数据库连接_字段

3)点击Get table names

kettle hbase kettle hbase数据库连接_Data_02

4)创建Mapping

在下图中单击Get table names按钮,从下拉列表中选择需要创建MAPPING的表名,在Mapping name中输入Mapping名称,然后再设置key字段,如下图

kettle hbase kettle hbase数据库连接_Data_03

4)创建完Mapping后,再返回Configure query页签

A 设置Zookeeper Host(s)

B 设置Zookeeper post默认为2181

C 单击Get mapped table names,从已经创建过MAPPING的列表中选择表名

D 单击Get mappings or the specified table 获取该表MAPPING

E 单击Get Key/Fields Info获取Key字段

 

kettle hbase kettle hbase数据库连接_kettle hbase_04

kettle hbase kettle hbase数据库连接_字段_05

kettle hbase kettle hbase数据库连接_kettle hbase_06

kettle hbase kettle hbase数据库连接_表名_07

2016/07/28 11:27:48 - Default - ERROR (version 3.2.0, build 1 from 2016-07-07 10.46.10 by xnren) : Error disconnecting from database : 
2016/07/28 11:27:48 - Default - ERROR (version 3.2.0, build 1 from 2016-07-07 10.46.10 by xnren) : Unable to commit repository connection
2016/07/28 11:27:48 - Default - ERROR (version 3.2.0, build 1 from 2016-07-07 10.46.10 by xnren) : 
2016/07/28 11:27:48 - Default - ERROR (version 3.2.0, build 1 from 2016-07-07 10.46.10 by xnren) : Error comitting connection
2016/07/28 11:27:48 - Default - ERROR (version 3.2.0, build 1 from 2016-07-07 10.46.10 by xnren) : No operations allowed after connection closed.

 

注:上图报错因为数据库资源库连接断了,重新连接数据库资源池,ctrl+r

 

执行运行

kettle hbase kettle hbase数据库连接_表名_08

但是没有文件,解决办法:

kettle hbase kettle hbase数据库连接_Data_09

kettle hbase kettle hbase数据库连接_kettle hbase_10

把上面的这个

kettle hbase kettle hbase数据库连接_字段_11

对勾去掉,就可以写入文件了

kettle hbase kettle hbase数据库连接_表名_12

$ cat file.txt

Key;A

Key;115