kettle下载和运行(windows)

http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/
本教程以下载pdi-ce-7.0.0.0-25.zip为例

解压后如下

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_字段

双击spoon.bat进入kettle,成功进入后如下图

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_大数据_02

创建作业和转换

在主对象树下面分别双击作业和转换,即可创建作业和转换

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_大数据_03


比如我们双击转换,就成功创建了一个转换如下图

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_大数据_04

给转换配置db连接

上面的例子我们已经创建了一个转换,接下来双击创建的转换中的db连接(上图中选中的部分),创建一个db连接

以oracle为例,弹出来的界面这样配置

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_大数据_05


kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_etl_06

表输入

表输入首先要有一张表,我们就创建一张测试表,在刚才上一步配置的数据库连接的数据库中创建一张表reader

create table reader(
    rdid varchar2(50),
    rdname varchar2(50)
) ;

然后在核心对象的输入中,找到表输入,拖到右边的画布中

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_大数据_07

双击拖到画布中的表输入进行编辑,在弹出来的界面:
1. 数据库连接选择上一步配置的数据库连接
2. 输入sql 语句 select rdid,rdname from reader

插入/更新

创建要插入更新的表,还是在刚才配置的数据库连接的数据库中创建一张表reader_new

create table reader_new(
    rdid_new varchar2(50),
    rdname_new varchar2(50)
) ;

然后找到插入/更新,拖到画布中

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_kettle_08

先点住刚才创建的表输入,按住shift拖动鼠标会出现一根线,将这根线牵到现在创建的 插入\更新 中,连好了是这种效果

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_kettle_09

双击对 插入/更新 进行编辑

1. 目标表选择reader_new

2. 关键字和更新字段像图中这样配置,更新字段可以通过编辑映射和获取和更新字段快速配置

3. 这样配置会根据rdid_new来插入或更新rdname_new

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_etl_10

测试转换的效果

我们先往reader表随机插入一些数据,我们这边用代码往随机生成了一些数据

然后点击运行转换按钮开始运行

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_大数据_11

运行的日志可以在这里看

kettle转换如何使用javascript代码转换数据类型 kettle的转换步骤_数据库连接_12

运行完成后,reader表的数据就全部同步到reader_new表中了