文章目录

  • 前言
  • 一、下载、安装
  • 二、启动软件
  • 三、转换的使用教程
  • 四、作业的使用教程
  • 总结



前言

Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。


一、下载、安装

我使用的是7.0.0.0-25版本,
oracle、mysql驱动文件的下载地址:文章末尾
直接下载,解压就可以使用。

二、启动软件

双击 Spoon.bat 就能启动 kettle 。

java 执行kettle脚本 kettle调用jar包_数据库连接

三、转换的使用教程

1.点击 文件->新建->转换

java 执行kettle脚本 kettle调用jar包_java 执行kettle脚本_02

2.在主对象树中点击DB连接,新建数据库连接。

java 执行kettle脚本 kettle调用jar包_mysql_03


3.配置数据库连接,配置完可以点测试进行验证连接是否成功,在连接数据库是需要下载mysql驱动,否则会报找不到驱动错误,将驱动文件放在lib文件夹下,mysql驱动文件的下载地址:

java 执行kettle脚本 kettle调用jar包_kettle_04


4.在核心对象中找到输入文件,将表输入拖动到右边的方框中即可。

java 执行kettle脚本 kettle调用jar包_数据库连接_05


5.双击右侧拖入的表输入控件,选择数据库连接和输入sql语句。

java 执行kettle脚本 kettle调用jar包_mysql_06


6.在核心对象中找到插入/更新控件,将插入/更新拖动到右边的方框中即可。

java 执行kettle脚本 kettle调用jar包_数据库连接_07

7.按住 Shift 键,点击表输入拖动鼠标把表输入和插入/更新用线将两个控件连接起来,使数据可以进行相互传输。

java 执行kettle脚本 kettle调用jar包_kettle_08


8.双击插入/更新,进行配置目标数据库连接和更新的数据表以及对应的表字段。

java 执行kettle脚本 kettle调用jar包_kettle_09


9.点击运行,就实现了数据的传输。运行结束后可以看到运行的条数,时间等。

java 执行kettle脚本 kettle调用jar包_java 执行kettle脚本_10

四、作业的使用教程

需要定时更新数据,就会用到作业。

1.新建一个作业

java 执行kettle脚本 kettle调用jar包_使用教程_11


2.从左侧依次拖动 START 、转换、成功到右侧,并用线连接起来。

java 执行kettle脚本 kettle调用jar包_kettle_12

3.双击START,配置我们需要定时运行转换

java 执行kettle脚本 kettle调用jar包_java 执行kettle脚本_13

4.双击转换,选择需要运行的转换文件

java 执行kettle脚本 kettle调用jar包_java 执行kettle脚本_14

5.点击运行,这个作业就处于运行状态,根据设置的时间节点运行,运行成功后可以看到运行的作业量度。

java 执行kettle脚本 kettle调用jar包_使用教程_15


到这里,一个简单的kettle的转换与作业就完成了,希望对你有所帮助。


总结

kettle 是一个非常强大的 ETL 工具,通过图形化界面的配置,可以实现数据迁移,并不用开发代码。



上面这篇博客写的相对比较详细,本人根据实际操作过程中遇到的问题,列出几项需要注意的问题

不管是连接mysql还是oracle数据库,需要把相应的驱动jar包复制到kettle的lib目录下,要重启。

  • oracle的连接方式要注意,只需要填写“数据库名称”即可,端口和主机名/SID直接拼接在后面

主机名称:不用填
数据库名称:填写域名或者IP:端口/服务名
数据表空间:不用填
索引表空间:不用填
端口号:-1,因为再填写数据库名称时已经填写,所以这里填写-1
用户名:用户名
密码:密码

mysql和oracle连接驱动所需jar包地址:
链接:https://pan.baidu.com/s/1ErGP7AHBXzt4DEzNg8Rl7w?pwd=auht
提取码:auht