目录
1.配置源数据库A
1.1 文件-->数据库连接
1.2 配置数据库,选择自己的数据库并配置。
1.3 数据库配置可能会报错,原因是缺少数据库驱动
2.配置目标数据库(与源数据库一致)
3.数据迁移(举例)
3.1 创建数据转化任务
3.2 选择数据来源(输入--> 表输入)
3.3 选择数据去向(输出--> 表输出)
4. 数据转化开始执行
5.其他
Kettle支持多种数据源,MySql、Oracle、Excel等,本文以最简单的Mysql向MySql迁移为例。后续逐步增加复杂度,如:表格不一致时,增加数据常亮、数据筛选、新增自增列等等,甚至增加脚本逻辑代码。
1.配置源数据库A
1.1 文件-->数据库连接
1.2 配置数据库,选择自己的数据库并配置。
1.3 数据库配置可能会报错,原因是缺少数据库驱动
错误连接数据库 [kettle_mysql] : org.pentaho.di.core.exception.KettleDatabaseException:
Error occurred while trying to connect to the database
Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver
解决办法:拷贝响应的数据库驱动(例如 mysql-connector-java-5.1.47.jar)至 目录bin,并重启客户端
2.配置目标数据库(与源数据库一致)
3.数据迁移(举例)
3.1 创建数据转化任务
3.2 选择数据来源(输入--> 表输入)
1)可以手动写SQL语句,可以手动增加筛选条件 where
2) 也可以通过“获取SQL语句”,通过界面化页面选择
3)选择数源的结果,可以通过“预览” 进行查看
3.3 选择数据去向(输出--> 表输出)
1)根据自己的业务选择输出目标 数据表、Excel文件等
2)表输出选择与表输入一致
3)如果来源表与目标表结构一致,其实这一步已经可以了。
4)开始做表数据关联
选中“表输入A” 关联按钮指向 “表输出B”
4. 数据转化开始执行
5.其他
往往在工作中表输入A 与 表输出B的结构可能不一致。也可能“表输出B”在写入时需要依据“输入表A”的数据增加一些业务逻辑判断,从而进行不同逻辑的处理之后才可以应用。后续将逐步完善