1. 在windows下安装kettle
想要运行kettle8.2必须安装1.8以上版本的jdk,下载kettle可以
Kettle下载后得到pdi-ce-8.2.0.0-342.zip的压缩包。将其解压得到data-integration文件夹。
利用编译工具打开spoon.bat在如图位置加入"-Dfile.encoding=UTF-8"防止kettle乱码。
windows系统可以通过双击运行/data-integration下的spoon.bat文件来打开图形化界面。
然后是在windows下的资源库的创建。
为了让kettle能够连接数据库我们要在/data-integration/lib下放入数据库的驱动。否则kettle与数据库连接时会报错。在这里我用的是mysql所以加入的驱动为mysql-connector-java-5.1.46-bin.jar。
2. 建立kettle的资源库
在kettle中的转换或者作业等资源的存储仓库称为资源库:分为文件资源库、数据库资源库。
| 数据库资源库 | 文件资源库 |
区别 | 产生的文件存放在数据库中 | 文件存放在实际目录中 |
现在我们来以数据库资源库为例,运行spoon.bat后点击右上角的“Connect”中的“Repository Manager”会弹出一个窗口点击“add”按钮创建新的资源库。
再点击“Other Repositories”如下图
选择相应的资源库,在这里我选择的是数据库资源库如下图
将数据库起名后点击Database Connection,在点击Create New Connection
进入DatabaseConnection对资源库的连接进行新建或设置(这里我配置的为mysql)如下图
点击选项为资源库设置参数
参数如下
rewriteBatchedStatements true
useCompression true
defaultRowPrefetch 1000
cachePrepStmts true
useUnicode true
characterEncoding UTF-8
useSSL false
serverTimezone Asia/Shanghai
useServerPrepStmts false
autoReconnect true
参数配置完成后
点击测试出现正确连接到数据库的提示。
点击确认返回如下页面
点击back
finish,后即可完成数据库资源库的创建。
此时查看数据库会发现有许多kettle资源库相关的表生成。
点击主页面的connect就能看到刚刚创建的资源库
点开输入默认账号密码就能登入资源库。
账号:admin
密码:admin
3. DB连接的创建
在kettle的使用过程中我们需要建立DB连接来定位我们在进行转换时需要用到的表
进入资源库后任意新建或打开一个转换,出现如下菜单。
右键新建DB连接弹出数据库连接的窗口,与上文配置资源库连接类似(参考2中的内容即可)
DB连接的参数设置同上。