应用场景:

我们想把表头一致的多个EXCEL文件导入数据库,可以使用kettle操作非常方便。

第一步:

新建转换

kettle迁移mysql至达梦 kettle将excel导入数据库_etl

第二步:

在输入中找到EXCEL输入,单击拖到右边操作框。

kettle迁移mysql至达梦 kettle将excel导入数据库_kettle迁移mysql至达梦_02


kettle迁移mysql至达梦 kettle将excel导入数据库_字段_03

第三步:

在输出中找到表输出,单击拖到右边操作框。

kettle迁移mysql至达梦 kettle将excel导入数据库_oracle_04

第四步:

点击EXCEL输入摁住鼠标滚轮出现箭头链接到表输出。

kettle迁移mysql至达梦 kettle将excel导入数据库_oracle_05


第五步:

(1)双击EXCEL输入点击浏览点击所有文件找到任意一个文件,点击确定—点击添加

kettle迁移mysql至达梦 kettle将excel导入数据库_数据库_06


(2)表格类型下拉按钮如果EXCEL文件是.XLS选择 Excel 97-2003 XLS (JXL),如果是.xlsx选择Excel 2007 XLSX (Apache POI Streaming);

第六步:

点击字段,点击获取获取来自头部数据的字段。

kettle迁移mysql至达梦 kettle将excel导入数据库_字段_07


kettle迁移mysql至达梦 kettle将excel导入数据库_oracle_08


第七步:

在数据库中创建表

create table  数据采集0329(
Clientmachine_ID  VARCHAR2(250),
MD5  VARCHAR2(250),
YUAN_IP   VARCHAR2(250),
IP_HOME    VARCHAR2(250),
Target_port VARCHAR2(250),
URL VARCHAR2(1024),
Record_time   VARCHAR2(250));

第八步:

(1)在目标表中输入 你创建的表名 test0329,选择指定数据库字段,点击获取字段。

kettle迁移mysql至达梦 kettle将excel导入数据库_etl_09


(2)将表字段(在数据库中创建表的表头)与流字段(导入的EXCEL中的表头)一一对应,点击确定。

kettle迁移mysql至达梦 kettle将excel导入数据库_etl_10


第九步:

运行,经测试一个EXCEL可以导入、

kettle迁移mysql至达梦 kettle将excel导入数据库_字段_11


第十步:

双击EXCEL输入将文件/目录改成所有EXCEL所在目录,然后利用通配符“.”例如 .*入站请求.*.xlsx,利用通配符匹配所有文件,然后点击确定,运行。
此处“.*”通配符代表所有字段。

kettle迁移mysql至达梦 kettle将excel导入数据库_kettle迁移mysql至达梦_12


运行结果如下:

kettle迁移mysql至达梦 kettle将excel导入数据库_字段_13


这样就导入成功了。

小技巧
可以在日志中查看报错,根据错误类型进行修改,常见错误如在创表时字符长度太小,需要修改字符长度等。

你学会了吗?