实验一:复杂表头的Excel数据源处理


  1. 如何利用kettl进行可视化编程


实验原理

  1. 通过“Excel输入”选择要最终输出的字段到下一个步骤“追加流”(实验中必须保证每个数据源经过字段选择后,输出的字段都是一致的),再通过“追加流”设置2个数据源的合并顺序,然后通过“追加流”进行多个据源的合并。


实验要求 1.熟练掌握“Excel输入”,组件的使用,完成复杂表头的Excel数据源处理 实验步骤 一、创建转换(ktr文件)

1. 文件→新建转换


kettle postgres批量加载 kettle追加流_数据源


2.保存重命名 设置保存路径


kettle postgres批量加载 kettle追加流_kettle postgres批量加载_02


二、核心对象


kettle postgres批量加载 kettle追加流_字段_03


三、可视化编程


1.创建步骤,设置表输入


kettle postgres批量加载 kettle追加流_字段_04


2.创建Microsoft excel输出


kettle postgres批量加载 kettle追加流_数据源_05


3.创建转换的跳,表输入输出连接


kettle postgres批量加载 kettle追加流_字段_06


4.创建数据库,导入信息表


kettle postgres批量加载 kettle追加流_可视化编程_07

5.配置表输入,连接类型选择mysql,主机名称为localhost,数据库名称为sql_test,端口号默认3306,用户名root,密码为空

kettle postgres批量加载 kettle追加流_数据源_08


kettle postgres批量加载 kettle追加流_数据源_09


6.获取sql语句

kettle postgres批量加载 kettle追加流_字段_10


7.展开sheet1

kettle postgres批量加载 kettle追加流_数据源_11


kettle postgres批量加载 kettle追加流_可视化编程_12


8.预览数据,记录数量为1000

kettle postgres批量加载 kettle追加流_kettle postgres批量加载_13


9.配置Microsoft Excel输出。配置文件路径,文件名,拓展名选择2007以上的版本

kettle postgres批量加载 kettle追加流_可视化编程_14


10.获取上个步骤输出的数据字段

kettle postgres批量加载 kettle追加流_数据源_15


11.运行转换,执行程序

kettle postgres批量加载 kettle追加流_字段_16


四、执行结果

1.输出一个Excel文件

kettle postgres批量加载 kettle追加流_可视化编程_17


2.日志

kettle postgres批量加载 kettle追加流_kettle postgres批量加载_18


3. 步骤度量

kettle postgres批量加载 kettle追加流_可视化编程_19


4.Metrice

kettle postgres批量加载 kettle追加流_数据源_20


5.Preview data

kettle postgres批量加载 kettle追加流_可视化编程_21


五、状态栏

kettle postgres批量加载 kettle追加流_kettle postgres批量加载_22


1.转换调试程序

kettle postgres批量加载 kettle追加流_kettle postgres批量加载_23

六、主对象树

kettle postgres批量加载 kettle追加流_kettle postgres批量加载_24