本文介绍常用的输入控件:


目录

1 CSV文件输入

2 文本文件输入

3 Excel输入

4 多文件合并

5 Get data from XML

6 JSON input

7 生成记录

8 表输入


1 CSV文件输入

kettle表输入到java代码 kettle输入excel_控件

2 文本文件输入

kettle表输入到java代码 kettle输入excel_etl_02

 

kettle表输入到java代码 kettle输入excel_数据仓库_03

 

kettle表输入到java代码 kettle输入excel_etl_04

3 Excel输入

前言:

微软的Excel目前有两种后缀名的文件分别为:xls和xlsx
xls:2007年之前
xlsx:2007年之后

kettle表输入到java代码 kettle输入excel_控件_05

对于Excel文件,需要先选择“表格类型(引擎)”,才会浏览到对应excel版本文件。


表格类型(引擎):

若Excel后缀名为.xls,则设为“Excel 97-2003 XLS (JXL)”;

若Excel后缀名为.xlsx,则为“Excel 2007 XLSX (Apache POl)”

kettle表输入到java代码 kettle输入excel_控件_06

kettle表输入到java代码 kettle输入excel_控件_07

4 多文件合并

”多文件合并“:将多个文件合并为一个文件。

kettle表输入到java代码 kettle输入excel_etl_08

kettle表输入到java代码 kettle输入excel_数据仓库_09

5 Get data from XML

XML 指可扩展标记语言(EXtensible Markup Language)。

数据准备:

<?xml version="1.0" encoding="UTF-8" ?>
<all_data>
    <row id="1">
        <name>Amy</name>
        <age>18</age>
    </row>
    <row id="2">
        <name>Li</name>
        <age>20</age>
    </row>
</all_data>

XML结构分析:

kettle表输入到java代码 kettle输入excel_etl_10

前言:XPath

XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。

XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。

选取节点XPath使用路径表达式在XML文档中选取节点。节点是通过沿着路径或者step来选取的。

下面列出了最有用的路径表达式:

kettle表输入到java代码 kettle输入excel_XML_11

 路径表达式-示例:

kettle表输入到java代码 kettle输入excel_etl_12

控件要点:

kettle表输入到java代码 kettle输入excel_XML_13

 

kettle表输入到java代码 kettle输入excel_控件_14

 字段排列顺序与结果一致。

kettle表输入到java代码 kettle输入excel_数据仓库_15

 

kettle表输入到java代码 kettle输入excel_etl_16

6 JSON input

JSON(0 avaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式。

数据准备:

{
  "userinfo": [
    {
      "name": "Amy",
      "age": "18"
    },
    {
      "name": "Li",
      "age": "20"
    }
  ]
}

JSON结构分析:

kettle表输入到java代码 kettle输入excel_数据仓库_17

 前言:JSONPath

JSONPath类似于XPath在xml文档中的定位,JsonPath表达式通常是用来路径检索或设置Json的。

其表达式可以分为“"dot-notation”(点记法)和"bracket-notation”(括号记法)格式

点记法:$.store.book[0].title

括号记法:$['store']['book'][o]['tite']


下面列出了最有用的路径表达式:

kettle表输入到java代码 kettle输入excel_kettle表输入到java代码_18

 JSONPath示例:

kettle表输入到java代码 kettle输入excel_kettle表输入到java代码_19

控件要点:

kettle表输入到java代码 kettle输入excel_kettle表输入到java代码_20

 

kettle表输入到java代码 kettle输入excel_数据仓库_21

 

kettle表输入到java代码 kettle输入excel_XML_22

 参考:

遇见Kettle ETL工具课程入门-进阶-实战 Kettle2020全新从入门到精通实战课程

7 生成记录

”生成记录“控件:生成N行相同的数据行。

kettle表输入到java代码 kettle输入excel_etl_23

 

kettle表输入到java代码 kettle输入excel_数据仓库_24

8 表输入

“表输入”:实际是对数据库表的查询

kettle表输入到java代码 kettle输入excel_kettle表输入到java代码_25

参考:遇见Kettle ETL工具课程入门-进阶-实战 Kettle2020全新从入门到精通实战课程