kettle java脚本获取job定义的变量 kettle执行job

转载

jacksky 2023-09-07 11:23:15

核心概念

kettle java脚本获取job定义的变量 kettle执行job_数据

负责将Transformation组织在一起进而完成某一工作，通常我们需要把一个大的任务分解成几个逻辑上隔离的Job，当这几个Job都完成了，也就说明这项任务完成了。

Job Entry是Job内部的执行单元，每一个Job Entry用于实现特定的功能，如：验证表是否存在，发送邮件等。可以通过Job来执行另一个Job或者Transformation，也就是说Transformation和Job都可以作为Job Entry。

Job Entry包含内容如下：

kettle java脚本获取job定义的变量 kettle执行job_执行顺序_02

Job Hop是作业项之间的连接线。他定义了作业的执行路径。作业里每个作业项的不同运行结果决定了作业的不同执行路径。

Job Hop有如下三种执行情况：

kettle java脚本获取job定义的变量 kettle执行job_执行顺序_03

无条件执行：不论上个作业项执行成功或者失败，下一个作业项都会执行。这是一种蓝色的连接线，上面有一个锁的标。
当运行结果为真时执行：当上一个作业项执行结果为真时，执行下一个作业项。通常在需要无错误执行的情况下使用。这是一条绿色的连接线，上面有对勾号的图标。
当运行结果为假时执行：当上一个作业项执行结果为假或者没有执行成功，执行一按一个作业项，这是一条红色的连接线，上面有红色停止的图标。

kettle java脚本获取job定义的变量 kettle执行job_执行顺序_04

Transformation是对数据操作的容器，数据操作就是数据从输入到输出的一个过程，可以理解为比Job粒度更小一级的容器，我们将任务分解成Job，然后需要将Job分解成一个或多个Transformation，每个Transformation只完成一部分工作。

Step是Transformation内部的最小单元，每一个Step完成一个特定的功能。

转换跳是步骤之间带箭头的连线，也是两个步骤之间的被称为行集的数据行缓存。
转换跳的这种基于行集缓存的规则允许每一个步骤都是有一个独立的线程运行，这样并发程度最高。这一规则也允许数据以最小的消耗内存的数据流的方式处理。

Transformation Hop 的读写机制如下：

Transformation Hop包含内容：

kettle java脚本获取job定义的变量 kettle执行job_数据_05

Transformation：步骤之间的数据以数据流方式传递。所有的步骤都会从输入跳（Hop）中读取数据，并把处理过的数据写到输出跳（Hop），直到输入跳（Hop）里不再有数据就终止步骤的运行；
Job：作业项之间可以传递一个包含了数据行的结果对象。当一个作业项执行完成后，再传递结果对象给下一个作业项。