数据库有一批数据,需要对比一个排除某些栏位数据的表,标出这些数据,这样后续计算时,可以排除这些数据。

可以使用到如下组建:

Table_Input:读取数据表和需要对比的参照表栏位,两个表的栏位需要一致,因此可以先手工构造参照表的栏位,提取填充需要对比的栏位数据值

Filter_Row:过滤掉不需要的栏位数据

Fuzzy_Match:对比源表和参照表的数据

Table_Output: 数据写到一个数据表

流程图如下:

Pentaho PDI 过滤/排除数据的一种方式_数据过滤

Pentaho PDI 过滤/排除数据的一种方式_数据_02