1.行扁平化只适用于除最后一列之不同,前几列排序之后,每一类的行数相同的情况。

kettle使用记录_扁平化

2.去除重复记录必须先经过排序,否则达不到去重的效果。

3.唯一行(哈希值)是在内存中对数据进行去重操作。