文本文件有文件、内容、错误处理、过滤、字段和Additional output fields等几个页签,主要说一下内容和过滤两个页签。

  内容,如下

    

[数据仓库]kettle——入门操作(文本文件输入流)_字段

      1)文件类型,保持默认csv即可

      2)分隔符:指的是文本文件每个字段间的分区标志,如下

          

[数据仓库]kettle——入门操作(文本文件输入流)_限定符_02

        不可见分隔符的输入方法:$[01]

      3)文本限定符:当文本字段中有分隔符作为字段内容一部分的时候就需要文本限定符了,如下

        

[数据仓库]kettle——入门操作(文本文件输入流)_Kettle_03

        使用方法如下:    

 

[数据仓库]kettle——入门操作(文本文件输入流)_Kettle_04

[数据仓库]kettle——入门操作(文本文件输入流)_分隔符_05

        结果如下

        

[数据仓库]kettle——入门操作(文本文件输入流)_限定符_06

      4)逃逸字符:针对文本限定符而言,当文本字段中出现文本限定符了,需要使用的

        如下

[数据仓库]kettle——入门操作(文本文件输入流)_Kettle_07

[数据仓库]kettle——入门操作(文本文件输入流)_Kettle_08

        5)其他不再做解释

  过滤,看前后对比

            

[数据仓库]kettle——入门操作(文本文件输入流)_Kettle_09

      

[数据仓库]kettle——入门操作(文本文件输入流)_分隔符_10