文本理工具

wc(word count) 统计文件

wc命令用于统计文件的行、字节数、用空格隔的字符单词数信息

法:wc [文件名...]

      wc [选项] [文件名...]

选项

    -l统计数(lines)

    -w统计单词数(words)

    -c统计节数(bytes)

    -m统计字符

    -L统计文件中最行的


cut 字符截取

cut命令用于截取文件中的字符;如果要分割多个数字,用“,行分割;如果要分割连续字段,用“-行分割(1-9

法:cut [选项...] [文件名]

      cut [指定分隔符] [文件名]

选项

    -d:指定分隔符(只能指定一个),这个选项和字符之可以不用加空格

    -f:指定提取第几列,这个选项和字符之可以不用加空格

        #:指定的单个字段

        #-#:连续的多个字段

        #,#:离散的多个字段

    -n-b选项结合使用,不分割多字字符

    -s:不示不包含分隔符的行

    --output-delimiter=分隔符;指定容是的字段分割符


cut的局限

cut命令默是不能使用多个空格作分隔符

Linux文本处理工具_文本处理


可用awk命令解决

Linux文本处理工具_ 命令 _02



sort 排序

sort用于文件行排序,并将排序出;sort是比每一行的第一字符,按字母表中升序行排序

法:sort [文件名...]

      sort [选项] [文件名...]

选项

    -f:忽略字符大小

    -r:反向排序

    -k:以指定字段为标行排序

    -t:指定字段分隔符

    -n:以数值大小行排序

    -u:重的行,只示一次


uniq 忽略重

uniq 用于忽略文件中的重行,一般sort合使用

法:uniq [选项] [文件名]

选项

    -c示每行出的次

    -d仅显示重复过的行

    -u仅显有重复过的行