一、概述
cut是将文本文件按列分割的工具,并且可以指定列与列之间的定界符。每一列称为一个字段。
制表符\t 是默认的定界符,如何一行中没有定界符,将原样输出。
二、具体使用方法
(1)从文本文件中提取指定列, field_list是由列号组成作为-f的参数,列号从1开始,使用逗号隔开
cut -f field_list filename
eg.
[1]提取文件file的第2列和第3列
cut -f 2,3 file
[2]从标准输入中获得数据,进行分割
cat file | cut -f 2,3
[3]默认没有定界符的行将显示,使用-s选项去掉没有定界符的行
cut -f 3,4 file -s #没有制表符的行将不再显示
(2)指定排除某些列(需要提取的列很多,则进行补集运算),field_list为需要排除的字段。
cut -f field_list filename --complement
eg.
[1]提取file文件中除了第2列和第3列以外的列
cut -f 2,3 file --complement
(3)指定定界符 -d
cut -f field_list -d delimiter filename
eg.
[1]file文件中的每一字段由分号隔开,提取第2个字段
cut -f 2 -d ";" file
(4)将一串字符作为字段来显示
记法 | 范围 |
N- | 从第N个字节、字符或字段 到 行尾 |
N-M | 从第N个字节、字符或字段 到 第M个(包括第M个在内)字节、字符或者字段 |
-M | 第1个字节、字符或字段 到 第M个(包括第M个在内)字节、字符或字段 |
-b | 字节 |
-c | 字符 |
-f | 字段 |
eg.
[1]打印文件中的第3到第5个字符
cut -c 3-5 file
[2]打印文件中的前2个字符
cut -c -2 file
[3]提取多个字段是,使用--output-delimiter 指定定界符,否则不能区分多个字段
cut -c 3-5,6-9 file --output-delimiter ","