1,cut 命令
cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”,来进行分析的,并不是整篇信息分析的。cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。
常用的有
#cut -d 后面指定分隔符,用单引号引起来。
#cut -f 指定第几段
#cut -c 后面只有一个数字表示截取第几个字符,后面跟一个数字区域,表示截取从几到几
#cat /etc/passwd |cut -d: -f 1 以冒号为分割符,截取该文件的第一段
#cut -c 后面可以是一个数字n,也可以是一个区间n1-n2,也可以是n1,n2,n3
2,sort命令,将文本文件内容加以排序。
-r 以相反的顺序来排序。 (按照as码)
-t<分隔字符> 指定排序时所用的栏位分隔字符。
-n 依照数值的大小排序。
-u 去重复
-k 后面跟数字,表示对第几个区域的字符串排序
#sort -t:-k3,5 -r /etc/passwd
表示从第3到第5区域间的字符排序,-r表示反向排序
3,wc命令
#wc -l file 显示文件内容的行数
#wc -w 计算文件有多少个单词
wc -m 计算文件有多少个字符
4,unip和tee命令
unip用来去重复的行,常用 -c 统计重复的行数,并把行数写在前面。
使用unip的前提是需要给文件排序,否则无用
#sort 1.txt |unip -c
tee命令,后面跟文件名,类似与重定向 > ,但是比重定向多了一个 显示 功能。
#echo "dffvfv" |tee 1.txt
dffvfv
#cat 1.txt
dffvfv
5,tr和split命令
tr用于替换字符,常用来处理文档中出现的特殊符号。
-d 删除某个字符,-d后面要跟要删除的字符
-s 重复的字符去掉
最常用的就是把小写变大写
#tr '[a-z]' '[A-Z]'
#tr 'r' 'R'
split用于切割文档
-b 依据大小分割文档,单位为byte
-l 依据行数来分割文档
#split -b500 passwd 以500字节为大小切割该文件
如果不指定目标文件名,则会以xaa xab……这样的文件名来命名切割后的文件。
#split -b500 passwd 123(自定义指定切割后的目标文件名)