1,cut 命令

cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”,来进行分析的,并不是整篇信息分析的。cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。

常用的有

#cut -d 后面指定分隔符,用单引号引起来。

#cut -f 指定第几段

#cut -c 后面只有一个数字表示截取第几个字符,后面跟一个数字区域,表示截取从几到几

#cat /etc/passwd |cut -d: -f 1  以冒号为分割符,截取该文件的第一段

#cut -c 后面可以是一个数字n,也可以是一个区间n1-n2,也可以是n1,n2,n3


2,sort命令,将文本文件内容加以排序。

-r   以相反的顺序来排序。 (按照as码)

-t<分隔字符> 指定排序时所用的栏位分隔字符。

-n   依照数值的大小排序。

-u  去重复

-k 后面跟数字,表示对第几个区域的字符串排序

#sort -t:-k3,5 -r /etc/passwd

表示从第3到第5区域间的字符排序,-r表示反向排序


3,wc命令

#wc -l file 显示文件内容的行数

#wc -w 计算文件有多少个单词

wc -m 计算文件有多少个字符


4,unip和tee命令

unip用来去重复的行,常用 -c 统计重复的行数,并把行数写在前面。

使用unip的前提是需要给文件排序,否则无用

#sort 1.txt |unip -c

tee命令,后面跟文件名,类似与重定向 > ,但是比重定向多了一个 显示 功能。

#echo "dffvfv" |tee 1.txt

dffvfv

#cat 1.txt

dffvfv


5,tr和split命令

tr用于替换字符,常用来处理文档中出现的特殊符号。

-d 删除某个字符,-d后面要跟要删除的字符

-s 重复的字符去掉

最常用的就是把小写变大写

#tr '[a-z]' '[A-Z]'

#tr 'r' 'R' 

split用于切割文档

-b 依据大小分割文档,单位为byte

-l 依据行数来分割文档

#split -b500 passwd  以500字节为大小切割该文件

如果不指定目标文件名,则会以xaa xab……这样的文件名来命名切割后的文件。

#split -b500 passwd 123(自定义指定切割后的目标文件名)