sort 是 Linux 的排序命令,而且可以依据不同的数据类型来进行排序。sort 将文件的每一行作为一个单位,相互比较。比较原则是从首字符向后,依次按 ASCII 码值进行比较,最后将它们按升序输出。


sort 命令格式如下:

[root@localhost ~]# sort [选项] 文件名

选项:

  • -f:忽略大小写;
  • -b:忽略每行前面的空白部分;
  • -n:以数值型进行排序,默认使用字符串排序;
  • -r:反向排序;
  • -u:删除重复行。就是 uniq 命令;
  • -t:指定分隔符,默认分隔符是制表符;
  • -k [n,m]:按照指定的字段范围排序。从第 n 个字段开始,到第 m 个字(默认到行尾);

 


sort 命令默认是用每行开头的第一个字符来进行排序的,比如:

[root@localhost ~]# sort /etc/passwd
#排序用户信息文件
abrt:x:173:173::/etc/abrt:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin apache:x:48:48:Apache:/var/www:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
…省略部分输出…

 

如果想要反向排序(倒序),则使用“-r”选项,比如:

[root@localhost ~]# sort -r /etc/passwd
#反向排序
vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
…省略部分输出…

 

如果想要指定排序的字段,则需要使用"-t"选项指定分隔符,并使用"-k"选项指定字段号。

假如我想要按照 UID 字段排序 /etc/passwd 文件,命令如下:

[root@localhost ~]# sort -t":"-k 3,3 /etc/passwd
#指定分隔符是":",以第三个字段开头,以第三个字段结尾排序,也就是只用第三个字段排序
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
abrt:x:173:173::/etc/abrt:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
…省略部分输出…

 

 看起来好像很美,可是如果仔细看看,怎么 daemon 用户的 UID 是 2,反而排在了下面?这是因为 sort 默认是按照字符排序的,前面用户的 UID 的第一个字符都是 1,所以这么排序。要想按照数字排序,请使用"-n"选项,比如:

[root@localhost ~]# sort -n -t":" -k 3,3 /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spod/lpd:/sbin/nologin
...省略部分输出...

 

 

 

-k 3.1,3.1  以第3列的第一个字符到第3列的第一个字符排序【0,1,2】

-k 4.1,4.3 以第4列的第一个字符到第4列的第3个字符排序【151,152,153,1,2,20】

Linux sort命令详解:字符串排序_ip地址

 

 

排序后去重

使用-u参数去重

[root@test1 tmp]# cat 2.log
序号 企业名称 公网IP地址
1 国海证券 113.16.174.228
3 兴业证券 61.154.12.206
2 平安证券 211.157.16.114
3 兴业证券 61.154.12.206
[root@test1 tmp]# cat 2.log |sort -u
1 国海证券 113.16.174.228
2 平安证券 211.157.16.114
3 兴业证券 61.154.12.206
序号 企业名称 公网IP地址

 

 

按照文件大小进行排序

使用-h参数,按照人类习惯阅读方式比较文件大小

Linux sort命令详解:字符串排序_字段_02

 

 

 

将两个文件合同同时对合并后的内容排序

[root@test1 tmp]# sort 2.log 5.log > 6.log
[root@test1 tmp]# cat 6.log
1 test 1
1 国海证券 113.16.174.228
2 test2 2
2 平安证券 211.157.16.114
3 兴业证券 61.154.12.206
3 兴业证券 61.154.12.206
序号 企业名称 公网IP地址

 

排序并去重,并统计出现的次数

Linux sort命令详解:字符串排序_ip地址_03

 

Linux sort命令详解:字符串排序_分隔符_04

 

 Linux sort命令详解:字符串排序_字段_05

 

 

 作者:孙龙-程序员