转自:Linux下查找命令

一.Linux查找文件的相关命令

常 用 命 令

简要中文说明

程序所在目录

more

分页显示一个文件或任何输出结果

/bin

less

分页显示一个文件并且可以回头

/usr/bin

whereis

寻找文件工具

/usr/bin

find

寻找文件工具

/usr/bin

locate

寻找文件工具

/usr/bin

grep

寻找某字串内容工具

/bin

env

查看环境设置

/usr/bin

  more [文件名]

  分页显示一个文件或任何输出结果

  其实more不是用来寻找文件的,但是一般人却十有八九是在找文件时把它派上用场。

  因为 more 主要的作用是把输出结果显示在屏幕上,一页停止一次,所以例如当我们用 ls 命令去找一个 x字母开头的文件,而下达了 ls x* 却仍然列出太多文件,一个屏幕看不完时,就可以配合管道符号和 more 命令:

  ls x* | more

  它会一屏停止一下,等待您按空白键才继续往上卷。于是 more 俨然犹如 DOS 的 DIR 命令 /P 选项的地位了。而 more 当主角的时候,是用做一页一次显示文章,例如我们想要看 /etc 里面的 XF86Config 文件,可以下如下命令:

  more /etc/XF86Config

  这样,我们就可以不断按空白键把这个文件慢慢看完。但是,因为more 先天的设计,如果您看完了这页,想要回头看上一页,很抱歉,是不行的,您必须从头再来!于是大家在使用中就干脆摒弃这个命令,而代之以 vi 或者pico, joe等文书编辑器来看文字文件了!

  less [文件名]

  分页显示一个文件并且可以回头

  less命令很好笑,取名时就故意与more 命令打对台,你叫“更多”,我就叫“更少”,就好像你叫黑人牙膏我就叫白人牙膏一样。事实上与什么“更多”、“更少”都没有关系。它最主要只是为了改进一点:more 不能回头看的问题!

  less 的优点就是可以随时回头,最简单的用【PgUp】键就可以向上翻。

  可是依我们的孤陋之见,还是用文书编辑器去阅读文件就好了嘛,更何况 less 本身还有高达 42 个选项,何必那么麻烦!

  所以,为了您好,选项我们也不介绍了。这个命令目前只在 Linux 系统可以使用,其他 UNIX 家族尚无。

  pico /etc/XF86Config

  到最后,很少人再用more了。所以more经常配合 ls在找文件的场合出现,每天都可以上场十几次。

  所以,相信把失去主要舞台的 more归类为找寻文件的相关命令虽不合法,但合情合理也合于现状。

  whereis 文件名

  寻找文件工具

  whereis 是一个小巧好用的文件寻找工具,它专门用来寻找可执行的程序、原始程序和使用手册。

  例如执行命令:

  whereis bzip2

  它就会告诉您,bzip2 放在 /usr/bin 。通常,如果您确定某个东西是程序,而用 whereis 找不到的话,那就表示本系统没有安装该程序了,例如:

  whereis cjoe

  表示这套系统中没有装 cjoe,否则应该会找到才对。

  find [寻找的目录] [表示式]

  寻找文件工具

  find 是高级的寻找文件工具,可不像 whereis 那么“阳春白雪”。但也因为它太高级了,复杂到很多人用不熟练。我们尽量只举简单的例子。

  最简单的格式如下:

  find / -name my* -print

  这个意思是请它从最底层的主目录开始找,找出文件名是 my 开头的文件,把它显示出来。-print 选项是显示,您可把它当做固定要加上的项目。

  但它还可以用时间来找,例如:

  find /usr -atime 3 –print

  会从 /usr 目录开始往下找,找最近3天之内存取过的文件。

  find /usr -ctime 5 –print

  会从 /usr 目录开始往下找,找最近5天之内修改过的文件。

  find /doc -user jacky -name 'j*' –print

  会从 /doc 目录开始往下找,找jacky 的、文件名开头是 j的文件。

  find /doc /( -name 'ja*' -o- -name 'ma*' /) –print

  会从 /doc 目录开始往下找,找寻文件名是 ja 开头或者 ma开头的文件。

  find /doc -name '*bak' -exec rm {} /;

  会从 /doc 目录开始往下找,找到凡是文件名结尾为 bak的文件,把它删除掉。-exec 选项是执行的意思,rm 是删除命令,{ } 表示文件名,“/;”是规定的命令结尾。

  locate 文件名

  寻找文件工具

  locate 也是一个寻找文件的工具,但是它不像 whereis 只能找程序文件等几种文件,也不像find那么复杂,可以算是“中庸之道”!

  中庸之道,往往就是大部分人最佳的选择,如图所示。

linux怎么查询mongodb数据 linux more查询_字符串

 

  whereis找不到的文件,find要一大串命令,还花了很久的时间才找到的XF86Config设置文件,而用locate一下子就简单找到了!

 grep [-选项] [字串] [文件名]

  寻找某字串内容工具

  有些时候,我们存储文件时随手乱取了一个文件名,事后自己都忘了那个文件名叫什么,连开头第一个字母都想不起来。那么,如果您还记得该文件一点特殊的词语,应该可以用 grep 命令找到。

  例如,我们想在一个目录的200个文件里面,找出哪一个文件提到“排版”这个词语:

  grep 排版 *.txt

  找到了两个文件有此字样。然后您再自行调出看看到底哪一篇才是您所要的即可。寻找时注意尽量寻找特殊词语,如果您输入“然后”、“这样”、“不是”、“电脑”……这类太普遍的词语,可能几百篇文章中都有,那就失去了用 grep 找文件的意义了。

  因为例子中第二篇文章出现了两次,所以列出了3行,其实只有两个文件符合。如果您想要让它凡是符合条件的只出现一次的话,加上 -l 选项就可以了,如图2-33所示。

 

linux怎么查询mongodb数据 linux more查询_文件名_02

 

  其他常用的选项还有:

  -n 同时列出该词语出现在文章的第几行。

  -c 计算一下该字串出现的次数。

  -i 比对的时候,不计较大小写的不同

  env

  查看环境设置

  env 命令可以设置很多环境变量,例如终端机的类型、使用的浏览器、用户主目录(Home Directory)的所在等等。

  但是我们现在把焦点集中在其中一项:PATH环境变量。

  因为 PATH 这个环境变量掌管了您下达命令的时候,它会到下面几个目录去找您命令的程序:

  /usr/bin

  /sbin

  /usr/sbin

  /usr/X11R6/bin

  /root/bin

  那么您用 env 命令,让它把所有的环境变量列出来的时候,就可以看到有一行PATH 设置,把上述几个目录用分号分开,然后串成一串。这就是它所谓寻找命令的“路径”。DOS 系统也有一个同名而且意义非常相似的路径设置。如图2-34所示。

 

linux怎么查询mongodb数据 linux more查询_字符串_03

  如果您想在它查找命令的路径上增加一个 /usr/bin/he,而把 /root/bin 去掉,那么您可以重新下达:

  env PATH=/usr/bin;/sbin;/usr/sbin;/usr/X11R6/bin;/usr/bin/he

  当然env 其他的变量也可以这样改变。但是因为涉及面太广,我们就只把焦点集中在改变查找路径上,其他暂时不谈。

二.linux文本搜索命令

文本的提取和排序

下面介绍几个重要的文本提取工具。

使用grep匹配模式

本章前面简要地介绍了grep命令,用它进行一个串中某些模式的匹配,采用正规表达式。(关于正规表达式的详细介绍,请参阅http://www.regular-expressions.info/tutorial.html处的教程。)词grep是global regular expression print(全局正规表达式打印)的首字母缩写,它是从下面的vi命令衍生出来的,下面的命令打印与正规表达式re相匹配的所有行。

 

可将正规表达式 想象为用来定位文件中文本的搜索标准。因此,grep类似于别的操作系统中的搜索命令。grep搜索文件(或多个文件)的每一行,寻找给定串的第一次出 现,如果找到这个串,打印出相应的行。例如,输出文件test.txt中包含表达式oracle database的所有行,可以按如下的方式使用grep命令:

 

为了输出test.txt文件中不包含表达式oracle database的所有行,可使用带-v选项的grep命令,如下所示:

 

除-v选项外,grep命令还可以使用如下的几个选项。

q -c:打印每个输入文件匹配行计数。

q -l:打印每个输入文件的名字。

q -n:提供每个输出行的行号。

q -i:忽略表达式中字母的大小写。

除grep外,还可以使用fgrep(固定grep)搜索文件。fgrep命令不使用正规表达式。此命令直接进行串比较,查找某个固定串而不是一个正规表达式的匹配。

grep的egrep版本帮助处理复杂的正规表达式,比正规的grep命令快。

剪切、粘贴和联结文本

通常,需要剪切一个文件文本的某部分,或者联结来自不止一个文件的文本。UNIX提供了执行这些任务的命令,以下各节对它们进行介绍。

1.用cut命令输出列

cut命令输出一个文本文件的指定的列。假如有一个名为example.txt的文件,它具有如下的文本:

 

可用-f选项指定要提取的字段。下面的命令将返回example.txt文件中的第二列:

 

使用带-c选项的cut命令来指定希望从一个文件中提取的特定字符。下面的两个命令分别提取password.txt文件中的第10个字符以及第10-12个字符:

 

可与-f选项一 起使用-d选项提取直到一个特定定界符的所有字符。下面的例子说明,cut命令提取passwd文件的第一个字段(f1),用-d选项指出该字段是由冒号 (:)定界的。(passwd文件位于/etc目录,此目录保存UNIX和Linux系统用户账号信息。)

 

2.用paste命令联结文件

paste命令从一个源取一行并把它与来自另一源的另一行组合起来。假如有两个文件:test1.txt包含字符串one two three,test2.txt包含one four five six。可如下用paste命令将两个文件结合:

 

3.用join命令联结文件

join命令也结合两个文件的内容,但它只在两个文件有一个共同字段时进行结合。前一节中,test1.txt和test2.txt不具有共同的列,因此对这两个文件使用join命令不起作用。但如果有两个文件test.one和test.two,它们的内容如下:

 

默认情况下,join命令只匹配第一个字段,所以它将根据共同的(第一列)给出如下的结果:

 

-1选项允许指出使用哪个字段作为第一个文件中的匹配字段。-2选项允许指定使用哪个字段作为第二个文件中的匹配字段。例如,如果第一个文件的第二个字段匹配第二个文件的第三个字段,可使用如下的join命令:

 

可使用-o选项以后面的格式指定输出字段:file.filed。因此,要打印匹配行的第一个文件的第二个字段和第二个文件的第三个字段,可使用如下带选项的join命令:

 

4.用sort命令排序文本

可用sort命令对文本文件的行进行排序,不管这些行是来自于管道或来自于文件。如果使用-m选项,sort只合并文件而不排序。假如有一个名为test.txt的文件,其内容如下:

 

可用sort命令将test.txt文件的内容按字母顺序输出:

 

默认时,sort在文本的第一列上进行排序。

5.用uniq命令删除重复的行

uniq命令删除文件的重复行。在一个管道中,此命令通常后跟一个sort命令。使用-c选项,可将其用来对某行进行计数,或者使用-d选项,可用来只报告重复的行。

 

上面的例子中,sort命令使用-m选项合并两个文件,test.one和test.two。输出管道到带-c选项的uniq命令。所得出的是一个按字母顺序排列的表,所有重复行被删除。而且还给出每行重复的频率。

 

 

 

三.Linux查找文件内容的常用命令方法

从文件内容查找匹配指定字符串的行: $ grep "被查找的字符串" 文件名

从文件内容查找与正则表达式匹配的行: $ grep –e “正则表达式” 文件名

查找时不区分大小写: $ grep –i "被查找的字符串" 文件名

查找匹配的行数: $ grep -c "被查找的字符串" 文件名

从文件内容查找不匹配指定字符串的行:  $ grep –v "被查找的字符串" 文件名

从根目录开始查找所有扩展名为.log的文本文件,并找出包含”ERROR”的行 find / -type f -name "*.log" | xargs grep "ERROR"

如果需要查找的内容包含特殊符号,比如$等等,grep要加参数 find ./ -name "*.php" | xargs grep -F '要查找的内容'  

 

四.定位一个程序文件

Which命令在linux系统中用来定位一个程序文件,包含别名和路径的工具。

使用权限

所有用户

语法格式

which [ 程序名称 ] 

使用说明

which 命令取得程序名列表并寻找当这些文件名作为命令给定时所运行的文件。which 命令展开每个参数(如果它有别名),并沿着用户的路径搜索它。别名和路径从用户主目录中的 .cshrc 文件取得。如果 .cshrc 文件不存在,或者如果路径没有在 .cshrc 文件中定义,则 which 命令使用在用户环境中定义的路径。如果名称的别名多于一个单字或如果在路径里没有找到一个有参数名称的可执行文件,那么将会给出诊断信息。

使用实例

要查找与 lookup 命令名有关的可执行文件:which lookup

 



查找目录下的所有文件中是否含有某个字符串 
find .|xargs grep -ri "IBM" 
查找目录下的所有文件中是否含有某个字符串,并且只打印出文件名 
find .|xargs grep -ri "IBM" -l 
1.正则表达式  
  (1)正则表达式一般用来描述文本模式的特殊用法,由普通字符(例如字符a-z)以及特殊字符(称为元字符,如/、*、?等)组成。 
  (2)基本元字符集及其含义 
      ^ :只匹配行首。   如^a 匹配以a开头的行abc,a2e,a12,aaa,...... 
      $ :只匹配行尾。   如^a 匹配以a结尾的行bca,12a,aaa,....... 
      * :匹配0个或多个此单字符。 如(a)* 匹配 空,a,aa,aaa,.... 
      [] :只匹配[]内字符。可以是一个单字符,也可以是字符序列,用","将里面要匹配的不同字符串分开。也可以使用-来表示[]内字符序列的范围,如[1-5]表示[12345] 
      \ :只用来屏蔽一个元字符的特殊含义。 如\*,\',\",\|,\+,\^,\. 等 
      .:(点)只匹配任意单字符。 
      pattern\{n\}:只用来匹配前面pattern出现的次数.n为次数。如a\{2\}匹配aa. 
      pattern\{n,\}:含义同上,但次数最少为n.如a\{2,\}匹配aa,aaa,aaaa,..... 
      pattern\{n,m\}:含义同上,但次数在n和m之间。如a\{2,4\}匹配aa,aaa,aaaa三个 
  (3)举例说明: 
      ^$ :匹配空行 
      ^.$ :匹配包含一个字符的行 
    \*\.pas :匹配以*.pas结尾的所有字符或文件 
    [0123456789]或[0-9] :假定要匹配任意一个数字 
    [a-z] :任意小写字母 
    [A-Za-z] :任意大小写字母 
    [S,s] :匹配大小写S 
    [0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\} :匹配IP地址 [0-9]\{3\}三个0-9组成的字符串;\. :匹配点(注意这里点是特殊的字符,所以要用"\"来屏蔽其含义) 
2.find介绍   (1)查找具有某些特征文件的命令,可遍历当前目录甚至于整个文件系统来查看某些文件或目录,其遍历大的文件系统时一般放在后台执行。 
  (2)find命令的一般形式 
      find pathname -options [-print -exec -ok] 
      -pathname :find命令所查找的目录路径。如用"."来表示当前的目录,用/来表示系统根目录 
      -print :find命令将匹配的文件输出到标准输出 
      -exec: find命令对匹配的文件执行该参数所给出的shell命令,相应的命令形式为 
        'command'{} \; (注意{}和\之间的空格) 
      -ok 和 -exec的作用相同,只不过以一种更为安全的模式来执行该参数所给出的shell命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。 
    options有如下几种: 
    -name :按照文件名查找文件 
    -perm :按照文件权限来查找文件 
    -user :按照文件属主来查找文件 
    -group :按照文件所属的组来查找文件 
    -mtime -n +n 按照文件的更改时间来查找文件,-n表示文件更改时间距现在n天以内,+n表示文件更改时间距现在n天以前。find命令还有-atime 和-ctime选项,但它们都和-mtime选项相似。 
    -size n[c]查找文件长度为n块的文件,带有c时表示文件长度以字节计。 
    -nogroup 查找无有效所属组的文件,即该文件所属的组在/etc/groups中不存在 
    -newer file1 !file2查找更改时间比文件file1新但比文件file2旧的文件 
    -depth 先查找指定目录有无匹配文件,若无则再在子目录中查找 
    -type 查找某一类型的文件,如 
      b :块设备文件 
      d:目录 
      e:字符设备文件 
      p;管道文件 
      l:符号链接文件 
      f:普通文件 
  (3)find命令举例 
      find -name "*.txt" -print 查找txt结尾的文件并输出到屏幕上 
      find /cmd ".sh" -print 查找/cmd目录下所有sh文件,并输出 
      find . -perm 755 -print 查找当前目录下权限为755的文件,并输出 
      find `pwd` -user root -print 查找当前目录下属主为root的文件,并输出 
      find ./ -group sunwill -print 查找当前目录下所属主是sunwill的文件 
      find /var -mtime -5 -print 查找/var目录下更改时间为5天内的所有文件 
      find /var -mtime +5 -print 查找/var目录下更改时间为5天以前的所有文件 
      find /var -newer "myfile1" ! -newer "myfile2" -print 查找/var目录下比myfile1新,但是比myfile2旧的所有文件。 
      find /var -type d -print 查找/var目录下所有目录 
      find /var -type l -print 查找/var目录下所有的符号链接文件。 
      find . -size +1000000c -print 查找当前目录下大于1000000字节的文件 
      find / -name "con.file" -depth -print 查找根目录下有无"con.file",若无则在其子目录中查找 
      find . -type f -exec ls -l {} \; 查找当前目录下是否有普通文件,若有则执行ls -l 
    (4)xargs命令 
      在 使用find命令的-exec选项处理匹配到的文件时,find命令将所有匹配到的文件一起传递给exec。不幸的是,有些系统对能够传递给exec的命 令长度有限制,这样find命令运行几分钟之后就算出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是xargs的用处所在,特别是与 find命令一起使用,exec会发起多个进程,而xargs会多个,只有一个 
      find ./ -perm -7 -print | xargs chmod o-w 查找权限为7的文件并传递给chmod处理 
3.grep介绍   (1)grep 的一般格式为 grep [options] 基本正则表达式 [文件] 
      字符串参数最好采用是双引号括,一是以防被误解为shell命令,二是可以用来查找多个单词组成的字符串 
      -c:只输出匹配行的记数 
      -i:不区分大小写(只适用于单个字符) 
      -h:查询多个文件时不显示文件名 
      -H:只显示文件名 
      -l:查询多文件时只输出包含匹配字符的文件名 
      -n:只显示匹配行及其行号 
      -s:不显示不存在或无匹配文本的错误信息。 
      -v:显示不包含匹配文本的所有行。 
  (2)举例说明: 
      grep ^[^210] myfile 匹配myfile中以非2、1、0开头的行 
      grep "[5-8][6-9][0-3]" myfile 匹配myfile中第一位为5|6|7|8,第二位6|7|8|9,第三位为0|1|2|3的三个字符的行 
      grep "4\{2,4\}" myfile 匹配myfile中含有44,444或4444的行 
      grep "\?" myfile匹配myfile中含有任意字符的行 
  (3)grep命令类名 
      [[:upper:]]   表示[A-Z] 
      [[:alnum:]]   表示[0-9a-zA-Z] 
      [[:lower:]]   表示[a-z] 
      [[:space:]]   表示空格或者tab键 
      [[:digit:]]   表示[0-9] 
      [[:alpha:]]   表示[a-zA-Z] 
    如:grep "5[[:digit:]][[:digit:]]" myfile 匹配myfile中含有5开头接下去两位都是数字的行。 
4.awk介绍 
可以从文件或字符串中基于指定规则浏览和抽取信息,是一种自解释的变成语言。 
(1)awk命令行方式 awk [-F filed-spearator] 'command' input-files 
    awk脚本:所有awk命令插入一个文件,并使awk程序可执行,然后用awk命令解释器作为脚本的首行,以便通过键入脚本名称来调用它。awk脚本是由各种操作和模式组成。 
    模式部分决定动作语句何时触发及触发事件。(BEGIN,END) 
    动作对数据进行处理,放在{}内指明(print) 
(2)分隔符、域和记录 
    awk执行时,其浏览域标记为$1,$2,...$n.这种方法成为域标识。$0为所有域。 
(3)举例说明: 
      awk '{print $0}' test.txt |tee test.out 输出test.txt中所有行$0表示所有域 
      awk -F : '{print $1} test.txt |tee test.out'   同上。。只是分隔符为":" 
      awk 'BEGIN {print "IPDate\n"}{print $1 "\t" $4} END{print "end-of-report"}' test.txt 
      开始时打印“IPDate”结束时打印“end-of-report”中间打印主体信息,比如总共匹配三条信息,则输出如下:   
IPDate 
1 first 
2 second 
3 third 
end-of-report 
  (4)匹配操作符 ~ 匹配,!~ 不匹配 
      cat test.txt |awk '$0~/210.34.0.13/' 匹配test.txt中为210.34.0.13的行 
      awk '$0!~/210.34.0.13' test.txt     匹配test.txt中不是210.34.0.13的行 
      awk '{if($1=="210.34.0.13") print $0}' test.txt 匹配 test.txt中第一个域为210.34.0.13的行。
5.sed介绍     sed不与初始化文件打交道,它操作的只是一个拷贝,然后所有的改动如果没有重定向到一个文件,将输出到屏幕。 
    sed是一种很重要的文本过滤工具,使用一行命令或者使用管道与grep与awk相结合。是一种非交互性文本流编辑。 
    (1)调用sed的三种方式 
      使用sed命令行格式为:sed [options] sed命令 输入文件 
      使用sed脚本文件格式为:sed[options] -f sed脚本文件 输入文件 
      sed脚本文件[options] 输入文件 
      --不管是使用shell命令行方式或脚本文件方式,如果没有指定输入文件,sed从标准输入中接受输入,一般是键盘或重定向结果。 
    (2)sed 命令的options如下 
        -n:不打印 
        -c:下一命令是编辑命令 
        -f:如果正在调用sed脚本文件 
    (3)sed在文件中查询文本的方式 
          --使用行号,可以是一个简单的数字,或是一个行号的范围 
          --使用正则表达式 
    (4)读取文本的方式 
          x       x为一行号 
          x,y       表示行号范围从x到y 
          /pattern/     查询包含模式的行 
          /pattern/pattern/ 查询包含两个模式的行 
          pattern/,x   在给定的行号上查询包含模式的行 
          x,/pattern/   通过行号和模式查询匹配行 
          x,y!       查询不包含指定行号x和y的行 
      (5)基本sed编辑命令 
            p   打印匹配行 
            d   删除匹配行 
            =   显示文件行号 
            a\   在定位行号后附加新文本信息 
            i\   在定位行号后插入新文本信息 
            c\   用新文本替换定位文本 
            s     使用替换模式替换相应模式 
            r     从另一个文件中读文件 
            w   写文本到一个文件 
            q     第一个模式匹配完成后推出或立即退出 
            l     显示与八禁止ASCII代码等价的控制字符 
            {}   在定位行执行的命令组 
            n     从另一个文件中读文本下一行,并附加在下一行 
            g     将模式2粘贴到/pattern n/ 
            y     传送字符 
    (6)举例说明: 
          sed -n '2p' test.txt 打印第二行的信息(注意:-n是不打印不匹配的信息,若没加-n,则打印文件的所有信息而不是匹配信息) 
          sed -n '1,4p' test.txt 打印第一行到第四行的信息 
          sed -n '/los/p' test.txt模式匹配los,并打印出来 
          sed -n '2,/los/p' test.txt 从第二行开始。。知道匹配第一个los 
          sed -n '/^$/p' test.txt 匹配空行 
          sed -n -e '/^$/p' -e '/^$/=' test.txt 打印空行及行号 
          sed -n '/good/a\morning' test.txt 在匹配到的good后面附加morning 
          sed -n '/good/i\morning' test.txt 在匹配到的good前面插入morning 
          sed -n '/good/c\morning' test.txt 将匹配到的good替换成morning 
          sed '1,2d' test.txt 删除第1和2行 
          sed 's/good/good morning/g' test.txt 匹配good并替换成goodmorning 
          send 's/good/& hello /p' test.txt 匹配到good就在其后面加上hello 
          send 's/good/ hello &/p' test.txt 匹配到good就在其前面加上hello 
6.合并与分割(sort,uniq,join,cut,paste,split)     (1)sot命令 
        sort [options] files 许多不同的域按不同的列顺序排序 
          -c 测试文件是否已经排序 
          -m 合并两个排序文件 
          -u 删除所有同样行 
          -o 存储sort结果的输出文件名 
          -t 域分隔符,用非空格或tab开始排序 
          +n :n 为列号,使用此列号开始排序 
          -n 指定排序是域上的数字分类项 
          -r 比较求逆 
        sort -c test.txt 测试文件是否分类过 
        sort -u test.txt 排序并合并一样的行 
        sort -r test.txt 以相反的顺序排列 
        sort -t "/" +2 test.txt 以"/"分隔,第二个域开始分类 
      (2)uniq命令 
          uniq [options ] files 从一个文本文件中去除或禁止重复行 
          -u 只显示不重复行 
          -d 只显示有重复数据行,每种重复行只显示其中一行 
          -c 打印每一重复行出现次数 
          -f :n为数字,前n个域被忽略 
          uniq -f 2 test.txt 忽略前2个域 
      (3)join 命令 
          join [options] file1 file2 用来将来自两个分类文本文件的行连在一起 
          -an,n为一数字,用于连接时从文件n中显示不匹配行 
          -onm ,连接域,n为文件号,m为域号 
          -jnm,n为文件号,m为域号,使用其他域作连接域 
          -t ,域分隔符。用来设置非空格或tab键的域分隔符。 
        (4)split命令 
          split -output_file_size intput_filename output_filename 
          用来将大文件分割成小文件。 
            -b n,每个分割文件的大小n 
            -C n,每个分割文件一行最多n字节 
            -l n,每个分割文件的行数 
            -n,同-l n 
            split -10 test.txt 将test.txt分割成10行的小文件 
        (5)cut 命令 
          cut -c n1-n2 filename 显示每行从开头算起 n1 到 n2 的文字。
          cut -c 3-5 test.txt 显示test.txt中每行从第3到第5个字符