文件及内容处理 - grep(egrep)、join

1. grep(egrep):文本过滤工具

grep(egrep)命令的功能说明

grep命令是Linux系统中最重要的命令之一,其功能是从文本文件或管道数据流中筛选匹配的行及数据,如果配合正则表达式技术一起使用,则功能更加强大。egrepgrep 的扩展正则,后面讲三剑客时会讲的。

grep命令的语法格式

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
grep [-abcEFGhHilLnqrsvVwxy][-A<显示列数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]

grep命令的常用参数说明:

grep 参数很多,表1为 grep 命令的参数及说明:

表1: grep 命令的参数及说明

参数选项

解释说明

-a 或 --text

不要忽略二进制的数据。

-A<显示行数> 或 --after-context=<显示行数>

除了显示符合范本样式的那一列之外,并显示该行之后的内容。

-b 或 --byte-offset

在显示符合样式的那一行之前,标示出该行第一个字符的编号。

-B<显示行数> 或 --before-context=<显示行数>

除了显示符合样式的那一行之外,并显示该行之前的内容。

-c 或 --count

计算符合样式的列数。

-C<显示行数> 或 --context=<显示行数>或-<显示行数>

除了显示符合样式的那一行之外,并显示该行之前后的内容。

-d <动作> 或 --directories=<动作>

当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。

-e<范本样式> 或 --regexp=<范本样式>

指定字符串做为查找文件内容的样式。

-E 或 --extended-regexp

将样式为延伸的普通表示法来使用。

-f<规则文件> 或 --file=<规则文件>

指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。

-F 或 --fixed-regexp

将样式视为固定字符串的列表。

-G 或 --basic-regexp

将样式视为普通的表示法来使用。

-h 或 --no-filename

在显示符合样式的那一行之前,不标示该行所属的文件名称。

-H 或 --with-filename

在显示符合样式的那一行之前,表示该行所属的文件名称。

-i 或 --ignore-case

忽略字符大小写的差别。

-l 或 --file-with-matches

列出文件内容符合指定的样式的文件名称。

-L 或 --files-without-match

列出文件内容不符合指定的样式的文件名称。

-n 或 --line-number

在显示符合样式的那一行之前,标示出该行的列数编号。

-o 或 --only-matching

只显示匹配PATTERN 部分。

-q 或 --quiet或--silent

不显示任何信息。

-r 或 --recursive

此参数的效果和指定"-d recurse"参数相同。

-s 或 --no-messages

不显示错误信息。

-v 或 --revert-match

显示不包含匹配文本的所有行。

-V 或 --version

显示版本信息。

-w 或 --word-regexp

只显示全字符合的列。

-x --line-regexp

只显示全列符合的列。

-y

此参数的效果和指定"-i"参数相同。

grep命令的实践操作

范例1: –v 参数实践

[root@oldboyedu  ~]#cat 1.txt
1
2
3
[root@oldboyedu  ~]# grep -v "2" 1.txt
1
3
[root@oldboyedu  ~]#

范例2: -n 参数实践

[root@oldboyedu  ~]# cat 2.txt
aa
aa
bb
cc
dd
ee
ff
bb
cc
dd
ee
ff
[root@oldboyedu  ~]# grep -n "cc" 2.txt
4:cc
9:cc
[root@oldboyedu  ~]#

范例3: -i参数实践

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep "c" 3.txt
cc
cA
[root@oldboyedu  ~]# grep -i "c" 3.txt
cc
cA
bC
[root@oldboyedu  ~]#

范例4: -E'--color'的参数实践

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -Ei "a|c" 3.txt
aa
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -Ei --color=auto "a|c" 3.txt
aa
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]#

范例5: -c 参数实战

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -c "c" 3.txt
2
[root@oldboyedu  ~]#

范例6: -o 参数实战

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -o "c" 3.txt
c
c
c
[root@oldboyedu  ~]#

2. join:按两个文件的相同字段合并

join命令的功能说明

join 命令用于将两个文件中,指定栏位内容相同的行连接起来。找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。

join命令的语法格式

join [OPTION]... FILE1 FILE2
join [-i][-a<1或2>][-e<字符串>][-o<格式>][-t<字符>][-v<1或2>][-1<栏位>][-2<栏位>][--help][--version][文件1][文件2]

join命令的常用参数说明:

join 参数,表1为 join 命令的参数及说明:

表1: join 命令的参数及说明

参数选项

解释说明

-a<1或2>

除了显示原来的输出内容之外,还显示指令文件中没有相同栏位的行。

-e<字符串>

若[文件1]与[文件2]中找不到指定的栏位,则在输出中填入选项中的字符串。

-i或--igore-case

比较栏位内容时,忽略大小写的差异。

-o<格式>

按照指定的格式来显示结果。

-t<字符>

使用栏位的分隔字符。

-v<1或2>

跟-a相同,但是只显示文件中没有相同栏位的行。

-1<栏位>

连接[文件1]指定的栏位。

-2<栏位>

连接[文件2]指定的栏位。

--help

显示帮助。

--version

显示版本信息。

join命令的实践操作

范例1: 连接两个文件。

--------------------------------------------------------------
==>首先查看 testfile_1、testfile_2 中的文件内容<==
--------------------------------------------------------------
[root@oldboyedu ~]# cat testfile_1 
Hello 95
Linux 85  
test 30  
[root@oldboyedu ~]# cat testfile_2 
Hello 2005 
Linux 2009  
test 2006 

--------------------------------------------------------------
==>然后使用join命令,将两个文件连接<==
--------------------------------------------------------------
[root@oldboyedu ~]#  join testfile_1 testfile_2 
Hello 95 2005
Linux 85 2009  
test 30 2006 

--------------------------------------------------------------
==>文件1与文件2的位置对输出到标准输出的结果是有影响的<==
--------------------------------------------------------------
[root@oldboyedu ~]# join testfile_2 testfile_1
Hello 2005 95 
Linux 2009 85  
test 2006 30

今天就写到这里,有什么疑问或出现什么错误,随时欢迎大神们发表评论指点迷津


转载于:https://blog.51cto.com/14068656/2383880