1.作用
linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。
2.语法格式
grep [OPTION]...PATTERN [FILE] ...
3.主要参数
[options]主要参数:
-c:只输出匹配了多少次。 -i:不区分大小写(只适用于单字符)。 -h:查询多文件时不显示文件名。 -l:查询多文件时只输出包含匹配字符的文件名。 -n:显示匹配行及行号。 -s:不显示不存在或无匹配文本的错误信息。 -v:显示不包含匹配文本的所有行。 -d:跳过对子目录的搜索 -r: 对子目录也进行查找
4.grep正则表达式元字符集(基本集):
\:忽略正则表达式中特殊字符的原有含义。 ^:匹配正则表达式的开始行,如:'^grep'匹配所有以grep开头的行。 $: 匹配正则表达式的结束行,如'grep$'匹配所有以grep结尾的行。 \<:从匹配正则表达式的行开始。如'\<grep'匹配包含以grep结尾的单词的行。 \>:到匹配正则表达式的行结束。如'grep\>'匹配包含以grep结尾的单词的行。 []:匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。需要特別留意的是,在 [] 当中『仅代表一个待搜寻的字元』 [ n1-n2 ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。 . :所有的单个字符。 * :有字符,长度可以为0。 \(..\):标记匹配字符,如'(love)',love被标记为1。 \{n,m\}:意義:重复前一个字符n-m个,若为\{n\}则是重复前一个字符n次,若是 \{n,\}则是重复前一个字答n次以上
5.用于egrep和 grep -E的元字符(扩展集)
+ 匹配一个或多个先前的字符。如:'[a-z]+able',匹配一个或多个小写字母后跟able的串,如loveable,enable,disable等。 ? 匹配零个或多个先前的字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行。 a|b|c 匹配a或b或c。如:grep|sed匹配grep或sed () 分组符号,如:love(able|rs)ov+匹配loveable或lovers,匹配一个或多个ov。
6.举例
参数不举例了,见名思义,下面主要练习正则表达式
1)正则表达式的运用(过滤出本机IP地址)
[root@yang1 lesson-1]# ifconfig eth0|grep 'inetaddr:'|sed 's/^.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\) Bcast.*/\1/g' 10.0.0.29
解析:^.* 以任意字符开头,并重复0次或多次
[0-9]\{1,3\} 重复匹配0-9中的字符1次或2次或3次
\( ……\) 标记匹配字符,第一个\(\)标记为1,第二个\(\)标记为2
\1 取第1个标记中的内容
s/aa/b/g 属于sed中的替换功能,把aa替换为b,例中把匹配的一行替换为标记1中的内容
[root@yang1 lesson-1]# ifconfig eth0 |grep "inet addr:" |sed 's#^.*addr:\(.*\) Bcast.*$#\1#g' 10.0.0.29
2)egrep扩展表达式运用
过滤出多个行要使用egrep
[root@yang1lesson-1]# ifconfig eth0|egrep --color=auto 'inet|inet6' addr:10.0.0.29 Bcast:10.0.0.255 Mask:255.255.255.0 addr:fe80::20c:29ff:fe6a:4121/64 Scope:Link
其它+? ()同理,需要使用egrep或grep -E
[root@yang1lesson-1]# ifconfig eth0 |grep -E --color=auto "inet|inet6" addr:10.0.0.29 Bcast:10.0.0.255 Mask:255.255.255.0 addr:fe80::20c:29ff:fe6a:4121/64 Scope:Link