正则表达式之——grep

正则表达式定义

   使用一类元字符(不表示本身意义,而表示通配或其它意义)组合其他字符,所描述出来的,能能够匹配符合条件字符

正则表达式的分类:

   基本正则表达式:grep

   扩张正则表达式:egrep


正则表达式元字符集和及其意义

符号意义
*匹配紧挨在其前面的字符0次或多次重复
.匹配单个字符
.*匹配任意长度字符
^锚定行首的符合条件的内容
&锚定行尾的符合条件的内容
^$空白行
\{m,n\}匹配前面字符出现了m-n
\{0,n\}匹配前面字符至多出现n次
\{m,\}匹配前面字符至少出现m次
\{m\}匹配前面字符出现了m
\<
锚定词
\>锚定词尾
\<\>锚定单词
\(\)分组
[]匹配指定范围内的任意单个字符
[^]匹配指定范围外的任意单个字符
\?匹配紧挨在其前面的字符0次或1次
+
匹配其前面的字符至少1次
|

grep 的选项及其意义

选项意义
--color添加颜色
-v反向选取,只显示不符合模式的行
-o只显示被模式匹配到的字串,而不是整个行;
-i不区分字符大小写;
-A #显示匹配到的行时,顺带显示其后面的#个行;
-B #显示匹配到的行时,顺带显示其前面的#个行;
-C #显示匹配到的行时,顺带显示其前后面的#个行;
-E使用扩展正则表达式

grep支持字符和字符集合

字符意义
[:digit:]所有数字, 相当于0-9 或者\d
[:lower:]所有的小写字母
[:upper:]所有的大写字母
[:alpha:]所有的字母
[:alnum:]相当于[0-9a-zA-Z]
[:space:]空白字符 相当于\s
[:punct:]所有标点符号
\S匹配任何非空白字符。与 [^ \f\n\r\t\v] 等效
\w匹配任何字类字符,包括下划线。与“[A-Za-z0-9_]”等效。
\W与任何非单词字符匹配。与“[^A-Za-z0-9_]”等效。

正则表达式举例说明:

(1) 查找/etc/passwd 中以root开头的行

1
2
3
[root@localhost /]# grep "^root"/etc/passwd
root:x:0:0:root:/root:/bin/bash
[root@localhost /]#

(2) 查找/etc/passwd 中以“/bin/bash”结尾的行

1
2
3
4
5
[root@localhost /]# grep "/bin/bash$"/etc/passwd
root:x:0:0:root:/root:/bin/bash
mandriva:x:4004:501::/home/mandriva:/bin/bash
mysql:x:495:2004::/home/mysql:/bin/bash
[root@localhost /]#

(3)查找/etc/passwd中以r开头以h结尾中间任意字符的行

1
2
3
[root@localhost /]# grep "^r.*h$"/etc/passwd
root:x:0:0:root:/root:/bin/bash
[root@localhost /]#

(4)查找/etc/passwd中包括ro或者root的行(使用\{1,2\}p)

1
2
3
4
5
[root@localhost /]# grep "ro\{1,2\}"/etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
rtkit:x:499:497:RealtimeKit:/proc:/sbin/nologin
[root@localhost /]#

(5)查找/etc/passwd 中精确匹配rpc的行 \(rpc\)

1
2
3
4
5
6
[root@localhost /]# grep "rpc"/etc/passwd    查找rpc的行
rpc:x:32:32:Rpcbind Daemon:/var/cache/rpcbind:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
[root@localhost /]# grep "\<rpc\>"/etc/passwd   精确匹配rpc的行
rpc:x:32:32:Rpcbind Daemon:/var/cache/rpcbind:/sbin/nologin
[root@localhost /]#

(6)显示/proc/meminfo文件中以不区分大小的s开头的行;

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
[root@localhost /]# grep "[Ss]"/proc/meminfo
Buffers:           47272kB
SwapCached:            0kB
SwapTotal:       2097144kB
SwapFree:        2097144kB
AnonPages:         43056kB
Shmem:               252kB
Slab:              97532kB
SReclaimable:      71464kB
SUnreclaim:        26068kB
KernelStack:        1400kB
PageTables:         4736kB
NFS_Unstable:          0kB
Committed_AS:     154500kB
VmallocUsed:      276328kB
AnonHugePages:      2048kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048kB
[root@localhost /]#

或者使用 grep -i 选项

(7)显示/var/log/secure文件中包含“Failed password”或“FAILED LOGIN”的行;

1
2
3
[root@localhost /]# grep -E "Failed password | FAILED LOGIN"/var/log/secure
Jul 1414:01:52localhost sshd[2950]: Failed password forroot from 172.16.254.22port 57650ssh2
[root@localhost /]#(

(8)在cat.sh中使用(|)搜索cat,Cat

正则表达式之——grep_egrep     (9)在/proc/meminfo中查找以S开头后面跟一个字符的行

1
2
3
4
5
6
7
8
9
10
11
[root@localhost /]# grep "^S."/proc/meminfo
SwapCached:            0kB
SwapTotal:       2097144kB
SwapFree:        2097144kB
Shmem:               252kB
Slab:              97544kB
SReclaimable:      71468kB
SUnreclaim:        26076kB
[root@localhost /]# grep "^S..b"/proc/meminfo
Slab:              97536kB
[root@localhost /]#


正则表达式与grep选项配合使用举例:

1). 显示/etc/rc.d/rc.sysinit中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;

1
2
3
4
5
6
7
8
9
10
11
12
13
[root@localhost /]# grep "^#[[:space:]]\{1,\}[^[:space:]]"/etc/rc.d/rc.sysinit
# /etc/rc.d/rc.sysinit - run once at boot time
# Taken inpart from Miquel van Smoorenburg's bcheckrc.
# Check SELinux status
# Print a text banner.
# Only read thisonce.
# Initialize hardware
# Set defaultaffinity
# Load other user-defined modules
# Load modules (forbackward compatibility withVARs)
# Configure kernel parameters
# Set the hostname.
# Sync waiting forstorage.

2).显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行;即任意单个字符后面跟了个n,n后面有任意长度的任意字符,而后是任意单个字符后面跟了个n

1
2
3
4
5
6
7
8
9
10
[root@localhost /]# grep --color=auto ".n.*.n"/etc/rc.d/rc.sysinit
# /etc/rc.d/rc.sysinit - run once at boot time
# Taken inpart from Miquel van Smoorenburg's bcheckrc.
HOSTNAME=$(/bin/hostname)
if[ -f /etc/sysconfig/network ]; then
. /etc/sysconfig/network
if[ -z "$HOSTNAME"-o "$HOSTNAME"= "(none)"]; then
if[ ! -e /proc/mounts ]; then
mount -n -t proc /proc /proc
mount -n -t sysfs /sys /sys >/dev/null2>&1

3).显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行;即任意单个字符后面跟了个n,n后面有任意长度的任意字符,而后是任意单个字符后面跟了个n,但后面的n之前的字符要与前面的n之前的字符相同;

1
2
3
4
5
6
7
8
[root@localhost /]# grep --color=auto "\(.n\).*\1"/etc/rc.d/rc.sysinit
# Taken inpart from Miquel van Smoorenburg's bcheckrc.
mount -n -o remount /dev/shm >/dev/null2>&1
if[ -e "/selinux/enforce"] && [ "$(cat /proc/self/attr/current)"!= "kernel"]; then
if[ -r "/selinux/enforce"] ; then
echo $"*** Warning -- SELinux is active"
echo $"*** Disabling security enforcement for system recovery."
echo $"*** Run 'setenforce 1' to reenable."

4).查看电话号码

1
2
3
4
5
6
7
8
9
10
[root@localhost /]# cat > phone.txt << EOF
0511-440533
0212-7878909
0313-99797780
23937974320432840324894820
EOF
[root@localhost /]# grep -E  "[0-9]{3}-[0-9]{8}|[0-9]{4}-[0-9]{7}"phone.txt
0212-7878909
0313-99797780
[root@localhost /]#


5).匹配邮件地址

1
2
3
4
5
6
7
8
9
10
11
[root@localhost /]# cat > email.txt << EOF
> 903U948HH@qq.com
> wejojodffslf@126.com
> 3joefjowfmfj@163.com
> dfk;dkf;f;;wkererm
> EOF
[root@localhost /]# grep -E "\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*"email.txt
903U948HH@qq.com
wejojodffslf@126.com
3joefjowfmfj@163.com
[root@localhost /]#

总结:

1、* # ? 的比较:

 *:匹配其前一个字符0次或多次

 #:匹配其前一个字符1次或多次

 ?:匹配其前一个字符0次或1次

2、‘’ “” ``的比较:

“”:弱引用,可以实现变量替换

'':强引用,不替换,而显示字符本身;

  ``:命令引用,``<--->$()