笔记内容:

9.1 正则介绍_grep

9.2 grep

9.3 grep

笔记日期:2017.8.17

 

9.1 正则介绍_grep

wKioL1nkIWbhuIF_AAt86H5NvSE672.png


正则就是各种各样的字符组合在一起形成的一串有规律的字符串,编程语言、shell脚本都需要用到正则表达式,可以利用正则来完成一些复杂的需求。

  学习正则需要用到四个工具grepegrepsedawk,其中egrepgrep的扩展,这俩者通常被归类为同一个工具。学好正则对编写shell脚本有很大的帮助。

wKiom1nkJCGyswIwAAmkF7sLtA8894.png


grep最简单的用法就是后面加一个字符串,然后匹配含有这个字符串的行:

wKiom1nkJCWiAQsGAAdjX4TX9WQ970.png


CentOS7grep自带了--color=auto选项:

wKioL1nkIW-g0Sj-AAFq6JZff5o177.png


-c选项查看行数:

wKioL1nkIXCyUJMyAAGOZxAA378830.png


-n选项显示行号:

wKiom1nkJCmyQSH6AAdjX10gYOU647.png


-i选项不区分大小写查看:

wKiom1nkJCzCoM96AAexbaL8BY4018.png


-v选项是取反:

wKioL1nkIZGBd7N1AAO_mqtz-IE181.png


-r选项把一些子目录下面的文件进行遍历:

wKioL1nkIZaSu7EnAAy1M2SHAH0328.png

root目录下含有root字符串的文件都列出来了



-A选项后面跟数字就会列出指定字符所在行下的n行:

wKiom1nkJE_BxzR2AAUNqPUmImM599.png


-B选项则是相反,列出指定字符所在行上的n行:

wKioL1nkIZqgUku_AAL0GPCz3JQ419.png


-C选项是列出指定字符所在行上下n行:

wKiom1nkJFHAWvJMAAQYzkqKGfI402.png



wKioL1nkIaTQ_dVlABLsCl5bKdY182.png




9.2 grep

wKioL1nkIamCSXWtAAhwQIpWZxA775.png

要注意的是所谓0-9不是说09的基数的意思,是指包含0-9的字符串,比如956包含了956这三个字符,就会被列出来。

  加-v选项就是显示不包含0-9的行,也可以理解为把不包含数字的行列出来:

wKioL1nkIeXRDe5lAAGID101a4M399.png


^#表示列出以#号开头的行,所以^就是表示某个字符开头的行:

wKiom1nkJJ7x1MyqAAdsCAF5oVQ480.png


-v选项就可以过滤掉#号开头的行:

wKioL1nkIemDfXf2AAE_LwoFG_s064.png


[^0-9]表示非0-9,会把内容列出来然后0-9之外的字符都会显示颜色:

wKioL1nkIjOgg5G0AAibmbU4vKQ120.png




9.3 grep

  . 表示匹配任意的单个字符的行:

wKiom1nkJOnRTc0PAAKt_q7Xl-g372.png


* 则表示匹配任意个字符的行:

wKiom1nkJKiy6fWkAAjyXHexnQM244.png


.* 贪婪匹配,会匹配所有的,类似于通配:

wKiom1nkJQvytIfYAApErp5X0-w894.png


{}可以用数字指定前面那个字符的重复范围,但是要加上脱义符:

wKiom1nkJZnx2XrmAAPl7YKE1zI324.png


如果不想写脱义符可以加个-E选项或者使用egrep

wKioL1nkIuWidWlrAALQJL3q5jI177.png

wKioL1nkIuWTeWfYAAMR4d5JTkE800.png


+*有点相似,表示匹配字符出现1次上的行,而*号则是0次也算,使用+需要加上脱义符,不想使用脱义符就用egrep

wKiom1nkJZzTsPUvAALUsasQGTU274.png


?表示字符重复次数为01

wKiom1nkJaCRKrTEAAkmb-9EI_8569.png


| 是或者的意思:

wKioL1nkIu3DyYhDAAeOuC9hfFY480.png


()是表示组合的意思:

wKioL1nkIu7wo4p0AARiXjv9-RY924.png




扩展

把一个目录下,过滤所有*.php文档中含有eval的行

grep -r --include="*.php" 'eval' /data/