一、grep简介
(1). grep (global search regular expression (RE) and print out the line ),[全面搜索正则表达式并把行打印出来]是一种强大的文本搜索工具,他们使用正则表达式搜索文本,并且把匹配的行打印出来。
(2).grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令只跟grep有很小的不同。egrep是grep的扩展,支持更多的(RE)元字符.
(3)可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果不成功,则返回1,如果搜索不存在,则返回2,我们利用返回值可以进行一些自动化的文本处理工作。
(4)语法说明:
grep [options] PATTERN [FILE...]
-a或--text 不要忽略二进制的数据。
-A或--after-context= 除了显示符合范本样式的那一列之外,并显示该列之後的内容。
-b或--byte-offset 在显示符合范本样式的那一列之前,标示出该列第一个字符的位编号。
-B或--before-context= 除了显示符合范本样式的那一列之外,并显示该列之前的内容。
-c或--count 计算符合范本样式的列数。
-C或--context=或- 除了显示符合范本样式的那一列之外,并显示该列之前後的内容。
-d或--directories= 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e或--regexp= 指定字符串做为查找文件内容的范本样式。
-E或--extended-regexp 将范本样式为延伸的普通表示法来使用。
-f或--file= 指定范本文件,其内容含有一个或多个范本样式,让grep查找符合范本条件的文件内容,格式为每列一个范本样式。
-F或--fixed-regexp 将范本样式视为固定字符串的列表。
-G或--basic-regexp 将范本样式视为普通的表示法来使用。
-h或--no-filename 在显示符合范本样式的那一列之前,不标示该列所属的文件名称。
-H或--with-filename 在显示符合范本样式的那一列之前,表示该列所属的文件名称。
-i或--ignore-case 忽略字符大小写的差别。
-l或--file-with-matches 列出文件内容符合指定的范本样式的文件名称。
-L或--files-without-match 列出文件内容不符合指定的范本样式的文件名称。
-n或--line-number 在显示符合范本样式的那一列之前,标示出该列的列数编号。
-o --仅显示匹配到的行
-q或--quiet或--silent 不显示任何信息。
-r或--recursive 此参数的效果和指定“-d recurse”参数相同。
-s或--no-messages 不显示错误信息。
-v或--revert-match 反转查找。
-V或--version 显示版本信息。
-w或--word-regexp 只显示全字符合的列。
-x或--line-regexp 只显示全列符合的列。
-y 此参数的效果和指定“-i”参数相同。
--help 在线帮助。
常见字符集:
[:alnum:] 匹配任意字母数字字符0-9、A-Z或a-z
[:alpha:] 匹配任意字母字符,不管是大写还是小写
[:blank:] 匹配空格或者制表符
[:digit:] 匹配0-9之间的数字
[:lower:] 匹配小写字母字符a-z
[:print:] 匹配任意可打印字符
[:punct:] 匹配标点符号
[:space:] 匹配任意空白字符:空格、制表符、NL、FF、VT、和CR
[:upper:] 匹配任意大写字母字符A-Z
文件名通配:
* | 任意长度的任意字符 |
? | 匹配任意单个字符 |
[ ] | 匹配指定范围内的任意单个字符 |
[^] | 匹配指定范围以外的任意单个字符 |
基本正则表达式:
字符匹配 | . | 匹配任意单个字符 |
[ ] | 匹配指定范围内的任意单个字符 | |
[^] | 匹配指定范围外的任意单个字符 |
次数匹配 | * | 前面的字符可以出现任意次 |
\? | 前面的字符出现0次或者1次 | |
\{m\} | 前面的字符出现m次 | |
\{m,n\} | 前面的字符出现n次~m次 | |
\{m,\} | 前面的字符至少出现m次 | |
\{0,n\} | 前面的字符至多出现n次 |
.* | 任意长度的任意字符 |
位置锚定 | ^ | 行首锚定,写在模式的最左侧 |
$ | 行尾锚定,写在模式的最右侧 | |
^$ | 匹配空行 | |
\< | 词首锚定,出现于单词左侧 | |
\> | 词尾锚定,出现于单词右侧 |
分组 | \1 | 引用第1个括号所匹配到的内容,而非模式本身 |
\2 | 引用第2个括号所匹配到的内容,而非模式本身 | |
\(\) | 匹配分组 |
扩展正则表达式:
字符匹配 | . | 匹配任意单个字符 |
[ ] | 匹配指定范围内的任意单个字符 | |
[^] | 匹配指定范围外的任意单个字符 |
次数匹配 | * | 前面的字符可以出现任意次 |
? | 前面的字符出现0次或者1次 | |
+ | 前面的字符至少出现1次 | |
{m} | 前面的字符出现m次 | |
{m,n} | 前面的字符出现m次~n次 | |
{m,} | 前面的字符至少出现m次 | |
{0,n} | 前面的字符至多出现n次 |
锚定 | ^ | 行首锚定,写在模式的最左侧 |
$ | 行尾锚定,写在模式的最右侧 | |
\<,\b | 词首锚定,出现于单词左侧 | |
\>,\b | 词尾锚定,出现于单词右侧 | |
^$ | 匹配空行 |
分组 | ( ) | 匹配一个分组 |
\1 | 引用第1个括号所匹配到的内容,而非模式本身 |
grep正则表达式元字符
^ 锚定行的开始 例如:'^grep' 匹配所有以grep开头的行。
$ 锚定行的结束 例如:'grep$' 匹配所有以grep结尾的行。
. 匹配一个非换行符的字符 例如:'gr.p' 匹配gr后面接一个任意字符,然后是p。
* 匹配零个或多个先前字符 例如: '*grep' 匹配所有一个或多个空格后紧跟grep的行,.*一起用,代表任意字符。
[] 匹配一个指定范围内的字符 例如:'[Gg]rep' 匹配Grep和grep.
[^] 匹配一个不在指定范围内的字符,例如:'[^A-EG-Z]rep' 匹配不包含A-EG-Z开头,紧跟rep的行