grep

grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。Linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。

grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。

grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功(搜索结果为空),则返回1,如果搜索的文件不存在,则返回2。我们利用$?获取这些返回值就可进行一些自动化的文本处理工作。

用法:
Usage: grep [OPTION]... PATTERN [FILE]...
Search for PATTERN in each FILE.
Example: grep -i 'hello world' menu.h main.c
语法
grep [-abcEFGhHilLnqrsvVwxy][-A<显示行数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]
常用参数:

  • -a 或 --text : 不要忽略二进制的数据。
  • -c 或 --count : 计算符合样式的行数。
  • -n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。
  • -v 或 --invert-match : 反向查找,显示不符合条件行的内容,常用于排除注释行。

匹配模式选择:

  • -E, --extended-regexp 扩展正则表达式egrep
  • -F, --fixed-strings 一个换行符分隔的字符串的集合fgrep
  • -G, --basic-regexp 基本正则
  • -P, --perl-regexp 调用的perl正则
  • -e, --regexp=PATTERN 后面根正则模式,默认无
  • -f, --file=FILE 从文件中获得匹配模式
  • -i, --ignore-case 不区分大小写
  • -w, --word-regexp 匹配整个单词
  • -x, --line-regexp 匹配整行
  • -z, --null-data 一个 0 字节的数据行,但不是空行

输入控制:

  • -R, -r, --recursive 递归调用
  • -o, --only-matching 只显示一行中匹配PATTERN 的部分
  • -m, --max-count=NUM 匹配的最大数
  • -b, --byte-offset 打印匹配行前面打印该行所在的块号码。
  • -n, --line-number 显示的加上匹配所在的行号
  • --line-buffered 刷新输出每一行
  • -H, --with-filename 当搜索多个文件时,显示匹配文件名前缀
  • -h, --no-filename 当搜索多个文件时,不显示匹配文件名前缀
  • --label=LABEL print LABEL as filename for standard input
  • -q, --quiet, --silent 不显示任何东西
  • --binary-files=TYPE 假定二进制文件的TYPE 类型;
    TYPE 可以是binary', text', 或`without-match'
  • -a, --text 匹配二进制的东西
  • -I 不匹配二进制的东西
  • -d, --directories=ACTION 目录操作,读取,递归,跳过
  • -D, --devices=ACTION 设置对设备,FIFO,管道的操作,读取,跳过
  • --include=PATTERN 只查找匹配FILE_PATTERN 的文件
  • --exclude=PATTERN 跳过匹配FILE_PATTERN 的文件和目录
  • --exclude-from=FILE 跳过所有除FILE 以外的文件
  • -L, --files-without-match 匹配多个文件时,显示不匹配的文件名
  • -l, --files-with-matches 匹配多个文件时,显示匹配的文件名
  • -c, --count 显示匹配的行数
  • -Z, --null 在FILE 文件最后打印空字符

文件控制:

  • -B, --before-context=NUM 打印匹配本身以及前面的几个行由NUM控制
  • -A, --after-context=NUM 打印匹配本身以及随后的几个行由NUM控制
  • -C, --context=NUM 打印匹配本身以及随后,前面的几个行由NUM控制
  • -NUM 根-C的用法一样的
  • --color[=WHEN],
  • --colour[=WHEN] 使用标志高亮匹配字串;
  • -U, --binary 使用标志高亮匹配字串;
  • -u, --unix-byte-offsets 当CR 字符不存在,报告字节偏移(MSDOS 模式)