简述

Linux中 grep 命令用于查找文件里符合条件的字符串。
grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep 指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。
grep命令(Global Regular Expression Print)是 Linux系统中一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来 。
grep 是linux中最为常用的三大文本(awk,sed,grep)处理工具之一,所以有必要掌握其用法。
grep家族总共有三个成员构成:grep、egrep、fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。

语法

grep    [选项]    字符串/正则表达式    [文件]

参数说明

-a 或 --text : 不要忽略二进制的数据。

-A<显示行数> 或 --after-context=<显示行数> : 除了显示符合范本样式的那一列之外,并显示该行之后的内容。

-b 或 --byte-offset : 在显示符合样式的那一行之前,标示出该行第一个字符的编号。

-B<显示行数> 或 --before-context=<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前的内容。

-c 或 --count : 计算符合样式的列数。

-C<显示行数> 或 --context=<显示行数>或-<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前后的内容。

-d <动作> 或 --directories=<动作> : 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。

-e<范本样式> 或 --regexp=<范本样式> : 指定字符串做为查找文件内容的样式。

-E 或 --extended-regexp : 将样式为延伸的正则表达式来使用。

-f<规则文件> 或 --file=<规则文件> : 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。

-F 或 --fixed-regexp : 将样式视为固定字符串的列表。

-G 或 --basic-regexp : 将样式视为普通的表示法来使用。

-h 或 --no-filename : 在显示符合样式的那一行之前,不标示该行所属的文件名称。

-H 或 --with-filename : 在显示符合样式的那一行之前,表示该行所属的文件名称。

-i 或 --ignore-case : 忽略字符大小写的差别。

-l 或 --file-with-matches : 列出文件内容符合指定的样式的文件名称。

-L 或 --files-without-match : 列出文件内容不符合指定的样式的文件名称。

-n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。

-o 或 --only-matching : 只显示匹配PATTERN 部分。

-q 或 --quiet或--silent : 不显示任何信息。

-r 或 --recursive : 此参数的效果和指定"-d recurse"参数相同。

-s 或 --no-messages : 不显示错误信息。

-v 或 --revert-match : 显示不包含匹配文本的所有行。

-V 或 --version : 显示版本信息。

-w 或 --word-regexp : 只显示全字符合的列。

-x --line-regexp : 只显示全列符合的列。

-y : 此参数的效果和指定"-i"参数相同。

注意!

一、
单双引号

  • 在grep 命令中输入 字符串参数时,用双引号括起来。
    例如:grep “good” ./1.txt
    这样做有两个原因:
    一是防止字符串参数被误解为shell命令;
    二是可以用来查找多个单词组成的字符串。如果不用双引号将其括起来,那么单词 “good” 将被误认为是一个文件,查询结果将返回”文件不存在”的错误信息。
  • 在使用变量时,也应该使用双引号,例如:grep “$good” ./1.txt,如果不这样,将没有返回结果。
  • 在调用模式匹配[正则表达式]时,应使用单引号:grep ‘good.*’ ./1.txt

二、
搜索当前目录
默认情况下,grep 只搜索当前目录,如果此目录下有许多子目录
明确要求搜索子目录:grep -r
忽略子目录:grep -d skip

[root@ljh2020 test]# grep -r "good" ./*
./1.txt:today is a good day

三、
特殊符号
< 和 > 分别标注单词的开始与结尾。
例如:
grep man ./* 会匹配 “Batman”、“manic”、“man"等,
grep '\<man' * 匹配"manic”、“man”,但不匹配 “Batman”,
grep '\<man\>' 只匹配"man",而不是 “Batman”、"manic"等其他的字符串。

'^': 指匹配的字符串在行首
'$': 指匹配的字符串在行尾

正则表达式主要参数:

  • \: 忽略正则表达式中特殊字符的原有含义。
  • ^:匹配正则表达式的开始行。
  • $: 匹配正则表达式的结束行。
  • \<:从匹配正则表达 式的行开始。
  • \>:到匹配正则表达式的行结束。
  • [ ]:单个字符,如[A]即A符合要求 。
  • [ - ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
  • .:所有的单个字符。
  • *:所有字符,长度可以为0。

举例

# 在当前目录下所有.txt文件中查找字符串"good"
[root@ljh2020 test]# grep  "good"  *.txt 
1.txt:today is a good day
# 查询1.txt 中 含有 "good" 的行数 
[root@ljh2020 test]# grep  -c  "good"  ./1.txt
1
# 输出含有"good" 的行以及行号
[root@ljh2020 test]# grep  -n  "good"  ./1.txt
1:today is a good day
# 查询特殊字符时,诸如 $  .  ‘  ”  *  [ ]  ^  |  \  +  ?   时,未避免转义,需要在前面加 '\' 
# 查询含有文件名 test.conf 的行 
[root@ljh2020 test]# grep  "test\.conf"    ./1.txt  
test.conf
# 查询目录列表中的 所有目录[文件夹]
[root@ljh2020 test]# ls  -l  |grep  "^d"   
drwxr-xr-x 2 root root 4096 May 12 21:06 ljh
# 查询目录列表中的所有文件
[root@ljh2020 test]# ls -l |grep  -v  "^d"
total 4
-rw-r--r-- 1 root root 30 May 12 21:03 1.txt
-rw-r--r-- 1 root root  0 May 12 17:54 2.txt
-rw-r--r-- 1 root root  0 May 12 17:38 3.bocx