文本处理工具grep及正则表达式

-----------------------------------------------------------------------------------------------------------------------------------------------

查看命令

cat查看文件内容,tac从列的方向反向查看,rev从行的方向反向查看

cat -A可以看见文档中回车和换行符

less查看文件不像cat查看文件一次到底,而是一页一页显示


文本处理三剑客

grep:文本过滤(模式:pattern)工具

grep, egrep, fgrep(不支持正则表达式搜索)

sed:stream editor,文本编辑工具

awk:Linux上的实现gawk,文本报告生成器


grep相关概念

1.grep: Global search REgular expression and Print out the line,作用是文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查,打印匹配到的行;模式:由正则表达式字符及文本字符所编写的过滤条件;

2.REGEXP:由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能;

3.程序支持:grep,sed,awk,vim, less,nginx,varnish等分两类:

(1)基本正则表达式:BRE

(2)扩展正则表达式:ERE,指令为grep -E, egrep;

4正则表达式引擎:采用不同算法,检查处理正则表达式的软件模块,PCRE(Perl Compatible Regular Expressions);

5.元字符分类:字符匹配、匹配次数、位置锚定、分组


正则表达式符号

文本处理工具grep及正则表达式_正则表达式

文本处理工具grep及正则表达式_grep_02

文本处理工具grep及正则表达式_正则表达式_03