正则入门

原创

ha4931129 2012-08-22 15:08:57 博主文章分类：linux服务 ©著作权

文章标签 正则入门 文章分类 运维

©著作权归作者所有：来自51CTO博客作者ha4931129的原创作品，请联系作者获取转载授权，否则将追究法律责任

用途
   一种工具，为了解决某一类专门的问题
如何使用
   一种是查找特定的信息(搜索)，另一种是查找并

编辑特定的信息(替换)。两种基本用途，搜索和替换。给

定一个正则表达式，它要么匹配一些文本(进行一次搜索)

，要么匹配并替换一些文本(进行一次替换)。

\b是正则表达式规定的一个特殊代码（好吧，某些人叫它元字符，metacharacter），代表着单词的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格，标点符号或者换行来分隔的，但是\b并不匹配这些单词分隔字符中的任何一个，它只匹配一个位置

. 是另一个元字符，匹配除了换行符以外的任意字符

*前边的内容可以连续重复使用任意次以使整个表达式得到匹配

.*连在一起就意味着任意数量的不包含换行的字符

\d是个新的元字符，匹配一位数字(0，或1，或2，或……)

代码说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束

*     重复零次或更多次
+     重复一次或更多次
?     重复零次或一次
{n}   重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

\W       匹配任意不是字母，数字，下划线，汉字的字符
\S       匹配任意不是空白符的字符
\D       匹配任意非数字的字符
\B       匹配不是单词开头或结束的位置
[^x]     匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符

分类代码/语法    说明
捕获 (exp)        匹配exp,并捕获文本到自动命名的组里
     (?<name>exp) 匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
     (?:exp)      匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
         (?<=exp) 匹配exp后面的位置
         (?!exp) 匹配后面跟的不是exp的位置
         (?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读

(?=exp)也叫零宽度正预测先行断言，它断言自身出现的位置的后面能匹配表达式exp

(?<=exp)也叫零宽度正回顾后发断言，它断言自身出现的位置的前面能匹配表达式exp

零宽度负预测先行断言(?!exp)，断言此位置的后面不能匹配表达式exp

零宽度负回顾后发断言(?<!exp)，断言此位置的前面不能匹配表达式exp

小括号的另一种用途是通过语法(?#exp)来包含注释

*?     重复任意次，但尽可能少重复
+?     重复1次或更多次，但尽可能少重复
??     重复0次或1次，但尽可能少重复
{n,m}? 重复n到m次，但尽可能少重复
{n,}? 重复n次以上，但尽可能少重复

简单地说，因为正则表达式有另一条规则，比懒惰／贪婪规则的优先级更高：最先开始的匹配拥有最高的优先权