昨天新学习了正则表达式,才知道它的强大,也知道不容易掌握。
好在,好多常用的表达式,已经在网上广为流传,怀着感激之情,我们拿来用好了。
不过,了解些基本的内容还是有必要的。 就说说它的基本构成吧。
1。表达式边界 以^开始,以$结束。
2。字符
除元字符和转义字符外其他的字符表示其本身。
元字符有
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始,开始边界
$ 匹配字符串的结束,结束边界
转义字符有
\a 与响铃匹配
\b 表示单词边界,还表示退格符
\t 与Tab符匹配
\r 与回车符匹配
\v 与垂直符匹配
\f 与换页符匹配
\n 与换行符匹配
\e 与Esc符匹配
3。字符范围
a.连续的范围 用[]括住,如[1-9],[a-z]表示1到9,小a到小z。
b.不连续的范围 用[]括住,字符间用|隔开,如[|3|5|8]表示匹配或3或5或8。
4。重复
a.固定重复 在重复项后面写{次数} 如\d{5} 表示匹配5个数字。其中,
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
b.不固定重复又称贪婪模式
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
如 [a-zA-Z]+ 表示匹配至少有一个字母。
5。分组 把一系列相关的字符用小括号括起来,多用于需要匹配一定次数时。
如 (.\d{3})+ 表示“.”和3个整数要至少出现1次。
6。组合又称分支 即只要满足一个条件就代表匹配成功。
分支之间用|表示,如(2[0-4]\d)|(25[0-5]) 表示一个三位数要么是以2开头不大于249,
要么是以25开头,不大于255。
其他的还有什么零宽度断言,反向,反义等等语法,等用到时再着重研究吧。
掌握以上知识点,对于一些常用的表达式,就能分析改用了。