一、正则表达式

1.概念 正则表达式(Regular Expression)是用于描述一组字符串特征的模式,用来匹配特定的字符串。通过特殊字符+普通字符来进行模式描述,从而达到文本匹配目的工具。

2.应用场景 (1)验证:表单提交时,进行用户名密码的验证。 (2)查找:从大量信息中快速提取指定内容,在一批url中,查找指定url。 (3)替换:将指定格式的文本进行正则匹配查找,找到之后进行特定替换。

3.网址: 正则在线测试工具:https://regexr-cn.com/ 正则练习:https://codejiaonang.com/

二、元字符

1.元字符(matacharacter):具有特定含义的字符(一个字符是否是元字符取决于应用的具体情况) 常用的元字符 代码    说明 .    匹配除换行符以外的任意字符 \w    匹配字母或数字或下划线或汉字 \s    匹配任意的空白符 \d    匹配数字 \b    匹配单词的开始或结束 []       字符组,匹配单个列出的字符 ^    匹配字符串的开始(在集合字符里[^a]表示非(不匹配)的意思 $    匹配字符串的结束

2.反义字符:多用于查找除某个字符以外其他任意字符均可以的情况 常用的反义字符 代码/语法    说明 \W    匹配任意不是字母,数字,下划线,汉字的字符 \S    匹配任意不是空白符的字符 \D    匹配任意非数字的字符 \B    匹配不是单词开头或结束的位置 [^x]    匹配除了x以外的任意字符 [^aeiou]    匹配除了aeiou这几个字母以外的任意字符

3.限定字符:多用于重复匹配次数 常用的限定符 代码/语法    说明 *             重复零次或更多次 +             重复一次或更多次 ?             容许匹配一次,但非必须 {min,max}  区间量词,至少min次,最多max次 例如: {n,m}    重复n到m次

4.转义字符(\) 在实际的开发中,可能会遇到要比配元字符的情况,这个时候就需要进行字符转义,如元字符 .  *  \ 需要转换为\.   \*   \\ 5.多选结构(|) 多用于满足不同情况的选择,用“|”将不同的条件分割开来 6.括号 限定多选结构的范围,标注量词作用的元素,为反向应用“捕获”文本 7.反向引用(\1,\2) 匹配之前的第一,第二组括号内的字表达式匹配的文本。