目录
- 1. 语法
- 2. 修饰符
- 3. 正则表达式模式
- 括号
- 元字符
- 量词
- 3. 正则表达式常用的字符串方法
- 4. 正则表达式方法(RegExp 对象方法)
- 5. RegExp 对象属性
- 6. 正则表达式应用——实例应用
正则表达式是构成搜索模式(search pattern)的字符序列,用来描述搜索的内容,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。
正则表达式可用于执行所有类型的文本搜索和文本替换操作。
1. 语法
//创建 RegExp 对象的语法:
var regex = new RegExp(pattern, attributes);
//直接量语法
var patt=/pattern/attributes;
参数
-
pattern
(模式) 指定了正则表达式的模式或其他正则表达式。 -
attributes
(修饰符) 是一个可选的字符串,包含属性 “g”、“i” 和 “m”,分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。
返回值
- 一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。
- 如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。
抛出
SyntaxError
- 如果 pattern 不是合法的正则表达式,或 attributes 含有 “g”、“i” 和 “m” 之外的字符,抛出该异常。TypeError
- 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。
ES6的修改
如果RegExp
构造函数第一个参数是一个正则对象,那么可以使用第二个参数指定修饰符。而且,返回的正则表达式会忽略原有的正则表达式的修饰符,只使用新指定的修饰符。
new RegExp(/abc/ig, 'i').flags
// "i"
上面代码中,原有正则对象的修饰符是ig
,它会被第二个参数i
覆盖。
2. 修饰符
修饰符用于执行区分大小写和全局匹配
修饰符 | 描述 |
i | 执行对大小写不敏感的匹配。 |
g | 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。 |
m | 执行多行匹配。 |
ES6增加
修饰符 | 描述 |
u | 含义为“Unicode 模式”,用来正确处理大于 |
3. 正则表达式模式
括号
用于查找一定范围的字符串:
表达式 | 描述 |
[abc] | 查找方括号之间的任何字符。 |
[0-9] | 查找任何从 0 至 9 的数字。 |
(x|y) | 查找由|分隔的任何选项。 |
[a-z] | 查找任何从小写 a 到小写 z 的字符。 |
[A-Z] | 查找任何从大写 A 到大写 Z 的字符。 |
[A-z] | 查找任何从大写 A 到小写 z 的字符。 |
[adgk] | 查找给定集合内的任何字符。 |
元字符
元字符(Metacharacter)是拥有特殊含义的字符:
元字符 | 描述 |
. | 查找单个字符,除了换行和行结束符。 |
\w | 查找数字、字母及下划线。 |
\W | 查找非单词字符。 |
\d | 查找数字。 |
\D | 查找非数字字符。 |
\s | 查找空白字符。 |
\S | 查找非空白字符。 |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
\0 | 查找 NULL 字符。 |
\n | 查找换行符。 |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
\xxx | 查找以八进制数 xxx 规定的字符。 |
\xdd | 查找以十六进制数 dd 规定的字符。 |
\uxxxx | 查找以十六进制数 xxxx 规定的 Unicode 字符。 |
量词
量词 | 描述 |
n+ | 匹配任何包含至少一个 n 的字符串。例如,/a+/ 匹配 “candy” 中的 “a”,“caaaaaaandy” 中所有的 “a”。 |
n* | 匹配任何包含零个或多个 n 的字符串。例如,/bo*/ 匹配 “A ghost booooed” 中的 “boooo”,“A bird warbled” 中的 “b”,但是不匹配 “A goat grunted”。 |
n? | 匹配任何包含零个或一个 n 的字符串。例如,/e?le?/ 匹配 “angel” 中的 “el”,“angle” 中的 “le”。 |
n{X} | 匹配包含 X 个 n 的序列的字符串。例如,/a{2}/ 不匹配 “candy,” 中的 “a”,但是匹配 “caandy,” 中的两个 “a”,且匹配 “caaandy.” 中的前两个 “a”。 |
n{X,} | X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配。例如,/a{2,}/ 不匹配 “candy” 中的 “a”,但是匹配 “caandy” 和 “caaaaaaandy.” 中所有的 “a”。 |
n{X,Y} | X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配。例如,/a{1,3}/ 不匹配 “cndy”,匹配 “candy,” 中的 “a”,“caandy,” 中的两个 “a”,匹配 “caaaaaaandy” 中的前面三个 “a”。注意,当匹配 “caaaaaaandy” 时,即使原始字符串拥有更多的 “a”,匹配项也是 “aaa”。 |
n$ | 匹配任何结尾为 n 的字符串。 |
^n | 匹配任何开头为 n 的字符串。 |
?=n | 匹配任何其后紧接指定字符串 n 的字符串。 |
?!n | 匹配任何其后没有紧接指定字符串 n 的字符串。 |
3. 正则表达式常用的字符串方法
方法 | 描述 |
search() | 使用表达式来搜索匹配,然后返回匹配的位置。 |
replace() | 返回模式被替换处修改后的字符串。 |
match() | 找到一个或多个正则表达式的匹配。 |
split() | 把字符串分割为字符串数组。 |
4. 正则表达式方法(RegExp 对象方法)
方法 | 描述 |
test() | 通过模式来搜索字符串,即检索字符串中指定的值,然后根据结果返回 true 或 false。 |
exec | 检索字符串中指定的值。返回找到的值,并确定其位置。如果未找到匹配,则返回 null。 |
toString | 返回正则表达式的字符串。 |
compile | 在 1.5 版本中已废弃。 编译正则表达式。 |
5. RegExp 对象属性
属性 描述 FF IE
global RegExp 对象是否具有标志 g。 1 4
ignoreCase RegExp 对象是否具有标志 i。 1 4
lastIndex 一个整数,标示开始下一次匹配的字符位置。 1 4
multiline RegExp 对象是否具有标志 m。 1 4
source 正则表达式的源文本。
6. 正则表达式应用——实例应用
1.验证用户名和密码:("^[a-zA-Z]\w{5,15}$")
正确格式:"[A-Z][a-z]_[0-9]"
组成,并且第一个字必须为字母6~16位;
2.验证电话号码:("^(\d{3,4}-)\d{7,8}$")
正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;
3.验证手机号码(包含虚拟号码和新号码段):"^1([38][0-9]|4[5-9]|5[0-3,5-9]|66|7[0-8]|9[89])[0-9]{8}$"
;
4.验证身份证号(15位):"\d{14}[[0-9],0-9xX]"
,
(18位):"\d{17}(\d|X|x)"
;
5.验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$")
;
6.只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$")
;
7.整数或者小数:^[0-9]+([.][0-9]+){0,1}$
8.只能输入数字:"^[0-9]*$"
。
9.只能输入n位的数字:"^\d{n}$"
。
10.只能输入至少n位的数字:"^\d{n,}$"
。
11.只能输入m~n位的数字:"^\d{m,n}$"
。
12.只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"
。
13.只能输入有两位小数的正实数:"^[0-9]+(\.[0-9]{2})?$"
。
14.只能输入有1~3位小数的正实数:"^[0-9]+(\.[0-9]{1,3})?$"
。
15.只能输入非零的正整数:"^\+?[1-9][0-9]*$"
。
16.只能输入非零的负整数:"^\-[1-9][0-9]*$"
。
17.只能输入长度为3的字符:"^.{3}$"
。
18.只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"
。
19.只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"
。
20.只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"
。
21.验证是否含有^%&',;=?$\"
等字符:"[%&',;=?$\\^]+"
。
22.只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"
。
23.验证URL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"
。
24.验证一年的12个月:"^(0?[1-9]|1[0-2])$"
正确格式为:“01"~"09"和"10"~"12”。
25.验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"
正确格式为;“01"~"09”、"10"~"29"和“30”~“31”。
26.获取日期正则表达式:\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日?
评注:可用来匹配大多数年月日信息。
27.匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
28.匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
29.匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
30.匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
31.匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
32.匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
33.匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10 000 开始
34.匹配中国邮政编码:[1-9]\\d{5}(?!\d)
评注:中国邮政编码为6位数字
35.匹配ip地址:([1-9]{1,3}\.){3}[1-9]
。
评注:提取ip地址时有用
36.匹配MAC地址:([A-Fa-f0-9]{2}\:){5}[A-Fa-f0-9]