目录

  • 1. 语法
  • 2. 修饰符
  • 3. 正则表达式模式
  • 括号
  • 元字符
  • 量词
  • 3. 正则表达式常用的字符串方法
  • 4. 正则表达式方法(RegExp 对象方法)
  • 5. RegExp 对象属性
  • 6. 正则表达式应用——实例应用



正则表达式是构成搜索模式(search pattern)的字符序列,用来描述搜索的内容,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。


正则表达式可用于执行所有类型的文本搜索和文本替换操作。

1. 语法

//创建 RegExp 对象的语法:
var regex = new RegExp(pattern, attributes);
//直接量语法
var patt=/pattern/attributes;

参数

  • pattern(模式) 指定了正则表达式的模式或其他正则表达式。
  • attributes(修饰符) 是一个可选的字符串,包含属性 “g”、“i” 和 “m”,分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。

返回值

  • 一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。
  • 如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。

抛出

  • SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 “g”、“i” 和 “m” 之外的字符,抛出该异常。
  • TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。

ES6的修改

如果RegExp构造函数第一个参数是一个正则对象,那么可以使用第二个参数指定修饰符。而且,返回的正则表达式会忽略原有的正则表达式的修饰符,只使用新指定的修饰符。

new RegExp(/abc/ig, 'i').flags
// "i"

上面代码中,原有正则对象的修饰符是ig,它会被第二个参数i覆盖。

2. 修饰符

修饰符用于执行区分大小写和全局匹配

修饰符

描述

i

执行对大小写不敏感的匹配。

g

执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。

m

执行多行匹配。

ES6增加

修饰符

描述

u

含义为“Unicode 模式”,用来正确处理大于\uFFFF的 Unicode 字符。也就是说,会正确处理四个字节的 UTF-16 编码

3. 正则表达式模式

括号

用于查找一定范围的字符串:

表达式

描述

[abc]

查找方括号之间的任何字符。

[0-9]

查找任何从 0 至 9 的数字。

(x|y)

查找由|分隔的任何选项。

[a-z]

查找任何从小写 a 到小写 z 的字符。

[A-Z]

查找任何从大写 A 到大写 Z 的字符。

[A-z]

查找任何从大写 A 到小写 z 的字符。

[adgk]

查找给定集合内的任何字符。

元字符

元字符(Metacharacter)是拥有特殊含义的字符:

元字符

描述

.

查找单个字符,除了换行和行结束符。

\w

查找数字、字母及下划线。

\W

查找非单词字符。

\d

查找数字。

\D

查找非数字字符。

\s

查找空白字符。

\S

查找非空白字符。

\b

匹配单词边界。

\B

匹配非单词边界。

\0

查找 NULL 字符。

\n

查找换行符。

\f

查找换页符。

\r

查找回车符。

\t

查找制表符。

\v

查找垂直制表符。

\xxx

查找以八进制数 xxx 规定的字符。

\xdd

查找以十六进制数 dd 规定的字符。

\uxxxx

查找以十六进制数 xxxx 规定的 Unicode 字符。

量词

量词

描述

n+

匹配任何包含至少一个 n 的字符串。例如,/a+/ 匹配 “candy” 中的 “a”,“caaaaaaandy” 中所有的 “a”。

n*

匹配任何包含零个或多个 n 的字符串。例如,/bo*/ 匹配 “A ghost booooed” 中的 “boooo”,“A bird warbled” 中的 “b”,但是不匹配 “A goat grunted”。

n?

匹配任何包含零个或一个 n 的字符串。例如,/e?le?/ 匹配 “angel” 中的 “el”,“angle” 中的 “le”。

n{X}

匹配包含 X 个 n 的序列的字符串。例如,/a{2}/ 不匹配 “candy,” 中的 “a”,但是匹配 “caandy,” 中的两个 “a”,且匹配 “caaandy.” 中的前两个 “a”。

n{X,}

X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配。例如,/a{2,}/ 不匹配 “candy” 中的 “a”,但是匹配 “caandy” 和 “caaaaaaandy.” 中所有的 “a”。

n{X,Y}

X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配。例如,/a{1,3}/ 不匹配 “cndy”,匹配 “candy,” 中的 “a”,“caandy,” 中的两个 “a”,匹配 “caaaaaaandy” 中的前面三个 “a”。注意,当匹配 “caaaaaaandy” 时,即使原始字符串拥有更多的 “a”,匹配项也是 “aaa”。

n$

匹配任何结尾为 n 的字符串。

^n

匹配任何开头为 n 的字符串。

?=n

匹配任何其后紧接指定字符串 n 的字符串。

?!n

匹配任何其后没有紧接指定字符串 n 的字符串。

3. 正则表达式常用的字符串方法

方法

描述

search()

使用表达式来搜索匹配,然后返回匹配的位置。

replace()

返回模式被替换处修改后的字符串。

match()

找到一个或多个正则表达式的匹配。

split()

把字符串分割为字符串数组。

4. 正则表达式方法(RegExp 对象方法)

方法

描述

test()

通过模式来搜索字符串,即检索字符串中指定的值,然后根据结果返回 true 或 false。

exec

检索字符串中指定的值。返回找到的值,并确定其位置。如果未找到匹配,则返回 null。

toString

返回正则表达式的字符串。

compile

在 1.5 版本中已废弃。 编译正则表达式。

5. RegExp 对象属性

属性 描述 FF IE
global RegExp 对象是否具有标志 g。 1 4
ignoreCase RegExp 对象是否具有标志 i。 1 4
lastIndex 一个整数,标示开始下一次匹配的字符位置。 1 4
multiline RegExp 对象是否具有标志 m。 1 4
source 正则表达式的源文本。

6. 正则表达式应用——实例应用

1.验证用户名和密码:("^[a-zA-Z]\w{5,15}$") 正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位;

2.验证电话号码:("^(\d{3,4}-)\d{7,8}$")正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;

3.验证手机号码(包含虚拟号码和新号码段):"^1([38][0-9]|4[5-9]|5[0-3,5-9]|66|7[0-8]|9[89])[0-9]{8}$"

4.验证身份证号(15位):"\d{14}[[0-9],0-9xX]"
(18位):"\d{17}(\d|X|x)"

5.验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$")

6.只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$")

7.整数或者小数:^[0-9]+([.][0-9]+){0,1}$

8.只能输入数字:"^[0-9]*$"

9.只能输入n位的数字:"^\d{n}$"

10.只能输入至少n位的数字:"^\d{n,}$"

11.只能输入m~n位的数字:"^\d{m,n}$"

12.只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"

13.只能输入有两位小数的正实数:"^[0-9]+(\.[0-9]{2})?$"

14.只能输入有1~3位小数的正实数:"^[0-9]+(\.[0-9]{1,3})?$"

15.只能输入非零的正整数:"^\+?[1-9][0-9]*$"

16.只能输入非零的负整数:"^\-[1-9][0-9]*$"

17.只能输入长度为3的字符:"^.{3}$"

18.只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"

19.只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"

20.只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"

21.验证是否含有^%&',;=?$\"等字符:"[%&',;=?$\\^]+"

22.只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"

23.验证URL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"

24.验证一年的12个月:"^(0?[1-9]|1[0-2])$" 正确格式为:“01"~"09"和"10"~"12”。

25.验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$" 正确格式为;“01"~"09”、"10"~"29"和“30”~“31”。

26.获取日期正则表达式:\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日? 评注:可用来匹配大多数年月日信息。

27.匹配双字节字符(包括汉字在内):[^\x00-\xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

28.匹配空白行的正则表达式:\n\s*\r 评注:可以用来删除空白行

29.匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? /> 评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

30.匹配首尾空白字符的正则表达式:^\s*|\s*$ 评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

31.匹配网址URL的正则表达式:[a-zA-z]+://[^\s]* 评注:网上流传的版本功能很有限,上面这个基本可以满足需求

32.匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 评注:表单验证时很实用

33.匹配腾讯QQ号:[1-9][0-9]{4,} 评注:腾讯QQ号从10 000 开始

34.匹配中国邮政编码:[1-9]\\d{5}(?!\d) 评注:中国邮政编码为6位数字

35.匹配ip地址:([1-9]{1,3}\.){3}[1-9]
评注:提取ip地址时有用

36.匹配MAC地址:([A-Fa-f0-9]{2}\:){5}[A-Fa-f0-9]