文本: 

<br/>您好,非常好,很开心认识你

<br/><a target=_blank href="www.baidu.com">百度一下</a>百度才知道

<br/><a target=_blank href="/view/fafa.htm">发发</ a>最佳帅哥

<br/><a target=_blank href="/view/lili.htm">丽丽</ a>最佳美女

<br/>

 

方法1: 匹配,捕获(存储)

 正则表达式:(?<=(href=")).{1,200}(?=(">))

       解释:(?<=(href=")) 表示 匹配以(href=")开头的字符串,并且捕获(存储)到分组中

               (?=(">)) 表示 匹配以(">)结尾的字符串,并且捕获(存储)到分组中

 匹配结果:

 

emoji正则 正则 ?<!_Windows

方法2: 匹配,不捕获(不存储)

 正则表达式:(?<=(?:href=")).{1,200}(?=(?:">))

       解释:(?<=(?:href=")) 表示 匹配以(href=")开头的字符串,并且不捕获(不存储)到分组中

               (?=(?:">)) 表示 匹配以(">)结尾的字符串,并且不捕获(不存储)到分组中

 匹配结果:

 

emoji正则 正则 ?<!_字符串_02

 

 

(?:pattern) 

非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。

(?=pattern)

非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

(?!pattern)

非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。

(?<=pattern)

非获取匹配,反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。

(?<!pattern)

非获取匹配,反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。这个地方不正确,有问题 

 

 

 

请问这个「 (?<=<(\w+)>).*(?=<\/\1>) 」正则表达式是什么意思呢?

----------------------------------------------------

正则表达式看懂的最好方法就是一步步分开解析:

1)以 '.*' 为分界,前面括号中的内容可以划分为 ‘?<=’ 和 ‘<(\w+)>’,其中‘<(\w+)>'表示匹配尖括号里面是字母、数字或下划线的内容,类似<span>,外面还要加个括号是要实现分组;而‘?<=’用到的是零宽断言语法,表示的是断定‘<(\w+)>’后面有或没有内容,而且与内容的间隔宽度为零。

2)再看' .* '后面的部分,括号里面的内容可以分为 ‘?=’ 和 ‘<(\/\1>’,其中‘?=’用零宽断言表示匹配‘<(\/\1>’前面的部分,而对于‘<(\/\1>’,‘\/’匹配‘/’符号,类似</span>,这里可能有些同学不太明白‘\1’是什么意思?这里用到的是捕获分组的思想,上述提到的‘<(\w+)>’外面加个小括号就表示一个分组,对于正则表达式的分组结果,索引 0表示匹配的整个内容,而1表示的是第1个子分组,所以这里的'\1'指向的就是前面的第一个分组‘<(\w+)>’,\2表示重复第2个子项,\n表示重复第n个子项;

3).* 就比较简单了,表示的是匹配 除了换行符意外的任意字符0次或多次。

综上,改表达式匹配的是类似html标签这种内容的,如<body>你好,正则!</body>