刀不用,久了就会生锈,regex久了没有使用,就会遗忘一点,下面总结一下regex的几个关键点:
1. .不是全部字符,它无法匹配\n ,所以使用时必须这样:
- val dirtyString = "<td>fuck\n\nyour sis</td><td>hehe!!</td>"
- val handlePattern=new Regex("(<td>(?:.|\n)*?</td>)","td1")
- val result=handlePattern.replaceAllIn(dirtyString,(m:Match)=>{
- m.group("td1").replace("\n","<br />")+"SUN"
- })
- println(result)
- //<td>fuck<br /><br />your sis</td>SUN<td>hehe!!</td>SUN
规则的标签都得这么匹配,才能在标签内部有\n时不出错。
2.思考久了,我们就会犯困
我一直在思考怎么样在正则表达式中添加一个条件,让td标签中间不要出现</td>,而这根本就没有意义。尽管最后我想出了一个表达式,但最终 val handlePattern=new Regex("(<td>(?!<td>|</td>)*?</td>)","td1")也没有成功!