刀不用,久了就会生锈,regex久了没有使用,就会遗忘一点,下面总结一下regex的几个关键点:

1.  .不是全部字符,它无法匹配\n ,所以使用时必须这样:

     

  1. val dirtyString = "<td>fuck\n\nyour sis</td><td>hehe!!</td>" 
  2.  val handlePattern=new Regex("(<td>(?:.|\n)*?</td>)","td1") 
  3.  val result=handlePattern.replaceAllIn(dirtyString,(m:Match)=>
  4.        m.group("td1").replace("\n","<br />")+"SUN" 
  5.  }) 
  6.  println(result) 
  7. //<td>fuck<br /><br />your sis</td>SUN<td>hehe!!</td>SUN

规则的标签都得这么匹配,才能在标签内部有\n时不出错。

2.思考久了,我们就会犯困

我一直在思考怎么样在正则表达式中添加一个条件,让td标签中间不要出现</td>,而这根本就没有意义。尽管最后我想出了一个表达式,但最终 val handlePattern=new Regex("(<td>(?!<td>|</td>)*?</td>)","td1")也没有成功!