js 正则匹配（去掉html标签）

转载

mb5fdb12e4adbb2 2011-08-02 19:34:00

1，得到网页上的链接地址：

string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";

2，得到网页的标题：

string matchString = @"<title>(?<title>.*)</title>";

3，去掉网页中的所有的html标记：

string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档

4, string matchString = @"<title>([\S\s\t]*?)</title>";

5,js去掉所有html标记的函数：

function delHtmlTag(str)

{

return str.replace(/<[^>]+>/g,"");//去掉所有的html标记

}

完

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客