python 正则表达式

原创

fox64194167 2022-08-01 20:35:31 博主文章分类：python ©著作权

©著作权归作者所有：来自51CTO博客作者fox64194167的原创作品，请联系作者获取转载授权，否则将追究法律责任

1. sub 来删除匹配到的东西

#去除标签

s = "<div>\
<p>岗位职责：</p>\
<p>完成推荐算法、数据统计、接口、后台等服务器端相关工作</p>\
<p><br></p>\
<p>必备要求：</p>\
<p>良好的自我驱动力和职业素养，工作积极主动、结果导向</p>\
<p> <br></p>\
<p>技术要求：</p>\
<p>1、一年以上 Python 开发经验，掌握面向对象分析和设计，了解设计模式</p>\
<p>2、掌握HTTP协议，熟悉MVC、MVVM等概念以及相关WEB开发框架</p>\
<p>3、掌握关系数据库开发设计，掌握 SQL，熟练使用 MySQL/PostgreSQL 中的一种<br></p>\
<p>4、掌握NoSQL、MQ，熟练使用对应技术解决方案</p>\
<p>5、熟悉 Javascript/CSS/HTML5，JQuery、React、Vue.js</p>\
<p> <br></p>\
<p>加分项：</p>\
<p>大数据，数理统计，机器学习，sklearn，高性能，大并发。</p>\
</div> "

p = r"</?\w+>"
print(re.sub(p, "", s))

</? 中的/?表示匹配0个或者1次/, 可以匹配< 和</
\w+ 表示匹配一次或多次字符

2. split

正则表达式的分割

#-*- coding:utf-8 -*-
import re

#提取出单词
s3 = "hello world ha ha"
print(re.split(r" +", s3))

line = "abc aa;bb,cc | dd(xx).xxx 12.12'    xxxx"  
re.split(r'[;,\s]',line)  
#用[]来建立自己的字符分类,\s是空格
#结果
['abc', 'aa', 'bb', 'cc', '|', 'dd(xx).xxx', "12.12'", 'xxxx']

3. findAll

#-*- coding:utf-8 -*-
import re

#提取出单词
s3 = "hello world ha ha"
#\b表示单词边界符\bw+\b 表示匹配一个单词
print(re.findall(r"\b\w+\b", s3))

上一篇：python 找不同 Find the Difference

下一篇：mongo 数据备份用户名加密码

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯