python 正则反向引用 python 正则 \w

转载

hackernew 2023-06-09 18:47:57

文章标签 python 正则反向引用正则表达式 python 字符串下划线 文章分类 Python 后端开发

\d：匹配一个数字
\w：可以匹配一个字母或数字,以及下划线
.：可以匹配任意字符
*：表示任意个数目（包括0个）
+：表示至少一个
?：表示0个或1个
{n}：表示n个
{m：n}：表示第m-n个

可以用[]表示范围：[0-9a-zA-Z_]+可以匹配至少由一个数字、字母或者下划线组成的字符串
A|B：可以匹配A或B，如(P|p)ython可以匹配’Python’或者’python’。
^表示行的开头 ^\d表示必须以数字开头。
$表示行的结束，\d$表示必须以数字结束。

贪婪匹配

正则匹配默认是贪婪匹配，也就是默认匹配尽可能多的字符串

>>> re.match(r'^(\d+)(0*)$', '102300').groups()
	('102300', '')

(\d+)把数字都匹配完了，(0)*只能匹配空字符串

加个?可以让(\d+)采用非贪婪匹配

>>> re.match(r'^(\d+?)(0*)$', '102300').groups()
('1023', '00')

编译

使用正则表达式的时候，re模块内部会做俩件事。

1.编译正则表达式，如果正则表达式的字符串本身不合法，会报错；

2.用编译后的正则表达式去匹配字符串。

如果一个正则表达式要重复使用几千次，出于效率的考虑，可以预编译该正则表达式，接下来重复使用时就不需要编译这个步骤了，直接匹配：

>>> import re
# 编译:
>>> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用：
>>> re_telephone.match('010-12345').groups()
('010', '12345')
>>> re_telephone.match('010-8086').groups()
('010', '8086')

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 必须遍历吗 python中的遍历结构

下一篇：jsp传值javascript jsp传值给后端

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python 正则 反向引用 python 正则 \w

python 正则 反向引用 python 正则 \w

贪婪匹配

编译

51CTO博客

python 正则反向引用 python 正则 \w

python 正则反向引用 python 正则 \w