python 正则所有匹配 python re正则匹配

转载

lingyuli 2023-06-09 16:00:11

文章标签 python 正则所有匹配正则表达式 python 学习字符串 文章分类 Python 后端开发

re模块

Python自带了匹配字符串的模块re，我们可以通过该模块对字符串进行（模糊）匹配，提取出我们需要的内容。

re模块中很多功能都是基于正则表达式实现的。正则表达式是一种特殊的字符序列，它能帮助我们去检查字符串是否与某种模式相匹配。

常用方法

1、re.compile(pattern, flags=0)

将正则表达式编译成正则对象，搭配match、search、findall等等进行匹配。

import re



prog = re.compile('[abc]') # 匹配字符集abc与字符串匹配的第一个字符。

print(prog.search('abcd').group()) # a

2、re.match(pattern, string, flags=0)

从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。

import re



# \w 用来匹配单次字符 包括a-z A-Z 0-9  _

r = re.match('h\w+', 'how are you')

# 获取匹配到的结果

print(r.group())   # how

r = re.match('h(\w+)', 'how are you')

# groups 获取模型中匹配到的结果，返回匹配到的字符串的分组部分

print(r.groups())  # ('ow',)



# 引用别名word1、word2,它们相当于key，value就是匹配到的内容。

r = re.match('(?P<word1>h)(?P<word2>\w+)', 'how are you')

print(r.group()) # how

print(r.groups()) # ('h', 'ow')

print(r.groupdict()) # {'word1': 'h', 'word2': 'ow'}

3、re.search(pattern, string, flags=0)

扫描整个字符串，返回第一个成功的匹配，如果匹配失败，返回None。

import re



# \w 用来匹配单次字符 包括a-z A-Z 0-9  _

r = re.search('a\w+', 'how are you')

# 获取匹配到的结果

print(r.group())   # are

r = re.search('a(\w+)', 'how are you')

# groups 获取模型中匹配到的结果，返回匹配到的字符串的分组部分

print(r.groups())  # ('re',)



# 引用别名word1、word2,它们相当于key，value就是匹配到的内容。

r = re.search('(?P<word1>a)(?P<word2>\w+)', 'how are you')

print(r.group()) # are

print(r.groups()) # ('a', 're')

print(r.groupdict()) # {'word1': 'a', 'word2': 're'}

4、re.findall(pattern, string, flags=0)

以string列表形式返回string中pattern的所有非重叠匹配项。从左到右扫描该字符串，并以找到的顺序返回匹配项。如果该模式中存在一个或多个组，则返回一个组列表；否则，返回一个列表。如果模式包含多个组，则这将是一个元组列表。空匹配项包含在结果中。

import re



# 匹配包含所有带有o的单次

r= re.findall('\wo\w+', 'how are you')

print(r) # ['how', 'you']



# * 前的字符可以是0个或者多个。返回list

r = re.findall('好*', '你好吗？我很好。你好才是真的好。你好好了')

print(r) # ['', '好', '', '', '', '', '好', '', '', '好', '', '', '', '', '好', '', '', '好好', '', '']

r = re.findall('你好*', '你好吗？我很好。你好才是真的好。你好好了')

print(r) # ['你好', '你好', '你好好']



# + 用于匹配字符一次或者多次

r = re.findall('好+', '你好吗？我很好。你好才是真的好。你好好了')

print(r) # ['好', '好', '好', '好', '好好']

r = re.findall('你好+', '你好吗？我很好。你好才是真的好。你好好了')

print(r) # ['你好', '你好', '你好好']



# $ 用来匹配结尾

r = re.findall('测试$', '测试小姐姐还没对象')

print(r) # []

r = re.findall('测试$', '小姐姐我的代码还没测试')

print(r) # ['测试']



# ^ 用来匹配开始

r = re.findall('^小姐姐', '小姐姐我的代码还没测试')

print(r) # ['小姐姐']



# ^ 用于字符集中表示取反

# 匹配所有除字母外的字符

r = re.findall('[^a-z]', '123abcde789')

print(r) # ['1', '2', '3', '7', '8', '9']

5、re.split(pattern, string, maxsplit=0, flags=0)

split能够按照所能匹配的字串将字符串进行切分，返回切分后的字符串列表

import re



# 按照；或者， 对字符串进行分割

r = re.split('[;,]', 'abc,qwer; opq, mn')

print(r) # ['abc', 'qwer', ' opq', ' mn']

以上仅演示了部分正则的语法，更多正则语法可以参考下表。

python 正则所有匹配 python re正则匹配_正则表达式

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：springboot hive springboot hive分区

下一篇：typescript参数红线 typescript go

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯