python 找出最后一个匹配字符串 python find 最后一个

转载

jordana 2024-07-12 16:28:28

文章标签 python 找出最后一个匹配字符串 python findall函数字符串正则表达式反斜杠 文章分类 Python 后端开发

python 找出最后一个匹配字符串 python find 最后一个_python findall函数

什么是正则表达式

•正则表达式是字符串处理的有力工具，比字符串自身提供的方法提供了更强大的处理功能。

•例如判断一个字符串是否是合法的Email地址，可以通过构造一个规则（正则表达式），去判断字符串是否能够匹配。

正则表达式，又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本

元字符

python 找出最后一个匹配字符串 python find 最后一个_python findall函数_02

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_03

python 找出最后一个匹配字符串 python find 最后一个_python findall函数_04

python 找出最后一个匹配字符串 python find 最后一个_正则表达式_05

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_06

python 找出最后一个匹配字符串 python find 最后一个_正则表达式_07

一、导入re库

python使用正则表达式要导入re库。

import re

Python通过re模块提供对正则表达式的支持。

使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例

然后使用Pattern实例处理文本并获得匹配结果（一个Match实例）

最后使用Match实例获得信息，进行其他的操作

python 找出最后一个匹配字符串 python find 最后一个_python 找出最后一个匹配字符串_08

re.match函数

匹配成功re.match方法返回一个匹配的对象

使用group(num) 或 groups() 匹配对象函数来获取匹配表达式

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_09

python 找出最后一个匹配字符串 python find 最后一个_python 找出最后一个匹配字符串_10

re.match与re.search的区别

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None

而re.search匹配整个字符串，直到找到一个匹配

compile 函数

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用

findall

在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。

注意：

•string

•pos

•endpos

findall

python 找出最后一个匹配字符串 python find 最后一个_python findall函数_11

re.finditer

在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回

re.finditer(pattern, string, flags=0)

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_12

python 找出最后一个匹配字符串 python find 最后一个_python findall函数_13

re.split

split 方法按照能够匹配的子串将字符串分割后返回列表，它的使用形式如下

re.split(pattern, string[, maxsplit=0, flags=0])

python 找出最后一个匹配字符串 python find 最后一个_字符串_14

re.sub

sub(pattern, repl, string, count=0, flags=0)

替换函数，将正则表达式 pattern 匹配到的字符串替换为 repl 指定的字符串, 参数 count 用于指定最大替换次数

贪婪 vs 不贪婪

当重复一个正则表达式时，如用 a*，操作结果是尽可能多地匹配模式。 .* 的本质是“贪婪”的

在这种情况下，解决方案是使用不贪婪的限定符 *?、+?、?? 或 {m,n}?，尽可能匹配小的文本

python 找出最后一个匹配字符串 python find 最后一个_正则表达式_15

二、使用正则表达式步骤

1、寻找规律；

2、使用正则符号表示规律；

3、提取信息，如果每一个字符都能匹配，则匹配成功；一旦有匹配不成功的字符则匹配失败

三、正则表达式中常见的基本符号

1．点号“.”

一个点号可以代替除了换行符（n）以外的任何一个字符，包括但不限于英文字母、数字、汉字、英文标点符号和中文标点符号。

2．星号“*”

一个星号可以表示它前面的一个子表达式（普通字符、另一个或几个正则表达式符号）0次到无限次。

3．问号“?”

问号表示它前面的子表达式0次或者1次。注意，这里的问号是英文问号。

4．反斜杠“”

反斜杠在正则表达式里面不能单独使用，甚至在整个Python里都不能单独使用。反斜杠需要和其他的字符配合使用来把特殊符号变成普通符号，把普通符号变成特殊符号。如：“n”。

5．数字“d”

正则表达式里面使用“d”来表示一位数字。再次强调一下，“d”虽然是由反斜杠和字母d构成的，但是要把“d”看成一个正则表达式符号整体。

6．小括号“()”

小括号可以把括号里面的内容提取出来。

四、常见的正则表达式举例

1. .*?（匹配所有内容）

例如：'<title>(.*?)</title>' 将网页的标题爬取下来。

2、w 单词字符[A-Za-z0-9_]， "+" 匹配前一个字符1次或无限次例如：一个人的邮箱是这样的lixiaomei@qq.com，那么我们如何从一大堆的字符串把它提取出来呢？

pattern: w+@w+.com

?代表了匹配0次或者1次括号分组内的匹配内容，"()"则表示被括内容是一个分组，分组序号从pattern字符串起始往后依次排列。因为是匹配0次或1次，那么就意味着括号内的部分是可有可无的，所以这个pattern就可能匹配以上两种邮箱格式。

扩展： w+@(w+.)*w+.com 模式就更厉害了，" * " 可以匹配0次或无限次。

五、re库的核心函数

compile()函数（可有可无）

函数定义： compile（pattern， flag=0）
函数描述：编译正则表达式pattern，然后返回一个正则表达式对象。

为什么要对pattern进行编译呢？《Python核心编程》里面是这样解释的：

使用预编译的代码对象比直接使用字符串要快，因为解释器在执行字符串形式的代码前都必须把字符串编译成代码对象。

2、match()函数

函数定义： match（pattern， string， flag=0）
函数描述：只从字符串的最开始与pattern进行匹配，匹配成功返回匹配对象（只有一个结果），否则返回None。

python 找出最后一个匹配字符串 python find 最后一个_字符串_16

问题来了，为什么result1结果有这么多的东西啊？貌似最后一个才是要匹配的对象。这个要怎么提取出来呀？

别着急，我们现在得到的是匹配对象，需要用一定的方法提取，后面会在《匹配对象的方法》章节来解决这个问题，继续往下看。

3、search()函数

函数定义： search（pattern， string， flag=0）
函数描述：与match()工作的方式一样，但是search()不是从最开始匹配的，而是从任意位置查找第一次匹配的内容。如果所有的字串都没有匹配成功，返回None，否则返回匹配对象。

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_17

4、findall()函数

函数定义： findall（pattern， string [,flags]）
函数描述：查找字符串中所有出现的正则表达式模式，并返回一个匹配列表

python 找出最后一个匹配字符串 python find 最后一个_python 找出最后一个匹配字符串_18

上面同时列出了match、search、findall三个函数用法。findall与match和search不同的地方是它会返回一个所有无重复匹配的列表。如果没找到匹配部分，就返回一个空列表。六、匹配对象的方法（提取）

以上re模块函数的返回内容可以分为两种：

返回匹配对象：就是上面如 <_sre.SRE_Match object; span=(0, 5), match='12345'>这样的对象，可返回匹配对象的函数有match、search、finditer。
返回一个匹配的列表：返回列表的就是 findall。

因此匹配对象的方法只适用match、search、finditer，而不适用与findall。

常用的匹配对象方法有这两个：group、groups、还有几个关于位置的如 start、end、span就在代码里描述了。

1、group方法

方法定义：group(num=0)
方法描述：返回整个的匹配对象，或者特殊编号的字组

python 找出最后一个匹配字符串 python find 最后一个_字符串_19

再看下面的实例：

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_20

这里就需要用到我们之前提到的分组概念。

分组的意义在于：我们不仅仅想得到匹配的整个字符串，我们还想得到整个字符串里面的特定子字符串。如上例中，整个字符串是“我12345+abcde”，但是想得到 “abcde”，我们就可以用（）括起来。因此，你可以对pattern进行任何的分组，提取你想得到的内容。

2、groups方法

方法定义：groups(default =None)
方法描述：返回一个含有所有匹配子组的元组，匹配失败则返回空元组

python 找出最后一个匹配字符串 python find 最后一个_反斜杠_21

七、re模块的属性（flag）

re模块的常用属性有以下几个：

re.I: 匹配不分大小写；(常用)
re.L: 根据使用的本地语言环境通过w, W, b, B, s, S实现匹配；
re.M: ^和$分别匹配目标字符串中行的起始和结尾，而不是严格匹配整个字符串本身的起始和结尾；
re.S: “.”（点号）通常匹配除了n（换行符）之外的所有单个字符,该标记表示“.”（点号）能够匹配全部字符；（常用）
re.X: 通过反斜线转义，否则所有空格加上#（以及在该行中所有后续文字）都被忽略，除非在一个字符类中或者允许注释并且提高可读性；

python 找出最后一个匹配字符串 python find 最后一个_字符串_22

python 找出最后一个匹配字符串 python find 最后一个_正则表达式_23

注意:

如果我们定义了compile编译，需要先将flag填到compile函数中，否则填到匹配函数中会报错；如果没有定义compile，则可以直接在匹配函数findall中填写flag。

python 找出最后一个匹配字符串 python find 最后一个_字符串_24

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 实现Unicode下标符号 python下标运算

下一篇：dockMySQL重启后数据消失 sql重启数据库

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python 找出最后一个匹配字符串 python find 最后一个

python 找出最后一个匹配字符串 python find 最后一个

元字符

51CTO博客