python正则非贪婪匹配

原创

mob649e81597922 2023-09-11 05:00:25 ©著作权

©著作权归作者所有：来自51CTO博客作者mob649e81597922的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python正则表达式的贪婪匹配与非贪婪匹配

正则表达式是一种强大的文本匹配工具，它可以在文本中查找、替换符合特定模式的字符串。在使用正则表达式时，有一个重要的概念就是贪婪匹配和非贪婪匹配。

1. 贪婪匹配

贪婪匹配是指正则表达式尽可能多地匹配符合条件的字符串。例如，我们有一个字符串 "abbbc" ，用正则表达式 ab*c 来匹配这个字符串，结果会是整个字符串 "abbbc" 被匹配上。这是因为正则表达式中的 * 是贪婪匹配的，它会尽可能多地匹配前面的字符。

让我们来看一个例子，在Python中使用re模块来进行贪婪匹配：

import re

text = "abbbc"
pattern = "ab*c"

result = re.match(pattern, text)  # 使用match方法进行匹配

print(result.group())  # 输出匹配的结果

代码输出的结果为 "abbbc"，即整个字符串都被匹配上了。

2. 非贪婪匹配

非贪婪匹配是指正则表达式尽可能少地匹配符合条件的字符串。在正则表达式中，我们可以在量词后面加上 ? 来实现非贪婪匹配。例如，我们有一个字符串 "abbbc" ，用正则表达式 ab*?c 来匹配这个字符串，结果会是 "abc" 被匹配上。这是因为正则表达式中的 *? 是非贪婪匹配的，它会尽可能少地匹配前面的字符。

让我们来看一个例子，在Python中使用re模块来进行非贪婪匹配：

import re

text = "abbbc"
pattern = "ab*?c"

result = re.match(pattern, text)  # 使用match方法进行匹配

print(result.group())  # 输出匹配的结果

代码输出的结果为 "abc"，即只有 "abc" 被匹配上了。

3. 贪婪匹配和非贪婪匹配的对比

贪婪匹配和非贪婪匹配在某些情况下会产生不同的结果。让我们来看一个例子，有一个字符串 "abbbcabc" ，我们用正则表达式 ab*c 来匹配这个字符串。

import re

text = "abbbcabc"
pattern = "ab*c"

result = re.findall(pattern, text)  # 使用findall方法进行匹配

print(result)

代码输出的结果为 ['abbbc', 'abc']，即整个字符串被贪婪匹配。如果我们想要只匹配到 "abc"，则可以使用非贪婪匹配。

import re

text = "abbbcabc"
pattern = "ab*?c"

result = re.findall(pattern, text)  # 使用findall方法进行匹配

print(result)

代码输出的结果为 ['abc', 'abc']，即只有 "abc" 被非贪婪匹配。

4. 贪婪匹配和非贪婪匹配的原理

贪婪匹配和非贪婪匹配的原理是正则表达式引擎从左到右扫描文本，并尽可能多（或尽可能少）地匹配符合条件的字符串。在贪婪匹配中，当匹配到一个符合条件的字符时，正则表达式引擎会尽可能多地匹配，直到无法匹配为止。而在非贪婪匹配中，当匹配到一个符合条件的字符时，正则表达式引擎会尽可能少地匹配，直到满足条件为止。