Python正则表达式re.findall一个有趣的现象

转载

mb5fd340b104967 2019-08-24 15:26:00

文章标签 子串正则表达式数据学python javascript 文章分类 代码人生

下面通过几个案例来分析一下，

注意：本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程》

案例一：

>>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
['断魔归本合元神']
>>> parsematch(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配，匹配情况:
    匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为：(0, 19)
    匹配子串group(1): 断魔归本合元神,位置为：(12, 19)
>>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
['断魔归本合元神']

案例二：

>>> re.findall("(.)*",'第二回 悟彻菩提真妙理　断魔归本合元神')
['神', '']
>>> parsematch("(.)*",'第二回 悟彻菩提真妙理　断魔归本合元神')
第1次匹配，匹配情况:
    匹配子串group(0): 第二回 悟彻菩提真妙理　断魔归本合元神,位置为：(0, 19)
    匹配子串group(1): 神,位置为：(18, 19)
第2次匹配，匹配情况:
    匹配子串group(0): ,位置为：(19, 19)

案例三：

>>> re.findall(".*",'第二回 悟彻菩提真妙理　断魔归本合元神')
['第二回 悟彻菩提真妙理\u3000断魔归本合元神', '']
>>> parsematch(".*",'第二回 悟彻菩提真妙理　断魔归本合元神')
第1次匹配，匹配情况:
    匹配子串group(0): 第二回 悟彻菩提真妙理　断魔归本合元神,位置为：(0, 19)
第2次匹配，匹配情况:
    匹配子串group(0): ,位置为：(19, 19)
>>>

案例四：

>>> re.findall(r"(.*) (.*) (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
[('第二回', '悟彻菩提真妙理', '断魔归本合元神')]
>>>

上述4个案例的前2个案例，在第一次匹配存在group（1）的情况下，findall中返回的第一个元素为group（1）的匹配子串，而group（0）的数据没有在findall中返回，而3个案例的第2次匹配以及第3个案例的第1次匹配都只有group（0），此时findall返回的就是group（0）的整体搜索串，第4个案例返回的是group（1,2,3）。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。