下面通过几个案例来分析一下,
注意:本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程》
案例一:
>>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
['断魔归本合元神']
>>> parsematch(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配,匹配情况:
匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
匹配子串group(1): 断魔归本合元神,位置为:(12, 19)
>>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
['断魔归本合元神']
案例二:
>>> re.findall("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
['神', '']
>>> parsematch("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配,匹配情况:
匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
匹配子串group(1): 神,位置为:(18, 19)
第2次匹配,匹配情况:
匹配子串group(0): ,位置为:(19, 19)
案例三:
>>> re.findall(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
['第二回 悟彻菩提真妙理\u3000断魔归本合元神', '']
>>> parsematch(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配,匹配情况:
匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
第2次匹配,匹配情况:
匹配子串group(0): ,位置为:(19, 19)
>>>
案例四:
>>> re.findall(r"(.*) (.*) (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
[('第二回', '悟彻菩提真妙理', '断魔归本合元神')]
>>>
上述4个案例的前2个案例,在第一次匹配存在group(1)的情况下,findall中返回的第一个元素为group(1)的匹配子串,而group(0)的数据没有在findall中返回,而3个案例的第2次匹配以及第3个案例的第1次匹配都只有group(0),此时findall返回的就是group(0)的整体搜索串,第4个案例返回的是group(1,2,3)。