正则基础


导入模块:import re

math方法匹配

res = re.match(正则表达式,要匹配的字符串)

  • re.match()从字符串的开始位置进行匹配,配对成功返回match对象。,没有匹配成功返回None
  • 匹配到数据,使用group方法获取数据 在这里插入图片描述

匹配单个字符

“.”——匹配任意一个字符(除了\n之外)

在这里插入图片描述

“[]”——匹配[]中列举的字符

在这里插入图片描述

  • 下图报错原因:由于没有匹配到元素,之后又调用了group()方法造成的。 在这里插入图片描述
“\d”——匹配数字

0,1,2,3,4,5,6,7,8,9 在这里插入图片描述

“\D”——匹配非数字,即不是数字

在这里插入图片描述

“\s”——匹配空白,即空格和tab键

在这里插入图片描述

“\S”——匹配非空白

在这里插入图片描述

“\w”——匹配单词字符

a-z,A-Z,0-9,_(下划线),汉字 在这里插入图片描述

“\W”——匹配非单词字符

在这里插入图片描述

匹配多个字符

“ * ” ——匹配前一个字符出现0次或无限次

在这里插入图片描述

“ + ” ——匹配前一个字符出现一次或无限次

在这里插入图片描述

“ ?” ——匹配前一个字符出现一次或0次,即要么有一次,要么没有

在这里插入图片描述

“{m}” ——匹配前一个字符出现m次

在这里插入图片描述

“{m,n}”——匹配前一个字符出现从m次到n次(m<n)

在这里插入图片描述 在这里插入图片描述

匹配开头结尾

“ ^ ” ——匹配字符串开头

^表示以什么开头,表示对什么取反。

在这里插入图片描述

^在[]外表示由[]中的各个字符开头就匹配成功

^[ab] :表示以'a'或'b'开头就匹配成功 在这里插入图片描述

“ $ ” ——匹配字符串结尾

在这里插入图片描述 在这里插入图片描述 在这里插入图片描述

不匹配

^在[]中表示不匹配

在这里插入图片描述

总结

  • ‘abc’:表示字符串开头有abc就匹配成功
  • '[abc]':表示以字符串开头有'a'或'b'或'c'就匹配成功
  • '^[abc]':表示由'a'或'b'或'c'开头就匹配成功
  • '[^abc]':表示匹配除了'a'、'b'、‘c’之外的字符

匹配分组

“ | ”——匹配左右任意一个表达式(从左到右进行匹配)

在这里插入图片描述

(ab)——括号中字符作为一个分组

在这里插入图片描述 在这里插入图片描述

\num——引用分组num匹配到的字符串

在这里插入图片描述

(?P<name>)分组起别名

(?P=name)引用别名为name分组匹配到的字符串 在这里插入图片描述