1、python里面处理正则表达式的是内置模块re,使用之前import re

2、re主要函数:

  match:默认是从头开始匹配

  search:可以从任何地方匹配

  findall:返回全部匹配数组

  sub:匹配之后,做替换操作,操作可以是一个函数

  r的作用,Python中字符串前面加上 r 表示原生字符串,正常是"\\\\n" 用r"\\n"

3、正则表达式规则

  (1)、匹配单个字符用[],[^字符]标示非某个字符就可以

  .是代表除换行外的任意字符,\d 数字,、\D 非数字,\s是\n\t\空格等空字符 ,\S 是非空字符,\w是数字、大小字母和_(包括Utf-8的其他文字字符,例如,中文字) ,\W是非\w

  (2)、多个字符,+代表最少出现一次,* 代表出现0到无限次,?代表出现一次或不出现,{m}出现m次,{m,n}出现m-n次都可以,{m,}最少m次到无限次,{,n}最多n次

  (3)、分组,用()可以对规则内的内容进行分组,后面重复时可以使用\数字替代,| 用于多个条件的Or关系

  (4)、别名(<?P=name>)  定义别名,使用 (?P=name)使用别名

  (5)、^必须以开头,必须以结尾$