python语言的自学之路3

原创

文先生爱学习 2017-08-12 13:15:54 博主文章分类：入门基础 ©著作权

文章标签 Python python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者文先生爱学习的原创作品，请联系作者获取转载授权，否则将追究法律责任

正则匹配里面方法分为两种使用方法：

方法1：

import re

str = ‘i am a bad hero'

re.search(‘am’,str)

re.match(‘am’,str)

re.findall(‘am’,str)

re.finditer(‘am’,str)

方法2:

import re

str = ‘i am a bad hero’

pat = re.compile(r‘am’) #r的意思是原生字符串

pat.match(str)

方法区别在于，当多次使用相同的匹配规则时，方法2由于compile已经缓存了匹配规则，所以执行多次的效率高于方法1.

原生字符串

假如你需要匹配文本中的字符"\"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\”，

Python里的原生字符串很好地解决了这个问题，这个例子中的正则表达式可以使用r"\\”表示，匹配一个数字的"\\d"可以写成r"\d"。

re.compile(strPattern[, flag]):

这个方法是Pattern类的工厂方法，用于将字符串形式的正则表达式编译为Pattern对象。

第二个参数flag是匹配模式，取值可以使用按位或运算符'|'表示同时生效，比如re.I | re.M。

另外，你也可以在regex字符串中指定模式，

比如re.compile('pattern', re.I | re.M)与re.compile('(?im)pattern')是等价的。

可选值有：

re.I(全拼：IGNORECASE): 忽略大小写（括号内是完整写法，下同）

re.M(全拼：MULTILINE): 多行模式，改变'^'和'$'的行为（参见上图）

re.S(全拼：DOTALL): 点任意匹配模式，改变'.'的行为

re.L(全拼：LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定

re.U(全拼：UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性

re.X(全拼：VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释

以下两个正则表达式a和b是等价的：

a = re.compile(r"""\d + # the integral part

\. # the decimal point

\d * # some fractional digits""", re.X)

b = re.compile(r"\d+\.\d*")

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯