正则表达式是可匹配文本片段的模式,一个正则表达式指定了一个与之匹配的字符串集合。最简单的正则表达式为普通字符串,与它自己匹配。如正则表达式’python’与字符串’python’匹配。通过匹配,可以在文本中查找模式对应的字符串,或将满足特定模式的字符串替换为新的字符串,以及将文本分割成片段。

正则表达式包含普通或者特殊字符,普通字符匹配自身,这是正则表达式的一种匹配模式:字符匹配,而特殊字符一般不匹配自身,如果要匹配自身需要用转义符转义表示匹配自身而不是作为特殊规则。re模块包括的特殊字符包括:: [ ]. ^ $ * + ? { } \ | :( ),它们的匹配规则含义在后面将逐一介绍。

Python为了支持正则表达式,专门提供了re模块来支持。re模块包含了正则表达书处理的函数,通过这些函数就可以实现正则表达式搜索特定模式文本的功能。下面我们将学习re模块对正则表达式处理的一些支撑函数及正则表达式的一些基本概念。