有时候面对下面这个示例文本的整理时,使用正则表达式去除不需要的内容,往往高效简洁

text='<p>你好</p>'

正则表达式库中有一个sub的函数,用于实现强大的替换功能。下面先来看一下帮组文档中的具体参数。

sub(pattern, repl, string, count=0, flags=0)
    pattern:正则表达式
    repl:替换成的字符串
    string:需要匹配的字符串
    count:匹配次数(需要修改前多少个)
    flags: 修饰符

下面给出实例:

import re
text = '<p>你好1</p><p>你好2</p><p>你好3</p>'
text_1 = re.sub(r'<.*?>','',4)
print(text_1)
>>>'你好1你好2<p>你好3</p>'