有时候面对下面这个示例文本的整理时,使用正则表达式去除不需要的内容,往往高效简洁
text='<p>你好</p>'
正则表达式库中有一个sub
的函数,用于实现强大的替换功能。下面先来看一下帮组文档中的具体参数。
sub(pattern, repl, string, count=0, flags=0)
pattern:正则表达式
repl:替换成的字符串
string:需要匹配的字符串
count:匹配次数(需要修改前多少个)
flags: 修饰符
下面给出实例:
import re
text = '<p>你好1</p><p>你好2</p><p>你好3</p>'
text_1 = re.sub(r'<.*?>','',4)
print(text_1)
>>>'你好1你好2<p>你好3</p>'