1.有个坑 re.sub('[^\w]', ' ', 'hello world, get rid of comma')   --> [^\w] 非字符的意思

[^abc] 匹配除了a,b,c之外的字符

import re
text_string = re.sub(r'([^\s\w]|_|[0-9])+',''," I 3   _ I  3 ? _ love you")
print (text_string)
I     I     love you

 

用一个例子来演示会更加清晰