今天下午,心血来潮想要爬取一个网页的文本

分别使用了xpath和bs都不行

最后使用正则,还是不行

万般无奈之下,想到是不是因为编码问题?

把下载的网页文件删掉后,直接从网页源码复制粘贴到一个新文件

 

然后,一切都解决了!

 

一切都解决的!!!

我...........