# yyds干货盘点 # 这段网上的文字，我为什么爬下来是乱码？

关注 Python进阶者

文章目录

一、前言
二、实现过程
三、总结

# yyds干货盘点 # 这段网上的文字，我为什么爬下来是乱码？

原创

Python进阶者 2024-02-05 17:44:32 博主文章分类：Python那些事儿 ©著作权

文章标签 Python Python基础 Python入门 Python教程 Python应用 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者Python进阶者的原创作品，请联系作者获取转载授权，否则将追究法律责任

大家好，我是皮皮。

一、前言

前几天在Python白银交流群【上海新年人】问了一个Python网络爬虫文字乱码的问题。代码如下：

url = 'https://www.fwsir.com/Article/html/Article_20230101085126_2180223.html'
heades = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
r = requests.get(url=url,headers=heades).text
r.encode('utf-8')
soup = BeautifulSoup(r,'html.parser')
s1 = soup.select('div.content>p')
for i in s1:
    print(i.get_text())

二、实现过程

这个问题其实很常见，之前的文章里边也有写过多次了，这里【甯同学】给了一个提示：如下所示：

# yyds干货盘点 # 这段网上的文字，我为什么爬下来是乱码？_Python

【磐奚鸟🐦】给出了实战截图，上述代码确实好使。

# yyds干货盘点 # 这段网上的文字，我为什么爬下来是乱码？_Python入门_02

后来【瑜亮老师】也补充了下爬虫知识，如下图所示：

# yyds干货盘点 # 这段网上的文字，我为什么爬下来是乱码？_Python基础_03

顺利地解决了粉丝的问题。

如果你也有类似这种数据分析或者Python网络爬虫的小问题，欢迎随时来交流群学习交流哦，有问必答！

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Python网络爬虫文字乱码的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【上海新年人】提出的问题，感谢【甯同学】、【磐奚鸟🐦】、【瑜亮老师】给出的思路，感谢【莫生气】、【冯诚】等人参与学习交流。

【提问补充】温馨提示，大家在群里提问的时候。可以注意下面几点：如果涉及到大文件数据，可以数据脱敏后，发点demo数据来（小文件的意思），然后贴点代码（可以复制的那种），记得发报错截图（截全）。代码不多的话，直接发代码文字即可，代码超过50行这样的话，发个.py文件就行。

# yyds干货盘点 # 这段网上的文字，我为什么爬下来是乱码？_Python基础_04

赞
收藏
评论
分享
举报

上一篇：# yyds干货盘点 # 盘点一个txt文档合并的实战需求（方法三）

下一篇：# yyds干货盘点 # Pandas中想剔除字符串中的【第】和【批】这两个字如何做？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册