五月总结

原创

xinchaolei 2021-12-15 10:52:23 博主文章分类：爬虫 ©著作权

©著作权归作者所有：来自51CTO博客作者xinchaolei的原创作品，请联系作者获取转载授权，否则将追究法律责任

反爬虫的主要手段及处理方法

1， Headers限制

添加headers，通过按浏览器的F12，找到对应的header

2， IP限制

通过添加代理解决

3，动态加载

通过js的分析，或者模拟动态加载

4，验证码

图片识别技术，牵扯到python高级

5，减少返回的信息

返回的信息被偷掉

6，返回伪造的信息

返回的信息被编码过，要通过解码

7，通过robots.txt来限制爬虫

8，通过cookie限制抓取信息

9，通过js渲染，隐藏真实地址信息，ajax请求

10， 登陆的账号密码进行加密，通常存放在js中

11， 绑定一个IP，请求只能以绑定的ip请求

12，页面保存在图片中，图片混在js中

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯