scrapy爬虫，学习资料分享

原创

代码小生 2021-08-11 15:47:05 ©著作权

文章标签 python 资料分享微信 ide java 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者代码小生的原创作品，请联系作者获取转载授权，否则将追究法律责任

这也是之前群友所需要的资料，一直按照顺序在分享，但这速度方面还是供不应求啊。

看看读者所需要的资料还有那些没有被分享呢？

scrapy爬虫，学习资料分享_ide

截至目前，读者所需资料

小编有可能会漏掉，如果上图没有你所需要的资料，那么请留言或者加小编微信codingSmart，随时私信我说明都可以的。

今天的干货

scrapy爬虫，学习资料分享_python_02

scrapy爬虫，学习资料分享_ide_03

这套教程应该是很不错的了

这份资料主要包括两大内容：第一是 Python爬虫，第二是 scrapy框架爬虫，其余的小编不过多解释，里面都是有内容的，具体可根据自己的需要来查看。

获取方式：

小编打算维护一个 Python 群，没有广告的那种。所以小编想大概需要这份资料的朋友都是做 Python 的吧，或者至少对 Pyhton 感兴趣应该没错。

Scrapy简介

Scrapy，Python开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架，任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，最新版本又提供了web2.0爬虫的支持。

Scrap，是碎片的意思，这个Python的爬虫框架叫 Scrapy。

相关书籍

《精通Scrapy网络爬虫》是2017年清华大学出版社出版的图书，作者是刘硕。

本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章，从逻辑上可分为基础篇和高级篇两部分，基础篇重点介绍Scrapy的核心元素，如spider、selector、item、link等；高级篇讲解爬虫的高级话题，如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等，并配合项目案例讲解，包括供练习使用的网站，以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富，注重实践，代码注释详尽，适合有一定Python语言基础，想学习编写复杂网络爬虫的读者使用。

如果你有空闲的业余时间，不防学一学爬虫，也许有意外收获。

scrapy爬虫，学习资料分享_python_04