介绍一款好用又易学的爬虫工具：web scraper

原创

AiuTools 2024-04-24 10:04:49 博主文章分类：爬虫 ©著作权

文章标签 浏览器插件谷歌插件爬虫 web scraper 工具 文章分类 JavaScript 前端开发

©著作权归作者所有：来自51CTO博客作者AiuTools的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

web scraper

简介：

优点
缺点

下载地址：
操作
安装

谷歌浏览器
火狐浏览器

使用说明

web scraper

简介：

Web Scraper分为chrome插件和云服务两种，云服务是收费的，chrome插件是免费的，这里说的就是chrome插件这种。
Web Scraper插件，可以让你以“所见即所得”的方式挑选要提取的网页数据，形成模版，以后可以随时执行该模版，并且执行结果可以导出成Csv格式。
web scraper 比较类似selenium和火车头浏览器，不过web scraper功能要少的多，不过更加小巧，学习成本更低

优点

抓取需要登录的数据较方便，因为这个插件是运行在浏览器上的。
只要抓取频率慢一点，被网站屏蔽的概率较小，也因为是浏览器的原因，这就像是真实的用户访问一样。
学习成本低

缺点

好像并不能做验证码识别
抓取效率较低，相对于爬虫程序来说，Web scraper没法大并发，快速切换IP等，所以大量级的数据抓取用Web Scrpaer不适合，慢慢抓大几千网页还是可以。
插件本身是不支持配置定时任务的，云服务提供了这种功能，不过是收费的，到是可以尝试使用Python驱动谷歌来进而来操作web scraper的定时