最简单的免费采集器——易数云采集器

为什么说易数云采集器简单呢?这个采集器已经包含有大量的采集规则,对于小白来说简直是轻松上手而且当前采集器还属于迭代中客服非常的认证几乎达到一对一服务,当前采集器拥有的功能:1、数据可视化 2、多任务多服务器并行 3、定时自动任务 4、自定义爬取规则
话不多说直接进入正题。。。。。。。。。
采集器下载链接:http://cloud.yisurvey.com/
先说明才软件还属于迭代中,所以有用户下载不了可以留言我给你们安装包

打开采集器的界面是这样:

zabbix 采集器 rds 采集器配置软件_zabbix 采集器 rds

大家可以自行注册登录登录之后的界面如下:

zabbix 采集器 rds 采集器配置软件_mysql_02


接下来就是操作步骤

先在自己的浏览器找到自己想要爬取的界面url再点击项目列表(这里以贝壳找房为例)1、点击进去在左上角可以看到添加项目按钮,点击添加项目

zabbix 采集器 rds 采集器配置软件_node.js_03


2、弹出相应添加项目的对话框,输入自己想要描述即可

zabbix 采集器 rds 采集器配置软件_zabbix 采集器 rds_04


3、将会弹出一个配置规则的窗口

zabbix 采集器 rds 采集器配置软件_zabbix 采集器 rds_05


4、接下来教大家如何让配置,只是重点(先把自己要的网页复制下来)

点击添加步骤 》点击循环 》点击URL列表 》将你的url复制到下面文本框中》点击确定(文本框可以填多个网址,使用循环就是当你想爬取多个网址的时候能起到循环每个url作用)

zabbix 采集器 rds 采集器配置软件_zabbix 采集器 rds_06


确定之后会弹出你要爬取的界面图

zabbix 采集器 rds 采集器配置软件_zabbix 采集器 rds_07


5、现在打开了网址,需要循环网页的每一个房子信息列表(就是可以这样想一个有很多盒子的柜子,网页就是柜子,每一个房源就是小盒子,我们要拿小盒子的东西当然需要一个个盒子打开啦)
在打开网页那里点击添加步骤》点击循环》点击不固定元素列表==》点击获取不固定列表==》弹出一个新的对话框,在新的对话框点击点击第一个元素==》弹出新的对话框,在新对话框点击点击网页元素==》点击扩大范围将整个列表(盒子)包含,第二个元素一样这样获取==》再点击获取元素==》点击确认==》再点击循环对话框的确认即可

zabbix 采集器 rds 采集器配置软件_javascript_08

zabbix 采集器 rds 采集器配置软件_node.js_09


zabbix 采集器 rds 采集器配置软件_javascript_10

zabbix 采集器 rds 采集器配置软件_javascript_11


6、弹出当前界面,双击提取数据即可

zabbix 采集器 rds 采集器配置软件_https_12

会出现如下界面:

zabbix 采集器 rds 采集器配置软件_node.js_13


7、添加自己想要抓取的数据

点击添加==》弹出新的对话框,在新的点击点击元素==》点击确认==》在字段名修改字段名==》接着自己根据自己需求多添加几个==》点击确定

zabbix 采集器 rds 采集器配置软件_https_14

zabbix 采集器 rds 采集器配置软件_node.js_15


8、最后一步点击启动爬虫(启动前考虑循环是否要给点延时免得攻击人家太狠)==》点击运行

zabbix 采集器 rds 采集器配置软件_node.js_16

总结对于翻页啊那些功能就是添加循环,不会的可以扣我。中间可能看得费劲,不过绝对是最详细的解说啦,记得好的话点赞,谢谢!