八爪鱼采集器是一款免费的、直观的、稳定的网络采集数据的软件,它不需要学习编程语言,也不需要搭建大数据采集集群平台,可以无代码,可视化地实现网页大数据的抓取。零基础的大数据采集小白,使用八爪鱼就可以轻轻松松直接上手采集数据。八爪鱼有两种模式的数据采集,分别是【使用模板任务采集数据】和【自定义任务采集数据】。
1. 使用模板任务采集数据
八爪鱼【采集模板采集数据】是由八爪鱼官方提供的一些现成的采集数据模板,有部分模版,可以免费试用。
- 启动八爪鱼采集软件
(2)单击左侧导航栏内的【模板】图标,切换到【采集模板】页面,可以输入关键词搜索模板,选择【筛选条件】、【综合排序】,找到采集数据的相应模板。在【采集模板】页面【输入框】中,输入目标网站名称,八爪鱼自动寻找相关的采集模板。如果没有找到符合自己要求的模板,可以进入【采集模板】页面,在搜索栏内输入:新模板,出现【我想要新模板】,单击【我想要新模板】,填写【我想要新模板】的表单,填写选项【想要采集的网址】、采集需求等提交,系统就会根据你提交的需求制作新的模板。
(3)使用模板
在采集模板下拉窗口或者搜索关键词“免费”,如图1-8所示;找到【京东商品详情采集】,单击【查看详情】。
2. 自定义任务采集数据
打开采集页面开始窗口,单击【新建自定义任务】,出现如图1-12所示的【新建自定义任务】页面。通过在【任务组】文本栏内输入“数据采集项目1”(自行输入),设置【新建任务组】;在采集网址栏内输入网址,可以有手动输入、从文件导入、从任务导入、批量生成等方法输入采集网址。例如手动输入京东网址:https://www.jd.com/,会有向导按照采集流程,引导自动进行网站上数据的采集。