简介

这一学期我讲授的课程之一是《电子商务数据分析》,本人介绍数据采集器时发现多款工具都使用到XPath工具。结论是:这是一个同学们难以绕过的槛——尽管此前不少班级已经开设过网页制作甚至是网站建设等前导课程。于是,先把这个工具的安装及入门用法记录在此,后续再补充这个工具及XPath语法的详细知识。

下载与安装插件

【前提】由于Chrome浏览器插件安装的局限性,所以我选择使用Firefox——事实上随着版本的升级,Firefox与Chrome从外观到功能各方面已经不差上下了。

安装Firefox浏览器是很简单的,直接到官网下载后安装即可(不建议到其他地方下载,以免安装其他的乱七八糟的灰色软件)。在此从略。

经网络搜索与分析发现:Ruto的XPath Finder插件非常优秀,使用极其简易,适合入门同学学习。于是,决定选择安装它。

步骤如下:

【1】使用如下图所示操作找到启动插件面板界面。

数据采集器实战|Firefox插件XPath Finder_firefox

随后出现【扩展和主题】界面,如下图:

数据采集器实战|Firefox插件XPath Finder_右键_02

在右上角搜索框中输入关键词“XPath Finder"后回车即可找到目标插件(也叫扩展)。

数据采集器实战|Firefox插件XPath Finder_firefox_03

点击上图中框出的插件(其实第一个也不错!),即跳转到这个插件的安装与说明界面,如下图:

数据采集器实战|Firefox插件XPath Finder_右键_04

点击按钮【添加到Firefox】后,上方弹出一个小窗口,再点击其中的【添加】即可轻松安装插件。

注意到,正确安装后的浏览器右上角的插件图标如图中所标记的:

数据采集器实战|Firefox插件XPath Finder_firefox_05


基本用法

【1】打开目标页面,定位到要查找其XPath表达的方式的目标元素,如图标记出的:

数据采集器实战|Firefox插件XPath Finder_安装插件_06

【2】在上图目标元素上单击鼠标右键,在快捷菜单中选择【Add to Ruto】命令:

数据采集器实战|Firefox插件XPath Finder_右键_07

这一步的作用是此标记有关信息即被扩展记录下来并进行XPath表达的分析。

【3】(左键)单击浏览器右上方XPath插件图标即出现我们需要的XPath表达式(如图),然后通过【Copy】按钮复制,再粘贴到目标文件中即可。

数据采集器实战|Firefox插件XPath Finder_安装插件_08

注意!!!

默认状态下,第一次点击插件图标时显示如下(【Off】状态):

数据采集器实战|Firefox插件XPath Finder_安装插件_09

根据开发者说明,如下图:

数据采集器实战|Firefox插件XPath Finder_安装插件_10

似乎是默认情况下,在目标元素通过右键菜单”Add to Ruto“即可捕获到XPath数据。但是,我试用(浏览器与此插件都是最新版本)时发现,第一次右键操作后再点开上面插件图标什么也没有。于是,把上面图示中的【Off】切换成【On】后再切换回【Off】,再重复上述操作便OK了。


参考

​https://www.likecs.com/show-203536256.html​

​https://www.cnblogs.com/xyztank/articles/15476775.html​