python中的Xpath的安装及使用

原创

相信光的奥特王小懒 2022-10-20 10:56:43 ©著作权

文章标签 html xml 快捷键 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者相信光的奥特王小懒的原创作品，请联系作者获取转载授权，否则将追究法律责任

Xpath是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 都构建于 XPath 表达之上。

路径获取

环境的安装

使用 xpath 需要安装 lxml 库,在这里需要用pip的安装命令,所以我在这里给大家总结了两种提高速度的方式.

使用国内的镜像下载

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple  自己要下载的包

注意 : i即是表示临时的意思

注意: 升级 pip 到最新的版本 (>=10.0.0) 后进行配置

pip install pip -U
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在这里我们也可以采用如下方式:

pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple

python中的Xpath的安装及使用_xml

实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中。有两种方式：
1、将本地的html文档中的源码数据加载到etree对象中
etree.parse('filePath', etree.HTMLParser()) # filePath为文件的路径

示例：

from lxml import etree # 导包
html = etree.parse('./test.html', etree.HTMLParser()) # ./test.html为本地的html文件的路径
html.xpath('xpath表达式')

2、将从互联网上获取的源码数据加载到etree对象中
etree.HtML('page_data') # page_data为从页面获取的源码数据

示例：

from lxml import etree # 导包
html = etree.HtML('page_data') # page_data为从页面获取的源码数据
html.xpath('xpath表达式')

chrome生成xpath表达式

经常使用chrome的小伙伴都应该知道这个功能，在"审查"状态下(快捷键ctrl+shift+i，F12)，定位到元素(快捷键ctrl+shift+c) ，在Elements选项卡中，右键元素 Copy->Copy xpath，就能得到该元素的xpath了

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯