文章目录项目代码展示使用技术一.正则匹配re.match(a, b, c)re.search(a, b, c)re.sub(a, b, c, d, e)re.compile(a, b)findall(a, b, c, d)finditer(a, b, c)re.split(a, b, c, d)正则表达式修饰符二.xPath方法Xpath常用的规则本地展示xPath运算符按序选择节点轴选择演示代
XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可以用XPath来选择xpath解析原理:1
转载 2024-06-20 12:11:31
74阅读
简介  XPath由W3C的 XPath 1.0 标准描述.本教程通过实例来展示XPath的一些特性.你可以从以下内容开始: 1。基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径/AAA选择根元素AAAAAA>         &nbs
1. 面向对象    1.1 类定义 , 属性 , 初始化      1. 面向对象最重要的概念就是类(Class) 和实例(Instance), 面向对象编程是一种编程设计思想.      class Cat: """这是一个猫类""" # class 关键字 # Cat 类名 同变量名 大驼峰命名法 # 三引号中的内容是解释这个类的用途    2. 实例化对象
转载 9月前
30阅读
在信息化时代,随着互联网内容的快速增长,提取和抓取网页中特定数据的问题变得越来越重要。我今天将分享如何使用 Python 来获取网页中的所有 `` 链接 `href` 属性。这篇文章将分为几个部分,以便于理解和学习。 ### 背景描述 在进行数据爬取或分析时,我们经常需要从网页中提取信息。链接是网页中重要的信息之一,通过获取所有的链接地址,我们可以进一步进行数据分析或抓取。用 Python 进行
原创 5月前
28阅读
经常在工作中会使用到XPath的相关知识,但每次总会在一些关键的地方不记得或不太清楚,所以免不了每次总要查一些零碎的知识,感觉即很烦又浪费时间,所以对XPath归纳及总结一下。 在这篇文章中你将能学习到: XPath简介 XPath 路径表达式详解 XPath在DOM,XSLT及XQuery中的应用 XPath简介XPath是W3C的一个标准。它最主要的目的是为了在XML1.0或XML1.1文档节
转载 7月前
59阅读
# Python提取XPath链接教程 ## 概述 在本教程中,我将指导你如何使用Python提取XPath链接。首先,我们会讨论提取XPath链接的整个流程,然后逐步教你每一步需要做什么,并提供相应的代码示例。 ## 整个流程 下面是提取XPath链接的整体流程,我们将使用Python的lxml库来实现: | 步骤 | 描述 | | --- | --- | | 步骤1 | 发起HT
原创 2023-12-05 11:01:20
431阅读
目录1、简介2、选取节点3、谓语4、通配符5、多路径选择6、xpath 轴7、常用的功能函数 1、简介xpath 即为 XML 路径语言,它是一种用来确定 XML(标准通用标记语言的子集)文档中某部分位置的语言。xpath 基于 XML 的树状结构,有不同类型的节点,包括元素节点,属性节点和文本节点,提供在数据结构树中
转载 2024-09-25 15:19:49
96阅读
# Python爬虫获取a链接href ## 简介 Python爬虫是指使用Python编写程序来自动获取互联网上的数据。在实际应用中,经常需要从网页中提取链接信息,特别是从``标签中获取`href`属性值。本篇文章将教会你如何使用Python爬虫获取a链接href。 ## 整件事情的流程 我们将分为以下步骤来实现这个功能: 1. 发起HTTP请求,获取网页内容 2. 解析网页内容,提
原创 2023-08-24 09:57:30
911阅读
介绍XPath是一种XML路径语言,被用于在XML文档中通过元素和属性进行导航安装pip install lxml使用html示例内容,下面的所有练习全都来自与此段示例<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>test<
转载 2024-08-26 13:35:10
18阅读
1: <a> 标签的 href 属性用于指定超链接目标的 URL,href 属性的值可以是任何有效文档的相对或绝对 URL,包括片段标识符和 JavaScript 代码段。2: <a href="#abc">a link <#>  表示跳到锚点abc,3: <a hr
转载 2023-06-09 11:39:59
113阅读
先上HTML文档<html> <body> <a href="http://www.example.com">Example</a> <a href="http://www.stackoverflow.com">S
原创 2022-01-12 14:57:45
128阅读
/li/a/@herf 这样取的应该是herf的内容/li/a/text() 这样取得是text内容
原创 2023-03-09 20:16:29
1066阅读
需求:现在有一个网站的页面,我希望用python自动化的测试点击这个页面上所有的在本窗口跳转,并且是本站内的链接,前往到链接页面之后在通过后退返回到原始页面。   要完成这个需求就必须实现3点:   1. 找到原始页面上面所有的在本窗口内跳转的链接   2. 跳转到目标页面之后,“后退”到原始页面   3. 在原始页面上继续点击后续的链接   首先,要找到页面上的所有链接并不困难。selenium
转载 2024-09-03 17:17:17
35阅读
Html<!--  -->  Html注释head标签内使用的标签<meta http-equiv="Refresh" Content="3" />  自动刷新<meta http-equiv="Refresh" Content="3; Url=https://baidu.com" />  自动跳转<meta nam
转载 2024-08-23 13:33:25
101阅读
【代码】html <a>设置发送邮件链接、打电话链接 <a href=“mailto:></a> <a href=“tel:></a>
原创 9月前
168阅读
# 如何使用 jQuery 增加超链接href 属性 作为一名初学者,学习如何使用 jQuery 添加或修改超链接href 属性是非常重要的。jQuery 是一个强大的 JavaScript 库,它使得 HTML 文档的操作、事件处理和动画效果变得简单。在本文中,我们将详细介绍如何实现这个功能,并为你提供一个简单的流程和具体的代码示例。 ## 整体流程 在实现链接添加或修改的过程中,
原创 9月前
46阅读
## 实现 Python 点击下拉菜单链接 XPATH ### 流程概述 要实现 Python 点击下拉菜单链接 XPATH,需要经历以下步骤: 1. 安装必要的库和工具; 2. 导入所需的库; 3. 获取页面源代码; 4. 使用 XPATH 定位下拉菜单; 5. 点击下拉菜单链接。 下面将详细介绍每一步的具体操作和所需的代码。 ### 1. 安装必要的库和工具 在实现过程中,我们将使
原创 2024-01-05 05:01:50
160阅读
scrapy作为一款强大的爬虫框架,当然要好好学习一番,本文便是本人学习和使用scrapy过后的一个总结,内容比较基础,算是入门笔记吧,主要讲述scrapy的基本概念和使用方法。scrapy framework首先附上scrapy经典图如下: scrapy框架包含以下几个部分 Scrapy Engine 引擎 Spiders 爬虫 Scheduler 调度器 Downloader 下载器 Ite
转载 2024-06-18 10:48:25
44阅读
今天持久男 在抓取数据的时候发现很多内容都加了锚文本, 这怎么办呢? 没办法只能通过工具解决 我是这样解决的: 例如: 成功了.
原创 2021-07-29 10:40:49
728阅读
  • 1
  • 2
  • 3
  • 4
  • 5