python 网页元素定位网页元素定位工具

转载

mob64ca14092155 2023-10-21 18:44:46

文章标签 python 网页元素定位标签名属性值父类 文章分类 Python 后端开发

一、web页面元素定位工具介绍

1、打开google浏览器，按F12进入开发者模式，如下图：

python 网页元素定位网页元素定位工具_python 网页元素定位

2、用鼠标点击下图红色框中的箭头——然后鼠标移动到web页面的元素上（此处为百度框），会自动定位到对应的html代码，如下图：

python 网页元素定位网页元素定位工具_父类_02

二、web页面元素的8种定位方法:

1、通过元素的id属性来定位元素——id是唯一标识（每个id都是不一样的）

driver.find_element_by_id("kw")

python 网页元素定位网页元素定位工具_标签名_04

python 网页元素定位网页元素定位工具_标签名_05

1 from selenium import webdriver
2 driver=webdriver.Chrome()
3 driver.get("https://www.baidu.com/")
4 
5 # 通过元素的id属性来定位——id是唯一的
6 search=driver.find_element_by_id("kw")
7 
8 search.send_keys("selenium")

id.py

2、通过元素的name属性来定位元素，name属性不是绝对唯一的（一个页面内可能存在多个元素的name属性是相同的）

如果name属性的值wd是唯一的，用find_element_by_name定位元素，返回值是一个值
driver.find_element_by_name("wd")

如果name属性的值wd不是唯一的，用find_elements_by_name定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
driver.find_elements_by_name("wd")

python 网页元素定位网页元素定位工具_标签名_04

python 网页元素定位网页元素定位工具_标签名_05

1 from selenium import webdriver
 2 driver=webdriver.Chrome()
 3 driver.get("https://www.baidu.com/")
 4 
 5 #通过元素的name属性来定位元素，name属性不是绝对唯一的（一个页面内可能存在多个元素的name属性是相同的）
 6 
 7 # 如果name属性的值kw是唯一的，用find_element_by_name定位元素，返回值是一个值
 8 search=driver.find_element_by_name("wd")
 9 
10 # 如果name属性的值kw不是唯一的，用find_elements_by_name定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
11 search=driver.find_elements_by_name("wd")
12 
13 
14 search.send_keys("python")

name.py

3、通过元素的class属性来定位元素，class属性不是绝对唯一的（一个页面内可能存在多个元素的class属性是相同的）

如果class属性的值s_ipt是唯一的，用find_element_by_class_name定位元素，返回值是一个值

driver.find_element_by_class_name("s_ipt")

如果class属性的值s_ipt不是唯一的，用find_elements_by_class_name定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
driver.find_elements_by_class_name("s_ipt")

python 网页元素定位网页元素定位工具_标签名_04

python 网页元素定位网页元素定位工具_标签名_05

1 from selenium import webdriver
 2 driver=webdriver.Chrome()
 3 driver.get("https://www.baidu.com/")
 4 
 5 #通过元素的class属性来定位元素，class属性不是绝对唯一的（一个页面内可能存在多个元素的class属性是相同的）
 6 
 7 # 如果class属性的值s_ipt是唯一的，用find_element_by_class定位元素，返回值是一个值
 8 search=driver.find_element_by_class_name("s_ipt")
 9 
10 # 如果class属性的值s_ipt不是唯一的，用find_elements_by_class定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
11 search=driver.find_elements_by_class_name("s_ipt")
12 
13 
14 search.send_keys("java")

class.py

4、通过元素的标签名tag来定位元素，标签名不是绝对唯一的（一个页面内可能存在多个相同的标签名）

如果标签名是唯一的，用find_element_by_tag_name定位元素，返回值是一个值
driver.find_element_by_tag_name("input")

如果标签名不是唯一的，用find_elements_by_tag_name定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
driver.find_elements_by_tag_name("input")

要找的元素是第8个input标签，所以通过列表查找时下标是7

search2[7].send_keys("java")

python 网页元素定位网页元素定位工具_python 网页元素定位_10

备注：上图找到的是15个标签，不是13个

python 网页元素定位网页元素定位工具_标签名_04

python 网页元素定位网页元素定位工具_标签名_05

1 from selenium import webdriver
 2 driver=webdriver.Chrome()
 3 driver.get("https://www.baidu.com/")
 4 
 5 #通过元素的标签名来定位元素，标签名不是绝对唯一的（一个页面内可能存在多个相同的标签名）
 6 
 7 # 如果标签名是唯一的，用find_element_by_tag_name定位元素，返回值是一个值
 8 #search=driver.find_element_by_tag_name("input")
 9 
10 # 如果标签名不是唯一的，用find_elements_by_tag_name定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
11 search2=driver.find_elements_by_tag_name("input")
12 
13 #打印出15个元素
14 print(search2)
15 
16 #要找的元素是第8个input标签，所以通过列表查找时下标是7
17 search2[7].send_keys("java")

input

5&6、通过链接元素的文本内容来精确匹配和模糊匹配定位元素，不是绝对唯一的（一个页面内可能存在多个链接元素的文本内容是相同的）

1、精确匹配——文本内容为“新闻”

如果文本内容时唯一的，用find_element_by_link_text定位元素，返回值是一个值
driver.find_element_by_link_text("新闻")

如果文本内容不是唯一的，用elements_by_link_text定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
driver.find_elements_by_link_text("新闻")

2、模糊匹配——通过文本内容的部分内容，例如“hao123”，通过“hao”定位

如果文本内容时唯一的，用find_element_by_partial_link_text定位元素，返回值是一个值
driver.find_element_by_partial_link_text("hao123")

如果文本内容不是唯一的，用find_elements_by_partial_link_text定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表

driver.find_elements_by_partial_link_text("hao123")

python 网页元素定位网页元素定位工具_标签名_04

python 网页元素定位网页元素定位工具_标签名_05

1 # 1、精确匹配——文本内容为“新闻”
 2 # 如果文本内容时唯一的，用find_element_by_link_text定位元素，返回值是一个值
 3 search=driver.find_element_by_link_text("新闻")
 4 
 5 # 如果文本内容不是唯一的，用elements_by_link_text定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
 6 search=driver.find_elements_by_link_text("新闻")
 7 
 8 search.click()
 9 
10 # 2、模糊匹配——通过文本内容的部分内容，例如“hao123”，通过“hao”定位
11 # 如果文本内容时唯一的，用find_element_by_partial_link_text定位元素，返回值是一个值
12 aa=driver.find_element_by_partial_link_text("hao123")
13 
14 # 如果文本内容不是唯一的，用find_elements_by_partial_link_text定位元素，返回符合条件的多个值，保存在列表中，即返回的是列表
15 
16 aa=driver.find_elements_by_partial_link_text("hao123")

linktext

7、通过Xpath定位

1、绝对路径定位方法如下图：

find_element_by_xpath("/html/body/div[2]/div/form/div/input")——以/开头，从根目录逐级查找（父子关系），这种方式太依赖元素的位置和顺序，稍微调整就会找不到，后期维护成本太高，所以一般不会用绝对定位

python 网页元素定位网页元素定位工具_属性值_15