一、web页面元素定位工具介绍

1、打开google浏览器,按F12进入开发者模式,如下图:

python 网页元素定位 网页元素定位工具_python 网页元素定位

2、用鼠标点击下图红色框中的箭头——然后鼠标移动到web页面的元素上(此处为百度框),会自动定位到对应的html代码,如下图:

python 网页元素定位 网页元素定位工具_父类_02

 

二、web页面元素的8种定位方法:

1、通过元素的id属性来定位元素——id是唯一标识(每个id都是不一样的)

   driver.find_element_by_id("kw")

 

 

python 网页元素定位 网页元素定位工具_父类_03

python 网页元素定位 网页元素定位工具_标签名_04

python 网页元素定位 网页元素定位工具_标签名_05

1 from selenium import webdriver
2 driver=webdriver.Chrome()
3 driver.get("https://www.baidu.com/")
4 
5 # 通过元素的id属性来定位——id是唯一的
6 search=driver.find_element_by_id("kw")
7 
8 search.send_keys("selenium")

id.py

 

2、通过元素的name属性来定位元素,name属性不是绝对唯一的(一个页面内可能存在多个元素的name属性是相同的)

     如果name属性的值wd是唯一的,用find_element_by_name定位元素,返回值是一个值
 driver.find_element_by_name("wd")

     如果name属性的值wd不是唯一的,用find_elements_by_name定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
     driver.find_elements_by_name("wd") 

python 网页元素定位 网页元素定位工具_标签名_04

python 网页元素定位 网页元素定位工具_标签名_05

1 from selenium import webdriver
 2 driver=webdriver.Chrome()
 3 driver.get("https://www.baidu.com/")
 4 
 5 #通过元素的name属性来定位元素,name属性不是绝对唯一的(一个页面内可能存在多个元素的name属性是相同的)
 6 
 7 # 如果name属性的值kw是唯一的,用find_element_by_name定位元素,返回值是一个值
 8 search=driver.find_element_by_name("wd")
 9 
10 # 如果name属性的值kw不是唯一的,用find_elements_by_name定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
11 search=driver.find_elements_by_name("wd")
12 
13 
14 search.send_keys("python")

name.py

 

3、通过元素的class属性来定位元素,class属性不是绝对唯一的(一个页面内可能存在多个元素的class属性是相同的)

      如果class属性的值s_ipt是唯一的,用find_element_by_class_name定位元素,返回值是一个值

      driver.find_element_by_class_name("s_ipt")

      如果class属性的值s_ipt不是唯一的,用find_elements_by_class_name定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
  driver.find_elements_by_class_name("s_ipt")

python 网页元素定位 网页元素定位工具_标签名_04

python 网页元素定位 网页元素定位工具_标签名_05

1 from selenium import webdriver
 2 driver=webdriver.Chrome()
 3 driver.get("https://www.baidu.com/")
 4 
 5 #通过元素的class属性来定位元素,class属性不是绝对唯一的(一个页面内可能存在多个元素的class属性是相同的)
 6 
 7 # 如果class属性的值s_ipt是唯一的,用find_element_by_class定位元素,返回值是一个值
 8 search=driver.find_element_by_class_name("s_ipt")
 9 
10 # 如果class属性的值s_ipt不是唯一的,用find_elements_by_class定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
11 search=driver.find_elements_by_class_name("s_ipt")
12 
13 
14 search.send_keys("java")

class.py

 

4、通过元素的标签名tag来定位元素,标签名不是绝对唯一的(一个页面内可能存在多个相同的标签名)

     如果标签名是唯一的,用find_element_by_tag_name定位元素,返回值是一个值
driver.find_element_by_tag_name("input")

 

     如果标签名不是唯一的,用find_elements_by_tag_name定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
driver.find_elements_by_tag_name("input")

     要找的元素是第8个input标签,所以通过列表查找时下标是7

      search2[7].send_keys("java")

 

 

python 网页元素定位 网页元素定位工具_python 网页元素定位_10

备注:上图找到的是15个标签,不是13个

python 网页元素定位 网页元素定位工具_标签名_04

python 网页元素定位 网页元素定位工具_标签名_05

1 from selenium import webdriver
 2 driver=webdriver.Chrome()
 3 driver.get("https://www.baidu.com/")
 4 
 5 #通过元素的标签名来定位元素,标签名不是绝对唯一的(一个页面内可能存在多个相同的标签名)
 6 
 7 # 如果标签名是唯一的,用find_element_by_tag_name定位元素,返回值是一个值
 8 #search=driver.find_element_by_tag_name("input")
 9 
10 # 如果标签名不是唯一的,用find_elements_by_tag_name定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
11 search2=driver.find_elements_by_tag_name("input")
12 
13 #打印出15个元素
14 print(search2)
15 
16 #要找的元素是第8个input标签,所以通过列表查找时下标是7
17 search2[7].send_keys("java")

input

 5&6、通过链接元素的文本内容来精确匹配和模糊匹配定位元素,不是绝对唯一的(一个页面内可能存在多个链接元素的文本内容是相同的)

  1、精确匹配——文本内容为“新闻”

            如果文本内容时唯一的,用find_element_by_link_text定位元素,返回值是一个值
    driver.find_element_by_link_text("新闻")

           如果文本内容不是唯一的,用elements_by_link_text定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
driver.find_elements_by_link_text("新闻")

 

       2、模糊匹配——通过文本内容的部分内容,例如“hao123”,通过“hao”定位

            如果文本内容时唯一的,用find_element_by_partial_link_text定位元素,返回值是一个值
    driver.find_element_by_partial_link_text("hao123")

            如果文本内容不是唯一的,用find_elements_by_partial_link_text定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表

driver.find_elements_by_partial_link_text("hao123")

 

python 网页元素定位 网页元素定位工具_标签名_04

python 网页元素定位 网页元素定位工具_标签名_05

1 # 1、精确匹配——文本内容为“新闻”
 2 # 如果文本内容时唯一的,用find_element_by_link_text定位元素,返回值是一个值
 3 search=driver.find_element_by_link_text("新闻")
 4 
 5 # 如果文本内容不是唯一的,用elements_by_link_text定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
 6 search=driver.find_elements_by_link_text("新闻")
 7 
 8 search.click()
 9 
10 # 2、模糊匹配——通过文本内容的部分内容,例如“hao123”,通过“hao”定位
11 # 如果文本内容时唯一的,用find_element_by_partial_link_text定位元素,返回值是一个值
12 aa=driver.find_element_by_partial_link_text("hao123")
13 
14 # 如果文本内容不是唯一的,用find_elements_by_partial_link_text定位元素,返回符合条件的多个值,保存在列表中,即返回的是列表
15 
16 aa=driver.find_elements_by_partial_link_text("hao123")

linktext

 7、通过Xpath定位

      1、绝对路径定位方法如下图:

        find_element_by_xpath("/html/body/div[2]/div/form/div/input")——以/开头,从根目录逐级查找(父子关系),这种方式太依赖元素的位置和顺序,稍微调整就会找不到,后期维护成本太高,所以一般不会用绝对定位

           

python 网页元素定位 网页元素定位工具_属性值_15

       2、相对定位——以//开头,在整个页面中寻找符合定位表达式的元素,不在乎元素的顺序和位置

          

python 网页元素定位 网页元素定位工具_标签名_16

        单属性定位: //标签名[@属性名称=值]

         

python 网页元素定位 网页元素定位工具_python 网页元素定位_17

如果单属性定位不到,就需要组合属性定位://标签名[@属性名称=值 and @属性名称=值 and @属性名称=值]

         

python 网页元素定位 网页元素定位工具_父类_18

 如果页面存在2个一模一样的元素,只是位置不同,定位方式如下图:从父类开始找,父类还不能唯一确定,继续从父类的父类就找

         

python 网页元素定位 网页元素定位工具_属性值_19

   另外的方式:通过父类去找:  

  

python 网页元素定位 网页元素定位工具_python 网页元素定位_20

 

 

python 网页元素定位 网页元素定位工具_属性值_21

 xpath模糊匹配:

 

 

python 网页元素定位 网页元素定位工具_python 网页元素定位_22

a. 用contains关键字,寻找页面中href属性值包含有logout这个单词的所有a元素,由于这个退出按钮的href属性里肯定会包含logout,所以这种方式是可行的,也会经常用到。其中@后面可以跟该元素任意的属性名,定位代码如下:

driver.find_element_by_xpath("//a[contains(@href, ‘logout’)]")

这句话的意思是

b. 用start-with:寻找rel属性以nofo开头的a元素。其中@后面的rel可以替换成元素的任意其他属性,定位代码如下

driver.find_element_by_xpath(("//a[starts-with(@rel, ‘nofo’)]")

c. 用Text关键字,寻找包含“退出”文本的所有a元素,定位代码如下:

driver.find_element_by_xpath("//a[contains(text(), ’退出’)]")

3.XPath 关于网页中的动态属性的定位,例如,ASP.NET 应用程序中动态生成 id 属性值,可以有以下三种方法:

a.starts-with      例子: input[starts-with(@id,'ctrl')]              解析:匹配以 ctrl开始的属性值

b.ends-with        例子:input[ends-with(@id,'userName')]     解析:匹配以 userName 结尾的属性值

c.contains()        例子:Input[contains(@id,'userName')]         解析:匹配含有 userName 属性值

G.xpath文本精准定位

//a[text()='新闻']   #精准定位到本文属性,contains则是模糊定位