迟来的第二篇来了

前言

接着上篇继续

元素定位不到, 这是一个经常遇到的问题,在之前的文章中也介绍过大概有以下几种

  • 元素定位写的不对
  • 页面加载超时
  • 没有在同一个页面(窗口)或iframe
  • 页面存在多个相同的元素

等等,这些操作的时候,都会报相应的异常错误,这些异常详细可参考我这篇文章 selenium操作元素遇到的异常

debug

来详细说一下,这次遇到的问题,是怎么定位的

1 先检查元素定位是否正确

手工打开这个页面,并找到该链接元素 脚本中这个链接元素定位是用xpath,可以使用xpath插件来验证,也可以打开开发者工具来使用另一款插件来找到该元素的xpath定位和你写的是否一致

经过定位,这个xpath表达式是没有问题的

2 在脚本中增加延时/获取当前页面窗口handler,打印页面url,进行debug

在页面中增加延时可以使用以下几种方法

使用python time模块的sleep函数,例如增加2秒延时

​time.sleep(2)​

selenium 自带的函数,隐士等待

例如 30秒内没有加载完成,也会继续执行后续代码

driver.implicitly_wait(30)

selenium 的 显示等待

等待时长20秒,间隔0.5秒去查询一次目标元素是否加载完成 20秒内加载完成后,执行后续的代码,最长等待20秒,没有加载也会继续执行

from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver.get(url)
locator = (By.LINK_TEXT, 'xxxx')

# 20 秒是最长等待时间, 0.5 秒是间隔轮询时间
WebDriverWait(driver,20,0.5).until(EC.presence_of_element_located(locator))

获取handler

在脚本里需要打印handler和URL 的地方,打印出来

获取当前窗口句柄和页面URL:

from selenium import webdriver
current_window = driver.current_window_handle
print(current_window)
current_url = driver.current_url

获取所有窗口句柄:

# 获取当前所有打开的窗口句柄
all_windows = driver.window_handles
print(all_windows)

结果

经过以上方式debug,发现会经过两个跳转,但handler都是同一个handler,但是不同的URL, 总是定位失败的那个元素在第二个页面URL 那里, 但是执行过程中,跳转到第二个页面之后,会再次自动跳转到第一个页面,所以导致该链接元素定位不到, 至于为啥会自动跳转到第一个页面,需要和相应的开发者沟通,为了快速运行脚本,这里暂用了一个折中的方法, 获取到第二个URL, 然后用代码driver.get( second_url)再次跳一次,去执行后续脚本