「本章我们使用selenium来获取上一章精美的壁纸。上一章的代码,请求的时候会有很多的链接请求不到,具体原因就不追究了,我们本章用selenium来解决一下」

准备工作:
1、驱动(我用的火狐)
2、selenium版本(我用的4.7.2)
3、Python版本(我用的3.9.5)

测试代码能否打开浏览器

url = f'https://wallhaven.cc/hot'
s = Service(r'D:\pytest_\Case\geckodriver.exe')
fox=  webdriver.Firefox(service=s)
fox.get(url)

嗯哼,正常打开,获取其中的属性

ele = fox.find_elements(By.CLASS_NAME,'preview')
for value in ele:
    value_url = value.get_attribute("href")
    print(value_url)

可以获取到href属性了,接下里就是再次打开网页。

ele = fox.find_elements(By.XPATH, "//a[@class='preview']")
for value in ele:
    value_url = value.get_attribute("href")

这样就能获取到全部的图片地址链接了,剩下的就是打开获取高清了

先来看看使用selenium怎么操作

fox.execute_script("window.open('{}')".format(value_url))
for window_handle in fox.window_handles:
    if window_handle != original_window:
        fox.switch_to.window(window_handle)
        break
    try:
        WebDriverWait(fox, 5).until(
              EC.presence_of_element_located((By.XPATH, "//*[@id='wallpaper']")))
        img = fox.find_element(By.XPATH, "//*[@id='wallpaper']").get_attribute('src')
        img_list.append(img)
        print(img)
    except:
          pass
    # 关闭新窗口
    fox.close()
    # 切换回原始窗口
    fox.switch_to.window(original_window)

这里大概的意思就是打开新窗口,判断一下,切换新窗口,锁定图片具体链接,获取它。

做完这些操作了,剩下的就是请求了,源码链接我放在了gitee:https://gitee.com/qinganan_admin/reptile-case/blob/master/%E5%A3%81%E7%BA%B8/selenium-wallhaven%E8%8E%B7%E5%8F%96.py

此外,我将获取到的链接储存了一个txt文件,也上传了gitee,有兴趣的可以取看看。