「本章我们使用selenium来获取上一章精美的壁纸。上一章的代码,请求的时候会有很多的链接请求不到,具体原因就不追究了,我们本章用selenium来解决一下」
准备工作:
1、驱动(我用的火狐)
2、selenium版本(我用的4.7.2)
3、Python版本(我用的3.9.5)
测试代码能否打开浏览器
url = f'https://wallhaven.cc/hot'
s = Service(r'D:\pytest_\Case\geckodriver.exe')
fox= webdriver.Firefox(service=s)
fox.get(url)
嗯哼,正常打开,获取其中的属性
ele = fox.find_elements(By.CLASS_NAME,'preview')
for value in ele:
value_url = value.get_attribute("href")
print(value_url)
可以获取到href属性了,接下里就是再次打开网页。
ele = fox.find_elements(By.XPATH, "//a[@class='preview']")
for value in ele:
value_url = value.get_attribute("href")
这样就能获取到全部的图片地址链接了,剩下的就是打开获取高清了
先来看看使用selenium怎么操作
fox.execute_script("window.open('{}')".format(value_url))
for window_handle in fox.window_handles:
if window_handle != original_window:
fox.switch_to.window(window_handle)
break
try:
WebDriverWait(fox, 5).until(
EC.presence_of_element_located((By.XPATH, "//*[@id='wallpaper']")))
img = fox.find_element(By.XPATH, "//*[@id='wallpaper']").get_attribute('src')
img_list.append(img)
print(img)
except:
pass
# 关闭新窗口
fox.close()
# 切换回原始窗口
fox.switch_to.window(original_window)
这里大概的意思就是打开新窗口,判断一下,切换新窗口,锁定图片具体链接,获取它。
做完这些操作了,剩下的就是请求了,源码链接我放在了gitee:https://gitee.com/qinganan_admin/reptile-case/blob/master/%E5%A3%81%E7%BA%B8/selenium-wallhaven%E8%8E%B7%E5%8F%96.py
此外,我将获取到的链接储存了一个txt文件,也上传了gitee,有兴趣的可以取看看。