需要做的准备:
本文章是使用Chrome,所以需要Chormedriver.exe,具体的下载过程可以百度查到
Selenium是一种自动化测试工具,能模拟浏览器的行为,所以今天我就模拟一下浏览器登陆博客园的行为。
首先,分析问题,登陆博客园需要做些什么:
1.打开浏览器
2.输入博客园主页的网址
3.点击登陆按钮,等待页面跳转
4.输入账号密码,点击登陆
知道了步骤,接下来我们用代码来实现它:from selenium import webdriverimport time#创建登陆类
from selenium import webdriver
import time
class Loadup:
def __init__(self,username,password):
self.username = username
self.password = password
self.driver = webdriver.Chrome()
def closeBrowser(self):
self.driver.close()
def login(self):
driver = self.driver
driver.get('https://www.cnblogs.com/')
time.sleep(2)
# 使用xpath的方法来定位元素
login_button = driver.find_element_by_xpath("//a[@onclick='login();return false']")
login_button.click()
time.sleep(2)
# 使用xpath的方法来定位元素
username_elem = driver.find_element_by_xpath("//input[@name='LoginName']")
# 使用xpath的方法来定位元素
username_elem.clear()
username_elem.send_keys(self.username)
# 使用xpath的方法来定位元素
password_elem = driver.find_element_by_xpath("//input[@name='Password']")
password_elem.clear()
password_elem.send_keys(self.password)
# 定位登陆按钮
loadup_button = driver.find_element_by_xpath("//span[@class='ladda-label']")
loadup_button.click()
time.sleep()
Leslie_ChanId = Loadup("176******","*******") #在此输入自己的帐号和密码
Leslie_ChanId.login()
运行程序:
可以看到成功登陆,仔细看,会发现“Chrome正在受自动测试软件的控制”,说明是selenium正在操作浏览器。期间,人工也是可以操作浏览器的。
后言:
在测试的过程中,可能会出现博客园的滑动图片验证,可能是因为频繁操作引起,以我目前所学很难实现自动滑正确的图片,所以需要人为的去滑动图片。
使用driver定位元素的方法不止有xpath,还可以通过id,name,linkt_text等等
使用selenium进入网页后,可以做很多操作,是一种更方便于爬取动态网页的方法。