一、什么是Selenium?
selenium英文原意是硒 在python中是一个自动化测试工具
测试按照不同的分类 分为 手动测试 ,自动测试 黑盒测试或者白盒测试
selenium在python中的应用
selenium 可以完全模拟人,对浏览器操作,对动态数据进行获取 ,动态数据由代码生成,在页面的初始化过程中
是没有的,也无法获取 但是可以通过selenium进行获取
有些数据是需要进行登录后才能够获取的,比如说好友列表 评论 消费记录 登陆后获取cookie才能进行以上
操作,只要获取账号密码之后即可实现selenium代替登陆
selenium的特点
由程序控制浏览器进行操作,而不是手动操作浏览器
程序控制浏览器进行操作的时候 ,速度回很慢,所以要谨慎使用selenium
使用selenium控制浏览器的时候需要下载浏览器对应的驱动程序
selenium为开源的免费的,但是更新速度没有浏览器快不是因为selenium的官网新速度慢而是浏览器
的更新速度太快了,需要selenium与浏览器之间的冠词
二、安装Selenium
win+r 输入cmd
安装selenium(一般安装好python之后,会自带pip工具)
输入pip install selenium 回车即可
出现下面就是安装成功了
安装火狐和谷歌浏览器驱动driver
把下载好的文件解压到 D:\Python\Anaconda\Scripts 路径下即可 就已经安装成功了
# 在python中的应用为:
#1. selenium可以完全模拟人对浏览器操作,对动态数据进行获取
# 动态数据由代码生成,在页面初始话的过程当中是没有的也无法获取,但是可以通过selenium来进行获取
# 2.有些数据是需要进行登录以后才能获取的,比如说好友列表,评论,消费记录。。。
# 登录以后获取cookie才能进行衣裳操作,但是使用selenium,以后,可以避免人工登录,只需要得到账号密码,
# 即可实现selenium代替登录
# selenium特点;
# 1.由程序控制浏览器进行操作,而不是手动操作浏览器
# 2.程序控制浏览器进行操作的时候,速度非常慢,所以要谨慎使用selenium
# 3.使用selenium控制浏览器的时候,需要下载浏览器对应的驱动程序
# 4.selenium为开源,免费,但是更新速度没有浏览器快,不是selenium更新慢,而是浏览器更新快,要注意selenium和浏览器之间的对应关系
# 引入网页驱动
from selenium import webdriver
import time
# 使用网页驱动来运行火狐浏览器
driver = webdriver.Firefox()
# 通过驱动来执行指定的网页
driver.get('http://www.baidu.com')
# selenium提供了找到元素方法find_element_by_XXXX
# 这些方法全部是用python实现的
# 如果只是想对这个元素进行查找,定位,建议使用xpath或者css_selecotor
# 如果需要对找到的内容进行点击等操作,建议使用find_element_by_XXXX
# find 找到 element 元素 节点 标签 by 通过
# 通过kw这个id找到一个标签
# time.sleep(3)
# driver.find_element_by_id('kw').send_keys('selenium')
# 报错原因:代码执行速度很快,但是浏览器响应很慢,代码执行到这的时候浏览器里面的元素可能还没有加载完,所以找不到指定的元素
# selenium.common.exceptions.NoSuchElementException: Message: Unable to locate element: [id="kw"]
# driver.find_element_by_name('wd').send_keys('csdn')
# u unicode如果后面有中文,那么前面需要加一个u
# driver.find_element_by_class_name('s_ipt').send_keys(u'清华')
这篇文章主要介绍了selenium的安装和基本的应用,对于更深层次的应用将在后面的文章中介绍。希望这篇博客可以帮到有需要的人。