Python_selenium之获取当前页面的href属性,id属性,图片信息和截全屏

一、  获取当前页面的全部信息

1. 图片信息包括图片名称、图片大小等信息

2. 只需将图片信息打印出来(image.text  image.size   image.tag_name)

二、  获取页面元素的href属性(id同理)

1. 获取当前页面所有的链接信息(以百度首页为例)

2. 运用for循环,然后运用get_attribute(‘href’)

3. 然后将之打印出来即可

三、  截取全屏信息

1. 运用get_screenshot_file()进行截图即可

四、  测试脚本

 1. 将以上三种代码写在一起,如下所示:

 

#coding:utf-8
from selenium import webdriver
import time
 
driver=webdriver.Firefox()
driver.maximize_window()
driver.implicitly_wait(8)
 
driver.get("https://www.baidu.com/")
for image in driver.find_elements_by_tag_name("img"):#获取当前页面的图片信息
    print image.text
    print image.size
    print image.tag_name
print "================================"
time.sleep(2)
for link in driver.find_elements_by_xpath("//*[@href]"):#获取当前页面的href
    print link.get_attribute('href')
 
print "================================"
for id in driver.find_elements_by_xpath("//*[@id]"):#获取当前页面的id
    print id.get_attribute('id')
 
print "================================"
 
driver.get_screenshot_as_file("E:\\work_study\\One.png")#截取当前页面的图片(全屏)。括号里面的路径为保存到本地电脑上面的路径,可随意设置。
driver.quit()

五、  测试结果

1. 如下图所示:

 

python提取url返回的二级目录json python提取href_for循环