对于Python网页截图这个问题,笔者网络一番搜索之后,总结了大概有如下几种实现方案,
- 利用PyQT5
- 利用selenium + phantomjs
其中第二种方式的呼声比较高,总的来说,都不是特别方便。笔者最后找到了一家专门提供网页截图的第三方服务商,其中还有Python的实现网页截图代码,这里介绍给大家,毕竟造轮子还不是直接站在巨人的肩膀上,把时间花在我们的核心业务上才是最重要的事情。
该服务有如下特点:
支持多线路
支持登录截图
支持UA变换
支持Cookie注入 实现登录截图
支持自定义宽高
支持网页滚动截图
支持设定截图前的延迟时间
使用方式也很简单,我们打开它的首页 https://www.screenshotmaster.com/ 注册一个账号,然后你会在用户中心获取到一个唯一的Token,保存好这个Token 不要泄漏!
下面来看看它支持的参数:
您可以前往API文档页面查看更多的参数。
使用Python调用截屏大师的接口获取截图:
import urllib.parse import urllib.request import ssl ssl._create_default_https_context = ssl._create_unverified_context # 参数 token = "5f681b50d09f6" url = urllib.parse.quote_plus("https://www.baidu.com") width = 1280 height = 800 full_page = 1 # 构造URL query = "https://www.screenshotmaster.com/api/v1/screenshot" query += "?token=%s&url=%s&width=%d&height=%d&full_page=%s" % (token, url, width, height, full_page) # 调用API urllib.request.urlretrieve(query, "./screenshot.png")