用python爬取某丽图库的高清壁纸图片
分享本文章
公众号回复 靓丽图库 获取源代码
先看效果
没问题,都是可以看的
打开网站
随便哪个分类都可以
这里每一个div都包括了一个图片的代码
这个是图片的链接,点进去
然后出来一个网页,这个网页就是这个图片
打开开发者模式,找到下载本图的代码
这个链接就是源图片
思路:
1、先访问首页,提取所有的图片页的地址
2、循环访问所有的图片页地址,提取所有源图片链接
3、通过requests访问获取二进制码,进行保存
访问视频首页
url = 'https://www.hexuexiao.cn/weimei/aiqing/'
# 用户标识
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.35'
}
# 开始访问,获取源码
res = requests.get(url=url,headers=headers).text
通过xpath提取
提取标题和图片详情页链接
提取到了所有的图片详情页链接
然后用for循环去遍历每一个
访问图片详情页链接,
然后用xpath提取源图片链接href的值
再requests.get()访问源图片的链接,用.content来获取二级制码
然后再保存
content = requests.get(url=src,headers=headers).content
with open(f'靓丽图库/{title[n]}.jpg',mode='wb') as f:
f.write(content)
print(title[n]+': 已保存完成!')
n += 1
感谢观看
分享文章
公众号回复 靓丽图库 获取源代码