用python爬取某丽图库的高清壁纸图片

分享本文章

公众号回复 靓丽图库 获取源代码

先看效果

没问题,都是可以看的

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_页地址

打开网站

   随便哪个分类都可以

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_for循环_02

这里每一个div都包括了一个图片的代码

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_for循环_03

这个是图片的链接,点进去

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_04

然后出来一个网页,这个网页就是这个图片

打开开发者模式,找到下载本图的代码

这个链接就是源图片

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_页地址_05

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_06


思路:

1、先访问首页,提取所有的图片页的地址

2、循环访问所有的图片页地址,提取所有源图片链接

3、通过requests访问获取二进制码,进行保存


访问视频首页

url = 'https://www.hexuexiao.cn/weimei/aiqing/'
# 用户标识
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.35'
}
# 开始访问,获取源码
res = requests.get(url=url,headers=headers).text


通过xpath提取

提取标题和图片详情页链接

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_07

 

提取到了所有的图片详情页链接

然后用for循环去遍历每一个

 访问图片详情页链接,

然后用xpath提取源图片链接href的值

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_for循环_08

再requests.get()访问源图片的链接,用.content来获取二级制码

然后再保存

content = requests.get(url=src,headers=headers).content


    with open(f'靓丽图库/{title[n]}.jpg',mode='wb') as f:
        f.write(content)
        print(title[n]+': 已保存完成!')
    n += 1

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_09

感谢观看

分享文章

公众号回复 靓丽图库 获取源代码