python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸

原创

Python爬虫案例 2023-10-26 12:03:27 ©著作权

文章标签 公众号页地址 for循环 文章分类 Html/CSS 前端开发

©著作权归作者所有：来自51CTO博客作者Python爬虫案例的原创作品，请联系作者获取转载授权，否则将追究法律责任

用python爬取某丽图库的高清壁纸图片

分享本文章

公众号回复 靓丽图库 获取源代码

先看效果

没问题，都是可以看的

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_页地址

打开网站

随便哪个分类都可以

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_for循环_02

这里每一个div都包括了一个图片的代码

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_for循环_03

这个是图片的链接，点进去

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_04

然后出来一个网页，这个网页就是这个图片

打开开发者模式，找到下载本图的代码

这个链接就是源图片

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_页地址_05

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_06

思路：

1、先访问首页，提取所有的图片页的地址

2、循环访问所有的图片页地址，提取所有源图片链接

3、通过requests访问获取二进制码，进行保存

访问视频首页

url = 'https://www.hexuexiao.cn/weimei/aiqing/'
# 用户标识
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.35'
}
# 开始访问，获取源码
res = requests.get(url=url,headers=headers).text

通过xpath提取

提取标题和图片详情页链接

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_07

提取到了所有的图片详情页链接

然后用for循环去遍历每一个

访问图片详情页链接，

然后用xpath提取源图片链接href的值

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_for循环_08

再requests.get()访问源图片的链接，用.content来获取二级制码

然后再保存

content = requests.get(url=src,headers=headers).content


    with open(f'靓丽图库/{title[n]}.jpg',mode='wb') as f:
        f.write(content)
        print(title[n]+': 已保存完成!')
    n += 1

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸_公众号_09