import requests Python爬虫的图片存到哪里去了

原创

mob649e815b5994 2023-07-29 05:36:19 ©著作权

文章标签 网页内容 python 下载图片 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e815b5994的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python爬虫的图片存储

简介

在进行Python爬虫时，经常会遇到需要下载并存储网页中的图片的情况。使用requests库可以轻松实现网页内容的获取，但是如何将图片保存到本地是一个需要注意的问题。本文将向刚入行的小白开发者介绍如何使用requests库下载图片并将其保存到本地。

整体流程

在开始编写代码之前，我们需要明确整个流程。下面是一个简单的流程表格，展示了实现该功能所需的步骤：

步骤	描述
1	导入`requests`库
2	发送HTTP请求并获取网页内容
3	解析网页内容，提取图片链接
4	遍历图片链接，下载图片
5	将图片保存到本地目录

接下来，我们将详细介绍每一步需要做什么，并提供相应的代码。

步骤一：导入`requests`库

首先，我们需要导入requests库，以便使用其中的函数和方法。使用以下代码导入requests库：

import requests

步骤二：发送HTTP请求并获取网页内容

在这一步，我们需要使用requests库发送HTTP请求，并获取网页的内容。使用以下代码发送GET请求并返回响应的内容：

url = '  # 网页的URL
response = requests.get(url)  # 发送GET请求
content = response.content  # 获取网页内容

步骤三：解析网页内容，提取图片链接

在这一步，我们需要解析网页的内容，提取出其中的图片链接。可以使用BeautifulSoup库来解析HTML内容，并提取出所有的图片链接。首先，确保已经安装了BeautifulSoup库。使用以下代码解析网页内容，并提取出所有的图片链接：

from bs4 import BeautifulSoup

soup = BeautifulSoup(content, 'html.parser')  # 解析网页内容
img_tags = soup.find_all('img')  # 提取所有的<img>标签

img_urls = []  # 存储图片链接的列表
for img_tag in img_tags:
    img_url = img_tag['src']  # 获取图片链接
    img_urls.append(img_url)  # 将图片链接添加到列表中

步骤四：遍历图片链接，下载图片

在这一步，我们需要遍历所有的图片链接，并将图片下载到本地。使用以下代码遍历图片链接，并下载图片：

for img_url in img_urls:
    response = requests.get(img_url)  # 发送GET请求
    img_data = response.content  # 获取图片的二进制数据

    # 从图片链接中提取出文件名
    img_filename = img_url.split('/')[-1]

    # 保存图片到本地
    with open(img_filename, 'wb') as f:
        f.write(img_data)

步骤五：将图片保存到本地目录

在这一步，我们需要将下载好的图片保存到本地的目录中。可以使用以下代码将图片保存到指定的目录：

import os

save_dir = 'images'  # 图片保存的目录
os.makedirs(save_dir, exist_ok=True)  # 创建目录（如果不存在）

for img_url in img_urls:
    response = requests.get(img_url)  # 发送GET请求
    img_data = response.content  # 获取图片的二进制数据

    img_filename = img_url.split('/')[-1]  # 提取文件名
    save_path = os.path.join(save_dir, img_filename)  # 构建保存路径

    with open(save_path, 'wb') as f:
        f.write(img_data)

以上就是实现将爬取的图片保存到本地的完整代码。你可以根据需要进行修改和调整，以适应不同的场景和需求。

希望以上内容对你有所帮助！