Python怎么保存html网页

原创

mob64ca12cfec58 2023-11-07 08:24:47 ©著作权

文章标签 HTML Python html 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12cfec58的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python如何保存HTML网页

导言

在现代互联网时代，网页是人们获取信息的主要来源之一。有时候，我们可能希望保存一个特定的网页以供离线查看，或者作为后续分析的数据源。本文将探讨如何使用Python保存HTML网页，并提供一些示例代码。

问题描述

我们面临的问题是，如何使用Python保存HTML网页？我们需要一种方法来自动下载网页并将其保存为HTML文件，以便后续使用。

解决方案

Python提供了多种方法来保存HTML网页。下面将介绍两种常用的方法。

方法一：使用`requests`库下载网页内容

requests是一个常用的Python库，可以用于发送HTTP请求，并处理响应。我们可以使用requests库发送GET请求来下载HTML网页的内容，并将其保存为HTML文件。

import requests

url = "  # 替换为你想要保存的网页地址

response = requests.get(url)
content = response.text

with open("output.html", "w", encoding="utf-8") as file:
    file.write(content)

在上面的代码中，我们首先导入了requests库。然后，我们指定了要下载的网页的URL。接下来，我们使用requests.get()函数发送GET请求，并将响应的内容保存在content变量中。最后，我们使用open()函数创建一个名为output.html的文件，并将content变量的内容写入文件中。

方法二：使用`urllib`库下载网页内容

urllib是Python标准库中的一个模块，提供了用于处理URL的各种功能。我们可以使用urllib.request模块来下载HTML网页的内容，并将其保存为HTML文件。

import urllib.request

url = "  # 替换为你想要保存的网页地址

response = urllib.request.urlopen(url)
content = response.read().decode("utf-8")

with open("output.html", "w", encoding="utf-8") as file:
    file.write(content)

在上面的代码中，我们首先导入了urllib.request模块。然后，我们指定了要下载的网页的URL。接下来，我们使用urllib.request.urlopen()函数发送GET请求，并将响应的内容保存在content变量中。最后，我们使用open()函数创建一个名为output.html的文件，并将content变量的内容写入文件中。

示例

下面我们将通过一个示例来演示如何使用上述方法保存HTML网页。

示例：保存百度首页

import requests

url = "

response = requests.get(url)
content = response.text

with open("baidu.html", "w", encoding="utf-8") as file:
    file.write(content)

在上面的示例中，我们使用requests库下载了百度首页的内容，并将其保存为名为baidu.html的HTML文件。