pytorch 查看显存大小

原创

mob649e816347dd 2024-09-06 06:24:27 ©著作权

文章标签 python 数据清理缓存 文章分类 PyTorch 人工智能

©著作权归作者所有：来自51CTO博客作者mob649e816347dd的原创作品，请联系作者获取转载授权，否则将追究法律责任

如何在PyTorch中查看显存大小

在深度学习的研发过程中，显存的管理和监控是极其重要的。对于新手来说，理解如何在PyTorch中查看显存大小是第一步。本文将详细讲解如何实现这一目标，并逐步带领你通过实际代码来实现。

流程概述

在开始代码实现之前，我们首先来了解一下整个流程的步骤：

步骤	说明
1	导入所需的库
2	检查可用的GPU设备
3	创建一个简单的模型
4	随机输入数据
5	监控显存使用情况
6	清理缓存

步骤详细说明

1. 导入所需的库

我们需要导入PyTorch的核心库，以及其他辅助库，例如NumPy用于数据处理。

# 导入PyTorch库
import torch
# 导入NumPy库
import numpy as np

2. 检查可用的GPU设备

在开始创建模型之前，首先检查我们是否有可用的GPU设备。

# 检查是否有可用的GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f'使用的设备: {device}')  # 输出使用的设备类型

3. 创建一个简单的模型

这里我们创建一个简单的全连接神经网络模型（MLP），以便后续进行显存监控。

# 定义一个简单的神经网络模型
class SimpleNN(torch.nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = torch.nn.Linear(784, 256)  # 输入层到隐藏层
        self.fc2 = torch.nn.Linear(256, 10)    # 隐藏层到输出层

    def forward(self, x):
        x = torch.relu(self.fc1(x))  # 使用ReLU激活函数
        x = self.fc2(x)               # 通过输出层
        return x

# 实例化模型
model = SimpleNN().to(device)

4. 随机输入数据

我们将生成一些随机输入数据来测试模型。

# 生成随机的输入数据
input_data = torch.randn(64, 784).to(device)  # 批次大小为64

5. 监控显存使用情况

使用PyTorch的内置函数来检查显存的使用情况。

# 输出显存使用信息
print(f'目前已用显存: {torch.cuda.memory_allocated(device)} bytes')  # 当前分配的显存
print(f'最大显存: {torch.cuda.max_memory_allocated(device)} bytes')  # 最大分配的显存

# 进行一次前向传播
output = model(input_data)

# 再次输出显存使用信息
print(f'前向传播后已用显存: {torch.cuda.memory_allocated(device)} bytes')
print(f'前向传播后的最大显存: {torch.cuda.max_memory_allocated(device)} bytes')

6. 清理缓存

在训练过程中，GPU的显存会不断累积使用，因此我们需要清理不再需要的缓存。

# 清理未使用的缓存
torch.cuda.empty_cache()
print(f'清理缓存后的显存: {torch.cuda.memory_allocated(device)} bytes')  # 清理后显存

显存使用情况的可视化

为了更好地理解显存的使用情况，我们可以使用饼状图来表示显存使用的比例。

pie
    title 显存使用情况
    "已用显存": 70
    "未使用显存": 30

项目时间表

我们还可以借助甘特图展示项目进展的时间安排。

gantt
    title 显存监控项目进度
    dateFormat  YYYY-MM-DD
    section 项目阶段
    导入库          :a1, 2023-10-01, 1d
    检查GPU        :after a1  , 1d
    创建模型        :after a1  , 1d
    随机输入数据    :after a1  , 1d
    监控显存使用    :after a1  , 1d
    清理缓存        :after a1  , 1d