pytorch 网络参数量 pytorch网络训练太慢

关注 jowvid

文章目录

项目场景：
问题描述：
原因分析：
解决方案：

pytorch 网络参数量 pytorch网络训练太慢

转载

jowvid 2023-08-08 13:19:05

文章标签 pytorch 网络参数量 python 深度学习数据读取数据 文章分类 PyTorch 人工智能

项目场景：

利用Pytorch在PTB数据集上训练的词嵌入模型的实现。

问题描述：

在训练过程中，发现训练速度很慢，利用GPU-Z查看后，发现GPU利用率基本为0。

pytorch 网络参数量 pytorch网络训练太慢_pytorch 网络参数量

pytorch 网络参数量 pytorch网络训练太慢_深度学习_02

原因分析：

为了找到耗时大的程序段，在训练代码中加入输出耗时的语句。

for batch in data_iter:
            print("end：, time ", time.time() - start)
            center, context_negative, mask, label = [d.to(device) for d in batch]
            pred = skip_gram(center, context_negative, net[0], net[1])
            l = loss(pred.view(label.shape), label, mask).mean()  # 一个batch的平均loss
            optimizer.zero_grad()
            l.backward()
            optimizer.step()
            sum_loss += l.cpu().item()
            print("sta：, time ", time.time() - start)

pytorch 网络参数量 pytorch网络训练太慢_pytorch 网络参数量_03

发现训练耗时很短，主要的时间花费都在读取数据的环节，每次都要花费1.5s左右。

for batch in data_iter:

而读取数据是由CPU完成的，训练过程的处理数据是由GPU完成了，也就是说程序运行时间长是由于CPU性能不足导致的，GPU每次处理数据都很快，只需要很短的时间就可以处理完数据，而后一直处于等待时间，因此利用率才会为0。同样利用GPU-Z查看平均利用率：

pytorch 网络参数量 pytorch网络训练太慢_深度学习_04

发现实际上是有使用GPU的，只是平均利用率非常低。为了进一步验证问题，同样也是为了查看GPU的处理能力，将batca size加大一个数量级，从512改为4096，进行观察。

pytorch 网络参数量 pytorch网络训练太慢_读取数据_05

发现CPU读取数据所用时间增长了66倍，而GPU处理数据所用时间基本不变。

因此可以确定，训练速度慢的原因，是遇到CPU瓶颈了。也就是CPU加载速度慢，使GPU空转、利用率低。

解决方案：

参考中提出的两种方法。

1、从单线程改为多线程。也就是将num_workers（线程数）改为4、8、16等，提高加载数据的速度。但windows系统有个贼sb的bug，好像已经有几年了，num_workers必须为0，不然就会出现错误如下：

pytorch 网络参数量 pytorch网络训练太慢_读取数据_06

因此该方法在win上暂时不可用。2、pin_memory=True。当你的服务器或者电脑的内存较大，性能较好的时候，建议打开pin_memory打开，就省掉了将数据从CPU传入到缓存RAM里面，再给传输到GPU上；为True时是直接映射到GPU的相关内存块上，省掉了一点数据传输时间。

pytorch 网络参数量 pytorch网络训练太慢_数据_07

也许是因为我的电脑性能不足，速度不仅没有变快，反而变慢了，只好放弃该方法。

3、此外，在一些其他的文章上看到，可以对数据的加载代码做一些优化，但还没有尝试过，不知道效果如何。

结论：无能为力，还是准备用服务器跑吧。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：java 非对称加密解密非对称加密解密过程

下一篇：openstack nova scheduler服务负责 openstack的主要组件

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册