GPU使用报错合集

原创

说文科技 2022-01-25 16:46:03 ©著作权

文章标签 深度学习 python GPU 数据持续更新 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者说文科技的原创作品，请联系作者获取转载授权，否则将追究法律责任

LawsonAbs的认知与思考，望各位读者审慎阅读。

总结

持续更新~

1 报错：RuntimeError: Invalid device, must be cuda device

1.1 原因：

在不支持cuda（GPU）的机器上，妄想把模型或者数据放到GPU中，这时就会报错。

2 报错

RuntimeError: CUDA out of memory. Tried to allocate 170.00 MiB (GPU 0; 11.93 GiB total capacity; 
11.09 GiB already allocated; 35.06 MiB free; 11.31 GiB reserved in total by PyTorch)

这个时候看一下 GPU 的使用情况，如下所示：

GPU使用报错合集_持续更新

可以看到这个程序是把卡1所有的显存都用上了，所以导致显存不足，那么就可以考虑是否是数据量过大导致的？我看一下我的代码，果然如此：

GPU使用报错合集_GPU_02

我要把 1446 *2 条句子同时用model处理，所以导致显存爆炸，当我将其变成小批量时，就可以解决这个问题了。

2.1 原因

本质原因是：显存过小，但是就程序而言是因为数据量过大。所以也就有了将数据分批的想法。

上一篇：读研秘籍

下一篇：git屏蔽某些文件/文件夹

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

GPU使用报错合集

GPU使用报错合集

总结

1 报错：​​RuntimeError: Invalid device, must be cuda device​​

1.1 原因：

2 报错

2.1 原因

51CTO博客

1 报错：RuntimeError: Invalid device, must be cuda device