GPU和CPU计算上的精度差异

原创

说文科技 2022-03-29 14:45:25 ©著作权

文章标签 深度学习 pytorch 机器学习浮点数矩阵乘法 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者说文科技的原创作品，请联系作者获取转载授权，否则将追究法律责任

前言

文章来源：CSDN@LawsonAbs
晚上跑代码，想比较两种方法计算结果之间是否相同，理论上计算结果应该一致，但是比较结果就是二者不一致，错误排查了很久，怎么都不知道哪儿错了？难道机器真的算错了吗？
本代码可以在我的github中找到

为了清楚演示具体的差异，抽象出如下简单的代码片段：

示例

简单看一个例子，看看其在cuda和cpu下的计算表现

1. cuda下的矩阵乘法

GPU和CPU计算上的精度差异_矩阵乘法
可以看到GPU下的计算：很显然的一个相同结果在GPU的计算下是二者竟然不等！

2. cpu 下的矩阵乘法

GPU和CPU计算上的精度差异_深度学习_02

其实在找“问题”的时候，我猜测过是不是因为精度问题（但是没有多想，心想着GPU精度再差，也不至于万分位就差了吧 -_-||），但哪知道还真是这个问题！当代码变多，很难立马定位到到底是什么地方出了问题，排查问题的过程就变的非常困难！之前我也听过cuda精度之类的一点儿东西，但是从未放在心上，终于花了一个多小时去找这个问题，才知道有这个坑，果然是坑只有自己踩过才知道。。。