RTX 30显卡的在线发布会上有一个细节特别引人瞩目,那就是公布了一个名为TFLOPS的数据时,如果大家收看的视频有弹幕,一定马上就会弹幕爆炸了。这个参数到底是啥?为什么让大家那么关注呢?咱们今天就来说说吧。




gpu 排行 浮点运算 手机gpu浮点运算性能_浮点运算


TFLOPS是Tera和Floating-point operations per second词组的组合,后者的意思是每秒浮点运算次数,Tera则是万亿的意思,合起来就是每秒浮点运算多少万亿次。因为现在的图像是分成像素点来处理的,每个点的色彩都要进行浮点运算,然后组合成一幅图片,所以这个参数就说明了显卡或者GPU每秒能处理多少个像素点。


gpu 排行 浮点运算 手机gpu浮点运算性能_浮点数_02


它的基础就来自现在的GPU设计,目前的GPU都是由很多小处理核心或者叫流处理器组成,这个核心比处理器核心简单得多,每个时钟周期只负责处理一个浮点数据,所以总的浮点运算次数就是核心数量×时钟周期了。又因为现在的核心可以一次性处理一个双精度浮点数据,它相当于两个最基础的单精度浮点数据,所以再×2就得到了GPU的浮点运算次数。


gpu 排行 浮点运算 手机gpu浮点运算性能_浮点运算_03


回过头来看看这个参数对游戏有啥意义。在分辨率确定后,每一幅画面的像素点数量也就确定了,那么每秒处理的像素点越多,实际上每秒能处理的画面数量当然就越多。这说明了啥?当然就是游戏的帧速(每秒画面数)越高啦。没错,对使用同一代特别是同一核心的显卡,算出它的浮点运算能力,基本就了解游戏速度了。


gpu 排行 浮点运算 手机gpu浮点运算性能_像素点_04


不过对于不同代甚至不同架构的GPU,这种对比就不合适了,比如RTX 3080拥有两倍于RTX 2080 Ti的浮点运算次数,帧速能达到RTX 2080 Ti的两倍吗?从之前的测试大家就知道,当然不是这样。


gpu 排行 浮点运算 手机gpu浮点运算性能_gpu 排行 浮点运算_05


这就牵扯出了另一个问题,也就是核心的效率,因为谁也不能保证所有的核心或者流处理器能一直满载、有效运行,它的实际发挥还要考虑到前端的分配、后端的合成、显存数据等单元的配合,所以设计不同的架构下,按照最理想情况算出的浮点运算次数能发挥多少也是不同的。


gpu 排行 浮点运算 手机gpu浮点运算性能_浮点数_06


RTX 30还有所不同,因为它实际上是让每个核心中的整数运算单元也参加浮点运算,造成了“理论”运算能力翻倍、但因为干的是非专业工作,整数单元的浮点运算效率肯定赶不上专业的浮点运算单元,再加上前端的数据分配能力、显存带宽啥的没有跟着翻倍,所以效率大幅下降,最终我们可以看到,翻倍的浮点运算能力带来的只是不到40%的实际帧速提升。


gpu 排行 浮点运算 手机gpu浮点运算性能_浮点运算_07


gpu 排行 浮点运算 手机gpu浮点运算性能_浮点运算_08


既然同一个厂家在架构上的改动都会造成浮点运算能力的实际发挥,AMD和NV这种相差更远的架构就别提了,比如RX 6800系列用了比较特殊的架构设计,就以远低于RTX 3080/3070的浮点运算能力,得到了能抗衡甚至压制它们的性能。