[转帖]关于Intel CPU浮点性能、内存带宽计算

转载

jinanxiaolaohu6 2024-02-19 14:13:04

2021年上半年Intel 终于发布了Cascade +++ 之后的新产品，虽然制程工艺无法与AMD相比，但相比14nm已经有很大的提升，与AMD之争从很早就开始了，14nm制程时在企业级服务器平台可以说Intel 以绝对的优势占据对决的市场，由于芯片架构的因素导致Intel 7nm迟迟无法推出，为了保住市场占有率，10nm工艺应运而生，下面是整理^[1]的Whitley平台下ICE Lake部分产品，因为型号种类众多，我仅整理了部分作为参考，工艺的提升就代表着性能的增强，而性能与硬件链路又有很大的关系，尤其是不同级别产品，除了核心数、主频区别外，他们本身的链路结构，链路的吞吐也会对CPU整体的性能产生影响，本片文章中先来聊一聊关于CPU相关的带宽计算问题。

[转帖]关于Intel CPU浮点性能、内存带宽计算_链路

对于ICE Lake Intel CPU来讲每个Core有两个FMA-512，FMA指令集（英语：Fused-Multiply-Add，即积和熔加运算）是x86架构微处理器上的指令集。FMA指令集是128位和256比特的流式单指令流多资料流扩展集（SSE）指令集，以进行积和熔加运算。[1]FMA指令集允许创建新的指令并有效率地执行各种复杂的运算，可结合乘法与加法运算（即进行积和熔加运算），通过单一指令执行多次重复计算，从而简化程序，从而使系统能快速执行绘图、渲染、照片着色、立体音效，及复杂向量运算等计算量大的工作^[2]

双精度浮点（即FP64）：

双精度浮点理论峰值频率核数（单核数量）（一次运算融合加和乘）双精度浮点理论峰值��=频率×核数×51264×2（单核��数量）×2（一次运算融合加和乘）

例如：

8352Y为例子：32core，单核基频2.2GHz，锁基频时，如需要超频，建议按照全核超频频率计算。

2.2×32×8×2×2=2252.8��=2.3��

内存理论带宽计算：

总带宽支持内存最大频率内存通道数（每次传输位宽）总带宽��/�=支持内存最大频率×内存通道数×64��（每次传输位宽）÷8

例如：

8352Y为例子：3200MHz，8chennel，理论带宽计算：

3200×8×64(��)÷8=204800��/�=204.8��/�

注：内存带宽实际测试时，实际结果也会受到核心数影响(从测试结果看超过16core后影响会变小)：

因为编译工具版本以及环境、内存种类影响，stream测试最大带宽仅为152GB/s。