2021年上半年Intel 终于发布了Cascade +++ 之后的新产品,虽然制程工艺无法与AMD相比,但相比14nm已经有很大的提升,与AMD之争从很早就开始了,14nm制程时在企业级服务器平台可以说Intel 以绝对的优势占据对决的市场,由于芯片架构的因素导致Intel 7nm迟迟无法推出,为了保住市场占有率,10nm工艺应运而生,下面是整理[1]的Whitley平台下ICE Lake部分产品,因为型号种类众多,我仅整理了部分作为参考,工艺的提升就代表着性能的增强,而性能与硬件链路又有很大的关系,尤其是不同级别产品,除了核心数、主频区别外,他们本身的链路结构,链路的吞吐也会对CPU整体的性能产生影响,本片文章中先来聊一聊关于CPU相关的带宽计算问题。

[转帖]关于Intel CPU浮点性能、内存带宽计算_链路

对于ICE Lake Intel CPU来讲每个Core有两个FMA-512,FMA指令集(英语:Fused-Multiply-Add,即积和熔加运算)是x86架构微处理器上的指令集。FMA指令集是128位和256比特的流式单指令流多资料流扩展集(SSE)指令集,以进行积和熔加运算[1]FMA指令集允许创建新的指令并有效率地执行各种复杂的运算,可结合乘法与加法运算(即进行积和熔加运算),通过单一指令执行多次重复计算,从而简化程序,从而使系统能快速执行绘图、渲染、照片着色、立体音效,及复杂向量运算等计算量大的工作[2]

双精度浮点(即FP64):

双精度浮点理论峰值频率核数(单核数量)(一次运算融合加和乘)双精度浮点理论峰值������=频率×核数×51264×2(单核���数量)×2(一次运算融合加和乘)

例如:

8352Y为例子:32core,单核基频2.2GHz,锁基频时,如需要超频,建议按照全核超频频率计算。

2.2×32×8×2×2=2252.8������=2.3������

 

内存理论带宽计算:

总带宽支持内存最大频率内存通道数(每次传输位宽)总带宽��/�=支持内存最大频率×内存通道数×64���(每次传输位宽)÷8

例如:

8352Y为例子:3200MHz,8chennel,理论带宽计算:

3200×8×64(���)÷8=204800��/�=204.8��/�

注:内存带宽实际测试时,实际结果也会受到核心数影响(从测试结果看超过16core后影响会变小):

因为编译工具版本以及环境、内存种类影响,stream测试最大带宽仅为152GB/s。

[转帖]关于Intel CPU浮点性能、内存带宽计算_链路_02

 

参考

  1. ^https://www.intel.com/content/www/us/en/products/details/processors/xeon/scalable.html
  2. ^wiki https://zh.wikipedia.org/wiki/FMA%E6%8C%87%E4%BB%A4%E9%9B%86