GPU芯片主流架构有哪几类

转载

误会一场 2024-09-11 17:32:30

硬件层面：

软件层面：

GPU架构是围绕一个流式多处理器（SM）的扩展阵列搭建的。通过复制这种结构来实现GPU的硬件并行。

Instruction Cache：指令缓存，缓存了该SM里Warps的指令；
Warp Scheduler：线程束调度器；
Dispatch Unit：指令分发器，根据Warp Scheduler的调度向核心发送该Warp的指令；
Register File：寄存器，编译好的机器码如ADD r1 r2 r3，这些r开头的就是一个个寄存器，给Core提供计算参数或者存储输出结果，上图的SM中有3万多个32bit的寄存器，Warp中每个任务都会分配私有的寄存器；
Core：计算核心，负责浮点数和整数的计算；
SFU：Special Function Units，执行特殊数学计算（sin、cos、log等）；
LD/ST：Load/Store，访存单元，加载和存储数据；
L1 Cache：一级缓存，片上内存，即该内存是位于芯片内部的，速度很快；
Shared Memory：共享内存，片上内存；
Tex与Texture Cache：纹理单元用于采样纹理，纹理缓存；
PolyMorph Engine：多边形引擎，用于处理顶点数据拉取、Viewport Transform等。

GPU芯片主流架构有哪几类_Core

GPU芯片主流架构有哪几类_硬件架构_02

Fermi架构如上图，它的特性如下：

2018年的NVidia Turing架构为例进行解析

GPU芯片主流架构有哪几类_寄存器_03

放大一点

GPU芯片主流架构有哪几类_Core_04

上图是采纳了Turing架构的TU102 GPU，它的特点如下：

单个SM的结构图如下：

GPU芯片主流架构有哪几类_GPU芯片主流架构有哪几类_05

每个SM包含：

64 CUDA核
8 Tensor核
256 KB寄存器文件

可用主观看出，一个商业级别的GPU 包含的东西比寒武纪的深度学习加速卡的会复杂一点，在图像的处理，浮点运算的考虑上更加丰富。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯