显卡架构显卡架构和cpu架构

转载

mob64ca14137e4f 2023-08-30 14:56:40

文章标签 显卡架构 CPU GPU 科普应用场景 文章分类 架构后端开发

1. 写了啥

CPU和GPU作为电子计算机的重要部件，在近年来受到工业界的广泛关注，正处于高速迭代的发展期。发展到今日，CPU与GPU同作为计算部件，在应用场景上已经出现明显的区别，与之对应的，二者在结构上，也大不相同。

CPU全称为中央处理器，是一块超大规模的集成电路板，与内部储存器和输入输出设备一起被称为计算机的三大核心部件。从最早的Intel4004和Intel8008，经历数个阶段的发展迭代，现在已经成为集处理指令顺序，执行操作，控制时间，进行复杂计算为一体的运算核心和控制核心，电子计算机的“大脑”。目前工业界的主流产品是Intel i5和i7系列。

GPU全称为图形处理器，是计算机显卡的核心部件。在个人电脑上，GPU通常被用于2D和3D图形处理，即进行复杂的数学和几何计算。但近几年来，由于GPU在浮点计算和并行计算上，拥有极其出色的性能，甚至超越了CPU的数十倍，使其被广泛使用在数据挖掘，深度学习等需要大量重复计算的工程之中。目前，主流GPU厂商NVIDIA生产的GTX和GT系列显卡占据了市场较大份额，而同为NVIDIA生产的Titan V目前性能最为强大。

本文立足于目前CPU和GPU的发展现状，讨论了CPU和GPU的物理结构之间的异同。事实上，CPU与GPU在构造上有很大的区别，由于GPU需要满足大量重复的图形计算，计算单元占据了绝大部分体积，CPU由于综合性能的要求，还需要一定数量的存储单元和控制单元。除了在物理结构上的不同，本文还将讨论两者在性能和应用场景的具体区别。除此之外，还将简要介绍CPU和GPU协同工作的并行处理机制，这是当前本领域的研究热点。

2. 物理结构

2.1 计算单元

如图1所示^[1]，在CPU与GPU中,都存在一种结构占据了大量的体积空间，即ALU(arithmetic and logic unit)，算术逻辑单元为CPU和GPU提供了强大的逻辑计算能力，满足基本的计算功能。但其中不同在于，GPU的计算单元占比远高于CPU，这导致了GPU拥有在单一的逻辑运算中性能远高于CPU的特性。除此之外，如图2所示^[2]，GPU在计算核心的数量上也远高于CPU，所以其并行处理能力强悍，而CPU更适合做一些小型的串行计算，当然，多核CPU的出现，也使现在的CPU[1]拥有了一定的并行处理能力，但其ALU数量的限制依然存在。

显卡架构显卡架构和cpu架构_显卡架构

图1 CPU与GPU物理结构对比^[1]

2.2 控制单元和储存单元

除了在ALU上的差异之外，CPU和GPU在控制单元和储存单元上也有很大区别，如图一所示。CPU作为中央处理器，要处理指令顺序，安排操作执行的顺序，所以有很大体积的控制单元和储存单元，其中储存单元Cache为CPU提供了快速I/O的能力，I/O的速度将影响CPU处理指令集的速度，从而影响计算机的响应速度。而GPU仅具有少量的简单控制单元和小型储存单元，其作用是控制多线程合并处理和储存少量的并行运行指令。

显卡架构显卡架构和cpu架构_科普_02

图2 CPU与GPU计算核心数量示意图^[2]

特性和应用场景对比

特性

由于物理结构的不同，CPU和GPU具有完全不同的特性。CPU存在大量的控制和储存单元，导致其拥有强大的分支处理能力，可以将来自不同地方的指令调整顺序，使命令按次序顺利和高效运行。同时由于具有一定的计算单元，所以也可以处理一些串行计算任务，多核CPU则可以处理一些简单的并行任务。

GPU仅具有极大数量的ALU，和少量用于辅助的控制和储存单元，所以其特性也是单一的强大计算能力。又因为ALU往往被划分为多个计算核心，所以GPU适合于处理大型的重复计算任务，因为重复计算任务往往更容易并行化。

事实上，CPU和GPU在计算方面的差异正是复杂程度和规模程度，对于复杂的逻辑计算，往往在逻辑上难以并行划分，只能按照逻辑顺序串行处理，这种情况下因为CPU具有更快的内存读写速度，往往表现更加优异。相反，对于逻辑简单但规模庞大的计算问题，例如大型矩阵的运算，往往易于并行化，自然GPU在性能上的表现更加优异。在（刘进锋，郭雷；2011）中，比较了CPU和GPU在矩阵乘法运算上的性能。对于矩阵规模为1024的矩阵乘法，GPU上的最佳实现比CPU上的最佳实现快了大约6倍^[3]。同样的，在（刘勇，苏军； 2010）中，在快速傅里叶变换上比较了CPU和GPU的运算时间，CPU耗时高达GPU的40倍^[4]。

应用场景

由于特性上的差异，CPU与GPU适用于不同的应用场景，从适用范围上来看，CPU要更胜一筹。

CPU拥有强大的指令处理和计算能力，往往用于进行电子计算机的核心工作，即解释计算机指令和处理计算机软件中的数据。事实上，在大多数的个人电脑中，用户和软件都会不断地产生指令流，而处理指令流之间执行的先后顺序，就是CPU要完成的一个重要工作。CPU将从I/O设备接收到的指令集储存在储存单元中，然后按照一定的规则，取出相应的指令，并转化成对应的操作控制信号，发送给所属的计算机部件。

除此之外，CPU还要负责处理计算机软件所产生的数据。考虑到软件数据类型多样而且处理逻辑复杂，所以CPU往往在这类数据上表现出更优异的性能。

GPU相对于CPU而言，拥有单一的强大并行计算能力，所以用途往往是需要大规模并行计算的场景。早期GPU多被用于2D和3D图形的计算和处理，因为图形数据的处理往往涉及到大量的大型矩阵运算，计算量大但易于并行化。在近些年来，由于大数据成为了计算机学术界的研究热点。所以GPU也常常被用于需要大量重复计算的数据挖掘领域，如研究机器学习，深度学习，云计算等方向的研究机构，往往使用以GPU为计算核心的大型服务器作为硬件平台。

联合CPU和GPU的并行处理机制

事实上，由于CPU和GPU各自在处理和计算上有着强大的性能，关于CPU和GPU的联合处理方案一直是学术界和工业界研究的热点。在（卢风顺，宋君强等； 2011）中提出，CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台^[5]。在（张云雷，李轲等； 2017）中，研究了基于CPU/GPU的雷达脉冲压缩算法并行机制^[6]。除了学术界，在工业界，使用GPU加速计算机软件运行也是一大课题。GPU厂商NVIDIA一直致力于研究科学，工程，消费和企业应用程序的GPU加速计算，并取得了显著的成果。

但正如（卢风顺，宋君强等； 2011）中所言，CPU/GPU协同并行计算属于新兴研究领域，其中还有很多挑战有待解决。同时，目前主流的个人计算机软件并没有很好的并行工作能力，这仍然需要技术和行业的持续发展。

总结

CPU和GPU作为电子计算机的重要部件，无论是从物理结构上，还是从性能特性以及应用场景上，都有着很大的区别。相较于担负计算机核心大脑功能，负责处理调配计算机指令的CPU，GPU提供单一强劲的多计算核心用于满足图形处理，数据挖掘等大规模并行重复计算的需要。CPU和GPU作为不同应用场景的处理器，在目前的科技水平下，都是个人计算机中不可缺少的组成部分。

而根据二者的特点以及当下的发展趋势，未来可能会出现成熟的CPU与GPU并行处理方案，在CPU与GPU互补的情况下，可以极大的提高计算机的计算能力和软件响应速度，同时也将大大降低计算产生的功耗，从而大大降低个人计算机的体积重量，带来更好的用户体验。

参考文献

[1] NVIDIA. NVIDIA CUDA Documentation[DB/OL].http://www.nvidia.cn/object/cuda_develop_cn_old.html, 2018-03-08

[2] NVIDIA. 加速计算[DB/OL].http://www.nvidia.cn

/object/what-is-gpu-computing-cn.html,2018-03-08

[3] 刘进锋, 郭雷. CPU与GPU上几种矩阵乘法的比较与分析[J]. 计算机工程与应用, 2011, 47(19):9-11.

[4]刘勇, 苏军. 基于CPU与GPU/OpenCL的快速傅里叶变换的实现和性能比较[J]. 科技信息, 2010, 2(17):545+600.

[5]卢风顺, 宋君强, 银福康,等. CPU/GPU协同并行计算研究综述[J]. 计算机科学, 2011, 38(3):5-9.

[6]彭培, 张云雷, 李轲,等. 基于CPU/GPU处理器的雷达脉冲压缩算法并行机制研究[J]. 舰船电子工程, 2017(10):30-32.

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。