芯片相关-- Cpu历史--AMD系列

 

1.1 AMD

1968 年,仙童半导体的8位创始人中的两位——总经理罗伯特·诺伊斯(Robert Noyce)和实验室负责人戈登·摩尔(Gorden Moore),带着一部分员工离开了陷入资金危机的公司,成立了英特尔(Intel)。而一年后的 1969 年5月1日,桑德斯(之前在摩托罗拉,后来去了仙童半导体Fairchild Semiconductor)也带着 7 个人另立门户,成立了超微半导体(Advanced Micro Devices, AMD)。

AMD当前处理器分为:服务器霄龙cpu,工作站锐龙线程撕裂者和锐龙pro cpu,嵌入式霄龙,锐龙,R和G系系列嵌入式cpu,笔记本锐龙pro,锐龙和速龙移动cpu,台式处理器锐龙线程撕裂者,锐龙pro,速龙pro,锐龙及搭载显卡的cpu,以及支持chromebook处理器系列

Ø 服务器处理器AMD EPYC(霄龙):先进的 x86 服务器处理器4树立卓越性能、安全和可扩展性新标准。

Ø 工作站处理器AMD 锐龙 Threadripper PRO,锐龙Threadripper,锐龙PRO:借助拥有超多核心的高性能工作站处理器,轻松应对多线程工作负载。

Ø 嵌入式和半定制处理器AMD EPYC(霄龙)嵌入式,AMD 锐龙嵌入式处理器,R和G系列嵌入式解决方案和半定制。

Ø 笔记本电脑处理器面向企业的 AMD 锐龙 PRO 移动处理器:出色的多核性能和超长电池续航 + 优秀的可管理性和额外安全保护。面向企业的 AMD 锐龙移动处理器:疾速响应、多核性能、卓越能效和超长电池续航。AMD 锐龙移动处理器:超多核心为移动处理器带来卓越性能。AMD 速龙移动处理器:面向主流笔记本电脑打造卓越性能和先进功能。面向学生和老师的 AMD 笔记本电脑:AMD 处理器搭载 Radeon 显卡,带来疾速顺畅的网页浏览和视频播放体验,为在线学习环境赋能助力。

Ø 台式处理器

l AMD 锐龙 Threadripper PRO 处理器:7nm 制程工艺打造出色的 CPU 核心密度,并且支持 128 条 PCIe® 4.0 通道,轻松应对各种专业工作负载。

l AMD 锐龙 PRO 处理器:最多可达8个核心,带来出色的性能、先进的安全功能和无缝的可管理性,轻松应对各种严苛业务环境。

l AMD 速龙 PRO 处理器:专业的安全功能、性能和可管理性,以及卓越的价值。

l AMD 锐龙 Threadripper 处理器助力高端台式机:最多可达 64 核心和 128 线程,让创意工作疾速非凡。

l AMD 锐龙处理器:最多可达 16 核心和 32 线程,最高可达 4.9GHz 的加速时钟频率和最多可达 72MB 的高速缓存,实力打造非凡卓越的性能。

l AMD 锐龙处理器搭载 Radeon 显卡:无需独立显卡,即可享受发烧级性能。

l AMD 速龙处理器搭载 Radeon 显卡:最多可达 4 个先进的“Zen +”3 处理核心和 4 个处理线程,轻松疾速搞定日常办公、网上冲浪和多任务处理。

Chromebook 处理器:

l 面向企业的 AMD Chromebook:性能卓越的 AMD 锐龙和速龙处理器为 Chrome 设备赋能,全面加速企业云计算应用。

l 面向家庭和个人的AMD Chromebook:AMD处理器出色的能效助力打造更轻更薄的 Chromebook,带来超快的连接以及超长的电池续航。

l 面向学生和老师的 AMD Chromebook:Chromebook 助力用户通过各种多媒体应用、STEM 工具、安全功能和精彩创意,深度融入现代教育的方方面面。

https://www.amd.com/zh-hans/processors#%E5%8F%B0%E5%BC%8F%E6%9C%BA

1.1.1 K5

K5是AMD公司1993年开始开发,并于1996年03月27日发布的第一个独立生产的x86级CPU,之前都是跟随intel,例如逆向8080,发布AM9080。当时为了和zilog Z80对抗,1976年和intel签订协议,作为intel的第二供应商,类似代工厂。后面各种巧合,intel给amd授权,AMD也走性价比路线,1985intel撕毁协定,停止了32位处理器80386的授权,AMD告intel,持续四年多,最后胜诉一直追随不是办法。

[转帖]芯片相关-- Cpu历史--AMD系列_浮点

图1 AMD代工的8088和逆向的386

[转帖]芯片相关-- Cpu历史--AMD系列_浮点_02

K5系列: K5系列CPU的频率共有6种: 75 MHz/90 MHz /100 MHz /120 MHz/133 MHz /166 MHz,总线的频率和Pentium差不多,都是60 MHz或者66 MHz。K5采用了高度并行化的 29k RISC 指令集,这与主流的 CISC 指令集大相径庭,但又提供了非常好的 x86 前端。其内部则采用了 4 流水线、5 个整数单元和 1 个浮点单元的设计。为了保证兼容性,K5 能够在奔腾的 Socket 5/7 系列主板上使用。

K5系列 CPU都内置了32 KB的一级缓存,Pentium内置的16 KB,在整数运算和系统整体性能方面要比同样时钟频率的Pentium还要好,但K5上市时间比Pentium(93年3月发布)晚了许多,再加上浮点运算能力远远比不上Pentium,一度使得AMD的市场份额大量丧失。

[转帖]芯片相关-- Cpu历史--AMD系列_Chrome_03

图2 AMD K5 CPU

K5 的竞争对手是 Intel 的奔腾 Pro 系列(于 1995 年发布)和 Cyrix 的 6x86 系列。整数运算性能大约是奔腾 200 的水平,浮点性能则是奔腾 100 的水平,但击败了 Cyrix 的竞品(当时购买的就是cyrix 200的cpu),还是比较中规中矩的,由于出的较晚,第一次尝试效果一般。

1.1.2 K6-2

硅谷有个60 人的小公司 NexGen,研发的Nx686 处理器轻松地达到了 180MHz 的核心频率,通过比尔盖茨的撮合, 与NexGen的创始人Atiq Raza(“微处理器设计领域的迈克尔·乔丹”)建立合作关系,将Nx686 CPU 技术用在K6上,可以直接插在socket7主板上,性能和intel pentun II有一拼,成为公司的转折点。

[转帖]芯片相关-- Cpu历史--AMD系列_浮点_04

图3 AMD K6-2 CPU

 

1.1.3 K7速龙

1999年6月,AMD推出的K7架构处理器比K6更加强势,其主要技术来自DEC公司强大的服务器处理器Alpha 21264,并使用了Alpha架构的EV6总线。与之前的绝大部分非Intel处理器不同,K7架构拥有超越Intel处理器的浮点能力和频率潜力。首款K7处理器被命名为Athlon至今仍是中低端处理器的品牌。

[转帖]芯片相关-- Cpu历史--AMD系列_Chrome_05

[转帖]芯片相关-- Cpu历史--AMD系列_缓存_06

图4 Socket A接口Thunderbird(雷鸟)核心Athlon处理器低端的Duron(钻龙,俗称毒龙)

2001年底,AMD在压力下也推出了新版本的K7处理器进行应对,即Athlon XP,其主要变化是加入了对SSE指令集的支持,以及更高的频率,另外相应的芯片组也开始支持更高带宽的DDR内存,封装基板也从厚重的陶瓷改为了更轻巧、类似Pentium Ⅲ的树脂材质。

[转帖]芯片相关-- Cpu历史--AMD系列_浮点_07

图5 树脂基板的Athlon

这种裸die封装方式,出现过散热器压碎cpu die的情况,后来封装都加上了一个金属外壳保护die,但感觉上还是少了些生趣。是不是对安装cpu散热器心有余悸,安装起来怎么别扭怎么来,划伤手都是正常的。但是的散热器鱼龙混杂,没有标准的散热器夹具,有没有装散热器很不顺手的情况,

1.1.4 K8皓龙

2003年8月,AMD推出的K8处理器可以说是一款划时代的产品。基于K7但是又三项改变:

加入了64位指令集,其实64位指令集是intel先提出的并且用在IA64架构安腾(Itanium)处理器上,后来也被迫在消费cpu上也支持64位。

首次集成了内存控制器,最初支持DDR内存,可以大幅度降低内存与处理器的通信延迟,提升系统整体性能

放弃了原有的FSB前端总线而采用了HyperTransport总线技术,它采用点对点串行设计,让内存、磁盘、PCI总线控制器之间有了更高的数据带宽和更大的弹性空间。

除此之外,K8还在K7架构的基础上还加长了整数与浮点流水线,增加了缓存容量,加入温控电路和节能技术,以及增加了对SSE2指令集的支持。第一代K8处理器架构内置单/双通道DDR400内存控制器,一级缓存为128KB,二级缓存为512KB~1024KB。封装上和奔腾4类似加入了金属保护壳,防止压碎。

K8处理器有面向主流市场的Athlon 64、顶级的Athlon 64 FX以及专业级产品Opteron,接口也分为Socket 754和Socket 940两种。

[转帖]芯片相关-- Cpu历史--AMD系列_Chrome_08

图6 两种封装,后者支持双通道内存

2006年第一季度,AMD处理器10年的繁荣期达到顶峰,在X86市场的份额达到近50%,Intel Pentium 4最终完败。不过此时,笔记本平台上的Intel Pentium M处理器却大获成功。成功往往伴随对手失误。

Tips:2001 年 8 月,Intel 的基于 NetBurst 架构的奔腾 4 系列开始铺货,首批型号代号为 Willamette,频率来到了史无前例的 2GHz。NetBurst 架构的宗旨是采用较长的流水线,通过几乎是暴力提升频率的简单方法来达到提升性能的效果。2005 年 5 月,这次是 Intel,抢先发布了史上第一款双核 CPU:奔腾 D。不过,奔腾 D 是由两颗 P4 的核心共享 FSB 组成,本质上还是没有摆脱高功耗低性能的怪圈。一周以后,AMD 就祭出了自己的双核心处理器:Athlon 64 X2,代号 Toledo/Manchester,制程为 90nm, 吊打了奔腾 D。

1.1.5 AMD Zen

2006年,收购加拿大的显卡企业ATI,从此一蹶不振,后来集中精力游戏主机的关注和新架构ZEN的开发,当前市场上有三大游戏主机,微软Xbox,索尼PlayStation和任天堂Wii都是用AMD处理器。

距K8后的下一次翻身就是zen架构。

Zen的L1缓存在大小和关联性都翻倍了,而且是写回式而不是穿透式。同时采用了非对称 L/S 单元,因为在大多数情况下 load 操作比 store 要频繁得多。指令缓存不再是两个核心共享,同时关联性也翻倍,这将减少缓存未命中的情况。

1.1.6 AMD Zen2

“Zen 2”核心在久负盛名的“Zen”架构之上进行了重大更新。主要优势如下:

时钟周期指令数提升高达 15%2

3 级高速缓存容量翻倍(高达 32MB)

浮点吞吐能力翻倍(256 位)

OpCache 容量翻倍(4K)

Infinity Fabric 带宽翻倍(512 位)

全新的 TAGE 分支预测器

https://www.amd.com/zh-hans/technologies/zen-core

1.1.7 AMD Zen3

Hot Chips 2021大会上AMD发布了Zen3架构处理器

一是提升单线程性能,专业名词叫IPC(每时钟周期指令数),毕竟之前几代一直追求多核心为主,是时候把单核性能提升到足够的高度了,不然始终是瘸着脚走路,缺乏长久竞争力。

二是在维持8核心CCD模块的前提下,统一核心与缓存,提升彼此通信效率,降低延迟。

三是继续提高能效比,性能提升的同时功耗不能失控。

AMD Zen 3 CCD的尺寸为83.736mm2(11.270 x 7.430mm)。Zen 2 CCD约为72mm2,这使得Zen 3的尺寸比Zen 2大16%。12nmIOD(I/O Die)的尺寸与Ryzen 3000系列相同,为124.29mm2(12.900 x 9.635mm)并使其插入器上最大的芯片。

[转帖]芯片相关-- Cpu历史--AMD系列_浮点_09

 

为此,Zen3架构对于所有模块都进行了翻新,前端、预取、解码、执行、整数、浮点、载入、存储、缓存等等,每个环节都是焕然一新。

首先,Zen3设计了一个堪称艺术级的分支预测器,它之后有两条通道将指令送入队列,然后进行分派,一是8路关联的32KB一级指令缓存和x86解码器,二是4K指令的操作缓存(Op-cache)。

x86解码器的限制是每个时钟周期只能处理最多4条指令,但如果是熟悉的指令,就可以放入操作缓存,每个周期就能处理8条,二者结合指令分发效率就大大提升,相比于Zen2直接上升了一个档次。

指令分派之后就来到执行引擎阶段,分为整数、浮点两大部分,每个时钟周期可以向它们分派6条指令。

其中,整数单元还是4个,但更加分散,并增加了一个单独的分支与数据存储单元,提升吞吐量,每时钟周期可以生成3个地址。

浮点方面则分为六条流水线,进一步提升吞吐量和效率。

内存方面,每时钟周期可以执行3个载入,或者1个载入加2个存储,再次提升吞吐量,并且可以更灵活地处理不同工作负载。

[转帖]芯片相关-- Cpu历史--AMD系列_浮点_10

图7 Zen2对比Zen3

前端方面,主要有容量翻番的L1 BTB、更大的分支预测器带宽、更快的预测错误恢复、更快的操作缓存拾取、更精细的操作缓存流水线切换,等等。

执行引擎方面,主要有独立的分支与数据存储单元、更大的整数窗口、更低的特定整数/浮点指令延迟、6宽度拾取与分发、更宽的浮点分派、更快的浮点FMAC(乘法累加器),等等。

载入/存储方面,主要有更高的载入带宽(2个变3个)、更高的存储带宽(1个变2个)、更灵活的载入/存储指令、更好的内存依赖检测,等等。

https://news.mydrivers.com/1/722/722438.htm

世间本没有魔法,只是我们还不了解,导致让它看起来像有魔法一样。

下期预告:

除了我们常见的Intel和amd外,另外在通用cpu舞台上,还有哪些过客或目前在某些特殊领域依旧在发挥价值的公司和cpu种类。

上期回顾: