最近,一位同事急匆匆跑过来跟我说:糟糕了,服务器CPU的使用率达100%了。
我心想不可能啊,CPU有那么多核,怎会跑满?于是看了一眼,结果虚惊一场。
这位同事看到的100%,并非指整个CPU使用率到了100%,而是指CPU某些核的使用率到了100%.
趁此机会,我来聊聊与CPU相关的概念,对很多软件开发和运维人员来说,这些概念是必须要掌握的:
- CPU主频
- 多个CPU
- 多核CPU
- 逻辑核(超线程)
- 大小端
以一款CPU为例,看下具体参数:
CPU主频(时钟频率)
在上面这些参数中,人们最熟知的是CPU主频(时钟频率)。买电脑时,肯定需要看CPU主频是多少。
我们知道:CPU时钟越快,产生上升沿/下降沿的速度就越快,就能更快地迫使其它器件做相应工作。
CPU的时钟,就像龙舟比赛的击鼓人,击鼓频率越快,就迫使划船的人跟上节奏,结果龙舟也越快。
从CPU参数可以看到,该CPU有12个物理核,每个物理核对应2个逻辑核(超线程技术)。所以,从外部看,该CPU有24个核(逻辑核)。
也就是说,该CPU有12个物理上的运算器&控制器,有24个逻辑上的运算器&控制器。
多个CPU
我们看linux命令lscpu给出的信息:
Socket(s): 2
可以看到,在这台服务器上,总共插了2个CPU, 这2个CPU是物理上的CPU, 人眼可以看到,手也可以触摸到:
多核CPU
我们看linux命令lscpu给出的信息:
Core(s) per socket: 12
可以看到,针对每一个物理CPU而言,内部有12个物理核。也就是说,在一个物理CPU内,有12个物理层面的运算器&控制器,它们是实实在在存在的。
很霸气的感觉,12个物理核如下图所示:
逻辑核(超线程)
我们看linux命令lscpu给出的信息:
Thread(s) per core: 2
由于Intel采用了超线程技术,所以每个物理核对应2个逻辑核:
要注意,在物理上看来,只有一个核,但采用了超线程技术,在使用时,实际效果是2个核在同时并行(不是同步并发)工作,也即有2个逻辑核,如下图所示:
那么,在上面这台服务器中,有多少个逻辑核呢?
服务器中插有2个物理CPU, 每个物理CPU有12个物理核,每个物理核有2个逻辑核,故总共48个逻辑核。
因此,当操作系统俯视CPU硬件时,它看到的是,在计算机中,有48个核,即有48个运算器&控制器。
对于操作系统而言,它可以认为有48个CPU核在同时并行(不是同步并发)为它提供服务,lscpu查出的信息如下:
CPU(s): 48
这里的48个CPU(s), 其实就是48个逻辑核。有时,我们也可以说,这台服务器有48个核。
这台服务器有2个CPU, 针对其中一个CPU,我们也可以说,它是"12核24线程"。
操作系统对核的分配
需要注意的是,如上的服务器有2个CPU, 每个CPU有12物理核,每个物理核有2个逻辑核,这仅仅是针对特定服务器和CPU的。
其他计算机或者CPU, 就不一定如此了。来看我的另外一台服务器,配置略微寒酸:总共只有1个CPU, 1个物理核,1个逻辑核:
ubuntu@VM-0-15-ubuntu:~$ lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 1
On-line CPU(s) list: 0
Thread(s) per core: 1
Core(s) per socket: 1
Socket(s): 1
NUMA node(s): 1
Vendor ID: GenuineIntel
CPU family: 6Model: 79
Model name: Intel(R) Xeon(R) CPU E5-26xx v4
Stepping: 1CPU MHz: 2394.446
BogoMIPS: 4788.89
Hypervisor vendor: KVM
Virtualization type: full
L1d cache: 32K
L1i cache: 32K
L2 cache: 4096K
NUMA node0 CPU(s): 0
Flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx lm constant_tsc rep_good nopl eagerfpu pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch bmi1 avx2 bmi2 rdseed adx xsaveopt
ubuntu@VM-0-15-ubuntu:~$
如果在这个单核服务器上,运行如下的死循环程序,会如何呢?
#include <stdio.h>int main(){ while(1); // 死循环 return 0;}
观察top命令给出的结果,可以看到,1个进程就消耗了大约99.0%的CPU,整个CPU的使用率达到99.7%:
那么,如果开启2个进程并发执行呢?可以看到,每个进程几乎都是占用49.x%的CPU,整个CPU的使用率达到99.7%:
那么,如果开启3个进程并发执行呢?可以看到,每个进程几乎都是占用32.x%的CPU,整个CPU的使用率达到98.7%:
可以看到,整个CPU几乎被瓜分殆尽。这种调度和分配,是由操作系统完成的。
再来看多核CPU的情况,我找了另一台服务器,有32个逻辑核,简称32个核。运行一下死循环进程,用top命令来分析。
可以看到,1个进程占满1个核,使用率100%, 而服务器32个核的使用率是3.6%:
运行2个进程,可以看到,2个进程都占用99.7%的核,而服务器32个核的使用率是6.5%:
运行3个进程,可以看到,3个进程都占用100%的核,而服务器32个核的使用率是9.8%:
看到使用率为100%时,不要紧张,不要以为CPU就用完了,这台服务器有32个核呢(拥有3200%的能力)。
来看下3个进程时,每个核的具体使用情况(3个进程,总共大概占用300%的核):
这些值会动态地变化,而且不一定是消耗在某些固定的核上。核的调度和资源分配,由操作系统来完成:
CPU大小端
最后,来看一个大小端的问题,看lscpu命令的信息:
Byte Order: Little Endian
它的含义是: CPU是小端模式。相信几乎所有的程序员都听说过这个概念,我们具体来测试一下。
下面是在Intel CPU + Windows + VC++6.0上的测试结果,可以看到:低位的0x78存储在地址较小的位置(小端模式):
下面是对8051单片机进行的仿真测试,可以看到:高位的0x12存储在地址较小的位置(大端模式):
至此为止,我们对CPU的基本参数有了大致了解,这也是linux相关的开发、运维人员必须掌握的。
以后也可以谈笑风生地聊多个CPU、多核CPU、逻辑核和大小端了,而不是一如既往地一知半解。