本文分享自天翼云开发者社区《私有云服务器虚拟化超分比及资源扩容管理》,作者:7****m

服务器虚拟化技术已商用多年,并已成为云计算产业发展的基石。私有云用户更是非常关注服务器虚拟化的超分比,因为直接影响到用户可用的虚机资源量。

超分比技术介绍:

服务器虚拟化超分比,就是控制宿主机最大开出的vcpu资源数,当设置的超分比高时,可开出的最大vCPU资源就多。真正影响虚机性能的还是物理CPU的利用率,即物理CPU低并发没什么影响,高并发下超分比过高会增加CPU调度产生的性能损耗。

举例,资源池物理资源总核数为100核,无论是3倍还是4倍的超分比,当已开出的虚机vCPU小于100核时,云主机独立占用CPU的时间片,性能和独享CPU性能基本一致。

当开出的虚机vCPU是300核在运行时,无论是3倍还是4倍的超分比,性能也是一样的,都是3vCPU共同使用一个CPU的时间片,此时CPU调度开销相比独享CPU时增加。

当开出的虚机vCPU是400核(>=4倍超分比)在运行时,相比于3倍超分,是4vCPU共用一个CPU的时间片,此时CPU调度开销以及单vCPU性能相比3倍超分时增加。

当物理CPU实际利用率较高时,就会存在CPU时间片竞争,导致性能可能不满足业务的需求。

综合上述,当物理服务器资源不变或扩容周期较长的情况下,超分比的设置应根据业务实际和负载预测合理配置,避免设置明显过高的超配比,在物理资源高负载的情况下,不能及时对物理资源扩容影响了整体虚机业务性能;当业务发展快速,物理服务器较容易按业务需求扩容时,应设置偏高的超配比,保障业务应用所需资源可及时满足。

资源扩容管理建议

私有云用户应根据物理服务器资源利用率、虚拟化超分比制定计算、存储、网络、安全等资源的扩容机制,在物理资源使用率达到扩容阈值时及时扩容资源。以宿主机服务器扩容举例。

宿主机扩容可参考两个核心指标,一是物理CPU 资源利用率,二是内存资源利用率。

宿主机CPU 利用率,即承载虚拟机运行的物理服务器的 CPU 利用率,该指标平均值范围在[10%,60%]通常视为合理区间。以天为观察周期,连续3天利用率低于 10%,认定该宿主机CPU 为轻载;连续3天利用率高于 60%,认定该宿主机 CPU 过载。

计算资源池 CPU平均利用率,即计算资源池中所有宿主机 CPU 每天平均利用率之和除以宿主机数量所得数值,该指标在[10%,50%]通常视为合理区间。以周为观察周期,连续2周利用率低于 10%,认定该资源池宿主机 CPU 为轻载;连续2周利用率高于 50%,认定该资源池宿主机CPU 过载。

宿主机内存利用率,即承载虚拟机运行的物理服务器的内存利用率,该指标平均值范围在[60%,90%]视为合理区间。以天为观察周期,连续3天利用率低于60%,认定该宿主机内存为轻载;连续3天利用率高于 90%,认定该宿主机内存为过载。

计算资源池内存平均利用率,即计算资源池中所有宿主机内存平均利用率之和除以宿主机数量所得数值,该指标在[60%,90%]视为合理区间。以周为观察周期,连续2周利用率低于60%,认定该资源池内存为轻载;连续2周利用率高于 90%,认定该资源池内存过载。

宿主机CPU(内存)为过载情况下,此宿主机的部分虚机应当迁移至其余CPU(内存)负载较低的宿主机;计算资源池宿主机CPU(内存)为过载情况下,应当及时扩容物理服务器数量加入资源池。

宿主机CPU(内存)为轻载情况下,可将其余CPU(内存)负载较高宿主机上的虚机迁移部分过来;计算资源池宿主机CPU为轻载情况下,且资源池可用vCPU已基本用完,可提高虚拟化超分比增加可用vCPU资源开通新的虚机。