云计算-k8s超配理论

精选原创

羊草 2024-09-05 13:40:16 博主文章分类：虚拟化云计算 ©著作权

文章标签 Pod 大数据服务质量 文章分类 运维 私藏项目实操分享

©著作权归作者所有：来自51CTO博客作者羊草的原创作品，请联系作者获取转载授权，否则将追究法律责任

在很多商业k8s方案中，存在所谓的超配，或者超卖，超售比的配置，只要开启就能大幅度提高k8s资源利用率。这里总结了一些原理概念

概念

当前很多业务有波峰和波谷，部署服务时，为了保证服务的性能和稳定性，通常会按照波峰时需要的资源申请，但是波峰的时间可能很短，这样在非波峰时段就有资源浪费。另外，由于在线作业SLA要求较高，为了保证服务的性能和可靠性，通常会申请大量的冗余资源，因此，会导致资源利用率很低、浪费比较严重。

云计算-k8s超配理论_Pod

超配理论及影响分析

超配理论

Kubernetes 生产态和测试态集群是任务态的容器作业执行环境。资源管理组件以资源组为单位对集群计算资源进行管理和分配。

从物理层面看，kubernetes 集群所有node 的可供给资源量（allocatable）可以看作集群的实际资源总量。在大数据云业务逻辑中，正常情况下，总可售资源量总是等于实际资源总量。开启超配后，集群的总可售资源量为集群所有node 的可供给资源量（allocatable）*超配比。

当总可售资源量大于实际资源总量时，理论上容器资源池可以接受更多node 的剩余可分配资源是该node 的可供给资源减去该node 的所有非终止状态的pod 的request 总和的值.

一个node 的所有非终止状态pod 的request 总和占该node 的可供给资源量的比值就是这个node 的资源分配水位。

因此，仅仅将一个集群的总可售资源量设置为大于实际资源总量并不能使集群接受更多 pod 提交。从node 层面看，只有降低pod 的request 值，kubernetes 调度引擎才能将更多的pod 调度到node. 降低pod 的request 值称为pod 压缩。

pod的 limit 即对应于容器作业配置的资源量，这个limit 值同时也受资源组（namespace）的约束。注意，在大数据云资源组实现中，namespace resourcequota 约束的是该namespace 下pod 的limit. 如图，resourcequota 设定了当前namespace 的limits.cpu（namespace下所有pod的CPU限制总和）和limits.memory （namespace下所有pod的内存限制总和）的Hard 值，约束当前namespace 下的所有pod 的limits.cpu 和limits.memory. 由于resourcequota 并没有设定任何request 指标，因此并不会约束该namespace 下的pod 的request 项。

云计算-k8s超配理论_Pod_02

正常情况下，一个 namespace 下所有非终止状态的pod 的limits 总和不能超过namespace resourcequota 规定的limits 值。

对于一个 node, 所有pod 的request 资源总量占比不能超过集群可分配资源的100%, 而limit 资源总量可以超过100%, 即overcommitted.

云计算-k8s超配理论_大数据_03

综上所述，一个 Kubernetes 集群要接受更多pod 提交，

• （1）首先要降低pod 的request 值，以使Kubernetes 调度引擎将更多pod 调度到节点上——这是Kubernetes 本身的机制。

• （2）同时，要设置集群的可售资源总量大于集群实际资源总量，即设置sum(namespace quota) > sum(node allocatable)，这一步即大数据云运营侧面向用户的超额配置设置。

以上两项核心措施可以概括为 pod 压缩和集群超配。这两项措施的目标是使集群接受更多的 pod 提交，但跟集群的实际资源利用率(sum(使用量)/集群所有节点的实际物理资源)并没有直接关系。

影响超配的因素

集群超额配置关注的侧重点是资源分配策略，而利用率跟应用程序的业务相关，是动态的。Kubernetes 的用户、应用开发者必须对自己的应用程序的资源需求（主要是 cpu, mem 资源）有深入理解和把握，据此设置合理的container request 和limit, 以向Kubernetes 提供调度和运行依据。

如果 pod 的实际资源利用率总是很低（低于声明的limit 甚至低于request），则开发者应考虑调整pod 声明的request 和limit.

云计算-k8s超配理论_Pod_04