k8s hpa 缩容慢

原创

大炮打蚊子 2024-04-07 11:09:19 ©著作权

©著作权归作者所有：来自51CTO博客作者大炮打蚊子的原创作品，请联系作者获取转载授权，否则将追究法律责任

在Kubernetes（K8S）中，Horizontal Pod Autoscaling（HPA）是一种用于自动调整部署中Pod数量的机制，以根据CPU利用率或其他指标来应对应用程序的负载变化。当负载增加时，HPA会自动扩容Pod数量；反之，当负载下降时，HPA会自动缩减Pod数量。

### K8S HPA 缩容慢实现步骤

下表展示了实现K8S HPA缩容慢的步骤：

| 步骤 | 操作 |
| :----: | :---- |
| 1 | 创建一个Deployment和一个HPA |
| 2 | 在Deployment中增加HorizontalPodAutoscaler相关的配置 |
| 3 | 准备一个负载生成工具，如`hey` |
| 4 | 模拟负载增加和减少的情况 |

### 操作步骤详解

#### 步骤1：创建一个Deployment和一个HPA

首先，我们需要创建一个Deployment和一个HPA对象。Deployment是一个用来管理Pod的控制器，而HPA用来自动调整Pod数量。

```yaml
# deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
name: my-app
spec:
replicas: 5
selector:
matchLabels:
app: my-app
template:
metadata:
labels:
app: my-app
spec:
containers:
- name: my-app
image: my-image
resources:
requests:
cpu: 200m
memory: 100Mi
limits:
cpu: 500m

# hpa.yaml
apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
name: my-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: my-app
minReplicas: 1
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 50
```

#### 步骤2：在Deployment中增加HorizontalPodAutoscaler相关的配置

在Deployment的spec中增加`horizontalPodAutoscaler`字段，用来指定与HPA对象的关联。

```yaml
# deployment.yaml
spec:
replicas: 5
horizontalPodAutoscaler:
minReplicas: 1
maxReplicas: 10
targetCPUUtilizationPercentage: 50
```

#### 步骤3：准备一个负载生成工具，如`hey`

在本地或者集群中准备一个负载生成工具，如`hey`，用来模拟访问量的增加和减少。

#### 步骤4：模拟负载增加和减少的情况

使用`hey`来模拟高负载情况，让HPA自动扩容Pod数量；然后停止`hey`，让负载骤降，观察HPA缩容Pod数量的速度。

通过以上步骤，你就可以实现K8S HPA缩容慢的效果了。在实际生产环境中，可以根据实际情况调整HPA的配置，以达到最佳的自动缩容效果。

希望以上内容能够帮助你理解和实现K8S HPA缩容慢的过程，如果有任何疑问，可以随时向我提问。祝你在Kubernetes的学习和实践中获得更多的经验和成长！