一、认识HPA
参考: https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale/
- HPA全称是Horizontal Pod Autoscaler,中文意思是POD水平自动伸缩.
- 可以基于 CPU 利用率自动扩缩 ReplicationController、Deployment、ReplicaSet 和 StatefulSet 中的 Pod 数量。
- 除了 CPU 利用率,内存占用外,也可以基于其他应程序提供的自定义度量指标来执行自动扩缩。
自定义度量参考: https://github.com/kubernetes/community/blob/master/contributors/design-proposals/instrumentation/custom-metrics-api.md
- Pod 自动扩缩不适用于无法扩缩的对象,比如 DaemonSet。
- Pod 水平自动扩缩特性由 Kubernetes API 资源和控制器实现。资源决定了控制器的行为。
- 控制器会周期性的调整副本控制器或 Deployment 中的副本数量,以使得 Pod 的平均 CPU 利用率与用户所设定的目标值匹配。
二、HPA工作机制
Pod 水平自动扩缩器的实现是一个控制回路,由控制器管理器的 --horizontal-pod-autoscaler-sync-period 参数指定周期(默认值为 15 秒)。 每个周期内,控制器管理器根据每个 HorizontalPodAutoscaler 定义中指定的指标查询资源利用率。 控制器管理器可以从资源度量指标 API(按 Pod 统计的资源用量)和自定义度量指标 API(其他指标)获取度量值。
- 对于按 Pod 统计的资源指标(如 CPU), 控制器从资源指标 API 中获取每一个 HorizontalPodAutoscaler 指定的 Pod 的度量值,如果设置了目标使用率, 控制器获取每个 Pod 中的容器资源使用情况,并计算资源使用率。 如果设置了 target 值,将直接使用原始数据(不再计算百分比)。 接下来,控制器根据平均的资源使用率或原始值计算出扩缩的比例,进而计算出目标副本数。
需要注意的是,如果 Pod 某些容器不支持资源采集,那么控制器将不会使用该 Pod 的 CPU 使用率。
-
如果 Pod 使用自定义指示,控制器机制与资源指标类似,区别在于自定义指标只使用 原始值,而不是使用率。
-
如果 Pod 使用对象指标和外部指标(每个指标描述一个对象信息)。 这个指标将直接根据目标设定值相比较,并生成一个上面提到的扩缩比例。 在
autoscaling/v2beta2
版本 API 中,这个指标也可以根据 Pod 数量平分后再计算。
通常情况下,控制器将从一系列的聚合 API(metrics.k8s.io、custom.metrics.k8s.io 和 external.metrics.k8s.io)中获取度量值。 metrics.k8s.io API 通常由 Metrics 服务器(需要额外启动)提供。
确认安装metrics-server
kubectl get pods -n kube-system |grep metrics-server
kubectl top nodes
三、HPA API对象
HPA的API有三个版本 kubectl api-versions | grep autoscal
APA版本 | 描述 |
---|---|
autoscaling/v1 | 只支持基于CPU指标的缩放 |
autoscaling/v2beta1 | 支持Resource Metrics(资源指标,如pod的CPU)和Custom Metrics(自定义指标)的缩放; |
autoscaling/v2beta2 | 支持Resource Metrics(资源指标,如pod的CPU)和Custom Metrics(自定义指标)和ExternalMetrics(额外指标)的缩放。 |
四、kubectl对HPA的支持
与其他 API 资源类似kubectl 以标准方式支持 HPA。
- 通过 kubectl create 命令创建一个 HPA 对象
- 通过 kubectl get hpa 命令来获取所有 HPA 对象
- 通过 kubectl describe hpa 命令来查看 HPA 对象的详细信息
- 通过 kubectl delete hpa 命令删除对象。
此外,还有个简便的命令 kubectl autoscale 来创建 HPA 对象。 例如,命令 kubectl autoscale rs foo --min=2 --max=5 --cpu-percent=80 将会为名 为 foo 的 ReplicationSet 创建一个 HPA 对象, 目标 CPU 使用率为 80%,副本数量配置为 2 到 5 之间。
五、HPA演示案例
参考: https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/
基于CPU的HPA
1, 构建测试镜像
vim index.php
<?php
$x = 0.0001;
for ($i = 0; $i <= 1000000; $i++) {
$x += sqrt($x);
}
echo "OK!";
?>
vim Dockerfile
FROM php:5-apache
COPY index.php /var/www/html/index.php
RUN chmod a+rx index.php
docker build -f Dockerfile -t 192.168.154.137/library/hpa-example:v1 .
2, 上传到harbor
docker login 192.168.154.137 docker push 192.168.154.137/library/hpa-example:v1
3, 部署测试deployment
vim php-apache.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
name: php-apache
spec:
selector:
matchLabels:
app: php-apache
replicas: 1
template:
metadata:
labels:
app: php-apache
spec:
containers:
- name: php-apache
image: 192.168.154.137/library/hpa-example:v1
ports:
- containerPort: 80
resources:
limits:
cpu: 500m
requests:
cpu: 200m
kubectl apply -f php-apache.yaml
4, 验证得到pod-IP
kubectl get pods -o wide
得到pod-IP为172.20.166.164,此IP下面测试需要用到
5, 创建HPA
kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
说明:
--cpu-percent=50表示所有Pod的平均CPU使用率维持在50%,超过就要扩容 --min=1 --max=10表示pod数量的范围
kubectl get hpa
看到目前CPU还是0%
6, 创建测试pod对其访问
用另一个终端(我这里是master2)使用busybox镜像产生一个测试pod,对172.20.166.164 进行压测
[root@master2 ~]# kubectl run busybox -it --image=busybox /bin/sh
/ # while true; do wget -q -O- http://172.20.166.164; done
****不断查询hpa状态,大概一分钟后才会看到效果
kubectl get hpa
cpu用到106%了
kubectl get pods
也可以看到pod扩容到了5个
[root@master2 ~]# kubectl run busybox -it --image=busybox /bin/sh
/ # while true; do wget -q -O- http://172.20.166.164; done
ctrl+c取消压力测试
要等几分钟甚至更久后,就看到cpu与pod数量都回去了
kubectl get hpa
kubectl get pods
7, 测试完后删除
kubectl delete deployments.apps php-apache kubectl delete pod busybox kubectl delete hpa php-apache
基于内存的HPA
1, 创建测试deployment
vim nginx-hpa.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-hpa
spec:
selector:
matchLabels:
app: nginx-hpa
replicas: 1
template:
metadata:
labels:
app: nginx-hpa
spec:
containers:
- name: nginx
image: nginx:1.15-alpine
ports:
- containerPort: 80
name: http
protocol: TCP
resources:
requests:
cpu: 0.01
memory: 25Mi
limits:
cpu: 0.05
memory: 60Mi
kubectl apply -f nginx-hpa.yaml
2, 创建HPA
vim mem-hpa.yaml
apiVersion: autoscaling/v2beta1 # v2beta1版本
kind: HorizontalPodAutoscaler
metadata:
name: nginx-hpa
spec:
maxReplicas: 10
minReplicas: 1 # 1-10个pod范围内扩容与裁剪
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: nginx-hpa
metrics:
- type: Resource
resource:
name: memory
targetAverageUtilization: 50 # 50%内存利用
kubectl apply -f mem-hpa.yaml kubectl get hpa
3, 对pod进行测试
换一个终端(master2),进入pod后进行dd命令测试
[root@master2 ~]# kubectl exec -it nginx-hpa-b9fb96f5c-bhzwm -- /bin/sh / # dd if=/dev/zero of=/tmp/file1
4, 验证
不断查询hpa状态,大概一分钟后才会看到效果
kubectl get hpa
kubectl get pods
5, 裁剪测试
ctrl+c取消后,删除dd的文件
[root@master2 ~]# kubectl exec -it nginx-hpa-74ccf95f7d-454z5 -- /bin/sh / # rm /tmp/file1 -rf
等几分钟甚至更久后,就看到cpu与pod数量都回去了*
kubectl get hpa
kubectl get pods |grep nginx-hpa
6, 测试完后删除
kubectl delete deploy nginx-hpa kubectl delete hpa nginx-hpa