一、认识HPA

参考: https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale/

  • HPA全称是Horizontal Pod Autoscaler,中文意思是POD水平自动伸缩.
  • 可以基于 CPU 利用率自动扩缩 ReplicationController、Deployment、ReplicaSet 和 StatefulSet 中的 Pod 数量。
  • 除了 CPU 利用率,内存占用外,也可以基于其他应程序提供的自定义度量指标来执行自动扩缩。

自定义度量参考: https://github.com/kubernetes/community/blob/master/contributors/design-proposals/instrumentation/custom-metrics-api.md

  • Pod 自动扩缩不适用于无法扩缩的对象,比如 DaemonSet。
  • Pod 水平自动扩缩特性由 Kubernetes API 资源和控制器实现。资源决定了控制器的行为。
  • 控制器会周期性的调整副本控制器或 Deployment 中的副本数量,以使得 Pod 的平均 CPU 利用率与用户所设定的目标值匹配。

二、HPA工作机制

Pod 水平自动扩缩器的实现是一个控制回路,由控制器管理器的 --horizontal-pod-autoscaler-sync-period 参数指定周期(默认值为 15 秒)。 每个周期内,控制器管理器根据每个 HorizontalPodAutoscaler 定义中指定的指标查询资源利用率。 控制器管理器可以从资源度量指标 API(按 Pod 统计的资源用量)和自定义度量指标 API(其他指标)获取度量值。

  • 对于按 Pod 统计的资源指标(如 CPU), 控制器从资源指标 API 中获取每一个 HorizontalPodAutoscaler 指定的 Pod 的度量值,如果设置了目标使用率, 控制器获取每个 Pod 中的容器资源使用情况,并计算资源使用率。 如果设置了 target 值,将直接使用原始数据(不再计算百分比)。 接下来,控制器根据平均的资源使用率或原始值计算出扩缩的比例,进而计算出目标副本数。

需要注意的是,如果 Pod 某些容器不支持资源采集,那么控制器将不会使用该 Pod 的 CPU 使用率。

  • 如果 Pod 使用自定义指示,控制器机制与资源指标类似,区别在于自定义指标只使用 原始值,而不是使用率。

  • 如果 Pod 使用对象指标和外部指标(每个指标描述一个对象信息)。 这个指标将直接根据目标设定值相比较,并生成一个上面提到的扩缩比例。 在 autoscaling/v2beta2 版本 API 中,这个指标也可以根据 Pod 数量平分后再计算。

通常情况下,控制器将从一系列的聚合 API(metrics.k8s.io、custom.metrics.k8s.io 和 external.metrics.k8s.io)中获取度量值。 metrics.k8s.io API 通常由 Metrics 服务器(需要额外启动)提供。

确认安装metrics-server

kubectl get pods -n kube-system |grep metrics-server

kubectl top nodes

三、HPA API对象

HPA的API有三个版本 kubectl api-versions | grep autoscal

APA版本 描述
autoscaling/v1 只支持基于CPU指标的缩放
autoscaling/v2beta1 支持Resource Metrics(资源指标,如pod的CPU)和Custom Metrics(自定义指标)的缩放;
autoscaling/v2beta2 支持Resource Metrics(资源指标,如pod的CPU)和Custom Metrics(自定义指标)和ExternalMetrics(额外指标)的缩放。

四、kubectl对HPA的支持

与其他 API 资源类似kubectl 以标准方式支持 HPA。

  • 通过 kubectl create 命令创建一个 HPA 对象
  • 通过 kubectl get hpa 命令来获取所有 HPA 对象
  • 通过 kubectl describe hpa 命令来查看 HPA 对象的详细信息
  • 通过 kubectl delete hpa 命令删除对象。

此外,还有个简便的命令 kubectl autoscale 来创建 HPA 对象。 例如,命令 kubectl autoscale rs foo --min=2 --max=5 --cpu-percent=80 将会为名 为 foo 的 ReplicationSet 创建一个 HPA 对象, 目标 CPU 使用率为 80%,副本数量配置为 2 到 5 之间。

五、HPA演示案例

参考: https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/

基于CPU的HPA

1, 构建测试镜像

vim index.php

<?php
  $x = 0.0001;
  for ($i = 0; $i <= 1000000; $i++) {
    $x += sqrt($x);
  }
  echo "OK!";
?>

vim Dockerfile

FROM php:5-apache
COPY index.php /var/www/html/index.php
RUN chmod a+rx index.php

docker build -f Dockerfile -t 192.168.154.137/library/hpa-example:v1 .

2, 上传到harbor

docker login 192.168.154.137 docker push 192.168.154.137/library/hpa-example:v1

3, 部署测试deployment

vim php-apache.yaml

apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-apache
spec:
  selector:
    matchLabels:
      app: php-apache
  replicas: 1
  template:
    metadata:
      labels:
        app: php-apache
    spec:
      containers:
      - name: php-apache
        image: 192.168.154.137/library/hpa-example:v1
        ports:
        - containerPort: 80
        resources:
          limits:
            cpu: 500m
          requests:
            cpu: 200m

kubectl apply -f php-apache.yaml

4, 验证得到pod-IP

kubectl get pods -o wide

得到pod-IP为172.20.166.164,此IP下面测试需要用到

5, 创建HPA

kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10

说明:

--cpu-percent=50表示所有Pod的平均CPU使用率维持在50%,超过就要扩容 --min=1 --max=10表示pod数量的范围

kubectl get hpa

看到目前CPU还是0%

6, 创建测试pod对其访问

用另一个终端(我这里是master2)使用busybox镜像产生一个测试pod,对172.20.166.164 进行压测

[root@master2 ~]# kubectl run busybox -it --image=busybox /bin/sh

/ # while true; do wget -q -O- http://172.20.166.164; done

****不断查询hpa状态,大概一分钟后才会看到效果

kubectl get hpa

cpu用到106%了

kubectl get pods

也可以看到pod扩容到了5个

[root@master2 ~]# kubectl run busybox -it --image=busybox /bin/sh

/ # while true; do wget -q -O- http://172.20.166.164; done

ctrl+c取消压力测试

要等几分钟甚至更久后,就看到cpu与pod数量都回去了

kubectl get hpa

kubectl get pods

7, 测试完后删除

kubectl delete deployments.apps php-apache kubectl delete pod busybox kubectl delete hpa php-apache

基于内存的HPA

1, 创建测试deployment

vim nginx-hpa.yaml

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-hpa
spec:
  selector:
    matchLabels:
      app: nginx-hpa
  replicas: 1
  template:
    metadata:
      labels:
        app: nginx-hpa
    spec:
      containers:
      - name: nginx
        image: nginx:1.15-alpine
        ports:
        - containerPort: 80
          name: http
          protocol: TCP
        resources:
          requests:
            cpu: 0.01
            memory: 25Mi
          limits:
            cpu: 0.05
            memory: 60Mi

kubectl apply -f nginx-hpa.yaml

2, 创建HPA

vim mem-hpa.yaml

apiVersion: autoscaling/v2beta1				# v2beta1版本
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
spec:
  maxReplicas: 10
  minReplicas: 1							# 1-10个pod范围内扩容与裁剪
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-hpa
  metrics:
  - type: Resource				
    resource:
      name: memory
      targetAverageUtilization: 50			# 50%内存利用

kubectl apply -f mem-hpa.yaml kubectl get hpa

3, 对pod进行测试

换一个终端(master2),进入pod后进行dd命令测试

[root@master2 ~]# kubectl exec -it nginx-hpa-b9fb96f5c-bhzwm -- /bin/sh / # dd if=/dev/zero of=/tmp/file1

4, 验证

不断查询hpa状态,大概一分钟后才会看到效果

kubectl get hpa

kubectl get pods

5, 裁剪测试

ctrl+c取消后,删除dd的文件

[root@master2 ~]# kubectl exec -it nginx-hpa-74ccf95f7d-454z5 -- /bin/sh / # rm /tmp/file1 -rf

等几分钟甚至更久后,就看到cpu与pod数量都回去了*

kubectl get hpa

kubectl get pods |grep nginx-hpa

6, 测试完后删除

kubectl delete deploy nginx-hpa kubectl delete hpa nginx-hpa