实用技巧:Spring Cloud中,如何优雅下线微服务?_post请求

在生产环境中,服务的上下线是不可避免的,我们希望能够优雅地下线微服务。本文基于Spring Boot 2.x + Spring Cloud Finchley讲解实际项目中优雅下线服务的四种方式,并探讨各方式的优缺点。

:Spring Boot 1.x + Spring Cloud Edgware及之前的方式相同,但配置有区别,本文不做讨论。

 

方式一:kill java进程【不建议】

使用方式:

1

kill java进程ID

该方式借助的是Spring Boot应用的Shutdown hook,应用本身的下线也是优雅的,但如果你的服务发现组件使用的是Eureka,那么默认最长会有90秒的延迟,其他应用才会感知到该服务下线,这意味着:该实例下线后的90秒内,其他服务仍然可能调用到这个已下线的实例。因此,该方式是不够优雅的 。

方式二:/shutdown 端点【不建议】

Spring Boot提供了/shutdown 端点,可以借助它实现优雅停机。使用方式:

  • 在想下线应用的applicationyml 中添加如下配置,从而启用并暴露/shutdown 端点:

    1

    2

    3

    4

    5

    6

    7

    8

    management:

     endpoint:

       shutdown:

         enabled: true

     endpoints:

       web:

         exposure:

           include: shutdown

  • 发送POST请求到/shutdown 端点

    1

    curl -X http://你想停止的服务地址/actuator/shutdown

该方式本质和方式一是一样的,也是借助Spring Boot应用的Shutdown hook去实现的。

方式三:/pause 端点【生产可用,但有一点缺陷】

Spring Boot应用提供了/pause 端点,利用该端点可实现优雅下线。

使用方式:

  • 在想下线应用的application.yml 中添加配置,从而启用并暴露/pause 端点:

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    management:

     endpoint:

    # 启用pause端点

       pause:

         enabled: true

    # 启用restart端点,之所以要启用restart端点,是因为pause端点的启用依赖restart端点的启用。详见:https://cloud.spring.io/spring-cloud-static/Finchley.SR2/single/spring-cloud.html#_endpoints

       restart:

         enabled: true

     endpoints:

       web:

         exposure:

           include: pause,restart

  • 发送POST请求到/actuator/pause 端点:

    1

    curl -X POST http://你想停止的服务实例地址/actuator/pause

  • 执行后的效果类似下图:

    实用技巧:Spring Cloud中,如何优雅下线微服务?_java_02

    如图所示,该应用在Eureka Server上的状已被标记为DOWN ,但是应用本身其实依然是可以正常对外服务的。在Spring Cloud中,Ribbon做负载均衡时,只会负载到标记为UP 的实例上。利用这两点,你可以:先用pause端点,将要下线的应用标记为DOWN,但不去真正停止应用;然后过一定的时间(例如90秒,或者自己做个监控,看当前实例的流量变成0后)再去停止应用,例如kill 应用 ,当然如果你足够变态,kill -9 也可以 。

缺点&局限

缺点 描述
不同的版本配置不大一样 早期的Spring Cloud版本中,,pause端点是不依赖restart端点的,后来一个pull request导致pause端点必须依赖restart端点…个人给官方提issue,官方最后选择了继续依赖,我也是醉了……
无法和Eureka的健康检查配合使用

如果你的服务发现组件用的是Eureka

,并且你的应用开启了健康检查(eureka.client.healthcheck

.enabled = true ,那么/pause 端点无效!!!

方式四:/service-registry 端点【生产可用】

使用方式:

  • 在想下线应用的application.yml 中添加配置,从而暴露/service-registry 端点:

    1

    2

    3

    4

    5

    management:

    endpoints:

    web:

    exposure:

    include: service-registry

    发送POST请求到/actuator/service-registry 端点:

    1

    2

    curl -X "POST" "http://localhost:8000/actuator/service-registry?status=DOWN" \

    -H "Content-Type: application/vnd.spring-boot.actuator.v2+json;charset=UTF-8"

    实行后的效果类似如下图:

    实用技巧:Spring Cloud中,如何优雅下线微服务?_java_02

    由图可知,使用/service-registry 端点可实现类似/pause 端点的效果。

缺点

暂时没有发现缺点。

拓展一下

在实际项目中,你可以做一个运维工具:

  • 运维工具读取服务发现组件中的所有服务。

  • 有一天你想下线某个服务的时候,就点击该示例的“优雅下线” 按钮,该按钮会请求到想要下线的服务的/pause 端点或者service-registry 端点(看你能不能容忍/pause 端点的缺点),这样就可以把该实例在Eureka上标记为DOWN,流量过一段时间后就不会打到这个实例上。

  • 做一个流量检测工具(例如QPS统计,这种百度随便找下,最简单的一个过滤器 + map就可以做了),如果检测到当前实例确实已经没有流量进入,就在运维工具上点击另一个按钮,例如停止。真正停止应用。

    • 当然,如何停止应用又是另一个问题了,例如你可以请求实例的shutdown端点(Spring Boot提供了优雅下线的端点),或者用脚本kill,或者如果是容器可以借助一些探针……

 

 

更多干货,请关注我

实用技巧:Spring Cloud中,如何优雅下线微服务?_运维工具_04