1 介绍

        微服务架构中的应用优雅停机主要是指应用实例有计划而平滑(即不产生需要处理的事故)的退出。应用服务器的停机主要分为两类:主动停机和被动停机,而其中主动停机和大部分的被动停机都是可以实现优雅停机。如果应用不做优雅停机,则会带来以下情况:

  • 数据丢失:内存的中数据尚未持久化至磁盘
  • 文件损坏:正在操作写的文件因没有更新完成,导致文件损坏
  • 请求丢失:排队中等待处理的请求丢失
  • 响应丢失:成功的交易还没来得及做出响应
  • 交易中断:正在处理至中间状态的交易被强制中断
  • 服务未下线:上游服务依然还会继续往下游服务发送消费请求

        而我们微服务的优雅升级的目标就是避免以上几种情况,从而避免人工干预的工作量和提升微服务架构的服务高可靠。

2 使用场景

优雅停机可以解决以下场景:

  • KILL PID
  • 应用意外自动退出(System.exit(n))
  • 使用脚本命令的方式停止应用

优雅停机解决不了以下场景:

  • 突然断电
  • 机器物理破坏
  • KILL-9 PID 或 taskkill /f /pid

3 ShutdownHook

        Java的优雅停机通常通过注册JDK的ShutdownHook(钩子)来实现,当系统接收到退出指令后,首先标记系统处于退出状态,不再接收新的消息,然后将积压的消息处理完,最后调用资源回收接口将资源销毁,最后各线程退出执行。简单的使用demo案例如下(简单版):

/**
 * 优雅停机处理方式
 * 
 * @author lry
 **/
public class Main{

    /**
     * 启动应用
     **/
    public void start(){
        // 第一步:启动应用服务……

        // 第二步:注册JDK钩子
        Runtime.getRuntime().addShutdownHook(new Thread(new Runnable() {
            @Override
            public void run() {
                System.out.println("The hook running...");
                //第三步:调用停机处理
                stop();
            }
        }));
    }

    /**
     * 停止应用
     **/
    public void stop(){
        // 停止应用前停机处理(如:注销服务、标记不接受请求等)
    }

}

超时控制
        通常优雅退出需要有超时控制机制,如果到达超时时间仍然没有完成退出前的资源回收等操作,则由停机脚本直接调用KILL -9 PID的方式进行强制退出,不然可能会等待很长时间。

4 微服务优雅停机

        微服务的优雅停机没有统一的解决方案,只要抓住核心思想进行设计即可:
        引流 → 挡板 → 等待停机

        但在微服务架构中,我们可以遵守以下建议规则来设计微服务的优雅停机机制:

  • 所有微服务应用都应该支持优雅停机
  • 优先注销注册中心注册的服务实例
  • 待停机的服务应用的接入点标记拒绝服务
  • 上游服务支持故障转移因优雅停机而拒绝的服务
  • 根据具体业务也提供适当的停机接口

    微服务应用的优雅停机根据其使用者角色的不同,而主要分为两种类型:

  • 微服务业务应用优雅停机设计:

微服务业务应用优雅停机设计

  • 微服务网关应用优雅停机设计:
    微服务网关应用优雅停机设计

    其余各层设备的优雅停机都可从以上两种类型进行衍生出解决方案,如:

  • 整个后端架构升级,则可从DNS或Nginx直接切换
  • Nginx层升级,则可以从DNS直接切换

5 使用案例

        在业界开源的产品中,很多产品都使用了JDK钩子的方式来实现优雅停机,如以下产品:

  • Netty
  • DUBBO