最近项目开发中遇到了一些不明的尴尬情况,程序运行很长时间都不退出,导致服务崩溃。经过分析,可能会是sql查询永久性等待(与ORM有关)、maven打包前执行maven clean命令,也可能是还没有想到的原因。。。

为了解决这个大bug,至少在原因明了之前暂时应付。我写了一个监控程序运行时间并强制退出的功能,多少安心了。

附scala代码,java自然也是大同小异的。

import org.joda.time.DateTime
import core.traits.LogTrait
object ExitKit extends LogTrait {
  val secondsNum = 1     //s
  val minuteNum = 60     //s
  val hourNum = 3600      //s
  val dayNum = 3600 * 24     //s
  /**
   * ms为单位
   */
  val sleepTime = 10000
  /**
   * 程序异常退出时的code
   */
  val exitCode = 3
  def monitorExit() {
    val excuteTime = sys.props.get("sys.maxExcuteTime")
    if (excuteTime != None) {
      logger.info("进行运行时间控制")
      val timeType = sys.props.getOrElse("sys.timeType", "s").toLowerCase
      var timeLast = excuteTime.get.toInt
      logger.info("sys.timeType:{}", timeType)
      if (timeType == "s") {}
      else if (timeType == "m") {
        timeLast = timeLast * minuteNum
      }
      else if (timeType == "h") {
        timeLast = timeLast * hourNum
      }
      else if (timeType == "d") {
        timeLast = timeLast * dayNum
      }
      logger.info("sys.maxExcuteTime:" + timeLast + " s")
      /**
       * 一个守护线程,如果程序长时间不退出,可以通过它来使程序强行退出,退出时code为 exitCode=3
       */
      val daemonThread = new Thread(new Runnable {
        def run() {
          val start = System.currentTimeMillis()
          var end = start
          while (true) {
            end = System.currentTimeMillis()
            logger.info("end-start:" + (end - start) / 1000 + " s")
            /**
             * 其他地方也可以控制线程是否退出,通过设置sys.othersShut为true
             */
            val othersShut = sys.props.getOrElse("sys.othersShut", "false")
            if (othersShut == "true")
              return
            if ((end - start) / 1000 > timeLast) {
              try {
                logger.info("System.exit(3),原因:(end - start) / 1000 > " + timeLast.toString + " --- start:{},end:{}",
                  new DateTime(start).toString("yyyy-MM-dd HH:mm:ss"), new DateTime(end).toString("yyyy-MM-dd HH:mm:ss"))
              } catch {
                case t: Throwable => logger.info("System.exit(3),原因:(end - start) / 1000 > " + timeLast.toString)
              }
              System.exit(exitCode)
            }
            try {
              Thread.sleep(sleepTime)
              logger.debug("--- monitorExit 休息{}秒 ---", sleepTime.toString)
            } catch {
              case t: Throwable =>
            }
          }
        }
      })
      daemonThread.setDaemon(true)
      println("--thread --- isDaemon? :" + daemonThread.isDaemon)
      daemonThread.start()
    } else {
      logger.info("进行运行时间控制")
    }
  }
}

功能也不是多么厉害,主要涉及了Daemon Thread的特性,解决其他线程在规定时间内已经全部退出时,程序自然也应该不再监控运行时间了,应该退出的问题。