Quartz调度源码分析【面试+工作】

原创

Java帮帮 2022-04-06 16:32:33 ©著作权

文章标签 sql 分布式锁配置文件 文章分类 SQL Server 数据库

©著作权归作者所有：来自51CTO博客作者Java帮帮的原创作品，请联系作者获取转载授权，否则将追究法律责任

前言

本文将具体分析Quartz是如何调度的，是如何通过数据库的方式来现在分布式调度。

调度线程

Quartz内部提供的调度类是QuartzScheduler，而QuartzScheduler会委托QuartzSchedulerThread去实时调度；当调度完需要去执行job的时候QuartzSchedulerThread并没有直接去执行job，

而是交给ThreadPool去执行job，具体使用什么ThreadPool，初始化多线线程，可以在配置文件中进行配置：

Quartz调度源码分析【面试+工作】_配置文件

常用的线程池是SimpleThreadPool，这里默认启动了10个线程，在SimpleThreadPool会创建10个WorkerThread，由WorkerThread去执行具体的job；

调度分析

QuartzSchedulerThread是调度的核心类，具体Quartz是如何实现调度的，可以查看QuartzSchedulerThread核心源码：

Quartz调度源码分析【面试+工作】_配置文件_02

Quartz调度源码分析【面试+工作】_配置文件_03

Quartz调度源码分析【面试+工作】_分布式锁_04

Quartz调度源码分析【面试+工作】_分布式锁_05

Quartz调度源码分析【面试+工作】_分布式锁_06

1.halted和paused

这是两个boolean值的标志参数，分别表示：停止和暂停；halted默认为false，当QuartzScheduler执行shutdown()时才会更新为true；paused默认是true，当QuartzScheduler执行start()时

更新为false；正常启动之后QuartzSchedulerThread就可以往下执行了；

2.availThreadCount

查询SimpleThreadPool是否有可用的WorkerThread，如果availThreadCount>0可以往下继续执行其他逻辑，否则继续检查；

3.acquireNextTriggers

查询一段时间内将要被调度的triggers，这里有3个比较重要的参数分别是：idleWaitTime，maxBatchSize，batchTimeWindow，这3个参数都可以在配置文件中进行配置：

Quartz调度源码分析【面试+工作】_分布式锁_07

idleWaitTime:在调度程序处于空闲状态时，调度程序将在重新查询可用触发器之前等待的时间量（以毫秒为单位），默认是30秒;

batchTriggerAcquisitionMaxCount:允许调度程序节点一次获取（用于触发）的触发器的最大数量，默认是1;

batchTriggerAcquisitionFireAheadTimeWindow:允许触发器在其预定的火灾时间之前被获取和触发的时间（毫秒）的时间量，默认是0;

往下继续查看acquireNextTriggers方法源码：

Quartz调度源码分析【面试+工作】_sql_08

可以发现只有在设置了acquireTriggersWithinLock或者batchTriggerAcquisitionMaxCount>1情况下才使用LOCK_TRIGGER_ACCESS锁，也就是说在默认参数配置的情况下，这里是没有使用锁的，

那么如果多个节点同时去执行acquireNextTriggers，会不会出现同一个trigger在多个节点都被执行？

注：acquireTriggersWithinLock可以在配置文件中进行配置：

Quartz调度源码分析【面试+工作】_配置文件_09

acquireTriggersWithinLock：获取triggers的时候是否需要使用锁，默认是false，如果batchTriggerAcquisitionMaxCount>1最好同时设置acquireTriggersWithinLock为true；

带着问题继续查看TransactionCallback内部的acquireNextTrigger方法源码：

Quartz调度源码分析【面试+工作】_sql_10

Quartz调度源码分析【面试+工作】_sql_11

Quartz调度源码分析【面试+工作】_配置文件_12

首先看一下在执行selectTriggerToAcquire方法时引入了新的参数：misfireTime=当前时间-MisfireThreshold，MisfireThreshold可以在配置文件中进行配置：

Quartz调度源码分析【面试+工作】_sql_13

misfireThreshold：叫触发器超时，比如有10个线程，但是有11个任务，这样就有一个任务被延迟执行了，可以理解为调度引擎可以忍受这个超时的时间；具体的查询SQL如下所示：

Quartz调度源码分析【面试+工作】_sql_14

这里的noLaterThan=当前时间+idleWaitTime+batchTriggerAcquisitionFireAheadTimeWindow，

noEarlierThan=当前时间-MisfireThreshold；

在查询完之后，会遍历执行updateTriggerStateFromOtherState()方法更新trigger的状态从STATE_WAITING到STATE_ACQUIRED，并且会判断rowsUpdated是否大于0，这样就算多个节点都查询到相同的trigger，但是肯定只会有一个节点更新成功；更新完状态之后，往qrtz_fired_triggers表中插入一条记录，表示当前trigger已经触发，状态为STATE_ACQUIRED；

4.executeInNonManagedTXLock

Quartz的分布式锁被用在很多地方，下面具体看一下Quartz是如何实现分布式锁的，executeInNonManagedTXLock方法源码如下：

Quartz调度源码分析【面试+工作】_配置文件_15

Quartz调度源码分析【面试+工作】_配置文件_16

大致分成3个步骤：获取锁，执行逻辑，释放锁；getLockHandler().obtainLock表示获取锁txCallback.execute(conn)表示执行逻辑，commitConnection(conn)表示释放锁

Quartz的分布式锁接口类是Semaphore，默认具体的实现是StdRowLockSemaphore，具体接口如下：

Quartz调度源码分析【面试+工作】_sql_17

具体看一下obtainLock()是如何获取锁的，源码如下：

Quartz调度源码分析【面试+工作】_sql_18

Quartz调度源码分析【面试+工作】_分布式锁_19

obtainLock首先判断是否已经获取到锁，如果没有执行方法executeSQL，其中有两条重要的SQL，分别是：expandedSQL和expandedInsertSQL，以SCHED_NAME = ‘myScheduler’为例：

Quartz调度源码分析【面试+工作】_sql_20

select语句后面添加了FOR UPDATE，如果LOCK_NAME存在，当多个节点去执行此SQL时，只有第一个节点会成功，其他的节点都将进入等待；

如果LOCK_NAME不存在，多个节点同时执行expandedInsertSQL，只会有一个节点插入成功，执行插入失败的节点将进入重试，重新执行expandedSQL；

txCallback执行完之后，执行commitConnection操作，这样当前节点就释放了LOCK_NAME，其他节点可以竞争获取锁，最后执行了releaseLock；

5.triggersFired

表示触发trigger，具体代码如下：

Quartz调度源码分析【面试+工作】_分布式锁_21

Quartz调度源码分析【面试+工作】_sql_22

Quartz调度源码分析【面试+工作】_配置文件_23

首先查询trigger的状态是否STATE_ACQUIRED状态，如果不是直接返回null；然后通过通过jobKey获取对应的jobDetail，更新对应的FiredTrigger为EXECUTING状态；最后判定job的DisallowConcurrentExecution是否开启，如果开启了不能并发执行job，那么trigger的状态为STATE_BLOCKED状态，否则为STATE_WAITING；如果状态为STATE_BLOCKED，那么下次调度

对应的trigger不会被拉取，只有等对应的job执行完之后，更新状态为STATE_WAITING之后才可以执行，保证了job的串行；

6.执行job

通过ThreadPool来执行封装job的JobRunShell；

问题解释

在文章Spring整合Quartz分布式调度中可在历史中查找，最后做了几次测试分布式调度，现在可以做出相应的解释

1.同一trigger同一时间只会在一个节点执行

上文中可以发现Quartz使用了分布式锁和状态来保证只有一个节点能执行；

2.任务没有执行完，可以重新开始

因为调度线程和任务执行线程是分开的，认为执行在Threadpool中执行，互相不影响；

3.通过DisallowConcurrentExecution注解保证任务的串行

在triggerFired中如果使用了DisallowConcurrentExecution，会引入STATE_BLOCKED状态，保证任务的串行；

总结