1. 缘起:
假设我们的系统在运行的过程中,源源不断的有新的任务需要处理(比如订单处理),而且这些任务的处理是相互独立的,没有前后顺序依赖性(顺序依赖性是指,必须在任务A处理结束后才可开始B任务),那么我们就可以使用多个线程来同时处理多个任务。每个处理任务的线程称为“工作者(线程)”。
我设计了ESBasic.Threading.Engines.IWorkerEngine工作者引擎,其目的就是使用多个线程来并行处理任务,提高系统的吞吐能力。
工作者引擎的形象示意图如下:
2.适用场合:
设计工作者引擎ESBasic.Threading.Engines.IWorkerEngine的主要目的是为了解决类似下面的问题:
(1)充分利用多CPU、多核计算资源。
(2)减少因高速设备与低速设备之间速度差而产生计算资源浪费。
(3)对于突发的大批量的任务(比如订单系统经常在其它时段接受的订单很少,但在某高峰期会有突发性的大量的订单进来)进行缓冲处理,并最大限度地利用现有资源进行处理。
3.设计思想与实现
IWorkerEngine的设计思路是这样的:我们使用一个队列来存放需要处理的任务,新来的任务都会排队到这个队列中,然后有N个工作者线程不断地从队列中取出任务去处理,每个线程处理完当前任务后,又从队列中取出下一个任务……,如此循环。
IWorkerEngine接口的源码对应如下:
public
interface
IWorkerEngine
<
T
>
{
///
<summary>
///
IdleSpanInMSecs当没有工作要处理时,工作者线程休息的时间间隔。默认为10ms
///
</summary>
int
IdleSpanInMSecs{
get
;
set
;}
///
<summary>
///
WorkerThreadCount工作者线程的数量。默认值为1。
///
</summary>
int
WorkerThreadCount{
get
;
set
;}
///
<summary>
///
WorkProcesser用于处理任务的处理器。
///
</summary>
IWorkProcesser
<
T
>
WorkProcesser{
set
;}
///
<summary>
///
WorkCount当前任务队列中的任务数。
///
</summary>
int
WorkCount{
get
;}
///
<summary>
///
MaxWaitWorkCount历史中最大的处于等待状态的任务数量。
///
</summary>
int
MaxWaitWorkCount{
get
;}
void
Initialize();
void
Start();
void
Stop();
///
<summary>
///
AddWork添加任务。
///
</summary>
void
AddWork(Twork);
}
由于任务的类型不是固定的,所以我们使用的泛型参数
T
来表示要处理任务的类型。
所有的任务的具体执行都是由IWorkProcesser完成的:
public
interface
IWorkProcesser
<
T
>
{
void
Process(Twork);
}
实现这个IWorkerEngine接口的时候要注意以下几点:
(1)AddWork方法会在多线程的环境中被调用,所以必须保证其是线程安全的。
(2)每个工作者线程实际上就是一个我们前面介绍的循环引擎ICycleEngine,只不过将其DetectSpanInSecs设为0即可,表示不间断地执行任务。WorkerEngine便是使用了N个AgileCycleEngine实例来作为工作者的。这些AgileCycleEngine实例在Initialize方法中被实例化。
(3)所有的工作者最终都是执行私有的DoWork方法,这个方法就是从任务队列中取出任务并且调用IWorkProcesser来处理任务,如果任务队列为空,则等待IdleSpanInMSecs秒钟后再重试。
(4)MaxWaitWorkCount属性用于记录自从引擎运行以来最大的等待任务的数量,通过这个属性我们可以推测任务量与任务处理速度之间的差距。
(5)通过Start、Stop方法我们可以随时停止、启动工作者引擎,并可重复调用。
4. 使用时的注意事项
(1) 当引擎已经启动并正在运行时,如果要修改WorkerThreadCount的值并使其生效,则必须先调用Stop方法停止引擎,然后重新调用Initialize方法初始化引擎,再调用Start方法启动引擎。
(2) 关于工作者线程的个数N的设置的问题。这个数字不是越大越好,因为使用的线程越多,而CPU跟不上的话,那么消耗在线程切换上的浪费就越严重。所以,为了达到最好的性能,需要为工作者线程个数设置一个合适的值。
通常,这个值跟CPU的个数、CPU核的个数、任务的复杂度、慢速设备与快速设备之间的速度差以及它们的吞吐量有关。我们可以通过足够的测试来发现适合我们系统的N值。
一般情况下的推荐值为:CPU个数*单个CPU的核数*2 + 1。
5.扩展
(1)“一次性”的工作者引擎:BriefWorkerEngine
假设我们的系统可能会偶尔有一批任务要处理(也许永远也不会有这样的任务出现),我们希望只有当任务到来时,才使用一个工作者引擎实例来多线程处理它,处理完后,该引擎就可以释放掉。
ESBasic.Threading.Engines.BriefWorkerEngine,精简的工作者引擎,便是为这一目的而设计的。它使用多线程处理一批任务,当这批任务处理结束后,工作者线程会被自动释放,而该引擎实例也就可以被结束了。
为了方便使用,我将BriefWorkerEngine设计为从构造函数注入引擎运行所需要的参数,包括任务处理器、工作者线程个数、以及要处理的任务集合。在引擎实例被构造成功的同时,内部的循环引擎已经准备好了。注意,BriefWorkerEngine实现了IDisposable接口,这表明当引擎被释放时,内部所有的循环引擎都会停止运行,从而不再占有后台线程池中的线程。
我们可以这样来使用BriefWorkerEngine:
IWorkProcesser
<
MyTask
>
processer
=
...
;
IList
<
MyTask
>
taskList
=
...
;
BriefWorkerEngine
<
MyTask
>
engine
=
new
BriefWorkerEngine
<
MyTask
>
(processer,
5
,taskList);
engine.Start();
while
(
!
engine.IsFinished())
{
System.Threading.Thread.Sleep(
100
);
}
engine.Dispose();
//
执行到这里,表示所有任务已经处理完毕,引擎实例即将被释放。
我们可以通过它的IsFinished方法来检测执行是否已经完成。当IsFinished方法返回true时,引擎实例就可以被销毁了。
(2)永不停止的工作者引擎
我们同样可以考虑一个类似于循环引擎的扩展的情况,假设我们的系统要求在启动时就将工作者引擎运行起来,而且在整个运行的生命周期中,都不需要停止引擎,那么我们就不想将Start方法、Stop方法暴露出来以免意外的调用Stop方法而导致引擎停止运行,那这个时候我们可以使用相同的技巧来做到:
public
sealed
class
MyWorkerEngine
{
private
IWorkerEngine
<
MyTask
>
workerEngine;
public
void
Initialize()
{
this
.workerEngine
=
new
WorkerEngine
<
MyTask
>
();
this
.workerEngine.WorkerThreadCount
=
5
;
//
this.workerEngine.WorkProcesser=
..赋值
this
.workerEngine.Initialize();
this
.workerEngine.Start();
}
}
public
class
MyTask
{}
其道理与循环引擎的扩展是一样的。