1. 缘起:

假设我们的系统在运行的过程中,源源不断的有新的任务需要处理(比如订单处理),而且这些任务的处理是相互独立的,没有前后顺序依赖性(顺序依赖性是指,必须在任务A处理结束后才可开始B任务),那么我们就可以使用多个线程来同时处理多个任务。每个处理任务的线程称为“工作者(线程)”。
我设计了ESBasic.Threading.Engines.IWorkerEngine工作者引擎,其目的就是使用多个线程来并行处理任务,提高系统的吞吐能力。


工作者引擎的形象示意图如下:

ES active_shards 多少合适 es basic_c#



2.适用场合:

设计工作者引擎ESBasic.Threading.Engines.IWorkerEngine的主要目的是为了解决类似下面的问题:

(1)充分利用多CPU、多核计算资源。

(2)减少因高速设备与低速设备之间速度差而产生计算资源浪费。

(3)对于突发的大批量的任务(比如订单系统经常在其它时段接受的订单很少,但在某高峰期会有突发性的大量的订单进来)进行缓冲处理,并最大限度地利用现有资源进行处理。

3.设计思想与实现

IWorkerEngine的设计思路是这样的:我们使用一个队列来存放需要处理的任务,新来的任务都会排队到这个队列中,然后有N个工作者线程不断地从队列中取出任务去处理,每个线程处理完当前任务后,又从队列中取出下一个任务……,如此循环。

IWorkerEngine接口的源码对应如下:



public 
  
 interface 
  
 IWorkerEngine 
 < 
 T 
 > 
 
{
 
 /// 
  
 <summary> 
 
 
 /// 
 IdleSpanInMSecs当没有工作要处理时,工作者线程休息的时间间隔。默认为10ms
 
 /// 
  
 </summary> 
 
 
  
 int 
 IdleSpanInMSecs{ 
 get 
 ; 
 set 
 ;}

 
 /// 
  
 <summary> 
 
 
 /// 
 WorkerThreadCount工作者线程的数量。默认值为1。
 
 /// 
  
 </summary> 
 
 
  
 int 
 WorkerThreadCount{ 
 get 
 ; 
 set 
 ;}

 
 /// 
  
 <summary> 
 
 
 /// 
 WorkProcesser用于处理任务的处理器。
 
 /// 
  
 </summary> 
 
 
  
 IWorkProcesser 
 < 
 T 
 > 
 WorkProcesser{ 
 set 
 ;}

 
 /// 
  
 <summary> 
 
 
 /// 
 WorkCount当前任务队列中的任务数。
 
 /// 
  
 </summary> 
 
 
  
 int 
 WorkCount{ 
 get 
 ;}

 
 /// 
  
 <summary> 
 
 
 /// 
 MaxWaitWorkCount历史中最大的处于等待状态的任务数量。
 
 /// 
  
 </summary> 
 
 
  
 int 
 MaxWaitWorkCount{ 
 get 
 ;}

 
 void 
 Initialize();
 
 void 
 Start();
 
 void 
 Stop();

 
 /// 
  
 <summary> 
 
 
 /// 
 AddWork添加任务。
 
 /// 
  
 </summary> 
  
 
 
  
 void 
 AddWork(Twork);
}

由于任务的类型不是固定的,所以我们使用的泛型参数 T 来表示要处理任务的类型。

所有的任务的具体执行都是由IWorkProcesser完成的:



public 
  
 interface 
  
 IWorkProcesser 
 < 
 T 
 > 
 
{
 
 void 
 Process(Twork);
}


实现这个IWorkerEngine接口的时候要注意以下几点:

(1)AddWork方法会在多线程的环境中被调用,所以必须保证其是线程安全的。

(2)每个工作者线程实际上就是一个我们前面介绍的循环引擎ICycleEngine,只不过将其DetectSpanInSecs设为0即可,表示不间断地执行任务。WorkerEngine便是使用了N个AgileCycleEngine实例来作为工作者的。这些AgileCycleEngine实例在Initialize方法中被实例化。

(3)所有的工作者最终都是执行私有的DoWork方法,这个方法就是从任务队列中取出任务并且调用IWorkProcesser来处理任务,如果任务队列为空,则等待IdleSpanInMSecs秒钟后再重试。

(4)MaxWaitWorkCount属性用于记录自从引擎运行以来最大的等待任务的数量,通过这个属性我们可以推测任务量与任务处理速度之间的差距。

(5)通过Start、Stop方法我们可以随时停止、启动工作者引擎,并可重复调用。

4. 使用时的注意事项

(1) 当引擎已经启动并正在运行时,如果要修改WorkerThreadCount的值并使其生效,则必须先调用Stop方法停止引擎,然后重新调用Initialize方法初始化引擎,再调用Start方法启动引擎。

(2) 关于工作者线程的个数N的设置的问题。这个数字不是越大越好,因为使用的线程越多,而CPU跟不上的话,那么消耗在线程切换上的浪费就越严重。所以,为了达到最好的性能,需要为工作者线程个数设置一个合适的值。
通常,这个值跟CPU的个数、CPU核的个数、任务的复杂度、慢速设备与快速设备之间的速度差以及它们的吞吐量有关。我们可以通过足够的测试来发现适合我们系统的N值。

一般情况下的推荐值为:CPU个数*单个CPU的核数*2 + 1。

5.扩展

(1)“一次性”的工作者引擎:BriefWorkerEngine

假设我们的系统可能会偶尔有一批任务要处理(也许永远也不会有这样的任务出现),我们希望只有当任务到来时,才使用一个工作者引擎实例来多线程处理它,处理完后,该引擎就可以释放掉。

ESBasic.Threading.Engines.BriefWorkerEngine,精简的工作者引擎,便是为这一目的而设计的。它使用多线程处理一批任务,当这批任务处理结束后,工作者线程会被自动释放,而该引擎实例也就可以被结束了。

为了方便使用,我将BriefWorkerEngine设计为从构造函数注入引擎运行所需要的参数,包括任务处理器、工作者线程个数、以及要处理的任务集合。在引擎实例被构造成功的同时,内部的循环引擎已经准备好了。注意,BriefWorkerEngine实现了IDisposable接口,这表明当引擎被释放时,内部所有的循环引擎都会停止运行,从而不再占有后台线程池中的线程。

我们可以这样来使用BriefWorkerEngine:



IWorkProcesser 
 < 
 MyTask 
 > 
 processer 
 = 
 ... 
 ;
 
 IList 
 < 
 MyTask 
 > 
 taskList 
 = 
 ... 
 ;
 
 BriefWorkerEngine 
 < 
 MyTask 
 > 
 engine 
 = 
  
 new 
  
 BriefWorkerEngine 
 < 
 MyTask 
 > 
 (processer, 
 5 
 ,taskList);
engine.Start();
 
 while 
 ( 
 ! 
 engine.IsFinished())
{
System.Threading.Thread.Sleep( 
 100 
 );
}
engine.Dispose();
 
 // 
 执行到这里,表示所有任务已经处理完毕,引擎实例即将被释放。


我们可以通过它的IsFinished方法来检测执行是否已经完成。当IsFinished方法返回true时,引擎实例就可以被销毁了。

(2)永不停止的工作者引擎

我们同样可以考虑一个类似于循环引擎的扩展的情况,假设我们的系统要求在启动时就将工作者引擎运行起来,而且在整个运行的生命周期中,都不需要停止引擎,那么我们就不想将Start方法、Stop方法暴露出来以免意外的调用Stop方法而导致引擎停止运行,那这个时候我们可以使用相同的技巧来做到:




public 
  
 sealed 
  
 class 
  
 MyWorkerEngine 
 
{
 
 private 
  
 IWorkerEngine 
 < 
 MyTask 
 > 
 workerEngine;

 
 public 
  
 void 
 Initialize()
{
 
 this 
 .workerEngine 
 = 
  
 new 
  
 WorkerEngine 
 < 
 MyTask 
 > 
 ();
 
 this 
 .workerEngine.WorkerThreadCount 
 = 
  
 5 
 ;
 
 // 
 this.workerEngine.WorkProcesser=
..赋值 
 
 
  
 this 
 .workerEngine.Initialize();
 
 this 
 .workerEngine.Start();
}
}

public class MyTask {}

其道理与循环引擎的扩展是一样的。