注意:本章主要参考自《大型分布式Java应用:基础与实践》和《大型网站技术架构:核心原理与案例分析》

1、选用的两个角度

  • 高性能:将提交到线程池中的任务直接交给线程去处理(前提:线程数小于最大线程数),不入队
  • 缓冲执行:希望提交到线程池的任务尽量被核心线程(corePoolSize)执行掉

2、高性能

  • 队列:SynchronousQueue
  • 最大线程数:一般设为Integer.MAX_VALUE(整数最大值),防止回绝任务
  • 典型案例:newCachedThreadPool
  • 尤其适合于执行耗时短的任务

注意:

 

  • 设置好闲置失效时间,keepAliveTime,用于避免资源大量耗费
  • 对于出现大量耗时长的任务,容易造成线程数迅速增加,这种情况要衡量使用该类线程池是否合适

3、缓冲执行

  • 队列:LinkedBlockingQueue和ArrayBlockingQueue
  • 典型案例:newFixedThreadPool(int threadSize)

注意:

  • 使用该类线程池,最好使用LinkedBlockingQueue(无界队列),但是当大量并发任务的涌入,导致核心线程处理不过来,队列元素会大量增加,可能会报内存溢出
  • 当然,对于上边这种情况的话,如果是ArrayBlockingQueue的话,如果设置得当,可以回绝一些任务,而不报内存溢出

4、线程数的确定

  • 公式:启动线程数=[任务执行时间/(任务执行时间-IO等待时间)]*CPU核数

注意:

  • 如果任务大都是CPU计算型任务,启动线程数=CPU核数+1
  • 如果任务大多需要等待磁盘操作,网络响应,(IO密集型),启动线程数
  • 可以参照公式估算,当然>CPU核数
  • 2*cpu
  • cpu/(1-0.8~0.9), eg 8核/(1-0.9)=80

 

总结:

一般使用线程池,按照如下顺序依次考虑(只有前者不满足场景需求,才考虑后者):

newCachedThreadPool-->newFixedThreadPool(int threadSize)-->ThreadPoolExecutor

  • newCachedThreadPool不需要指定任何参数
  • newFixedThreadPool需要指定线程池数(核心线程数==最大线程数)
  • ThreadPoolExecutor需要指定核心线程数、最大线程数、闲置超时时间、队列、队列容量,甚至还有回绝策略和线程工厂

对于:newFixedThreadPool和ThreadPoolExecutor的核心数可以参照上述给出的公式进行估算。