前言
本文来自方腾飞老师《Java并发编程的艺术》第一章。
并发编程的目的是为了让程序运行得更快,但是并不是启动更多的线程就能让程序最大 限度地并发执行。在进行并发编程时,如果希望通过多线程执行任务让程序运行得更快,会面临非常多的挑战,比如上下文切换的问题、死锁的问题,以及受限于硬 件和软件的资源限制问题,本文要研究的是上下文切换的问题。
什么是上下文切换
即使是单核CPU也支持多线程执行代码,CPU通过给每个线程分配CPU时间片来实现这个机制。时间片是CPU分配给各个线程的时间,因为时间片非常短,所以CPU通过不停地切换线程执行,让我们感觉多个线程时同时执行的,时间片一般是几十毫秒(ms)。
CPU通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再次加载这个任务的状态,从任务保存到再加载的过程就是一次上下文切换。
这就像我们同时读两本书,当我们在读一本英文的技术书籍时,发现某个单词不认识, 于是便打开中英文词典,但是在放下英文书籍之前,大脑必须先记住这本书读到了多少页的第多少行,等查完单词之后,能够继续读这本书。这样的切换是会影响读 书效率的,同样上下文切换也会影响多线程的执行速度。
上下文切换代码测试
下面的代码演示串行和兵法执行并累加操作的时间:
1 public class ContextSwitchTest 2 { 3 private static final long count = 10000; 4 5 public static void main(String[] args) throws Exception 6 { 7 concurrency(); 8 serial(); 9 } 10 11 private static void concurrency() throws Exception 12 { 13 long start = System.currentTimeMillis(); 14 Thread thread = new Thread(new Runnable(){ 15 public void run() 16 { 17 int a = 0; 18 for (int i = 0; i < count; i++) 19 { 20 a += 5; 21 } 22 } 23 }); 24 thread.start(); 25 int b = 0; 26 for (long i = 0; i < count; i++) 27 { 28 b --; 29 } 30 thread.join(); 31 long time = System.currentTimeMillis() - start; 32 System.out.println("Concurrency:" + time + "ms, b = " + b); 33 } 34 35 private static void serial() 36 { 37 long start = System.currentTimeMillis(); 38 int a = 0; 39 for (long i = 0; i < count; i++) 40 { 41 a += 5; 42 } 43 int b = 0; 44 for (int i = 0; i < count; i++) 45 { 46 b --; 47 } 48 long time = System.currentTimeMillis() - start; 49 System.out.println("Serial:" + time + "ms, b = " + b + ", a = " + a); 50 } 51 }
修改上面的count值,即修改循环次数,看一下串行运行和并发运行的时间测试结果:
循环次数 | 串行执行耗时/ms | 并发执行耗时/ms | 串行和并发对比 |
1亿 | 78 | 50 | 并发快约0.5倍 |
1000万 | 10 | 6 | 并发快约0.5~1倍 |
100万 | 3 | 2 | 差不多 |
10万 | 2 | 2 | 差不多 |
1万 | 0 | 1 | 差不多,十几次执行下来,总体而言串行略快 |
从表中可以看出,100次并发执行累加以下,串行执行和并发执行的运行速度总体而言差不多,1万次以下串行执行甚至还可以说是略快。为什么并发执行的速度会比串行慢呢?这就是因为线程有创建和上下文切换的开销。
上下文切换次数查看
在Linux系统下可以使用vmstat命令来查看上下文切换的次数,下面是利用vmstat查看上下文切换次数的示例:
CS(Context Switch)表示上下文切换的次数,从图中可以看到,上下文每秒钟切换500~600次左右。
如果要查看上下文切换的时长,可以利用Lmbench3,这是一个性能分析工具。
如何减少上下文切换
既然上下文切换会导致额外的开销,因此减少上下文切换次数便可以提高多线程程序的运行效率。减少上下文切换的方法有无锁并发编程、CAS算法、使用最少线程和使用协程。
- 无锁并发编程。多线程竞争时,会引起上下文切换,所以多线程处理数据时,可以用一些办法来避免使用锁,如将数据的ID按照Hash取模分段,不同的线程处理不同段的数据
- CAS算法。Java的Atomic包使用CAS算法来更新数据,而不需要加锁
- 使用最少线程。避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这样会造成大量线程都处于等待状态
- 协程。在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换
前言
本文来自方腾飞老师《Java并发编程的艺术》第一章。
并发编程的目的是为了让程序运行得更快,但是并不是启动更多的线程就能让程序最大 限度地并发执行。在进行并发编程时,如果希望通过多线程执行任务让程序运行得更快,会面临非常多的挑战,比如上下文切换的问题、死锁的问题,以及受限于硬 件和软件的资源限制问题,本文要研究的是上下文切换的问题。
什么是上下文切换
即使是单核CPU也支持多线程执行代码,CPU通过给每个线程分配CPU时间片来实现这个机制。时间片是CPU分配给各个线程的时间,因为时间片非常短,所以CPU通过不停地切换线程执行,让我们感觉多个线程时同时执行的,时间片一般是几十毫秒(ms)。
CPU通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再次加载这个任务的状态,从任务保存到再加载的过程就是一次上下文切换。
这就像我们同时读两本书,当我们在读一本英文的技术书籍时,发现某个单词不认识, 于是便打开中英文词典,但是在放下英文书籍之前,大脑必须先记住这本书读到了多少页的第多少行,等查完单词之后,能够继续读这本书。这样的切换是会影响读 书效率的,同样上下文切换也会影响多线程的执行速度。
上下文切换代码测试
下面的代码演示串行和兵法执行并累加操作的时间:
1 public class ContextSwitchTest 2 { 3 private static final long count = 10000; 4 5 public static void main(String[] args) throws Exception 6 { 7 concurrency(); 8 serial(); 9 } 10 11 private static void concurrency() throws Exception 12 { 13 long start = System.currentTimeMillis(); 14 Thread thread = new Thread(new Runnable(){ 15 public void run() 16 { 17 int a = 0; 18 for (int i = 0; i < count; i++) 19 { 20 a += 5; 21 } 22 } 23 }); 24 thread.start(); 25 int b = 0; 26 for (long i = 0; i < count; i++) 27 { 28 b --; 29 } 30 thread.join(); 31 long time = System.currentTimeMillis() - start; 32 System.out.println("Concurrency:" + time + "ms, b = " + b); 33 } 34 35 private static void serial() 36 { 37 long start = System.currentTimeMillis(); 38 int a = 0; 39 for (long i = 0; i < count; i++) 40 { 41 a += 5; 42 } 43 int b = 0; 44 for (int i = 0; i < count; i++) 45 { 46 b --; 47 } 48 long time = System.currentTimeMillis() - start; 49 System.out.println("Serial:" + time + "ms, b = " + b + ", a = " + a); 50 } 51 }
修改上面的count值,即修改循环次数,看一下串行运行和并发运行的时间测试结果:
循环次数 | 串行执行耗时/ms | 并发执行耗时/ms | 串行和并发对比 |
1亿 | 78 | 50 | 并发快约0.5倍 |
1000万 | 10 | 6 | 并发快约0.5~1倍 |
100万 | 3 | 2 | 差不多 |
10万 | 2 | 2 | 差不多 |
1万 | 0 | 1 | 差不多,十几次执行下来,总体而言串行略快 |
从表中可以看出,100次并发执行累加以下,串行执行和并发执行的运行速度总体而言差不多,1万次以下串行执行甚至还可以说是略快。为什么并发执行的速度会比串行慢呢?这就是因为线程有创建和上下文切换的开销。
上下文切换次数查看
在Linux系统下可以使用vmstat命令来查看上下文切换的次数,下面是利用vmstat查看上下文切换次数的示例:
CS(Context Switch)表示上下文切换的次数,从图中可以看到,上下文每秒钟切换500~600次左右。
如果要查看上下文切换的时长,可以利用Lmbench3,这是一个性能分析工具。
如何减少上下文切换
既然上下文切换会导致额外的开销,因此减少上下文切换次数便可以提高多线程程序的运行效率。减少上下文切换的方法有无锁并发编程、CAS算法、使用最少线程和使用协程。
- 无锁并发编程。多线程竞争时,会引起上下文切换,所以多线程处理数据时,可以用一些办法来避免使用锁,如将数据的ID按照Hash取模分段,不同的线程处理不同段的数据
- CAS算法。Java的Atomic包使用CAS算法来更新数据,而不需要加锁
- 使用最少线程。避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这样会造成大量线程都处于等待状态
- 协程。在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换