Java多线程(multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。多线程能够提高资源的利用率而在java线程中独具优势,归功于java多线程的三大特性。

原子性

Java的原子性其实和数据库事务的原子性差不多,即一个操作或者多个操作,要么全部执行并且执行的过程不会被任何因素打断,要么就都不执行。由此及彼,在JAVA中,对基本数据类型的变量的读取和赋值操作是原子性操作,即这些操作是不可被中断的,要么执行,要么不执行。JAVA内存模型(JMM)只是保证了基本的原子性,有些操作看似是原子操作,实则不然,举个例子:

x = 1; //语句1

y = x; //语句2

x++; //语句3

l  x = x + 1; //语句4

上面的4个语句中哪个是原子性操作呢?其实只有语句1是原子性操作,其他三个语句都不是原子性操作。语句1是直接将数值1赋值给x,也就是说线程执行这个语句的会直接将数值1写入到工作内存中。语句2实际上包含2个操作,它先要去读取x的值,再将x的值写入工作内存,虽然读取x的值以及将x的值写入工作内存这2个操作都是原子性操作,但是合起来就不是原子性操作了。同样的,x++和 x = x+1包括3个操作:读取x的值,进行加1操作,写入新的值。所以上面4个语句只有语句1的操作具备原子性。也就是说,只有简单的读取、赋值(而且必须是将数字赋值给某个变量,变量之间的相互赋值不是原子操作)才是原子操作。如果想实现x++和 x = x+1是原子操作,就需要用到 synchronized 或者是 lock 进行加锁处理。如果是基础类的自增操作可以用AtomicInteger 这样的原子类来实现(其本质是利用CPU级别的CAS指令来完成的)。其中用的最多的方法就是:incrementAndGet() 以原子的方式自增。其主要实现过程就是获得当前的值,然后自增 +1。接着则是最核心的compareAndSet() 来进行原子更新。其逻辑就是判断当前的值是否被更新过,是否等于current,如果等于就说明没有更新过然后将当前的值更新为next,如果不等于则返回false 进入循环,直到更新成功为止。

可见性

在现代计算机中,由于CPU直接从主内存中读取数据的效率不高,所以都会对应的CPU高速缓存,先将主内存中的数据读取到缓存中,线程修改数据之后首先更新到缓存,之后才会更新到主内存。如果此时还没有来得及将数据更新到主内存其他的线程此时来读取就是修改之前的数据。volatile 关键字就是用于保证内存可见性,当线程A更新了volatile修饰的变量时,它会立即刷新到主线程,并且将其余缓存中该变量的值清空,导致其余线程只能去主内存读取最新值。使用 volatile关键词修饰的变量每次读取都会得到最新的数据,不管哪个线程对这个变量的修改都会立即刷新到主内存。

synchronized和lock也能保证可见性,synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码,并且在释放锁之前会将对变量的修改刷新到主存当中,因此可以保证可见性,但是和 volatile 相比开销较大。

有序性

这里的有序性即程序执行的顺序按照代码的先后顺序执行。在Java内存模型中,允许编译器和处理器对指令进行重排序,但是重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性。

lint a = 100 ; //1

lint b = 200 ; //2

lint c = a + b ; //3

正常情况下的执行顺序应该是 1>>2>>3。但是有时为了提高整体的效率会进行指令重排导致执行的顺序可能是 2>>1>>3。但是也不能是什么都进行重排,是在保证最终结果和代码顺序执行结果一致的情况下才可能进行重排。在Java里面,可以通过volatile关键字来保证一定的“有序性”。另外可以通过synchronized和Lock来保证有序性,很显然,synchronized和Lock保证每个时刻是有一个线程执行同步代码,相当于是让线程顺序执行同步代码,自然就保证了有序性。另外,Java内存模型具备一些先天的“有序性”,即不需要通过任何手段就能够得到保证的有序性,这个通常也称为 happens-before (先行发生原则)原则。如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能保证它们的有序性,虚拟机可以随意地对它们进行重排序。一般情况下,CPU和编译器为了提升程序执行的效率,会按照一定的规则允许进行指令优化,在某些情况下,这种优化会带来一些执行的逻辑问题,主要的原因是代码逻辑之间是存在一定的先后顺序,在并发执行情况下,会发生二义性,即按照不同的执行逻辑,会得到不同的结果信息。

Java多线程的特性完全符合现代计算机操作系统中的多任务处理功能,这绝不仅仅是因为减少了程序运行的时间,提高运行效率,同时也大大提高了CPU的资源利用率。与此同时,多线程线程间有方便的通信和数据交换机制。对于不同进程来说,它们具有独立的数据空间,要进行数据的传递只能通过通信的方式进行,这种方式不仅费时,而且很不方便。线程则不然,由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其他线程所用,这不仅快捷,而且方便。这些都奠定了java多线程在java中的地位。