文章目录

  • 1:概述
  • 2:线程安全
  • 2.1 Java语言中的线程安全
  • 2.2 线程安全实现方法


1:概述

并发处理的广泛应用是使得Amdahl定律代替摩尔定律成为计算机性能发展源动力的根本原因

  • 对于高并发来说,首先需要保证并发的正确性,然后在此基础上实现高效,所已,我们要先从如何保证并发的正确性和如何实现线程安全讲起

2:线程安全

  • 线程安全:当多个线程访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方法进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那么这个对象是线程安全的。

如上定义要求线程安全的代码都必须具备一个特征:代码本身封装了所有必要的正确性保障手段(如互斥同步),调用者无需关心多线程的问题,更无需自己采取任何措施来保证多线程的正确使用。(在大多数情况下,我们都会弱化这个定义)

2.1 Java语言中的线程安全

  • 线程安全,就限定于多个线程之间存在共享数据访问这个前提,因为如果一段代码不会与其他线程共享数据,那么从先线程安全的角度来看,程序是串行执行还是多线程执行对它来说是完全没有区别的。
    按照线程安全的“安全程度”由强至弱来排序,我们可以将Java语言中各种操作共享数据分成以下五类:不可变,绝对线程安全,相对线程安全,线程兼容和线程对立
    1:不可变
    不可变的对象一定是线程安全的,无论是对象的方法实现还是方法调用者,都不需要再采取任何线程安全的保障措施,不可变带来的安全性是最简单和最纯粹的。Java语言中,如果共享数据是一个基本数据类型,那么只要在定义时使用final关键字修饰它就可以保证它是不可变的。如果共享数据是一个对象,那就需要保证对象的行为不会对其状态产生任何影响才可以,例如java.lang.String类的对象,它是一个典型的不可变对象,我们调用它的substring(),replace()这些方法不会影响它原来的值,只会返回一个新构造的字符串对象。

保证对象行为不影响自己状态的途径有很多种,其中最简单的就是把对象中带有状态的变量都声明为final,这样在构造函数之后他就是不可变的。
Java API中符合不可变要求的类型,除了String还有枚举类型,java.lang.Number部分子类,Long和Double等数值包装类,BigInteger等大型数据类型

2:绝对线程安全
一个类要达到“不管运行时环境如何,调用者都不需要任何额外的同步措施”通常需要付出很大的,不切实际的代价。在Java API中标注自己是线程安全的类,大多数都不是绝对线程安全。我们可以来看看这里的绝对是什么意思,如java.util.Vector是一个线程安全容器,它的add(),get(),size()这类方法都是被synchronized修饰的,尽管效率低,当确实是安全的。即使这样所有的方法都被修饰同步的,不意味着调用它的时候都不再需要同步手段,因为如果在多线程环境中,如果不在方法调用端做额外的同步措施的话,使用这段代码仍然不是安全的。
3:相对线程安全
相对线程安全就是我们通常意义上所讲的线程安全,它需要保证对这个对象单独的操作是线程安全的,我们在调用的时候不需要做额外的保障措施,但是对于一些特定顺序的连续调用,就必须要在调用端使用额外的同步手段来保证调用的正确性
在Java API大部分线程安全的类,大部分线程安全类都属于这种类型,例如Vector,HashTable,Collections包装的集合等
4:线程兼容
本身不是线程安全的,但是可以通过调用端使用同步来保证安全性。我们常常说的一个类不是线程安全的,绝大多数是这一种情况,Java API中大部分的类都是属于线程兼容的,如ArrayList和HashMap
5:线程对立
无论是否采用同步措施,都无法在并发中使用。由于Java语言天生就具备多线程特性,线程对立这种排斥多线程的代码是很少出现的。

一个例子:Thread类的suspend()和resume()方法,如果有两个线程同时持有一个对象,一个尝试中断线程,一个尝试恢复线程,如果并发进行,无论是否进行同步,目标线程都是存在死锁风险,所以已经被JDK废弃

2.2 线程安全实现方法

了解什么是线程安全后,接着我们就要知道如何实现线程安全,这似乎是一件由代码如何编写来决定的事情,确实,如何实现线程安全与代码编写有很大的关系,但是虚拟机提供的同步和锁机制也起到了非常重要作用。

代码编写如何实现线程安全和虚拟机如何实现同步与锁这两者都会有所涉及,相对后者更重要一点

1:互斥同步
互斥同步是常见的一种并发正确性保障手段,同步是指在多个线程并发访问共享数据时,保证共享数据在同一个时刻只被一个线程使用。而互斥是实现同步的一种手段,临界区,互斥量,信号量都是主要的互斥实现方式。因此在这4个字里面,互斥是因,同步是果;互斥是方法,同步是目的
2:非阻塞同步
互斥同步最主要的问题就是进行线程阻塞和唤醒所带来的性能问题,因此这种同步也称为阻塞同步。从处理问题的方式上说,互斥同步属于一种悲观的并发策略,总是认为只要不去做正确的同步措施(例如加锁),那就肯定会出现问题,无论共享数据是否真的会出现竞争,它都要进行加锁,用户态核心态转换,维护锁计数器和检查是否有被阻塞的线程需要唤醒等操作。随着硬件指令集的发展,我们有了另外一个选择:基于冲突检测的乐观并发策略,通俗地说,就是先进行操作,如果没有其他线程争用共享数据,那操做就成功了。如果共享数据有争用,产生了冲突,那就再采取其他的补偿措施(最常见的补偿措施就是不断地重试,直到成功为止), 这种乐观的并发策略的许多实现都不需要把线程挂起,因此这种同步操作称为非阻塞同步(Non-Blocking Synchronization)。

为什么说使用乐观并发策略需要“硬件指令集的发展”才能进行呢?因为我们需要操作和冲突检测这两个步骤具备原子性,靠什么来保证呢?如果这里再使用互斥同步来保证就失去意义了,所以我们只能硬件来完成这件事情,硬件保证一个从语义上看起来需要多次操作的行为只通过一条处理器指令就可以完成,这类指令常用的有:测试并设置(Test-andSet),获取并增加(Fetch-and-Increment),交换(Swap),比较并交换(Compare-and-Swap),加载链接/条件存储(Load-Linked/Store-Conditional)
3:无同步方案
要保证线程安全,并不一定要进行同步,两者没有因果关系。同步只是保证共享数据争用时的正确性手段,如果一个方法本来就不涉及共享数据,那他自然就无需任何同步措施去保证正确性,因此会有一些代码天生就是线程安全的,如下两类
1:可重入代码
可重入代码(Reentry code)也叫纯代码(Pure code)是一种允许多个进程同时访问的代码。为了使各进程所执行的代码完全相同,故不允许任何进程对其进行修改。程序在运行过程中可以被打断,并由开始处再次执行,并且在合理的范围内(多次重入,而不造成堆栈溢出等其他问题),程序可以在被打断处继续执行,且执行结果不受影响。可重入代码有一些共同特征:不依赖存储在堆上的数据和公用的系统资源,用到的状态量都由参数中传入,不调用非可重入的方法等。

如果一个方法,它的返回结果是可以预测的,只要输入相同的数据,就可以返回相同的结果,那就满足可重入性的要求,当然也是线程安全的

2:线程本地存储
如果一段代码中需要的数据必须与其他代码共享,那就看看这些共享数据的代码是否可以保证在同一个线程中执行?如果可以,我们就可以把共享数据的可见范围限制在同一个线程之内,这样,无需同步也可以保证线程之间不出现数据争用问题
ThreadLocalMap(线程的一个属性)
1、每个线程中都有一个自己的ThreadLocalMap类对象,各管各的,线程可以正确访问到自己的对象
2、将一个共用的ThreadLocal静态实例作为key,将不同对象的引用保存到不同线程的ThreadLocalMap中,然后在线程执行的各处通过这个静态ThreadLocal实例的get()方法取得自己线程保存的那个对象,避免了将这个对象作为参数传递的麻烦。
3、ThreadlocalMap其实就是线程里面的一个属性,它在Thread类中定义
ThreadLocal.ThreadLocalMap threadLocals = null;