早在 JDK 1.2 的版本中就提供 java.lang.ThreadLocal,为解决多线程程序的并发问题提供了一种新的思路。使用这个工具类可以很简洁地编写出优美的多线程程序。

ThreadLocal 很容易让人望文生义,想当然地认为是一个“本地线程”。其实,ThreadLocal并不是一个 Thread,而是 Thread 的局部变量,也许把它命名为 ThreadLocalVariable 更容易让人理解一些。当使用 ThreadLocal 维护变量时,ThreadLocal 为每个使用该变量的线程提供独立的变量副本,所以每一个线程都可以独立地改变自己的副本,而不会影响其它线程所对应的副本。

从线程的角度看,目标变量就是线程的本地变量,这也是类名中“Local”所要表达的意思。线程局部变量并不是 Java 的新发明,很多语言(如 IBM XL FORTRAN)在语法层面就提供线程局部变量。在 Java 中没有提供语言级支持,而是变相地通过 ThreadLocal 的类提供支持。

JDK 5 以后提供了泛型支持,ThreadLocal 被定义为支持泛型:

public class ThreadLocal<T> extends Object

T 为线程局部变量的类型。该类定义了 4 个方法:

1) protected T initialValue():返回此线程局部变量的当前线程的“初始值”。线程第一次使用 get() 方法访问变量时将调用此方法,但如果线程之前调用了 set(T) 方法,则不会对该线程再调用 initialValue 方法。通常,此方法对每个线程最多调用一次,但如果在调用 get() 后又调用了 remove(),则可能再次调用此方法。

该实现返回 null;如果程序员希望线程局部变量具有 null 以外的值,则必须为ThreadLocal 创建子类,并重写此方法。通常将使用匿名内部类完成此操作。

2)public T get():返回此线程局部变量的当前线程副本中的值。如果变量没有用于当前线程的值,则先将其初始化为调用 initialValue() 方法返回的值

3)public void set(T value):将此线程局部变量的当前线程副本中的值设置为指定值。大部分子类不需要重写此方法,它们只依靠 initialValue() 方法来设置线程局部变量的值。

4)public void remove():移除此线程局部变量当前线程的值。如果此线程局部变量随后被当前线程读取,且这期间当前线程没有设置其值,则将调用其 initialValue() 方法重新初始化其值。这将导致在当前线程多次调用 initialValue 方法。

下面是一个使用 ThreadLocal 的例子,每个线程产生自己独立的序列号。就是使用ThreadLocal 存储每个线程独立的序列号复本,线程之间互不干扰。

package cn.micai.concurrent;

/**
* 描述:
* <p>
*
* @author: 赵新国
* @date: 2018/5/14 9:29
*/
public class SequenceNumber {

/**
* 定义匿名子类创建ThreadLocal的变量
*/
private static ThreadLocal<Integer> seqNum = new ThreadLocal<Integer>() {
@Override
protected Integer initialValue() {
return 0;
}
};

/**
* 下一个序列号
* @return
*/
public int getNextNum() {
seqNum.set(seqNum.get() + 1);
return seqNum.get();
}

private static class TestClient extends Thread {

private SequenceNumber sn;

public TestClient(SequenceNumber sn) {
this.sn = sn;
}

/**
* 线程产生序列号
*/
@Override
public void run() {
for (int i=0; i<3; i++) {
System.out.println("thread[" + Thread.currentThread().getName() + "] " +
"sn[" + sn.getNextNum() + "]");
}
}
}

public static void main(String [] args) {
SequenceNumber sn = new SequenceNumber();
TestClient t1 = new TestClient(sn);
TestClient t2 = new TestClient(sn);
TestClient t3 = new TestClient(sn);
t1.start();
t2.start();
t3.start();
}

}

运行结果:

ThreadLocal变量_ThreadLocal

从运行结果可以看出,使用了 ThreadLocal 后,每个线程产生了独立的序列号,没有相互干扰。通常我们通过匿名内部类的方式定义 ThreadLocal 的子类,提供初始的变量值。

ThreadLocal和线程同步机制相比有什么优势呢?ThreadLocal和线程同步机制都是为了解决多线程中相同变量的访问冲突问题。

在同步机制中,通过对象的锁机制保证同一时间只有一个线程访问变量。这时该变量是多个线程共享的,使用同步机制要求程序慎密地分析什么时候对变量进行读写,什么时候需要锁定某个对象,什么时候释放对象锁等繁杂的问题,程序设计和编写难度相对较大。

而 ThreadLocal 则从另一个角度来解决多线程的并发访问。ThreadLocal 会为每一个线程提供一个独立的变量副本,从而隔离了多个线程对数据的访问冲突。因为每一个线程都拥有自己的变量副本,从而也就没有必要对该变量进行同步了。ThreadLocal 提供了线程安全的共享对象,在编写多线程代码时,可以把不安全的变量封装进ThreadLocal。

概括起来说,对于多线程资源共享的问题,同步机制采用了“以时间换空间”的方式,而 ThreadLocal 采用了“以空间换时间”的方式。前者仅提供一份变量,让不同的线程排队访问,而后者为每一个线程都提供了一份变量,因此可以同时访问而互不影响。

需要注意的是 ThreadLocal 对象是一个本质上存在风险的工具,应该在完全理解将要使用的线程模型之后,再去使用 ThreadLocal 对象。这就引出了线程池(thread pooling)的问题,线程池是一种线程重用技术,有了线程池就不必为每个任务创建新的线程,一个线程可能会多次使用,用于这种环境的任何 ThreadLocal 对象包含的都是最后使用该线程的代码所设置的状态,而不是在开始执行新线程时所具有的未被初始化的状态。

那么 ThreadLocal 是如何实现为每个线程保存独立的变量的副本的呢?通过查看它的源代码,我们会发现,是通过把当前“线程对象”当作键,变量作为值存储在一个 Map 中。

ThreadLocal变量_序列号_02