什么?面试官问我Java内存模型!这不得给我加薪?_后端

内存模型的基础

  • 通信  线程之间以何种机制来交换信息
    • 共享内存  隐式通信
    • 消息传递  显示通信
  • 同步  程序中用于控制不同线程间操作,发生的相对顺序的机制
    • 共享内存  显式同步
    • 消息传递  隐式同步

Java线程线程之间是通过共享内存的方式实现通信的.

内存模型的抽象结构

什么?面试官问我Java内存模型!这不得给我加薪?_多线程_02

  • 共享变量

共享变量手内存模型影响,线程会去主内存里去加载共享变量,当线程需要改变共享变量时,会将本地内存已更改的副本提交到主内存.

  • 局部变量

局部变量不会受内存模型的影响

线程之间通信

什么?面试官问我Java内存模型!这不得给我加薪?_多线程_03

指令重排

  • 编译器优化的重排序
  • 指令级并行的重排序
  • 内存系统的重排序

什么?面试官问我Java内存模型!这不得给我加薪?_编程语言_04

什么是指令重排?

int i=0; 2 int j=1;

按照我们的认知,程序是一行一行往下执行的,但是由于编译器或运行时环境为了优化程序性能,采取对指令进行重新排序执行,也就是说在计算机执行上面两句话的时候,有可能第二条语句会优先于第一条语句执行.

然而并不是所有的指令都能重排,重排需要基于数据依赖性.

数据依赖性

如果两个操作访问同一个变量,且这两个操作中有一个为写操作,此时这两个操作之间就存在数据依赖性。数据依赖分下列三种类型:

名称 代码示例 说明
写后读 a=1;b=a; 写一个变量之后,再读这个位置.
写后写 a=1;a=2; 写一个变量之后,再写这个变量.
读后写 a=b;b=1; 读一个变量之后,再写这个变量.

上面的情况,如果重排序了两个操作的执行顺序,程序的执行结果将会跟预期完全不一样.

所以说,虽然编译器和处理器可能会对操作做重排序,但是编译器和处理器在重排序时,会遵守数据依赖性,编译器和处理器不会改变存在数据依赖关系的两个操作的执行顺序。

注意,这里所说的数据依赖性仅针对单个处理器中执行的指令序列和单个线程中执行的操作,不同处理器之间和不同线程之间的数据依赖性不被编译器和处理器考虑。

as-if-serial

定义:不管怎么重排序(编译器和处理器为了提⾼并⾏度),(单线程) 程序的执⾏结果不能被改变。编译器、runtime和处理器都必须遵守as-if-serial语义。

什么?面试官问我Java内存模型!这不得给我加薪?_java_05

happens-before

happens-before是JMM的最核心概念之一

JMM设计意图

  • 程序员对内存模型的使用
    • 为程序员提供足够强的内存可见性保证
  • 编译器和处理器对内存模型的实现
    • 对编译器和处理器的限制要尽可能的放松

JMM禁止:

禁止编译器和处理器会改变程序执行结果的重排序.

JMM允许:

允许编译器和处理器不会改变程序执行结果的重排序.

happens-before规则

在JMM中,如果⼀个操作执⾏的结果需要对另⼀个操作可⻅,那么这两个操作之间必须要存在happens-before关系.

  • 程序顺序规则  ⼀个线程中的每个操作,happens-before于该线程中的任意后续操作.
  • 监视器锁规则  对⼀个锁的解锁,happens-before于随后对这个锁的加锁.
  • volatile变量规则  对⼀个volatile域的写,happens-before于任意后续对这个volatile域的读.
  • 传递性  如果A happens-before B,且B happens-before C,那么A happens-before C.
  • start()规则  如果线程A执⾏操作ThreadB.start()(启动线程B),那么A线程的ThreadB.start()操作happens-before于线程B中的任意操作。
  • join()规则  如果线程A执⾏操作ThreadB.join()并成功返回,那么线程B中的任意操作happens-before于线程A从ThreadB.join()返回
  • 线程中断规则  对线程interrupt⽅法的调⽤happens-before于被中断线程的代码检测到中断事件的发⽣.
  • 对象终结规则  ⼀个对象的初始化的完成,也就是构造函数执⾏的结束⼀定 happens-before它的finalize()⽅法.

JMM向程序员提供的happens-before规则能满⾜程序员的需求.

JMM对编译器和处理器的束缚已经尽可能少.

JMM对程序员的承诺

如果⼀个操作happens-before另⼀个操作,那么第⼀个操作的执⾏结果将对第⼆个操作 可⻅,⽽且第⼀个操作的执⾏顺序排在第⼆个操作之前.

JMM对编译器和处理器重排序的约束原则

两个操作之间存在happens-before关系,并不意味着Java平台的具体实现必须要按照 happens-before关系指定的顺序来执⾏.

例子:

1 public class Demo29 { 
2     int a=0;
3     boolean flag=false;
4     public void writer(){ 
5         a=1;                //1
6         flag=true;          //2
7     }
8     public void reader(){ 
9         if(flag){           //3
10             int i=a * a;    //4
11 } 
12 } 
13 }

假如线程B在进行操作4时,能否看到线程A在操作1对共享变量a的写入呢? 不一定

| 时刻 | 线程A | 线程B |
| T1 | flag=true |   |
| T2 |   | if(flag) |
| T3 |   | int i=a*a |
| T4 | a=1 |   |

当线程A在执行writer方法时,因为指令重排序,会先执行flag=true,再执行a=1.而线程B在执行操作4时就会读不到线程A对共享变量a的写入,导致运行结果超出预期.

解决方案1:

通过加锁的方式来解决

1 public class Demo29 { 
2     int a=0;
3     boolean flag=false;
4     public synchronized void writer(){ 
5         a=1;                //1
6         flag=true;          //2
7     }
8     public synchronized void reader(){ 
9         if(flag){           //3
10             int i=a * a;    //4
11 } 
12 } 
13 }

什么?面试官问我Java内存模型!这不得给我加薪?_数据库_06

锁的内存语义:

什么?面试官问我Java内存模型!这不得给我加薪?_数据库_07

  • 线程A释放⼀个锁,实质上是线程A向接下来将要获取这个锁的某个线程发出了(线程A 对共享变量所做修改的)消息。
  • 线程B获取⼀个锁,实质上是线程B接收了之前某个线程发出的(在释放这个锁之前对共 享变量所做修改的)消息。
  • 线程A释放锁,随后线程B获取这个锁,这个过程实质上是线程A通过主内存向线程B发 送消息。

volatile的作用

  1. volatile原理:被volatile关键字修饰的变量,编译器与运行时都会注意到这个变量是共享的,因此不会将该变量上的操作与其他内存操作一起重排序。volatile变量不会被缓存在寄存器或者对其他处理器不可见的地方,因此在读取volatile类型的变量时总会返回最新写入的值。
  2. 在访问volatile变量时不会执行加锁操作,因此也就不会使执行线程阻塞,因此volatile变量是一种比sychronized关键字更轻量级的同步机制。当对非 volatile 变量进行读写的时候,每个线程先从内存拷贝变量到CPU缓存中。如果计算机有多个CPU,每个线程可能在不同的CPU上被处理,这意味着每个线程可以拷贝到不同的 CPU cache 中。而声明变量是 volatile 的,JVM 保证了每次读变量都从内存中读,跳过 CPU cache 这一步。
  3. volatile在Java并发编程中常用于保持内存可见性和防止指令重排序。内存可见性(Memory Visibility):所有线程都能看到共享内存的最新状态;防止指令重排:在基于偏序关系的Happens-Before内存模型中,指令重排技术大大提高了程序执行效率,但同时也引入了一些问题。
  4. 可见性:volatile保持内存可见性的特殊规则:read、load、use动作必须连续出现;assign、store、write动作必须连续出现;每次读取前必须先从主内存刷新最新的值;每次写入后必须立即同步回主内存当中。也就是说,volatile关键字修饰的变量看到的随时是自己的最新值。在线程1中对变量v的最新修改,对线程2是可见的。
  5. 内存屏障:volatile防止指令重排的策略:在每个volatile写操作的前面插入一个StoreStore屏障;在每个volatile写操作的后面插入一个StoreLoad屏障;在每个volatile读操作的后面插入一个LoadLoad屏障;在每个volatile读操作的后面插入一个LoadStore屏障。
  6. volatile 性能:volatile 的读性能消耗与普通变量几乎相同,但是写操作稍慢,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。

volatile内存语义

什么?面试官问我Java内存模型!这不得给我加薪?_后端_08

  • 线程A写⼀个volatile变量,实质上是线程A向接下来将要读这个volatile变量的某个线程 发出了(其对共享变量所做修改的)消息。
  • 线程B读⼀个volatile变量,实质上是线程B接收了之前某个线程发出的(在写这个volatile 变量之前对共享变量所做修改的)消息。
  • 线程A写⼀个volatile变量,随后线程B读这个volatile变量,这个过程实质上是线程A通过 主内存向线程B发送消息。

volatile内存语义的实现

是否能重排序 第二个操作
第一个操作 普通读/写
普通读/写 Y
volatile读 N
volatile写 Y
  • 当第⼆个操作是volatile写时,不管第⼀个操作是什么,都不能重排序。

  • 当第⼀个操作是volatile读时,不管第⼆个操作是什么,都不能重排序。

  • 当第⼀个操作是volatile写,第⼆个操作是volatile读时,不能重排序。

内存屏障

屏障类型 指令示例 说明
LoadLoad Barriers Load1;LoadLoad;Load2 确保Load1数据的装载先于Load2及所有后续装载指令的装载
StoreStore Barriers Store1;StoreStore;Store2 确保Store1数据对其他处理器可见(刷新达到内存)先于Store2及所有后续存储指令的存储
LoadStore Barriers Load1;LoadStrore;Store2 确保Load1数据装载先于Store2及所有后续的存储指令刷新到内存
StoreLoad Barriers Store;StoreLoad;Load2 确保Store1数据对其他处理器变得可见(指刷新到内存)先于Load2及所有后续装载指令的装载.StoreLoad Barriers会使该屏障之前的所有内存访问指令(存储和装载指令)完成之后,才执行该屏障之后的内存访问指令
  • 在每个volatile写操作的前⾯插⼊⼀个StoreStore屏障
  • 在每个volatile写操作的后⾯插⼊⼀个StoreLoad屏障
  • 在每个volatile读操作的后⾯插⼊⼀个LoadLoad屏障
  • 在每个volatile读操作的后⾯插⼊⼀个LoadStore屏障

什么?面试官问我Java内存模型!这不得给我加薪?_多线程_09

什么?面试官问我Java内存模型!这不得给我加薪?_java_10

Final的内存语义

写final域的重排序规则

  • JMM禁止编译器把final域的写重排序到构造函数之外.
  • 编译器会在final域的写之后,构造函数return之前插入一个StoreStore屏障

读final域的重排序规则

  • 在⼀个线程中,初次读对象引⽤与初次读该对象包含的final域,JMM禁⽌处理器重排序这两个操作
  • 在构造函数内对一个final引用的对象的成员域的写入,与随后在构造函数外把这个被构造对象的引用赋值给一个引用变量,这两个操作之间不能重排序

什么?面试官问我Java内存模型!这不得给我加薪?_后端_11

写final域的重排序规则

  • 在构造函数内对⼀个final引⽤的对象的成员域 的写⼊,与随后在构造函数外把这个被构造对象的引⽤赋值给⼀个引⽤变量,这两个操作之 间不能重排序。

什么?面试官问我Java内存模型!这不得给我加薪?_后端_12

多线程下的单例模式

双重检查锁定

1 public class DoubleCheckedLocking {
 2     private static DoubleCheckedLocking doubleCheckedLocking;
 3 
 4     private DoubleCheckedLocking() {
 5 
 6     }
 7 
 8     public static DoubleCheckedLocking getInstance() { 
 9         if (doubleCheckedLocking == null) { 
10             synchronized (DoubleCheckedLocking.class) { 
11                 if (doubleCheckedLocking == null) { 
12                     doubleCheckedLocking = new DoubleCheckedLocking();//问题出现在这里
13 } 
14 } 
15 } 
16         return doubleCheckedLocking; 
17 } 
18 }

我们来看看这段双重检查锁定的单例模式有什么问题?

什么?面试官问我Java内存模型!这不得给我加薪?_java_13

线程A设置指向刚分配的内存地址后,线程B就判断doubleCheckedLocking对象是否为空,然后直接返回未初始化的doubleCheckedLocking对象,这样会引发出很严重的问题.

解决方案1:

使用volatile,禁止2和3重排序

1 public class DoubleCheckedLocking { 
2     private volatile static DoubleCheckedLocking doubleCheckedLocking; 3 
4     private DoubleCheckedLocking() { 
5 
6     }
7 
8     public static DoubleCheckedLocking getInstance() { 
9         if (doubleCheckedLocking == null) { 
10             synchronized (DoubleCheckedLocking.class) { 
11                 if (doubleCheckedLocking == null) { 
12                     doubleCheckedLocking = new DoubleCheckedLocking();//问题出现在这里
13 } 
14 } 
15 } 
16         return doubleCheckedLocking; 
17 } 
18 }

解决方案2:

基于类初始化,允许2和3重排序,但不允许其他线程"看到这个重排序"

1 public class InstanceFactory { 
2     private static class InstanceHolder { 
3         public static DoubleCheckedLocking doubleCheckedLocking = new DoubleCheckedLocking(); 
4 } 
5 
6     public static DoubleCheckedLocking getInstance() { 
7         return InstanceHolder.doubleCheckedLocking; 
8 } 
9 }

这里使用到了静态内部类的静态属性,类的静态属性只会在第一次调用的时候初始化,而且会有一个Class对象的初始化锁,从而确保只会发生一次初始化.

最后,祝大家早日学有所成,拿到满意offer