1 前言
上节我们看了一下线程安全的原子性、有序性、可见性,这节我们回到CPU多级缓存的问题,就是各个缓存中一致性的问题,这节我们就来看一下MESI一致性协议。
2 MESI缓存一致性协议
MESI协议也叫做缓存一致性协议,主要是用来进行协调多核CPU的高级缓存的数据一致的。
MESI一致性协议定义了高速缓存中数据的4种状态:
- M(Modified): 修改过的,只有一个CPU能独占这个修改状态,独占的意思是当有一个CPU的高速缓存数据处于这个状态的时候,其它CPU的高速缓存对这个共享的数据均不能操作;此时高速缓存中的数据发生了更新,需要被刷入主内存中。
- E(Exclusive): 独占状态,只有一个CPU能独占这个状态,同样当某个CPU的高速缓存的数据处于这个状态的时候,其它CPU的均不能操作这个共享数据。
- S(Share):共享的状态,当CPU的高速缓存中的数据这个状态的时候,各个CPU可以并发的对这个数据进行读取。
- I(Invalid):无效的,意思是当前高速缓存的这个数据已经是无效了或者过期了,不能使用。
3 问题示例
为了大家更好的理解一致性协议,我们先来看个问题:
(1)看下面的图,假如两个CPU0、CPU1同时将 i = 0 读取进入自己的高速缓存
(2)然后CPU0执行得比较快,执行完 i++操作之后将 i=1 的结果刷回主存了
(3)但是CPU1并不知道数据已经变更了,还是使用 i=0 的结果去进行 i++ 操作
(4)本来正确的结果应该是i = 2 的,结果执行了两次i++,结果却是1
造成上面数据不一致的原因主要是因为,CPU0修改了数据之后,没有机制能够通知到CPU1,让它高速缓存上这个变量的数据失效掉,导致CPU1计算的时候还是使用旧的值。
所以要解决多核CPU的高速缓存数据一致性的问题,必须有个机制能够某个CPU0修改了数据之后,立即通知的CPU1,让CPU1的高速缓存上的这个变量数据失效掉;然后CPU1用到的时候重新重从主内存读取最新的值,这样就能得到最新的结果了。
MESI实现的缓存一致性协议,正是CPU0修改了数据,通知到CPU1的那套通知机制的一种规范,计算机厂商根据这套规范实现了这种通知机制,但是不同的厂商之间实现方式可能稍微不同
那么接下来我们看看MESI这四种状态是怎么来解决多核CPU高速缓存数据一致的?
(1)首先像下面的图一样,CPU0、CPU1将共享变量 i = 0 读取,进入自己高速缓存的时候;缓存的状态是S,也就是共享的。
(2)然后CPU0要对 i = 0 的变量进行修改操作,在MESI一致性里面大概会经过这些步骤:
- CPU0发送消息给总线,说我要修改数据了,让总线通知一些其它的CPU
- 其它的CPU收到通知消息,将自己高速缓存上 i = 0 的数据状态变为Invalid过期
- 其它CPU将自己本地的 i=0 的高速缓存状态变为过期,返回我们都完成过期了操作了
- 总线收到其它CPU返回过期OK了
- 总线返回给CPU0说,好了,其它CPU都通知到位了,它们高速缓存上的 i = 0的数据都是过期状态了
- CPU0收到了过期确认,都过期了那我就可以独占这份数据了,准备可以修改数据,然后就设置自己高速缓存的状态为 E ,表示其它CPU的高速缓存都过期了自己可以独占了
- CPU0执行i++操作,将 i=1 的最新结果刷入到高速缓存中,同时将高速缓存的数据状态设为 M(修改过的)
- 然后后将高速缓存中 i=1 的最新结果又刷入主内存中
- CPU1发现自己高速缓存上 i = 0 的数据是 Invalid 过期状态,于是从主存重新读取
- 然后CPU1从主内存读取到 i = 1 的最新的数据,将自己状态设置成 S(共享)
上面就是MESI一致性协议在多核CPU之间进行协调的原理。
不知道大家还记得上节我们说可见性的时候,多个工作内存之间共享变量x的副本,可能数据不一致,这个数据不一致的可见性问题在JMM层次是怎么解决的?
其实Java内存模型建立在多核CPU高速缓存之上对不对,那JAVA内存模型对应到底层肯定也是操作主内存、操作高速缓存来操作数据的,既然多核CPU的缓存一致性又是通过MESI协议来达到一致性的。所以啊,JAVA内存模型底层其实也还是通过MESI一致性来使得一个线程修改了数据,把别的线程的工作内存副本数据弄失效的。
4 小结
本节我们讲了一下MESI在多级缓存中的作用以及原理,有理解不对的地方欢迎指正哈。