上节提到的:伪共享,今天我们来说说。

那什么是伪共享呢?

这得从CPU的缓存结构说起。以下如图,CPU一般来说是有三级缓存,1 级,2级,3级,越上面的,越靠近CPU的,速度越快,成本也越高。也就是说速度方面:1级>2级>3级。

JAVA使用多级缓存实现秒加载及查询 java 三级缓存_区块链

图1

JAVA使用多级缓存实现秒加载及查询 java 三级缓存_缓存_02

 

 图2

 

如上图2我们来看看不同级别的缓存的时延:

   

 

到CPU的延迟

CPU时钟

耗时

主内存

很多(Multiple)

~60-80 ns

L3 缓存

~40-45 周期

~15 ns

L2 缓存

~10 周期

~3 ns

L1 缓存

~3-4 周期

~1 ns

寄存器

一周期        

 小于1ns,飞快


 

说到这里,我们要理解一个很重要的概念:缓存行。什么是缓存行?

首先我们来看这几级缓存,其中,1,2级缓存是CPU核心私有的,也就是说每个核,之间不会共享1,2级缓存,那它们之间怎么通信或共享数据呢?

答案是:3级缓存,如下图:

JAVA使用多级缓存实现秒加载及查询 java 三级缓存_缓存_03

 

 那core1,和core2之间,是通过什么方式共享缓存呢?

答案是:缓存行!

什么是缓存行?简单来说,就是CPU内核之间共享数据的最小单位。如下图:x,y是在同一个缓存行,那每次CPU内核之间通信时交换x,y值,可以同时共享两个值。是不是很高效?

是的,一般情况下,如果x,y是属于数组内的数据 ,是可以达到高效共享数据的功能,但问题又来了:如果,x,y并不属于同一数组,x属于core1,而y属于core2,这个时候,如果core1更新了x,会导致y值失效了。为什么失效了,因为他们在同一缓存行。这时,只有把缓存行 flush到主存后, 其他内核中的相应的缓存行才会被置为过期数据,而缓存行什么时候flush到memory, 这个是有一定延时的 ,在这个延时当中, 其他CPU core是无法得知你的更新的 。那么内核core2再去读取Y的值时,由于L1的缓存里的数据已失效,那么就需要从L3获取,然后放入L2,再放入L1。 这样核心2读取Y值就需要从L3级的缓存读了。但是明明是内核core1修改的X的值,却影响到内核2去读取Y值了。同理,如果是内核2去修改Y的值,也会影响内核1去读取X的值。

简单来说,x,y同放在缓存行,而且它们又属于不同CPU内核的数据值(事实上CPU内核也就是代码中的:线程)。那就会因为各自更新其中一个值,而导致缓存失效。

这就是著名的伪共享问题。

有没有什么解决方案呢?

有的。

方案是:缓存行填充。

 

JAVA使用多级缓存实现秒加载及查询 java 三级缓存_JAVA使用多级缓存实现秒加载及查询_04

 还是回到上面的例子,如果x,y同放到同一个缓存行,会造成伪共享。很简单,那就不要放在一起好了!

比如:x有8byte(字节),而一般缓存行总共有64byte。那其他剩下的位置,我们就用预定的空变量填充就行了,代码如下 (java6版本):

public final static class VolatileLong {
        public volatile long x= 0L;
        public long p1, p2, p3, p4, p5, p6,p7;     //缓存行填充
    }

 

 这个时候,core1更新x值,也就不会影响y值,从而造成伪共享问题。

上面的代码是java6的解决方案。

JAVA 8下的方案

在JAVA 8中,缓存行填充终于被JAVA原生支持了。JAVA 8中添加了一个@Contended的注解,添加这个的注解,将会在自动进行缓存行填充,如下代码:

import sun.misc.Contended;

@Contended
public class VolatileLong {
    public volatile long value = 0L;  
}

执行时,必须加上虚拟机参数-XX:-RestrictContended,@Contended注释才会生效。很多文章把这个漏掉了,那样的话实际上就没有起作用。

 

这就是伪共享的解决方案,多么简单!

本系列完毕!

如果各位读者,还有什么意见或建议,欢迎拍砖吐槽!