关于后端:Java-CAS-原理剖析

在Java并发中，咱们最后接触的应该就是synchronized关键字了，然而synchronized属于重量级锁，很多时候会引起性能问题，volatile也是个不错的抉择，然而volatile不能保障原子性，只能在某些场合下应用。
像synchronized这种独占锁属于乐观锁，它是在假如肯定会发生冲突的，那么加锁恰好有用，除此之外，还有乐观锁，乐观锁的含意就是假如没有发生冲突，那么我正好能够进行某项操作，如果要是发生冲突呢，那我就重试直到胜利，乐观锁最常见的就是CAS。
咱们在读Concurrent包下的类的源码时，发现无论是ReenterLock外部的AQS，还是各种Atomic结尾的原子类，外部都利用到了CAS，最常见的就是咱们在并发编程时遇到的i++这种状况。传统的办法必定是在办法上加上synchronized关键字:
public class Test {

public volatile int i;

public synchronized void add() {
    i++;
}

}
复制代码然而这种办法在性能上可能会差一点，咱们还能够应用AtomicInteger，就能够保障i原子的++了。
public class Test {

public AtomicInteger i;

public void add() {
    i.getAndIncrement();
}

}
复制代码咱们来看getAndIncrement的外部：
public final int getAndIncrement() {

return unsafe.getAndAddInt(this, valueOffset, 1);

}
复制代码再深刻到getAndAddInt():
public final int getAndAddInt(Object var1, long var2, int var4) {

int var5;
do {
    var5 = this.getIntVolatile(var1, var2);
} while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));

return var5;

}
复制代码这里咱们见到compareAndSwapInt这个函数，它也是CAS缩写的由来。那么仔细分析下这个函数做了什么呢？
首先咱们发现compareAndSwapInt后面的this，那么它属于哪个类呢，咱们看上一步getAndAddInt，后面是unsafe。这里咱们进入的Unsafe类。这里要对Unsafe类做个阐明。联合AtomicInteger的定义来说：
public class AtomicInteger extends Number implements java.io.Serializable {

private static final long serialVersionUID = 6214790243416807050L;

// setup to use Unsafe.compareAndSwapInt for updates
private static final Unsafe unsafe = Unsafe.getUnsafe();
private static final long valueOffset;

static {
    try {
        valueOffset = unsafe.objectFieldOffset
            (AtomicInteger.class.getDeclaredField("value"));
    } catch (Exception ex) { throw new Error(ex); }
}

private volatile int value;
...

复制代码在AtomicInteger数据定义的局部，咱们能够看到，其实理论存储的值是放在value中的，除此之外咱们还获取了unsafe实例，并且定义了valueOffset。再看到static块，懂类加载过程的都晓得，static块的加载产生于类加载的时候，是最先初始化的，这时候咱们调用unsafe的objectFieldOffset从Atomic类文件中获取value的偏移量，那么valueOffset其实就是记录value的偏移量的。
再回到下面一个函数getAndAddInt，咱们看var5获取的是什么，通过调用unsafe的getIntVolatile(var1, var2)，这是个native办法，具体实现到JDK源码里去看了，其实就是获取var1中，var2偏移量处的值。var1就是AtomicInteger，var2就是咱们后面提到的valueOffset,这样咱们就从内存里获取到当初valueOffset处的值了。
当初重点来了，compareAndSwapInt（var1, var2, var5, var5 + var4）其实换成compareAndSwapInt（obj, offset, expect, update）比较清楚，意思就是如果obj内的value和expect相等，就证实没有其余线程扭转过这个变量，那么就更新它为update，如果这一步的CAS没有胜利，那就采纳自旋的形式持续进行CAS操作，取出乍一看这也是两个步骤了啊，其实在JNI里是借助于一个CPU指令实现的。所以还是原子操作。
CAS底层原理
CAS底层应用JNI调用C代码实现的，如果你有Hotspot源码，那么在Unsafe.cpp里能够找到它的实现：
static JNINativeMethod methods_15[] = {

//省略一堆代码...
{CC"compareAndSwapInt",  CC"("OBJ"J""I""I"")Z",      FN_PTR(Unsafe_CompareAndSwapInt)},
{CC"compareAndSwapLong", CC"("OBJ"J""J""J"")Z",      FN_PTR(Unsafe_CompareAndSwapLong)},
//省略一堆代码...

};
复制代码咱们能够看到compareAndSwapInt实现是在Unsafe_CompareAndSwapInt外面，再深刻到Unsafe_CompareAndSwapInt:
UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
UnsafeWrapper(“Unsafe_CompareAndSwapInt”);
oop p = JNIHandles::resolve(obj);
jint addr = (jint ) index_oop_from_field_offset_long(p, offset);
return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
UNSAFE_END
复制代码p是取出的对象，addr是p中offset处的地址，最初调用了Atomic::cmpxchg(x, addr, e), 其中参数x是行将更新的值，参数e是原内存的值。代码中能看到cmpxchg有基于各个平台的实现，这里我抉择Linux X86平台下的源码剖析：
inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {
int mp = os::is_MP();
asm volatile (LOCK_IF_MP(%4) “cmpxchgl %1,(%3)”

                : "=a" (exchange_value)
                : "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)
                : "cc", "memory");

return exchange_value;
}
复制代码这是一段小汇编，__asm__阐明是ASM汇编，__volatile__禁止编译器优化
// Adding a lock prefix to an instruction on MP machine

define LOCK_IF_MP(mp) “cmp $0, ” #mp “; je 1f; lock; 1: “

复制代码os::is_MP判断以后零碎是否为多核零碎，如果是就给总线加锁，所以同一芯片上的其余处理器就临时不能通过总线拜访内存，保障了该指令在多处理器环境下的原子性。
在正式解读这段汇编前，咱们来理解下嵌入汇编的根本格局：
asm ( assembler template

: output operands                  /* optional */
: input operands                   /* optional */
: list of clobbered registers      /* optional */
);

复制代码

template就是cmpxchgl %1,(%3)示意汇编模板

output operands示意输入操作数,=a对应eax寄存器

input operand 示意输出参数，%1 就是exchange_value, %3是dest, %4就是mp， r示意任意寄存器，a还是eax寄存器

list of clobbered registers就是些额定参数，cc示意编译器cmpxchgl的执行将影响到标记寄存器, memory通知编译器要从新从内存中读取变量的最新值，这点实现了volatile的感觉。

那么表达式其实就是cmpxchgl exchange_value ,dest，咱们会发现%2也就是compare_value没有用上，这里就要剖析cmpxchgl的语义了。cmpxchgl开端l示意操作数长度为4，下面曾经晓得了。cmpxchgl会默认比拟eax寄存器的值即compare_value和exchange_value的值，如果相等，就把dest的值赋值给exchange_value,否则，将exchange_value赋值给eax。具体汇编指令能够查看Intel手册CMPXCHG
最终，JDK通过CPU的cmpxchgl指令的反对，实现AtomicInteger的CAS操作的原子性。
CAS 的问题

ABA问题

CAS须要在操作值的时候查看下值有没有发生变化，如果没有发生变化则更新，然而如果一个值原来是A，变成了B，又变成了A，那么应用CAS进行查看时会发现它的值没有发生变化，然而实际上却变动了。这就是CAS的ABA问题。
常见的解决思路是应用版本号。在变量后面追加上版本号，每次变量更新的时候把版本号加一，那么A-B-A 就会变成1A-2B-3A。
目前在JDK的atomic包里提供了一个类AtomicStampedReference来解决ABA问题。这个类的compareAndSet办法作用是首先查看以后援用是否等于预期援用，并且以后标记是否等于预期标记，如果全副相等，则以原子形式将该援用和该标记的值设置为给定的更新值。

循环工夫长开销大

下面咱们说过如果CAS不胜利，则会原地自旋，如果长时间自旋会给CPU带来十分大的执行开销。

关于后端:Java-CAS-原理剖析

define LOCK_IF_MP(mp) “cmp $0, ” #mp “; je 1f; lock; 1: “

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于后端:Java-CAS-原理剖析

define LOCK_IF_MP(mp) “cmp $0, ” #mp “; je 1f; lock; 1: “

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复