[Java并发]1，入门：并发编程Bug的源头

介绍
如何坚决并发问题，首先要理解并发的实际源头怎么发生的。
现代大家使用的计算机的不同硬件的运行速度是不一样的，这个大家应该都是知道的。
计算机数据传输运行速度上的快慢比较： CPU > 缓存 > I/O
如何最大化的让不通速度的硬件可以更好的协调执行，需要做一些“撮合”的工作

CUP增加了高速缓存来均衡与缓存间的速度差异
操作系统增加了进程，线程，以分时复用CPU，进而均衡CPU与I/O的速度差异（当等待I/O的时候切换给其他CPU去执行）
现代编程语言的编译器优化指令顺序，使得缓存能够合理的利用

上面说来并发才生问题的背景，下面说下并发才生的具体原因是什么
缓存导致的可见性问题
先看下单核CPU和缓存之间的关系：
单核情况下，也是最简单的情况，线程A操作写入变量A，这个变量A的值肯定是被线程B所见的。因为2个线程是在一个CPU上操作，所用的也是同一个CPU缓存。
这里我们来定义
一个线程对共享变量的修改，另外一个线程能够立刻看到，我们称为 “可见性”
多核CPU时代下，我们在来看下具体情况：

很明显，多核情况下每个CPU都有自己的高速缓存，所以变量A的在每个CPU中可能是不同步的，不一致的。结果程A刚好操作来CPU1的缓存，而线程B也刚好只操作了CPU2的缓存。所以这情况下，当线程A操作变量A的时候，变量并不对线程B可见。
我们用一段经典的代码说明下可见性的问题：
private void add10K() {
int idx = 0;
while (idx++ < 100000) {
count += 1;
}
}

@Test
public void demo() {

// 创建两个线程，执行 add() 操作
Thread th1 = new Thread(() -> {
add10K();
});
Thread th2 = new Thread(() -> {
add10K();
});
// 启动两个线程
th1.start();
th2.start();
// 等待两个线程执行结束

try {
th1.join();
th2.join();
} catch (Exception exc) {

exc.printStackTrace();
}

System.out.println(count);

}
大家应该都知道，答案肯定不是 200000这就是可见性导致的问题，因为2个线程读取变量count时，读取的都是自己CPU下的高速缓存内的缓存值，+1时也是在自己的高速缓存中。
线程切换带来的原子性问题
进程切换最早是为了提高CPU的使用率而出现的。
比如，50毫米操作系统会重新选择一个进程来执行（任务切换），50毫米成为“时间片”

早期的操作系统是进程间的切换，进程间的内存空间是不共享的，切换需要切换内存映射地址，切换成本大。
而一个进程创建的所有线程，内存空间都是共享的。所以现在的操作系统都是基于更轻量的线程实现切换的，现在我们提到的“任务切换”都是线程切换。
任务切换的时机大多数在“时间片”结束的时候。
现在我们使用的基本都是高级语言，高级语言的一句对应多条CPU命令，比如 count +=1 至少对应3条CPU命令，指令：
1, 从内存加载到CPU的寄存器2, 在寄存器执行 +13, 最后，讲结果写回内存（缓存机制导致可能写入的是CPU缓存而不是内存）
操作系统做任务切换，会在任意一条CPU指令执行完就行切换。所以会导致问题

如图所示，线程A当执行完初始化count=0时候，刚好被线程切换给了线程B。线程B执行count+1=1并最后写入值到缓存中，CPU切换回线程A后，继续执行A线程的count+1=1并再次写入缓存，最后缓存中的count还是为1.一开始我们任务count+1=1应该是一个不能再被拆开的原子操作。
我们把一个或多个操作在CPU执行过程中的不被中断的特性称为原子性。
CPU能够保证的原子性，是CPU指令级别的。所以高级语言需要语言层面保证操作的原子性。
编译优化带来的有序性问题
有序性。顾名思义，有序性指的是程序按照代码的先后顺序执行。
编译器为了优化性能，有时候会改变程序中语句的先后顺序，例如程序中：a=6；b=7；编译器优化后可能变成b=7；a=6；，在这个例子中，编译器调整了语句的顺序，但是不影响程序的最终结果。不过有时候编译器及解释器的优化可能导致意想不到的 Bug。
Java中的经典案例，双重检查创建单例对象；
public class Singleton {

static Singleton instance;

static Singleton getInstance(){

if (instance == null) {

synchronized(Singleton.class) {

if (instance == null)

instance = new Singleton();

}

}
return instance;
}
}
看似完美的代码，其实有问题。问题就在new上。
想象中 new操作步骤：1，分配一块内存 M2，在内存M上初始化对象3，把内存M地址赋值给变量
实际上就行编译后的顺序是：1，分开一块内存 M2，把内存M地址赋值给变量3，在内存M上初始化对象
优化导致的问题：

如图所示，当线程A执行到第二步的时候，被线程切换了，这时候，instance未初始化实例的对象，而线程B这时候执行到instance == null ?的判断中，发现instance已经有“值”了，导致了返回了一个空对象的异常。
总结
1，缓存引发的可见性2，切换线程带来的原子性3，编译带来的有序性
深刻理解这些前因后果，可以诊断大部分并发的问题！

[Java并发]1，入门：并发编程Bug的源头

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

[Java并发]1，入门：并发编程Bug的源头

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复