关于java:一个-println-竟然比-volatile-还好使

先点赞再看，养成好习惯

前两天一个小伙伴忽然找我求助，说筹备换个坑，最近在零碎学习多线程常识，但遇到了一个刷新认知的问题……

小伙伴：Effective JAVA 里的并发章节里，有一段对于可见性的形容。上面这段代码会呈现死循环，这个我能了解，JMM 内存模型嘛，JMM 不保障 stopRequested 的批改能被及时的观测到。

static boolean stopRequested = false;

public static void main(String[] args) throws InterruptedException {

    Thread backgroundThread = new Thread(() -> {
        int i = 0;
        while (!stopRequested) {
            i++;
        }
    }) ;
    backgroundThread.start();
    TimeUnit.MICROSECONDS.sleep(10);
    stopRequested = true ;
}

但奇怪的是在我加了一行打印之后，就不会呈现死循环了！难道我一行 println 能比 volatile 还好使啊？这俩也没关系啊

static boolean stopRequested = false;

public static void main(String[] args) throws InterruptedException {

    Thread backgroundThread = new Thread(() -> {
        int i = 0;
        while (!stopRequested) {

            // 加上一行打印，循环就能退出了！
            System.out.println(i++);
        }
    }) ;
    backgroundThread.start();
    TimeUnit.MICROSECONDS.sleep(10);
    stopRequested = true ;
}

我：小伙子八股文背的挺熟啊，JMM 张口就来。

我：这个……其实是 JIT 干的坏事，导致你的循环无奈退出。JMM 只是一个逻辑上的内存模型，外部有些机制是和 JIT 无关的

比方你第一个例子里，你用-Xint禁用 JIT，就能够退出死循环了，不信你试试？

小伙伴：卧槽，真的能够，加上 -Xint 循环就退出了，好神奇！JIT 是个啥啊？还能有这种效用？

JIT（Just-in-Time）的优化

家喻户晓，JAVA 为了实现跨平台，减少了一层 JVM，不同平台的 JVM 负责解释执行字节码文件。尽管有一层解释会影响效率，但益处是跨平台，字节码文件是平台无关的。

在 JAVA 1.2 之后，减少了 即时编译（Just-in-Time Compilation，简称 JIT） 的机制，在运行时能够将执行次数较多的热点代码编译为机器码，这样就不须要 JVM 再解释一遍了，能够间接执行，减少运行效率。

但 JIT 编译器在编译字节码时，可不仅仅是简略的间接将字节码翻译成机器码，它在编译的同时还会做很多优化，比方循环展开、办法内联等等……

这个问题呈现的起因，就是因为 JIT 编译器的优化技术之一 – 表达式晋升（expression hoisting） 导致的。

表达式晋升（expression hoisting）

先来看个例子，在这个 hoisting 办法中，for 循环里每次都会定义一个变量 y，而后通过将 x*y 的后果存储在一个 result 变量中，而后应用这个变量进行各种操作

public void hoisting(int x) {
    for (int i = 0; i < 1000; i = i + 1) {
        // 循环不变的计算 
        int y = 654;
        int result = x * y;

        // ...... 基于这个 result 变量的各种操作
    }
}

然而这个例子里，result 的后果是固定的，并不会跟着循环而更新。所以齐全能够将 result 的计算提取到循环之外，这样就不必每次计算了。JIT 剖析后会对这段代码进行优化，进行表达式晋升的操作：

public void hoisting(int x) {
    int y = 654;
    int result = x * y;

    for (int i = 0; i < 1000; i = i + 1) {    
        // ...... 基于这个 result 变量的各种操作
    }
}

这样一来，result 不必每次计算了，而且也齐全不影响执行后果，大大晋升了执行效率。

留神，编译器更喜爱局部变量，而不是动态变量或者成员变量；因为动态变量是“逃逸在外的”，多个线程都能够拜访到，而局部变量是线程公有的，不会被其余线程拜访和批改。

编译器在解决动态变量/成员变量时，会比拟激进，不会轻易优化。

像你问题里的这个例子中，stopRequested就是个动态变量，编译器本不应该对其进行优化解决；

static boolean stopRequested = false;// 动态变量

public static void main(String[] args) throws InterruptedException {

    Thread backgroundThread = new Thread(() -> {
        int i = 0;
        while (!stopRequested) {
            // leaf method
            i++;
        }
    }) ;
    backgroundThread.start();
    TimeUnit.MICROSECONDS.sleep(10);
    stopRequested = true ;
}

但因为你这个循环是个 leaf method，即没有调用任何办法，所以在循环之中不会有其余线程会观测到stopRequested值的变动。那么编译器就冒进的进行了表达式晋升的操作，将stopRequested晋升到表达式之外，作为循环不变量（loop invariant）解决：

int i = 0;

boolean hoistedStopRequested = stopRequested;// 将stopRequested 晋升为局部变量
while (!hoistedStopRequested) {    
    i++;
}

这样一来，最初将 stopRequested赋值为 true 的操作，影响不了晋升的hoistedStopRequested的值，天然就无奈影响循环的执行了，最终导致无奈退出。

至于你减少了 println 之后，循环就能够退出的问题。是因为你这行 println 代码影响了编译器的优化。println 办法因为最终会调用 FileOutputStream.writeBytes 这个 native 办法，所以无奈被内联优化（inling）。而未被内敛的办法调用从编译器的角度看是一个“full memory kill”，也就是说 副作用不明 、必须对内存的读写操作做激进解决。

在这个例子里，下一轮循环的 stopRequested 读取操作按程序要产生在上一轮循环的 println 之后。这里“激进解决”为：就算上一轮我曾经读取了 stopRequested 的值，因为通过了一个副作用不明的中央，再到下一次拜访就必须从新读取了。

所以在你减少了 prinltln 之后，JIT 因为要激进解决，从新读取，天然就不能做下面的表达式晋升优化了。

以上对表达式晋升的解释，总结摘抄自 R大的知乎答复。

我：“这下明确了吧，这都是 JIT 干的坏事，你要是禁用 JIT 就没这问题了”

小伙伴：“卧槽🐂🍺，一个简略的 for 循环也太多机制了，没想到 JIT 这么智能，也没想到 R 大这么🐂🍺”

小伙伴：“那 JIT 肯定很多优化机制吧，除了这个表达式晋升还有啥？”

我：我也不是搞编译器的……哪理解这么多，就晓得一些罕用的，简略给你说说吧

表达式下沉（expression sinking）

和表达式晋升相似的，还有个表达式下沉的优化，比方上面这段代码：

public void sinking(int i) {
    int result = 543 * i;

    if (i % 2 == 0) {
        // 应用 result 值的一些逻辑代码
    } else {
        // 一些不应用 result 的值的逻辑代码
    }
}

因为在 else 分支里，并没有应用 result 的值，可每次不论什么分支都会先计算 result，这就没必要了。JIT 会把 result 的计算表达式挪动到 if 分支里，这样就防止了每次对 result 的计算，这个操作就叫表达式下沉：

public void sinking(int i) {
    if (i % 2 == 0) {
        int result = 543 * i;
        // 应用 result 值的一些逻辑代码
    } else {
        // 一些不应用 result 的值的逻辑代码
    }
}

JIT 还有那些常见优化？

除了下面介绍的表达式晋升/表达式下沉以外，还有一些常见的编译器优化机制。

循环展开（Loop unwinding/loop unrolling）

上面这个 for 循环，一共要循环 10w 次，每次都须要查看条件。

for (int i = 0; i < 100000; i++) {
    delete(i);
}

在编译器的优化后，会删除肯定的循环次数，从而升高索引递增和条件查看操作而引起的开销：

for (int i = 0; i < 20000; i+=5) {
    delete(i);
    delete(i + 1);
    delete(i + 2);
    delete(i + 3);
    delete(i + 4);
}

除了循环展开，循环还有一些优化机制，比方循环剥离、循环替换、循环决裂、循环合并……

内联优化（Inling）

JVM 的办法调用是个栈的模型，每次办法调用都须要一个压栈（push）和出栈（pop）的操作，编译器也会对调用模型进行优化，将一些办法的调用进行内联。

内联就是抽取要调用的办法体代码，到以后办法中间接执行，这样就能够防止一次压栈出栈的操作，晋升执行效率。比方上面这个办法：

public  void inline(){
    int a = 5;
    int b = 10;
    int c = calculate(a, b);

    // 应用 c 解决……
}

public int calculate(int a, int b){
    return a + b;
}

在编译器内联优化后，会将 calculate 的办法体抽取到 inline 办法中，间接执行，而不必进行办法调用：

public  void inline(){
    int a = 5;
    int b = 10;
    int c = a + b;

    // 应用 c 解决……
}

不过这个内联优化是有一些限度的，比方 native 的办法就不能内联优化

提前置空

来先看一个例子，在这个例子中 was finalized! 会在 done.之前输入，这个也是因为 JIT 的优化导致的。

class A {
    // 对象被回收前，会触发 finalize
    @Override protected void finalize() {
        System.out.println(this + " was finalized!");
    }

    public static void main(String[] args) throws InterruptedException {
        A a = new A();
        System.out.println("Created " + a);
        for (int i = 0; i < 1_000_000_000; i++) {
            if (i % 1_000_00 == 0)
                System.gc();
        }
        System.out.println("done.");
    }
}

//打印后果
Created A@1be6f5c3
A@1be6f5c3 was finalized!//finalize办法输入
done.

从例子中能够看到，如果 a 在循环实现后曾经不再应用了，则会呈现先执行finalize的状况；尽管从对象作用域来说，办法没有执行完，栈帧并没有出栈，然而还是会被提前执行。

这就是因为 JIT 认为 a 对象在循环内和循环后都不会在应用，所以提前给它置空了，帮忙 GC 回收；如果禁用 JIT，那就不会呈现这个问题……

这个提前回收的机制，还是有点危险的，在某些场景下会引起 BUG

HotSpot VM JIT 的各种优化项

下面只是介绍了几个简略罕用的编译优化机制，JVM JIT 更多的优化机制能够参考上面这个图。这是 OpenJDK 文档中提供的一个 pdf 资料，外面列出了 HotSpot JVM 的各种优化机制，相当多……

如何防止因 JIT 导致的问题？

小伙伴：“JIT 这么多优化机制，很容易出问题啊，我平时写代码要怎么避开这些呢”

平时在编码的时候，不必刻意的去关怀 JIT 的优化，就比方下面那个 println 问题，JMM 原本就不保障批改对其余线程可见，如果依照标准去加锁或者用 volatile 润饰，基本就不会有这种问题。

而那个提前置空导致的问题，呈现的几率也很低，只有你标准写代码根本不会遇到的。

我：所以，这不是 JIT 的锅，是你的……

小伙伴：“懂了，你这是说我菜，说我代码写的屎啊……”

总结

在日常编码过程中，不必刻意的猜想 JIT 的优化机制，JVM 也不会残缺的通知你所有的优化。而且这种货色不同版本成果不一样，就算搞明确了一个机制，可能到下个版本就齐全不一样了。

所以，如果不是搞编译器开发的话，JIT 相干的编译常识，作为一个常识储备就好。

也不必去猜想 JIT 到底会怎么优化你的代码，你（可能）猜不准……

关于java:一个-println-竟然比-volatile-还好使

JIT（Just-in-Time）的优化

表达式晋升（expression hoisting）

表达式下沉（expression sinking）

JIT 还有那些常见优化？

循环展开（Loop unwinding/loop unrolling）

内联优化（Inling）

提前置空

HotSpot VM JIT 的各种优化项

如何防止因 JIT 导致的问题？

总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:一个-println-竟然比-volatile-还好使

JIT（Just-in-Time） 的优化

表达式晋升（expression hoisting）

表达式下沉（expression sinking）

JIT 还有那些常见优化？

循环展开（Loop unwinding/loop unrolling）

内联优化（Inling）

提前置空

HotSpot VM JIT 的各种优化项

如何防止因 JIT 导致的问题？

总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

JIT（Just-in-Time）的优化

发表回复取消回复