乐趣区

关于java:著名的Java并发编程大师都这么说了你还不知道伪共享么

记得关注我【看点代码再下班】,订阅更多好文!

全文共计 2163 字 18 图,预计浏览工夫 13 分钟

大家好,我是 tin,这是我的第 7 篇原创文章

图拍摄于深圳桃园南山图书馆,年前某个阳光明媚的周六,看到挂满的灯笼,感觉甚是喜庆。文章较长,先上一个目录:上个全文目录:

  • 一、Doug Lea
  • 二、CPU 缓存架构
  • 三、CPU 缓存行
  • 四、伪共享
  • 五、结语

一、Doug lea

在微博上看到这么一句话,挺有意思的。

Doug Lea 是谁?为什么这么说?预计还真挺多人不意识他吧。

Doug Lea,中文名为道格·利。java.util.concurrent 并发包的作者。说他是这个世界上对 Java 影响力最大的一个人,一点也不为过。因为两次 Java 历史上的大改革,他都间接或间接的表演了无足轻重的角色。2004 年所推出的 Tiger。Tiger 广纳了 15 项 JSRs 的语法及规范,其中一项便是 JSR-166。JSR-166 是来自于 Doug 编写的 util.concurrent 包,次要是对于 J.U.C 的技术规范。

上文摘抄自百度百科:

JSRs(Java Specification Requests),示意 Java 标准申请,由 JCP 成员向委员会提交的 Java 倒退议案,通过一系列流程后,如果通过最终会体现在将来的 Java 中。

JCP 全称 Java Community Process,翻译中文即是:Java 社区过程。JCP 成立于 1998 年,官网地址 https://www.jcp.org,由社会各界 Java 组成的社区,次要布局和领导 Java 的倒退。

二、CPU 缓存架构

国内另一位大神,dubbo 的创作者,已经在他的 ppt 写过这样的一页

或者有人曾经猜到这 ppt 作者是谁的,有趣味可自行理解(须要残缺 ppt 也可分割我!)。ppt 形容的背地原理就是伪共享问题。

说起伪共享,还得从 cpu 的缓存架构说起。

CPU 缓存能够分为一级缓存,二级缓存,三级缓存,每一级缓存中所贮存的全副数据都是下一级缓存的一部分。当 CPU 要读取一个数据时,首先从一级缓存中查找,如果没有找到再从二级缓存中查找,如果还是没有就从三级缓存或内存中查找。一般来说,每级缓存的命中率大略都在 80% 左右,也就是说全副数据量的 80% 都能够在一级缓存中找到,只剩下 20% 的总数据量才须要从二级缓存、三级缓存或内存中读取。

越凑近 CPU 的缓存越快也越小。所以 L1 缓存很小但很快,紧接着 L2 大一些,也会慢一些,L3 更慢,最初到主存,主存保留着程序运行的所有数据,由所有 CPU 核共享。

三、CPU 缓存行

CPU 缓存由缓存行组成,缓存行长度为 64 字节,能够这么认为,缓存行是缓存更新的根本单位。缓存每次更新都从主内存中加载间断的 64 个字节。试想,如果在内存中有两个紧邻的 long 型变量 a 和 b,当 a 加载到缓存时,b 也能够一起被加载到缓存,下一次如果拜访 b 则能够间接从缓存读取,这对读取的效率晋升是十分大的。

然而,正因为缓存都以缓存行为根本单位解决,如果 cpu core1 批改 a 变量,core1 上蕴含 a 变量的缓存即将生效,同时其余 core 上蕴含 a 变量的缓存行也将生效。此时,如果 core2 要拜访和 a 在同一缓存行上的 b 变量,会被告知缓存行生效,这时只能到主内存从新加载 b 变量。

在《Java 并发编程的艺术》一书中,第二章第 11 页如是说:

Doug lea 在 jdk7 的并发包外面新增一个队列汇合类 LinkedTransferQueue,它在应用 volatie 变量时,用一种追加字节的形式来优化队列出队和入队的性能。

四、伪共享

缓存以缓存行为根本单位,当线程批改相互独立的变量时,如果这些变量在同一缓存行中,那么就会相互变量缓存值得有效性,从而影响拜访性能,这就是伪共享。

看一个单元测试源码:

package com.tin.example.falls.sharing;
​
import org.springframework.util.StopWatch;
​
/**
 * title: AutoIncrement
 * <p>
 * description: 多线程环境下,long 变量自增
 *
 * @author tin @看点代码再下班 on 2021/2/17 下午 1:28
 */
public class AutoIncrement {
​
 public static void main(String[] args) throws InterruptedException {StopWatch stopWatch = new StopWatch("@看点代码再下班");
 stopWatch.start();
 System.out.println("====== start to iterate ======");
 autoIncrement(new LongNumber());
​
 stopWatch.stop();
 System.out.println("cost" + stopWatch.getTotalTimeMillis() + "ms");
 }
​
 private static void autoIncrement(LongNumber longNumber) throws InterruptedException {Thread t1 = new Thread(() -> {for (int i = 0; i < 100000000; i++) {longNumber.n1++;}
 });
​
 Thread t2 = new Thread(() -> {for (int i = 0; i < 100000000; i++) {longNumber.n2++;}
 });
​
 t1.start();
 t2.start();
 t1.join();
 t2.join();}
​
 static class LongNumber {
//        @sun.misc.Contended
 volatile long n1;
 volatile long n2;
 }
}

当我启用两个线程,别离自增 1 亿次 n1 和 n2 时,耗时大概 3000+ms

当我在 n1 字段加上注解 @sun.misc.Contended,从新跑程序,耗时变为 800+ms

@sun.misc.Contended 注解在 Java 8 后新增,其用来进行缓存行填充。它能够用于类级别的润饰,同时也能够用于字段级别的润饰,当利用于字段级别时,被正文的字段将和其余字段隔离开来,会被加载在独立的缓存行上。

@sun.misc.Contended 注解和上文 ppt 中提及的追加字节成果是等同的(注解要失效需在启动参数上加 -XX:-RestrictContended)。除了加注解,如果在 n1 和 n2 两头减少 16 个对象援用也同样起到作用(一个对象援用 4 个字节)。

咱们要看一个对象所占的字节数大小怎么看?分享一个好货色,援用上面的包依赖:

 <dependency>
 <groupId>org.openjdk.jol</groupId>
 <artifactId>jol-core</artifactId>
 <version>0.9</version>
 </dependency>

代码中显式打印对象即可:

ClassLayout.parseInstance(obj).toPrintable()

能够看到打印进去的后果:

五、结语

我是 tin,一个在致力让本人变得更优良的一般攻城狮。本人经历无限、学识肤浅,如有发现文章不妥之处,十分欢送加我提出,我肯定仔细斟酌加以批改。

看到这里请安顿个点赞再走吧,保持原创不容易,你的正反馈是我保持输入的最弱小能源,谢谢啦!

别忘了关注我哦!⏬⏬⏬

退出移动版