关于java:著名的Java并发编程大师都这么说了你还不知道伪共享么

记得关注我【看点代码再下班】，订阅更多好文！

全文共计2163字18图，预计浏览工夫13分钟

大家好，我是tin，这是我的第7篇原创文章

图拍摄于深圳桃园南山图书馆，年前某个阳光明媚的周六，看到挂满的灯笼，感觉甚是喜庆。文章较长，先上一个目录：上个全文目录：

一、Doug Lea
二、CPU缓存架构
三、CPU缓存行
四、伪共享
五、结语

一、Doug lea

在微博上看到这么一句话，挺有意思的。

Doug Lea是谁？为什么这么说？预计还真挺多人不意识他吧。

Doug Lea，中文名为道格·利。java.util.concurrent并发包的作者。说他是这个世界上对Java影响力最大的一个人，一点也不为过。因为两次Java历史上的大改革，他都间接或间接的表演了无足轻重的角色。2004年所推出的Tiger。Tiger广纳了15项JSRs的语法及规范，其中一项便是JSR-166。JSR-166是来自于Doug编写的util.concurrent包，次要是对于J.U.C的技术规范。

上文摘抄自百度百科：

JSRs(Java Specification Requests)，示意Java标准申请，由JCP成员向委员会提交的Java倒退议案，通过一系列流程后，如果通过最终会体现在将来的Java中。

JCP全称Java Community Process ，翻译中文即是：Java社区过程。JCP成立于1998年，官网地址https://www.jcp.org，由社会各界Java组成的社区，次要布局和领导Java的倒退。

二、CPU缓存架构

国内另一位大神，dubbo的创作者，已经在他的ppt写过这样的一页

或者有人曾经猜到这ppt作者是谁的，有趣味可自行理解（须要残缺ppt也可分割我！）。ppt形容的背地原理就是伪共享问题。

说起伪共享，还得从cpu的缓存架构说起。

CPU缓存能够分为一级缓存，二级缓存，三级缓存，每一级缓存中所贮存的全副数据都是下一级缓存的一部分。当CPU要读取一个数据时，首先从一级缓存中查找，如果没有找到再从二级缓存中查找，如果还是没有就从三级缓存或内存中查找。一般来说，每级缓存的命中率大略都在80%左右，也就是说全副数据量的80%都能够在一级缓存中找到，只剩下20%的总数据量才须要从二级缓存、三级缓存或内存中读取。

越凑近 CPU 的缓存越快也越小。所以 L1 缓存很小但很快，紧接着L2 大一些，也会慢一些，L3更慢，最初到主存，主存保留着程序运行的所有数据，由所有 CPU 核共享。

三、CPU缓存行

CPU缓存由缓存行组成，缓存行长度为64字节，能够这么认为，缓存行是缓存更新的根本单位。缓存每次更新都从主内存中加载间断的 64 个字节。试想，如果在内存中有两个紧邻的long型变量a和b，当a加载到缓存时，b也能够一起被加载到缓存，下一次如果拜访b则能够间接从缓存读取，这对读取的效率晋升是十分大的。

然而，正因为缓存都以缓存行为根本单位解决，如果cpu core1批改a变量，core1上蕴含a变量的缓存即将生效，同时其余core上蕴含a变量的缓存行也将生效。此时，如果core2要拜访和a在同一缓存行上的b变量，会被告知缓存行生效，这时只能到主内存从新加载b变量。

在《Java并发编程的艺术》一书中，第二章第11页如是说：

Doug lea在jdk7的并发包外面新增一个队列汇合类LinkedTransferQueue，它在应用volatie变量时，用一种追加字节的形式来优化队列出队和入队的性能。

四、伪共享

缓存以缓存行为根本单位，当线程批改相互独立的变量时，如果这些变量在同一缓存行中，那么就会相互变量缓存值得有效性，从而影响拜访性能，这就是伪共享。

看一个单元测试源码：

package com.tin.example.falls.sharing;

import org.springframework.util.StopWatch;

/**
 * title: AutoIncrement
 * <p>
 * description: 多线程环境下，long变量自增
 *
 * @author tin @看点代码再下班 on 2021/2/17 下午1:28
 */
public class AutoIncrement {

 public static void main(String[] args) throws InterruptedException {
 StopWatch stopWatch = new StopWatch("@看点代码再下班");
 stopWatch.start();
 System.out.println("====== start to iterate ======");
 autoIncrement(new LongNumber());

 stopWatch.stop();
 System.out.println("cost " + stopWatch.getTotalTimeMillis() + "ms");
 }

 private static void autoIncrement(LongNumber longNumber) throws InterruptedException {
 Thread t1 = new Thread(() -> {
 for (int i = 0; i < 100000000; i++) {
 longNumber.n1++;
 }
 });

 Thread t2 = new Thread(() -> {
 for (int i = 0; i < 100000000; i++) {
 longNumber.n2++;
 }
 });

 t1.start();
 t2.start();
 t1.join();
 t2.join();
 }

 static class LongNumber {
//        @sun.misc.Contended
 volatile long n1;
 volatile long n2;
 }
}

当我启用两个线程，别离自增1亿次n1和n2时，耗时大概3000+ms

当我在n1字段加上注解@sun.misc.Contended，从新跑程序，耗时变为800+ms

@sun.misc.Contended注解在Java 8后新增，其用来进行缓存行填充。它能够用于类级别的润饰，同时也能够用于字段级别的润饰，当利用于字段级别时，被正文的字段将和其余字段隔离开来，会被加载在独立的缓存行上。

@sun.misc.Contended注解和上文ppt中提及的追加字节成果是等同的（注解要失效需在启动参数上加-XX:-RestrictContended）。除了加注解，如果在n1和n2两头减少16个对象援用也同样起到作用（一个对象援用4个字节）。

咱们要看一个对象所占的字节数大小怎么看？分享一个好货色，援用上面的包依赖：

 <dependency>
 <groupId>org.openjdk.jol</groupId>
 <artifactId>jol-core</artifactId>
 <version>0.9</version>
 </dependency>

代码中显式打印对象即可：

ClassLayout.parseInstance(obj).toPrintable()

能够看到打印进去的后果：

五、结语

我是tin，一个在致力让本人变得更优良的一般攻城狮。本人经历无限、学识肤浅，如有发现文章不妥之处，十分欢送加我提出，我肯定仔细斟酌加以批改。

看到这里请安顿个点赞再走吧，保持原创不容易，你的正反馈是我保持输入的最弱小能源，谢谢啦！

别忘了关注我哦！⏬⏬⏬

关于java:著名的Java并发编程大师都这么说了你还不知道伪共享么

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:著名的Java并发编程大师都这么说了你还不知道伪共享么

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复