Java内存模型JMM详解

26次阅读

共计 3441 个字符,预计需要花费 9 分钟才能阅读完成。

在 Java JVM 系列文章中有朋友问为什么要 JVM,Java 虚拟机不是已经帮我们处理好了么?同样,学习 Java 内存模型也有同样的问题,为什么要学习 Java 内存模型。它们的答案是一致的:能够让我们更好的理解底层原理,写出更高效的代码。

就 Java 内存模型而言,它是深入了解 Java 并发编程的先决条件。对于后续多线程中的线程安全、同步异步处理等更是大有裨益。

硬件内存架构

在学习 Java 内存模型之前,先了解一下计算机硬件内存模型。我们多知道处理器与计算机存储设备运算速度有几个数量级的差别。总不能让处理器总是等待计算机存储设备,这样就没办法显现出处理器的优势。

因此,为了“压榨”处理的性能,达到“高并发”的效果,在处理器和存储设备之间加入了高速缓存(cache)来作为缓冲。

将运算需要使用到的数据复制到缓存中,让运算能够快速进行。当运算完成之后,再将缓存中的结果写入主内存,这样运算器就不用等待主内存的读写操作了。

每个处理器都有自己的高速缓存,同时又共同操作同一块主内存,当多个处理器同时操作主内存时,可能导致数据不一致,因此需要“缓存一致性协议”来保障。比如,MSI、MESI 等。

Java 内存模型

Java 内存模型即 Java Memory Model,简称 JMM。用来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让 Java 程序在各平台下都能够达到一致的内存访问效果。

JMM 定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存(main memory)中,每个线程都有一个私有的本地内存(local memory),本地内存中存储了该线程以读 / 写共享变量的副本。本地内存是 JMM 的一个抽象概念,并不真实存在。它涵盖了缓存,写缓冲区,寄存器以及其他的硬件和编译器优化。

JMM 与 Java 内存结构并不是同一个层次的内存划分,两者基本没有关系。如果一定要勉强对应,那从变量、主内存、工作内存的定义看,主内存主要对应 Java 堆中的对象实例数据部分,工作内存则对应虚拟机栈的部分区域。

主内存:主要存储的是 Java 实例对象,所有线程创建的实例对象都存放在主内存中,不管该实例对象是成员变量还是方法中的本地变量(也称局部变量),当然也包括了共享的类信息、常量、静态变量。共享数据区域,多条线程对同一个变量进行访问可能会发现线程安全问题。

工作内存:主要存储当前方法的所有本地变量信息(工作内存中存储着主内存中的变量副本拷贝),每个线程只能访问自己的工作内存,即线程中的本地变量对其它线程是不可见的,就算是两个线程执行的是同一段代码,它们也会各自在自己的工作内存中创建属于当前线程的本地变量,当然也包括了字节码行号指示器、相关 Native 方法的信息。由于工作内存是每个线程的私有数据,线程间无法相互访问工作内存,因此存储在工作内存的数据不存在线程安全问题。

JMM 模型与硬件模型直接的对照关系可简化为下图:

内存之间的交互操作

线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作都必须在工作内存中进行,而不能直接读写主内存中的变量。不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。

如上图,本地内存 A 和 B 有主内存中共享变量 x 的副本,初始值都为 0。线程 A 执行之后把 x 更新为 1,存放在本地内存 A 中。当线程 A 和线程 B 需要通信时,线程 A 首先会把本地内存中 x = 1 值刷新到主内存中,主内存中的 x 值变为 1。随后,线程 B 到主内存中去读取更新后的 x 值,线程 B 的本地内存的 x 值也变为了 1。

在此交互过程中,Java 内存模型定义了 8 种操作来完成,虚拟机实现必须保证每一种操作都是原子的、不可再拆分的(double 和 long 类型例外)。

  • lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
  • read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的 load 动作使用。
  • load(载入):作用于工作内存的变量,它把 read 操作从主内存中得到的变量值放入工作内存的变量副本中。
  • use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。
  • assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
  • store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的 write 操作使用。
  • write(写入):作用于主内存的变量,它把 store 操作从工作内存中得到的变量的值放入主内存的变量中。

如果需要把一个变量从主内存复制到工作内存,那就要顺序地执行 read 和 load 操作,如果要把变量从工作内存同步回主内存,就要顺序地执行 store 和 write 操作。注意,Java 内存模型只要求上述两个操作必须按顺序执行,而没有保证是连续执行。也就是说 read 与 load 之间、store 与 write 之间是可插入其他指令的,如对主内存中的变量 a、b 进行访问时,一种可能出现顺序是 read a、read b、load b、load a。除此之外,Java 内存模型还规定了在执行上述 8 中基本操作时必须满足如下规则。

  • 不允许 read 和 load、store 和 write 操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起回写了但主内存不接受的情况出现。
  • 不允许一个线程丢弃它的最近的 assign 操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。
  • 不允许一个线程无原因地(没有发生过任何 assign 操作)把数据从线程的工作内存同步回主内存。
  • 一个新的变量只能在主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load 或 assign)的变量,换句话说,就是对一个变量实施 use、store 操作之前,必须先执行过了 assign 和 load 操作。
  • 一个变量在同一时刻只允许一条线程对其进行 lock 操作,但 lock 操作可以被同一条线程重复执行多次,多次执行 lock 后,只有执行相同次数的 unlock 操作,变量才会被解锁。
  • 如果对一个变量执行 lock 操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行 load 或 assign 操作初始化变量的值。
  • 如果一个变量事先没有被 lock 操作锁定,那就不允许对它执行 unlock 操作,也不允许去 unlock 一个被其他线程锁定住的变量。
  • 对一个变量执行 unlock 操作之前,必须先把此变量同步回主内存中(执行 store、write 操作)。

long 和 double 型变量的特殊规则

Java 内存模型要求 lock,unlock,read,load,assign,use,store,write 这 8 个操作都具有原子性,但对于 64 位的数据类型(long 或 double),在模型中定义了一条相对宽松的规定,允许虚拟机将没有被 volatile 修饰的 64 位数据的读写操作划分为两次 32 位的操作来进行,即允许虚拟机实现选择可以不保证 64 位数据类型的 load,store,read,write 这 4 个操作的原子性,即 long 和 double 的非原子性协定。

如果多线程的情况下 double 或 long 类型并未声明为 volatile,可能会出现“半个变量”的数值,也就是既非原值,也非修改后的值。

虽然 Java 规范允许上面的实现,但商用虚拟机中基本都采用了原子性的操作,因此在日常使用中几乎不会出现读取到“半个变量”的情况。

小结

本节课重点介绍了 Java 内存模型以及内存交互的步骤和操作。下篇文章将重点介绍 Java 内存模型涉及的几个特征和原则。欢迎关注微信公众号“程序新视界”,第一时间获得最新文章的更新。

原文链接:《Java 内存模型 (JMM) 详解》

《面试官》系列文章:

  • 《JVM 之内存结构详解》
  • 《面试官,不要再问我“Java GC 垃圾回收机制”了》
  • 《面试官,Java8 JVM 内存结构变了,永久代到元空间》
  • 《面试官,不要再问我“Java 垃圾收集器”了》
  • 《Java 虚拟机类加载器及双亲委派机制》
  • 《Java 内存模型 (JMM) 详解》

<center>程序新视界:精彩和成长都不容错过 </center>

正文完
 0