JVM(二)Java虚拟机组成详解

5次阅读

共计 3365 个字符,预计需要花费 9 分钟才能阅读完成。

导读:详细而深入的总结,是对知识“豁然开朗”之后的“刻骨铭心”,想忘记都难。
Java 虚拟机(Java Virtual Machine)下文简称 jvm,上一篇我们对 jvm 有了大体的认识,进入本文之后我们将具体而详细的介绍 jvm 的方方面面,而本文主要讲的是 jvm 的组成,了解了它,就揭开了 jvm 的神秘面纱。
一、jvm 的主要组成部分

类加载器(ClassLoader)
运行时数据区(Runtime Data Area)
执行引擎(Execution Engine)
本地库接口(Native Interface)

接下来我们来看以上 4 个主要组成部分的用途。
二、jvm 组成部分的用途
程序在执行之前先要把 java 代码转换成字节码(class 文件),jvm 首先需要把字节码通过一定的方式 类加载器(ClassLoader)把文件加载到内存中 运行时数据区(Runtime Data Area),而字节码文件是 jvm 的一套指令集规范,并不能直接交个底层操作系统去执行,因此需要特定的命令解析器 执行引擎(Execution Engine)将字节码翻译成底层系统指令再交由 CPU 去执行,而这个过程中需要调用其他语言的接口 本地库接口(Native Interface)来实现整个程序的功能,这就是这 4 个主要组成部分的职责与功能。
而我们通常所说的 jvm 组成指的是运行时数据区(Runtime Data Area),因为通常需要程序员调试分析的区域就是“运行时数据区”,或者更具体的来说就是“运行时数据区”里面的 Heap(堆)模块,那接下来我们来看运行时数据区(Runtime Data Area)是由哪些模块组成的。
三、运行时数据区
jvm 的运行时数据区,不同虚拟机实现可能略微有所不同,但都会遵从 Java 虚拟机规范,Java 8 虚拟机规范规定,Java 虚拟机所管理的内存将会包括以下几个运行时数据区域:

程序计数器(Program Counter Register)
Java 虚拟机栈(Java Virtual Machine Stacks)
本地方法栈(Native Method Stack)
Java 堆(Java Heap)
方法区(Methed Area)

接下来我们分别介绍每个区域的用途。
3.1 程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解析器的工作是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
特性:内存私有
由于 jvm 的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,也就是任何时刻,一个处理器(或者说一个内核)都只会执行一条线程中的指令。因此为了线程切换后能恢复到正确的执行位置,每个线程都有独立的程序计数器。
异常规定:无
如果线程正在执行 Java 中的方法,程序计数器记录的就是正在执行虚拟机字节码指令的地址,如果是 Native 方法,这个计数器就为空(undefined),因此该内存区域是唯一一个在 Java 虚拟机规范中没有规定 OutOfMemoryError 的区域。
3.2 Java 虚拟机栈
Java 虚拟机栈(Java Virtual Machine Stacks)描述的是 Java 方法执行的内存模型,每个方法在执行的同时都会创建一个线帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息,每个方法从调用直至执行完成的过程,都对应着一个线帧在虚拟机栈中入栈到出栈的过程。
特性:内存私有,它的生命周期和线程相同。
异常规定:StackOverflowError、OutOfMemoryError
1、如果线程请求的栈深度大于虚拟机所允许的栈深度就会抛出 StackOverflowError 异常。
2、如果虚拟机是可以动态扩展的,如果扩展时无法申请到足够的内存就会抛出 OutOfMemoryError 异常。
3.3 本地方法栈
本地方法栈(Native Method Stack)与虚拟机栈的作用是一样的,只不过虚拟机栈是服务 Java 方法的,而本地方法栈是为虚拟机调用 Native 方法服务的。
在 Java 虚拟机规范中对于本地方法栈没有特殊的要求,虚拟机可以自由的实现它,因此在 Sun HotSpot 虚拟机直接把本地方法栈和虚拟机栈合二为一了。
特性和异常:同虚拟机栈,请参考 3.2 的知识点。
3.4 Java 堆
Java 堆(Java Heap)是 Java 虚拟机中内存最大的一块,是被所有线程共享的,在虚拟机启动时候创建,Java 堆唯一的目的就是存放对象实例,几乎所有的对象实例都在这里分配内存,随着 JIT 编译器的发展和逃逸分析技术的逐渐成熟,栈上分配、标量替换优化的技术将会导致一些微妙的变化,所有的对象都分配在堆上渐渐变得不那么“绝对”了。
特性:内存共享
异常规定:OutOfMemoryError
如果在堆中没有内存完成实例分配,并且堆不可以再扩展时,将会抛出 OutOfMemoryError。
Java 虚拟机规范规定,Java 堆可以处在物理上不连续的内存空间中,只要逻辑上连续即可,就像我们的磁盘空间一样。在实现上也可以是固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是可扩展的,通过 -Xmx 和 -Xms 控制。
3.5 方法区
方法区(Methed Area)用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。
误区:方法区不等于永生代
很多人原因把方法区称作“永久代”(Permanent Generation),本质上两者并不等价,只是 HotSpot 虚拟机垃圾回收器团队把 GC 分代收集扩展到了方法区,或者说是用来永久代来实现方法区而已,这样能省去专门为方法区编写内存管理的代码,但是在 Jdk8 也移除了“永久代”,使用 Native Memory 来实现方法区。
特性:内存共享
异常规定:OutOfMemoryError
当方法无法满足内存分配需求时会抛出 OutOfMemoryError 异常。
四、扩展知识
本节将扩展一些和内存分配有关的知识。
4.1 运行时常量池
运行时常量池是方法区的一部分,Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table)用于存放编译期生成的各种字面量和符号引用,这部分在类加载后进入方法区的运行是常量池中,如 String 类的 intern() 方法。
4.2 直接内存
直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,但这部分内存也会被频繁的使用,而且可能导致 OutOfMemoryError。在 JDK 1.4 中新加入了 NIO 类,引入了一种基于 Channel 与缓冲区 Buffer 的 IO 方式,它通过一个存储在 Java 堆中的 DirectByteBuffer 对象作为这块内存的引用操作,它因此更高效,它避免了 Java 堆和 Native 堆来回交换数据的时间。
注意:直接内存分配不会受到 Java 堆大小的限制,但是受到本机总内存大小限制,在设置虚拟机参数的时候,不能忽略直接内存,把实际内存设置为 -Xmx,使得内存区域的总和大于物理内存的限制,从而导致动态扩展时出现 OutOfMemoryError 异常。
五、总结
本文讲了 jvm 的主要组成部分,以及组成部分中最重要的运行时数据区(Runtime Data Area)的构成,其中程序计数器、虚拟机栈和本地方法为私有内存,会随着线程而生,随着线程而灭,而 Java 堆作为最大的内存区域将是开发人员重点关注的内存区域,还有方法区以及运行时常量区与永生代的关系,最后讲了直接内存的实现过程已经使用时需要主要的点,希望能够帮助大家更好的理解 jvm。
六、参考资料
Java 虚拟机的内存组成以及堆内存介绍:http://t.cn/EqVvZui
JVM 组成.md:http://t.cn/Eq6Vmuo
技术问答集锦(15)JVM 内存模型:http://t.cn/EqVvxOS
JVM 系列 (二):JVM 内存结构:http://t.cn/RB8i3RN
参考书籍:《深入理解 Java 虚拟机》
最后
关注作者公众号,了解后续更多精彩内容:

如果觉得本文对你有帮助,欢迎转发到朋友圈或直接分享给你的朋友。

正文完
 0