1. JVM 内存结构
1.1 运行时数据区
运行时数据区是规范,内存结构是具体实现。
官方运行时数据区定义
- 程序计数器 PC Register:JVM 支持多线程同时执行,每一个线程都有自己的 PC Register,线程正在执行的方法叫做当前方法,如果是 java 代码,PC Register 里面存放的就是房钱正在执行的指令的地址,如果你是 C 代码,则为空。
- Java 虚拟机栈(Java Virtual Machine Stacks)是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是 Java 方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口灯信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
- Java 堆(Java Heap)是 Java 虚拟机所管理的内存中最大的一块。堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。Java 堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
- 方法区(Method Area):方法区域 java 堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常亮、静态变量、即时编译器编译后的代码等数据。虽然 Java 虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做 Non-Heap(非堆),目的是与 Java 堆区分开来。
- 运行时常量池(Runtime Constant Pool)是方法区的一部分。Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的常量池中存放。
- 本地方法栈(Native Method Stacks)与虚拟机栈所放回的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行的 Java 方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。
1.2 JVM 的内存结构
CCS:压缩类空间,这个空间只有当启用了压缩类短指针时候,这个空间才会存在,在堆中分配的每一个对象,都有一个指向自己的 Class 的一个指针,64 位的虚拟机指针的长度是 64 位,如果考虑性能的原因,我们可以把这个指针采用短指针方式引用,采用 32 位指针,所引用的 class 文件都存储在压缩类空间。如果不启用短指针,那么压缩类空间就不存在。CodeCache:存放的是 JIT 编译后的源代码,还有 JVM 执行的 JNI Native 代码。如果没有启用 JIT 即时编译,或者没有引用 JNI 方法,这块空间不存在。Metaspace = Class、Package、Method、Method、Field、字节码、常量池、符号引用等等。CCS:32 位指针的 Class。CodeCache:JIT 编译后的本地代码、JNI 使用的 C 代码。
实例:
启用压缩类空间:
jstat -gc 13144
禁用压缩类空间:
jstat -gc 13523
codecache 也是一样操作。
-xint
常用参数:
- -Xms-Xmx
- -XX:NewSize -XX:MaxNewSize
- -XX:NewRatio -XX:SurvivorRatio
- -XX:MetaspaceSize -XX:MaxMetaspaceSize
- -XX:+UseCompressedClassPointers
- -XX:CompressedClassSpaceSize
- -XX:InitialCodeCacheSize
- -XX:ReservedCodeCacheSize
2. 垃圾回收算法
C++ 和 Java 中内存泄露区别:在 C ++ 中 New 了一个对象,但是将该对象的指针丢失了,这就导致这个对象占用的内存永远得不到释放,就造成了内存泄露。在 JAVA 中 New 一个对象后,这个对象的指针一直被应用程序所持有,这样垃圾回收就不能将其释放,这样就导致内存泄露。
2.1 如何确定垃圾
思想:枚举根节点,做可达性分析
根节点:类加载器、Thread、虚拟机栈的本地变量表、static 成员、常亮引用、本地方法栈的变量等等。
2.2 各类算法
标记清除:算法分为“标记”和“清除”两个阶段,首先标记出所有需要回收的对象,在标记完成后统一回收所有。缺点是效率不高,标记和清除两个过程的效率都不高;产生碎片,碎片太多会导致提前 GC。复制算法:它将可用内存按照容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。优缺点是实现简单,运行高效,但是空间利用率低。标记整理算法:标记过程仍然与“标记 - 清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。优缺点是没有了内存碎片,但是整理内存比较耗时。分代垃圾回收:Young 区采用复制算法,Old 区采用标记清除或者标记整理算法。
对象分配:
- 对象优先分配在 Eden 区。
- 大对象直接进入老年代:-XX:PretenureSizeThreshold,该参数规定多大的对象会直接分配在老年代。
- 长期存活对象进入老年代:
-XX:MaxTenuringThreshold 晋升阈值
-XX:+PrintTenuringDistribution 发生 Young GC 时候,打印存活对象的年龄的分布情况
-XX:TargetSurivorRatio 设置 Surivor 区,Young 区垃圾回收后存活对象的比例,假设该值设置为 80%,意味着发生一次 Young GC,Surivor 区存活对象为 80%,这时候需要计算这些 80% 存活对象的平均年龄,用平均年龄和晋升阈值之间取一个最小值,如果有对象年龄大于该最小值,也会将该对象晋升到老年代。
3. 垃圾收集器
3.1 三种类型垃圾收集器
- 串行收集器 Serial:Serial、Serial Old。单线程,适用于内存小的嵌入式设备。
- 并行收集器 Parallel:Paralel Scavenge、Parallel Old,吞吐量优先。
- 并发收集器 Concurrent:CMS、G1,停顿时间优先。
3.2 并行 VS 并发
- 并行是指多条垃圾收紧线程并行工作,但此时用户线程仍然处于等待状态。适合科学计算、后台处理等弱交互场景。
- 并发指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),垃圾收集线程在执行的时候不会停顿用户程序的运行。适合对响应时间有要求的场景,比如 Web。
3.3 停顿时间 VS 吞吐量
- 停顿时间:垃圾收集器做垃圾回收中断应用执行的时间,-XX:MaxGCPauseMillis
- 吞吐量:花在垃圾收集的时间和花在应用时间的占比。-XXGCTimeRatio=<n>,来及收集时间占:1/1+n。
3.4 如何评价一个垃圾回收器的好坏
最理想的情况下,吞吐量最大的时候,停顿时间最小。现实中,这两个指标是互斥的,GC 调优时候,很大部分工作就是如何权衡这两个变量。
3.5 三种类型垃圾收集器开启与停用
串行收集器:
-XX:+UseSerialGC -XX:+UseSerialOldGC
并行收集器:
吞吐量优先,-XX:+UseParallelGC -XX:+UseParallelOldGC
Server 模式下的默认收集器,JVM 会根据当前系统内存情况决定启用 Server 模式还是 Client 模式,内存大于 2G,JVM 就会认为是 Server 模式。jinfo -flag UseParallelGC 21669
并发收集器:
在 Java8 中,有两个并发垃圾收集器,一个是 CMS,一个是 G1。响应时间优先。CMS: XX:+UseConcMarkSweepGC -XX:UseParNewGC
G1: -XX:UseG1GC
3.6 垃圾收集器搭配
- 有连线的是可以相互搭配使用。
- JDK8 推荐使用 G1,性能比较好,在 Yong 区和 Old 区都可以使用。
- 虚线表示 CMS 可能退化成 SerialOld,空间担保分配失败。
如何选择垃圾收集器?官方指导垃圾收集器选取方法
- 优先调整堆的大小,让 JVM 自己来选择;
- 如果内存小于 100M,使用串行收集器;
- 如果是单核,并没有停顿时间的要求,串行或 JVM 自己选;
- 如果允许停顿时间超过 1 秒,选择并行或 JVM 自己选;
- 如果响应时间非常重要,并且不能超过 1 秒,使用并发收集器;
3.7 两种常用垃圾收集器
3.7.1 Parallel Collector
工作原理:当发现内存不够时,暂停应用程序,启动多个垃圾回收线程来回收垃圾,垃圾回收结束后,重新启动应用程序。
-XX:+UseParallelGC 手动开启,server 模式默认开启;
-XX:ParallelGCThreads=<n> 开启多少个 GC 线程;
CPU > 8,N=5/8;CPU < 8,N=CPU;
并行收集器的自适应特性(Parallel Collector Ergonomics),会自动调整堆得大小,来自适应调整满足我们设定的指标:
- -XX:MaxGCPauseMills=<n> 最大停顿时间;
- -XX:GCTimeRatio=<n> 吞吐量;
- -Xmx<n> 堆的大小;
优先满足停顿时间要求,然后满足吞吐量要求,如果两个都满足的话,它会减小堆得大小,来满足停顿时间的要求,直到这三个条件中有一个是满足不了的。自适应其实不是最优的,因为它需要动态调整堆得大小来满足这些条件。
动态内存调整
并行收集器在自适应的时候会动态调整内存; - -XX:YongGenerationSizeIncrement=<Y> Yong 区动态调整每次增加的大小,默认 20%;
- -XX:TenuredGenerationSizeIncrement=<T> Old 区动态调整每次增加的大小,默认 20%;
- -XX:AdaptiveSizeDecrementScaleFactor=<D> 动态减小时每次减小的大小,默认 4%;
在生产环境下很少使用自适应功能,主要通过手动调整。
3.7.2 CMS Collector
并发收集
低停顿,低延迟
老年代收集器
(1)CMS 垃圾收集过程