JAVA应用性能监控之JVM层GC调优

jiezi

5 年前

运行时数据区是规范，内存结构是具体实现。

官方运行时数据区定义

程序计数器 PC Register：JVM 支持多线程同时执行，每一个线程都有自己的 PC Register，线程正在执行的方法叫做当前方法，如果是 java 代码，PC Register 里面存放的就是房钱正在执行的指令的地址，如果你是 C 代码，则为空。
Java 虚拟机栈（Java Virtual Machine Stacks）是线程私有的，它的生命周期与线程相同。虚拟机栈描述的是 Java 方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧，用于存储局部变量表、操作数栈、动态链接、方法出口灯信息。每一个方法从调用直至执行完成的过程，就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
Java 堆（Java Heap）是 Java 虚拟机所管理的内存中最大的一块。堆是被所有线程共享的一块内存区域，在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例，几乎所有的对象实例都在这里分配内存。Java 堆可以处于物理上不连续的内存空间中，只要逻辑上是连续的即可。
方法区（Method Area）：方法区域 java 堆一样，是各个线程共享的内存区域，它用于存储已被虚拟机加载的类信息、常亮、静态变量、即时编译器编译后的代码等数据。虽然 Java 虚拟机规范把方法区描述为堆的一个逻辑部分，但是它却有一个别名叫做 Non-Heap（非堆），目的是与 Java 堆区分开来。
运行时常量池（Runtime Constant Pool）是方法区的一部分。Class 文件中除了有类的版本、字段、方法、接口等描述信息外，还有一项信息是常量池（Constant Pool Table），用于存放编译器生成的各种字面量和符号引用，这部分内容将在类加载后进入方法区的常量池中存放。
本地方法栈（Native Method Stacks）与虚拟机栈所放回的作用是非常相似的，它们之间的区别不过是虚拟机栈为虚拟机执行的 Java 方法（也就是字节码）服务，而本地方法栈则为虚拟机使用到的 Native 方法服务。

CCS：压缩类空间，这个空间只有当启用了压缩类短指针时候，这个空间才会存在，在堆中分配的每一个对象，都有一个指向自己的 Class 的一个指针，64 位的虚拟机指针的长度是 64 位，如果考虑性能的原因，我们可以把这个指针采用短指针方式引用，采用 32 位指针，所引用的 class 文件都存储在压缩类空间。如果不启用短指针，那么压缩类空间就不存在。CodeCache：存放的是 JIT 编译后的源代码，还有 JVM 执行的 JNI Native 代码。如果没有启用 JIT 即时编译，或者没有引用 JNI 方法，这块空间不存在。Metaspace = Class、Package、Method、Method、Field、字节码、常量池、符号引用等等。CCS：32 位指针的 Class。CodeCache：JIT 编译后的本地代码、JNI 使用的 C 代码。

实例：
启用压缩类空间：

jstat -gc 13144

禁用压缩类空间：

jstat -gc 13523

codecache 也是一样操作。
-xint

常用参数：

-Xms-Xmx
-XX:NewSize -XX:MaxNewSize
-XX:NewRatio -XX:SurvivorRatio
-XX:MetaspaceSize -XX:MaxMetaspaceSize
-XX:+UseCompressedClassPointers
-XX:CompressedClassSpaceSize
-XX:InitialCodeCacheSize
-XX:ReservedCodeCacheSize

C++ 和 Java 中内存泄露区别：在 C ++ 中 New 了一个对象，但是将该对象的指针丢失了，这就导致这个对象占用的内存永远得不到释放，就造成了内存泄露。在 JAVA 中 New 一个对象后，这个对象的指针一直被应用程序所持有，这样垃圾回收就不能将其释放，这样就导致内存泄露。

思想：枚举根节点，做可达性分析
根节点：类加载器、Thread、虚拟机栈的本地变量表、static 成员、常亮引用、本地方法栈的变量等等。

标记清除：算法分为“标记”和“清除”两个阶段，首先标记出所有需要回收的对象，在标记完成后统一回收所有。缺点是效率不高，标记和清除两个过程的效率都不高；产生碎片，碎片太多会导致提前 GC。复制算法：它将可用内存按照容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。优缺点是实现简单，运行高效，但是空间利用率低。标记整理算法：标记过程仍然与“标记 - 清除”算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存。优缺点是没有了内存碎片，但是整理内存比较耗时。分代垃圾回收：Young 区采用复制算法，Old 区采用标记清除或者标记整理算法。

对象分配：

对象优先分配在 Eden 区。
大对象直接进入老年代：-XX:PretenureSizeThreshold，该参数规定多大的对象会直接分配在老年代。
长期存活对象进入老年代：
-XX:MaxTenuringThreshold 晋升阈值
-XX:+PrintTenuringDistribution 发生 Young GC 时候，打印存活对象的年龄的分布情况
-XX:TargetSurivorRatio 设置 Surivor 区，Young 区垃圾回收后存活对象的比例，假设该值设置为 80%，意味着发生一次 Young GC，Surivor 区存活对象为 80%，这时候需要计算这些 80% 存活对象的平均年龄，用平均年龄和晋升阈值之间取一个最小值，如果有对象年龄大于该最小值，也会将该对象晋升到老年代。

串行收集器 Serial：Serial、Serial Old。单线程，适用于内存小的嵌入式设备。
并行收集器 Parallel：Paralel Scavenge、Parallel Old，吞吐量优先。
并发收集器 Concurrent：CMS、G1，停顿时间优先。

并行是指多条垃圾收紧线程并行工作，但此时用户线程仍然处于等待状态。适合科学计算、后台处理等弱交互场景。
并发指用户线程与垃圾收集线程同时执行（但不一定是并行的，可能会交替执行），垃圾收集线程在执行的时候不会停顿用户程序的运行。适合对响应时间有要求的场景，比如 Web。

停顿时间：垃圾收集器做垃圾回收中断应用执行的时间，-XX:MaxGCPauseMillis
吞吐量：花在垃圾收集的时间和花在应用时间的占比。-XXGCTimeRatio=<n>，来及收集时间占：1/1+n。

最理想的情况下，吞吐量最大的时候，停顿时间最小。现实中，这两个指标是互斥的，GC 调优时候，很大部分工作就是如何权衡这两个变量。

串行收集器：

  -XX:+UseSerialGC -XX:+UseSerialOldGC

并行收集器：

 吞吐量优先，-XX:+UseParallelGC  -XX:+UseParallelOldGC
 Server 模式下的默认收集器，JVM 会根据当前系统内存情况决定启用 Server 模式还是 Client 模式，内存大于 2G，JVM 就会认为是 Server 模式。jinfo -flag UseParallelGC 21669

并发收集器：

 在 Java8 中，有两个并发垃圾收集器，一个是 CMS，一个是 G1。响应时间优先。CMS: XX:+UseConcMarkSweepGC -XX:UseParNewGC
 G1: -XX:UseG1GC

有连线的是可以相互搭配使用。
JDK8 推荐使用 G1，性能比较好，在 Yong 区和 Old 区都可以使用。
虚线表示 CMS 可能退化成 SerialOld，空间担保分配失败。

如何选择垃圾收集器？官方指导垃圾收集器选取方法

优先调整堆的大小，让 JVM 自己来选择；
如果内存小于 100M，使用串行收集器；
如果是单核，并没有停顿时间的要求，串行或 JVM 自己选；
如果允许停顿时间超过 1 秒，选择并行或 JVM 自己选；
如果响应时间非常重要，并且不能超过 1 秒，使用并发收集器；

工作原理：当发现内存不够时，暂停应用程序，启动多个垃圾回收线程来回收垃圾，垃圾回收结束后，重新启动应用程序。
-XX:+UseParallelGC 手动开启，server 模式默认开启；
-XX:ParallelGCThreads=<n> 开启多少个 GC 线程；

  CPU > 8，N=5/8；CPU < 8，N=CPU；

并行收集器的自适应特性（Parallel Collector Ergonomics），会自动调整堆得大小，来自适应调整满足我们设定的指标：

-XX:MaxGCPauseMills=<n> 最大停顿时间；
-XX:GCTimeRatio=<n> 吞吐量；
-Xmx<n> 堆的大小；
优先满足停顿时间要求，然后满足吞吐量要求，如果两个都满足的话，它会减小堆得大小，来满足停顿时间的要求，直到这三个条件中有一个是满足不了的。自适应其实不是最优的，因为它需要动态调整堆得大小来满足这些条件。
动态内存调整
并行收集器在自适应的时候会动态调整内存；
-XX:YongGenerationSizeIncrement=<Y> Yong 区动态调整每次增加的大小，默认 20%；
-XX:TenuredGenerationSizeIncrement=<T> Old 区动态调整每次增加的大小，默认 20%；
-XX:AdaptiveSizeDecrementScaleFactor=<D> 动态减小时每次减小的大小，默认 4%；
在生产环境下很少使用自适应功能，主要通过手动调整。

并发收集
低停顿，低延迟
老年代收集器

（1）CMS 垃圾收集过程

JAVA应用性能监控之JVM层GC调优

1. JVM 内存结构

1.1 运行时数据区

1.2 JVM 的内存结构

2. 垃圾回收算法

2.1 如何确定垃圾

2.2 各类算法

3. 垃圾收集器

3.1 三种类型垃圾收集器

3.2 并行 VS 并发

3.3 停顿时间 VS 吞吐量

3.4 如何评价一个垃圾回收器的好坏

3.5 三种类型垃圾收集器开启与停用

3.6 垃圾收集器搭配

3.7 两种常用垃圾收集器

3.7.1 Parallel Collector

3.7.2 CMS Collector