摘要:G1垃圾回收器是一款次要面向服务端利用的垃圾收集器。

本文分享自华为云社区《JVM面试高频考点:由浅入深带你理解G1垃圾回收器!!!》,原文作者:Code皮皮虾 。

G1垃圾回收器介绍

G1垃圾回收器是一款次要面向服务端利用的垃圾收集器。作为垃圾回收器技术发展史上里程碑的成绩,G1垃圾回收器不同于以往的垃圾回收器,首先是思维上的转变,如下图:

G1对于Java堆的划分


下面的图,小伙伴们第一次看可能不咋明确,因为各位还不理解G1,看看上面的话,应该就差不多了。

G1垃圾回收器对于Java堆区域的划分不同于以往咱们对Java对区域划分的认知

以往对于Java堆区域的划分为:新生代和老年代,新生代又划分为 Eden区和 Survivor区,Survivor区又分为 from区和 to区。

然而当初,G1不再保持固定大小以及固定数量的分代区域划分,而是把间断的Java堆空间划分为多个大小相等的独立区域(Region),每个Region都能够成为 Eden空间、Survivor空间、老年代空间。

这种思维上的转变和设计,使得G1能够面向堆内存任何局部来组成回收集来进行回收,衡量标准不再是它属于哪个分代,而是哪块内存寄存的垃圾最多,回收收益最大,这就是G1收集器的 Mixed GC模式,即混合GC模式。

Region还有一类非凡的 Humongous 区域,专门用来存储大对象。G1认为只有大小超过了一个Region容量一半的对象即可断定为大对象。如果是那些超过了整个Region容量的超大对象,将会放在间断 N 个 Humongous Region区域。

Region的取值范畴为 1M ~ 32M

Region的默认个数为 2048个

-XX:G1HeapRegionSize = N

G1这么做看起来是由一种面目一新的感觉,但仔细的小伙伴可能曾经发现,如果 Region之间存在跨区援用对象,那这些对象如何解决?

  1. 不论是G1还是其余分代收集器,JVM都是应用 记忆集(Remembered Set) 来防止全局扫描。
  2. 每个Region都有一个对应的记忆集。
  3. 每次Reference类型数据写操作时,都会产生一个 写屏障(Write Barrier)临时去终止操作
  4. 而后查看将要写入的援用 指向的对象是否和该Reference类型数据在不同的 Region(其余收集器:查看老年代对象是否援用了新生代对象)
  5. 如果不同,通过 卡表(Card Table)把相干援用信息记录到援用指向对象的所在Region对应的记忆集(Remembered Set) 中
  6. 当进行垃圾收集时,在GC Roots枚举范畴加上记忆集;就能够保障不进行全局扫描了。

G1的记忆集能够了解为一个哈希表,Key就是别的Region的起始地址,Value就是卡表的索引号汇合。

因为G1将Java堆划分为一个个Region的缘故,而Region数量相比于传统分代数量显著多得多,所以G1相比于传统的垃圾回收器来说,须要耗费相当于Java堆容量 10%~ 20%的额定空间来维持收集器的工作。

G1 垃圾回收器工作流程

  • 初始标记(Initial Marking):这阶段仅仅只是标记GC Roots能间接关联到的对象并批改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确的可用的Region中创立新对象,这阶段须要进展线程,然而耗时很短。而且是借用进行Minor GC的时候同步实现的,所以G1收集器在这个阶段理论并没有额定的进展。
  • 并发标记(Concurrent Marking):从GC Roots开始对堆的对象进行可达性剖析,递归扫描整个堆里的对象图,找出存活的对象,这阶段耗时较长,然而能够与用户程序并发执行。当对象图扫描实现当前,还要重新处理SATB记录下的在并发时有援用变动的对象。
  • 最终标记(Final Marking):对用户线程做另一个短暂的暂停,用于解决并发阶段完结后仍遗留下来的最初那大量的 SATB 记录。
  • 筛选回收(Live Data Counting and Evacuation):负责更新 Region 的统计数据,对各个 Region 的回收价值和老本进行排序,依据用户所冀望的进展工夫来制订回收打算。能够自由选择多个Region来形成会收集,而后把回收的那一部分Region中的存活对象==复制==到空的Region中,在对那些Region进行清空。

除了并发标记外,其余过程都要 STW

G1和CMS的区别

  • G1从整体上来看是 标记-整顿 算法,但从部分(两个Region之间)是复制算法。而CMS是 标记-革除算法 所以说,G1不会产生内存碎片,而CMS会产生内存碎片
  • CMS应用了 写后屏障来保护卡表,而G1不仅应用了写后屏障来保护卡表,还是用了 写前屏障来跟踪并发时的指针变动状况(为了实现原始快照)。
  • CMS对Java堆内存应用的是传统的 新生代和老年代划分办法,而G1应用的全新的划分办法。
  • CMS收集器只收集老年代,能够配合新生代的Serial和ParNew收集器一起应用。G1收集器收集范畴是老年代和新生代。不须要联合其余收集器应用
  • CMS应用 增量更新解决并发标记下呈现的谬误标记问题,而G1应用原始快照解决

点击关注,第一工夫理解华为云陈腐技术~