乐趣区

关于后端:面试官JVM是如何判定对象已死的学JVM必会的知识

本文已收录至 GitHub,举荐浏览 👉 Java 随想录

微信公众号:Java 随想录

原创不易,重视版权。转载请注明原作者和原文链接

作为一名 Java 程序员,咱们每天都在程序里不停地去 new 对象,然而你晓得这些被 new 进去的对象,最初是怎么被回收的吗?

在堆外面寄存着 Java 世界中简直所有的对象实例,垃圾收集器在对堆进行回收前,第一件事件就是要确定这些对象之中哪些还「存活」着,哪些曾经「死去」(“死去”即不可能再被任何路径应用的对象)。

JVM 必然是有本人的一套办法来判断哪些对象该回收,哪些不该回收。

本篇文章就来聊聊这个话题。

援用计数算法

这种算法的工作原理是这样的:在对象中增加一个援用计数器,每当有一个中央援用它时,计数器值就加一;当援用生效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被应用的

主观的说,援用计数算法尽管占用了一些额定的内存空间来计数,但原理简略,效率也很高。

然而目前支流的 Java 虚拟机外面都没有选用援用计数法来进行内存治理,why?

次要起因是,援用计数算法很难解决对象之间互相「循环援用」的问题。上面放段代码,举个例子:

public class MyObject {
    public Object ref = null;
    public static void main(String[] args) {MyObject myObject1 = new MyObject();
        MyObject myObject2 = new MyObject();
        myObject1.ref = myObject2;
        myObject2.ref = myObject1;
        myObject1 = null;
        myObject2 = null;
    }
}

这段代码里定义了一个类 MyObject,只有一个成员变量ref
当设置 myObject1 = nullmyObject2 = null后,仅仅是革除了 myObject1myObject2变量所持有的援用。并没有影响到 myObject1 对象外部的 ref 字段和 myObject2 对象外部的 ref 字段,它们依然在互相援用。

咱们能够看出 myObject1myObject2这两个对象除相互援用外再无任何援用,实际上这两个对象曾经不可能再被拜访,然而它们因为相互援用着对方,导致它们的援用计数都不为零,援用计数算法也就无奈回收它们,这就是循环援用问题。

有点相似死锁的概念,A 和 B 相互持有,谁也不开释,间接卡住。

通过这个例子咱们能够看出援用计数法是存在弊病的。

所以 HotSpot 虚拟机并不是通过援用计数算法来判断对象是否存活的,应用的是「可达性剖析算法」。

可达性剖析算法

JVM 通过可达性剖析(Reachability Analysis)算法来断定对象是否存活的。

这个算法的基本思路就是通过一系列称为 GC Roots 的根对象作为起始节点集,从这些节点开始,依据援用关系向下搜寻。
搜寻过程所走过的门路称为 援用链(Reference Chain)如果某个对象到 GC Roots 间没有任何援用链相连,或者用图论的话来说就是从 GC Roots 到这个对象不可达时,则证实此对象是不可能再被应用的

如图,对象 object 5、object 6、object 7 到 GC Roots 是不可达的,因而它们将会被断定为可回收的对象。

上文提到的GC Roots,咱们能够认为是终点,而在 JVM 外面,固定能够作为 GC Roots 的对象包含以下几种:

  • 在虚拟机栈(栈中 的本地变量表)中援用的对象,例如各个线程被调用的办法堆栈中应用到的参数、局部变量、长期变量等。
  • 在办法区中常量援用的对象,例如字符串常量池(String Table)里的援用。
  • 在本地办法栈中 JNI(本地办法)援用的对象。
  • Java 虚拟机外部的援用,如根本数据类型对应的 Class 对象,一些常驻的异样对象(NullPointException、OutOfMemoryError)等,以及零碎类加载器。
  • 所有被同步锁(synchronized)持有的对象。
  • 反映 Java 虚拟机外部状况的 JMXBean、JVMTI 中注册的回调、本地代码缓存等。

通过枚举一个一个根节点 (GC Roots),而后顺藤摸瓜一路摸下来,而后没摸到的那些对象,也就是不存在援用的对象就把它咔嚓回收了。这个过程称之为「 根节点枚举」。

目前所有的垃圾收集器在 根节点枚举 这一步骤时都是必须暂停用户线程的,也就是必须会有 STW(Stop the Wrold)。
这外面细讲货色很多,先埋个坑,后续会有文章专门来讲根节点枚举。

下面咱们讲了可达性剖析算法是依据援用来回收的,而对不同的援用类型有不同的解决形式,JVM 也是会去「差异看待的」。

援用类型

Java 将援用分为 强援用(Strongly Re-ference)软援用(Soft Reference)弱援用(Weak Reference) 虚援用(Phantom Reference) 4 种,这 4 种援用强度顺次逐步削弱。

  • 强援用是最传统的“援用”的定义,在程序代码之中普遍存在,即相似 Object obj=new Object() 这种援用关系。如果一个对象具备强援用,那就相似于 ” 必不可少的生活用品 ”。只有强援用还存在,垃圾收集器永远不会回收掉被援用的对象。
  • 软援用是用来形容一些还有用,但非必须的对象。只被软援用关联着的对象,在零碎将要产生内存溢出异样前,会把这些对象列进回收范畴之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异样。在 JDK 1.2 版之后提供了 SoftReference 类来实现软援用。
  • 弱援用也是用来形容那些非必须对象,然而它的强度比软援用更弱一些,被弱援用关联的对象只能生存到下一次垃圾收集产生为止 。当垃圾收集器开始工作,无论以后内存是否足够,都会回收掉只被弱援用关联的对象。在 JDK 1.2 版之后提供了WeakReference 类来实现弱援用。
  • 虚援用是最弱的一种援用关系。如果一个对象仅持有虚援用,那么它就和没有任何援用一样,随时都可能被垃圾回收器回收,无奈通过虚援用来获得一个对象实例 。虚援用次要用来跟踪对象被垃圾回收器回收的流动,比方确保某个资源被 finalize 后,做一些后续的清理工作。在 JDK 1.2 版之后提供了PhantomReference 类来实现虚援用。

下面巴拉巴拉说了一堆话,我晓得你们必定不爱看,也记不住。所以铁子,我总结成一句话,你听这句话就够了。

总结一句话就是:强援用内存不足也不会回收,软援用内存不足才回收,弱援用和虚援用看见就回收

看到这里有个疑难,在可达性剖析算法中断定为不可达的对象,就肯定「非死不可」吗?

Dead Or Alive

当一个对象被判断为不可达的时候,这时候该对象处在「缓刑」阶段。

意思就是说刀曾经架你脖子上了,然而还败落下来,还是有磋商的余地的。

要真正宣告一个对象死亡,至多要经验 两次标记过程

如果对象在进行可达性剖析后发现没有与 GC Roots 相连接的援用链,那它将会被第一次标记 ,随后进行一次筛选,筛选的条件是此对象 是否有必要执行 finalize()办法

如果对象没有笼罩 finalize()办法,或者 finalize()办法曾经被虚拟机调用过,那么虚拟机将这两种状况都视为“没有必要执行”。

如果这个对象被断定为确有必要执行 finalize()办法,那么该对象将会被搁置在一个名为 F-Queue 的队列之中,并在稍后由一条由虚拟机主动建设的、低调度优先级的 Finalizer 线程去执行它们的 finalize()办法

这里所说的“执行”是指虚构机会触发这个办法开始运行,但并不承诺肯定会期待它运行完结。

这样做的起因是,如果某个对象 finalize() 办法执行迟缓,或者更极其地产生了死循环,将很可能导致 F-Queue 队列中的其余对象永恒处于期待,卡死在这里。甚至导致整个内存回收子系统的解体。

finalize()办法是对象逃脱死亡命运的最初一次机会,救命的最初一根稻草,稍后收集器将对 F -Queue 中的对象进行第二次小规模的标记。

如果对象要在 finalize()中胜利援救本人——只有从新与援用链上的任何一个对象建设关联即可,譬如把本人(this 关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移出「行将回收」的汇合。

如果对象这时候还没有逃脱,那基本上它就真的要被回收了,就真要说 byebye 了

须要留神的是:任何一个对象的 finalize()办法都只会被零碎主动调用一次,如果对象面临下一次回收,它的 finalize()办法不会被再次执行,不能指望我每次都救你,我只能救你一次,剩下的就靠你本人了

看起来对象可能应用 finalize()办法实现自我救赎,然而这个办法并没有什么用,放一段《深刻了解 Java 虚拟机》里的原话:

总结一下,就是 finalize()这个办法并没什么卵用,大家还是把他忘了好

对象的回收行为次要产生在新生代和老年代,那么有兄弟可能会问了,永恒代有垃圾回收行为吗?

永恒代真的 ” 永恒 ” 吗?

留神一下,这里说的永恒代,次要还是针对于 Java 8 以前,在 Java 8 以及之后的版本中,永恒代被元数据区(Metaspace)取代。

永恒代和办法区和元空间的关系可能有点凌乱,略微提一嘴:办法区是由 Java 虚拟机标准定义的一个逻辑区域,是个逻辑上的概念,而永恒代和元空间则是 HotSpot 对办法区的两种不同实现

一图胜千言,间接上图。

有些人认为办法区(如 HotSpot 虚拟机中的元空间或者永恒代)是没有垃圾收集行为的,但其实办法区是能够被回收的,只不过回收的断定条件过于刻薄,垃圾收集的成绩很差

并不是名字叫永恒代就真的「永恒」了,进去混,欠的债总要还的

咱们先搞清楚办法区要回收的是什么,办法区的垃圾收集次要回收两局部内容:「废除的常量 」和「 不再应用的类型」。

断定一个常量是否“废除”还是绝对简略,看这个常量有没有在用就行了,而要断定一个类型是否属于「不再被应用的类」的条件就比拟刻薄了。须要同时满足上面三个条件(留神是同时!):

  • 该类所有的实例都曾经被回收,也就是 Java 堆中不存在该类及其任何派生子类的实例。
  • 加载该类的类加载器曾经被回收,这个条件除非是通过精心设计的可替换类加载器的场景,如 OSGi、JSP 的重加载等,否则通常是很难达成的。
  • 该类对应的 java.lang.Class 对象没有在任何中央被援用,无奈在任何中央通过反射拜访该类的办法。

Java 虚拟机被容许对满足上述三个条件的无用类进行回收,这里说的仅仅是“被容许”,而并不是和对象一样,没有援用了就必然会回收。

对于是否要对类型进行回收,HotSpot 虚拟机提供了 -Xnoclassgc 参数进行管制。

对于 Oracle 的 HotSpot JVM,这个参数默认是不开启的,意味着默认状况下,类元数据能够被垃圾收集器回收。如果你明确应用了 -Xnoclassgc 参数来启动 JVM,那么就会禁止类的垃圾回收。

也就是说如果没有开启这项参数反对类型的卸载,哪怕满足了所有条件,也不会进行类型的卸载

下面咱们讲了对象回收的条件,晓得了回收的条件之后,咱们再讲讲怎么被回收,也就是垃圾回收算法。

这块可是面试重点,面试问到 JVM 这块少不了要被教育一番,大家好好听,下次能够跟面试官对波线。

垃圾收集算法

垃圾收集(Garbage Collection,GC)算法是 Java 虚拟机(JVM)用来主动治理内存的一种形式。次要的指标是找出那些曾经不再应用的对象,并开释它们所占用的内存空间。

艰深来说就是发现垃圾之后怎么收垃圾,是打包带走,还是来个垃圾分类

标记 - 革除算法

标记 - 革除算法是最早呈现也是最根底的垃圾收集算法。

它分为「标记」和「革除」两个阶段:首先标记出所有须要回收的对象,在标记实现后,对立回收掉所有被标记的对象,也能够反过来,标记存活的对象,对立回收所有未被标记的对象

下图为应用“标记 - 革除”算法回收前后的状态:

  • 长处:不须要进行对象的挪动,在存活对象比拟多的状况下十分高效。
  • 毛病:标记 - 革除算法次要毛病有两个:

    第一个是执行效率不稳固,如果 Java 堆中蕴含大量对象,而且其中大部分是须要被回收的,这时必须进行大量标记和革除的动作。

    第二个是内存空间的碎片化问题,标记、革除之后会产生大量不间断的「内存碎片」,而内存碎片是无奈被调配对象的,内存碎片太多可能会导致当当前在程序运行过程中须要调配较大对象时无奈找到足够的间断内存而不得不提前触发另一次垃圾收集动作。

第一个问题其实还好,然而第二个内存碎片是个大问题,无奈容忍。试想一下就跟你打游戏,玩着越来越卡,玩一秒卡二秒,这还怎么玩?

所以后续的收集算法大多都是以标记 - 革除算法为根底,改良了内存碎片的问题,对其毛病进行改良而失去的

标记 - 复制算法

为了解决 标记 - 革除算 法面对大量可回收对象时执行效率低的问题,1969 年 Fenichel 提出了一种称为「半区复制(Semispace Copying)」的垃圾收集算法。

它将可用内存按容量划分为大小相等的两块,每次只应用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块下面,而后再把已应用过的内存空间一次清理掉

如果内存中少数对象都是存活的,这种算法将会产生大量的内存间复制的开销,但对于少数对象都是可回收的状况,算法须要复制的就是占多数的存活对象,而且每次都是针对整个半区进行内存回收,分配内存时也就不必思考有空间碎片的简单状况。

所以,标记 - 复制算法通常用在新生代的 Eden 区和 Survivor 区,这两个区的对象,朝生夕死,少数对象都是可回收的

总结一下,标记 - 复制算法有如下长处和毛病:

  • 长处:实现简略,内存回收时不必思考内存碎片的呈现。
  • 毛病:代价是将可用内存放大为了原来的一半,并且在对象存活率较高时就要进行较多的复制操作,效率将会升高。

下图为应用复制算法回收前后的状态:

标记 - 复制看着还行,然而比拟大的毛病是节约了 50% 的空间,要晓得内存是很贵的啊。

标记 - 整顿算法

标记 - 复制 算法在对象存活率较高时就要进行较多的复制操作,效率将会升高。

更要害的是,如果不想节约 50% 的空间,就须要有额定的空间进行调配担保,以应答被应用的内存中所有对象都 100% 存活的极其状况。

所以在老年代个别不能间接选用这种算法 。针对老年代对象的存亡特色,1974 年 Edward Lueders 提出了另外一种有针对性的 标记 - 整顿(Mark-Compact)算法

其中的标记过程依然与“标记 - 革除”算法一样,但后续步骤不是间接对可回收对象进行清理,而是让所有存活的对象都向内存空间一端挪动,而后间接清理掉边界以外的内存。

  • 长处:通过整顿之后,新对象的调配只须要通过指针碰撞便能实现,也解决了内存碎片的问题。
  • 毛病:GC 暂停的工夫会增长,对象挪动的工夫老本是非常可观的。

下图为应用“标记 - 整顿”算法回收前后的状态:

标记 - 革除 VS 标记 - 整顿

标记 - 革除算法与标记 - 整顿算法的实质差别在于前者是一种「非移动式」的回收算法,而后者是「移动式」的。

别小看这一差别,是否挪动回收后的存活对象是一项优缺点并存的危险决策

如果挪动存活对象,尤其是在老年代这种每次回收都有大量对象存活区域,挪动存活对象会是一种极为负重的操作,而且这种对象挪动操作必须全程暂停用户应用程序能力进行。

但如果跟 标记 - 革除 算法那样齐全不思考挪动和整顿存活对象的话,弥散于堆中的存活对象导致的内存碎片问题就只能依赖更为简单的内存分配器和内存拜访器来解决。

譬如通过「分区闲暇调配链表」来解决内存调配问题。

内存的拜访是用户程序最频繁的操作,甚至都没有之一,如果在这个环节上减少了额定的累赘,势必会间接影响应用程序的吞吐量

基于以上两点,是否挪动对象都存在弊病,挪动则内存回收时会更简单,不挪动则内存调配时会更简单。从垃圾收集的进展工夫来看,不挪动对象进展工夫会更短,然而从整个程序的吞吐量来看,挪动对象会更划算

HotSpot 虚拟机外面关注吞吐量的 Parallel Scavenge 收集器是基于标记 - 整顿算法的,而关注提早的 CMS 收集器则是基于标记 - 革除算法的,这也从侧面印证这点

另外,还有一种「和稀泥式」解决方案能够不在内存调配和拜访上减少太大额外负担,做法是让虚拟机平时少数工夫都采纳标记 - 革除算法,临时容忍内存碎片的存在,直到内存空间的碎片化水平曾经大到影响对象调配时,再采纳标记 - 整顿算法收集一次,以取得规整的内存空间。

基于标记 - 革除算法的 CMS 收集器采纳的就是这种解决方法。

当 CMS 呈现「并发失败”(Concurrent Mode Failure)」时,这时会启用 Serial Old 收集器来从新进行老年代的垃圾收集,而 Serial Old 正是基于标记 - 整顿算法。

好了,本篇文章到这就完结了,这篇文章次要是讲 JVM 是怎么回收对象的,明确了这个,JVM 算是初窥门径了。


感激浏览,如果本篇文章有任何谬误和倡议,欢送给我留言斧正。

老铁们,关注我的微信公众号「Java 随想录」,专一分享 Java 技术干货,文章继续更新,能够关注公众号第一工夫浏览。

一起交流学习,期待与你共同进步!

退出移动版