关于后端:面试官JVM是如何判定对象已死的

本文已收录至Github，举荐浏览 Java随想录

微信公众号：Java随想录

CSDN：码农BookSea

晓得的越多，才知晓得的越少。——苏格拉底

在堆外面寄存着Java世界中简直所有的对象实例，垃圾收集器在对堆进行回收前，第一件事件就是要确定这些对象之中哪些还“存活”着，哪些曾经“死去”（“死去”即不可能再被任何路径应用的对象）了。

下文围绕这个话题，开展聊聊。

援用计数算法

这种算法的工作原理是这样的：在对象中增加一个援用计数器，每当有一个中央援用它时，计数器值就加一；当援用生效时，计数器值就减一；任何时刻计数器为零的对象就是不可能再被应用的。主观的说，援用计数算法尽管占用了一些额定的内存空间来计数，但原理简略，效率也很高，然而目前支流的Java虚拟机外面都没有选用援用计数法来进行内存治理，次要起因是，援用计数算法很难解决对象之间互相循环援用的问题。

举个例子：

public class MyObject {    public Object ref = null;    public static void main(String[] args) {        MyObject myObject1 = new MyObject();        MyObject myObject2 = new MyObject();        myObject1.ref = myObject2;        myObject2.ref = myObject1;        myObject1 = null;        myObject2 = null;    }}

myObject1和myObject2这两个对象再无任何援用，实际上这两个对象曾经不可能再被拜访，然而它们因为相互援用着对方，导致它们的援用计数都不为零，援用计数算法也就无奈回收它们，这就是循环援用问题。

HotSpot虚拟机并不是通过援用计数算法来判断对象是否存活的，应用的是可达性剖析算法。

可达性剖析算法

JVM通过可达性剖析（Reachability Analysis）算法来断定对象是否存活的。这个算法的基本思路就是通过一系列称为GC Roots的根对象作为起始节点集，从这些节点开始，依据援用关系向下搜寻，搜寻过程所走过的门路称为援用链（Reference Chain），如果某个对象到GC Roots间没有任何援用链相连，或者用图论的话来说就是从GC Roots到这个对象不可达时，则证实此对象是不可能再被应用的。

如图，对象object 5、object 6、object 7到GC Roots是不可达的，因而它们将会被断定为可回收的对象。

在Java技术体系外面，固定能够作为GC Roots的对象包含以下几种

在虚拟机栈（栈中的本地变量表）中援用的对象，例如各个线程被调用的办法堆栈中应用到的参数、局部变量、长期变量等。
在办法区中常量援用的对象，例如字符串常量池（String Table）里的援用。
在本地办法栈中JNI（本地办法）援用的对象。
Java虚拟机外部的援用，如根本数据类型对应的Class对象，一些常驻的异样对象（NullPointException、OutOfMemoryError）等，以及零碎类加载器。
所有被同步锁（synchronized）持有的对象。
反映Java虚拟机外部状况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

目前所有的垃圾收集器在根节点枚举这一步骤时都是必须暂停用户线程的，这外面细讲货色很多，先埋个坑，之后出篇文章来讲根节点枚举。

援用类型

Java将援用分为强援用（Strongly Re-ference）、软援用（Soft Reference）、弱援用（Weak Reference）和虚援用（Phantom Reference）4种，这4种援用强度顺次逐步削弱。

强援用是最传统的“援用”的定义，是指在程序代码之中普遍存在的援用赋值，即相似Object obj=new Object()这种援用关系。无论任何状况下，只有强援用关系还存在，垃圾收集器就永远不会回收掉被援用的对象。
软援用是用来形容一些还有用，但非必须的对象。只被软援用关联着的对象，在零碎将要产生内存溢出异样前，会把这些对象列进回收范畴之中进行第二次回收，如果这次回收还没有足够的内存，才会抛出内存溢出异样。在JDK 1.2版之后提供了SoftReference类来实现软援用。
弱援用也是用来形容那些非必须对象，然而它的强度比软援用更弱一些，被弱援用关联的对象只能生存到下一次垃圾收集产生为止。当垃圾收集器开始工作，无论以后内存是否足够，都会回收掉只被弱援用关联的对象。在JDK 1.2版之后提供了WeakReference类来实现弱援用。
虚援用也称为“幽灵援用”或者“幻影援用”，它是最弱的一种援用关系。一个对象是否有虚援用的存在，齐全不会对其生存工夫形成影响，也无奈通过虚援用来获得一个对象实例。为一个对象设置虚援用关联的惟一目标只是为了能在这个对象被收集器回收时收到一个零碎告诉。在JDK 1.2版之后提供了PhantomReference类来实现虚援用。

总结一句话就是：强援用内存不足也不会回收，软援用内存不足才回收，弱援用和虚援用看见就回收。

Dead Or Alive

在可达性剖析算法中断定为不可达的对象，就"非死不可"吗？

当一个对象被判断为不可达的时候，这时候该对象处在“缓刑”阶段，要真正宣告一个对象死亡，至多要经验两次标记过程：

如果对象在进行可达性剖析后发现没有与GC Roots相连接的援用链，那它将会被第一次标记，随后进行一次筛选，筛选的条件是此对象是否有必要执行finalize()办法。如果对象没有笼罩finalize()办法，或者finalize()办法曾经被虚拟机调用过，那么虚拟机将这两种状况都视为“没有必要执行”。

如果这个对象被断定为确有必要执行finalize()办法，那么该对象将会被搁置在一个名为F-Queue的队列之中，并在稍后由一条由虚拟机主动建设的、低调度优先级的Finalizer线程去执行它们的finalize()办法。

这里所说的“执行”是指虚构机会触发这个办法开始运行，但并不承诺肯定会期待它运行完结。这样做的起因是，如果某个对象finalize()办法执行迟缓，或者更极其地产生了死循环，将很可能导致F-Queue队列中的其余对象永恒处于期待，甚至导致整个内存回收子系统的解体。finalize()办法是对象逃脱死亡命运的最初一次机会，稍后收集器将对F-Queue中的对象进行第二次小规模的标记，如果对象要在finalize()中胜利援救本人——只有从新与援用链上的任何一个对象建设关联即可，譬如把本人（this关键字）赋值给某个类变量或者对象的成员变量，那在第二次标记时它将被移出“行将回收”的汇合；如果对象这时候还没有逃脱，那基本上它就真的要被回收了。

须要留神的是：任何一个对象的finalize()办法都只会被零碎主动调用一次，如果对象面临下一次回收，它的finalize()办法不会被再次执行。我只能救你一次，剩下的就靠你本人了。

看起来对象可能应用finalize()办法实现自我救赎，然而这个办法并没有什么用，放一段书里的原话。

总结一下，就是finalize()这个办法并没什么卵用。

永恒代真的"永恒"吗？

有些人认为办法区（如HotSpot虚拟机中的元空间或者永恒代）是没有垃圾收集行为的，但其实办法区是能够被回收的，只不过回收的断定条件过于刻薄，垃圾收集的成绩很差。

并不是名字叫永恒代就真的"永恒"了。

咱们先搞清楚办法区要回收的是什么，办法区的垃圾收集次要回收两局部内容：废除的常量和不再应用的类型。

断定一个常量是否“废除”还是绝对简略，而要断定一个类型是否属于“不再被应用的类”的条件就比拟刻薄了。须要同时满足上面三个条件：

该类所有的实例都曾经被回收，也就是Java堆中不存在该类及其任何派生子类的实例。
加载该类的类加载器曾经被回收，这个条件除非是通过精心设计的可替换类加载器的场景，如OSGi、JSP的重加载等，否则通常是很难达成的。
该类对应的java.lang.Class对象没有在任何中央被援用，无奈在任何中央通过反射拜访该类的办法。

Java虚拟机被容许对满足上述三个条件的无用类进行回收，这里说的仅仅是“被容许”，而并不是和对象一样，没有援用了就必然会回收。对于是否要对类型进行回收，HotSpot虚拟机提供了-Xnoclassgc参数进行管制。

也就说如果没有开启这项参数反对类型的卸载，哪怕满足了所有条件，也不会进行类型的卸载。

垃圾收集算法

标记-革除算法

最早呈现也是最根底的垃圾收集算法是“标记-革除”（Mark-Sweep）算法。它分为“标记”和“革除”两个阶段：首先标记出所有须要回收的对象，在标记实现后，对立回收掉所有被标记的对象，也能够反过来，标记存活的对象，对立回收所有未被标记的对象。

长处：不须要进行对象的挪动，在存活对象比拟多的状况下十分高效。
毛病：标记-革除算法次要毛病有两个。第一个是执行效率不稳固，如果Java堆中蕴含大量对象，而且其中大部分是须要被回收的，这时必须进行大量标记和革除的动作；第二个是内存空间的碎片化问题，标记、革除之后会产生大量不间断的内存碎片，空间碎片太多可能会导致当当前在程序运行过程中须要调配较大对象时无奈找到足够的间断内存而不得不提前触发另一次垃圾收集动作。

下图为应用“标记-革除”算法回收前后的状态：

后续的收集算法大多都是以标记-革除算法为根底，对其毛病进行改良而失去的。

标记-复制算法

为了解决标记-革除算法面对大量可回收对象时执行效率低的问题，1969年Fenichel提出了一种称为“半区复制”（Semispace Copying）的垃圾收集算法，它将可用内存按容量划分为大小相等的两块，每次只应用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块下面，而后再把已应用过的内存空间一次清理掉。

如果内存中少数对象都是存活的，这种算法将会产生大量的内存间复制的开销，但对于少数对象都是可回收的状况，算法须要复制的就是占多数的存活对象，而且每次都是针对整个半区进行内存回收，分配内存时也就不必思考有空间碎片的简单状况。

长处：实现简略；内存回收时不必思考内存碎片的呈现。
毛病：代价是将可用内存放大为了原来的一半。

下图为应用复制算法回收前后的状态：

标记-整顿算法

标记-复制算法在对象存活率较高时就要进行较多的复制操作，效率将会升高。更要害的是，如果不想节约50%的空间，就须要有额定的空间进行调配担保，以应答被应用的内存中所有对象都100%存活的极其状况，所以在老年代个别不能间接选用这种算法。针对老年代对象的存亡特色，1974年Edward Lueders提出了另外一种有针对性的“标记-整顿”（Mark-Compact）算法，其中的标记过程依然与“标记-革除”算法一样，但后续步骤不是间接对可回收对象进行清理，而是让所有存活的对象都向内存空间一端挪动，而后间接清理掉边界以外的内存。

长处：通过整顿之后，新对象的调配只须要通过指针碰撞便能实现，也解决了内存碎片的问题。
毛病：GC 暂停的工夫会增长，对象挪动的工夫老本是非常可观的。

下图为应用“标记-整顿”算法回收前后的状态：

标记-革除 VS 标记-整顿

标记-革除算法与标记-整顿算法的实质差别在于前者是一种非移动式的回收算法，而后者是移动式的。是否挪动回收后的存活对象是一项优缺点并存的危险决策。

如果挪动存活对象，尤其是在老年代这种每次回收都有大量对象存活区域，挪动存活对象会是一种极为负重的操作，而且这种对象挪动操作必须全程暂停用户应用程序能力进行。

但如果跟标记-革除算法那样齐全不思考挪动和整顿存活对象的话，弥散于堆中的存活对象导致的内存碎片问题就只能依赖更为简单的内存分配器和内存拜访器来解决。譬如通过“分区闲暇调配链表”来解决内存调配问题。内存的拜访是用户程序最频繁的操作，甚至都没有之一，如果在这个环节上减少了额定的累赘，势必会间接影响应用程序的吞吐量。

基于以上两点，是否挪动对象都存在弊病，挪动则内存回收时会更简单，不挪动则内存调配时会更简单。从垃圾收集的进展工夫来看，不挪动对象进展工夫会更短，然而从整个程序的吞吐量来看，挪动对象会更划算。

HotSpot虚拟机外面关注吞吐量的Parallel Scavenge收集器是基于标记-整顿算法的，而关注提早的CMS收集器则是基于标记-革除算法的，这也从侧面印证这点。

另外，还有一种“和稀泥式”解决方案能够不在内存调配和拜访上减少太大额外负担，做法是让虚拟机平时少数工夫都采纳标记-革除算法，临时容忍内存碎片的存在，直到内存空间的碎片化水平曾经大到影响对象调配时，再采纳标记-整顿算法收集一次，以取得规整的内存空间。基于标记-革除算法的CMS收集器采纳的就是这种解决方法。

当CMS呈现“并发失败”（Concurrent Mode Failure）时，这时会启用Serial Old收集器来从新进行老年代的垃圾收集，而Serial Old正是基于标记-整顿算法。

如果本篇博客有任何谬误和倡议，欢送给我留言斧正。文章继续更新，能够关注公众号第一工夫浏览。