这道Java基础题真的有坑我求求你认真思考后再回答

22次阅读

共计 7172 个字符,预计需要花费 18 分钟才能阅读完成。

本文首发于公众号,关注文末公众号,阅读体验更佳。

这是个人第 10 篇原创文章

全文共计 7362 个字,46 张图。分析的较为详尽,并进行了相关知识点的扩展,所以篇幅较长,建议转发朋友圈或者自己收藏起来,慢慢阅读。

本文目录

一. 题是什么题?

二. 阿里 Java 开发规范。

 2.1 正例代码。2.2 反例代码。

三. 层层揭秘,为什么发生异常了呢?

3.1 第一层: 异常信息解读。3.2 第二层: 抛出异常的条件解读。3.3 第三层: 什么是 modCount? 它是干啥的? 什么时候发生变化?
3.4 第四层: 什么是 expectedModCount? 它是干啥的? 什么时候发生变化?
3.5 第五层: 组装线索, 直达真相。

四. 这题的坑在哪?

4.1 回头再看。4.2 还有一个骚操作。

五. 线程安全版的 ArrayList。

六. 总结一下。

七. 回答另外一个面试题。

八. 扩展阅读。

 7.1 fail-fast 机制和 safe-fast 机制。7.2 Java 语法糖。7.3 阿里 Java 开发手册。

九. 最后说一句。

一. 题是什么题?

我第一次遇到这个题的时候,是在一个微信群里,阿里著名的 ”Java 劝退师 ” 小马哥抛出了这样的一个问题:

然后大家纷纷给出了自己的见解(注:删除了部分聊天记录):

后面在另外的群里聊天的时候(注:删除了部分聊天记录),我也抛出了这样的问题:

总结一下图片中的各种回答:

1. 什么也不会发生,remove 之后,list 中的数据会被清空。

2.remove 的方法调用错误,入参应该是 index(数组下标)。

3. 并发操作的时候会出现异常。

4. 会发生 ConcurrentModifyException。

你的答案又是什么呢?

在这里,我先不说正确的答案是什么,也先不评价这些回答是对是错,我们一起去探索真相,寻找答案。

二. 阿里 Java 开发规范

有人看到题的第一眼(没有认真读题),就想起了阿里 java 开发手册(先入为主),里面是这样说的:

正是因为大多数人都知道并且读过这个规范 (毕竟是业界权威)。所以呼声最高的答案是【会发生 ConcurrentModifyException】。因为他们知道阿里 java 开发手册里面是强制要求:
不要在 foreach 循环里面进行元素的 remove/add 操作。remove 元素请使用 Iterator 方式,如果并发操作,需要对 Iterator 对象加锁。

但是不能因为他是权威,我们就全盘接受吧?

2.1 正例代码

所以我们眼见为实,先把手册里面提到的【正例代码】跑一下,如下:

细心的读者可能发现了:咦,这个代码的 22 行为啥颜色不一样呢?

我帮你看看。

替换之后的代码是这样的:

从上面我们可以得到一个结论 …….

等等,到这一步你就想得到结论了?你不对【一行代码为什么就替换了七行代码】好奇吗?

看到真相的时候,有时候再往前一步就是本质了。

源码之下无秘密,我再送你一张图,JDK1.8 中 Collection.removeIf 的源码:

好了,已经到源码级别了,从这里我们验证了,阿里 java 开发手册里面的正例是对的,而且我还想给他加上一句:
如果你的 JDK 版本是 1.8 以上,没有并发访问的情况下,可以使用 Collection.removeIf(Predicate<? super E> filter)方法。使代码更加优雅。

2.2 反例代码

接下来我们看看【反例代码】的运行结果:

从执行结果来看,和我们预期的结果是一致。看着没有问题呀?

但是你别忘了,下面还有一句话啊:

我们执行试一试:

什么情况? 真的是 ” 出乎意料 ” 啊!

把删除元素的条件从【公众号】修改为【why 技术】就发生了异常:
java.util.ConcurrentModificationException

三. 层层揭秘, 为什么发生了异常呢?

我们现在明白为什么阿里强制要求不要在 foreach 循环里面进行元素的 remove/add 操作,因为会发生异常了。

但是开发手册里面并没有告诉你,为什么会发生异常。需要我们自己层层深入,积极探索。

3.1 第一层:异常信息解读

所以这一小节我们就一起探索,为什么会发生异常。我们再解析一下程序的运行结果, 如下:

正如上图里面异常信息的体现,异常是在代码的第 21 行触发的。而代码的第 21 行,是一个 foreach 循环。foreach 循环是 Java 的语法糖,我们可以从编译后的 class 文件中看出,如下图所示:

请注意图中的第 26 行代码:
list.remove(item)(这句话很关键!!!)
很关键,很重要,后面会讲到。

这也解释了,异常信息里面的这一个问题:

好了,到这一步,我们把异常信息都解读完毕了。

3.2 第二层:抛出异常的条件解读

我再看看真实抛出异常的那一个方法:

很简单,很清晰的四行代码。抛出异常的条件是:
modCount !=expectedModCount

所以,我们需要解开的下两层面纱就是下面两大点:

第一:什么是 modCount?它是干啥的?什么时候发生变化?

第二:什么是 expectedModCount?它是干啥的?什么时候发生变化?

3.3 第三层:什么是 modCount? 它是干啥的?什么时候发生变化?

先来第一个:什么是 modCount?

modCount 上的注释很长,我只截取了最后一段。在这一段中,提到了两个关键点。

1.modCount 这个字段位于 java.util.AbstractList 抽象类中。

2.modCount 的注释中提到了 ”fail-fast” 机制。

3. 如果子类希望提供 ”fail-fast” 机制,需要在 add(int,E)方法和 remove(int)方法中对这个字段进行处理。

4. 从第三点我们知道了,在提供了 ”fail-fast” 机制的容器中(比如 ArrayList),除了文中示例的 remove(Obj)方法会导致 ConcurrentModificationException 异常,add 及其相关方法也会导致异常。

知道了什么是 modCount。那 modCount 是干啥的呢?

在提供了 ”fail-fast” 机制的集合中,modCount 的作用是记录了该集合在使用过程中被修改的次数。

证据就在源码里面,如下:

这是 java.util.ArrayList#add(int, E)方法的源码截图:

这是 java.util.ArrayList#remove(int)方法的源码截图:

注:这里不讨论手动设置为 null 是否对 GC 有帮助,我个人认为,在这里有这一行代码并没有坏处。在实际开发过程中,一般不需要考虑到这点。

同时,上面的源码截图也回答了这一层的最后一个问题:它什么时候被修改?

拿 ArrayList 来说,当调用 add 相关和 remove 相关方法时,会触发 modCount++ 操作,从而被修改。

好了,通过上面的分析,我们知道了什么是 modCount 和 modCount 是干啥的。准备进入第四层。

3.4 第四层:什么是 expectedModCount?它是干啥的?什么时候发生变化?

接下来:什么是 expectedModCount?

expectedModCount 是 ArrayList 中一个名叫 Itr 内部类的成员变量。

第二问:expectedModCount 它是干啥的:

它代表的含义是在这个迭代器中,预期的修改次数

第三问:expectedModCount 什么时候发生变化?

情况一: 从上图中也可以看出当 Itr 初始化的时候,会对 expectedModCount 字段赋初始值,其值等于 modCount。

情况二: 如下图所示,调用 Itr 的 remove 方法后会再次把 modCount 的值赋给 expectedModCount。

换句话说就是:调用迭代器的 remove 会维护 expectedModCount=modCount。(这句话很关键!!!)

好了分析到了这里,我们知道了下面这个六连击:

1. 什么是 modCount?

2.modCount 是干啥的?

3.modCount 什么时候发生变化?

4. 什么是 expectedModCount?

5.expectedModCount 是干啥的?

6.expectedModCount 什么时候发生变化?

3.5 第五层: 组装线索,直达真相

为什么发生了异常呢?

如果说前四层是线索的话,真相其实已经隐藏在线索里面了。我带你梳理一下:

【第一层: 异常信息解读】中说到:

【第二层:抛出异常的条件解读】中说到:

【第三层:什么是 modCount? 它是干啥的?什么时候发生变化?】中说到:

【第四层:什么是 expectedModCount?它是干啥的?什么时候发生变化?】中说到:

为什么发生了异常呢?我想你大概已经有了一个答案了,我再去 Debug 一下,为了方便演示,我们去掉语法糖,程序修改如下:

并确认一下这个循环体会执行三次,如下:

第一次循环

第一次循环取出的【公众号】,不满足条件 if(“why 技术 ”.equals(item)),不会触发 list.remove(Obj)方法。

第二次循环

如图所示,第二次循环取到了“why 技术”。满足条件 if(“why 技术 ”.equals(item)),会触发 list.remove(Obj)方法,如下所示:

第三次循环

总结一下在 foreach 循环里面进行元素的 remove/add 操作抛出异常的真相:

因为 foreach 循环是 Java 的语法糖,经过编译后还原成了迭代器。

但是从经过编译后的代码的第 26 行可以看出,remove 方法的调方是 list,而不是迭代器。

经过前面的源码分析我们知道,由于 ArrayList 的 ”fail-fast” 机制,调用 remove 方法会触发【modCount++】操作,对 expectedModCount 没有任何操作。只有调用迭代器的 remove 方法,才会维护 expectedModCount=modCount。

所以调用了 list 的 remove 方法后,再调用 Itr 的 next 方法时,导致了 expectedModCount!=modCount,抛出异常。

四. 这题的坑在哪里?

前面讲了阿里开发手册。讲了在 foreach 循环里面进行元素的 remove/add 为什么会发生异常。有了这些铺垫之后。

4.1 回头再看

我们再回过头来看小马哥出的这个题:

我靠,这乍一看,foreach 循环里面调用 list.remove(obj)。我们刚刚分析过,会抛出 ConcurrentModificationException 异常。

你要这样答,你就进了小马哥的坑了。

这个题的坑在这三个点里面。小马哥并没有说这个 list 是 ArrayList 吧?如果你没有认真审题,先入为主的默认了这个 list 就是 ArrayList。第一步就错了。

这是真正的高手,借力打力。借阿里开发手册的力,让你第一步就走错。

请看下面这张图:

当使用 CopyOnWriteArrayList 的时候,程序正常执行。

4.2 还有一个骚操作

既然我们知道为什么会抛出异常,也知道怎么不抛出异常,List 本来就是一个接口,那我们是不是可以实现这个接口,弄一个自定义的 List 呢?

比如下面的这个 WhyTechnologyList,就是我自己的 List,狸猫换太子,这操作,够 ” 骚 ” 啊。

只有掌握了原理,我们想怎么玩就怎么玩。

五. 线程安全版的 ArrayList

CopyOnWriteArrayList 是什么?我们看一下源码注释上面是怎么说的:

相对于 ArrayList 而言,CopyOnWriteArrayList 集合是线程安全的容器。在遍历的时候,由于它操作是数组的 ” 快照 ”,” 快照 ” 不会发生变化。所以它不需要额外加锁,也不会抛出 ConcurrentModificationException 异常。

我们主要看一下,示例程序中用到的三个方法,add(E e)、next()、remove(Obj)

先看 add(E e)方法:

我们看一下它的 next()方法:

再看一下它的 remove(Obj)方法:

next、remove 都是操作的快照,并没有看到 ArrayList 里面的 modCount 和 expectedModCount。所以它没有抛出 ConcurrentModificationException

之前看小马哥说的这句话的时候还不太明白集合和一致性之间的关系(老问题,还是先入为主,一说到一致性首先想到的是缓存和数据库之间的一致性)。

但是当我阅读源码,从 add 方法可以看出 CopyOnWriteArrayList 并不保证数据的实时一致性。只能保证最终一致性。

同时我们从源码中可以看出 CopyOnWriteArrayList 增删改数据的时候需要搞一个 ” 快照 ”,这一点是比较耗内存的,使用过程中需要注意。

六. 总结一下

我们再回到最开始的地方,看看大家的回答:

1. 什么也不会发生,remove 之后,list 中的数据会被清空。

2.remove 的方法调用错误,入参应该是 index(数组下标)。

3. 并发操作的时候会出现异常。

4. 会发生 ConcurrentModifyException。

现在,你知道这些回答的问题在哪里了吧?这一部分的总结也很简单,上一个对比图就好了:

七. 回答另外一个面试题

现在面试官经常问的一个问题,你读过源码吗?

咦,巧了。你看了这篇文章,就相当于了读了 ArrayList 和 CopyOnWriteArrayList 的部分源码。

那你就可以这样回答啦:我之前看阿里 Java 开发手册的时候看到一条规则是
不要在 foreach 循环里面进行元素的 remove/add 操作。remove 元素请使用 Iterator 方式,如果并发操作,需要对 Iterator 对象加锁。
我对这条规则很感兴趣,所以我对其进行了深入的研究,阅读了
ArrayList 和 CopyOnWriteArrayList 的部分源码。

如果碰巧面试官也读过这块源码,这个问题,你们可以相谈甚欢。
如果面试官没有读过这块源码,你可以给他讲的明明白白。

当然,还有一个前提是:我希望你读完这篇文章后,如果是第一次知道这个知识点,那你可以自己实际操作一下。

看懂了是一回事,自己再实际操作一下,是另外一回事。

八. 扩展阅读

8.1 fail-fast 和 fail-safe 机制

文中多次提到了 ”fail-fast” 机制(快速失败),与其对应的还有 ”fail-safe” 机制(失败安全)。

这种机制是一种思想,它不仅仅是体现在 Java 的集合中。在我们常用的 rpc 框架 Dubbo 中,在集群容错时也有相关的实现。

Dubbo 主要提供了这样几种容错方式:

Failover Cluster – 失败自动切换

Failfast Cluster – 快速失败

Failsafe Cluster – 失败安全

Failback Cluster – 失败自动恢复

Forking Cluster – 并行调用多个服务提供者

如果对这两种机制感兴趣的朋友可以查阅相关资料,进行了解。如果想要了解 Dubbo 的集群容错机制,可以看官方文档,地址如下:
http://dubbo.apache.org/zh-cn…

8.2 Java 语法糖

文中说到 foreach 循环的时候提到了 Java 的语法糖。如果对这一块有兴趣的读者,可以在网上查阅相关资料,也可以看看《深入理解 Java 虚拟机》的第 10.3 节,有专门的介绍。

书中说到:

总而言之,语法糖可以看做是编译器实现的一些“小把戏”,这些“小把戏”可能会使得效率“大提升”,但我们也应该去了解这些“小把戏”背后的真实世界,那样才能利用好它们,而不是被它们所迷惑。

关注公众号并回复关键字【Java】。即可获得此书的电子版。

8.3 阿里 Java 开发手册

阿里的孤尽大佬作为主要作者写的这本《阿里 Java 开发手册》,可以说是呕心沥血推出的业界权威,非常值得阅读。读完此书,你不仅能够获得很多干货,甚至你还能读出一点技术情怀在里面。

对于技术情怀,孤尽大佬是这样的说的:

热爱、思考、卓越。热爱是一种源动力,而思考是一个过程,而卓越是一个结果。如果给这三个词加一个定语,使技术情怀更加立体、清晰地被解读,那就是奉献式的热爱,主动式的思考,极致式的卓越。

关注公众号并回复关键字【Java】。即可获得此书的电子版。

九. 最后说一点

这篇文章写之前我一直在纠结,因为感觉这个知识点其实我已经掌握了,那我还有写的必要吗?我在写的这个过程中还能收获一些东西吗?

但是在写的过程中,我翻阅了大量的源码,虽然之前已经看过,但是没有这样一行一行仔细的去分析。之前只是一个大概的模糊的影像,现在具象化清晰了起来,在这个过程中,我还是学到了很多很多。

其实想到写什么内容并不难,难的是你对内容的把控。关于技术性的语言,我是反复推敲,查阅大量文章来进行证伪,总之慎言慎言再慎言,毕竟做技术,我认为是一件非常严谨的事情,我常常想象自己就是在故宫修文物的工匠,在工匠精神的认知上,目前我可能和他们还差的有点远,但是我时常以工匠精神要求自己。就像我之前表达的:对于技术文章(因为我偶尔也会荒腔走板的聊一聊生活,写一写书评,影评),我尽量保证周推,全力保证质量。

文中提到的两本书《深入理解 Java 虚拟机》和《阿里 Java 开发手册》是两本非常优秀,值得反复阅读的工具书,可以关注我后,在后台发送 java,即可获得电子书。

才疏学浅,难免会有纰漏,如果你发现了错误的地方,还请你留言给我指出来,我对其加以修改。

如果你觉得文章还不错,你的点赞、留言、转发、分享、赞赏就是对我最大的鼓励。

另外,如果小马哥本尊能读到这个文章,读到这段话,我想在这里表达对他的敬意。同时也想催更一下: 小马哥,每日一问好久没更新啦,非常怀恋那种被 ” 坑 ” 的明明白白的感觉!

以上。

谢谢您的阅读,感谢您的关注。

欢迎关注公众号【why 技术】。在这里我会分享一些技术相关的东西,主攻 java 方向,用匠心敲代码,对每一行代码负责。偶尔也会荒腔走板的聊一聊生活,写一写书评,影评。愿你我共同进步。

正文完
 0