从面试题说起

String s = new String("xyz"); 创立了几个实例?

这是一道很经典的面试题,在一本所谓的Java宝典上,我看到的“标准答案”是这样的:

两个,一个堆区的“xyz”,一个栈区指向“xyz”的s。

这个所谓的“标准答案”槽点太多,前面咱们缓缓剖析。

然而我感觉这个问题自身不具备什么意义,因为他没有既定义“创立”的具体含意,又没有指定“创立”的工夫,是运行时吗?包不包含类加载的时候?有没有上下文代码语境?也没有定义实例是指什么实例,是指Java实例吗?还是单指String实例?包不包含JVM中的C++实例?

显然,这是一个“有问题的问题”。也是一个“有问题的答案”。

String构造

在剖析之前,为了不便前面画内存图,咱们须要对Java中的String构造有一个大抵理解:

从上图能够看出,String类有三个属性:

value:char数组,用于用于存储字符。

hash:缓存字符串的哈希码,默认为0(String的hash值在真正调用hashCode办法的时候才会去计算)。

serialVersionUID:序列化用的。

失常的问题与正当的解释

在下面的题干上加上一些限定词,能够失去一个新的问题:

String s = new String("xyz");创立几个String实例?

对于这个问题,在网上能找到一些比拟高赞的答案:

两个,一个是字符串字面量"xyz"所对应的、存在于全局共享的常量池中的实例,另一个是通过new String(String)创立并初始化的、内容(字符)与"xyz"雷同的实例。思考到如果常量池中如果有这个字符串,就只会创立一个。同时在栈区还会有一个对new进去的String实例的s。

能提到常量池,我认为这曾经达到大部分面试官对这个题目答案的期许了,或者这也是面试官考查的点。

但这个答案也仅是比拟正当,并不完全正确。为什么呢?

我认为这个答案并不谨严,甚至是有一些谬误了解在其中的。

首先,我不了解的是为什么很多答主总是用“常量池”来代替“字符串常量池”,在Java体系中,其实是有三个常量池的,三个常量池的概念和用途都不雷同,我认为是不应该混同的。

其次,就算答主说的“常量池”就是“字符串常量池”,可“字符串常量池”中存的是String实例的援用,而不是字符串,这是有很大区别的。

而且这个答案是没有思考代码执行的环境。

这些咱们前面都会一一剖析。

分清变量和实例

首先咱们要分清变量和实例的区别。

先回到结尾的问题与“标准答案” 。

问题:String s = new String("xyz"); 创立了几个实例?

答案:两个,一个堆区的“xyz”,一个栈区指向“xyz”的s

很显著给答案的人是没有把变量和实例分分明。Java里变量就是变量,类型的变量只是对某个对象实例或者null的,不是实例自身。申明变量的个数跟创立实例的个数没有必然关系。

举个例子:

String s1 = "xyz";  String s2 = s1.concat("");  String s3 = null;  new String(s1);  

这段代码会波及3个String类型的变量:

  1. s1,指向上面String实例的1
  2. s2,指向与s1雷同
  3. s3,值为null,不指向任何实例

以及3个String实例:

  1. "xyz"字面量对应的驻留的字符串常量的String实例
  2. ""字面量对应的驻留的字符串常量的String实例 (String.concat()是个乏味的办法,当发现传入的参数是空字符串时会返回this,所以这里不会额定创立新的String实例)
  3. 通过new String(String)创立的新String实例,没有任何变量指向它。

类加载

对于String s = new String("xyz");创立几个String实例?这个问题。

仿佛网上的所有答案都把类加载过程和理论执行过程合在一起剖析的。

看起来如同是没有什么问题的,因为想要执行某个代码片段,其所在的类必然要被加载,而且对于同一个类加载器,最多加载一次。

然而咱们看一下这段代码的字节码:

仿佛只呈现了一次new java/lang/String,也就是只创立了一个String实例。也就是说原问题中的代码在每执行一次只会新创建一个String实例。 这里的ldc指令只是把先前在类加载过程中曾经创立好的一个String实例("xyz")的一个援用压到操作数栈顶而已,并没有创立新的String实例。

不是应该有两个实例吗?还有一个String实例是在什么时候创立的呢?

咱们都晓得类加载的解析阶段是Java虚拟机将常量池内的符号援用替换为间接援用的过程,依据JVM标准,符合规范的JVM实现应该在类加载的过程中创立并驻留一个String实例作为常量来对应"xyz"字面量,具体是在类加载的解析阶段进行的。这个常量是全局共享的,只在先前尚未有内容雷同的字符串驻留过的前提下才须要创立新的String实例。

所以你能够了解成,在类加载的解析阶段,其实曾经创立了一个String实例,执行代码的时候,又new了一个String实例。当然,你把两者放在一起探讨并不会有什么问题。

JVM优化

以上探讨都只是针对标准所定义的Java语言与Java虚拟机而言。概念上是如此,但理论的JVM实现能够做得更优化,原问题中的代码片段有可能在理论执行的时候一个String实例也不会残缺创立(没有调配空间)。

不联合上下文代码来看就间接说是“标准答案”就是耍流氓。

咱们看下这段代码:

运行这段代码,会一直的创立String对象吃内存,而后频繁的造成GC。

对于这个论断置信大家都没有意见,咱们加上-XX:+PrintGC -XX:-DoEscapeAnalysis打印日志,敞开逃逸剖析(JDK8默认开启此优化,咱们先敞开)运行一下看看。

后果的确如咱们所料,一直的创立String对象吃内存导致频繁GC。

咱们当初将-XX:-DoEscapeAnalysis改成-XX:+DoEscapeAnalysis,从新跑一下这段代码:

神奇的事件产生了,持续跑下去也没有再打出GC日志了。难道新创建String对象都不吃内存了么?

理论状况是:通过HotSpot VM的的优化后,newString()办法不会新创建String实例了。这样天然不吃内存,也就不再触发GC了。

当初再来看开篇的那个问题,不联合具体情况,还能简略的说String s = new String("xyz");会创立两个String实例吗?

我只是举了一个逃逸剖析的例子,HotSpot VM还有很多像这样的优化,比方办法内联、标量替换和无用代码削除。

klass-oop

如果题干上没有加上“Java”实例的定语,那JVM中的oop实例咱们也不应该疏忽。

为了前面能更好的说分明这一点,须要补充一下klass-opp模型的常识。

为了放弃谨严,先做一个约定,全文只有波及JVM具体实现的内容都是基于Jdk8中HotSpot VM开展的。

HotSpot VM是基于C++实现,而C++是一门面向对象的语言,自身是具备面向对象基本特征的,所以Java中的对象示意,最简略的做法是为每个Java类生成一个C++类与之对应。但HotSpot VM并没有这么做,而是设计了一套klass-oop模型。

klass,它是Java类的元信息在JVM中的存在模式。一个Java类被JVM类加载器加载之后,就是以klass的模式存在于JVM之中。

oop,它是Java对象在JVM中的存在模式。每创立一个新的对象,在JVM外部就会相应地创立一个对应类型的OOP对象。

其中instanceOopDesc示意非数组对象,arrayOopDesc示意数组对象;

而objArrayOopDesc示意援用类型数组对象,typeArrayOopDesc示意根本类型数组对象。

举个例子:Java中String类的一个实例,在JVM中会有一个对应的instanceOopDesc实例。

字符串常量池

在Java体系中,有三种常量池:

  • class字节码中的常量池:存在于硬盘上。次要寄存两大类常量:字面量、符号援用。
  • 运行时常量池:办法区的一部分。咱们常说的常量池,就是指这一块区域:办法区中的运行时常量池。
  • 字符串常量池:存在于堆区。这个常量池在JVM层面就是一个StringTable,只存储对java.lang.String实例的援用,而不存储String对象的内容。个别咱们说一个字符串进入了字符串常量池其实是说在这个StringTable中保留了对它的援用,反之,如果说没有在其中就是说StringTable中没有对它的援用。

明天,咱们重点说的是字符串常量池,即String Pool,在JVM中对应的类是StringTable,底层实现是一个Hashtable。也是利用的哈希思维。

上面这段代码,是往字符串常量池增加字符串办法。尽管是C++代码,但我置信学过Java的人都能看懂,至多也能明确这段代码干了什么事件。会通过String的内容+长度生成的hash值定位下标index,而后将Java的String类的实例对应的instanceOopDesc封装成HashtableEntry作为存储构造存储到常量池。

补充完字符串常量池的常识之后,咱们再回到文章结尾的那一题:

String s = new String("xyz");创立了几个实例?

咱们画一个内存图,图中省略了两个String对应的instanceOopDesc实例。

不难得出答案,如果包含JVM中的C++实例的话,有两个Java的String实例,两个String实例对应的instanceOopDesc实例,还有一个char[]数组对应的typeArrayOopDesc实例。加一起一共是5个,也能够说2个String实例加上3个oop实例。

总结

String s = new String("xyz"); 创立了几个实例?

通过以上的剖析,咱们会发现,每在这道题目的题干上每加一个定语,这道题目就会有不同的答案。

是否思考类加载过程,是否思考JVM优化,是否包含对应的oop实例等等等等,每个点都值得聊一聊的。

下次有人问你,你无妨把这篇的文章分享给他。

写在最初

为了写这一篇文章,我翻看了很多@RednaxelaFX前辈和周志明前辈的博客,过程中收益良多。在这里感激前辈们为国内JVM的科普与倒退做出的奉献!
还有一个很乏味的故事,我在查找“如何通过HSDB来理解String”相干材料的时候,看到一篇写的很好的文章,惊呼国内还有这么多低调的大神,起初增加了文章旁边的公众号,发现这个大神原来是PerfMa的创始人“寒泉子”李嘉鹏前辈,触犯了触犯了!

最初的最初

本着对每一篇收回去的文章负责的准则,文中波及常识实践,我都会尽量在官网文档和权威书籍找到并加以验证。但即便这样,我也不能保障文中每个点都是正确的,如果你发现错误之处,欢送指出,我会对其修改。

创作不易,你的正反馈对我来说十分重要!点个赞,点个再看,点个关注甚至评论区发送一条666都是对我最大的反对!

我是CoderW,一个一般的程序员。

谢谢你的浏览,咱们下期再见

参考文章

文中波及代码:https://github.com/xiaoyingzh...

JVM Spec Java SE 8Edition:https://docs.oracle.com/javas...

参考文章:http://isfeasible.cn/posts/vi...

参考文章:https://www.iteye.com/blog/re...

参考文章:http://lovestblog.cn/blog/201...