共计 2173 个字符,预计需要花费 6 分钟才能阅读完成。
简介
Byte Code 也叫做字节码,是连接 java 源代码和 JVM 的桥梁,源代码编译成为字节码,而字节码又被加载进 JVM 中运行。字节码怎么生成,怎么查看字节码,隐藏在 Byte Code 背后的秘密是什么呢?快跟小师妹一起来看看吧。
Byte Code 的作用
小师妹:F 师兄,为什么 Java 需要字节码呢?直接编译成为机器码不是更快吗?
小师妹,Java 的设计初衷是一次编写,到处运行。为了兼容各个平台的运行环境,java 特别为各种平台设计了 JVM。
我们可以把 JVM 看做是一种抽象,对外提供了统一的接口。这样我们只需要编写符合 JVM 规范的代码,即可在 JVM 中运行。
回想下之前我们提到过的 java 的执行过程:
- 编写 java 代码文件比如 Example.java
- 使用 java 编译器 javac 将源文件编译成为 Example.class 文件
- JVM 加载生成的字节码文件,将其转换成为机器可以识别的 native machine code 执行
小师妹:F 师兄,我有一个大胆的想法,JVM 的作用是将字节码解释或者编译成为机器码。然后在相应的运行环境中执行。那么有没有可能,不需要 JVM,不需要机器码,而是直接在对应的平台上执行字节码呢?
爱因斯坦说过没有想像力的灵魂,就像没有望远镜的天文台。小师妹你这个想法很好,这种实现有个专业的说法叫做:Java processor。
Java processor 就是用硬件来实现的 JVM。因此字节码可以直接在 Java processor 中运行。
其中比较出名的是 Jazelle DBX,这是一个主要支持 J2ME 环境的硬件架构。为了提升 java 在手机端的执行速度。
但是这样做其实也是有缺点的,后面我们会讲到,java 字节码中的指令非常非常多。所以如果用硬件来实现的话,就会非常非常复杂。
一般来说 Java processor 不会实现全部的字节码中的功能,只会提供部分的实现。
查看 Byte Code 字节码
小师妹:F 师兄,那使用 javac 编译过后的 class 文件跟字节码有什么关系呢?
class 文件中大部分都是 byte code,其他的部分是一些 meta data 元数据信息。这些组合在一起就是 class 文件了。
小师妹:F 师兄,你说 class 文件是 byte code,为什么我在 IDE 中打开的时候,直接显示的是反编译出来的源文件呢?
小师妹,这是 IDE 的一个便利功能。因为大多数情况下,没有人想去看 class 文件的 Byte code 的,大家都是想去看看这个 class 文件的源文件是什么样的。
我们举个最简单的例子:
这个类中,我们定义了一个很简单的 testByteCode 方法,里面定义了两个变量,然后返回他们两个的和。
现在有两种方法来查看这个类的 Byte Code:
第一种方法是用 javap 命令:
javap -c ByteCodeUsage.class
生成的结果如上所示。
第二种方法就是在 IDEA 中,选中 class 文件,然后在 view 中选中 show Bytecode:
我们看下输出结果:
两个的结果在显示上面可能有细微的差异,但是并不影响我们后面对其的解析。
java Byte Code 是怎么工作的
小师妹:F 师兄,能讲解一下这些 byte code 到底是怎么工作的吗?
首先我们要介绍一下 JVM 的实现是基于栈的结构的。为什么要基于栈的结构呢?那是因为栈是最适合用来实现 function 互相调用的。
我们再回顾一下上面的 testByteCode 的字节码。里面有很多 iconst,istore 的东西,这些东西被称作 Opcode,也就是一些基于栈的操作指令。
上面讲了 java bytecode 的操作指令其实有很多个。下面我们列出这些指令的部分介绍:
实在是太多了,这里就不把所有的列出来了。
我们看到的指令名字其实是一个助记词,真实的 Opcode 是一个占用两个字节的数字。
下面我们来详细解释一下 testByteCode 方法:
public int testByteCode();
Code:
0: iconst_1
1: istore_1
2: iconst_2
3: istore_2
4: iload_1
5: iload_2
6: iadd
7: ireturn
第一步,iconst_1 将 int 1 加载到 stack 中。
第二步,istore_1 将入栈的 int 1 出栈,并存储到变量 1 中。
第三步,iconst_2 将 int 2 入栈。
第四步,istore_2 将入栈的 int 2 出栈,并存储到变量 2 中。
第五步,iload_1 将变量 1 中的值入栈。
第六步,iload_2 将变量 2 中的值入栈。
第七步,iadd 将栈中的两个变量出栈,并相加。然后将结果入栈。
第八步,ireturn 将栈中的结果出栈。
这几步实际上完美的还原了我们在 testByteCode 方法中定义的功能。
当然我们只介绍了最贱的 byte code 命令,通过这些简单的命令可以组合成为更加复杂的 java 命令。
总结
本文介绍了 java byte code 的作用和具体的指令,并分析了一个简单的例子来做说明。希望大家能够掌握。
本文的例子 https://github.com/ddean2009/learn-java-base-9-to-20
本文作者:flydean 程序那些事
本文链接:http://www.flydean.com/jvm-byte-code/
本文来源:flydean 的博客
欢迎关注我的公众号: 程序那些事,更多精彩等着您!