前言

后面咱们解说了Class文件的构造、以及采纳不同的形式来解读Class文件

  • 第一种是采纳字节码一行一行的解读、
  • 第二种是采纳javap的指令进行解读、
  • 第三应用第三方(idea、Eclipse)插件进解读、

然而针对于Class文件里办法的字节码指令,咱们并没有进行细节的指令剖析

本篇文章,咱们开始对字节码指令进行剖析,看看示例代码里的办法到底做了什么事件?

一、指令概述


Java字节码对于虚拟机,就如同汇编语言对于计算机,属于根本执行指令。

Java虚拟机的指令由一个字节长度的、代表着某种特定操作含意的数字(称为操作码,Opcode)以及追随其后的零至多个代表此操作所需参数(称为操作数,Operands)而形成。

因为Java虚拟机采纳面向操作数栈而不是寄存器的构造,所以大多数的指令都不蕴含操作数

咱们能够采纳上一篇文章的示例代码与字节码剖析进行解析看看

咱们依据上篇的思路,找找这些字节码指令对应的字节码是什么呢?代表什么意思呢?

虚拟机限度了Java 操作码的长度为一个字节(即0~255),这意味着操作码总数不可能超过256条

官网文档: https: //docs.oracle.com/javase/specs/jvms/se8/htm1/jvms-6.html

相熟虚拟机的指令对于动静字节码生成、反编译Class文件、Class文件修补都有着十分重要的价值。因而浏览学节码作为理解ava虚拟机的根底技能,须要熟练掌握常见指令。

执行模型

================================

如果不思考异样解决的话

那么Java虚拟机的解释器能够应用上面这个伪代码当做最根本的执行模型来了解

do{    主动计算PC寄存器的值加1;        依据PC寄存器的批示地位,从字节码流中取出操作码;        if(字节码存在操作数)从字节码流中取出操作数;        执行操作码所定义的操作;    }while(字节码长度 > 0);

字节码与数据类型

================================

在Java虚拟机的指令集中,大多数的指令都蕴含了其操作所对应的数据类型信息。例如:

  • iload指令用于从局部变量表中加载int型的数据到操作数栈中
  • fload指令用于从局部变量表中加载的则是float类型的数据

咱们能够依据上篇的示例代码进行解析剖析看看

咱们能够看看局部变量表里的索引:0的值是什么?

对于大部分与数据类型相干的字节码指令,它们的操作码助记符中都有非凡的字符来表明专门为哪种数据类型服务:

  • i代表int
  • l代表long
  • s代表short
  • b代表byte
  • c代表char
  • f代表float
  • d代表double

也有一些指令的助记符中没有明确地指明操作类型的字母,如arraylength指令没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象

还有另外一些指令,如无条件跳转指令goto则是与数据类型无关的。

然而大部分的指令都没有反对整数类型byte、char和short,甚至没有任何指令反对boolean类型

编译器会在编译期或运行期将byte和short类型的数据带符号扩大(Sign-Extend)为相应的int类型数据将boolean和char类型数据零位扩大(Zero-Extend)为相应的int类型数据

与之相似,在解决boolean、byte、short和char类型的数组时,也会转换为应用对应的int类型的字节码指令来解决。因而大多数对于boolean、byte、short和char类型数据的操作,实际上都是应用相应的int类型作为运算类型

 byte b1 = 12; short s1 = 10 int i = b1 + s1

指令的分类

================================

因为齐全介绍和学习这些指令须要破费大量工夫。为了让大家可能更快地相熟和理解这些根本指令,这里将JVN中的字节码指令集按用处大抵分成9类

  • 加载与存储指令
  • 算术指令
  • 类型转换指令
  • 对象的创立与拜访指令
  • 办法调用与返回指令
  • 操作数栈治理指令
  • 比拟控制指令
  • 异样解决指令
  • 同步控制指令

写在后面的,对于这些不同分类指令,大多在做值相干操作时:

一个指令能够从局部变量表、常量池、堆中对象、办法调用、零碎调用中等获得数据,这些数据(可能是值,可能是对象的援用)被压入操作数栈。

一个指令也能够从操作数栈中取出一到多个值(pop屡次),实现赋值、加减乘除、办法传参、零碎调用等等操作。

二、加载与存储指令概述


作用

================================

加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递

常见指令

================================

下面所列举的指令助记符中,有一部分是以尖括号结尾的(例如:iload_<n>)。

指令助记符实际上代表了一组指令

例如:iload_<n>代表了iload_0、iload_1、iload_2、iload_3这几个指令。

这几组指令都是某个带有一个操作数的通用指令(例如:iload)的非凡模式,对于这若干组非凡指令来说,它们外表上没有操作数,不须要进行取操作数的动作,但操作数都隐含在指令中

除此之外它们的语义与原生的通用指令完全一致

例如 iload_0的语义与操作数为时的 iload 指令语义完全一致。

示例举例:

iload_0:将局部变量表中索引为0地位上的数据压入操作数栈中,这是占一个字节

iload 0:将局部变量表中索引为0地位上的数据压入操作数栈中,这是占两个字节

在尖括号之间的字母指定了指令隐含操作数的数据类型,具体信息如下:

  • <n>代表非负的整数、<i>代表是int类型
  • <l>代表long类型、<f>代表float类型
  • <d>代表double类型

操作byte、char、short和boolean类型数据时,常常用int类型的指令来示意。

三、加载与存储指令的再谈操作数栈与局部变量表


操作数栈(Operand Stacks)

================================

咱们晓得Java字节码是Java虚拟机所应用的指令集。因而与Java虚拟机基于栈的计算模型是密不可分

在解释执行过程中每当为Java办法调配栈桢时,Java虚拟机往往须要开拓一块额定的空间作为操作数栈,来寄存计算的操作数以及返回后果

具体来说便是:执行每一条指令之前,Java虚拟机要求该指令的操作数已被压入操作数栈中。在执行指令时,Java虚构机会将该指令所需的操作数弹出,并且将指令的后果从新压入栈中

以加法指令 iadd为例。假如在执行该指令前,栈顶的两个元素别离为 int值 1和 int 值 2,那么iadd 指令将弹出这两个int,并将求得的和int值 3 压入栈中。

因为 iadd 指令只耗费栈顶的两个元素,因而,对于离栈顶间隔为?的元素,即图中的问号,iadd 指令并不关怀它是否存在,更加不会对其进行批改。

局部变量表(Local Variables)

================================

Java办法栈桢的另外一个重要组成部分则是局部变量区,字节码程序能够将计算的后果缓存在局部变量区之中

实际上,Java虚拟机将局部变量区当成一个数组,顺次寄存 this 指针〈仅非静态方法),所传入的参数,以及字节码中的局部变量。

和操作数栈一样,long类型以及 double类型的值将占据两个单元,其余类型仅占据一个单元。

举例:public vid foo( long l,fl1oatf) {    {        int i = 0;    }    {        string s = "He11o, wor1d" ;    }}

在栈帧中,与性能调优关系最为亲密的局部就是局部变量表。局部变量表中的变量也是重要的垃圾回收根节点(GC Roots),只有被局部变量表中间接或间接援用的对象都不会被回收

在办法执行时,虚拟机应用局部变量表实现办法的传递

四、加载与存储指令的局部变量入栈指令


局部变量压栈指令将给定的局部变量表中的数据压入操作数栈。

这类指令大体能够分为:

  • 指令信息:xload_<n>,形容为:x为i、l、f、d、a,n为0到3
  • 指令信息:xload,形容为: x为i、l、f、d、a

阐明:在这里x的取值示意数据类型

指令xload_n示意将第n个局部变量压入操作数栈

比方iload_1、fload_0、aload_e等指令。其中aload_n示意将个对象援用压栈

指令xload通过指定参数的模式,把局部变量压入操作数栈,当应用这个命令时,示意局部变量的数量可能超过了4个,比方指令iload、 fload等。

接下来应用示例代码来演示一下局部变量压栈指令

public class LoadAndStoreTest {    //1.局部变量压栈指令    public void load(int num,object obj,long count,boolean flag,short[] arr){        system.out.println(num);        system.out.println(obj);         system.out.println(count);        system.out.print1n(flag);        system.out.println(arr);    }}

咱们应用编译一下,并且在idea中应用插件来看看该办法具体的指令有哪些?

此时咱们依据这些指令进行剖析看看,并且看看局部变量表与操作数栈是怎么样的状况


咱们也能够应用idea的插件校验一下,看看是否办法里的局部变量表统一?

接下来咱们剖析一下指令是怎么操作局部变量表与操作数栈的,


当咱们操作局部变量表索引为:5的时候,就会发现它占用了两个字节:iload 5,why?

五、、加载与存储指令的常量入栈指令


常量入栈指令的性能是

常数压入操作数栈,依据数据类型和入栈内容的不同,又能够分为const系列、push系列和ldc指令。

const系列

================================

用于对特定的常量入栈,入栈的常量隐含在指令自身里。

指令有: iconst_<i>、形容:i从-1到5
指令有: lconst_<l>、形容:l从0到1
指令有: fconst_<f>、形容:f从0到2
指令有: dconst_<d>、形容:d从0到1
指令有: aconst_null、形容:d从0到1

比方有示例:

  • iconst_m1,形容:将-1压入操作数栈;
  • iconst_x (x为0到5)将x压入栈:
  • lconst_0、lconst_1别离将长整数0和1压入栈;
  • fconst_0、fconst_1、fconst_2别离将浮点数0、1、2压入栈;
  • dconst_0、dconst_1别离将double型0和1压入栈。
  • aconst_null将null压入操作数栈;

从指令的命名上不难找出法则,指令助记符的第一个字符总是喜爱示意数据类型。

  • i示意整数、l示意长整数
  • f示意浮点数、d示意双精度浮点
  • a示意对象援用

如果指令隐含操作的参数,会以下划线模式给出。

push系列

================================

次要包含bipush和sipush,它们区别在于接收数据类型的不同:

bipush接管8位整数作为参数、sipush接管16位整数,它们都将参数压入栈。

指令ldc系列

================================

如果以上指令都不能满足需要,那么能够应用万能的ldc指令,它能够接管一个8位的参数,该参数指向常量池中的int、float或者String的索引,将指定的内容压入堆栈

相似的还有ldc_w,它接管两个8位参数,能反对的索引范畴大于ldc。
如果要压入的元素是1ong或者double类型的,则应用1dc2_w指令,应用形式都是相似的。

接下来应用示例代码来演示一下常量压栈指令

public class LoadAndStoreTest {    //2.常量入栈指令    public void pushConstLdc() {        int i = 1;        int a = 5;        int b = 6;        int c = 127;        int d = 128;        int e = 32767;        int f = 32768;    }}

咱们应用编译一下,并且在idea中应用插件来看看该办法具体的指令有哪些?

尽管咱们都是int类型的变量,然而指令里也有byte、long、short这些类型

所以咱们能够总结一下,具体类型的范畴具体定义,能够看如下图:

那么对于float、long类型,咱们也进行示例代码看看具体是怎么样的?

public class LoadAndStoreTest {    //2.常量入栈指令    public void constLdc() {        1ong a1 = 1;        long a2 = 2;        float b1 = 2;        f1oat b2 = 3;        double c1 = 1;        double c2 = 2;        Date d = null;    }}

咱们应用编译一下,并且在idea中应用插件来看看该办法具体的指令有哪些?

咱们后面也提到过压入的元素是1ong或者double类型的,则应用ldc2_w指令

当咱们超出float类型的范畴同样也是应用ldc2_w的指令

六、加载与存储指令的出栈指令


出栈装入局部变量表指令

用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定地位,用于给局部变量赋值

这类指令次要以store的模式存在

指令:xstore ,形容:x为i、l、f、d、a
指令:xstore_n,形容:x 为i、l、f、d、a,n为至 3

其中指令istore_n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引n地位

指令xstore因为没有隐含参数信息,故须要提供一个byte类型的参数类指定指标局部变量表的地位

接下来应用示例代码来演示一下常量压栈指令

public class LoadAndStoreTest {    //3.出栈装入局部变量表指令    public void store(int k,double d){        int m = k + 2;        long l = 12;        string str = "atguigu";        float f = 10.0F;        d = 10;    }}

咱们应用编译一下,并且在idea中应用插件来看看该办法具体的指令有哪些?

此时咱们依据这些指令进行剖析看看,并且看看出栈指令是怎么样的状况



接下来应用示例代码来演示一下其余的状况阐明

public class LoadAndStoreTest {    //4.出栈装入局部变量表指令    public void foo( 1ong l,f1oat f){        {            int i = 0;        }        {            string s = "He1lo,wor1d"        }    }}

咱们应用编译一下,并且在idea中应用插件来看看该办法具体的指令有哪些?

仅接着咱们来看看局部变量表里有什么呢?

然而咱们的局部变量表长度是多少呢?咱们一起来看看

此时咱们依据这些指令进行剖析看看,并且看看出栈指令是怎么样的状况