关于android:如何读懂晦涩的-Class-文件|进阶必备

40次阅读

共计 21751 个字符,预计需要花费 55 分钟才能阅读完成。

Android 开发者性能开发简直都是面向 Java/Kotlin 语法编程,对于 class 文件 的关注绝对较少。当你反编译 class 文件 或程序编译期批改字节码亦做代码注入时,读懂字节码成为一道绕不开的槛。

文章次要形容如何疾速读懂一个class 文件。波及到的 JVM 指令及字节码构造已做了整顿,这部分常识平时用到的时候查一下便可,用多了天然记住了。即便你是一个老手,依照上面的思路整合,你也能够从 0 上手。

读完本篇文章你会播种:

  1. Class 文件构造长啥样
  2. JVM 操作指令有哪些
  3. 如何从二进制流中读懂 Class 文件

举个栗子???? 带你入门

编写一个简略的java 文件

应用 javac 编译 TestClass.java 输入 TestClass.Class,失去的二进制流文件。能够通过工具查看其内容,在 MAC 平台上举荐应用 iHex-Hex Editor 以十六进制格局查看,大略长这个样子。

这看起来像 天书 ,无从下手。实际上任何编程产物最终都会演化成二进制,它必然是依照某种规定来申明对应逻辑。Java 虚拟机为了可能解析这个文件,要求其内容必须严格依照格局来排版,这种构造格局便是Class 文件构造。然而单单晓得外面有哪些内容还不够,虚拟机还须要一套规定来操作这些内容,这些规定便是 字节码操作指令

要读懂这些 天书 ,先得理解 天书 是怎么写进去的。

Class 文件构造长啥样

java 文件 通过 JAVA 编译器(javac)编译成中间代码字节码class 文件class 文件 是一个二进制文件,外面的内容曾经是严格依照 Class 文件构造规定排列的。

上面示意是 Class 文件构造表,顺次依照行从上到下解析,也就是说文件结尾优先解析 magic(魔数)

类型名称形容数量
u4(4 个字节)magic确定该文件是否为一个能被虚拟机承受的 Class 文件,相似于 ID1
u2(2 个字节)minot_version次版本号1
u2(2 个字节)mahor_version主版本号1
u2(2 个字节)constant_pool_count常量池容量计数值,从 1 开始计算,0 则示意不援用任何一个常量池我的项目1
cp_infoconstant_pool常量池constant_pool_count-1
u2(2 个字节)access_flags拜访标记1
u2(2 个字节)this_class类索引1
u2(2 个字节)super_class父类索引1
u2(2 个字节)interfaces_count实现接口的数目1
u2(4 个字节)interfaces接口索引interfaces_count
u2(4 个字节)fields_count字段的数目1
field_infofields字段内容fields_count
u2(2 个字节)methods_count办法的数目1
method_infomethods办法内容methods_count
u2(2 个字节)attributes_count属性的数目1
attribute_infoattributes属性内容attributes_count

单靠下面表还不够,形容列中局部内容蕴含字节码层面的形容,还需依据特定表格进行查问解析,具体如下:

  1. 常量池对应 常量表 束缚
  2. 拜访标记对应 拜访标记表 束缚
  3. 字段对应 字段表 束缚
  4. 办法对应 办法表 束缚
  5. 属性对应 属性表 束缚,同时属性内可能还须要进一步划分,对应 Code 属性构造, 异样属性构造 等表束缚
  6. 还有一些非凡字符串格局束缚,比方 非凡字符串表 等等

常量表

常量池次要寄存两种类型

  • 字面量,蕴含文本字符串,final 常量值等。
  • 符号援用,类和接口的全限定名,字段的名称和描述符,办法的名称和描述符。

Class 文件 只保留各个办法,字段信息,不保留内存信息。只有通过运行期转换能力失去真正的内存入口。当虚拟机运行时,须要从常量池中获取到对应的符号援用,再通过类创建者运行时解析,失去具体的内存地址。

类型子结构标记形容
CONSTANT_Utf8_infotagu1 = 1UTF- 8 编码的字符串
lenghtu2UTF- 8 编码的字符串占用的字节数
bytesu1长度为 lenght 的 UTF- 8 编码的字符串
CONSTANT_Integer_infotagu1=3整型字面量
bytesu4依照高位在前存储的 int 值
CONSTANT_Float_infotagu1=4浮点型字面量
bytesu4依照高位在前存储的 float 值
CONSTANT_Long_infotagu1=5长整型字面量
bytesu8依照高位在前存储的 long 值
CONSTANT_Double_infotagu1=6双精度浮点型字面量
bytesu8依照高位在前存储的 double 值
CONSTANT_Class_infotagu1=7类或接口的符号援用
bytesu2指向全限定名常量项的索引
CONSTANT_String_infotagu1=8字符串类型字面量
bytesu2指向字符串字面量的索引
CONSTANT_Fieldref_infotagu1=9字段的符号援用
indexu2指向申明字段的类或者接口描述符 CONSTANT_Class_info 的索引项
indexu2指向申明字段的类或者接口描述符 CONSTANT_NameAndType_info 的索引项
CONSTANT_Methodred_infotagu1=10类中办法的符号援用
indexu2指向申明字段的类或者接口描述符 CONSTANT_Class_info 的索引项
indexu2指向申明字段的类或者接口描述符 CONSTANT_NameAndType_info 的索引项
CONSTANT_InterfaceMethodref_infotagu1=11接口中办法的符号援用
indexu2指向申明字段的类或者接口描述符 CONSTANT_Class_info 的索引项
indexu2指向申明字段的类或者接口描述符 CONSTANT_NameAndType_info 的索引项
CONSTANT_NameAndType_infotagu1=12字段或办法的局部符号援用
indexu2指向该字段或办法名称常量项的索引
indexu2指向该字段或办法名称常量项的索引
CONSTANT_MethodHandle_infotagu1=15示意办法句柄
reference_kindu1值必须在 [1,9] 中,它决定了办法句柄的类型。办法句柄类型的值示意办法句柄的字节码行为
reference_indexu2值必须是对常量池的无效索引
CONSTANT_MethodType_infotagu1=16识别方法类型
descriptor_indexu2值必须是对常量池的无效索引,常量池在该索引处的项必须是 CONSTANT_Utf8_info 构造,示意办法的描述符
CONSTANT_InvokeDynamic_infotagu1=18示意一个动静办法调用点
bootstrap_method_attar_indexu2值必须是对以后 Class 文件中疏导办法表的 bootstrap_methods[]数组的无效索引
name_and_type_indexu2值必须是对以后常量池的无效索引,常量池在该索引处的值必须是 CONSTANT_NameAndType_info 构造,示意办法名和办法描述符

拜访标记表

针对类,字段表,办法表中的拜访标记进行划分。

  • 类拜访标记,用于辨认一些类或者接口档次的访问信息,包含这个 Class 是类还是接口,是否被定义成 public 类型,是否被定义成 abstract 类类型,如果是类的话,是否被申明为 final 等。

    标记名称标记值形容
    ACC_PUBLIC0x0001是否为 public 类型
    ACC_FINAL0x0010是否被申明为 final,只有类可设置
    ACC_SUPER0x0020是否容许应用 invokespecial 字节码指令的新语意,invokespecial 指令的语意在 JDK1.0.2 产生过变动,为了区别这条指令应用哪种语意,JDK1.0.2 之后编译进去的类的这个标识必须都为真
    ACC_INTERFACE0x0200标识这个是一个接口
    ACC_ABSTRACT0x0400是否为 abstract 类型,对于接口或者抽象类来说,此标记的值都为真,其余类型为假
    ACC_SYNTHETIC0x1000标识这个类并非由用户代码产生的
    ACC_ANNOTATION0x2000标识这是一个注解
    ACC_ENUM0x4000标识这是一个枚举
  • 外部类拜访标记

    标记名称标记值形容
    ACC_PUBLIC0x0001外部类是否为 public
    ACC_PRIVATE0x0002外部类是否为 private
    ACC_PROTECTED0x0004外部类是否为 protected
    ACC_STATIC0x0008外部类是否为 protected
    ACC_FINAL0x0010外部类是否为 protected
    ACC_INTERFACE0x0020外部类是否为接口
    ACC_ABSTRACT0x0400外部类是否为 abstract
    ACC_SYNTHETIC0x1000外部类是否并非由用户代码产生
    ACC_ANNOTATION0x2000外部类是否是一个注解
    ACC_ENUM0x4000外部类是否是一个枚举
  • 字段拜访标记

    标记名称标记值形容
    ACC_PUBLIC0x0001字段是否为 public
    ACC_PRIVATE0x0002字段是否为 private
    ACC_PROTECTED0x0004字段是否为 protected
    ACC_STATIC0x0008字段是否为 static
    ACC_FINAL0x0010字段是否为 final
    ACC_VOLATILE0x0040字段是否为 volatile
    ACC_TRANSIENT0x0080字段是否为 transient
    ACC_SYNTHETIC0x1000字段是否由编译器主动产生的
    ACC_ENUM0x4000字段是否为 enum
  • 办法拜访标记

    标记名称标记值形容
    ACC_PUBLIC0x0001办法是否为 public
    ACC_PRIVATE0x0002办法是否为 private
    ACC_PROTECTED0x0004办法是否为 protected
    ACC_STATIC0x0008办法是否为 static
    ACC_FINAL0x0010办法是否为 final
    ACC_SYNCHRONIZED0x0020办法是否为 synchronized
    ACC_BRIDGE0x0040办法是否由编译器产生的桥接办法
    ACC_VARARGS0x0080办法是否承受不定参数
    ACC_NATIVE0x0100办法是否为 native
    ACC_ABSTRACT0x0400办法是否为 abstract
    ACC_STRICTFP0x0800办法是否为 strictfp
    ACC_SYNTHETIC0x1000办法是否由编译器主动产生的

字段表

用于形容接口和类中申明的变量,包含类级别变量以及实例级别变量。

类型名称数量
u2access_flags1
u2name_index1
u2descriptor_index1
u2attributes_count1
u2attributesattributes_count

其中 access_flags 见下面拜访标记表中的字段拜访标记。

办法表

办法表蕴含拜访标记,名称索引和描述符索引,属性信息等几项。

类型名称数量
u2access_flags1
u2name_index1
u2descriptor_index1
u2attributes_count1
attribute_infoattributesattributes_count

其中办法的 access_flags 见上述的办法拜访标记。

属性表

属性表用于解释 Class 文件 中字段表,办法表中携带的属性表汇合,用于形容某些场景专有的信息。

属性名称应用地位含意
Code办法表Java 代码编译成的字节码指令
ConstantValue字段表final 关键字定义的常量值
Deprecated类,办法表,字段表final 关键字定义的常量值
Exceptions办法表final 办法抛出的异样
EnclosingMethod类文件仅当一个类为部分类或者匿名类时能力领有这个属性,这个属性用于标识这个类所在的外围办法
InnerClasses类文件外部类列表
LineNumberTableCode 属性Java 源码的行号与字节码指令的对应关系
LocalVariableTableCode 属性办法的局部变量形容
StackMapTableCode 属性JDK1.6 中新增的属性,供新的类型查看校验器(Type Checker)检查和解决指标办法的局部变量和操作数栈锁须要的类型是否匹配
Signature类,办法表,字段表JDK1.5 中新增的属性,这个属性用于反对泛型状况下的办法签名,在 java 语言中,任何类,接口,初始化办法或成员的泛型签名如果蕴含了类型变量(Type Variables)或者参数化类型(Parameterized Types),则 Signature 属性会为它记录泛型签名信息。因为 java 的泛型采纳擦除法实现,在为了类型信息被擦除后导致签名凌乱,须要这个属性记录泛型中的相干信息
SourceFile类文件记录源文件名称
SourceDebugExtension类文件JDK1.6 中新增的属性,SourceDebugExtension 属性用于存储额定的调试信息。譬如在进行 JSP 文件调试时,无奈通过 Java 堆栈来定位到 JSP 文件的行号,JSR-45 标准为这些非 Java 语言编写,却须要编译成字节码并运行在 Java 虚拟机中的程序提供了一个进行调试的规范机制,应用 SourceDebugExtension 属性就能够用于存储这个规范所新退出的调试信息
Synthetic类,办法表,字段表标识办法或者字段是否为编译器主动生成的
LocalVariableTypeTableJDK1.5 中新增的属性,它应用特色签名代替描述符,是为了引入泛型语法之后能形容泛型参数化类型而增加的
RuntimevisibleAnnotations类,办法表,字段表JDK1.5 中新增的属性,为动静注解提供反对。RuntimevisibleAnnotations 属性用于指明哪些注解是运行时(实际上运行时就是进行反射调用)可见的
RuntimeInvisibleAnnotations类,办法表,字段表JDK1.5 中新增的属性,与 RuntimevisibleAnnotations 属性作用刚好相同,用于指明哪些注解是运行时不可见的
RuntimeVisibleParameterAnnotations办法表JDK1.5 中新增的属性,作用与 RuntimevisibleAnnotations 属性相似,只不过作用对象为办法参数
RuntimeInvisibleParameterAnnotations办法表JDK1.5 中新增的属性,作用与 RuntimeInvisibleAnnotations 属性相似,只不过作用对象为办法参数
AnnotationDetault办法表JDK1.5 中新增的属性,用于记录注解类元素的默认值
BootstrapMethods类文件JDK1.5 中新增的属性,用于保留 invokedynamic 指令援用的疏导办法限定符

上述的每一个属性都须要从常量池中援用一个 CONSTANT_Utf8_info 类型常量来标示。还蕴含attribute_length(u4) 用于标示属性值所占用的位数,前面再跟着属性内容。上面为一些常见的属性子表构造。

  • Code 属性构造表,用于形容代码块
类型名称数量
u2attribute_name_index1
u4attribute_length1
u2max_stack1
u2max_locals1
u4code_length1
u1codecode_lenght
u2exception_table_lenght1
exception_infoexception_tableexception_table_length
u2attributes_count1
attribute_infoattributesattributes_count
  • 异样属性构造表,用于形容异样信息
类型名称数量
u2start_pc1
u2end_pc1
u2handler_pc1
u2catch_type1
  • Exceptions 属性构造表

区别与异样表,该表次要是列举中办法中可能抛出的受查看异样,也就是办法形容时 throws 关键字 列举的异样。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2number_of_exceptions1
u2exception_index_tablenumber_of_exceptions
  • LineNumberTable 属性构造表

用于形容 Java 源码行号与字节码行号之间的对应关系,默认宣称到 Class 文件中。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2line_number_table_length1
line_number_infoline_number_tableline_number_table_length

其中 line_number_info 蕴含 start_pcline_number 两个 u2 类型的数据项。

  • LocalVariableTable 属性构造表

用于形容栈帧中局部变量表中的变量与 Java 源码中定义的变量之间的关系,默认生成到 Class 文件 中。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2local_variable_table_lenght1
local_variable_infolocal_variable_tablelocal_variable_table_lenght

其中 local_variable_info 是代表栈帧与源码中局部变量的关联,见下表:

类型名称含意数量
u2start_pc局部变量的生命周期开始的字节码偏移量1
u2length局部变量的生命周期开始的作用范畴笼罩长度1
u2name_index指向常量池 CONSTANT_Utf8_info 索引1
u2descriptor_index指向常量池 CONSTANT_Utf8_info 索引1
u2index局部变量在栈帧局部变量表中 Slot 的地位1
  • SourceFile 属性构造表

用于记录生成这个 Class 文件 的源码文件名称。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2sourcefile_index1

其中 sourcefile_index 为指向常量池 CONSTANT_Utf8_info 索引。

  • ConstantValue 属性构造表

用于告诉虚拟机主动为动态变量赋值。只有被 static 关键字润饰的变量才能够应用这项属性。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2constant_index1
  • InnerClasses 属性构造表

用于记录外部类与宿主类之间的关联,如果一个类中定义了外部类,编译器则会为它生成外部类 InnerClasses 属性。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2number_of_classes1
inner_classes_infoinner_classesnumber_of_classes

每一个 inner_classes_info 代表一个外部类信息,构造如下:

类型名称含意数量
u2inner_class_info_index指向常量池 CONSTANT_Class_info 索引1
u2outer_class_info_index指向常量池 CONSTANT_Class_info 索引1
u2inner_name_index指向常量池 CONSTANT_Utf8_info 索引,代表这个外部类的名称,如果匿名则为 0 1
u2inner_class_access_flags外部类的拜访标记,见上述拜访标记篇章1
  • Deprecated/Synthetic 属性构造表

前者是用于标示某个类,字段或者办法是否不再举荐应用。

后者是用于标示字段或者办法不是由 Java 源码间接产生,所有由非用户代码生成的办法都须要设置 Synthetic 属性 或者 ACC_SYNTHETIC 标记,然而 init 办法clinit 办法 除外。构造如下:

类型名称数量
u2attribute_name_index1
u4attribute_length1
  • StackMapTable 属性构造表

JDK1.6 之后增加在 Class 标准中,位于 Code 属性 表中,该属性会在虚拟机类加载的字节码校验阶段被新类型查看测验器(Type Checker)应用。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2number_of_entries1
stack_map_framestack_map_frame_entriesnumber_of_entries
  • Signature 属性构造表

JDK1.5 公布之后增加到 Class 标准中,它是一个可选的定长属性,能够呈现在类,属性表,办法表构造的属性表中。该属性会记录泛型签名信息,在 Java 语言中泛型采纳的是擦除法实现的伪泛型,在字节码(Code 属性)中,泛型信息编译之后都通通被擦除掉。因为无奈像 C# 等运行时反对获取真泛型类型,增加该属性用于补救该缺点,当初 Java 反射曾经能获取到泛型类型。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2signature_index1

其中 signature_index 值必须是一个对常量池的无效索引且为 CONSTANT_Utf8_info,示意类签名,办法类型签名或字段类型签名。如果以后 Signature 属性是类文件的属性,则这个构造示意类签名,如果以后 Signature 属性是办法表的属性,则示意办法类型签名,如果以后 Signature 属性是字段表的属性,则示意字段类型签名。

  • BootstrapMethods 属性构造表

JDK1.7 公布后增加到 Class 标准中,是一个简单变长的属性,位于类文件的属性表中。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2num_bootstrap_methods1
bootstrap_methodbootstrap_methodsnum_bootstrap_methods

其中 bootstrap_method 构造如下:

类型名称数量
u2bootstrap_method_ref1
u2num_bootstrap_arguments1
u2bootstrap_argumentsnum_bootstrap_arguments

非凡字符串

所谓全限定名,就是应用 “.” 宰割类全名。比方 com/yummylau/TestClass 把类全名的 “.” 换成 “/”,变成 com.yummylau.TestClass,多个全限定名可应用多个 “;” 宰割。
而简略名称则没有类型和参数润饰的办法或者字段的名字,比方办法 inc() 和字段 m 别离标示为 inc 和 m。非凡字符串表蕴含一些根底类型的形容及办法形容。如下:

标识字符含意
B根本类型 byte
C根本类型 char
D根本类型 double
F根本类型 float
I根本类型 int
J根本类型 long
S根本类型 short
Z根本类型 boolean
V根本类型 void
L对象类型,比方 Ljava/lang/Object
  • 针对数组,每一个维度应用一个前置的 [字符来形容。比方定义一个 java.lang.String[][] 数组,被记录为 [[java.lang.String,一个整型数组 int[] 被记录为[I
  • 针对办法,应用以下描述符:
办法场景描述符
void inc()()V
java.lang.String toString()()Ljava/lang/String;
int indexOf(char[]source,int sourceOffest,int sourceCount,char[] target,int targetOffset,int targetCOunt,int formIndex)([CII[CIII)I

表格比拟多,然而个别在应用的过程中逐渐查找就能够了。

重新认识字节天书

这份字节天书,我依照上述的 class 文件构造表 字节区间法则从新进行了排版。

行从上到下一一对应 class 文件构造表 中的行。上面开始解析每行字节的含意,根本的逻辑都是索引到某个数据结构,该数据结构对应上述的某一张表格。

第 1 行 魔数,次要是用于确认这个文件是否能被虚拟机加载,CAFEBABE 其实就是 Baristas 咖啡

第 2 行 主次版本号,从 java-class 版本对应 可知示意 Java SE 10,向下兼容到 JDK1.1。

第 3 行 常量池中常量数量 ,因为从 1 开始计数,第 0 项预留用于示意“不援用任何一个常量池我的项目”,转化 16 进制之后可知常量池有 18 项常量。每一项常量都对应 常量表 的某一项,依照表中规定的每一项常量对应各自的构造。

第 4 行 第 1 项常量 ,为类中办法的符号援用,格局为 第 4 项常量. 第 15 项常量,为 java/lang/Object.< init >:()V

第 5 行 第 2 项常量 ,为字段的符号援用,格局为 第 3 项常量. 第 16 项常量,为 TestClass.m:I

第 6 行 第 3 项常量,为类或接口的符号援用,指向第 17 项常量,为 TestClass

第 7 行 第 4 项常量,为类或接口的符号援用,指向第 18 项常量,为 java/lang/Object

第 8 行 第 5 项常量,为 UTF-8 编码的字符串,长度为 1,转化失去 m

第 9 行 第 6 项常量,为 UTF-8 编码的字符串,长度为 1,转化失去 I

第 10 行 第 7 项常量,为 UTF-8 编码的字符串,长度为 6,转化失去 < init >

第 11 行 第 8 项常量,为 UTF-8 编码的字符串,长度为 3,转化失去 ()V

第 12 行 第 9 项常量,为 UTF-8 编码的字符串,长度为 4,转化失去 Code

第 13 行 第 10 项常量,为 UTF-8 编码的字符串,长度为 15,转化失去 LineNumberTable

第 14 行 第 11 项常量,为 UTF-8 编码的字符串,长度为 3,转化失去 inc

第 15 行 第 12 项常量,为 UTF-8 编码的字符串,长度为 3,转化失去 ()I

第 16 行 第 13 项常量,为 UTF-8 编码的字符串,长度为 14,转化失去 SourceFile

第 17 行 第 14 项常量,为 UTF-8 编码的字符串,长度为 10,转化失去 TestClass.java

第 18 行 第 15 项常量,为字段或办法的局部符号援用, 格局为 {第 7 项常量}:{第 8 项常量},为 < init >:()V

第 19 行 第 16 项常量,为字段或办法的局部符号援用,格局为 {第 5 项常量}:{第 6 项常量},为 m:I

第 20 行 第 17 项常量,为 UTF-8 编码的字符串,长度为 9,转化失去 TestClass

第 21 行 第 18 项常量,为 UTF-8 编码的字符串,长度为 16,转化失去 java/lang/Object

第 22 行 拜访标记 ,查看 拜访标记表 可知为 0x0021(0x0001|0x0020)表明这个是一个一般类,既不是接口,枚举也不是注解,被 public 关键字润饰但没有被申明为 finalabstract

第 23 行 类索引 ,对应 第 3 项常量,为 TestClass

第 24 行 父类索引 ,对应 第 4 项常量,为 java/lang/Object

第 25 行 实现接口的数目,0 示意没有实现任何接口

第 26 行 字段的数目,存在一个字段须要解析

第 27 行 第 1 个字段 ,查看 字段表 可知 拜访标记(0002)为 private, 名字(0005)为 m, 形容(0006)为 I, 没有属性(0000)

第 28 行 办法的数目,存在两个办法须要解析

第 29~32 行 第 1 个办法 ,查看 办法表 可知 拜访标记(0001)为 public, 名字(0007)为 < init >, 形容(0008)为 ()V, 一个属性(0001)。因为存在一个属性,持续查看 属性表 。从 30 行开始解析属性 0009 解析为 第 9 项常量 Code, 查看 属性表 -Code 属性构造表。然而发现 Code 块内局部字节难以解析。这是因为局部还须要联合 JVM 操作字节码指令才能够。这里先 mark 暂停。

第 33~36 行 第 2 个办法 ,查看 办法表 可知 拜访标记(0001)为 public, 名字(000B)为 inc, 形容(000C)为 ()I, 一个属性(0001)。也存在一个属性。从 34 行开始解析属性 0009 解析为 第 9 项常量 Code, 同上,mark 暂停。

第 37 行 属性的数目,存在一个属性

第 38 行 第 1 个属性 ,000D 解析为 第 13 项常量 sourceFile, 解析 sourceFile 属性失去 TestClass.java

通过上述的解析,咱们可失去:

到此,根本读懂了这份字节天书。然而 Code 属性内容还是缺失。这时候咱们须要一份 字节码指令总表 来帮忙咱们进一步解析 Code 外面波及哪些指令及信息。

JVM 操作指令有哪些

上面是 JVM 操作指令表

字节码助记符指令含意
0x00nop什么都不做
0x01aconst_null将 null 推送至栈顶
0x02iconst_m1将 int 型 -1 推送至栈顶
0x03iconst_0将 int 型 0 推送至栈顶
0x04iconst_1将 int 型 1 推送至栈顶
0x05iconst_2将 int 型 2 推送至栈顶
0x06iconst_3将 int 型 3 推送至栈顶
0x07iconst_4将 int 型 4 推送至栈顶
0x08iconst_5将 int 型 5 推送至栈顶
0x09lconst_0将 long 型 0 推送至栈顶
0x0alconst_1将 long 型 1 推送至栈顶
0x0bfconst_0将 float 型 0 推送至栈顶
0x0cfconst_1将 float 型 1 推送至栈顶
0x0dfconst_2将 float 型 2 推送至栈顶
0x0edconst_0将 double 型 0 推送至栈顶
0x0fdconst_1将 double 型 1 推送至栈顶
0x10bipush将单字节的常量(-128 – 127)推送至栈顶
0x11sipush将一个短整形常量常量(-32768 – 32767)推送至栈顶
0x12ldc将 int, float, String 型常量值从常量池中推送至栈顶
0x13ldc_w将 int, float, String 型常量值从常量池中推送至栈顶(宽索引)
0x14ldc2_w将 long 或 float 型常量值从常量池中推送至栈顶(宽索引)
0x15iload将指定的 int 型本地变量推送至栈顶
0x16lload将指定的 long 型本地变量推送至栈顶
0x17fload将指定的 float 型本地变量推送至栈顶
0x18dload将指定的 dload 型本地变量推送至栈顶
0x19aload将指定的援用类型本地变量推送至栈顶
0x1aiload_0将第一个 int 型本地变量推送至栈顶
0x1biload_1将第二个 int 型本地变量推送至栈顶
0x1ciload_2将第三个 int 型本地变量推送至栈顶
0x1diload_3将第四个 int 型本地变量推送至栈顶
0x1elload_0将第一个 long 型本地变量推送至栈顶
0x1flload_1将第二个 long 型本地变量推送至栈顶
0x20lload_2将第三个 long 型本地变量推送至栈顶
0x21lload_3将第四个 long 型本地变量推送至栈顶
0x22fload_0将第一个 float 型本地变量推送至栈顶
0x23fload_1将第二个 float 型本地变量推送至栈顶
0x24fload_2将第三个 float 型本地变量推送至栈顶
0x25fload_3将第四个 float 型本地变量推送至栈顶
0x26dload_0将第一个 double 型本地变量推送至栈顶
0x27dload_1将第二个 double 型本地变量推送至栈顶
0x28dload_2将第三个 double 型本地变量推送至栈顶
0x29dload_3将第四个 double 型本地变量推送至栈顶
0x2aaload_0将第一个援用类型本地变量推送至栈顶
0x2baload_1将第二个援用类型本地变量推送至栈顶
0x2caload_2将第三个援用类型本地变量推送至栈顶
0x2daload_3将第四个援用类型本地变量推送至栈顶
0x2eiaload将 int 型数组指定索引的值推送至栈顶
0x2flaload将 long 型数组指定索引的值推送至栈顶
0x30faload将 float 型数组指定索引的值推送至栈顶
0x31daload将 double 型数组指定索引的值推送至栈顶
0x32aaload将援用型数组指定索引的值推送至栈顶
0x33baload将 boolean 或 byte 型数组指定索引的值推送至栈顶
0x34caload将 char 型数组指定索引的值推送至栈顶
0x35saload将 short 型数组指定索引的值推送至栈顶
0x36istore将栈顶 int 型数值存入指定本地变量
0x37lstore将栈顶 long 型数值存入指定本地变量
0x38fstore将栈顶 float 型数值存入指定本地变量
0x39dstore将栈顶 double 型数值存入指定本地变量
0x3aastore将栈顶援用型数值存入指定本地变量
0x3bistore_0将栈顶 int 型数值存入第一个本地变量
0x3cistore_1将栈顶 int 型数值存入第二个本地变量
0x3distore_2将栈顶 int 型数值存入第三个本地变量
0x3eistore_3将栈顶 int 型数值存入第四个本地变量
0x3flstore_0将栈顶 long 型数值存入第一个本地变量
0x40lstore_1将栈顶 long 型数值存入第二个本地变量
0x41lstore_2将栈顶 long 型数值存入第三个本地变量
0x42lstore_3将栈顶 long 型数值存入第四个本地变量
0x43fstore_0将栈顶 float 型数值存入第一个本地变量
0x44fstore_1将栈顶 float 型数值存入第二个本地变量
0x45fstore_2将栈顶 float 型数值存入第三个本地变量
0x46fstore_3将栈顶 float 型数值存入第四个本地变量
0x47dstore_0将栈顶 double 型数值存入第一个本地变量
0x48dstore_1将栈顶 double 型数值存入第二个本地变量
0x49dstore_2将栈顶 double 型数值存入第三个本地变量
0x4adstore_3将栈顶 double 型数值存入第四个本地变量
0x4bastore_0将栈顶援用型数值存入第一个本地变量
0x4castore_1将栈顶援用型数值存入第二个本地变量
0x4dastore_2将栈顶援用型数值存入第三个本地变量
0x4eastore_3将栈顶援用型数值存入第四个本地变量
0x4fiastore将栈顶 int 型数值存入指定数组的指定索引地位
0x50lastore将栈顶 long 型数值存入指定数组的指定索引地位
0x51fastore将栈顶 float 型数值存入指定数组的指定索引地位
0x52dastore将栈顶 double 型数值存入指定数组的指定索引地位
0x53aastore将栈顶援用型数值存入指定数组的指定索引地位
0x54bastore将栈顶 boolean 或 byte 型数值存入指定数组的指定索引地位
0x55castore将栈顶 char 型数值存入指定数组的指定索引地位
0x56sastore将栈顶 short 型数值存入指定数组的指定索引地位
0x57pop将栈顶数值弹出(数值不能是 long 或 double 类型)
0x58pop_2将栈顶的一个(对于 long 或 double 类型)或两个数值(对于非 long 或 double 的其余类型)弹出
0x59dup复制栈顶数值并将复制值压入栈顶
0x5adup_x1复制栈顶数值并将两个复制值压入栈顶
0x5bdup_x2复制栈顶数值并将三个(或两个)复制值压入栈顶
0x5cdup_2复制栈顶一个(对于 long 或 double 类型)或两个(非 long 或 double 的其余类型)数值并将复制值压入栈顶)
0x5ddup_2_x1dup_x1 指令的双倍版本
0x5edup_2_x2dup_x2 指令的双倍版本
0x5fswap将栈最顶端的两个数值调换(数值不能是 long 或 double 类型)
0x60iadd将栈顶两 int 型数值相加并将后果压入栈顶
0x61ladd将栈顶两 long 型数值相加并将后果压入栈顶
0x62fadd将栈顶两 float 型数值相加并将后果压入栈顶
0x63dadd将栈顶两 double 型数值相加并将后果压入栈顶
0x64isub将栈顶两 int 型数值相减并将后果压入栈顶
0x65lsub将栈顶两 long 型数值相减并将后果压入栈顶
0x66fsub将栈顶两 float 型数值相减并将后果压入栈顶
0x67dsub将栈顶两 double 型数值相减并将后果压入栈顶
0x68imul将栈顶两 int 型数值相乘并将后果压入栈顶
0x69lmul将栈顶两 long 型数值相乘并将后果压入栈顶
0x6afmul将栈顶两 float 型数值相乘并将后果压入栈顶
0x6bdmul将栈顶两 double 型数值相乘并将后果压入栈顶
0x6cidiv将栈顶两 int 型数值相除并将后果压入栈顶
0x6dldiv将栈顶两 long 型数值相除并将后果压入栈顶
0x6efdiv将栈顶两 float 型数值相除并将后果压入栈顶
0x6fddiv将栈顶两 double 型数值相除并将后果压入栈顶
0x70irem将栈顶两 int 型数值作取模运算并将后果压入栈顶
0x71lrem将栈顶两 long 型数值作取模运算并将后果压入栈顶
0x72frem将栈顶两 float 型数值作取模运算并将后果压入栈顶
0x73drem将栈顶两 double 型数值作取模运算并将后果压入栈顶
0x74ineg将栈顶两 int 型数值作负并将后果压入栈顶
0x75lneg将栈顶两 long 型数值作负并将后果压入栈顶
0x76fneg将栈顶两 float 型数值作负并将后果压入栈顶
0x77dneg将栈顶两 double 型数值作负并将后果压入栈顶
0x78ishl将栈顶两 int 型数值左移位指定位数并将后果压入栈顶
0x79lshl将栈顶两 long 型数值左移位指定位数并将后果压入栈顶
0x7aishr将栈顶两 int 型数值右(带符号)移位指定位数并将后果压入栈顶
0x7blshr将栈顶两 long 型数值右(带符号)移位指定位数并将后果压入栈顶
0x7ciushr将栈顶两 int 型数值右(无符号)移位指定位数并将后果压入栈顶
0x7dlushr将栈顶两 long 型数值右(无符号)移位指定位数并将后果压入栈顶
0x7eiand将栈顶两 int 型数值作“按位与”并将后果压入栈顶
0x7fland将栈顶两 long 型数值作“按位与”并将后果压入栈顶
0x80ior将栈顶两 int 型数值作“按位或”并将后果压入栈顶
0x81lor将栈顶两 long 型数值作“按位或”并将后果压入栈顶
0x82ixor将栈顶两 int 型数值作“按位异或”并将后果压入栈顶
0x83lxor将栈顶两 long 型数值作“按位异或”并将后果压入栈顶
0x84iinc间接对 int 型变量减少指定值(如 i ++,i–,i+= 2 等)
0x85i2l将栈顶 int 型数值强制转成 long 型数值并将后果压入栈顶
0x86i2f将栈顶 int 型数值强制转成 float 型数值并将后果压入栈顶
0x87i2d将栈顶 int 型数值强制转成 double 型数值并将后果压入栈顶
0x88l2i将栈顶 long 型数值强制转成 int 型数值并将后果压入栈顶
0x89l2f将栈顶 long 型数值强制转成 float 型数值并将后果压入栈顶
0x8al2d将栈顶 long 型数值强制转成 double 型数值并将后果压入栈顶
0x8bf2i将栈顶 float 型数值强制转成 int 型数值并将后果压入栈顶
0x8cf2l将栈顶 float 型数值强制转成 long 型数值并将后果压入栈顶
0x8df2d将栈顶 float 型数值强制转成 double 型数值并将后果压入栈顶
0x8ed2i将栈顶 double 型数值强制转成 int 型数值并将后果压入栈顶
0x8fd2l将栈顶 double 型数值强制转成 long 型数值并将后果压入栈顶
0x90d2f将栈顶 double 型数值强制转成 float 型数值并将后果压入栈顶
0x91i2b将栈顶 int 型数值强制转成 byte 型数值并将后果压入栈顶
0x92i2c将栈顶 int 型数值强制转成 char 型数值并将后果压入栈顶
0x93i2s将栈顶 int 型数值强制转成 short 型数值并将后果压入栈顶
0x94lcmp比拟栈顶两 long 型数值的大小,并将后果(1,0 或 -1)压入栈顶
0x95fcmpl比拟栈顶两 float 型数值的大小,并将后果(1,0 或 -1)压入栈顶; 当其中一个数值为“NaN”时,将 -1 压入栈顶
0x96fcmpg比拟栈顶两 float 型数值的大小,并将后果(1,0 或 -1)压入栈顶; 当其中一个数值为“NaN”时,将 1 压入栈顶
0x97dcmpl比拟栈顶两 double 型数值的大小,并将后果(1,0 或 -1)压入栈顶; 当其中一个数值为“NaN”时,将 -1 压入栈顶
0x98dcmpg比拟栈顶两 double 型数值的大小,并将后果(1,0 或 -1)压入栈顶; 当其中一个数值为“NaN”时,将 1 压入栈顶
0x99ifeg当栈顶 int 型数值等于 0 时跳转
0x9aifne当栈顶 int 型数值不等于 0 时跳转
0x9biflt当栈顶 int 型数值小于 0 时跳转
0x9cifge当栈顶 int 型数值大于或等于 0 时跳转
0x9difgt当栈顶 int 型数值大于 0 时跳转
0x9eifle当栈顶 int 型数值小于或等于 0 时跳转
0x9fif_icmpeq比拟栈顶两 int 型数值的大小,当后果等于 0 时跳转
0xa0if_icmpne比拟栈顶两 int 型数值的大小,当后果不等于 0 时跳转
0xa1if_icmplt比拟栈顶两 int 型数值的大小,当后果小于 0 时跳转
0xa2if_icmpge比拟栈顶两 int 型数值的大小,当后果大于或等于 0 时跳转
0xa3if_icmpgt比拟栈顶两 int 型数值的大小,当后果大于 0 时跳转
0xa4if_icmple比拟栈顶两 int 型数值的大小,当后果小于或等于 0 时跳转
0xa5if_icmpeq比拟栈顶两援用型数值,当后果相等时跳转
0xa6if_icmpnc比拟栈顶两援用型数值,当后果不相等时跳转
0xa7goto无条件跳转
0xa8jsr跳转至指定的 16 位 offset 地位,并将 jsr 的下一条指令地址压入栈顶
0xa9ret返回至本地变量指定的 index 的指令地位(个别与 jsr 或 jsr_w 联结应用)
0xaatableswitch用于 switch 条件跳转,case 值间断(可变长度指令)
0xablookupswitch用于 switch 条件跳转,case 值连不续(可变长度指令)
0xacireturn从以后办法返回 int
0xadlreturn从以后办法返回 long
0xaefreturn从以后办法返回 float
0xafdreturn从以后办法返回 double
0xb0areturn从以后办法返回对象援用
0xb1return从以后办法返回 void
0xb2getstatic获取指定类的动态域,并将其值压入栈顶
0xb3putstatic为指定的类的动态域赋值
0xb4getfield获取指定类的实例域,并将其值压入栈顶
0xb5putfield为指定的类的实例域赋值
0xb6invokevirtual调用实例办法
0xb7invokespecial调用超类构造方法,实例初始化办法,公有办法
0xb8invokestatic调用静态方法
0xb9invokeinterface调用接口办法
0xbainvokedynamic调用动静办法
0xbbnew创立一个对象,并将其援用值压入栈顶
0xbcnewarray创立一个指定的原始类型(如 int,float 等)的数组,并将其援用值压入栈顶
0xbdanewarray创立一个援用型(如 类,接口,数组)的数组,并将其援用值压入栈顶
0xbearraylength取得数组的长度值并压入栈顶
0xbfathrow将栈顶的异样抛出
0xc0checkcast测验类型转换,测验未通过将抛出 ClassCastException
0xc1instanceof测验对象是否时指定类的实例,如果是,则将 1 压入栈顶,否则将 0 压入栈顶
0xc2monitorenter取得对象的锁,用于同步办法或同步块
0xc3monitorexit开释对象的锁,用于同步办法或同步块
0xc4wide扩大本地变量的宽度
0xc5multianewarray创立指定类型和指定维度的多维数组(执行该指令时,操作栈中必须蕴含各维度的长度值),并将其援用值压入栈顶
0xc6ifnull为 null 时跳转
0xc7ifnonnull不为 null 时跳转
0xc8goto_w无条件跳转(宽索引)
0xc9jsr_w跳转至指定的 32 位 offset 地位,并将 jsr_w 的下一条指令地址压入栈顶

上述表格内容更为具体的信息可参考 官网 JVM 指令文档,除上述表外,还须要意识一些数据类型及转化对应规定,同时再对上述指令的应用场景做一些总结划分。

数据类型在指令中的转化

数据类型byteshortintlongfloatdoublecharreference
简化转化bsilfdca

指令集反对的数据类型

上面表格中 T + 指令形成 opcode, T 为下面表格各数据类型的简化转化。

opcodebyteshortintlongfloatdoublecharreference
Tipushbipushsipush
Tconst iconstlconstfconstdconst aconst
Tload iloadlloadfloaddload aload
Tstore istorelstorefstoredstore astore
Tinc iinc
Taloadbaloadsaloadialoadlaloadfaloaddaloadcaloadaaload
Tastorebastoresastoreiastorelastorefastoredastorecastoreaastore
Tadd iaddladdfadddadd
Tsub isublsubfsubdsub
Tmul imullmulfmuldmul
Tdiv idivldivfdivddiv
Trem iremlremfremdrem
Tneg ineglnegfnegdneg
Tshl ishllshl
Tshr ishrlshr
Tushr iushrlushr
Tand iandland
Tor iorlor
Txor ixorlxor
i2Ti2bi2s i2li2fi2d
l2T l2i l2fl2d
f2T f2if2l f2d
d2T d2id2ld2f
Tcmp lcmp
Tcml fcmldcml
Tcmpg fcmpgdcmpg
if_TcmpOP if_icmpOP if_acopOP
Treturn ireturnlreturnfreturndreturn areturn

大部分指令没有反对 bytecharshort 甚至是 boolean,编译器会在编译期或运行期把这类数据扩大为 int 类型数据。

加载 / 存储指令

加载 / 存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。

  • 将一个局部变量加载到操作栈:TloadTload_n。后者示意是一组指令。
  • 将一个数值从操作数栈存储到局部变量表:TstoreTstore_n。后者示意是一组指令。
  • 将一个常量加载到操作数栈:TipushldcT_const
  • 裁减局部变量表的拜访索引指令:wide

运算指令

对操作数栈的数值进行运算之后把后果从新存入操作栈栈顶。

  • 加法指令Tadd
  • 减法指令Tsub
  • 乘法指令Tmul
  • 除法指令Tdiv
  • 求余指令Trem
  • 取反指令Tneg
  • 位移指令TshlTshrTushr
  • 按位或指令Tor
  • 按位与指令Tand
  • 按位异或指令Txor
  • 局部变量自增指令Tinc
  • 比拟指令TcmpgTcmpl

类型转化指令

类型转化指令用于将两种不同的数值类型进行互相转换,这种转换操作个别用于实现用户代码中的显式转换操作,或者用于解决字节码指令集中数据类型相干指令无奈与数据类型一一对应的问题。

  • int 类型转其余i2T
  • long 类型转其余l2T
  • float 类型转其余f2T
  • double 类型转其余d2T

对象创立与拜访指令

只管类实例和数组都是对象,但 Java 虚拟机 对类实例和数组的创立与操作应用了不同的字节码指令。

  • 创立类实例new
  • 创立数组newarrayanewarraymultianewarray
  • 拜访类变量和实例变量getfieldputfieldgetstaticputstatic
  • 把一个数组元素加载到操作数栈Taload
  • 将一个操作数栈的值存储到数组元素中Tastore
  • 取数组长度的指令arraylength
  • 查看类实例类型instanceof, checkcast

操作数栈治理指令

  • 将操作数栈栈顶一个或者两个元素出栈poppop2
  • 复制栈顶一个或两个数值并将复制值从新压入栈顶dupdup2dup_x1dup2_x1dup_x2dup2_x2
  • 将栈最顶端两个数值调换swap

管制转移指令

让虚拟机能够有条件或者无条件地从特定地位指令执行程序而不是在管制转移指令的下一条指令执行程序。

  • 条件分支ifeqifitifleifneifgtifgeifullifnonnullif_icmpeqif_icmpneif_icmpltif_icmpgtif_icmpleif_icmpgeif_acmpeqif_acmpne
  • 复合条件分支tableswitchlookupswitch`
  • 无条件分支gotogoto_wjsrjsr_wret

办法调用和返回指令

  • 调用对象的实例办法invokevirtual,依据对象的理论类型进行分派
  • 调用接口办法invokeinterface, 会在运行时搜寻一个实现了这个接口的办法的对象,找到适宜的办法进行调用
  • 调用一些须要非凡解决的实例办法invokespecial,包含实例初始化办法,公有办法和父类办法
  • 调用类办法invokestatic 用于调用 static 办法
  • 运行时动静解析处调用点限定符所援用的办法并执行该办法invokedynamic,区别于后面 4 条指令,它们都在固化在 JVM 外部,而该指令的分派逻辑是由用户所设定的疏导办法决定的。

异样解决指令

athrow 指令 用于实现显式抛出异样(throw 语句)的操作,除了用 throw 语句 之外,JVM 还规定在运行时会在其余 JVM 指令检测到异样情况的时候主动抛出。比方当除数为 0 时 JVM 会在 idivldiv中抛出ArithmeticException 异样

同步指令

JVM 的同步有一下场景,都是应用管程(Monitor)来反对

  • 办法级的同步,不须要字节码管制,实现于办法调用和返回操作志宏。从办法表中 ACC_SYNCHRONIZED 失去一个办法是否是同步,如果被设置,则执行线程须要先持有管程能力执行,执行完之后开释管程。
  • 办法外部一段指令序列的同步,由指令 monitorentermonitorexit 来反对 synchronized 实现。

咱们的 ???? 非常简单,实际上用不到这么多指令的,其余的可备份用于查问。

指令集辅助解析 Code

有了上述指令集帮忙及膝,回到天书中的第 29-36 行内容从新解析。

第 29-32 行 第 1 个办法 , 查看 办法表 可知 拜访标记(0001)为 public, 名字(0007)为 < init >, 形容(0008)为 ()V, 一个属性(0001)。因为存在一个属性,持续查看属性。从 30 行开始解析属性 0009 解析为 第 9 项常量 Code, 查看 属性表 -Code 属性构造表 及联合指令集中操作符信息,Code 属性最终的内容如下。(看到这里,你应该尝试过一遍哦 ????)

第 33-36 行 第 2 个办法 , 查看 办法表 可知 拜访标记(0001)为 public, 名字(000B)为 inc, 形容(000C)为 ()I, 一个属性(0001)。也存在一个属性。从 34 行开始解析属性 0009 解析为 第 9 项常量 Code, 内容如下。

至此,class 文件 内容根本确定可知。

为了验证咱们的思路是否正确,能够通过 javap 查看 TestClass.class 的构造来进行比照。

除了 javap 帮咱们做了格式化的工作外,也是依照咱们剖析字节码的逻辑来进行内容的输入, 感兴趣的搭档能够查看 javap 外部实现。

当你读懂 Class 文件 之后,你就能够进一步做很多工作了,比方借助 ASM 框架入侵 Gradle 构建流程注入动态代码等,更多场景等你开掘。

如果文章对您有帮忙,欢送点赞评论在看反对~

专一 Android 进阶技术分享,记录架构师横蛮成长之路

如果在 Android 畛域有遇到任何问题,包含我的项目遇到的技术问题,面试及简历形容问题,亦或对将来职业规划有纳闷,可增加我微信「Ming_Lyan」或关注公众号「Android 之禅」,会尽自所能和你探讨解决。
后续会针对“Android 畛域的必备进阶技术”,“Android 高可用架构设计及实际”,“业务中的疑难杂症及解决方案”等实用内容进行分享。
也会分享作为技术者如何在公司横蛮成长,包含技术提高,职级及支出的晋升。
欢送来撩。

正文完
 0