编译

咱们都晓得,当咱们编写完代码后,能够用javac命令或者开发工具,比方eclipse、idea等,把java文件编译成class文件,java虚拟机才能够执行。下图是WinHex关上class文件16进制的字节码。

每个class文件的后面四个字节成为魔数,它的惟一作用就是确定这个文件是否能被虚拟机承受的文件,这个魔数值为0xCSAFEBABE(咖啡宝贝)。第5、6字节是次版本号,第7、8字节是主版本号。从上图能够看到,我的主版本号是16进制的34,也就是10进制的52,52对应的JDK版本是1.8。
前面的16进制在这里不做过多的解说,能够依据Java虚拟机标准的约定,以无符号数和表两种数据类型进行解析。
java文件编译成class文件的时候,先依据词法和语法分析取得了程序代码的形象语法树示意,填充符号表,而后依据语义剖析看程序是否合乎逻辑,比方变量在应用前是否曾经申明,变量是否正确赋值等,最初就是把后面步骤生成的信息(比方语法树),转换成字节码写到磁盘中,当然编译器还做了大量的代码增加(程序中没有构造函数,会增加无参构造函数的操作是在填充符号表实现的,不是这里实现)和转换工作。

编译优化

常量折叠

请看上面的例子:

public class HelloWord {     public static void main(String[] args) {           System.out.println("Hello," + " World");     }}

如果我把下面的代码,改成这样的,那么我在运行期的时候,会减轻虚拟机的累赘吗?答案是否定的。编译器除了查看外,还对常量进行了折叠,也就是说,下面的Hello World会在编译的时候主动拼接,如果是int型的,比方i = 1 + 2,等价于 i = 3,并不会减少程序在运行期哪怕一个CPU指令的运算量。
咱们看看上面这个,如果是str += “c”呢,会不会折叠呢?

public void fun() {    String str = "a" + "b";    str += "c";    System.out.println(str);}

咱们从下图的ASTView能够看出,标记1和标记2是不一样的类型,一个是变量赋值,第二个是表达式,在标记3能够看到,变量赋值的时候,主动把a和b拼接起来。

泛型的擦除

看上面的例子:

public static void main(String[] args) {    List<String> list1 = new ArrayList<>();    List<Map<String, Integer>> list2 = new ArrayList<>();    System.out.println(list1);    System.out.println(list2);}

反编译后,如下,竟然泛型还在,其实这个出乎我的意料之外,两年前给公司分享虚拟机的时候,我的ppt里还记录着泛型的擦除的案例,反编译后的确的没有泛型的。

  public static void main(String[] args) {    List<String> list1 = new ArrayList<String>();    List<Map<String, Integer>> list2 = new ArrayList<Map<String, Integer>>();    System.out.println(list1);    System.out.println(list2);  }

于是我又换了另外一个反编译器,反编译如下,这次的确没有泛型信息。

  public static void main(String[] args)  {    List list1 = new ArrayList();    List list2 = new ArrayList();    System.out.println(list1);    System.out.println(list2);  }

用java自带的命令javap -verbose进行反编译,后果如下,能够看到泛型信息在只有调试用的LocalVariableTypeTable(LVTT)里,某些反编译器应该依据LVTT来展现泛型信息。

LocalVariableTable:Start  Length  Slot  Name   Signature    0      31     0  args   [Ljava/lang/String;    8      23     1 list1   Ljava/util/List;   16      15     2 list2   Ljava/util/List;LocalVariableTypeTable:Start  Length  Slot  Name   Signature    8      23     1 list1   Ljava/util/List<Ljava/lang/String;>;   16      15     2 list2   Ljava/util/List<Ljava/util/Map<Ljava/lang/String;Ljava/lang/Integer;>;>;

因为泛型在编译期就会被擦除,所以以下的重载,是编译不过来的,因为擦除后,他们其实

public static String fun(List<String> list) {    return null;}public static Integer fun(List<Integer> list) {    return null;}

主动装箱、拆箱与循环遍历

这部分代码包含主动装箱、拆箱与循环遍历。

public void fun() {    List<Integer> list = Arrays.asList(1, 2, 3, 4);    int sum = 0;    for (int i : list) {        sum += i;    }    System.out.println(sum);}

反编译后如下,首先把int装箱变成Integer,而后计算的时候,再从Integer装配变成int。另外一个就是把for编译成Iterator迭代器。

  public void fun()  {    List list = Arrays.asList(new Integer[] { Integer.valueOf(1), Integer.valueOf(2), Integer.valueOf(3), Integer.valueOf(4) });    int sum = 0;    for (Iterator localIterator = list.iterator(); localIterator.hasNext(); ) { int i = ((Integer)localIterator.next()).intValue();      sum += i;    }    System.out.println(sum);  }

另外看看上面的例子

public static void main(String[] args) {    Integer a = 1;    Integer b = 2;    Integer c = 3;    Integer d = 4;    Integer e = 321;    Integer f = 321;    Long g = 3L;    System.out.println(c == d);    System.out.println(e == f);    System.out.println(c == (a + b));    System.out.println(c.equals(a + b));    System.out.println(g == (a + b));    System.out.println(g.equals(a + b));}

反编译后

  public static void main(String[] args)  {    Integer a = Integer.valueOf(1);    Integer b = Integer.valueOf(2);    Integer c = Integer.valueOf(3);    Integer d = Integer.valueOf(4);    Integer e = Integer.valueOf(321);    Integer f = Integer.valueOf(321);    Long g = Long.valueOf(3L);    //为false,Integer对象,比拟地址,两个地址不一样    System.out.println(c == d);    //为false,因为两个地址不一样    System.out.println(e == f);    //为true,都变成int,比拟值    System.out.println(c.intValue() == a.intValue() + b.intValue());   //为true,equals办法比拟int System.out.println(c.equals(Integer.valueOf(a.intValue() + b.intValue())));   //为true,比拟值    System.out.println(g.longValue() == a.intValue() + b.intValue());    //为false,类型不一样    System.out.println(g.equals(Integer.valueOf(a.intValue() + b.intValue())));  }

条件编译

上面这个包含没有应用的变量a,if语句判断,while语句。

public static void main(String[] args) {    int a;    if(true){        System.out.println("Hello");    }else{        System.out.println("World");    }   /* while(false){        // Unreachable statement        System.out.println("while");    }*/}

反编译后,没有应用的变量a并没有被编译,Dead code,也就是为false的局部也没有被编译,另外while那个,因为恒为false,编译器报Unreachable statement。

  public static void main(String[] args)  {    System.out.println("Hello");  }