JVM指令分析实例一(常量、局部变量、for循环)
Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的操作码以及跟随其后的零至多个代表此操作所需参数的操作数所构成。虚拟机中许多指令并不包含操作数,只有一个操作码。
Java虚拟机限制操作码的长度为1个字节,因此最多只能有256个指令。
指令格式
以下指令格式,是基于Oracle JDK编译后,通过javap工具生成的指令描述格式。
<index> <opcode> [<operand1> [<operand2>...]] [<comment>]
<index>
指令操作码在方法字节码指令数组中的索引,也可以认为是相对于方法起始处的字节偏移量。其中,指令数组指方法对应的Code属性的code[]数组,该数组用于存放方法的字节码指令。
该索引可以作为控制转移指令的跳转目标。例如,goto 8指令表示跳转到索引为8的指令上继续执行。
<opcode>
指令的操作码助记符。例如,iconst_0、istore_1、iload_1和return等。
<operandN>
指令操作数,一条指令可以有0至多个操作数。例如,iconst_0没有操作数,bipush有1个操作数,iinc有2个操作数。
<comment>
指令行尾的注释。注释内容通常以//开始。
每一行中,表示运行时常量池索引的操作数前,会有一个井号。在指令后的注释中,会带有对这个操作数的描述,例如:
1: invokespecial #8 // Method java/lang/Object."<init>":()V 10: ldc2_w #19 // double 100.0d
实例分析
以下实例均使用JDK 1.8编译,并使用javap生成字节码指令清单。
代码1
void spin() { int i; for (i = 0; i < 100; i++) { ; // Loop body is empty } }
字节码指令序列
iinc用于实现局部变量的自增操作。在所有字节码指令中,只有该指令可直接用于操作局部变量。
对于非-1至5的int类型常量(对应指令iconst_N),使用bipush来将单字节常量值推至栈顶。
JVM对int类型提供了比较和跳转相结合的if指令,例如该例子中的if_icmplt指令。而对于long、float和double,则需要先通过各自的cmp比较指令计算出int类型结果,再结合int类型的if指令判断后再进行跳转。
代码2
void dspin() { double i; for (i = 0.0; i < 100.0; i++) { ; // Loop body is empty } }
字节码指令序列
其中,double类型占用局部变量的2个Slot,局部变量索引号从0开始,因此dstore_1对应的局部变量索引为1和2。
由于iinc只针对int类型进行自增操作,JVM并没有提供相应的指令来操作double类型。因此,需要借助dadd来实现double类型的自增操作。
同样,以if开头的比较跳转指令,都只用于int类型。但JVM另外提供了dcmpg、dcmpl来比较两个double类型数值的大小,然后将比较结果(1,0,-1)压入栈顶。最后,再使用int类型的if判断指令来进行判断跳转。
dcmpg与dcmpl的区别仅在于,当比较的其中一个值为NaN时,dcmpg将1压入栈顶,而dcmpl将-1压入栈顶。
ldc相关指令都是将常量值从常量池中推至栈顶。
代码3
void sspin() { short i; for (i = 0; i < 100; i++) { ; // Loop body is empty } }
字节码指令序列
short类型同样需要通过多条指令来实现i++操作,对应于索引号为5至9的指令。首先,使用iadd实现2个int类型数值相加,再使用i2s指令将int类型结果强制转换为short类型,最后使用istore_1指令将结果存回局部变量i。
对于byte、char和short类型数据,JVM并未提供像int类型一样丰富的直接操作指令。然而,由于byte、char和short类型数据都可以自动宽化转换为int类型,因此均可通过int类型的指令来操作。唯一额外的代价是要将操作结果截短至它们的有效范围内。
参考
《Java虚拟机规范》(Java SE 8版)
《深入理解Java虚拟机 JVM高级特性与最佳实践》
个人公众号
二进制之路