jvm位元組碼淺析
本文通過一個簡單的例子,分析jvm位元組碼的一些基本的概念。
例子:
public static void main(String args) {
int a=2;
int b=3;
int c = a + b;
System.out.println(c);
}
將它編譯為class檔案,通過javap檢視位元組碼並輸出到Test.txt裡面:javap -verbose Test.class >>Test.txt
看到的是:
Classfile /F:/code/java/test/out/production/test/Test.class Last modified Nov 18, 2018; size 544 bytes MD5 checksum c0b35e5d4791fdaa4f540b3c11e5afc0 Compiled from "Test.java" public class Test minor version: 0 major version: 52 flags: ACC_PUBLIC, ACC_SUPER Constant pool: #1 = Methodref #5.#23 // java/lang/Object."<init>":()V #2 = Fieldref #24.#25 // java/lang/System.out:Ljava/io/PrintStream; #3 = Methodref #26.#27 // java/io/PrintStream.println:(I)V #4 = Class #28 // Test #5 = Class #29 // java/lang/Object #6 = Utf8 <init> #7 = Utf8 ()V #8 = Utf8 Code #9 = Utf8 LineNumberTable #10 = Utf8 LocalVariableTable #11 = Utf8 this #12 = Utf8 LTest; #13 = Utf8 main #14 = Utf8 (Ljava/lang/String;)V #15 = Utf8 args #16 = Utf8 Ljava/lang/String; #17 = Utf8 a #18 = Utf8 I #19 = Utf8 b #20 = Utf8 c #21 = Utf8 SourceFile #22 = Utf8 Test.java #23 = NameAndType #6:#7 // "<init>":()V #24 = Class #30 // java/lang/System #25 = NameAndType #31:#32 // out:Ljava/io/PrintStream; #26 = Class #33 // java/io/PrintStream #27 = NameAndType #34:#35 // println:(I)V #28 = Utf8 Test #29 = Utf8 java/lang/Object #30 = Utf8 java/lang/System #31 = Utf8 out #32 = Utf8 Ljava/io/PrintStream; #33 = Utf8 java/io/PrintStream #34 = Utf8 println #35 = Utf8 (I)V { public Test(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 1: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this LTest; public static void main(java.lang.String); descriptor: (Ljava/lang/String;)V flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=4, args_size=1 0: iconst_2 1: istore_1 2: iconst_3 3: istore_2 4: iload_1 5: iload_2 6: iadd 7: istore_3 8: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream; 11: iload_3 12: invokevirtual #3 // Method java/io/PrintStream.println:(I)V 15: return LineNumberTable: line 3: 0 line 4: 2 line 5: 4 line 6: 8 line 7: 15 LocalVariableTable: Start Length Slot Name Signature 0 16 0 args Ljava/lang/String; 2 14 1 a I 4 12 2 b I 8 8 3 c I } SourceFile: "Test.java"
我們一步步分析這裡面的內容
Classfile類檔案的內容,接下去那些都是一些基本資訊。
然後看Constant pool,常量池。
常量池
我們經常聽說常量池,但是具體不知道是什麼,這裡就是常量池,在官方文件中,有一些對常量池的介紹:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.4
裡面定義了很多型別的常量:
我們的程式碼裡面有方法的引用:是常量1,指向常量5.常量23,這是個建構函式;
也有欄位引用Fileldref,還有類的引用Class等等,稍後我們就會使用到這些常量。
接下去看到了建構函式,建構函式我們分析完了main方法來看就很容易了,所以不分析。main方法裡面有個descriptor,包含了欄位描述和方法描述符:
欄位描述符
描述符是這個:(Ljava/lang/String;)V,這個Ljava/lang/String代表什麼意思呢?看官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.3.3。看到這裡又一個表:
L代表一個物件的引用。那麼B代表byte,C代表char,I代表Integer等,還有陣列是用[代表等等,後面我們還會看到。
方法描述符
剛剛:(Ljava/lang/String;)V這裡我們知道了Ljava/lang/String代表了String物件的引用,剩下的看方法描述符的官網:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.3.3。
我們可以知道V代表了void也就是返回空值。
接下去的flags也不需要解釋了,就是public和static。
code程式碼
接下去就是我們的code程式碼,首先我們要知道,我們的jvm的程式碼是基於棧的,不像x86系統基於暫存器的。
Code:
stack=2, locals=4, args_size=1
0: iconst_2
1: istore_1
2: iconst_3
3: istore_2
4: iload_1
5: iload_2
6: iadd
7: istore_3
8: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
11: iload_3
12: invokevirtual #3 // Method java/io/PrintStream.println:(I)V
15: return
第一行的stack就是棧的深度2,locals就是本地變量表(下面還有講解),本地變量表的最大長度(slot為單位),64位是2,其他是1,它的索引從0開始,如果是非static方法,索引0就代表this,後面是入參,再後面是本地變數。args_size=1代表了引數有一個。
一行行解釋。如果有位元組碼指令看不懂,參考官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html
- iconst_2就是把常量2壓入棧,i是integer型別,const就是常量。此時棧元素個數為1,本地變量表元素個數為1(因為有一個入參args)
- istore_1,就是把棧的元素放到本地變量表。此時棧元素個數為0,本地變量表元素個數為2。int a=2;這句程式碼執行完畢。
- iconst_3,把常量3壓入棧。此時棧元素個數為1,本地變量表元素個數為2.
- istore_2,把棧的元素放到本地變量表。此時棧元素個數為0,本地變量表元素個數為3。int b=3;這句程式碼執行完畢。
- iload_1,把本地表量表索引為1的數壓入棧裡面。此時棧元素個數為1,本地表量表元素個數為3.
- iload_2,把本地表量表索引為2的數壓入棧裡面。此時棧元素個數為2,本地標量表元素個數為3.
- iadd,把棧裡面的兩個元素出棧之後並相加,把相加的數放回到棧裡面。此時棧元素個數為1,值為5,本地表量表元素個數為3.
- istore_3,把棧裡面的元素放到本地變量表的索引為3的位置。此時棧元素個數為0,本地表量元素個數為4。此時程式碼int c=a+b執行完畢。
- getstatic #2,把常量池裡面第二個元素讀取出來,這是一個靜態filed:java/lang/System.out:Ljava/io/PrintStream;然後把這個filed放到棧裡面。此時棧元素個數為1,值就是放進去的filedref,本地表量元素個數為4。
- iload_3,把本地變量表裡面索引為3的元素放到棧裡面。此時棧元素個數為2,一個是filedref,一個是值5,本地表量元素個數為4,分別為args,2,3,5。
- invokevirtual #3 執行常量池裡面3號方法:java/io/PrintStream.println:(I)V。此時棧被清空,元素個數為0,本地變量表的個數為4。這個程式碼System.out.println©;執行完畢。
- return 清空本地表量表並返回。此時棧元素格式為0,本地變量表元素個數為0。方法返回。
LineNumberTable
官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.7.12
沒什麼好說吧,就是程式碼的第3行對應了我們編譯出來程式碼的第0行,程式碼的第4行對應了編譯出來程式碼的第2行,以此類推。這裡也是比較清晰的。
LocalVariableTable
這個就是我們聽說很多次的本地變量表:
Start Length Slot Name Signature
0 16 0 args Ljava/lang/String;
2 14 1 a I
4 12 2 b I
8 8 3 c I
官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.6.1。
通過code的分析,我們知道本地標量表有4個變數,所以有4行,有4個slot。由於是64位系統,每個slot大小是2,裡面的元素簽名分別是string(傳進去的引數)、Integer、Integer、Integer。
這段程式碼就簡單的分析完畢,以後我們會更加深入分析別的一些情形。