1. 程式人生 > >jvm位元組碼淺析

jvm位元組碼淺析

本文通過一個簡單的例子,分析jvm位元組碼的一些基本的概念。
例子:

public static void main(String args) {
		int a=2;
		int b=3;
		int c = a + b;
		System.out.println(c);
	}

將它編譯為class檔案,通過javap檢視位元組碼並輸出到Test.txt裡面:javap -verbose Test.class >>Test.txt
看到的是:

Classfile /F:/code/java/test/out/production/test/Test.class
  Last modified Nov 18, 2018; size 544 bytes
  MD5 checksum c0b35e5d4791fdaa4f540b3c11e5afc0
  Compiled from "Test.java"
public class Test
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #5.#23         // java/lang/Object."<init>":()V
   #2 = Fieldref           #24.#25        // java/lang/System.out:Ljava/io/PrintStream;
   #3 = Methodref          #26.#27        // java/io/PrintStream.println:(I)V
   #4 = Class              #28            // Test
   #5 = Class              #29            // java/lang/Object
   #6 = Utf8               <init>
   #7 = Utf8               ()V
   #8 = Utf8               Code
   #9 = Utf8               LineNumberTable
  #10 = Utf8               LocalVariableTable
  #11 = Utf8               this
  #12 = Utf8               LTest;
  #13 = Utf8               main
  #14 = Utf8               (Ljava/lang/String;)V
  #15 = Utf8               args
  #16 = Utf8               Ljava/lang/String;
  #17 = Utf8               a
  #18 = Utf8               I
  #19 = Utf8               b
  #20 = Utf8               c
  #21 = Utf8               SourceFile
  #22 = Utf8               Test.java
  #23 = NameAndType        #6:#7          // "<init>":()V
  #24 = Class              #30            // java/lang/System
  #25 = NameAndType        #31:#32        // out:Ljava/io/PrintStream;
  #26 = Class              #33            // java/io/PrintStream
  #27 = NameAndType        #34:#35        // println:(I)V
  #28 = Utf8               Test
  #29 = Utf8               java/lang/Object
  #30 = Utf8               java/lang/System
  #31 = Utf8               out
  #32 = Utf8               Ljava/io/PrintStream;
  #33 = Utf8               java/io/PrintStream
  #34 = Utf8               println
  #35 = Utf8               (I)V
{
  public Test();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 1: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   LTest;

  public static void main(java.lang.String);
    descriptor: (Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=4, args_size=1
         0: iconst_2
         1: istore_1
         2: iconst_3
         3: istore_2
         4: iload_1
         5: iload_2
         6: iadd
         7: istore_3
         8: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        11: iload_3
        12: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        15: return
      LineNumberTable:
        line 3: 0
        line 4: 2
        line 5: 4
        line 6: 8
        line 7: 15
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      16     0  args   Ljava/lang/String;
            2      14     1     a   I
            4      12     2     b   I
            8       8     3     c   I
}
SourceFile: "Test.java"

我們一步步分析這裡面的內容
Classfile類檔案的內容,接下去那些都是一些基本資訊。
然後看Constant pool,常量池。

常量池

我們經常聽說常量池,但是具體不知道是什麼,這裡就是常量池,在官方文件中,有一些對常量池的介紹:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.4
裡面定義了很多型別的常量:
在這裡插入圖片描述
我們的程式碼裡面有方法的引用:是常量1,指向常量5.常量23,這是個建構函式;
也有欄位引用Fileldref,還有類的引用Class等等,稍後我們就會使用到這些常量。
接下去看到了建構函式,建構函式我們分析完了main方法來看就很容易了,所以不分析。main方法裡面有個descriptor,包含了欄位描述和方法描述符:

欄位描述符

描述符是這個:(Ljava/lang/String;)V,這個Ljava/lang/String代表什麼意思呢?看官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.3.3。看到這裡又一個表:
在這裡插入圖片描述
L代表一個物件的引用。那麼B代表byte,C代表char,I代表Integer等,還有陣列是用[代表等等,後面我們還會看到。

方法描述符

剛剛:(Ljava/lang/String;)V這裡我們知道了Ljava/lang/String代表了String物件的引用,剩下的看方法描述符的官網:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.3.3。


在這裡插入圖片描述
我們可以知道V代表了void也就是返回空值。
接下去的flags也不需要解釋了,就是public和static。

code程式碼

接下去就是我們的code程式碼,首先我們要知道,我們的jvm的程式碼是基於棧的,不像x86系統基於暫存器的。

    Code:
      stack=2, locals=4, args_size=1
         0: iconst_2
         1: istore_1
         2: iconst_3
         3: istore_2
         4: iload_1
         5: iload_2
         6: iadd
         7: istore_3
         8: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        11: iload_3
        12: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        15: return

第一行的stack就是棧的深度2,locals就是本地變量表(下面還有講解),本地變量表的最大長度(slot為單位),64位是2,其他是1,它的索引從0開始,如果是非static方法,索引0就代表this,後面是入參,再後面是本地變數。args_size=1代表了引數有一個。
一行行解釋。如果有位元組碼指令看不懂,參考官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html

  • iconst_2就是把常量2壓入棧,i是integer型別,const就是常量。此時棧元素個數為1,本地變量表元素個數為1(因為有一個入參args)
  • istore_1,就是把棧的元素放到本地變量表。此時棧元素個數為0,本地變量表元素個數為2。int a=2;這句程式碼執行完畢。
  • iconst_3,把常量3壓入棧。此時棧元素個數為1,本地變量表元素個數為2.
  • istore_2,把棧的元素放到本地變量表。此時棧元素個數為0,本地變量表元素個數為3。int b=3;這句程式碼執行完畢。
  • iload_1,把本地表量表索引為1的數壓入棧裡面。此時棧元素個數為1,本地表量表元素個數為3.
  • iload_2,把本地表量表索引為2的數壓入棧裡面。此時棧元素個數為2,本地標量表元素個數為3.
  • iadd,把棧裡面的兩個元素出棧之後並相加,把相加的數放回到棧裡面。此時棧元素個數為1,值為5,本地表量表元素個數為3.
  • istore_3,把棧裡面的元素放到本地變量表的索引為3的位置。此時棧元素個數為0,本地表量元素個數為4。此時程式碼int c=a+b執行完畢。
  • getstatic #2,把常量池裡面第二個元素讀取出來,這是一個靜態filed:java/lang/System.out:Ljava/io/PrintStream;然後把這個filed放到棧裡面。此時棧元素個數為1,值就是放進去的filedref,本地表量元素個數為4。
  • iload_3,把本地變量表裡面索引為3的元素放到棧裡面。此時棧元素個數為2,一個是filedref,一個是值5,本地表量元素個數為4,分別為args,2,3,5。
  • invokevirtual #3 執行常量池裡面3號方法:java/io/PrintStream.println:(I)V。此時棧被清空,元素個數為0,本地變量表的個數為4。這個程式碼System.out.println©;執行完畢。
  • return 清空本地表量表並返回。此時棧元素格式為0,本地變量表元素個數為0。方法返回。

LineNumberTable

官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.7.12
沒什麼好說吧,就是程式碼的第3行對應了我們編譯出來程式碼的第0行,程式碼的第4行對應了編譯出來程式碼的第2行,以此類推。這裡也是比較清晰的。

LocalVariableTable

這個就是我們聽說很多次的本地變量表:

        Start  Length  Slot  Name   Signature
            0      16     0  args   Ljava/lang/String;
            2      14     1     a   I
            4      12     2     b   I
            8       8     3     c   I

官方文件:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.6.1。
通過code的分析,我們知道本地標量表有4個變數,所以有4行,有4個slot。由於是64位系統,每個slot大小是2,裡面的元素簽名分別是string(傳進去的引數)、Integer、Integer、Integer。
這段程式碼就簡單的分析完畢,以後我們會更加深入分析別的一些情形。