1. 程式人生 > 其它 >[轉]你還在為怎麼檢視位元組碼指令而擔憂嗎?

[轉]你還在為怎麼檢視位元組碼指令而擔憂嗎?

你還在為怎麼檢視位元組碼指令而擔憂嗎?https://juejin.cn/post/6844904150698819591

前言

我們平時編碼過程中,可能很少去檢視 Java 檔案編譯後的位元組碼指令。但是,不管你是因為對技術非常熱愛,喜歡刨根問底,還是想在別人面前裝X 。我認為,都非常有必要了解一下常見的位元組碼指令。這對於我們理解程式碼的執行原理也會很有幫助。

註釋會被執行嗎?

比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也讓我漲了見識了。且看程式碼,可能會讓你懷疑人生~

public class TestAnno {
    public static void main(String[] args) {
        String str = "張三";
        // \u000d str="李四";
        System.out.println(str);
    }
}
複製程式碼

可以猜一下最終列印結果是什麼。我來告訴你,結果是: “李四”。What? 這是什麼神仙操作。為何會這樣,這被註釋的程式碼還能執行?

別光顧著吃驚,我們來看一下為什麼列印結果跟我們想象中的略有偏差。

仔細檢視,發現註釋行中,有一個 \u000d 。這是一個 unicode 碼,它代表的是一個換行符。因此,在執行後,就會把 str="李四" 這行程式碼換行到下一行,從而導致了它也被編譯執行。

有的小夥伴就說了,我怎麼知道你說的是真是假呢,你這不是瞎說呢嗎,一點說服力都沒有啊。

好吧,這就需要我們看一下編譯後的位元組碼了,編譯器總不能騙我們吧。

檢視位元組碼的兩種方式

我們知道,通過 javac 命令,可以把 java 檔案編譯成 class 檔案。然後,想看它的位元組碼指令,需要用到 javap -c 反編譯一下。

但是,每次都通過命令列,還是有一些麻煩。因此,懶人福利來了。這裡我提供兩種方式,直接在 idea 中就可以檢視,非常的方便(果然,懶惰才是促使科技進步的原動力啊)。

配置 External Tools

這種方式,其實就是先配置一下,JDK 中 javap 命令的位置,然後讓 idea 幫我們自動執行 javap 命令。

找到 idea 的選單欄,File --> Settings 。然後找到 External Tools 。

點選加號,新增一個 tool ,裡邊的配置項,如下,

  • Name,就給當前 tool 起一個名字好了,用於使用時,在右鍵選單選項中展示。
  • Decriptions,描述此功能,別到時候你自己都忘了當前配置這個東西是用來幹嘛的了。
  • Program:電腦本機 javap 命令的絕對路徑。
  • Arguments:填寫 -c $FileNameWithoutExtension$.class 就可以,代表編譯的class檔案。
  • Working directory:填寫 $OutputPath$/$FileDirRelativeToSourcepath$ ,代表class檔案的工作目錄。

配置完成了,可以在idea中,直接右鍵,選擇配置中 Name 對應的選項。

此時 ,就可以打印出當前類編譯後的位元組碼指令。

我們稍後再來分析裡邊的具體含義。下邊,還有另外一種使用外掛的方式,來檢視位元組碼。而且功能更加強大。

jclasslib bytecode viewer 外掛

同上,在 idea 的 setting 選單,找到 Plugins 外掛項,然後搜尋這個外掛。

安裝之後,並重啟 idea ,就可以生效了。

使用的時候,在 View 選單,找到 show bytecode with jclasslib。

它可以檢視基本資訊,常量池,介面,屬性,方法等資訊。如下,找到我們對應的 main 方法。

這個外掛還有一個好處,就是當我們不知道某個指令是什麼意思的時候,直接滑鼠在指令上邊單擊,就可以連結到官方的解釋。如,不知道第一行 ldc 什麼意思,直接單擊 ldc 就可以跳轉到 oracle 官網對應命令的解釋。這非常有利用我們學習此命令。

常用位元組碼指令

以上兩種方式,都挺方便的,根據自己喜好自由選擇就好了。

相信你肯定也被很多位元組碼指令搞的一頭霧水過,接下來,我們就一起學習下常用的指令都有哪些吧。之後,再來看上邊的例子就輕鬆很多了。

資料型別

我們知道 Java 是強型別語言,在使用之前肯定已經確定了它的型別。而資料型別,無非就是基本資料型別和引用型別。它們對應的位元組碼,其實就是用它們的對應型別的英文首字母來表示的。(引用型別除外)

例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。

載入和儲存指令

我們知道,一個方法的執行,會在棧的棧幀中執行。方法中的變數稱為區域性變數,數的操作需要用到運算元棧。因此,載入和儲存指令,就是資料在區域性變量表和運算元棧中來回傳輸。

將一個區域性變數載入到運算元棧:如 iload、iload_ 。表示載入的是 int 型別變數。

iload_ 後邊帶數字代表第幾個 int 型變數。例如 iload_0 代表把第一個 int 型區域性變數載入到運算元棧。

其他型別變數同上: lload ,fload ,dload,aload 。

將一個數值儲存到區域性變量表: istore,istore_,lstore,lstore_,fstore,fstore_,dstore,dstore_,astore,astore_ 。

將一個常量載入到運算元棧: aconst_null,iconst_m1,iconst_,lconst_,fconst_,dconst_ ,bipush,sipush。

ldc 代表把 int、float、String型別常量從常量池中載入到運算元棧。 ldc_w 代表寬索引。

ldc2_w 代表把 long 或 double 型別常量從常量池中載入到運算元棧。(寬索引)

這裡需要說的是,int 型別根據數值的取值範圍不同,而採用不同的位元組碼指令。

iconst_m1 代表 -1 ,iconst_ 代表 05 。bipush 代表 -128127(byte取值範圍), sipush 代表 -3276832767(short取值範圍),ldc 在 int 中代表 -21474836482147483647(int取值範圍)。

public class TestByteCode {
    public static void main(String[] args) {
        int a = -1;
        int b = 0;
        int c = 1;
        int d = 2;
        int e = 3;
        int f = 4;
        int g = 5;
        int h = 127;
        int i = 32767;
        int j = 2147483647;
    }
}複製程式碼

其位元組碼為:

0 iconst_m1
 1 istore_1
 2 iconst_0
 3 istore_2
 4 iconst_1
 5 istore_3
 6 iconst_2
 7 istore 4
 9 iconst_3
10 istore 5
12 iconst_4
13 istore 6
15 iconst_5
16 istore 7
18 bipush 127
20 istore 8
22 sipush 32767
25 istore 9
27 ldc #2 <2147483647>
29 istore 10
31 return複製程式碼
訪問指令

訪問類欄位:getstatic,putstatic

訪問類例項欄位:getfield,putfield

方法呼叫和返回
  • invokevirtual : 用於呼叫物件的例項方法。
  • invokeinterfce: 用於呼叫介面方法。
  • invokespecial:用於呼叫一些特殊的方法,如父類構造方法,例項初始化方法,私有方法。
  • invokestatic:用於呼叫類的靜態方法。
  • invokedynamic:用於呼叫動態方法。

方法返回是跟返回型別相關,根據不同的返回型別,有不同的指令。

  • return:返回 void。
  • ireturn:注意,這個不止返回 int ,返回 boolean,byte,char,short 也用這個指令。其實,很多指令都沒有直接支援 byte,char,short和 boolean,而是用 int 型別代替。這是因為,虛擬機器的操作碼長度只有一個位元組,只能表示有限個數的指令。(我們這裡所提到的所有指令,都只是方便我們記憶的助記符,而在計算機內部肯定還是一個位元組,即 8 個 bit 位的二進位制)
  • lreturn:返回 long 型別。
  • freturn:返回 float 型別。
  • dreturn:返回 double 型別。
  • areturn:返回引用型別。

其餘位元組碼指令

上邊介紹的指令只是很少一部分位元組碼指令。但是,麻雀雖小,五臟俱全,也包括了最基本的變數定義,呼叫方法,和方法返回這些最基本的功能。同時,也足夠我們去解釋上邊的問題,為什麼註釋行會被執行了。

更多的位元組碼指令可以參考《深入理解Java虛擬機器》這本書的 6.4 節,和最後的附錄位元組碼指令表。需要這本書的,可以微信搜尋到我《煙雨星空》,後臺回覆“Java虛擬機器”。

由於位元組碼指令太多,比如還有運算指令,包括加減乘除、位運算,比較指令等,if 等控制指令,型別強轉指令,還有多執行緒用到的同步鎖。And so on ~

不可能把它們全部記住背會,但是,其實都是由規律可循的,很多都是見名知意,用各種英文首字母簡寫代表。比如,int型別的加法運算,就是 iadd,double 型別的減法運算是 dsub。等等。

因此,我這裡只是給了一個引子,重要的還是需要自己去尋找方法,不斷的實踐探索 ~

另外,官方文件才是最好的學習途徑:docs.oracle.com/javase/spec…

註釋行位元組碼

最後,學以致用,實踐出真知。我們一起看一下開頭丟擲的問題吧,為什麼註釋行會被執行。看一下它的位元組碼指令就知道了。

public class TestAnno {

    public static void main(String[] args) {
        String str = "張三";
        // \u000d str="李四";
        System.out.println(str);
    }
}複製程式碼
 //這裡就是從常量池中取出一個字串“張三”,然後載入到運算元棧
 0 ldc #2 <張三>
 //從運算元棧把這個字串引用儲存到區域性變量表中
 2 astore_1
 //從常量池中取出一個字串“李四”,然後載入到運算元棧
 3 ldc #3 <李四>
 //可以發現和上邊一樣都是astore_1,說明指向的是同一個引用 str。
 //若定義另外一個str2賦值給“李四”,這個操作指令肯定就不同了。
 5 astore_1
 //訪問的是System類的靜態屬性out,我們知道它的型別是PrintStream
 6 getstatic #4 <java/lang/System.out>
 //將out這個引用載入到運算元棧棧頂,以便後邊操作它
 9 aload_1
 //呼叫out的例項方法 println ,用於列印結果到控制檯
10 invokevirtual #5 <java/io/PrintStream.println>
//main方法返回值為void
13 return複製程式碼

這裡就不用再多餘解釋了吧,可以從位元組碼指令中看到,後邊的 str="李四" 被編譯器執行了。

如果本文對你有用,就趕快關注我,給我點贊吧~