[轉]你還在為怎麼檢視位元組碼指令而擔憂嗎?
你還在為怎麼檢視位元組碼指令而擔憂嗎?https://juejin.cn/post/6844904150698819591
前言
我們平時編碼過程中,可能很少去檢視 Java 檔案編譯後的位元組碼指令。但是,不管你是因為對技術非常熱愛,喜歡刨根問底,還是想在別人面前裝X 。我認為,都非常有必要了解一下常見的位元組碼指令。這對於我們理解程式碼的執行原理也會很有幫助。
註釋會被執行嗎?
比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也讓我漲了見識了。且看程式碼,可能會讓你懷疑人生~
public class TestAnno { public static void main(String[] args) { String str = "張三"; // \u000d str="李四"; System.out.println(str); } } 複製程式碼
可以猜一下最終列印結果是什麼。我來告訴你,結果是: “李四”。What? 這是什麼神仙操作。為何會這樣,這被註釋的程式碼還能執行?
別光顧著吃驚,我們來看一下為什麼列印結果跟我們想象中的略有偏差。
仔細檢視,發現註釋行中,有一個 \u000d 。這是一個 unicode 碼,它代表的是一個換行符。因此,在執行後,就會把 str="李四"
這行程式碼換行到下一行,從而導致了它也被編譯執行。
有的小夥伴就說了,我怎麼知道你說的是真是假呢,你這不是瞎說呢嗎,一點說服力都沒有啊。
好吧,這就需要我們看一下編譯後的位元組碼了,編譯器總不能騙我們吧。
檢視位元組碼的兩種方式
我們知道,通過 javac 命令,可以把 java 檔案編譯成 class 檔案。然後,想看它的位元組碼指令,需要用到 javap -c 反編譯一下。
但是,每次都通過命令列,還是有一些麻煩。因此,懶人福利來了。這裡我提供兩種方式,直接在 idea 中就可以檢視,非常的方便(果然,懶惰才是促使科技進步的原動力啊)。
配置 External Tools
這種方式,其實就是先配置一下,JDK 中 javap 命令的位置,然後讓 idea 幫我們自動執行 javap 命令。
找到 idea 的選單欄,File --> Settings 。然後找到 External Tools 。
點選加號,新增一個 tool ,裡邊的配置項,如下,
- Name,就給當前 tool 起一個名字好了,用於使用時,在右鍵選單選項中展示。
- Decriptions,描述此功能,別到時候你自己都忘了當前配置這個東西是用來幹嘛的了。
- Program:電腦本機 javap 命令的絕對路徑。
- Arguments:填寫 -c $FileNameWithoutExtension$.class 就可以,代表編譯的class檔案。
- Working directory:填寫 $OutputPath$/$FileDirRelativeToSourcepath$ ,代表class檔案的工作目錄。
配置完成了,可以在idea中,直接右鍵,選擇配置中 Name 對應的選項。
此時 ,就可以打印出當前類編譯後的位元組碼指令。
我們稍後再來分析裡邊的具體含義。下邊,還有另外一種使用外掛的方式,來檢視位元組碼。而且功能更加強大。
jclasslib bytecode viewer 外掛
同上,在 idea 的 setting 選單,找到 Plugins 外掛項,然後搜尋這個外掛。
安裝之後,並重啟 idea ,就可以生效了。
使用的時候,在 View 選單,找到 show bytecode with jclasslib。
它可以檢視基本資訊,常量池,介面,屬性,方法等資訊。如下,找到我們對應的 main 方法。
這個外掛還有一個好處,就是當我們不知道某個指令是什麼意思的時候,直接滑鼠在指令上邊單擊,就可以連結到官方的解釋。如,不知道第一行 ldc 什麼意思,直接單擊 ldc 就可以跳轉到 oracle 官網對應命令的解釋。這非常有利用我們學習此命令。
常用位元組碼指令
以上兩種方式,都挺方便的,根據自己喜好自由選擇就好了。
相信你肯定也被很多位元組碼指令搞的一頭霧水過,接下來,我們就一起學習下常用的指令都有哪些吧。之後,再來看上邊的例子就輕鬆很多了。
資料型別
我們知道 Java 是強型別語言,在使用之前肯定已經確定了它的型別。而資料型別,無非就是基本資料型別和引用型別。它們對應的位元組碼,其實就是用它們的對應型別的英文首字母來表示的。(引用型別除外)
例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。
載入和儲存指令
我們知道,一個方法的執行,會在棧的棧幀中執行。方法中的變數稱為區域性變數,數的操作需要用到運算元棧。因此,載入和儲存指令,就是資料在區域性變量表和運算元棧中來回傳輸。
將一個區域性變數載入到運算元棧:如 iload、iload_ 。表示載入的是 int 型別變數。
iload_ 後邊帶數字代表第幾個 int 型變數。例如 iload_0 代表把第一個 int 型區域性變數載入到運算元棧。
其他型別變數同上: lload ,fload ,dload,aload 。
將一個數值儲存到區域性變量表: istore,istore_,lstore,lstore_,fstore,fstore_,dstore,dstore_,astore,astore_ 。
將一個常量載入到運算元棧: aconst_null,iconst_m1,iconst_,lconst_,fconst_,dconst_ ,bipush,sipush。
ldc 代表把 int、float、String型別常量從常量池中載入到運算元棧。 ldc_w 代表寬索引。
ldc2_w 代表把 long 或 double 型別常量從常量池中載入到運算元棧。(寬索引)
這裡需要說的是,int 型別根據數值的取值範圍不同,而採用不同的位元組碼指令。
iconst_m1 代表 -1 ,iconst_ 代表 05 。bipush 代表 -128127(byte取值範圍), sipush 代表 -3276832767(short取值範圍),ldc 在 int 中代表 -21474836482147483647(int取值範圍)。
public class TestByteCode {
public static void main(String[] args) {
int a = -1;
int b = 0;
int c = 1;
int d = 2;
int e = 3;
int f = 4;
int g = 5;
int h = 127;
int i = 32767;
int j = 2147483647;
}
}複製程式碼
其位元組碼為:
0 iconst_m1
1 istore_1
2 iconst_0
3 istore_2
4 iconst_1
5 istore_3
6 iconst_2
7 istore 4
9 iconst_3
10 istore 5
12 iconst_4
13 istore 6
15 iconst_5
16 istore 7
18 bipush 127
20 istore 8
22 sipush 32767
25 istore 9
27 ldc #2 <2147483647>
29 istore 10
31 return複製程式碼
訪問指令
訪問類欄位:getstatic,putstatic
訪問類例項欄位:getfield,putfield
方法呼叫和返回
- invokevirtual : 用於呼叫物件的例項方法。
- invokeinterfce: 用於呼叫介面方法。
- invokespecial:用於呼叫一些特殊的方法,如父類構造方法,例項初始化方法,私有方法。
- invokestatic:用於呼叫類的靜態方法。
- invokedynamic:用於呼叫動態方法。
方法返回是跟返回型別相關,根據不同的返回型別,有不同的指令。
- return:返回 void。
- ireturn:注意,這個不止返回 int ,返回 boolean,byte,char,short 也用這個指令。其實,很多指令都沒有直接支援 byte,char,short和 boolean,而是用 int 型別代替。這是因為,虛擬機器的操作碼長度只有一個位元組,只能表示有限個數的指令。(我們這裡所提到的所有指令,都只是方便我們記憶的助記符,而在計算機內部肯定還是一個位元組,即 8 個 bit 位的二進位制)
- lreturn:返回 long 型別。
- freturn:返回 float 型別。
- dreturn:返回 double 型別。
- areturn:返回引用型別。
其餘位元組碼指令
上邊介紹的指令只是很少一部分位元組碼指令。但是,麻雀雖小,五臟俱全,也包括了最基本的變數定義,呼叫方法,和方法返回這些最基本的功能。同時,也足夠我們去解釋上邊的問題,為什麼註釋行會被執行了。
更多的位元組碼指令可以參考《深入理解Java虛擬機器》這本書的 6.4 節,和最後的附錄位元組碼指令表。需要這本書的,可以微信搜尋到我《煙雨星空》,後臺回覆“Java虛擬機器”。
由於位元組碼指令太多,比如還有運算指令,包括加減乘除、位運算,比較指令等,if 等控制指令,型別強轉指令,還有多執行緒用到的同步鎖。And so on ~
不可能把它們全部記住背會,但是,其實都是由規律可循的,很多都是見名知意,用各種英文首字母簡寫代表。比如,int型別的加法運算,就是 iadd,double 型別的減法運算是 dsub。等等。
因此,我這裡只是給了一個引子,重要的還是需要自己去尋找方法,不斷的實踐探索 ~
另外,官方文件才是最好的學習途徑:docs.oracle.com/javase/spec…
註釋行位元組碼
最後,學以致用,實踐出真知。我們一起看一下開頭丟擲的問題吧,為什麼註釋行會被執行。看一下它的位元組碼指令就知道了。
public class TestAnno {
public static void main(String[] args) {
String str = "張三";
// \u000d str="李四";
System.out.println(str);
}
}複製程式碼
//這裡就是從常量池中取出一個字串“張三”,然後載入到運算元棧
0 ldc #2 <張三>
//從運算元棧把這個字串引用儲存到區域性變量表中
2 astore_1
//從常量池中取出一個字串“李四”,然後載入到運算元棧
3 ldc #3 <李四>
//可以發現和上邊一樣都是astore_1,說明指向的是同一個引用 str。
//若定義另外一個str2賦值給“李四”,這個操作指令肯定就不同了。
5 astore_1
//訪問的是System類的靜態屬性out,我們知道它的型別是PrintStream
6 getstatic #4 <java/lang/System.out>
//將out這個引用載入到運算元棧棧頂,以便後邊操作它
9 aload_1
//呼叫out的例項方法 println ,用於列印結果到控制檯
10 invokevirtual #5 <java/io/PrintStream.println>
//main方法返回值為void
13 return複製程式碼
這裡就不用再多餘解釋了吧,可以從位元組碼指令中看到,後邊的 str="李四"
被編譯器執行了。
如果本文對你有用,就趕快關注我,給我點贊吧~