你還在為怎麼檢視位元組碼指令而擔憂嗎?
阿新 • • 發佈:2020-05-08
## 前言
我們平時編碼過程中,可能很少去檢視 Java 檔案編譯後的位元組碼指令。但是,不管你是因為對技術非常熱愛,喜歡刨根問底,還是想在別人面前裝X 。我認為,都非常有必要了解一下常見的位元組碼指令。這對於我們理解程式碼的執行原理也會很有幫助。
## 註釋會被執行嗎?
比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也讓我漲了見識了。且看程式碼,可能會讓你懷疑人生~
```java
public class TestAnno {
public static void main(String[] args) {
String str = "張三";
// \u000d str="李四";
System.out.println(str);
}
}
```
可以猜一下最終列印結果是什麼。我來告訴你,結果是: “李四”。What? 這是什麼神仙操作。為何會這樣,這被註釋的程式碼還能執行?
別光顧著吃驚,我們來看一下為什麼列印結果跟我們想象中的略有偏差。
仔細檢視,發現註釋行中,有一個 \u000d 。這是一個 unicode 碼,它代表的是一個換行符。因此,在執行後,就會把 ` str="李四" ` 這行程式碼換行到下一行,從而導致了它也被編譯執行。
有的小夥伴就說了,我怎麼知道你說的是真是假呢,你這不是瞎說呢嗎,一點說服力都沒有啊。
好吧,這就需要我們看一下編譯後的位元組碼了,編譯器總不能騙我們吧。
## 檢視位元組碼的兩種方式
我們知道,通過 javac 命令,可以把 java 檔案編譯成 class 檔案。然後,想看它的位元組碼指令,需要用到 javap -c 反編譯一下。
但是,每次都通過命令列,還是有一些麻煩。因此,懶人福利來了。這裡我提供兩種方式,直接在 idea 中就可以檢視,非常的方便(果然,懶惰才是促使科技進步的原動力啊)。
### 配置 External Tools
這種方式,其實就是先配置一下,JDK 中 javap 命令的位置,然後讓 idea 幫我們自動執行 javap 命令。
找到 idea 的選單欄,File --> Settings 。然後找到 External Tools 。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095455940-2013311215.jpg)
點選加號,新增一個 tool ,裡邊的配置項,如下,
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095456198-1325913814.jpg)
* Name,就給當前 tool 起一個名字好了,用於使用時,在右鍵選單選項中展示。
* Decriptions,描述此功能,別到時候你自己都忘了當前配置這個東西是用來幹嘛的了。
* Program:電腦本機 javap 命令的絕對路徑。
* Arguments:填寫 -c \$FileNameWithoutExtension\$.class 就可以,代表編譯的class檔案。
* Working directory:填寫 \$OutputPath\$/\$FileDirRelativeToSourcepath\$ ,代表class檔案的工作目錄。
配置完成了,可以在idea中,直接右鍵,選擇配置中 Name 對應的選項。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095456452-1188476716.jpg)
此時 ,就可以打印出當前類編譯後的位元組碼指令。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095456729-1624802025.jpg)
我們稍後再來分析裡邊的具體含義。下邊,還有另外一種使用外掛的方式,來檢視位元組碼。而且功能更加強大。
### jclasslib bytecode viewer 外掛
同上,在 idea 的 setting 選單,找到 Plugins 外掛項,然後搜尋這個外掛。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457019-1083129596.jpg)
安裝之後,並重啟 idea ,就可以生效了。
使用的時候,在 View 選單,找到 show bytecode with jclasslib。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457479-423012352.jpg)
它可以檢視基本資訊,常量池,介面,屬性,方法等資訊。如下,找到我們對應的 main 方法。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457751-456029105.jpg)
這個外掛還有一個好處,就是當我們不知道某個指令是什麼意思的時候,直接滑鼠在指令上邊單擊,就可以連結到官方的解釋。如,不知道第一行 ldc 什麼意思,直接單擊 ldc 就可以跳轉到 oracle 官網對應命令的解釋。這非常有利用我們學習此命令。
![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457983-939040830.jpg)
## 常用位元組碼指令
以上兩種方式,都挺方便的,根據自己喜好自由選擇就好了。
相信你肯定也被很多位元組碼指令搞的一頭霧水過,接下來,我們就一起學習下常用的指令都有哪些吧。之後,再來看上邊的例子就輕鬆很多了。
### 資料型別
我們知道 Java 是強型別語言,在使用之前肯定已經確定了它的型別。而資料型別,無非就是基本資料型別和引用型別。它們對應的位元組碼,其實就是用它們的對應型別的英文首字母來表示的。(引用型別除外)
例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。
### 載入和儲存指令
我們知道,一個方法的執行,會在棧的棧幀中執行。方法中的變數稱為區域性變數,數的操作需要用到運算元棧。因此,載入和儲存指令,就是資料在區域性變量表和運算元棧中來回傳輸。
將一個區域性變數載入到運算元棧:如 iload、iload\_ 。表示載入的是 int 型別變數。
iload\_ 後邊帶數字代表第幾個 int 型變數。例如 iload\_0 代表把第一個 int 型區域性變數載入到運算元棧。
其他型別變數同上: lload ,fload ,dload,aload 。
將一個數值儲存到區域性變量表: istore,istore\_,lstore,lstore\_,fstore,fstore\_,dstore,dstore\_,astore,astore\_ 。
將一個常量載入到運算元棧: aconst_null,iconst\_m1,iconst\_,lconst\_,fconst\_,dconst\_ ,bipush,sipush。
ldc 代表把 int、float、String型別常量從常量池中載入到運算元棧。 ldc_w 代表寬索引。
ldc2_w 代表把 long 或 double 型別常量從常量池中載入到運算元棧。(寬索引)
這裡需要說的是,int 型別根據數值的取值範圍不同,而採用不同的位元組碼指令。
iconst\_m1 代表 -1 ,iconst\_ 代表 0~5 。bipush 代表 -128~127(byte取值範圍), sipush 代表 -32768~32767(short取值範圍),ldc 在 int 中代表 -2147483648~2147483647(int取值範圍)。
```java
public class TestByteCode {
public static void main(String[] args) {
int a = -1;
int b = 0;
int c = 1;
int d = 2;
int e = 3;
int f = 4;
int g = 5;
int h = 127;
int i = 32767;
int j = 2147483647;
}
}
```
其位元組碼為:
```
0 iconst_m1
1 istore_1
2 iconst_0
3 istore_2
4 iconst_1
5 istore_3
6 iconst_2
7 istore 4
9 iconst_3
10 istore 5
12 iconst_4
13 istore 6
15 iconst_5
16 istore 7
18 bipush 127
20 istore 8
22 sipush 32767
25 istore 9
27 ldc #2 <2147483647>
29 istore 10
31 return
```
### 訪問指令
訪問類欄位:getstatic,putstatic
訪問類例項欄位:getfield,putfield
### 方法呼叫和返回
* invokevirtual : 用於呼叫物件的例項方法。
* invokeinterfce: 用於呼叫介面方法。
* invokespecial:用於呼叫一些特殊的方法,如父類構造方法,例項初始化方法,私有方法。
* invokestatic:用於呼叫類的靜態方法。
* invokedynamic:用於呼叫動態方法。
方法返回是跟返回型別相關,根據不同的返回型別,有不同的指令。
* return:返回 void。
* ireturn:注意,這個不止返回 int ,返回 boolean,byte,char,short 也用這個指令。其實,很多指令都沒有直接支援 byte,char,short和 boolean,而是用 int 型別代替。這是因為,虛擬機器的操作碼長度只有一個位元組,只能表示有限個數的指令。(我們這裡所提到的所有指令,都只是方便我們記憶的助記符,而在計算機內部肯定還是一個位元組,即 8 個 bit 位的二進位制)
* lreturn:返回 long 型別。
* freturn:返回 float 型別。
* dreturn:返回 double 型別。
* areturn:返回引用型別。
## 其餘位元組碼指令
上邊介紹的指令只是很少一部分位元組碼指令。但是,麻雀雖小,五臟俱全,也包括了最基本的變數定義,呼叫方法,和方法返回這些最基本的功能。同時,也足夠我們去解釋上邊的問題,為什麼註釋行會被執行了。
> 更多的位元組碼指令可以參考《深入理解Java虛擬機器》這本書的 6.4 節,和最後的附錄位元組碼指令表。需要這本書的,可以微信搜尋到我《煙雨星空》,後臺回覆“Java虛擬機器”。
由於位元組碼指令太多,比如還有運算指令,包括加減乘除、位運算,比較指令等,if 等控制指令,型別強轉指令,還有多執行緒用到的同步鎖。And so on ~
不可能把它們全部記住背會,但是,其實都是由規律可循的,很多都是見名知意,用各種英文首字母簡寫代表。比如,int型別的加法運算,就是 iadd,double 型別的減法運算是 dsub。等等。
因此,我這裡只是給了一個引子,重要的還是需要自己去尋找方法,不斷的實踐探索 ~
另外,官方文件才是最好的學習途徑:[https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html](https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html)
## 註釋行位元組碼
最後,學以致用,實踐出真知。我們一起看一下開頭丟擲的問題吧,為什麼註釋行會被執行。看一下它的位元組碼指令就知道了。
```java
public class TestAnno {
public static void main(String[] args) {
String str = "張三";
// \u000d str="李四";
System.out.println(str);
}
}
```
```java
//這裡就是從常量池中取出一個字串“張三”,然後載入到運算元棧
0 ldc #2 <張三>
//從運算元棧把這個字串引用儲存到區域性變量表中
2 astore_1
//從常量池中取出一個字串“李四”,然後載入到運算元棧
3 ldc #3 <李四>
//可以發現和上邊一樣都是astore_1,說明指向的是同一個引用 str。
//若定義另外一個str2賦值給“李四”,這個操作指令肯定就不同了。
5 astore_1
//訪問的是System類的靜態屬性out,我們知道它的型別是PrintStream
6 getst