JVM系列第7講:JVM 類載入機制
當 Java 虛擬機器將 Java 原始碼編譯為位元組碼之後,虛擬機器便可以將位元組碼讀取進記憶體,從而進行解析、執行等整個過程,這個過程我們叫:Java 虛擬機器的類載入機制。JVM 虛擬機器執行 class 位元組碼的過程可以分為七個階段:載入、驗證、準備、解析、初始化、使用、解除安裝。
在開始聊之前,先給大家看一道面試題。
class Grandpa { static { System.out.println("爺爺在靜態程式碼塊"); } } class Father extends Grandpa { static { System.out.println("爸爸在靜態程式碼塊"); } public static int factor = 25; public Father() { System.out.println("我是爸爸~"); } } class Son extends Father { static { System.out.println("兒子在靜態程式碼塊"); } public Son() { System.out.println("我是兒子~"); } } public class InitializationDemo { public static void main(String[] args) { System.out.println("爸爸的歲數:" + Son.factor); //入口 } }
請寫出最後的輸出字串。
正確答案是:
爺爺在靜態程式碼塊
爸爸在靜態程式碼塊
爸爸的歲數:25
我相信很多同學看到這個題目之後,表情是崩潰的,完全不知道從何入手。有的甚至遇到了幾次,仍然無法找到正確的解答思路。
其實這種面試題考察的就是你對Java類載入機制的理解。如果你對Java載入機制不理解,那麼你是無法解答這道題目的。這篇文章,我將通過對Java類載入機制的講解,讓你掌握解答此類題目的方法。
載入
下面是對於載入過程最為官方的描述。
載入階段是類載入過程的第一個階段。在這個階段,JVM 的主要目的是將位元組碼從各個位置(網路、磁碟等)轉化為二進位制位元組流載入到記憶體中,接著會為這個類在 JVM 的方法區建立一個對應的 Class 物件,這個 Class 物件就是這個類各種資料的訪問入口。
其實載入階段用一句話來說就是:把程式碼資料載入到記憶體中。這個過程對於我們解答這道問題沒有直接的關係,但這是類載入機制的一個過程,所以必須要提一下。
驗證
當 JVM 載入完 Class 位元組碼檔案並在方法區建立對應的 Class 物件之後,JVM 便會啟動對該位元組碼流的校驗,只有符合 JVM 位元組碼規範的檔案才能被 JVM 正確執行。這個校驗過程大致可以分為下面幾個型別:
- JVM規範校驗。JVM 會對位元組流進行檔案格式校驗,判斷其是否符合 JVM 規範,是否能被當前版本的虛擬機器處理。例如:檔案是否是以
0x cafe bene
開頭,主次版本號是否在當前虛擬機器處理範圍之內等。 - 程式碼邏輯校驗。
當代碼資料被載入到記憶體中後,虛擬機器就會對程式碼資料進行校驗,看看這份程式碼是不是真的按照JVM規範去寫的。這個過程對於我們解答問題也沒有直接的關係,但是瞭解類載入機制必須要知道有這個過程。
準備(重點)
當完成位元組碼檔案的校驗之後,JVM 便會開始為類變數分配記憶體並初始化。這裡需要注意兩個關鍵點,即記憶體分配的物件以及初始化的型別。
- 記憶體分配的物件。Java 中的變數有「類變數」和「類成員變數」兩種型別,「類變數」指的是被 static 修飾的變數,而其他所有型別的變數都屬於「類成員變數」。在準備階段,JVM 只會為「類變數」分配記憶體,而不會為「類成員變數」分配記憶體。「類成員變數」的記憶體分配需要等到初始化階段才開始。
例如下面的程式碼在準備階段,只會為 factor 屬性分配記憶體,而不會為 website 屬性分配記憶體。
public static int factor = 3;
public String website = "www.cnblogs.com/chanshuyi";
- 初始化的型別。在準備階段,JVM 會為類變數分配記憶體,併為其初始化。但是這裡的初始化指的是為變數賦予 Java 語言中該資料型別的零值,而不是使用者程式碼裡初始化的值。
例如下面的程式碼在準備階段之後,sector 的值將是 0,而不是 3。
public static int sector = 3;
但如果一個變數是常量(被 static final 修飾)的話,那麼在準備階段,屬性便會被賦予使用者希望的值。例如下面的程式碼在準備階段之後,number 的值將是 3,而不是 0。
public static final int number = 3;
之所以 static final 會直接被複制,而 static 變數會被賦予零值。其實我們稍微思考一下就能想明白了。
兩個語句的區別是一個有 final 關鍵字修飾,另外一個沒有。而 final 關鍵字在 Java 中代表不可改變的意思,意思就是說 number 的值一旦賦值就不會在改變了。既然一旦賦值就不會再改變,那麼就必須一開始就給其賦予使用者想要的值,因此被 final 修飾的類變數在準備階段就會被賦予想要的值。而沒有被 final 修飾的類變數,其可能在初始化階段或者執行階段發生變化,所以就沒有必要在準備階段對它賦予使用者想要的值。
解析
當通過準備階段之後,JVM 針對類或介面、欄位、類方法、介面方法、方法型別、方法控制代碼和呼叫點限定符 7 類引用進行解析。這個階段的主要任務是將其在常量池中的符號引用替換成直接其在記憶體中的直接引用。
其實這個階段對於我們來說也是幾乎透明的,瞭解一下就好。
初始化(重點)
到了初始化階段,使用者定義的 Java 程式程式碼才真正開始執行。在這個階段,JVM 會根據語句執行順序對類物件進行初始化,一般來說當 JVM 遇到下面 5 種情況的時候會觸發初始化:
- 遇到 new、getstatic、putstatic、invokestatic 這四條位元組碼指令時,如果類沒有進行過初始化,則需要先觸發其初始化。生成這4條指令的最常見的Java程式碼場景是:使用new關鍵字例項化物件的時候、讀取或設定一個類的靜態欄位(被final修飾、已在編譯器把結果放入常量池的靜態欄位除外)的時候,以及呼叫一個類的靜態方法的時候。
- 使用 java.lang.reflect 包的方法對類進行反射呼叫的時候,如果類沒有進行過初始化,則需要先觸發其初始化。
- 當初始化一個類的時候,如果發現其父類還沒有進行過初始化,則需要先觸發其父類的初始化。
- 當虛擬機器啟動時,使用者需要指定一個要執行的主類(包含main()方法的那個類),虛擬機器會先初始化這個主類。
- 當使用 JDK1.7 動態語言支援時,如果一個 java.lang.invoke.MethodHandle例項最後的解析結果 REF_getstatic,REF_putstatic,REF_invokeStatic 的方法控制代碼,並且這個方法控制代碼所對應的類沒有進行初始化,則需要先出觸發其初始化。
看到上面幾個條件你可能會暈了,但是不要緊,不需要背,知道一下就好,後面用到的時候回到找一下就可以了。
使用
當 JVM 完成初始化階段之後,JVM 便開始從入口方法開始執行使用者的程式程式碼。這個階段也只是瞭解一下就可以。
解除安裝
當用戶程式程式碼執行完畢後,JVM 便開始銷燬建立的 Class 物件,最後負責執行的 JVM 也退出記憶體。這個階段也只是瞭解一下就可以。
看完了Java的類載入機智之後,是不是有點懵呢。不怕,我們先通過一個小例子來醒醒神。
public class Book {
public static void main(String[] args)
{
System.out.println("Hello ShuYi.");
}
Book()
{
System.out.println("書的構造方法");
System.out.println("price=" + price +",amount=" + amount);
}
{
System.out.println("書的普通程式碼塊");
}
int price = 110;
static
{
System.out.println("書的靜態程式碼塊");
}
static int amount = 112;
}
思考一下上面這段程式碼輸出什麼?
給你5分鐘思考,5分鐘後交卷,哈哈。
怎麼樣,想好了嗎,公佈答案了。
書的靜態程式碼塊
Hello ShuYi.
怎麼樣,你答對了嗎?是不是和你想得有點不一樣呢。
下面我們來簡單分析一下,首先根據上面說到的觸發初始化的5種情況的第4種(當虛擬機器啟動時,使用者需要指定一個要執行的主類(包含main()方法的那個類),虛擬機器會先初始化這個主類),我們會進行類的初始化。
那麼類的初始化順序到底是怎麼樣的呢?
重點來了!
重點來了!
重點來了!
在我們程式碼中,我們只知道有一個構造方法,但實際上Java程式碼編譯成位元組碼之後,是沒有構造方法的概念的,只有類初始化方法
那麼這兩個方法是怎麼來的呢?
- 類初始化方法
。編譯器會按照其出現順序,收集類變數的賦值語句、靜態程式碼塊,最終組成類初始化方法 。類初始化方法一般在類初始化的時候執行。
上面的這個例子,其類初始化方法
static
{
System.out.println("書的靜態程式碼塊");
}
static int amount = 112;
- 物件初始化方法
。編譯器會按照其出現順序,收整合員變數的賦值語句、普通程式碼塊,最後收集建構函式的程式碼,最終組成物件初始化方法 。物件初始化方法一般在例項化類物件的時候執行。
上面這個例子,其物件初始化方法
{
System.out.println("書的普通程式碼塊");
}
int price = 110;
System.out.println("書的構造方法");
System.out.println("price=" + price +",amount=" + amount);
類初始化方法
但細心的朋友一定會發現,其實上面的這個例子其實沒有執行物件初始化方法
因為我們確實沒有進行 Book 類物件的例項化。如果你在 main 方法中增加 new Book() 語句,你會發現物件的初始化方法
感興趣的朋友可以自己動手試一下,我這裡就不執行了。
通過了上面的理論和簡單例子,我們下面進入更加複雜的實戰分析吧!
實戰分析
class Grandpa
{
static
{
System.out.println("爺爺在靜態程式碼塊");
}
}
class Father extends Grandpa
{
static
{
System.out.println("爸爸在靜態程式碼塊");
}
public static int factor = 25;
public Father()
{
System.out.println("我是爸爸~");
}
}
class Son extends Father
{
static
{
System.out.println("兒子在靜態程式碼塊");
}
public Son()
{
System.out.println("我是兒子~");
}
}
public class InitializationDemo
{
public static void main(String[] args)
{
System.out.println("爸爸的歲數:" + Son.factor); //入口
}
}
思考一下,上面的程式碼最後的輸出結果是什麼?
最終的輸出結果是:
爺爺在靜態程式碼塊
爸爸在靜態程式碼塊
爸爸的歲數:25
也許會有人問為什麼沒有輸出「兒子在靜態程式碼塊」這個字串?
這是因為對於靜態欄位,只有直接定義這個欄位的類才會被初始化(執行靜態程式碼塊)。因此通過其子類來引用父類中定義的靜態欄位,只會觸發父類的初始化而不會觸發子類的初始化。
對面上面的這個例子,我們可以從入口開始分析一路分析下去:
- 首先程式到 main 方法這裡,使用標準化輸出 Son 類中的 factor 類成員變數,但是 Son 類中並沒有定義這個類成員變數。於是往父類去找,我們在 Father 類中找到了對應的類成員變數,於是觸發了 Father 的初始化。
- 但根據我們上面說到的初始化的 5 種情況中的第 3 種(當初始化一個類的時候,如果發現其父類還沒有進行過初始化,則需要先觸發其父類的初始化)。我們需要先初始化 Father 類的父類,也就是先初始化 Grandpa 類再初始化 Father 類。於是我們先初始化 Grandpa 類輸出:「爺爺在靜態程式碼塊」,再初始化 Father 類輸出:「爸爸在靜態程式碼塊」。
- 最後,所有父類都初始化完成之後,Son 類才能呼叫父類的靜態變數,從而輸出:「爸爸的歲數:25」。
怎麼樣,是不是覺得豁然開朗呢。
我們再來看一下一個更復雜點的例子,看看輸出結果是啥。
class Grandpa
{
static
{
System.out.println("爺爺在靜態程式碼塊");
}
public Grandpa() {
System.out.println("我是爺爺~");
}
}
class Father extends Grandpa
{
static
{
System.out.println("爸爸在靜態程式碼塊");
}
public Father()
{
System.out.println("我是爸爸~");
}
}
class Son extends Father
{
static
{
System.out.println("兒子在靜態程式碼塊");
}
public Son()
{
System.out.println("我是兒子~");
}
}
public class InitializationDemo
{
public static void main(String[] args)
{
new Son(); //入口
}
}
輸出結果是:
爺爺在靜態程式碼塊
爸爸在靜態程式碼塊
兒子在靜態程式碼塊
我是爺爺~
我是爸爸~
我是兒子~
怎麼樣,是不是覺得這道題和上面的有所不同呢。
讓我們仔細來分析一下上面程式碼的執行流程:
- 首先在入口這裡我們例項化一個 Son 物件,因此會觸發 Son 類的初始化,而 Son 類的初始化又會帶動 Father 、Grandpa 類的初始化,從而執行對應類中的靜態程式碼塊。因此會輸出:「爺爺在靜態程式碼塊」、「爸爸在靜態程式碼塊」、「兒子在靜態程式碼塊」。
- 當 Son 類完成初始化之後,便會呼叫 Son 類的構造方法,而 Son 類構造方法的呼叫同樣會帶動 Father、Grandpa 類構造方法的呼叫,最後會輸出:「我是爺爺~」、「我是爸爸~」、「我是兒子~」。
看完了兩個例子之後,相信大家都胸有成足了吧。
下面給大家看一個特殊點的例子,有點難哦!
public class Book {
public static void main(String[] args)
{
staticFunction();
}
static Book book = new Book();
static
{
System.out.println("書的靜態程式碼塊");
}
{
System.out.println("書的普通程式碼塊");
}
Book()
{
System.out.println("書的構造方法");
System.out.println("price=" + price +",amount=" + amount);
}
public static void staticFunction(){
System.out.println("書的靜態方法");
}
int price = 110;
static int amount = 112;
}
上面這個例子的輸出結果是:
書的普通程式碼塊
書的構造方法
price=110,amount=0
書的靜態程式碼塊
書的靜態方法
下面我們一步步來分析一下程式碼的整個執行流程。
在上面兩個例子中,因為 main 方法所在類並沒有多餘的程式碼,我們都直接忽略了 main 方法所在類的初始化。
但在這個例子中,main 方法所在類有許多程式碼,我們就並不能直接忽略了。
- 當 JVM 在準備階段的時候,便會為類變數分配記憶體和進行初始化。此時,我們的 book 例項變數被初始化為 null,amount 變數被初始化為 0。
- 當進入初始化階段後,因為 Book 方法是程式的入口,根據我們上面說到的類初始化的五種情況的第四種(當虛擬機器啟動時,使用者需要指定一個要執行的主類(包含main()方法的那個類),虛擬機器會先初始化這個主類)。所以JVM 會初始化 Book 類,即執行類構造器
。 - JVM 對 Book 類進行初始化首先是執行類構造器(按順序收集類中所有靜態程式碼塊和類變數賦值語句就組成了類構造器
),後執行物件的構造器(按順序收整合員變數賦值和普通程式碼塊,最後收集物件構造器,最終組成物件構造器 )。
對於 Book 類,其類構造方法(
static Book book = new Book();
static
{
System.out.println("書的靜態程式碼塊");
}
static int amount = 112;
於是首先執行static Book book = new Book();
這一條語句,這條語句又觸發了類的例項化。於是 JVM 執行物件構造器
{
System.out.println("書的普通程式碼塊");
}
int price = 110;
Book()
{
System.out.println("書的構造方法");
System.out.println("price=" + price +", amount=" + amount);
}
於是此時 price 賦予 110 的值,輸出:「書的普通程式碼塊」、「書的構造方法」。而此時 price 為 110 的值,而 amount 的賦值語句並未執行,所以只有在準備階段賦予的零值,所以之後輸出「price=110,amount=0」。
當類例項化完成之後,JVM 繼續進行類構造器的初始化:
static Book book = new Book(); //完成類例項化
static
{
System.out.println("書的靜態程式碼塊");
}
static int amount = 112;
即輸出:「書的靜態程式碼塊」,之後對 amount 賦予 112 的值。
- 到這裡,類的初始化已經完成,JVM 執行 main 方法的內容。
public static void main(String[] args)
{
staticFunction();
}
即輸出:「書的靜態方法」。
方法論
從上面幾個例子可以看出,分析一個類的執行順序大概可以按照如下步驟:
- 確定類變數的初始值。在類載入的準備階段,JVM 會為類變數初始化零值,這時候類變數會有一個初始的零值。如果是被 final 修飾的類變數,則直接會被初始成使用者想要的值。
- 初始化入口方法。當進入類載入的初始化階段後,JVM 會尋找整個 main 方法入口,從而初始化 main 方法所在的整個類。當需要對一個類進行初始化時,會首先初始化類構造器(
),之後初始化物件構造器( )。 - 初始化類構造器。JVM 會按順序收集類變數的賦值語句、靜態程式碼塊,最終組成類構造器由 JVM 執行。
- 初始化物件構造器。JVM 會按照收整合員變數的賦值語句、普通程式碼塊,最後收集構造方法,將它們組成物件構造器,最終由 JVM 執行。
如果在初始化 main 方法所在類的時候遇到了其他類的初始化,那麼就先載入對應的類,載入完成之後返回。如此反覆迴圈,最終返回 main 方法所在類。
總結
看完了上面的解析之後,再去看看開頭那道題是不是覺得簡單多了呢。很多東西就是這樣,掌握了一定的方法和知識之後,原本困難的東西也變得簡單許多了。
JVM系列目錄
如果只是看,其實無法真正學會知識的。為了幫助大家更好地學習,我建了一個虛擬機器群,專門討論學習 Java 虛擬機器方面的內容,每週針對我所發文章進行討論答疑。如果你有興趣,關注「Java技術精選」公眾號,通過右下角選單「入群交流」加我好友,小助手會拉你入群。