1. 程式人生 > >JVM實戰---類載入的過程

JVM實戰---類載入的過程

任何程式都需要載入到記憶體才能與CPU進行交流
同理, 位元組碼.class檔案同樣需要載入到記憶體中,才可以例項化類
ClassLoader的使命就是提前載入.class 類檔案到記憶體中
在載入類時,使用的是Parents Delegation Model(溯源委派載入模型)

Java的類載入器是一個執行時核心基礎設施模組,主要是在啟動之初進行類的載入、連結、初始化

第一步,Load階段

讀取類檔案產生二進位制流,並轉為特定資料結構,初步校驗cafe babe魔法數、常量池、檔案長度、是否有父類等,然後建立對應類的java.lang.Class例項

第二步,Link階段

包括驗證、準備、解析三個步驟

  • 驗證是更詳細的校驗,比如final是否合規、型別是否正確、靜態變數是否合理等
  • 準備階段是為靜態變數分配記憶體,並設定預設值,解析類和方法確保類與類之間的相互引用正確性,完成記憶體結構佈局

    第三步,Init 階段

    執行類構造器

類載入是一個將.class位元組碼檔案例項化成Class物件並進行相關初始化的過程。
在這個過程中,JVM會初始化繼承樹上還沒有被初始化過的所有父類,並且會執行這個鏈路上所有未執行過的靜態程式碼塊、靜態變數賦值語句等。
某些類在使用時,也可以按需由類載入器進行載入。

全小寫的class是關鍵字,用來定義類
而首字母大寫的Class,它是所有class的類
這句話理解起來有難度,類已經是現實世界中某種事物的抽象,為什麼這個抽象還是另外一個類Class的物件?
示例程式碼如下:





● 第1處說明:
Class類下的newInstance()在JDK9中已經置為過時,使用getDeclaredConstructor().newInstance()的方式
著重說明一下new與newInstance的區別

  • new是強型別校驗,可以呼叫任何構造方法,在使用new操作的時候,這個類可以沒有被載入過
  • 而Class類下的newInstance是弱型別,只能呼叫無參構造方法
    • 如果沒有預設構造方法,就丟擲InstantiationException異常;
    • 如果此構造方法沒有許可權訪問,則拋 IllegalAccessException異常

Java 通過類載入器把類的實現與類的定義進行解耦,所以是實現面向介面程式設計、依賴倒置的必然選擇。

● 第2處說明:
可以使用類似的方式獲取其他宣告,如註解、方法等

● 第3處說明: private 成員在類外是否可以修改?
通過setccessible(true),即可使用Class類的set方法修改其值
如果沒有這一步,則丟擲如下異常:

類載入器

類載入器是如何定位具體的類檔案並讀取的呢?

在類載入器家族中存在著類似人類社會的權力等級制度

  • 最高層的Bootstrap
    在JVM啟動時建立的,通常由與作業系統相關的原生代碼實現,是最根基的類載入器,負責裝載最核心的Java類,比如Object、System、 String ,Java執行時的rt.jar等jar包
  • JDK9的Platform ClassLoader
    負責載入
  • 第三層 Application ClassLoader
    應用類載入器,主要是載入使用者定義的CLASSPATH路徑下的類

第二、三層類載入器為Java語言實現,使用者也可以自定義類載入器
檢視本地類載入器的方式如下:

在JDK8環境中,執行結果如下

AppClassLoader的Parent為Bootstrap,它是通過C/C++實現的,並不存在於JVM體系內,所以輸出為 null

低層次的當前類載入器,不能覆蓋更高層次類載入器已經載入的類
如果低層次的類載入器想載入一個未知類,要非常禮貌地向上逐級詢問:“請問,這個類已經載入了嗎?”
被詢問的高層次類載入器會自問兩個問題

  • 我是否已載入過此類
  • 如果沒有,是否可以載入此類

只有當所有高層次類載入器在兩個問題的答案均為“否”時,才可以讓當前類載入器載入這個未知類
左側綠色箭頭向上逐級詢問是否已載入此類,直至Bootstrap ClassLoader,然後向下逐級嘗試是否能夠載入此類,如果都載入不了,則通知發起載入請求的當前類載入器,准予載入
在右側的三個小標籤裡,列舉了此層類載入器主要載入的代表性類庫,事實上不止於此

通過如下程式碼可以檢視Bootstrap 所有已載入類庫

執行結果

Bootstrap載入的路徑可以追加,不建議修改或刪除原有載入路徑
在JVM中增加如下啟動引數,則能通過Class.forName正常讀取到指定類,說明此引數可以增加Bootstrap的類載入路徑:

-Xbootclasspath/a:/Users/sss/book/ easyCoding/byJdk11/src

如果想在啟動時觀察載入了哪個jar包中的哪個類,可以增加

-XX:+TraceClassLoading

此引數在解決類衝突時非常實用,畢竟不同的JVM環境對於載入類的順序並非是一致的
有時想觀察特定類的載入上下文,由於載入的類數量眾多,除錯時很難捕捉到指定類的載入過程,這時可以使用條件斷點功能
比如,想檢視HashMap的載入過程,在loadClass處打個斷點,並且在condition框內輸入如圖

JVM如何確立每個類在JVM的唯一性

類的全限定名和載入這個類的類載入器的ID

在學習了類載入器的實現機制後,知道雙親委派模型並非強制模型,使用者可以自定義類載入器,在什麼情況下需要自定義類載入器呢?

  • 隔離載入類
    在某些框架內進行中介軟體與應用的模組隔離,把類載入到不同的環境
    比如,阿里內某容器框架通過自定義類載入器確保應用中依賴的jar包不會影響到中介軟體執行時使用的jar包
  • 修改類載入方式
    類的載入模型並非強制,除Bootstrap外,其他的載入並非一定要引入,或者根據實際情況在某個時間點進行按需進行動態載入
  • 擴充套件載入源
    比如從資料庫、網路,甚至是電視機機頂盒進行載入
  • 防止原始碼洩露
    Java程式碼容易被編譯和篡改,可以進行編譯加密。那麼類載入器也需要自定義,還原加密的位元組碼。

實現自定義類載入器的步驟

  • 繼承ClassLoader
  • 重寫findClass()方法
  • 呼叫defineClass()方法

一個簡單的類載入器實現的示例程式碼如下

由於中介軟體一般都有自己的依賴jar包,在同一個工程內引用多個框架時,往往被迫進行類的仲裁
按某種規則jar包的版本被統一指定, 導致某些類存在包路徑、類名相同的情況,就會引起類衝突,導致應用程式出現異常
主流的容器類框架都會自定義類載入器,實現不同中介軟體之間的類隔離,有效避免了類衝突。

1 載入的定位

“載入”是“類載入”(Class Loading)過程的第一步

1.1 載入的過程

在載入的過程中,JVM主要做3件事情

  • 通過一個類的全限定名來獲取定義此類的二進位制位元組流(class檔案)
    在程式執行過程中,當要訪問一個類時,若發現這個類尚未被載入,並滿足類初始化的條件時,就根據要被初始化的這個類的全限定名找到該類的二進位制位元組流,開始載入過程
  • 將這個位元組流的靜態儲存結構轉化為方法區的執行時資料結構
  • 在記憶體中建立一個該類的java.lang.Class物件,作為方法區該類的各種資料的訪問入口

程式在執行中所有對該類的訪問都通過這個類物件,也就是這個Class物件是提供給外界訪問該類的介面

1.2 載入源

JVM規範對於載入過程給予了較大的寬鬆度.一般二進位制位元組流都從已經編譯好的本地class檔案中讀取,此外還可以從以下地方讀取

  • zip包
    Jar、War、Ear等
  • 其它檔案生成
    由JSP檔案中生成對應的Class類.
  • 資料庫中
    將二進位制位元組流儲存至資料庫中,然後在載入時從資料庫中讀取.有些中介軟體會這麼做,用來實現程式碼在叢集間分發
  • 網路
    從網路中獲取二進位制位元組流.典型就是Applet.
  • 執行時計算生成
    動態代理技術,用PRoxyGenerator.generateProxyClass為特定介面生成形式為"*$Proxy"的代理類的二進位制位元組流.

    1.3 類和陣列載入過程的區別

    陣列也有型別,稱為“陣列型別”.如:
String[] str = new String[10];

這個陣列的陣列型別是Ljava.lang.String,而String只是這個陣列的元素型別

當程式在執行過程中遇到new關鍵字建立一個數組時,由JVM直接建立陣列類,再由類載入器建立陣列中的元素型別.

而普通類的載入由類載入器建立.既可以使用系統提供的引導類載入器,也可以由使用者自定義的類載入器完成(即重寫一個類載入器的loadClass()方法)

1.4 載入過程的注意點

  • JVM規範並未給出類在方法區中存放的資料結構
    類完成載入後,二進位制位元組流就以特定的資料結構儲存在方法區中,但儲存的資料結構是由虛擬機器自己定義的,虛擬機器規範並沒有指定
  • JVM規範並沒有指定Class物件存放的位置
    在二進位制位元組流以特定格式儲存在方法區後,JVM會建立一個java.lang.Class類的物件,作為本類的外部訪問介面
    既然是物件就應該存放在Java堆中,不過JVM規範並沒有給出限制,不同的虛擬機器根據自己的需求存放這個物件
    HotSpot將Class物件存放在方法區.
  • 載入階段和連結階段是交叉的
    類載入的過程中每個步驟的開始順序都有嚴格限制,但每個步驟的結束順序沒有限制.也就是說,類載入過程中,必須按照如下順序開始:

    載入 -> 連結 -> 初始化

但結束順序無所謂,因此由於每個步驟處理時間的長短不一就會導致有些步驟會出現交叉

2 驗證

驗證階段比較耗時,它非常重要但不一定必要(因為對程式執行期沒有影響),如果所執行的程式碼已經被反覆使用和驗證過,那麼可以使用-Xverify:none引數關閉,以縮短類載入時間

2.1 驗證的目的

保證二進位制位元組流中的資訊符合虛擬機器規範,並沒有安全問題

2.2 驗證的必要性

雖然Java語言是一門安全的語言,它能確保程式猿無法訪問陣列邊界以外的記憶體、避免讓一個物件轉換成任意型別、避免跳轉到不存在的程式碼行.也就是說,Java語言的安全性是通過編譯器來保證的.

但是我們知道,編譯器和虛擬機器是兩個獨立的東西,虛擬機器只認二進位制位元組流,它不會管所獲得的二進位制位元組流是哪來的,當然,如果是編譯器給它的,那麼就相對安全,但如果是從其它途徑獲得的,那麼無法確保該二進位制位元組流是安全的。

通過上文可知,虛擬機器規範中沒有限制二進位制位元組流的來源,在位元組碼層面上,上述Java程式碼無法做到的都是可以實現的,至少語義上是可以表達出來的,為了防止位元組流中有安全問題,需要驗證!

2.3 驗證的過程

  • 檔案格式驗證
    驗證位元組流是否符合Class檔案格式的規範,並且能被當前的虛擬機器處理.
    本驗證階段是基於二進位制位元組流進行的,只有通過本階段驗證,才被允許存到方法區
    後面的三個驗證階段都是基於方法區的儲存結構進行,不會再直接操作位元組流.

通過上文可知,載入開始前,二進位制位元組流還沒進方法區,而載入完成後,二進位制位元組流已經存入方法區
而在檔案格式驗證前,二進位制位元組流尚未進入方法區,檔案格式驗證通過之後才進入方法區
也就是說,載入開始後,立即啟動了檔案格式驗證,本階段驗證通過後,二進位制位元組流被轉換成特定資料結構儲存至方法區中,繼而開始下階段的驗證和建立Class物件等操作
這個過程印證了:載入和驗證是交叉進行的

  • 元資料驗證
    對位元組碼描述資訊進行語義分析,確保符合Java語法規範.
  • 位元組碼驗證
    本階段是驗證過程的最複雜的一個階段.
    本階段對方法體進行語義分析,保證方法在執行時不會出現危害虛擬機器的事件.
    位元組碼驗證將對類的方法進行校驗分析,保證被校驗的方法在執行時不會做出危害虛擬機器的事,一個類方法體的位元組碼沒有通過位元組碼驗證,那一定有問題,但若一個方法通過了驗證,也不能說明它一定安全
  • 符號引用驗證
    發生在JVM將符號引用轉化為直接引用的時候,這個轉化動作發生在解析階段,對類自身以外的資訊進行匹配校驗,確保解析能正常執行.

    3 準備

    完成兩件事情
  • 為已在方法區中的類的靜態成員變數分配記憶體
  • 為靜態成員變數設定初始值
    初始值為0、false、null等
public static final int value = 123;

準備階段後 a 的值為 0,而不是 123,要在初始化之後才變為 123,但若被final修飾的常量如果有初始值,那麼在編譯階段就會將初始值存入constantValue屬性中,在準備階段就將constantValue的值賦給該欄位(此處將value賦為123).

4 解析

解析階段是虛擬機器將常量池中的符號引用替換為直接引用的過程.

5 初始化

真正開始執行類中定義的Java程式程式碼(或者說是位元組碼)
初始化階段就是執行類構造器clinit()的過程.

clinit()方法由編譯器自動產生,收集類中static{}程式碼塊中的類變數賦值語句和類中靜態成員變數的賦值語句。在準備階段,類中靜態成員變數已經完成了預設初始化,而在初始化階段,clinit()方法對靜態成員變數進行顯示初始化。

5.1 初始化過程的注意點

  • clinit()方法是IDE自動收集類中所有類變數的賦值動作和靜態語句塊中的語句合併產生的,IDE收集的順序是由語句在原始檔中出現的順序所決定的.
  • 靜態程式碼塊只能訪問到出現在靜態程式碼塊之前的變數,定義在它之後的變數,在前面的靜態語句塊可以賦值,但是不能訪問.
public class Test {
    static {
        i=0;
        System.out.println(i);//編譯失敗:"非法向前引用"
    }
    static int i = 1;
}
  • 例項構造器init()需要顯示呼叫父類建構函式,而類的clinit()不需要呼叫父類的類建構函式,虛擬機器會確保子類的clinit()方法執行前已經執行完畢父類的clinit()方法.因此在JVM中第一個被執行的clinit()方法的類肯定是java.lang.Object.
  • 如果一個類/介面中沒有靜態程式碼塊,也沒有靜態成員變數的賦值操作,那麼編譯器就不會為此類生成clinit()方法.
  • 介面也需要通過clinit()方法為介面中定義的靜態成員變數顯示初始化。
  • 介面中不能使用靜態程式碼塊,但仍然有變數初始化的賦值操作,因此介面與類一樣都會生成clinit()方法.不同的是,執行介面的clinit()方法不需要先執行父介面的clinit()方法.只有當父介面中的靜態成員變數被使用到時才會執行父介面的clinit()方法.
  • 虛擬機器會保證在多執行緒環境中一個類的clinit()方法別正確地加鎖,同步.當多條執行緒同時去初始化一個類時,只會有一個執行緒去執行該類的clinit()方法,其它執行緒都被阻塞等待,直到活動執行緒執行clinit()方法完畢.

其他執行緒雖會被阻塞,只要有一個clinit()方法執行完,其它執行緒喚醒後不會再進入clinit()方法.同一個類載入器下,一個型別只會初始化一次.

參考

  • 《碼到成功》

  • 《深入理解Java虛擬機器第二版》