1. 程式人生 > 實用技巧 >Java虛擬機器(3)物件建立、記憶體區域及訪問定位

Java虛擬機器(3)物件建立、記憶體區域及訪問定位

1. 物件的建立

當Java虛擬機器遇到一條位元組碼new指令時,就會開始虛擬機器中物件的建立:

1.1 類載入檢查

  1. 檢查new指令的引數是否能在常量池中定位到一個類的符號引用

  2. 檢查這個符號引用代表的類是否已被載入、解析和初始化過;

如果沒有,那必須先執行相應的類載入過程。

1.2 為物件分配記憶體

物件所需記憶體的大小在類載入完成後便可完全確定,等同於把一塊確定大小的記憶體塊從Java堆中劃分出來。

選擇哪種分配方式由Java堆是否規整決定,Java堆是否規整又由所採用的垃圾收集器是否帶有空間壓縮整理(Compact)的能力決定。

  • 規整

    即所有被使用過的記憶體都被放在一邊,空閒的記憶體被放在另一邊;

  • 不規整

    已被使用的記憶體和空閒的記憶體相互交錯在一起。

分配方式:

  1. 指標碰撞 - Bump The Pointer(規整)

    已使用記憶體在一邊,未使用記憶體在另一邊,中間放一個作為分界點的指示器;

  2. 空閒列表 - Free List(不規整)

    虛擬機器維護一個列表,記錄上哪些記憶體塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給物件例項,並更新列表上的記錄。

注意:物件建立在虛擬機器中是非常頻繁的操作,即使僅僅修改一個指標所指向的位置,在併發情況下也會引起執行緒不安全。

執行緒安全問題解決:

  1. 對分配記憶體空間的動作進行同步處理

    採用CAS配上失敗重試的方式保證更新操作的原子性;

  2. 本地執行緒分配緩衝(Thread Local Allocation Buffer,TLAB)

    把記憶體分配的動作按照執行緒劃分在不同的空間之中進行,每個執行緒在Java堆中預先分配一小塊記憶體,哪個執行緒要分配記憶體,就在哪個執行緒的本地緩衝區中分配,只有本地緩衝區用完了,分配新的快取區時才需要同步鎖定。虛擬機器是否使用TLAB,可以通過-XX:+/-UseTLAB引數來設定。

1.3 初始化零值

記憶體分配完成之後,虛擬機器必須將分配到的記憶體空間(但不包括物件頭)都初始化為零值。

如果使用了TLAB的話,這一項工作也可以提前至TLAB分配時順便進行。

保證了物件的例項欄位在Java程式碼中可以不賦初始值就直接使用,使程式能訪問到這些欄位的資料型別所對應的零值。

1.4 物件頭設定

Java虛擬機器還要對物件進行必要的設定,存放在物件的物件頭(Object Header)之中:

物件是哪個類的例項、如何找到類的元資料資訊、物件的雜湊碼(實際上物件的雜湊碼會延後到真正呼叫Object::hashCode()方法時才計算)、物件的GC分代年齡等。

1.5 按意圖初始化

對物件進行必要設定後,從虛擬機器的視角來看,一個新的物件已經產生了。Java 程式開發來說,物件建立才剛開始,需要進行一些初始化操作。new指令之後會接著執行()方法,按照程式設計師的意願對物件進行初始化,這樣一個真正可用的物件才算完全被構造出來。

總結

2.物件的記憶體佈局

HotSpot虛擬機器裡,物件在堆記憶體中的儲存佈局可以劃分為三個部分:物件頭(Header)、例項資料(Instance Data)和對齊填充(Padding)。

2.1 物件頭

物件頭主要包含兩部分:

  • 用於儲存物件自身的執行時資料(Mark Word);

    如雜湊碼(HashCode)、GC分代年齡、鎖狀態標誌、執行緒持有的鎖、偏向執行緒ID、偏向時間戳等;

    被設計成一個有著動態定義的資料結構,以便在極小的空間記憶體儲儘量多的資料,根據物件的狀態複用自己的儲存空間。

  • 型別指標,即物件指向它的型別元資料的指標。

    通過這個指標來確定該物件是哪個類的例項,但並不是所有的虛擬機器實現都必須在物件資料上保留型別指標。

    如果物件是一個Java陣列,那在物件頭中還必須有一塊用於記錄陣列長度的資料,因為虛擬機器可以通過普通Java物件的元資料資訊確定Java物件的大小,但是如果陣列的長度是不確定的,將無法通過元資料中的資訊推斷出陣列的大小。

2.2 例項資料

物件真正儲存的有效資訊,即我們在程式程式碼裡面所定義的各種型別的欄位內容。

無論是從父類繼承下來的,還是在子類中定義的欄位都必須記錄起來。

這部分的儲存順序會受到虛擬機器分配策略引數(-XX:FieldsAllocationStyle引數)和欄位在Java原始碼中定義順序的影響。

2.3 對齊填充

佔位符作用。

由於HotSpot虛擬機器的自動記憶體管理系統要求物件起始地址必須是8位元組的整數倍,換句話說就是任何物件的大小都必須是8位元組的整數倍。物件頭部分已經被精心設計成正好是8位元組的倍數(1倍或者2倍),因此,如果物件例項資料部分沒有對齊的話,就需要通過對齊填充來補全。

總結

3. 物件的訪問定位

建立物件後續如何使用該物件?

我們的Java程式會通過棧上的reference資料來操作堆上的具體物件。

由於reference型別在《Java虛擬機器規範》裡面只規定了它是一個指向物件的引用,並沒有定義這個引用應該通過什麼方式去定位、訪問到堆中物件的具體位置,所以物件訪問方式也是由虛擬機器實現而定的,主流的訪問方式主要有使用控制代碼和直接指標兩種。

3.1 控制代碼

Java堆中將可能會劃分出一塊記憶體來作為控制代碼池,reference中儲存的就是物件的控制代碼地址,而控制代碼中包含了物件例項資料與型別資料各自具體的地址資訊

3.2 直接指標

reference中儲存的直接就是物件地址。

總結

本文主要介紹了JVM物件建立、物件記憶體佈局、物件訪問定位,接下來會進一步閱讀《深入理解Java虛擬機器》,並進行更多內容的講解、總結。

歡迎點贊/評論,你們的贊同和鼓勵是我寫作的最大動力!