深入理解JVM——物件
物件的建立
虛擬機器遇到一條new指令時,首先檢查指令的引數能否在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已經被載入、解析和初始化過。如果沒有,必須先執行相應的類載入過程。
接下來虛擬機器為新生物件分配記憶體。物件所需要的記憶體在類載入完成後可以被完全確定,所以只需要把一塊確定大小的記憶體區域從堆中劃分出來給這個物件即可:
-
如果堆的記憶體是規整的,所有使用的記憶體在一邊,未使用的記憶體在另一邊,中間是一個作為分界點的指標,那分配空間只需要移動作為分界點的指標(移動距離等於該物件需要的空間)。這種方法叫“指標碰撞”(Bump the Pointer)
-
如果堆的記憶體是不規整的,那麼虛擬機器需要維護一個列表,記錄那些記憶體塊是可用的,在分配的時候劃分一個足夠大的記憶體塊給該物件,並且更新列表的記錄。這種方法叫”空閒列表“(Free List)
-
Java堆記憶體是否規整取決於所採用的垃圾收集器是否帶有壓縮整理的功能。
由於物件分配是非常頻繁的操作,所以必須考慮執行緒安全問題:
-
方法一是同步分配空間的動作,通過採用CAS+失敗重試保證更新操作的原子性。
-
方法二是給每個執行緒都分配本地執行緒分配緩衝TLAB,哪個執行緒要分配記憶體,就在那個執行緒的TLAB上分配。當執行緒的TLAB用完,重新分配新的TLAB時,才需要同步鎖定。
分配記憶體後,虛擬機器設定物件的一些必要資訊,這些資訊存在在物件的物件頭中。一般來說,執行new指令後,會接著執行<init>方法,將物件初始化。這樣一個真正可用的物件才算完全產生出來。
編譯器為每個類生成至少一個例項初始化方法,即<init>()方法。此方法與源程式裡的每個構造方法對應。如果類沒有宣告構造方法,則生成一個預設構造方法,該方法僅呼叫父類的預設構造方法,同時生成與該預設構造方法對應的<init>()方法。
<init>()方法內容大概為:
呼叫另一個<init>()方法(本類的另外一個<init>()方法或父類的<init>()方法);
初始化例項變數;
與其對應的構造方法內的位元組碼
物件的記憶體佈局
物件在記憶體中的佈局可以分為3塊區域:物件頭(header),例項資料(Instance Data)和對齊填充(Padding)。
物件頭包括兩部分資訊:
-
第一部分用於儲存物件自身的執行時資料。如雜湊碼,GC分代年齡,鎖狀態標誌,執行緒持有的鎖,偏向執行緒id,偏向時間戳等。考慮到虛擬機器的空間效率,此部分在32位和64位虛擬機器中只佔32位或者64位的大小。
-
第二部分是型別指標。即物件指向它的類元資料的指標,虛擬機器通過這個指標來確定這個物件是哪個類的例項。(並不是所有的虛擬機器實現都保留型別指標,查詢物件 的元資料資訊不一定要通過物件本身)
如果該物件是陣列,那麼物件頭還會保留一塊資料,用於記錄陣列長度。
接下來的例項資料是物件真正儲存的有效資訊,也是在程式碼中定義的各種型別的欄位內容。這部分的儲存順序會受到虛擬機器分配策略引數和欄位在Java原始碼中定義順序的影響。Hotspot虛擬機器預設策略是longs/doubles,ints,shorts/chars,bytes/booleans,oops(Ordinary Object Pointers),相同寬度的欄位總是分配到一起。在這個去前提下,父類中定義的變數會出現在子類之前。
對齊填充不是必須的,也沒有特別的意義,僅僅起到佔位符的作用。HotSpot的自動記憶體管理系統要求物件起始地址必須是8位元組的整數倍。
物件的訪問定位
Java程式通過棧上的reference資料來操作堆上的具體物件。由於reference型別在Java虛擬機器中的規範中只規定了一個指向物件的引用,並沒有定義這個引用應該通過何種方式去定位、訪問堆中的物件的具體位置,所以物件訪問方式也是取決於虛擬機器的實現而定的。目前主流的訪問方式有試用控制代碼和直接指標兩種:
-
控制代碼訪問。Java堆劃分出一塊記憶體作為控制代碼池,reference中儲存的就是物件的控制代碼地址,控制代碼中包含了物件例項資料與型別資料各自的具體地址資訊
-
直接指標訪問。Java堆物件的佈局中必要考慮如何防止訪問型別資料的相關資訊,而reference中儲存的直接就是物件地址。
直接指標訪問的最大好處是速度更快,節省了一次指標定位的時間開銷。