1. 程式人生 > 實用技巧 >jvm系列(二):JVM記憶體結構

jvm系列(二):JVM記憶體結構

JVM記憶體結構主要有三大塊:堆記憶體、方法區和棧。堆記憶體是JVM中最大的一塊由年輕代和老年代組成,而年輕代記憶體又被分成三部分,Eden空間、From Survivor空間、To Survivor空間,預設情況下年輕代按照8:1:1的比例來分配;

方法區儲存類資訊、常量、靜態變數等資料,是執行緒共享的區域,為與Java堆區分,方法區還有一個別名Non-Heap(非堆);棧又分為java虛擬機器棧和本地方法棧主要用於方法的執行。

在通過一張圖來了解如何通過引數來控制各區域的記憶體大小

控制引數
-Xms設定堆的最小空間大小。

-Xmx設定堆的最大空間大小。

-XX:NewSize設定新生代最小空間大小。

-XX:MaxNewSize設定新生代最大空間大小。

-XX:PermSize設定永久代最小空間大小。

-XX:MaxPermSize設定永久代最大空間大小。

-Xss設定每個執行緒的堆疊大小。

沒有直接設定老年代的引數,但是可以設定堆空間大小和新生代空間大小兩個引數來間接控制。

老年代空間大小=堆空間大小-年輕代大空間大小

從更高的一個維度再次來看JVM和系統呼叫之間的關係

程式計數器(Program Counter Register)

1. 概述

  • 程式計數器是一塊較小的記憶體空間,它的作用可以看做是當前執行緒所執行的位元組碼的行號指示器。
  • 在概念模型中,位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要這個計數器來完成
  • Java 虛擬機器的多執行緒是通過執行緒輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對於多喝處理器來說是一個核心)只會執行一條執行緒中的指令。
  • 因此,為了執行緒切換後能恢復到正確的執行位置,每個執行緒都需要有一個獨立的程式計數器,各條執行緒之間的計數器互不影響,獨立儲存,稱這類記憶體區域為**“執行緒私有”**的記憶體。
  • 如果執行緒現在正在執行的是一個Java 方法,這個計數器記錄的是正在執行的虛擬機器位元組碼指令的地址
  • 如果執行緒正在執行的是Native方法,這個計數器值則為空(Undefined)(Native方法是非Java語言編寫,比如c/c++,它們無法在 Java 編譯時生成位元組碼,即JVM 獲取不到 native 實現, 只能通過系統指令去呼叫native方法)
  • 此記憶體區域是唯一一個在 Java 虛擬機器規範中沒有規定任何 OutOfMemoryError情況的區域

2.特點

  • 佔記憶體很小,唯一不會規定任何 OutOfMemoryError情況
  • 執行緒私有
  • 對java方法是位元組碼指令的地址,對 Native 方法是 Undefined

JVM棧(JVM Stacks)

概述

  1. 和程式計數器一樣,Java 虛擬機器棧也是執行緒私有的,它的生命週期與執行緒相同。
  2. 虛擬機器棧描述的是 Java 方法執行的記憶體模型:每個方法被執行的時候都會同時建立一個棧幀(Stack Frame)用於儲存區域性變量表、操作棧、動態連結、方法出口等訊息。
  3. 對這個區域規定了兩種異常狀況:
    1. 如果執行緒請求的棧深度大於虛擬機器所允許的深度,將丟擲StackOverflowError異常。
    2. 如果虛擬機器棧可以動態擴充套件,當擴充套件時無法申請到足夠的記憶體時會丟擲OutOfMemoryError異常。

1.棧幀的概念

棧幀(Stack Frame) 是用於支援虛擬機器進行方法呼叫和方法執行的資料結構。棧幀儲存了方法的區域性變量表、運算元棧、動態連線和方法返回地址等資訊。每個方法從呼叫至執行完成的過程,都對應著一個棧幀在虛擬機器棧裡入棧到出棧的過程。

一個執行緒中方法的呼叫鏈可能很長,很多地方都同時處於執行狀態。對於JVM 執行引擎來說,在在活動執行緒中,只有位於 JVM 虛擬機器棧棧頂的元素才是有效的,即成為當前棧幀,與這個棧幀相關連的方法稱為當前方法,定義這個方法的類叫做當前類。

執行引擎執行的所有位元組碼指令都只針對當前棧幀進行操作。如果當前方法呼叫了其他方法,或者當前方法執行結束,那這個方法的棧幀就不再是當前棧幀。

在概念模型上,典型的棧幀結構如下

2.區域性變量表(Local Variable Table)

區域性變量表是一組變數值儲存空間,用於存放方法引數和方法內定義的區域性變數。區域性變量表的容量以變數槽(Variable Slot)為最小單位,Java虛擬機器規範並沒有定義一個槽應該佔用記憶體空間的大小,但是規定一個槽應該可以存放一個32位以內的資料型別。

一個區域性變數可以儲存一個型別為boolean(理論上是1/8位元組,但是java中沒有名明確大小)byte(一個位元組)char(兩個位元組)short(兩個位元組)int(四個位元組)float(四個位元組)reference(物件引用,它不等同於物件本身,根據不同的虛擬機器實現,它可能是一個指向物件起始地址的引用指標,也可能指向一個代表物件的控制代碼或與其他與此物件相關的位置)returnAddress(指向了一條位元組碼指令的地址)型別的資料。

3. 運算元棧(Operand Stack)

運算元棧也常稱為操作棧。同區域性變量表一樣,運算元棧的最大深度也在編譯的時候寫入到方法的Code屬性的max_stacks資料項中。

運算元棧的每一個元素可以是任意的Java資料型別,32位的資料型別佔一個棧容量,64位的資料型別佔兩個棧容量,且在方法執行的任意時刻,運算元棧的深度都不會超過max_stacks中設定的最大值。

當一個方法剛剛開始執行時,其運算元棧是空的,隨著方法執行和位元組碼指令的執行,會從區域性變量表或物件例項的欄位中複製常量或變數寫到運算元棧,再隨著計算的進行將棧中元素出棧到區域性變量表或者返回給方法呼叫者,也就是出棧/入棧操作。一個完整的方法執行期間往往包含多個這樣出棧/入棧的過程。

begin  
iload_0    // 將本地變數0中的int推入堆疊
iload_1    // 將本地變數1中的int推入堆疊 
iadd       // pop two ints, add them, push result  
istore_2   // 彈出int,儲存到本地變數2中
end

在這個位元組碼序列裡,前兩個指令iload_0和iload_1將儲存在區域性變量表中索引為0和1的整數壓入運算元棧中,其後iadd指令從運算元棧中彈出那兩個整數相加,在將結果壓入運算元棧。istore_2則從運算元棧中彈出結果,並把它儲存在區域性變量表索引為2的位置。

4.動態連結

在一個class檔案中,一個方法要呼叫其他方法,需要將這些方法的符號引用轉化為其在記憶體地址中的直接引用,而符號引用存在於方法區中的執行時常量池。

Java虛擬機器棧中,每個棧幀都包含一個指向執行時常量池中該棧所示方法的符號引用,持有這個引用的目的是支援方法呼叫過程中的動態連結。

這些符號引用一部分會在類載入階段或第一次使用時就直接轉化為直接引用,這類轉化稱為靜態解析。另一部分將在每次執行期間轉換為直接引用,這類轉化稱為動態連結。

5.方法返回

當一個方法開始執行時,可能有兩種方法退出該方法:

  • 正常完成出口
  • 異常完成出口

正常完成出口是指方法正常完成並退出,沒有丟擲任何異常。如果當前方法正常完成,則根據當前方法返回的位元組碼指令,這時可能會有返回值傳遞給方法呼叫者,或無返回值。

異常完成出口是指方法執行過程中遇到異常,並且這個異常在方法體內部沒有得到處理,導致方法退出。

無論方法採用何種方式退出,在方法退出後都需要返回到方法被呼叫的位置,程式才能繼續執行,方法返回時可能需要在當前棧幀中儲存一些資訊,用來幫他恢復它的上層方法執行狀態。

Java 堆

  • Java 堆(Java Heap)是 Java 虛擬機器所管理的記憶體中最大的一塊,是執行緒共享的,在虛擬機器啟動時建立。
  • 此記憶體區域的唯一目的是為了存放物件例項,幾乎所有的物件例項都在這裡分配記憶體。
  • Java 堆是垃圾收集器管理的主要區域。
  • 從記憶體回收的角度看,由於現在收集器基本都是採用分代收集演算法,所以 Java 堆中還可以細分為:新生代和老生代。
  • 如果在堆中沒有記憶體完成例項分配,並且堆也無法再擴充套件時,將會丟擲 OutOfMemoryError 異常。

方法區

  • 方法區(Method Area)是執行緒共享的記憶體區域。
  • 此記憶體區域的作用是儲存已被虛擬機器載入的類資訊、常量、靜態變數、及時編譯器編譯後的程式碼等資料。
  • Java 虛擬機器規範對這個區域的限制非常寬鬆,除了和 Java 堆一樣不需要連續的記憶體和可以選擇固定大小或可擴充套件外,還可以選擇不實現垃圾收集。
  • 當方法區無法滿足記憶體分配需求時,將會丟擲 OutOfMemoryError 異常。

執行時常量池

  • 執行時常量池(Runtime Constant Pool)是方法區的一部分。
  • Class 檔案中的常量池資訊在類載入後將會存放到方法區的執行時常量池中,一般來說,還會將翻譯出來的直接引用也儲存在執行時常量池中。
  • 執行時常量池相對於 Class 檔案常量池的另外一個重要特徵是具備動態性,Java 語言並不要求常量一定只能在編譯期產生,也就是並非預置入 Class 檔案中常量池的內容才能進入方法區執行時常量池,執行期間也可能將新的常量放入池中,這種特性被開發人員利用得比較多的便是String 類的 intern() 方法。
  • 作為方法區的一部分,自然也會受到方法區記憶體的限制,當常量池無法再申請到記憶體是會丟擲 OutOfMemoryError 異常。