03-樹3 Tree Traversals Again (25分)
方法區
前言
這次所講述的是執行時資料區的最後一個部分
從執行緒共享與否的角度來看
ThreadLocal:如何保證多個執行緒在併發環境下的安全性?典型應用就是資料庫連線管理,以及會話管理
棧、堆、方法區的互動關係
下面就涉及了物件的訪問定位
- Person:存放在元空間,也可以說方法區
- person:存放在 Java 棧的區域性變量表中
- new Person():存放在 Java 堆中
方法區的理解
《Java 虛擬機器規範》中明確說明:“儘管所有的方法區在邏輯上是屬於堆的一部分,但一些簡單的實現可能不會選擇去進行垃圾收集或者進行壓縮。”但對於 HotSpotJVM 而言,方法區還有一個別名叫做 Non-Heap(非堆),目的就是要和堆分開。
所以,方法區看作是一塊獨立於 Java 堆的記憶體空間。
方法區主要存放的是 Class,而堆中主要存放的是 例項化的物件
- 方法區(Method Area)與 Java 堆一樣,是各個執行緒共享的記憶體區域。
- 方法區在 JVM 啟動的時候被建立,並且它的實際的實體記憶體空間中和 Java 堆區一樣都可以是不連續的。
- 方法區的大小,跟堆空間一樣,可以選擇固定大小或者可擴充套件。
- 方法區的大小決定了系統可以儲存多少個類,如果系統定義了太多的類,導致方法區溢位,虛擬機器同樣會丟擲記憶體溢位錯誤:java.lang.OutofMemoryError:PermGen space 或者 java.lang.OutOfMemoryError:Metaspace
- 載入大量的第三方的 jar 包
- Tomcat 部署的工程過多(30~50 個)
- 大量動態的生成反射類
- 關閉 JVM 就會釋放這個區域的記憶體。
HotSpot中方法區的演進
在 jdk7 及以前,習慣上把方法區,稱為永久代。jdk8 開始,使用元空間取代了永久代。
- JDK 1.8 後,元空間存放在堆外記憶體中
本質上,方法區和永久代並不等價。僅是對 hotspot 而言的。《Java 虛擬機器規範》對如何實現方法區,不做統一要求。例如:BEAJRockit / IBM J9 中不存在永久代的概念。
- 現在來看,當年使用永久代,不是好的 idea。導致 Java 程式更容易 OOM(超過
-XX:MaxPermsize
而到了 JDK8,終於完全廢棄了永久代的概念,改用與 JRockit、J9 一樣在本地記憶體中實現的元空間(Metaspace)來代替
元空間的本質和永久代類似,都是對JVM規範中方法區的實現。不過元空間與永久代最大的區別在於:元空間不在虛擬機器設定的記憶體中,而是使用本地記憶體
永久代、元空間二者並不只是名字變了,內部結構也調整了
根據《Java 虛擬機器規範》的規定,如果方法區無法滿足新的記憶體分配需求時,將丟擲 OOM 異常
設定方法區大小與 OOM
方法區的大小不必是固定的,JVM 可以根據應用的需要動態調整。
jdk7及以前
- 通過
-XX:Permsize
來設定永久代初始分配空間。預設值是 20.75M -XX:MaxPermsize
來設定永久代最大可分配空間。32 位機器預設是 64M,64 位機器模式是 82M- 當 JVM 載入的類資訊容量超過了這個值,會報異常 OutOfMemoryError:PermGen space。
JDK8以後
元資料區大小可以使用引數
-XX:MetaspaceSize
和-XX:MaxMetaspaceSize
指定,替代上述原有的兩個引數。預設值依賴於平臺。Windows 下,
-XX:MetaspaceSize
是 21M,-XX:MaxMetaspaceSize
的值是 -1,即沒有限制。與永久代不同,如果不指定大小,預設情況下,虛擬機器會耗盡所有的可用系統記憶體。如果元資料區發生溢位,虛擬機器一樣會丟擲異常 OutOfMemoryError:Metaspace
-XX:MetaspaceSize
:設定初始的元空間大小。對於一個 64 位的伺服器端 JVM 來說,其預設的-XX:MetaspaceSize
值為 21MB。這就是初始的高水位線,一旦觸及這個水位線,FullGC 將會被觸發並解除安裝沒用的類(即這些類對應的類載入器不再存活)然後這個高水位線將會重置。新的高水位線的值取決於 GC 後釋放了多少元空間。如果釋放的空間不足,那麼在不超過 MaxMetaspaceSize 時,適當提高該值。如果釋放空間過多,則適當降低該值。如果初始化的高水位線設定過低,上述高水位線調整情況會發生很多次。通過垃圾回收器的日誌可以觀察到 FullGC 多次呼叫。為了避免頻繁地 GC,建議將
-XX:MetaspaceSize
設定為一個相對較高的值。
如何解決這些OOM
- 要解決 OOM 異常或 heap space 的異常,一般的手段是首先通過記憶體映像分析工具(如 Eclipse Memory Analyzer)對 dump 出來的堆轉儲快照進行分析,重點是確認記憶體中的物件是否是必要的,也就是要先分清楚到底是出現了記憶體洩漏(Memory Leak)還是記憶體溢位(Memory Overflow)
- 記憶體洩漏就是 有大量的引用指向某些物件,但是這些物件以後不會使用了,但是因為它們還和 GC ROOT 有關聯,所以導致以後這些物件也不會被回收,這就是記憶體洩漏的問題
如果是記憶體洩漏,可進一步通過工具檢視洩漏物件到 GC Roots 的引用鏈。於是就能找到洩漏物件是通過怎樣的路徑與 GCRoots 相關聯並導致垃圾收集器無法自動回收它們的。掌握了洩漏物件的型別資訊,以及 GCRoots 引用鏈的資訊,就可以比較準確地定位出洩漏程式碼的位置。
如果不存在記憶體洩漏,換句話說就是記憶體中的物件確實都還必須存活著,那就應當檢查虛擬機器的堆引數(-Xmx 與 -Xms),與機器實體記憶體對比看是否還可以調大,從程式碼上檢查是否存在某些物件生命週期過長、持有狀態時間過長的情況,嘗試減少程式執行期的記憶體消耗。
方法區的內部結構
《深入理解 Java 虛擬機器》書中對方法區(Method Area)儲存內容描述如下:它用於儲存已被虛擬機器載入的型別資訊、常量、靜態變數、即時編譯器編譯後的程式碼快取等。
型別資訊
對每個載入的型別(類 class、介面 interface、列舉 enum、註解 annotation),JVM 必須在方法區中儲存以下型別資訊:
- 這個型別的完整有效名稱(全名=包名.類名)
- 這個型別直接父類的完整有效名(對於 interface 或是 java.lang.object,都沒有父類)
- 這個型別的修飾符(public,abstract,final 的某個子集)
- 這個型別直接介面的一個有序列表
域(Field)資訊
JVM 必須在方法區中儲存型別的所有域的相關資訊以及域的宣告順序。
域的相關資訊包括:域名稱、域型別、域修飾符(public,private,protected,static,final,volatile,transient 的某個子集)
方法(Method)資訊
JVM 必須儲存所有方法的以下資訊,同域資訊一樣包括宣告順序:
- 方法名稱
- 方法的返回型別(或 void)
- 方法引數的數量和型別(按順序)
- 方法的修飾符(public,private,protected,static,final,synchronized,native,abstract 的一個子集)
- 方法的位元組碼(bytecodes)、運算元棧、區域性變量表及大小(abstract 和 native 方法除外)
異常表(abstract 和 native 方法除外)
每個異常處理的開始位置、結束位置、程式碼處理在程式計數器中的偏移地址、被捕獲的異常類的常量池索引
non-final的類變數
靜態變數和類關聯在一起,隨著類的載入而載入,他們成為類資料在邏輯上的一部分
類變數被類的所有例項共享,即使沒有類例項時,你也可以訪問它
/**
* non-final的類變數
*
* @author: Nemo
*/
public class MethodAreaTest {
public static void main(String[] args) {
Order order = new Order();
order.hello();
System.out.println(order.count);
}
}
class Order {
public static int count = 1;
public static final int number = 2;
public static void hello() {
System.out.println("hello!");
}
}
如上程式碼所示,即使我們把 order 設定為 null,也不會出現空指標異常
全域性常量
全域性常量就是使用 static final 進行修飾
被宣告為 final 的類變數的處理方法則不同,每個全域性常量在編譯的時候就會被分配了。
執行時常量池 VS 常量池
執行時常量池,就是執行時常量池
- 方法區,內部包含了執行時常量池
- 位元組碼檔案,內部包含了常量池
- 要弄清楚方法區,需要理解清楚 ClassFile,因為載入類的資訊都在方法區。
- 要弄清楚方法區的執行時常量池,需要理解清楚 ClassFile 中的常量池。
https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html
常量池
一個有效的位元組碼檔案中除了包含類的版本資訊、欄位、方法以及介面等描述符資訊外,還包含一項資訊就是常量池表(Constant Pool Table),包括各種字面量和對型別、域和方法的符號引用
為什麼需要常量池
一個 java 原始檔中的類、介面,編譯後產生一個位元組碼檔案。而 Java 中的位元組碼需要資料支援,通常這種資料會很大以至於不能直接存到位元組碼裡,換另一種方式,可以存到常量池,這個位元組碼包含了指向常量池的引用。在動態連結的時候會用到執行時常量池,之前有介紹。
比如:如下的程式碼:
public class SimpleClass {
public void sayHello() {
System.out.println("hello");
}
}
雖然上述程式碼只有 194 位元組,但是裡面卻使用了 String、System、PrintStream 及 Object 等結構。這裡的程式碼量其實很少了,如果程式碼多的話,引用的結構將會更多,這裡就需要用到常量池了。
常量池中有什麼
- 數量值
- 字串值
- 類引用
- 欄位引用
- 方法引用
例如下面這段程式碼
public class MethodAreaTest2 {
public static void main(String args[]) {
Object obj = new Object();
}
}
將會被翻譯成如下位元組碼
new #2
dup
invokespecial
小結
常量池、可以看做是一張表,虛擬機器指令根據這張常量表找到要執行的類名、方法名、引數型別、字面量等型別
執行時常量池
執行時常量池(Runtime Constant Pool)是方法區的一部分。
常量池表(Constant Pool Table)是 Class 檔案的一部分,用於存放編譯期生成的各種字面量與符號引用,這部分內容將在類載入後存放到方法區的執行時常量池中。
執行時常量池,在載入類和介面到虛擬機器後,就會建立對應的執行時常量池。
JVM 為每個已載入的型別(類或介面)都維護一個常量池。池中的資料項像陣列項一樣,是通過索引訪問的。
執行時常量池中包含多種不同的常量,包括編譯期就已經明確的數值字面量,也包括到執行期解析後才能夠獲得的方法或者欄位引用。此時不再是常量池中的符號地址了,這裡換為真實地址。
- 執行時常量池,相對於 Class 檔案常量池的另一重要特徵是:具備動態性。
String.intern()
執行時常量池類似於傳統程式語言中的符號表(symboltable),但是它所包含的資料卻比符號表要更加豐富一些。
當建立類或介面的執行時常量池時,如果構造執行時常量池所需的記憶體空間超過了方法區所能提供的最大值,則 JVM 會拋 OutOfMemoryError 異常。
方法區使用舉例
如下程式碼
public class MethodAreaDemo {
public static void main(String args[]) {
int x = 500;
int y = 100;
int a = x / y;
int b = 50;
System.out.println(a+b);
}
}
位元組碼執行過程展示
首先現將運算元500放入到運算元棧中
然後儲存到區域性變量表中
然後重複一次,把 100 放入區域性變量表中,最後再將變量表中的 500 和 100 取出,進行操作
將 500 和 100 進行一個除法運算,在把結果入棧
在最後就是輸出流,需要呼叫執行時常量池的常量
最後呼叫 invokevirtual(虛方法呼叫),然後返回
返回時
程式計數器始終計算的都是當前程式碼執行的位置,目的是為了方便記錄方法呼叫後能夠正常返回,或者是進行了 CPU 切換後,也能回來到原來的程式碼進行執行。
方法區的演進細節
首先明確:只有 Hotspot 才有永久代。BEA JRockit、IBMJ9 等來說,是不存在永久代的概念的。原則上如何實現方法區屬於虛擬機器實現細節,不受《Java 虛擬機器規範》管束,並不要求統一
Hotspot 中方法區的變化:
JDK 版本 | 方法區的變化 |
---|---|
JDK1.6 及以前 | 有永久代,靜態變數儲存在永久代上 |
JDK1.7 | 有永久代,但已經逐步“去永久代”,字串常量池,靜態變數移除,儲存在堆中 |
JDK1.8 | 無永久代,型別資訊,欄位,方法,常量儲存在本地記憶體的元空間,但字串常量池、靜態變數仍然在堆中。 |
JDK6 的時候
JDK7 的時候
JDK8 的時候,元空間大小隻受實體記憶體影響
為什麼永久代要被元空間替代?
官方解釋:http://openjdk.java.net/jeps/122
JRockit 是和 HotSpot 融合後的結果,因為 JRockit 沒有永久代,所以他們不需要配置永久代
隨著 Java8 的到來,HotSpot VM 中再也見不到永久代了。但是這並不意味著類的元資料資訊也消失了。這些資料被移到了一個與堆不相連的本地記憶體區域,這個區域叫做元空間(Metaspace)。
由於類的元資料分配在本地記憶體中,元空間的最大可分配空間就是系統可用記憶體空間,這項改動是很有必要的,原因有:
- 為永久代設定空間大小是很難確定的。
在某些場景下,如果動態載入類過多,容易產生 Perm 區的 OOM。比如某個實際 Web 工
程中,因為功能點比較多,在執行過程中,要不斷動態載入很多類,經常出現致命錯誤。
“Exception in thread‘dubbo client x.x connector'java.lang.OutOfMemoryError:PermGen space”
而元空間和永久代之間最大的區別在於:元空間並不在虛擬機器中,而是使用本地記憶體。
因此,預設情況下,元空間的大小僅受本地記憶體限制。 - 對永久代進行調優是很困難的。
- 主要是為了降低 Full GC
有些人認為方法區(如 HotSpot 虛擬機器中的元空間或者永久代)是沒有垃圾收集行為的,其實不然。《Java 虛擬機器規範》對方法區的約束是非常寬鬆的,提到過可以不要求虛擬機器在方法區中實現垃圾收集。事實上也確實有未實現或未能完整實現方法區型別解除安裝的收集器存在(如 JDK11 時期的 ZGC 收集器就不支援類解除安裝)。
一般來說這個區域的回收效果比較難令人滿意,尤其是型別的解除安裝,條件相當苛刻。但是這部分割槽域的回收有時又確實是必要的。以前 sun 公司的 Bug 列表中,曾出現過的若干個嚴重的 Bug 就是由於低版本的 HotSpot 虛擬機器對此區域未完全回收而導致記憶體洩漏
方法區的垃圾收集主要回收兩部分內容:常量池中廢棄的常量和不在使用的型別
StringTable為什麼要調整位置
jdk7 中將 StringTable 放到了堆空間中。因為永久代的回收效率很低,在 full gc 的時候才會觸發。而 full gc 是老年代的空間不足、永久代不足時才會觸發。
這就導致 stringTable 回收效率不高。而我們開發中會有大量的字串被建立,回收效率低,導致永久代記憶體不足。放到堆裡,能及時回收記憶體。
靜態變數存放在那裡?
靜態引用對應的物件實體始終都存在堆空間
可以使用 jhsdb.ext,需要在 jdk9 的時候才引入的
staticObj 隨著 Test 的型別資訊存放在方法區,instanceObj 隨著 Test 的物件例項存放在 Java 堆,localObject 則是存放在 foo() 方法棧幀的區域性變量表中。
測試發現:三個物件的資料在記憶體中的地址都落在 Eden 區範圍內。
所以結論:只要是物件例項必然會在 Java 堆中分配。
接著,找到了一個引用該 staticobj 物件的地方,是在一個 java.lang.Class 的例項裡,並且給出了這個例項的地址,通過 Inspector 檢視該物件例項,可以清楚看到這確實是一個 java.lang.Class 型別的物件例項,裡面有一個名為 staticobj 的例項欄位:
從《Java 虛擬機器規範》所定義的概念模型來看,所有 Class 相關的資訊都應該存放在方法區之中,但方法區該如何實現,《Java 虛擬機器規範》並未做出規定,這就成了一件允許不同虛擬機器自己靈活把握的事情。JDK7 及其以後版本的 HotSpot 虛擬機器選擇把靜態變數與型別在 Java 語言一端的對映class物件存放在一起,儲存於 Java 堆之中,從我們的實驗中也明確驗證了這一點
方法區的垃圾回收
有些人認為方法區(如 Hotspot 虛擬機器中的元空間或者永久代)是沒有垃圾收集行為的,其實不然。《Java 虛擬機器規範》對方法區的約束是非常寬鬆的,提到過可以不要求虛擬機器在方法區中實現垃圾收集。事實上也確實有未實現或未能完整實現方法區型別解除安裝的收集器存在(如 JDK11 時期的 ZGC 收集器就不支援類解除安裝)。
一般來說這個區域的回收效果比較難令人滿意,尤其是型別的解除安裝,條件相當苛刻。但是這部分割槽域的回收有時又確實是必要的。以前 sun 公司的 Bug 列表中,曾出現過的若干個嚴重的 Bug 就是由於低版本的 HotSpot 虛擬機器對此區域未完全回收而導致記憶體洩漏。
方法區的垃圾收集主要回收兩部分內容:常量池中廢棄的常量和不再使用的型別。
先來說說方法區內常量池之中主要存放的兩大類常量:字面量和符號引用。字面量比較接近 Java 語言層次的常量概念,如文字字串、被宣告為 final 的常量值等。而符號引用則屬於編譯原理方面的概念,包括下面三類常量:
- 類和介面的全限定名
- 欄位的名稱和描述符
- 方法的名稱和描述符
HotSpot 虛擬機器對常量池的回收策略是很明確的,只要常量池中的常量沒有被任何地方引用,就可以被回收。
回收廢棄常量與回收 Java 堆中的物件非常類似。(關於常量的回收比較簡單,重點是類的回收)
判定一個常量是否“廢棄”還是相對簡單,而要判定一個型別是否屬於“不再被使用的類”的條件就比較苛刻了。需要同時滿足下面三個條件:
- 該類所有的例項都已經被回收,也就是 Java 堆中不存在該類及其任何派生子類的例項。
載入該類的類載入器已經被回收,這個條件除非是經過精心設計的可替換類載入器的場景,如 OSGi、JSP 的重載入等,否則通常是很難達成的。 - 該類對應的 java.lang.Class 物件沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。
Java 虛擬機器被允許對滿足上述三個條件的無用類進行回收,這裡說的僅僅是“被允許”,而並不是和物件一樣,沒有引用了就必然會回收。關於是否要對型別進行回收,HotSpot 虛擬機器提供了 -Xnoclassgc
引數進行控制,還可以使用 -verbose:class
以及 -XX:+TraceClass-Loading
、-XX:+TraceClassUnLoading
檢視類載入和解除安裝資訊
在大量使用反射、動態代理、CGLib等位元組碼框架,動態生成 JSP 以及 oSGi 這類頻繁自定義類載入器的場景中,通常都需要 Java 虛擬機器具備型別解除安裝的能力,以保證不會對方法區造成過大的記憶體壓力。
總結
常見面試題
百度
三面:說一下 JVM 記憶體模型吧,有哪些區?分別幹什麼的?
螞蟻金服:
Java8 的記憶體分代改進
JVM 記憶體分哪幾個區,每個區的作用是什麼?
一面:JVM 記憶體分佈/記憶體結構?棧和堆的區別?堆的結構?為什麼兩個 survivor 區?
二面:Eden 和 survior 的比例分配
小米:
jvm 記憶體分割槽,為什麼要有新生代和老年代
位元組跳動:
二面:Java 的記憶體分割槽
二面:講講 jvm 執行時資料庫區
什麼時候物件會進入老年代?
京東:
JVM 的記憶體結構,Eden 和 Survivor 比例。
JVM 記憶體為什麼要分成新生代,老年代,持久代。新生代中為什麼要分為 Eden 和 survivor。
天貓:
一面:JVM 記憶體模型以及分割槽,需要詳細到每個區放什麼。
一面:JVM 的記憶體模型,Java8 做了什麼改
拼多多:
JVM 記憶體分哪幾個區,每個區的作用是什麼?
美團:
java 記憶體分配
jvm 的永久代中會發生垃圾回收嗎?
一面:jvm 記憶體分割槽,為什麼要有新生代和老年代?