深入理解JVM內存模型
我們知道,計算機CPU和內存的交互是最頻繁的,內存是我們的高速緩存區,用戶磁盤和CPU的交互,而CPU運轉速度越來越快,磁盤遠遠跟不上CPU的讀寫速度,才設計了內存,用戶緩沖用戶IO等待導致CPU的等待成本,但是隨著CPU的發展,內存的讀寫速度也遠遠跟不上CPU的讀寫速度,因此,為了解決這一糾紛,CPU廠商在每顆CPU上加入了高速緩存,用來緩解這種癥狀,因此,現在CPU同內存交互就變成了下面的樣子。
同樣,根據摩爾定律,我們知道單核
CPU的主頻不可能無限制的增長,要想很多的提升新能,需要多個處理器協同工作, Intel總裁的貝瑞特單膝下跪事件標誌著多核時代的到來。
基於高速緩存的存儲交互很好的解決了處理器與內存之間的矛盾,也引入了新的問題:緩存一致性問題。在多處理器系統中,每個處理器有自己的高速緩存,而他們又共享同一塊內存(下文成主存,
Java
虛擬機內存模型中定義的訪問操作與物理計算機處理的基本一致!
Java
中通過多線程機制使得多個任務同時執行處理,所有的線程共享JVM內存區域main memory,而每個線程又單獨的有自己的工作內存,當線程與內存區域進行交互時,數據從主存拷貝到工作內存,進而交由線程處理(操作碼+在之前,我們也已經提到,JVM的邏輯內存模型如下:
我們現在來逐個的看下每個到底是做什麽的!
1、程序計數器
程序計數器(Program Counter Register)是一塊較小的內存空間,它的作用可以看
做是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型裏(僅是概念模型,
各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變
這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、
線程恢復等基礎功能都需要依賴這個計數器來完成。
由於Java 虛擬機的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現
的,在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個內核)只會執行
一條線程中的指令。因此,為了線程切換後能恢復到正確的執行位置,每條線程都需要
有一個獨立的程序計數器,各條線程之間的計數器互不影響,獨立存儲,我們稱這類內
存區域為“線程私有”的內存。
如果線程正在執行的是一個Java 方法,這個計數器記錄的是正在執行的虛擬機字節
碼指令的地址;如果正在執行的是Natvie 方法,這個計數器值則為空(Undefined)。此
內存區域是唯一一個在Java 虛擬機規範中沒有規定任何OutOfMemoryError 情況的區域。
2、Java 虛擬機棧
與程序計數器一樣,Java 虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,
它的生命周期與線程相同。虛擬機棧描述的是Java 方法執行的內存模型:每個方法被執
行的時候都會同時創建一個棧幀(Stack Frame ①)用於存儲局部變量表、操作棧、動態
鏈接、方法出口等信息。每一個方法被調用直至執行完成的過程,就對應著一個棧幀在
虛擬機棧中從入棧到出棧的過程。
經常有人把Java 內存區分為堆內存(Heap)和棧內存(Stack),這種分法比較粗
糙,Java 內存區域的劃分實際上遠比這復雜。這種劃分方式的流行只能說明大多數程序
員最關註的、與對象內存分配關系最密切的內存區域是這兩塊。其中所指的“堆”在後
面會專門講述,而所指的“棧”就是現在講的虛擬機棧,或者說是虛擬機棧中的局部變
量表部分。
局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、
float、long、double)、對象引用(reference 類型,它不等同於對象本身,根據不同的虛擬
機實現,它可能是一個指向對象起始地址的引用指針,也可能指向一個代表對象的句柄或
者其他與此對象相關的位置)和returnAddress 類型(指向了一條字節碼指令的地址)。
其中64 位長度的long 和double 類型的數據會占用2 個局部變量空間(Slot),其余
的數據類型只占用1 個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個
方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間
不會改變局部變量表的大小。
在Java 虛擬機規範中,對這個區域規定了兩種異常狀況:如果線程請求的棧深度大
於虛擬機所允許的深度,將拋出StackOverflowError 異常;如果虛擬機棧可以動態擴展
(當前大部分的Java 虛擬機都可動態擴展,只不過Java 虛擬機規範中也允許固定長度的
虛擬機棧),當擴展時無法申請到足夠的內存時會拋出OutOfMemoryError 異常。
3、本地方法棧
本地方法棧(Native Method Stacks)與虛擬機棧所發揮的作用是非常相似的,其
區別不過是虛擬機棧為虛擬機執行Java 方法(也就是字節碼)服務,而本地方法棧則
是為虛擬機使用到的Native 方法服務。虛擬機規範中對本地方法棧中的方法使用的語
言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。甚至
有的虛擬機(譬如Sun HotSpot 虛擬機)直接就把本地方法棧和虛擬機棧合二為一。
與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError 和OutOfMemoryError
異常。
4、Java 堆
對於大多數應用來說,Java 堆(Java Heap)是Java 虛擬機所管理的內存中最大的
一塊。Java 堆是被所有線程共享的一塊內存區域,在虛擬機啟動時創建。此內存區域的
唯一目的就是存放對象實例,幾乎所有的對象實例都在這裏分配內存。這一點在Java 虛
擬機規範中的描述是:所有的對象實例以及數組都要在堆上分配①,但是隨著JIT 編譯器
的發展與逃逸分析技術的逐漸成熟,棧上分配、標量替換②優化技術將會導致一些微妙
的變化發生,所有的對象都分配在堆上也漸漸變得不是那麽“絕對”了。
Java 堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC 堆”(Garbage
Collected Heap,幸好國內沒翻譯成“垃圾堆”)。如果從內存回收的角度看,由於現在
收集器基本都是采用的分代收集算法,所以Java 堆中還可以細分為:新生代和老年代;
再細致一點的有Eden 空間、From Survivor 空間、To Survivor 空間等。如果從內存分配
的角度看,線程共享的Java 堆中可能劃分出多個線程私有的分配緩沖區(Thread Local
Allocation Buffer,TLAB)。不過,無論如何劃分,都與存放內容無關,無論哪個區域,
存儲的都仍然是對象實例,進一步劃分的目的是為了更好地回收內存,或者更快地分配
內存。在本章中,我們僅僅針對內存區域的作用進行討論,Java 堆中的上述各個區域的
分配和回收等細節將會是下一章的主題。
根據Java 虛擬機規範的規定,Java 堆可以處於物理上不連續的內存空間中,只要
邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小
的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx
和-Xms 控制)。如果在堆中沒有內存完成實例分配,並且堆也無法再擴展時,將會拋出
OutOfMemoryError 異常。
4、方法區
方法區(Method Area)與Java 堆一樣,是各個線程共享的內存區域,它用於存
儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。雖
然Java 虛擬機規範把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-
Heap(非堆),目的應該是與Java 堆區分開來。
對於習慣在HotSpot 虛擬機上開發和部署程序的開發者來說,很多人願意把方法區
稱為“永久代”(Permanent Generation),本質上兩者並不等價,僅僅是因為HotSpot 虛
擬機的設計團隊選擇把GC 分代收集擴展至方法區,或者說使用永久代來實現方法區而
已。對於其他虛擬機(如BEA JRockit、IBM J9 等)來說是不存在永久代的概念的。即
使是HotSpot 虛擬機本身,根據官方發布的路線圖信息,現在也有放棄永久代並“搬家”
至Native Memory 來實現方法區的規劃了。
Java 虛擬機規範對這個區域的限制非常寬松,除了和Java 堆一樣不需要連續的內
存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾
收集行為在這個區域是比較少出現的,但並非數據進入了方法區就如永久代的名字一
樣“永久”存在了。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸
載,一般來說這個區域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件
相當苛刻,但是這部分區域的回收確實是有必要的。在Sun 公司的BUG 列表中,曾出
現過的若幹個嚴重的BUG 就是由於低版本的HotSpot 虛擬機對此區域未完全回收而導
致內存泄漏。
根據Java 虛擬機規範的規定,當方法區無法滿足內存分配需求時,將拋出
OutOfMemoryError 異常。
5、運行時常量池
運行時常量池(Runtime Constant Pool)是方法區的一部分。Class 文件中除了有
類的版本、字段、方法、接口等描述等信息外,還有一項信息是常量池(Constant Pool
Table),用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載後存放
到方法區的運行時常量池中。
Java 虛擬機對Class 文件的每一部分(自然也包括常量池)的格式都有嚴格的規
定,每一個字節用於存儲哪種數據都必須符合規範上的要求,這樣才會被虛擬機認可、
裝載和執行。但對於運行時常量池,Java 虛擬機規範沒有做任何細節的要求,不同的
提供商實現的虛擬機可以按照自己的需要來實現這個內存區域。不過,一般來說,除
了保存Class 文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運行時常
量池中①。
運行時常量池相對於Class 文件常量池的另外一個重要特征是具備動態性,Java 語
言並不要求常量一定只能在編譯期產生,也就是並非預置入Class 文件中常量池的內容
才能進入方法區運行時常量池,運行期間也可能將新的常量放入池中,這種特性被開發
人員利用得比較多的便是String 類的intern() 方法。
既然運行時常量池是方法區的一部分,自然會受到方法區內存的限制,當常量池無
法再申請到內存時會拋出OutOfMemoryError 異常
6、直接內存
直接內存(Direct Memory)並不是虛擬機運行時數據區的一部分,也不是Java
虛擬機規範中定義的內存區域,但是這部分內存也被頻繁地使用,而且也可能導致
OutOfMemoryError 異常出現,所以我們放到這裏一起講解。
在JDK 1.4 中新加入了NIO(New Input/Output)類,引入了一種基於通道(Channel)
與緩沖區(Buffer)的I/O 方式,它可以使用Native 函數庫直接分配堆外內存,然
後通過一個存儲在Java 堆裏面的DirectByteBuffer 對象作為這塊內存的引用進行
操作。這樣能在一些場景中顯著提高性能,因為避免了在Java 堆和Native 堆中來
回復制數據。
顯然,本機直接內存的分配不會受到Java 堆大小的限制,但是,既然是內存,則
肯定還是會受到本機總內存(包括RAM 及SWAP 區或者分頁文件)的大小及處理器
尋址空間的限制。服務器管理員配置虛擬機參數時,一般會根據實際內存設置-Xmx
等參數信息,但經常會忽略掉直接內存,使得各個內存區域的總和大於物理內存限制
(包括物理上的和操作系統級的限制),從而導致動態擴展時出現OutOfMemoryError
異常。
邏輯內存模型我們已經看到了,那當我們建立一個對象的時候是怎麽進行訪問的呢?
在Java 語言中,對象訪問是如何進行的?對象訪問在Java 語言中無處不在,是最普通的程序行為,但即使是最簡單的訪問,也會卻涉及Java 棧、Java 堆、方法區這三個最重要內存區
域之間的關聯關系,如下面的這句代碼:
Object obj = new Object();
假設這句代碼出現在方法體中,那“Object obj”這部分的語義將會反映到Java 棧
的本地變量表中,作為一個reference 類型數據出現。而“new Object()”這部分的語義
將會反映到Java 堆中,形成一塊存儲了Object 類型所有實例數據值(Instance Data,對
象中各個實例字段的數據)的結構化內存,根據具體類型以及虛擬機實現的對象內存布
局(Object Memory Layout)的不同,這塊內存的長度是不固定的。另外,在Java 堆中
還必須包含能查找到此對象類型數據(如對象類型、父類、實現的接口、方法等)的地
址信息,這些類型數據則存儲在方法區中。
由於reference 類型在Java 虛擬機規範裏面只規定了一個指向對象的引用,並沒有
定義這個引用應該通過哪種方式去定位,以及訪問到Java 堆中的對象的具體位置,因此
不同虛擬機實現的對象訪問方式會有所不同,主流的訪問方式有兩種:使用句柄和直接
指針。
如果使用句柄訪問方式,Java 堆中將會劃分出一塊內存來作為句柄池,reference
中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據和類型數據各自的
具體地址信息,如下圖所示。
如果使用直接指針訪問方式,
Java 堆對象的布局中就必須考慮如何放置訪問類型數據的相關信息,reference 中直接存儲的就是對象地址,如下圖所示
這兩種對象的訪問方式各有優勢,使用句柄訪問方式的最大好處就是
reference 中存儲的是穩定的句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只
會改變句柄中的實例數據指針,而reference 本身不需要被修改。
使用直接指針訪問方式的最大好處就是速度更快,它節省了一次指針定位的時間開
銷,由於對象的訪問在Java 中非常頻繁,因此這類開銷積少成多後也是一項非常可觀的
執行成本。就本書討論的主要虛擬機Sun HotSpot 而言,它是使用第二種方式進行對象訪問的,但從整個軟件開發的範圍來看,各種語言和框架使用句柄來訪問的情況也十分常見。
下面我們來看幾個示例
1、Java 堆溢出
下面的程中我們限制Java 堆的大小為20MB,不可擴展(將堆的最小值-Xms 參
數與最大值-Xmx 參數設置為一樣即可避免堆自動擴展),通過參數-XX:+HeapDump
OnOutOfMemoryError 可以讓虛擬機在出現內存溢出異常時Dump 出當前的內存堆轉儲
快照以便事後進行分析。
參數設置如下
package com.yhj.jvm.memory.heap;
import java.util.ArrayList;
import java.util.List;
/**
* @Described:堆溢出測試
* @VM args:-verbose:gc -Xms20M -Xmx20M -XX:+PrintGCDetails
* @author YHJ create at 2011-11-12 下午07:52:22
* @FileNmae com.yhj.jvm.memory.heap.HeapOutOfMemory.java
*/
public class HeapOutOfMemory {
/**
* @param args
* @Author YHJ create at 2011-11-12 下午07:52:18
*/
public static void main(String[] args) {
List<TestCase> cases = new ArrayList<TestCase>();
while(true){
cases.add(new TestCase());
}
}
}
/**
* @Described:測試用例
* @author YHJ create at 2011-11-12 下午07:55:50
* @FileNmae com.yhj.jvm.memory.heap.HeapOutOfMemory.java
*/
class TestCase{
}
Java 堆內存的OutOfMemoryError異常是實際應用中最常見的內存溢出異常情況。出現Java 堆內
存溢出時,異常堆棧信息“java.lang.OutOfMemoryError”會跟著進一步提示“Java heap
space”。
要解決這個區域的異常,一般的手段是首先通過內存映像分析工具(如Eclipse
Memory Analyzer)對dump 出來的堆轉儲快照進行分析,重點是確認內存中的對象是
否是必要的,也就是要先分清楚到底是出現了內存泄漏(Memory Leak)還是內存溢
出(Memory Overflow)。圖2-5 顯示了使用Eclipse Memory Analyzer 打開的堆轉儲快
照文件。
如果是內存泄漏,可進一步通過工具查看泄漏對象到GC Roots 的引用鏈。於是就
能找到泄漏對象是通過怎樣的路徑與GC Roots 相關聯並導致垃圾收集器無法自動回收
它們的。掌握了泄漏對象的類型信息,以及GC Roots 引用鏈的信息,就可以比較準確
地定位出泄漏代碼的位置。
如果不存在泄漏,換句話說就是內存中的對象確實都還必須存活著,那就應當檢查
虛擬機的堆參數(-Xmx 與-Xms),與機器物理內存對比看是否還可以調大,從代碼上
檢查是否存在某些對象生命周期過長、持有狀態時間過長的情況,嘗試減少程序運行期
的內存消耗。
以上是處理Java 堆內存問題的簡略思路,處理這些問題所需要的知識、工具與經驗
在後面的幾次分享中我會做一些額外的分析。
2、java棧溢出
package com.yhj.jvm.memory.stack;
/**
* @Described:棧層級不足探究
* @VM args:-Xss128k
* @author YHJ create at 2011-11-12 下午08:19:28
* @FileNmae com.yhj.jvm.memory.stack.StackOverFlow.java
*/
public class StackOverFlow {
private int i ;
public void plus() {
i++;
plus();
}
/**
* @param args
* @Author YHJ create at 2011-11-12 下午08:19:21
*/
public static void main(String[] args) {
StackOverFlow stackOverFlow = new StackOverFlow();
try {
stackOverFlow.plus();
} catch (Exception e) {
System.out.println("Exception:stack length:"+stackOverFlow.i);
e.printStackTrace();
} catch (Error e) {
System.out.println("Error:stack length:"+stackOverFlow.i);
e.printStackTrace();
}
}
}
3、常量池溢出(常量池都有哪些信息,我們在後續的JVM類文件結構中詳細描述)
package com.yhj.jvm.memory.constant;
import java.util.ArrayList;
import java.util.List;
/**
* @Described:常量池內存溢出探究
* @VM args : -XX:PermSize=10M -XX:MaxPermSize=10M
* @author YHJ create at 2011-10-30 下午04:28:30
* @FileNmae com.yhj.jvm.memory.constant.ConstantOutOfMemory.java
*/
public class ConstantOutOfMemory {
/**
* @param args
* @throws Exception
* @Author YHJ create at 2011-10-30 下午04:28:25
*/
public static void main(String[] args) throws Exception {
try {
List<String> strings = new ArrayList<String>();
int i = 0;
while(true){
strings.add(String.valueOf(i++).intern());
}
} catch (Exception e) {
e.printStackTrace();
throw e;
}
}
}
4、方法去溢出
package com.yhj.jvm.memory.methodArea;
import java.lang.reflect.Method;
import net.sf.cglib.proxy.Enhancer;
import net.sf.cglib.proxy.MethodInterceptor;
import net.sf.cglib.proxy.MethodProxy;
/**
* @Described:方法區溢出測試
* 使用技術 CBlib
* @VM args : -XX:PermSize=10M -XX:MaxPermSize=10M
* @author YHJ create at 2011-11-12 下午08:47:55
* @FileNmae com.yhj.jvm.memory.methodArea.MethodAreaOutOfMemory.java
*/
public class MethodAreaOutOfMemory {
/**
* @param args
* @Author YHJ create at 2011-11-12 下午08:47:51
*/
public static void main(String[] args) {
while(true){
Enhancer enhancer = new Enhancer();
enhancer.setSuperclass(TestCase.class);
enhancer.setUseCache(false);
enhancer.setCallback(new MethodInterceptor() {
@Override
public Object intercept(Object arg0, Method arg1, Object[] arg2,
MethodProxy arg3) throws Throwable {
return arg3.invokeSuper(arg0, arg2);
}
});
enhancer.create();
}
}
}
/**
* @Described:測試用例
* @author YHJ create at 2011-11-12 下午08:53:09
* @FileNmae com.yhj.jvm.memory.methodArea.MethodAreaOutOfMemory.java
*/
class TestCase{
}
5、直接內存溢出
package com.yhj.jvm.memory.directoryMemory;
import java.lang.reflect.Field;
import sun.misc.Unsafe;
/**
* @Described:直接內存溢出測試
* @VM args: -Xmx20M -XX:MaxDirectMemorySize=10M
* @author YHJ create at 2011-11-12 下午09:06:10
* @FileNmae com.yhj.jvm.memory.directoryMemory.DirectoryMemoryOutOfmemory.java
*/
public class DirectoryMemoryOutOfmemory {
private static final int ONE_MB = 1024*1024;
private static int count = 1;
/**
* @param args
* @Author YHJ create at 2011-11-12 下午09:05:54
*/
public static void main(String[] args) {
try {
Field field = Unsafe.class.getDeclaredField("theUnsafe");
field.setAccessible(true);
Unsafe unsafe = (Unsafe) field.get(null);
while (true) {
unsafe.allocateMemory(ONE_MB);
count++;
}
} catch (Exception e) {
System.out.println("Exception:instance created "+count);
e.printStackTrace();
} catch (Error e) {
System.out.println("Error:instance created "+count);
e.printStackTrace();
}
}
}
深入理解JVM內存模型