Java 記憶體分配全面淺析
進入正題前首先要知道的是Java程式執行在JVM(Java Virtual Machine,Java虛擬機器)上,可以把JVM理解成Java程式和作業系統之間的橋樑,JVM實現了Java的平臺無關性,由此可見JVM的重要性。所以在學習Java記憶體分配原理的時候一定要牢記這一切都是在JVM中進行的,JVM是記憶體分配原理的基礎與前提。
簡單通俗的講,一個完整的Java程式執行過程會涉及以下記憶體區域:
l 暫存器:JVM內部虛擬暫存器,存取速度非常快,程式不可控制。
l 棧:儲存區域性變數的值,包括:1.用來儲存基本資料型別的值;2.儲存類的例項,即堆區物件的引用(指標)。也可以用來儲存載入方法時的幀。
l 堆:用來存放動態產生的資料,比如new出來的物件。注意創建出來的物件只包含屬於各自的成員變數,並不包括成員方法。因為同一個類的物件擁有各自的成員變數,儲存在各自的堆中,但是他們共享該類的方法,並不是每建立一個物件就把成員方法複製一次。
l 常量池:JVM為每個已載入的型別維護一個常量池,常量池就是這個型別用到的常量的一個有序集合。包括直接常量(基本型別,String)和對其他型別、方法、欄位的符號引用(1)。池中的資料和陣列一樣通過索引訪問。由於常量池包含了一個型別所有的對其他型別、方法、欄位的符號引用,所以常量池在Java的動態連結中起了核心作用。常量池存在於堆中
l 程式碼段:用來存放從硬碟上讀取的源程式程式碼。
l 資料段:用來存放static定義的靜態成員。
下面是記憶體表示圖:
上圖中大致描述了Java記憶體分配,接下來通過例項詳細講解Java程式是如何在記憶體中執行的(注:以下圖片引用自尚學堂馬士兵老師的J2SE課件,圖右側是程式程式碼,左側是記憶體分配示意圖,我會一一加上註釋)。
預備知識:
1.一個Java檔案,只要有main入口方法,我們就認為這是一個Java程式,可以單獨編譯執行。
2.無論是普通型別的變數還是引用型別的變數(俗稱例項),都可以作為區域性變數,他們都可以出現在棧中。只不過普通型別的變數在棧中直接儲存它所對應的值,而引用型別的變數儲存的是一個指向堆區的指標,通過這個指標,就可以找到這個例項在堆區對應的物件。因此,普通型別變數只在棧區佔用一塊記憶體,而引用型別變數要在棧區和堆區各佔一塊記憶體。
示例:
1.JVM自動尋找main方法,執行第一句程式碼,建立一個Test類的例項,在棧中分配一塊記憶體,存放一個指向堆區物件的指標110925。
2.建立一個int型的變數date,由於是基本型別,直接在棧中存放date對應的值9。
3.建立兩個BirthDate類的例項d1、d2,在棧中分別存放了對應的指標指向各自的物件。他們在例項化時呼叫了有引數的構造方法,因此物件中有自定義初始值。
呼叫test物件的change1方法,並且以date為引數。JVM讀到這段程式碼時,檢測到i是區域性變數,因此會把i放在棧中,並且把date的值賦給i。
把1234賦給i。很簡單的一步。
change1方法執行完畢,立即釋放區域性變數i所佔用的棧空間。
呼叫test物件的change2方法,以例項d1為引數。JVM檢測到change2方法中的b引數為區域性變數,立即加入到棧中,由於是引用型別的變數,所以b中儲存的是d1中的指標,此時b和d1指向同一個堆中的物件。在b和d1之間傳遞是指標。
change2方法中又例項化了一個BirthDate物件,並且賦給b。在內部執行過程是:在堆區new了一個物件,並且把該物件的指標儲存在棧中的b對應空間,此時例項b不再指向例項d1所指向的物件,但是例項d1所指向的物件並無變化,這樣無法對d1造成任何影響。
change2方法執行完畢,立即釋放區域性引用變數b所佔的棧空間,注意只是釋放了棧空間,堆空間要等待自動回收。
呼叫test例項的change3方法,以例項d2為引數。同理,JVM會在棧中為區域性引用變數b分配空間,並且把d2中的指標存放在b中,此時d2和b指向同一個物件。再呼叫例項b的setDay方法,其實就是呼叫d2指向的物件的setDay方法。
呼叫例項b的setDay方法會影響d2,因為二者指向的是同一個物件。
change3方法執行完畢,立即釋放區域性引用變數b。
以上就是Java程式執行時記憶體分配的大致情況。其實也沒什麼,掌握了思想就很簡單了。無非就是兩種型別的變數:基本型別和引用型別。二者作為區域性變數,都放在棧中,基本型別直接在棧中儲存值,引用型別只儲存一個指向堆區的指標,真正的物件在堆裡。作為引數時基本型別就直接傳值,引用型別傳指標。
小結:
1.分清什麼是例項什麼是物件。Class a= new Class();此時a叫例項,而不能說a是物件。例項在棧中,物件在堆中,操作例項實際上是通過例項的指標間接操作物件。多個例項可以指向同一個物件。
2.棧中的資料和堆中的資料銷燬並不是同步的。方法一旦結束,棧中的區域性變數立即銷燬,但是堆中物件不一定銷燬。因為可能有其他變數也指向了這個物件,直到棧中沒有變數指向堆中的物件時,它才銷燬,而且還不是馬上銷燬,要等垃圾回收掃描時才可以被銷燬。
3.以上的棧、堆、程式碼段、資料段等等都是相對於應用程式而言的。每一個應用程式都對應唯一的一個JVM例項,每一個JVM例項都有自己的記憶體區域,互不影響。並且這些記憶體區域是所有執行緒共享的。這裡提到的棧和堆都是整體上的概念,這些堆疊還可以細分。
4.類的成員變數在不同物件中各不相同,都有自己的儲存空間(成員變數在堆中的物件中)。而類的方法卻是該類的所有物件共享的,只有一套,物件使用方法的時候方法才被壓入棧,方法不使用則不佔用記憶體。
以上分析只涉及了棧和堆,還有一個非常重要的記憶體區域:常量池,這個地方往往出現一些莫名其妙的問題。常量池是幹嘛的上邊已經說明了,也沒必要理解多麼深刻,只要記住它維護了一個已載入類的常量就可以了。接下來結合一些例子說明常量池的特性。
預備知識:
基本型別和基本型別的包裝類。基本型別有:byte、short、char、int、long、boolean。基本型別的包裝類分別是:Byte、Short、Character、Integer、Long、Boolean。注意區分大小寫。二者的區別是:基本型別體現在程式中是普通變數,基本型別的包裝類是類,體現在程式中是引用變數。因此二者在記憶體中的儲存位置不同:基本型別儲存在棧中,而基本型別包裝類儲存在堆中。上邊提到的這些包裝類都實現了常量池技術,另外兩種浮點數型別的包裝類則沒有實現。另外,String型別也實現了常量池技術。
例項:
public class test {
public static void main(String[] args) {
objPoolTest();
}
public static void objPoolTest() {
int i = 40;
int i0 = 40;
Integer i1 = 40;
Integer i2 = 40;
Integer i3 = 0;
Integer i4 = new Integer(40);
Integer i5 = new Integer(40);
Integer i6 = new Integer(0);
Double d1=1.0;
Double d2=1.0;
System.out.println("i=i0\t" + (i == i0));
System.out.println("i1=i2\t" + (i1 == i2));
System.out.println("i1=i2+i3\t" + (i1 == i2 + i3));
System.out.println("i4=i5\t" + (i4 == i5));
System.out.println("i4=i5+i6\t" + (i4 == i5 + i6));
System.out.println("d1=d2\t" + (d1==d2));
System.out.println();
}
}
結果:
i=i0 true
i1=i2 true
i1=i2+i3 true
i4=i5 false
i4=i5+i6 true
d1=d2 false
結果分析:
1.i和i0均是普通型別(int)的變數,所以資料直接儲存在棧中,而棧有一個很重要的特性:棧中的資料可以共享。當我們定義了int i = 40;,再定義int i0 = 40;這時候會自動檢查棧中是否有40這個資料,如果有,i0會直接指向i的40,不會再新增一個新的40。
2.i1和i2均是引用型別,在棧中儲存指標,因為Integer是包裝類。由於Integer包裝類實現了常量池技術,因此i1、i2的40均是從常量池中獲取的,均指向同一個地址,因此i1=12。
3.很明顯這是一個加法運算,Java的數學運算都是在棧中進行的,Java會自動對i1、i2進行拆箱操作轉化成整型,因此i1在數值上等於i2+i3。
4.i4和i5均是引用型別,在棧中儲存指標,因為Integer是包裝類。但是由於他們各自都是new出來的,因此不再從常量池尋找資料,而是從堆中各自new一個物件,然後各自儲存指向物件的指標,所以i4和i5不相等,因為他們所存指標不同,所指向物件不同。
5.這也是一個加法運算,和3同理。
6.d1和d2均是引用型別,在棧中儲存指標,因為Double是包裝類。但Double包裝類沒有實現常量池技術,因此Doubled1=1.0;相當於Double d1=new Double(1.0);,是從堆new一個物件,d2同理。因此d1和d2存放的指標不同,指向的物件不同,所以不相等。
小結:
1.以上提到的幾種基本型別包裝類均實現了常量池技術,但他們維護的常量僅僅是【-128至127】這個範圍內的常量,如果常量值超過這個範圍,就會從堆中建立物件,不再從常量池中取。比如,把上邊例子改成Integer i1 = 400; Integer i2 = 400;,很明顯超過了127,無法從常量池獲取常量,就要從堆中new新的Integer物件,這時i1和i2就不相等了。
2.String型別也實現了常量池技術,但是稍微有點不同。String型是先檢測常量池中有沒有對應字串,如果有,則取出來;如果沒有,則把當前的新增進去。
凡是涉及記憶體原理,一般都是博大精深的領域,切勿聽信一家之言,多讀些文章。我在這只是淺析,裡邊還有很多貓膩,就留給讀者探索思考了。希望本文能對大家有所幫助!
腳註:
(1) 符號引用,顧名思義,就是一個符號,符號引用被使用的時候,才會解析這個符號。如果熟悉linux或unix系統的,可以把這個符號引用看作一個檔案的軟連結,當使用這個軟連線的時候,才會真正解析它,展開它找到實際的檔案
對於符號引用,在類載入層面上討論比較多,原始碼級別只是一個形式上的討論。
當一個類被載入時,該類所用到的別的類的符號引用都會儲存在常量池,實際程式碼執行的時候,首次遇到某個別的類時,JVM會對常量池的該類的符號引用展開,轉為直接引用,這樣下次再遇到同樣的型別時,JVM就不再解析,而直接使用這個已經被解析過的直接引用。
除了上述的類載入過程的符號引用說法,對於原始碼級別來說,就是依照引用的解析過程來區別程式碼中某些資料屬於符號引用還是直接引用,如,System.out.println("test" +"abc");//這裡發生的效果相當於直接引用,而假設某個Strings = "abc"; System.out.println("test" + s);//這裡的發生的效果相當於符號引用,即把s展開解析,也就相當於s是"abc"的一個符號連結,也就是說在編譯的時候,class檔案並沒有直接展看s,而把這個s看作一個符號,在實際的程式碼執行時,才會展開這個。
參考文章: