1. 程式人生 > 實用技巧 >深入理解Java虛擬機器---棧,堆,方法區

深入理解Java虛擬機器---棧,堆,方法區

ava程式執行時,資料會分割槽存放,JavaStack(Java棧)、heap(堆)、method(方法區)。

1、Java棧

Java棧的區域很小,只有1M,特點是存取速度很快,所以在stack中存放的都是快速執行的任務,基本資料型別的資料,和物件的引用(reference)。

駐留於常規RAM(隨機訪問儲存器)區域。但可通過它的“棧指標”獲取處理的直接支援。棧指標若向下移,會建立新的記憶體;若向上移,則會釋放那些記憶體。這是一種特別快、特別有效的資料儲存方式,僅次於暫存器。建立程式時,Java編譯器必須準確地知道堆疊內儲存的所有資料的“長度”以及“存在時間”。這是由於它必須生成相應的程式碼,以便向上和向下移動指標。這一限制無疑影響了程式的靈活性,所以儘管有些Java資料要儲存在棧裡——特別是物件控制代碼,但Java物件並不放到其中。

JVM只會直接對JavaStack(Java棧)執行兩種操作:①以幀為單位的壓棧或出棧;②通過-Xss來設定,若不夠會丟擲StackOverflowError異常。

1.每個執行緒包含一個棧區,棧中只儲存基本資料型別的資料和自定義物件的引用(不是物件),物件都存放在堆區中
2.每個棧中的資料(原始型別和物件引用)都是私有的,其他棧不能訪問。
3.棧分為3個部分:基本資料型別的變數區、執行環境上下文、操作指令區(存放操作指令)。

棧是存放執行緒呼叫方法時儲存區域性變量表,操作,方法出口等與方法執行相關的資訊,Java棧所佔記憶體的大小由Xss來調節,方法呼叫層次太多會撐爆這個區域。

2、程式計數器(ProgramCounter)暫存器

PC暫存器( PC register ):每個執行緒啟動的時候,都會建立一個PC(Program Counter,程式計數器)暫存器。PC暫存器裡儲存有當前正在執行的JVM指令的地址。 每一個執行緒都有它自己的PC暫存器,也是該執行緒啟動時建立的。儲存下一條將要執行的指令地址的暫存器是:PC暫存器。PC暫存器的內容總是指向下一條將被執行指令的地址,這裡的地址可以是一個本地指標,也可以是在方法區中相對應於該方法起始指令的偏移量。

3、本地方法棧

Nativemethodstack(本地方法棧):儲存native方法進入區域的地址。

4、堆

類的物件放在heap(堆)中,所有的類物件都是通過new方法建立,建立後,在stack(棧)會建立類物件的引用(記憶體地址)。

一種常規用途的記憶體池(也在RAM(隨機存取儲存器 )區域),其中儲存了Java物件。和棧不同:“記憶體堆”或“堆”最吸引人的地方在於編譯器不必知道要從堆裡分配多少儲存空間,也不必知道儲存的資料要在堆裡停留多長的時間。因此,用堆儲存資料時會得到更大的靈活性。要求建立一個物件時,只需用new命令編輯相應的程式碼即可。執行這些程式碼時,會在堆裡自動進行資料的儲存。當然,為達到這種靈活性,必然會付出一定的代價:在堆裡分配儲存空間時會花掉更長的時間。

JVM將所有物件的例項(即用new建立的物件)(對應於物件的引用(引用就是記憶體地址))的記憶體都分配在堆上,堆所佔記憶體的大小由-Xmx指令和-Xms指令來調節,sample如下所示:

  1. public class HeapOOM {
  2. static class OOMObject{}
  3. /**
  4. * @param args
  5. */
  6. public static void main(String[] args) {
  7. List list = new ArrayList();// List類和ArrayList類都是集合類,
  8. // 但是ArrayList可以理解為順序表,
  9. // 屬於線性表。
  10. while (true) {
  11. list.add(new OOMObject());
  12. }
  13. }
  14. }


加上JVM引數-verbose:gc -Xms10M -Xmx10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:+HeapDumpOnOutOfMemoryError,就能很快報出OOM異常(記憶體溢位異常):

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

並且能自動生成Dump。

5、方法區

method(方法區)又叫靜態區,存放所有的①類(class),②靜態變數(static變數),③靜態方法,④常量和⑤成員方法。

1.又叫靜態區,跟堆一樣,被所有的執行緒共享。

2.方法區中存放的都是在整個程式中永遠唯一的元素。這也是方法區被所有的執行緒共享的原因。

(順便展開靜態變數和常量的區別: 靜態變數本質是變數,是整個類所有物件共享的一個變數,其值一旦改變對這個類的所有物件都有影響;常量一旦賦值後不能修改其引用,其中基本資料型別的常量不能修改其值。)

Java裡面是沒有靜態變數這個概念的,不信你自己在某個成員方法裡面定義一個static int i = 0;Java裡只有靜態成員變數。它屬於類的屬性。至於他放哪裡?樓上說的是靜態區。我不知道到底有沒有這個翻譯。但是深入JVM裡是翻譯為方法區的。虛擬機器的體系結構:①Java棧,② 堆,③PC暫存器,④方法區,⑤本地方法棧,⑥執行常量池。而方法區儲存的就是一個類的模板,堆是放類的例項(即物件)的。棧是一般來用來函式計算的。隨便找本計算機底層的書都知道了。棧裡的資料,函式執行完就不會儲存了。這就是為什麼區域性變數每一次都是一樣的。就算給他加一後,下次執行函式的時候還是原來的樣子。

方法區的大小由-XX:PermSize和-XX:MaxPermSize來調節,類太多有可能撐爆永久代。靜態變數或常量也有可能撐爆方法區。

6、執行常量池

這兒的“靜態”是指“位於固定位置”。程式執行期間,靜態儲存的資料將隨時等候呼叫。可用static關鍵字指出一個物件的特定元素是靜態的。但Java物件本身永遠都不會置入靜態儲存空間。

這個區域屬於方法區。該區域存放類和介面的常量,除此之外,它還存放成員變數和成員方法的所有引用。當一個成員變數或者成員方法被引用的時候,JVM就通過執行常量池中的這些引用來查詢成員變數和成員方法在記憶體中的的實際地址。

7、舉例分析

例子如下:

為了更清楚地搞明白程式執行時,資料區裡的情況,我們來準備2個小道具(2個非常簡單的小程式)。

  1. // AppMain.java
  2. public class AppMain { //執行時,JVM把AppMain的資訊都放入方法區
  3. public static void main(String[] args) { //main成員方法本身放入方法區。
  4. Sample test1 = new Sample( " 測試1 " ); //test1是引用,所以放到棧區裡,Sample是自定義物件應該放到堆裡面
  5. Sample test2 = new Sample( " 測試2 " );
  6. test1.printName();
  7. test2.printName();
  8. }
  9. }
  10. // Sample.java
  11. public class Sample { //執行時,JVM把appmain的資訊都放入方法區。
  12. private name; //new Sample例項後,name引用放入棧區裡,name物件放入堆裡。
  13. public Sample(String name) {
  14. this .name = name;
  15. }
  16. public void printName() {// printName()成員方法本身放入方法區裡。
  17. System.out.println(name);
  18. }
  19. }

OK,讓我們開始行動吧,出發指令就是:“java AppMain”,包包裡帶好我們的行動向導圖。



系統收到了我們發出的指令,啟動了一個Java虛擬機器程序,這個程序首先從classpath中找到AppMain.class檔案,讀取這個檔案中的二進位制資料,然後把Appmain類的類資訊存放到執行時資料區的方法區中。這一過程稱為AppMain類的載入過程。

接著,JVM定位到方法區中AppMain類的Main()方法的位元組碼,開始執行它的指令。這個main()方法的第一條語句就是:

Sample test1 = new Sample("測試1");

語句很簡單啦,就是讓JVM建立一個Sample例項,並且呢,使引用變數test1引用這個例項。貌似小case一樁哦,就讓我們來跟蹤一下JVM,看看它究竟是怎麼來執行這個任務的:

1、Java虛擬機器一看,不就是建立一個Sample類的例項嗎,簡單,於是就直奔方法區(方法區存放已經載入的類的相關資訊,如類、靜態變數和常量)而去,先找到Sample類的型別資訊再說。結果呢,嘿嘿,沒找到@@,這會兒的方法區裡還沒有Sample類呢(即Sample類的類資訊還沒有進入方法區中)。可JVM也不是一根筋的笨蛋,於是,它發揚“自己動手,豐衣足食”的作風,立馬載入了Sample類, 把Sample類的相關資訊存放在了方法區中。

2、Sample類的相關資訊載入完成後。Java虛擬機器做的第一件事情就是在堆中為一個新的Sample類的例項分配記憶體,這個Sample類的例項持有著指向方法區的Sample類的型別資訊的引用(Java中引用就是記憶體地址)。這裡所說的引用,實際上指的是Sample類的型別資訊在方法區中的記憶體地址,其實,就是有點類似於C語言裡的指標啦~~,而這個地址呢,就存放了在Sample類的例項的資料區中。

3、在JVM中的一個程序中,每個執行緒都會擁有一個方法呼叫棧,用來跟蹤執行緒執行中一系列的方法呼叫過程,棧中的每一個元素被稱為棧幀,每當執行緒呼叫一個方法的時候就會向方法棧中壓入一個新棧幀。這裡的幀用來儲存方法的引數、區域性變數和運算過程中的臨時資料。OK,原理講完了,就讓我們來繼續我們的跟蹤行動!位於“=”前的test1是一個在main()方法中定義的變數,可見,它是一個區域性變數,因此,test1這個區域性變數會被JVM新增到執行main()方法的主執行緒的Java方法呼叫棧中。而“=”將把這個test1變數指向堆區中的Sample例項,也就是說,test1這個區域性變數持有指向Sample類的例項的引用(即記憶體地址)。

OK,到這裡為止呢,JVM就完成了這個簡單語句的執行任務。參考我們的行動向導圖,我們終於初步摸清了JVM的一點點底細了,COOL!

接下來,JVM將繼續執行後續指令,在堆區裡繼續建立另一個Sample類的例項,然後依次執行它們的printName()方法。當JVM執行test1.printName()方法時,JVM根據區域性變數test1持有的引用,定位到堆中的Sample類的例項,再根據Sample類的例項持有的引用,定位到方法區中Sample類的型別資訊(包括①類,②靜態變數,③靜態方法,④常量和⑤成員方法),從而獲取printName()成員方法的位元組碼,接著執行printName()成員方法包含的指令

Java儲存機制

一、java的六種儲存地址及解釋

1) 暫存器(register):這是最快的儲存區,因為它位於不同於其他儲存區的地方——處理器內部。但是暫存器的數量極其有限,所以暫存器由編譯器根據需求進行分配。你不能直接控制,也不能在程式中感覺到暫存器存在的任何跡象。

2) 堆疊(stack):位於通用RAM中,但通過它的“堆疊指標”可以從處理器哪裡獲得支援。堆疊指標若向下移動,則分配新的記憶體;若向上移動,則釋放那些記憶體。這是一種快速有效的分配儲存方法,僅次於暫存器。建立程式時候,JAVA編譯器必須知道儲存在堆疊內所有資料的確切大小和生命週期,因為它必須生成相應的程式碼,以便上下移動堆疊指標。這一約束限制了程式的靈活性,所以雖然某些JAVA資料儲存在堆疊中——特別是物件引用,但是JAVA物件不儲存其中。


3)堆(heap):一種通用性的記憶體池(也存在於RAM中),用於存放所有的JAVA物件。堆不同於堆疊的好處是:編譯器不需要知道要從堆裡分配多少儲存區域,也不必知道儲存的資料在堆裡存活多長時間。因此,在堆裡分配儲存有很大的靈活性。當你需要建立一個物件的時候,只需要new寫一行簡單的程式碼,當執行這行程式碼時,會自動在堆裡進行儲存分配。當然,為這種靈活性必須要付出相應的程式碼。用堆進行儲存分配比用堆疊進行儲存儲存需要更多的時間。


4)靜態儲存(static storage):這裡的“靜態”是指“在固定的位置”。靜態儲存裡存放程式執行時一直存在的資料。你可用關鍵字static來標識一個物件的特定元素是靜態的,但JAVA物件本身從來不會存放在靜態儲存空間裡。


5) 常量儲存(constant storage):常量值通常直接存放在程式程式碼內部,這樣做是安全的,因為它們永遠不會被改變。有時,在嵌入式系統中,常量本身會和其他部分分割離開,所以在這種情況下,可以選擇將其放在ROM中。


6) 非RAM儲存:如果資料完全存活於程式之外,那麼它可以不受程式的任何控制,在程式沒有執行時也可以存在。

二、棧、堆、方法區儲存的內容

堆區:
1.儲存的全部是物件,每個物件都包含一個與之對應的class的資訊。(class的目的是得到操作指令)
2.jvm只有一個堆區(heap)被所有執行緒共享,堆中不存放基本型別和物件引用,只存放物件本身 。
棧區:
1.每個執行緒包含一個棧區,棧中只儲存基礎資料型別的值和物件以及基礎資料的引用
2.每個棧中的資料(基礎資料型別和物件引用)都是私有的,其他棧不能訪問。
3.棧分為3個部分:基本型別變數區、執行環境上下文、操作指令區(存放操作指令)。
方法區:
1.又叫靜態區,跟堆一樣,被所有的執行緒共享。方法區包含所有的class和static變數。
2.方法區中包含的都是在整個程式中永遠唯一的元素,如class,static變數。

三、在Java語言裡堆(heap)和棧(stack)裡的區別

1. 棧(stack)與堆(heap)都是Java用來在Ram中存放資料的地方。與C++不同,Java自動管理棧和堆,程式設計師不能直接地設定棧或堆。
2. 棧的優勢是,存取速度比堆要快,僅次於直接位於CPU中的暫存器。但缺點是,存在棧中的資料大小與生存期必須是確定的,缺乏靈活性。另外,棧資料可以共享,詳見第3點。堆的優勢是可以動態地分配記憶體大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由於要在執行時動態分配記憶體,存取速度較慢。
3. Java中的資料型別有兩種。
   一種是基本型別(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,並沒有string的基本型別)。這種型別的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變數。值得注意的是,自動變數存的是字面值,不是類的例項,即不是類的引用,這裡並沒有類的存在。如int a = 3; 這裡的a是一個指向int型別的引用,指向3這個字面值。這些字面值的資料,由於大小可知,生存期可知(這些字面值固定定義在某個程式塊裡面,程式塊退出後,欄位值就消失了),出於追求速度的原因,就存在於棧中。
   另外,棧有一個很重要的特殊性,就是存在棧中的資料可以共享。假設我們同時定義
   int a = 3;
   int b = 3;
   編譯器先處理int a = 3;首先它會在棧中建立一個變數為a的引用,然後查詢有沒有字面值為3的地址,沒找到,就開闢一個存放3這個字面值的地址,然後將a指向3的地址。接著處理int b = 3;在建立完b的引用變數後,由於在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。
   特別注意的是,這種字面值的引用與類物件的引用不同。假定兩個類物件的引用同時指向一個物件,如果一個物件引用變數修改了這個物件的內部狀態,那麼另一個物件引用變數也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟著改變的情況。如上例,我們定義完a與 b的值後,再令a=4;那麼,b不會等於4,還是等於3。在編譯器內部,遇到a=4;時,它就會重新搜尋棧中是否有4的字面值,如果沒有,重新開闢地址存放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。
   另一種是包裝類資料,如Integer, String, Double等將相應的基本資料型別包裝起來的類。這些類資料全部存在於堆中,Java用new()語句來顯示地告訴編譯器,在執行時才根據需要動態建立,因此比較靈活,但缺點是要佔用更多的時間。
4.每個JVM的執行緒都有自己的私有的棧空間,隨執行緒建立而建立,java的stack存放的是frames ,java的stack和c的不同,只是存放本地變數,返回值和呼叫方法,不允許直接push和pop frames ,因為frames 可能是有heap分配的,所以j為ava的stack分配的記憶體不需要是連續的。java的heap是所有執行緒共享的,堆存放所有 runtime data ,裡面是所有的物件例項和陣列,heap是JVM啟動時建立。
   5. String是一個特殊的包裝類資料。即可以用String str = new String("abc");的形式來建立,也可以用String str = "abc";的形式來建立(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的表示式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表示式是可以的!因為編譯器在後臺進行Integer i = new Integer(3)的轉換)。前者是規範的類的建立過程,即在Java中,一切都是物件,而物件是類的例項,全部通過new()的形式來建立。Java 中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新建立的類,似乎違反了此原則。其實不然。該類運用了單例模式來返回類的例項,只不過這個例項是在該類內部通過new()來建立的,而getInstance()向外部隱藏了此細節。那為什麼在String str = "abc";中,並沒有通過new()來建立例項,是不是違反了上述原則?其實沒有。

四、 關於String str = "abc"的內部工作。Java內部將此語句轉化為以下幾個步驟:
  (1)先定義一個名為str的對String類的物件引用變數:String str;
  (2)在棧中查詢有沒有存放值為"abc"的地址,如果沒有,則開闢一個存放字面值為"abc"的地址,接著建立一個新的String類的物件o,並將o 的字串值指向這個地址,而且在棧中這個地址旁邊記下這個引用的物件o。如果已經有了值為"abc"的地址,則查詢物件o,並返回o的地址。
  (3)將str指向物件o的地址。
  值得注意的是,一般String類中字串值都是直接存值的。但像String str = "abc";這種場合下,其字串值卻是儲存了一個指向存在棧中資料的引用!
為了更好地說明這個問題,我們可以通過以下的幾個程式碼進行驗證。
  String str1 = "abc";
  String str2 = "abc";
  System.out.println(str1==str2); //true
  注意,我們這裡並不用str1.equals(str2);的方式,因為這將比較兩個字串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個物件時才返回真值。而我們在這裡要看的是,str1與str2是否都指向了同一個物件。
  結果說明,JVM建立了兩個引用str1和str2,但只建立了一個物件,而且兩個引用都指向了這個物件。
  我們再來更進一步,將以上程式碼改成:
  String str1 = "abc";
  String str2 = "abc";
  str1 = "bcd";
  System.out.println(str1 + "," + str2); //bcd, abc
  System.out.println(str1==str2); //false
  這就是說,賦值的變化導致了類物件引用的變化,str1指向了另外一個新物件!而str2仍舊指向原來的物件。上例中,當我們將str1的值改為"bcd"時,JVM發現在棧中沒有存放該值的地址,便開闢了這個地址,並建立了一個新的物件,其字串的值指向這個地址。
  事實上,String類被設計成為不可改變(immutable)的類。如果你要改變其值,可以,但JVM在執行時根據新值悄悄建立了一個新物件,然後將這個物件的地址返回給原來類的引用。這個建立過程雖說是完全自動進行的,但它畢竟佔用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。
  再修改原來程式碼:
  String str1 = "abc";
  String str2 = "abc";
  str1 = "bcd";
  String str3 = str1;
  System.out.println(str3); //bcd
  String str4 = "bcd";
  System.out.println(str1 == str4); //true
  str3 這個物件的引用直接指向str1所指向的物件(注意,str3並沒有建立新物件)。當str1改完其值後,再建立一個String的引用str4,並指向因str1修改值而建立的新的物件。可以發現,這回str4也沒有建立新的物件,從而再次實現棧中資料的共享。
  我們再接著看以下的程式碼。
  String str1 = new String("abc");
  String str2 = "abc";
  System.out.println(str1==str2); //false
  建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。
  String str1 = "abc";
  String str2 = new String("abc");
  System.out.println(str1==str2); //false
  建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。
  以上兩段程式碼說明,只要是用new()來新建物件的,都會在堆中建立,而且其字串是單獨存值的,即使與棧中的資料相同,也不會與棧中的資料共享。
  (4) 資料型別包裝類的值不可修改。不僅僅是String類的值不可修改,所有的資料型別包裝類都不能更改其內部的值。
  (5)結論與建議:
   1)我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們建立了String類的物件str。擔心陷阱!物件可能並沒有被建立!唯一可以肯定的是,指向 String類的引用被建立了。至於這個引用到底是否指向了一個新的物件,必須根據上下文來考慮,除非你通過new()方法來顯要地建立一個新的物件。因此,更為準確的說法是,我們建立了一個指向String類的物件的引用變數str,這個物件引用變數指向了某個值為"abc"的String類。清醒地認識到這一點對排除程式中難以發現的bug是很有幫助的。
   2)使用String str = "abc";的方式,可以在一定程度上提高程式的執行速度,因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新物件。而對於String str = new String("abc");的程式碼,則一概在堆中建立新物件,而不管其字串值是否相等,是否有必要建立新物件,從而加重了程式的負擔。這個思想應該是享元模式的思想,但JDK的內部在這裡實現是否應用了這個模式,不得而知。
   3)當比較包裝類裡面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個物件時,用==。
   4)由於String類的immutable性質,當String變數需要經常變換其值時,應該考慮使用StringBuffer類,以提高程式效率。
如果java不能成功分配heap的空間,將丟擲OutOfMemoryError