1. 程式人生 > >java執行的詳細記憶體分析,精確到每一步!!!!

java執行的詳細記憶體分析,精確到每一步!!!!

<一> 基礎資料型別(Value type)直接在棧(stack)空間分配,方法的形式引數,直接在棧空間分配,當方法呼叫完成後從棧空間回收。 引用資料型別,需要用new來建立,既在棧空間分配一個地址空間(reference),又在堆空間分配物件的類變數(object) 。方法的引用引數,在棧空間分配一個地址空間,並指向堆空間的物件區,當方法呼叫完成後從棧空間回收。區域性變數 new 出來時,在棧空間和堆空間中分配空間,當局部變數生命週期結束後,棧空間立刻被回收,堆空間區域等待GC回收。 方法呼叫時傳入的 literal 引數,先在棧空間分配,在方法呼叫完成後從棧空間分配。字串常量在 DATA 區域分配 ,this 在堆空間分配。陣列既在棧空間分配陣列名稱, 又在堆空間分配陣列實際的大小! 哦 對了,補充一下static在DATA區域分配。 從Java的這種分配機制來看,堆疊又可以這樣理解:堆疊(Stack)是作業系統在建立某個程序時或者執行緒(在支援多執行緒的作業系統中是執行緒)為這個執行緒建立的儲存區域,該區域具有先進後出的特性。 每一個Java應用都唯一對應一個JVM例項,每一個例項唯一對應一個堆。應用程式在執行中所建立的所有類例項或陣列都放在這個堆中,並由應用所有的執行緒共享.跟C/C++不同,Java中分配堆記憶體是自動初始化的。Java中所有物件的儲存空間都是在堆中分配的,但是這個物件的引用卻是在堆疊中分配,也就是說在建立一個物件時從兩個地方都分配記憶體,在堆中分配的記憶體實際建立這個物件,而在堆疊中分配的記憶體只是一個指向這個堆物件的指標(引用)而已。 <二> 參考自深入淺出JVM這本書,對了解JAVA的底層和執行機制有比較大的幫助。 廢話不想講了.入主題: 先了解具體的概念: JAVA的JVM的記憶體可分為3個區:堆(heap)、棧(stack)和方法區(method) 堆區: 1.儲存的全部是物件,每個物件都包含一個與之對應的class的資訊。(class的目的是得到操作指令) 2.jvm只有一個堆區(heap)被所有執行緒共享,堆中不存放基本型別和物件引用,只存放物件本身 棧區: 1.每個執行緒包含一個棧區,棧中只儲存基礎資料型別的物件和自定義物件的引用(不是物件),物件都存放在堆區中 2.每個棧中的資料(原始型別和物件引用)都是私有的,其他棧不能訪問。 3.棧分為3個部分:基本型別變數區、執行環境上下文、操作指令區(存放操作指令)。 方法區: 1.又叫靜態區,跟堆一樣,被所有的執行緒共享。方法區包含所有的class和static變數。 2.方法區中包含的都是在整個程式中永遠唯一的元素,如class,static變數。 為了更清楚地搞明白髮生在執行時資料區裡的黑幕,我們來準備2個小道具(2個非常簡單的小程式)。 AppMain.java Java程式碼 public   class  AppMain                //執行時, jvm 把appmain的資訊都放入方法區     {     public   static   void  main(String[] args)  //main 方法本身放入方法區。     {     Sample test1 = new  Sample( " 測試1 " );   //test1是引用,所以放到棧區裡, Sample是自定義物件應該放到堆裡面     Sample test2 = new  Sample( " 測試2 " );     test1.printName();     test2.printName();     }     }  Sample.java     public   class  Sample        //執行時, jvm 把appmain的資訊都放入方法區     {     private  name;      //new Sample例項後, name 引用放入棧區裡,  name 物件放入堆裡     public  Sample(String name)     {     this .name = name;     }     public   void  printName()   //print方法本身放入 方法區裡。     {     System.out.println(name);     }     }    OK,讓我們開始行動吧,出發指令就是:“java AppMain”,包包裡帶好我們的行動向導圖,Let’s GO!
  系統收到了我們發出的指令,啟動了一個Java虛擬機器程序,這個程序首先從classpath中找到AppMain.class檔案,讀取這個檔案中的二進位制資料,然後把Appmain類的類資訊存放到執行時資料區的方法區中。這一過程稱為AppMain類的載入過程。 接著,Java虛擬機器定位到方法區中AppMain類的Main()方法的位元組碼,開始執行它的指令。這個main()方法的第一條語句就是: Sample test1=new Sample("測試1"); 語句很簡單啦,就是讓java虛擬機器建立一個Sample例項,並且呢,使引用變數test1引用這個例項。貌似小case一樁哦,就讓我們來跟蹤一下Java虛擬機器,看看它究竟是怎麼來執行這個任務的: 1、 Java虛擬機器一看,不就是建立一個Sample例項嗎,簡單,於是就直奔方法區而去,先找到Sample類的型別資訊再說。結果呢,嘿嘿,沒找到@@,這會兒的方法區裡還沒有Sample類呢。可Java虛擬機器也不是一根筋的笨蛋,於是,它發揚“自己動手,豐衣足食”的作風,立馬載入了Sample類,把Sample類的型別資訊存放在方法區裡。 2、 好啦,資料找到了,下面就開始幹活啦。Java虛擬機器做的第一件事情就是在堆區中為一個新的Sample例項分配記憶體, 這個Sample例項持有著指向方法區的Sample類的型別資訊的引用。這裡所說的引用,實際上指的是Sample類的型別資訊在方法區中的記憶體地址,其實,就是有點類似於C語言裡的指標啦~~,而這個地址呢,就存放了在Sample例項的資料區裡。 3、在JAVA虛擬機器程序中,每個執行緒都會擁有一個方法呼叫棧,用來跟蹤執行緒執行中一系列的方法呼叫過程,棧中的每一個元素就被稱為棧幀,每當執行緒呼叫一個方法的時候就會向方法棧壓入一個新幀。這裡的幀用來儲存方法的引數、區域性變數和運算過程中的臨時資料。OK,原理講完了,就讓我們來繼續我們的跟蹤行動!位於“=”前的Test1是一個在main()方法中定義的變數,可見,它是一個區域性變數,因此,它被會新增到了執行main()方法的主執行緒的JAVA方法呼叫棧中。而“=”將把這個test1變數指向堆區中的Sample例項,也就是說,它持有指向Sample例項的引用。 OK,到這裡為止呢,JAVA虛擬機器就完成了這個簡單語句的執行任務。參考我們的行動向導圖,我們終於初步摸清了JAVA虛擬機器的一點點底細了,COOL! 接下來,JAVA虛擬機器將繼續執行後續指令,在堆區裡繼續建立另一個Sample例項,然後依次執行它們的printName()方法。當JAVA虛擬機器執行test1.printName()方法時,JAVA虛擬機器根據區域性變數test1持有的引用,定位到堆區中的Sample例項,再根據Sample例項持有的引用,定位到方法去中Sample類的型別資訊,從而獲得printName()方法的位元組碼,接著執行printName()方法包含的指令。 <三> 在windows中使用taskmanager檢視java程序使用的記憶體時,發現有時候會超過 -Xmx制定的記憶體大小, -Xmx指定的是java heap,java還要分配記憶體做其他的事情,包括為每個執行緒建立棧。 VM的每個執行緒都有自己的棧空間,棧空間的大小限制vm的執行緒數量,太大了,實用的執行緒數減少,太小容易丟擲java.lang.StackOverflowError異常。windows預設為1M,linux必須執行ulimit -s 2048。 在C語言裡堆(heap)和棧(stack)裡的區別 簡單的可以理解為: heap:是由malloc之類函式分配的空間所在地。地址是由低向高增長的。 stack:是自動分配變數,以及函式呼叫的時候所使用的一些空間。地址是由高向低減少。 一個由c/C++編譯的程式佔用的記憶體分為以下幾個部分 1、棧區(stack)— 由編譯器自動分配釋放 ,存放函式的引數值,區域性變數的值等。其操作方式類似於資料結構中的棧。 2、在Java語言裡堆(heap)和棧(stack)裡的區別     1. 棧(stack)與堆(heap)都是Java用來在Ram中存放資料的地方。與C++不同,Java自動管理棧和堆,程式設計師不能直接地設定棧或堆。   2. 棧的優勢是,存取速度比堆要快,僅次於直接位於CPU中的暫存器。但缺點是,存在棧中的資料大小與生存期必須是確定的,缺乏靈活性。另外,棧資料可以共享,詳見第3點。堆的優勢是可以動態地分配記憶體大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由於要在執行時動態分配記憶體,存取速度較慢。   3. Java中的資料型別有兩種。   一種是基本型別(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,並沒有string的基本型別)。這種型別的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變數。值得注意的是,自動變數存的是字面值,不是類的例項,即不是類的引用,這裡並沒有類的存在。如int a = 3; 這裡的a是一個指向int型別的引用,指向3這個字面值。這些字面值的資料,由於大小可知,生存期可知(這些字面值固定定義在某個程式塊裡面,程式塊退出後,欄位值就消失了),出於追求速度的原因,就存在於棧中。   另外,棧有一個很重要的特殊性,就是存在棧中的資料可以共享。假設我們同時定義   int a = 3;   int b = 3;   編譯器先處理int a = 3;首先它會在棧中建立一個變數為a的引用,然後查詢有沒有字面值為3的地址,沒找到,就開闢一個存放3這個字面值的地址,然後將a指向3的地址。接著處理int b = 3;在建立完b的引用變數後,由於在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。   特別注意的是,這種字面值的引用與類物件的引用不同。假定兩個類物件的引用同時指向一個物件,如果一個物件引用變數修改了這個物件的內部狀態,那麼另一個物件引用變數也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟著改變的情況。如上例,我們定義完a與 b的值後,再令a=4;那麼,b不會等於4,還是等於3。在編譯器內部,遇到a=4;時,它就會重新搜尋棧中是否有4的字面值,如果沒有,重新開闢地址存放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。   另一種是包裝類資料,如Integer, String, Double等將相應的基本資料型別包裝起來的類。這些類資料全部存在於堆中,Java用new()語句來顯示地告訴編譯器,在執行時才根據需要動態建立,因此比較靈活,但缺點是要佔用更多的時間。 4.每個JVM的執行緒都有自己的私有的棧空間,隨執行緒建立而建立,java的stack存放的是frames ,java的stack和c的不同,只是存放本地變數,返回值和呼叫方法,不允許直接push和pop frames ,因為frames 可能是有heap分配的,所以j為ava的stack分配的記憶體不需要是連續的。java的heap是所有執行緒共享的,堆存放所有 runtime data ,裡面是所有的物件例項和陣列,heap是JVM啟動時建立。   5. String是一個特殊的包裝類資料。即可以用String str = new String("abc");的形式來建立,也可以用String str = "abc";的形式來建立(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的表示式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表示式是可以的!因為編譯器在後臺進行Integer i = new Integer(3)的轉換)。前者是規範的類的建立過程,即在Java中,一切都是物件,而物件是類的例項,全部通過new()的形式來建立。Java 中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新建立的類,似乎違反了此原則。其實不然。該類運用了單例模式來返回類的例項,只不過這個例項是在該類內部通過new()來建立的,而getInstance()向外部隱藏了此細節。那為什麼在String str = "abc";中,並沒有通過new()來建立例項,是不是違反了上述原則?其實沒有。   5. 關於String str = "abc"的內部工作。Java內部將此語句轉化為以下幾個步驟:   (1)先定義一個名為str的對String類的物件引用變數:String str;   (2)在棧中查詢有沒有存放值為"abc"的地址,如果沒有,則開闢一個存放字面值為"abc"的地址,接著建立一個新的String類的物件o,並將o 的字串值指向這個地址,而且在棧中這個地址旁邊記下這個引用的物件o。如果已經有了值為"abc"的地址,則查詢物件o,並返回o的地址。   (3)將str指向物件o的地址。   值得注意的是,一般String類中字串值都是直接存值的。但像String str = "abc";這種場合下,其字串值卻是儲存了一個指向存在棧中資料的引用! 為了更好地說明這個問題,我們可以通過以下的幾個程式碼進行驗證。   String str1 = "abc";   String str2 = "abc";   System.out.println(str1==str2);  //true   注意,我們這裡並不用str1.equals(str2);的方式,因為這將比較兩個字串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個物件時才返回真值。而我們在這裡要看的是,str1與str2是否都指向了同一個物件。   結果說明,JVM建立了兩個引用str1和str2,但只建立了一個物件,而且兩個引用都指向了這個物件。   我們再來更進一步,將以上程式碼改成:   String str1 = "abc";   String str2 = "abc";   str1 = "bcd";   System.out.println(str1 + "," + str2);  //bcd, abc   System.out.println(str1==str2);  //false   這就是說,賦值的變化導致了類物件引用的變化,str1指向了另外一個新物件!而str2仍舊指向原來的物件。上例中,當我們將str1的值改為"bcd"時,JVM發現在棧中沒有存放該值的地址,便開闢了這個地址,並建立了一個新的物件,其字串的值指向這個地址。   事實上,String類被設計成為不可改變(immutable)的類。如果你要改變其值,可以,但JVM在執行時根據新值悄悄建立了一個新物件,然後將這個物件的地址返回給原來類的引用。這個建立過程雖說是完全自動進行的,但它畢竟佔用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。   再修改原來程式碼:   String str1 = "abc";   String str2 = "abc";   str1 = "bcd";   String str3 = str1;   System.out.println(str3);  //bcd   String str4 = "bcd";   System.out.println(str1 == str4);  //true   str3 這個物件的引用直接指向str1所指向的物件(注意,str3並沒有建立新物件)。當str1改完其值後,再建立一個String的引用str4,並指向因str1修改值而建立的新的物件。可以發現,這回str4也沒有建立新的物件,從而再次實現棧中資料的共享。   我們再接著看以下的程式碼。   String str1 = new String("abc");   String str2 = "abc";   System.out.println(str1==str2);  //false   建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。   String str1 = "abc";   String str2 = new String("abc");   System.out.println(str1==str2);  //false   建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。   以上兩段程式碼說明,只要是用new()來新建物件的,都會在堆中建立,而且其字串是單獨存值的,即使與棧中的資料相同,也不會與棧中的資料共享。   6. 資料型別包裝類的值不可修改。不僅僅是String類的值不可修改,所有的資料型別包裝類都不能更改其內部的值。   7. 結論與建議:   (1)我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們建立了String類的物件str。擔心陷阱!物件可能並沒有被建立!唯一可以肯定的是,指向 String類的引用被建立了。至於這個引用到底是否指向了一個新的物件,必須根據上下文來考慮,除非你通過new()方法來顯要地建立一個新的物件。因此,更為準確的說法是,我們建立了一個指向String類的物件的引用變數str,這個物件引用變數指向了某個值為"abc"的String類。清醒地認識到這一點對排除程式中難以發現的bug是很有幫助的。   (2)使用String str = "abc";的方式,可以在一定程度上提高程式的執行速度,因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新物件。而對於String str = new String("abc");的程式碼,則一概在堆中建立新物件,而不管其字串值是否相等,是否有必要建立新物件,從而加重了程式的負擔。這個思想應該是享元模式的思想,但JDK的內部在這裡實現是否應用了這個模式,不得而知。   (3)當比較包裝類裡面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個物件時,用==。   (4)由於String類的immutable性質,當String變數需要經常變換其值時,應該考慮使用StringBuffer類,以提高程式效率。