1. 程式人生 > >詳細介紹Java虛擬機器(JVM)

詳細介紹Java虛擬機器(JVM)

1. JVM生命週期

  • 啟動。啟動一個Java程式時,一個JVM例項就產生了,任何一個擁有public static void main(String[] args)函式的class都可以作為JVM例項執行的起點。
  • 執行。main()作為該程式初始執行緒的起點,任何其他執行緒均由該執行緒啟動。
  • 消亡。當程式中的所有非守護執行緒都終止時,JVM才退出;若安全管理器允許,程式也可以使用Runtime類或者System.exit()來退出。

  一個執行中的Java虛擬機器有著一個清晰的任務:執行Java程式。程式開始執行時他才執行,程式結束時他就停止。你在同一臺機器上執行三個程式,就會有三個執行中的Java虛擬機器。 Java虛擬機器總是開始於一個main()方法,這個方法必須是公有、返回void、直接受一個字串陣列。在程式執行時,你必須給Java虛擬機器指明這個包換main()方法的類名。main()方法是程式的起點,他被執行的執行緒初始化為程式的初始執行緒。程式中其他的執行緒都由他來啟動。

  Java中的執行緒分為兩種:守護執行緒 (daemon)和普通執行緒(non-daemon)。守護執行緒是Java虛擬機器自己使用的執行緒,比如負責垃圾收集的執行緒就是一個守護執行緒。當然,你也可以把自己的程式設定為守護執行緒。包含main()方法的初始執行緒不是守護執行緒。

  只要Java虛擬機器中還有普通的執行緒在執行,Java虛擬機器就不會停止。如果有足夠的許可權,你可以呼叫exit()方法終止程式。

2. JVM體系結構

  1) 類裝載器(ClassLoader)(用來裝載.class檔案)

  2) 執行引擎(執行位元組碼,或者執行本地方法)

  3) 執行時資料區(方法區、堆、java棧、PC暫存器、本地方法棧)

3. JVM執行時資料區

3.1 Java堆(Heap)

  • 被所有執行緒共享的一塊記憶體區域,在虛擬機器啟動時建立
  • 用來儲存物件例項
  • 可以通過-Xmx和-Xms控制堆的大小
  • OutOfMemoryError異常:當在堆中沒有記憶體完成例項分配,且堆也無法再擴充套件時。

  java堆是垃圾收集器管理的主要區域。java堆還可以細分為:新生代(New/Young)、舊生代/年老代(Old/Tenured)。持久代(Permanent)在方法區,不屬於Heap。

新生代:新建的物件都由新生代分配記憶體。常常又被劃分為Eden區和Survivor區。Eden空間不足時會把存活的物件轉移到Survivor。新生代的大小可由-Xmn控制,也可用-XX:SurvivorRatio控制Eden和Survivor的比例。

舊生代:存放經過多次垃圾回收仍然存活的物件。

持久代:存放靜態檔案,如今Java類、方法等。持久代在方法區,對垃圾回收沒有顯著影響。

3.2 方法區

  • 執行緒間共享
  • 用於儲存已被虛擬機器載入的類資訊、常量、靜態變數、即時編譯器編譯後的程式碼等資料
  • OutOfMemoryError異常:當方法區無法滿足記憶體的分配需求時
  • 執行時常量池

    • 方法區的一部分
    • 用於存放編譯期生成的各種字面量與符號引用,如String型別常量就存放在常量池
    • OutOfMemoryError異常:當常量池無法再申請到記憶體時

3.3 java虛擬機器棧(VM Stack)

  • 執行緒私有,生命週期與執行緒相同
  • 儲存方法的區域性變量表(基本型別、物件引用)、運算元棧、動態連結、方法出口等資訊。
  • java方法執行的記憶體模型,每個方法執行的同時都會建立一個棧幀,每一個方法被呼叫直至執行完成的過程,就對應著一個棧幀在虛擬機器棧中從入棧到出棧的過程。
  • StackOverflowError異常:當執行緒請求的棧深度大於虛擬機器所允許的深度
  • OutOfMemoryError異常:如果棧的擴充套件時無法申請到足夠的記憶體

  JVM棧是執行緒私有的,每個執行緒建立的同時都會建立JVM棧,JVM棧中存放的為當前執行緒中區域性基本型別的變數、部分的返回結果以及Stack Frame。其他引用型別的物件在JVM棧上僅存放變數名和指向堆上物件例項的首地址

3.4 本地方法棧(Native Method Stack)

  • 與虛擬機器棧相似,主要為虛擬機器使用到的Native方法服務,在HotSpot虛擬機器中直接把本地方法棧與虛擬機器棧二合一

3.5 程式計數器(Program Counter Register)

  • 當前執行緒所執行的位元組碼的行號指示器
  • 當前執行緒私有
  • 不會出現OutOfMemoryError情況

3.6 直接記憶體(Direct Memory)

  • 直接記憶體並不是虛擬機器執行的一部分,也不是Java虛擬機器規範中定義的記憶體區域,但是這部分記憶體也被頻繁使用
  • NIO可以使用Native函式庫直接分配堆外記憶體,堆中的DirectByteBuffer物件作為這塊記憶體的引用進行操作
  • 大小不受Java堆大小的限制,受本機(伺服器)記憶體限制
  • OutOfMemoryError異常:系統記憶體不足時

  總結:Java物件例項存放在堆中;常量存放在方法區的常量池;虛擬機器載入的類資訊、常量、靜態變數、即時編譯器編譯後的程式碼等資料放在方法區;以上區域是所有執行緒共享的。棧是執行緒私有的,存放該方法的區域性變量表(基本型別、物件引用)、運算元棧、動態連結、方法出口等資訊。

  一個Java程式對應一個JVM,一個方法(執行緒)對應一個Java棧。

4. Java程式碼的編譯和執行過程

Java程式碼的編譯和執行包括了三個重要機制:

(1)Java原始碼編譯機制(.java原始碼檔案 -> .class位元組碼檔案)

(2)類載入機制(ClassLoader)

(3)類執行機制(JVM執行引擎)

4.1 Java原始碼編譯機制

  Java原始碼是不能被機器識別的,需要先經過編譯器編譯成JVM可以執行的.class位元組碼檔案,再由直譯器解釋執行。即:Java原始檔(.java) -- Java編譯器 --> Java位元組碼檔案 (.class) -- Java直譯器 --> 執行。流程圖如下:

  位元組碼檔案(.class)是平臺無關的。

  Java中字元只以一種形式存在:Unicode。字元轉換髮生在JVM和OS交界處(Reader/Writer)。

  最後生成的class檔案由以下部分組成:

  • 結構資訊。包括class檔案格式版本號及各部分的數量與大小的資訊
  • 元資料。對應於Java原始碼中宣告與常量的資訊。包含類/繼承的超類/實現的介面的宣告資訊、域與方法宣告資訊和常量池
  • 方法資訊。對應Java原始碼中語句和表示式對應的資訊。包含位元組碼、異常處理器表、求值棧與區域性變數區大小、求值棧的型別記錄、除錯符號資訊

4.2 類載入機制(ClassLoader)

  Java程式並不一個可執行檔案,是由多個獨立的類檔案組成。這些類檔案並非一次性全部裝入記憶體,而是依據程式逐步載入

  JVM的類載入是通過ClassLoader及其子類來完成的,類的層次關係和載入順序可以由下圖來描述:

 

(1)Bootstrap ClassLoader

  • JVM的根ClassLoader,由C++實現
  • 載入Java的核心API:$JAVA_HOME中jre/lib/rt.jar中所有class檔案的載入,這個jar中包含了java規範定義的所有介面以及實現。
  • JVM啟動時即初始化此ClassLoader

 (2)Extension ClassLoader

  •  載入Java擴充套件API(lib/ext中的類)

(3)App ClassLoader

  • 載入Classpath目錄下定義的class

(4)Custom ClassLoader

  • 屬於應用程式根據自身需要自定義的ClassLoader,如tomcat、jboss都會根據J2EE規範自行實現ClassLoader

  載入過程中會先檢查類是否被已載入,檢查順序是自底向上,從Custom ClassLoader到BootStrap ClassLoader逐層檢查,只要某個classloader已載入就視為已載入此類,保證此類只所有ClassLoader載入一次。而載入的順序是自頂向下,也就是由上層來逐層嘗試載入此類。

雙親委派機制

  JVM在載入類時預設採用的是雙親委派機制。通俗的講,就是某個特定的類載入器在接到載入類的請求時,首先將載入任務委託給父類載入器,依次遞迴。如果父類載入器可以完成類載入任務,就成功返回;只有父類載入器無法完成此載入任務時,才自己去載入。

  作用:1)避免重複載入;2)更安全。如果不是雙親委派,那麼使用者在自己的classpath編寫了一個java.lang.Object的類,那就無法保證Object的唯一性。所以使用雙親委派,即使自己編寫了,但是永遠都不會被載入執行。

破壞雙親委派機制

  雙親委派機制並不是一種強制性的約束模型,而是Java設計者推薦給開發者的類載入器實現方式。

  執行緒上下文類載入器,這個類載入器可以通過java.lang.Thread類的setContextClassLoader()方法進行設定,如果建立執行緒時還未設定,它將會從父執行緒中繼承一個,如果在應用程式的全域性範圍內都沒有設定過的話,那麼這個類載入器就是應用程式類載入器。像JDBC就是採用了這種方式。這種行為就是逆向使用了載入器,違背了雙親委派模型的一般性原則。  

4.3 類執行機制

Java位元組碼的執行是由JVM執行引擎來完成,流程圖如下所示:

  JVM是基於棧的體系結構來執行class位元組碼的。執行緒建立後,都會產生程式計數器(PC)和棧(Stack),程式計數器存放下一條要執行的指令在方法內的偏移量,棧中存放一個個棧幀,每個棧幀對應著每個方法的每次呼叫,而棧幀又是有區域性變數區和運算元棧兩部分組成,區域性變數區用於存放方法中的區域性變數和引數,運算元棧中用於存放方法執行過程中產生的中間結果。

主要的執行技術:解釋,即時編譯,自適應優化、晶片級直接執行

  • 解釋屬於第一代JVM,
  • 即時編譯JIT屬於第二代JVM,
  • 自適應優化(目前Sun的HotspotJVM採用這種技術)則吸取第一代JVM和第二代JVM的經驗,採用兩者結合的方式

  開始對所有的程式碼都採取解釋執行的方式,並監視程式碼執行情況。對那些經常呼叫的方法啟動一個後臺執行緒,將其編譯為原生代碼,並進行優化。若方法不再頻繁使用,則取消編譯過的程式碼,仍對其進行解釋執行。

5. JVM垃圾回收(GC)

GC的基本原理:將記憶體中不再被引用的物件進行回收,GC中用於回收的方法稱為收集器。垃圾:不再被引用的物件。

由於GC需要消耗一些資源和時間,Java在對物件的生命週期特徵進行分析後,按照新生代、舊生代的方式來對物件進行收集,以儘可能的縮短GC對應用造成的暫停。

  • 對新生代的物件的收集稱為minor GC;
  • 對舊生代的物件的收集稱為Full GC;
  • 程式中主動呼叫System.gc()的GC為Full GC。

  Java垃圾回收是單獨的後臺執行緒gc執行的,自動執行無需顯示呼叫。即使主動呼叫了java.lang.System.gc(),該方法也只會提醒系統進行垃圾回收,但系統不一定會迴應,可能會不予理睬。

判斷一塊記憶體空間是否符合回收標準:

(1)物件賦予了空值,且之後再未呼叫(obj = null;)

(2)物件賦予了新值,即重新分配了記憶體空間(obj = new Obj();)

記憶體洩漏:程式中保留著對永遠不再使用的物件的引用。因此這些物件不回被GC回收,卻一直佔用記憶體空間卻毫無用處。即:1)物件是可達的;2)物件是無用的。滿足這兩個條件即可判定為記憶體洩漏。

  應確保不需要的物件不可達,通常採用將物件欄位設定為null的方式,或從容器collection中移除物件。區域性變數不再使用時無需顯示設定為null,因為對區域性變數的引用會隨著方法的退出而自動清除。

記憶體洩露的原因:1)全域性集合;2)快取;3)ClassLoader

6. 記憶體調優

調優目的:減少GC的頻率尤其是Full GC的次數,過多的GC會佔用很多系統資源影響吞吐量。特別要關注Full GC,因為它會對整個堆進行整理。

主要手段:JVM調優主要通過配置JVM的引數來提高垃圾回收的速度,合理分配堆記憶體各部分的比例。

導致Full GC的幾種情況和調優策略:

  • 舊生代空間不足 調優時儘量讓物件在新生代GC時被回收、讓物件在新生代多存活一段時間和不要建立過大的物件及陣列避免直接在舊生代建立物件 
  • 持久代(Pemanet Generation)空間不足 增大Perm Gen空間,避免太多靜態物件 
  • 統計得到的GC後晉升到舊生代的平均大小大於舊生代剩餘空間控制好新生代和舊生代的比例 
  • System.gc()被顯示呼叫 垃圾回收不要手動觸發,儘量依靠JVM自身的機制 

堆記憶體比例不良設定會導致什麼後果:

1)新生代設定過小

一是新生代GC次數非常頻繁,增大系統消耗;二是導致大物件直接進入舊生代,佔據了舊生代剩餘空間,誘發Full GC

2)新生代設定過大

一是新生代設定過大會導致舊生代過小(堆總量一定),從而誘發Full GC;二是新生代GC耗時大幅度增加

一般說來新生代佔整個堆1/3比較合適

3)Survivor設定過小

導致物件從eden直接到達舊生代,降低了在新生代的存活時間

4)Survivor設定過大

導致eden過小,增加了GC頻率

另外,通過-XX:MaxTenuringThreshold=n來控制新生代存活時間,儘量讓物件在新生代被回收

JVM提供兩種較為簡單的GC策略的設定方式:

1)吞吐量優先

JVM以吞吐量為指標,自行選擇相應的GC策略及控制新生代與舊生代的大小比例,來達到吞吐量指標。這個值可由-XX:GCTimeRatio=n來設定

2)暫停時間優先

JVM以暫停時間為指標,自行選擇相應的GC策略及控制新生代與舊生代的大小比例,儘量保證每次GC造成的應用停止時間都在指定的數值範圍內完成。這個值可由-XX:MaxGCPauseRatio=n來設定

JVM常見配置

  1. 堆設定
    • -Xms:初始堆大小
    • -Xmx:最大堆大小
    • -XX:NewSize=n:設定年輕代大小
    • -XX:NewRatio=n:設定年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代佔整個年輕代年老代和的1/4
    • -XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區佔整個年輕代的1/5
    • -XX:MaxPermSize=n:設定持久代大小
  2. 收集器設定
    • -XX:+UseSerialGC:設定序列收集器
    • -XX:+UseParallelGC:設定並行收集器
    • -XX:+UseParalledlOldGC:設定並行年老代收集器
    • -XX:+UseConcMarkSweepGC:設定併發收集器
  3. 垃圾回收統計資訊
    • -XX:+PrintGC
    • -XX:+PrintGCDetails
    • -XX:+PrintGCTimeStamps
    • -Xloggc:filename
  4. 並行收集器設定
    • -XX:ParallelGCThreads=n:設定並行收集器收集時使用的CPU數。並行收集執行緒數。
    • -XX:MaxGCPauseMillis=n:設定並行收集最大暫停時間
    • -XX:GCTimeRatio=n:設定垃圾回收時間佔程式執行時間的百分比。公式為1/(1+n)
  5. 併發收集器設定
    • -XX:+CMSIncrementalMode:設定為增量模式。適用於單CPU情況。
    • -XX:ParallelGCThreads=n:設定併發收集器年輕代收集方式為並行收集時,使用的CPU數。並行收集執行緒數。