JVM堆記憶體(heap)詳解
原文連結詳見:https://blog.51cto.com/lizhenliang/2164876?wx=
Java 堆記憶體管理是影響效能的主要因素之一。
堆記憶體溢位是 Java專案非常常見的故障,在解決該問題之前,必須先了解下 Java 堆記憶體是怎麼工作的。
先看下JAVA堆記憶體是如何劃分的,如圖:
-
JVM記憶體劃分為 堆記憶體 和 非堆記憶體,堆記憶體分為年輕代(Young Generation)、老年代(Old Generation),非堆記憶體就一個永久代(Permanent Generation)。
-
年輕代又分為Eden(生成區) 和 Survivor(生存區)。Survivor區由FromSpace和ToSpace組成。Eden區佔大容量,Survivor兩個區佔小容量,預設比例是8:1:1。
-
堆記憶體用途:存放的是物件,垃圾收集器就是收集這些物件,然後根據GC演算法回收。
-
非堆記憶體用途:永久代,也稱為方法區,儲存程式執行時長期存活的物件,比如類的元資料、方法、常量、屬性等。
在JDK1.8版本廢棄了永久代,替代的是元空間(MetaSpace),元空間與永久代上類似,都是方法區的實現,他們最大區別是:元空間並不在JVM中,而是使用本地記憶體。
元空間有兩個引數:
-
MetaspaceSize:初始化元空間大小,控制發生GC閾值。
-
MaxMetaspaceSize:限制元空間大小上限,防止異常佔用過多實體記憶體。
為什麼移除永久代?
移除永久代原因:為融合HotSpot JVM與JRockit VM(新JVM技術)而做出的改變,因為JRockit沒有永久代。
有了元空間就不再會出現永久代OOM問題了
分代概念
新生成的物件首先放到年輕代Eden區,當Eden空間滿了,觸發Minor GC,存活下來的物件移動到 Survivor0區,Survivor0區滿後觸發執行Minor GC,Survivor0區存活物件移動到Survivor1區,這樣保證了一段時間內總有一個survivor區為空。經過多次Minor GC仍然存活的物件移動到老年代。
老年代儲存長期存活的物件,佔滿時會觸發 Major GC = Full GC,GC期間會停止所有執行緒等待 GC 完成,所以對相應要求高的應用盡量減少發生Major GC,避免響應超時。
-
Minor GC:清理年輕代
-
Major GC:清理老年代
-
Full GC:清理整個堆空間,包括年輕代和永久代
所有GC都會停止所有應用程序
為什麼分代?
將物件根據存活概率進行分類,對存活時間長的物件,放到固定區,從而減少掃描垃圾時間及GC頻率。針對分類進行不同的垃圾回收演算法,對演算法揚長避短。
為什麼Survivor分為兩塊相等大小的倖存空間?
主要為了解決碎片化。如果記憶體碎片化嚴重,也就是兩個物件佔用不連續的記憶體,已有的連續記憶體不夠新物件存放,就會觸發GC。
JVM堆記憶體常用引數
引數 | 描述 |
---|---|
-Xms | 堆記憶體初始大小,單位m、g |
-Xmx(MaxHeapSize) | 堆記憶體最大允許大小,一般不要大於實體記憶體的80% |
-XX:PermSize | 非堆記憶體初始大小,一般應用設定初始化200m,最大1024m就夠了 |
-XX:MaxPermSize | 非堆記憶體最大允許大小 |
-XX:NewSize(-Xns) | 年輕代記憶體初始大小 |
-XX:MaxNewSize(-Xmn) | 年輕代記憶體最大允許大小,也可以縮寫 |
-XX:SurvivorRatio=8 | 年輕代中Eden區與Survivor區的容量比例值,預設為8,即8:1 |
-Xss | 堆疊記憶體大小 |
垃圾回收演算法(GC,Garbage Collection)
紅色是標記的非活動物件,綠色是活動物件。
-
標記-清除(Mark-Sweep)
GC分為兩個階段,標記和清除。首先標記所有可回收的物件,在標記完成後統一回收所有被標記的物件。同時會產生不連續的記憶體碎片。碎片過多會導致以後程式執行時需要分配較大物件時,無法找到足夠的連續記憶體,而不得已再次觸發GC。
-
複製(Copy)
將記憶體按容量劃分為兩塊,每次只使用其中一塊。當這一塊記憶體用完了,就將存活的物件複製到另一塊上,然後再把已使用的記憶體空間一次清理掉。這樣使得每次都是對半個記憶體區回收,也不用考慮記憶體碎片問題,簡單高效。缺點需要兩倍的記憶體空間。
-
標記-整理(Mark-Compact)
也分為兩個階段,首先標記可回收的物件,再將存活的物件都向一端移動,然後清理掉邊界以外的記憶體。此方法避免標記-清除演算法的碎片問題,同時也避免了複製演算法的空間問題。
一般年輕代中執行GC後,會有少量的物件存活,就會選用複製演算法,只要付出少量的存活物件複製成本就可以完成收集。
而老年代中因為物件存活率高,沒有額外過多記憶體空間分配,就需要使用標記-清理或者標記-整理演算法來進行回收。
垃圾收集器
-
序列收集器(Serial)
比較老的收集器,單執行緒。收集時,必須暫停應用的工作執行緒,直到收集結束。 -
並行收集器(Parallel)
多條垃圾收集執行緒並行工作,在多核CPU下效率更高,應用執行緒仍然處於等待狀態。 -
CMS收集器(Concurrent Mark Sweep)
CMS收集器是縮短暫停應用時間為目標而設計的,是基於標記-清除演算法實現,整個過程分為4個步驟,包括:-
初始標記(Initial Mark)
暫停應用程序,並標記一下GC Roots能直接關聯到的物件,速度很快 -
併發標記(Concurrent Mark)
標記可回收物件。 -
重新標記(Remark)
暫停應用程序,為了修正併發標記期間因使用者程式繼續運作導致標記產生變動的那一部分物件的標記記錄,這個階段暫停時間比初始標記階段稍長一點,但遠比並發標記時間短。 -
併發清除(Concurrent Sweep)
-
由於整個過程中消耗最長的併發標記和併發清除過程收集器執行緒都可以與使用者執行緒一起工作,所以,CMS收集器記憶體回收與使用者一起併發執行的,大大減少了暫停時間。
-
G1收集器(Garbage First)
G1收集器將堆記憶體劃分多個大小相等的獨立區域(Region),並且能預測暫停時間,能預測原因它能避免對整個堆進行全區收集。G1跟蹤各個Region裡的垃圾堆積價值大小(所獲得空間大小以及回收所需時間),在後臺維護一個優先列表,每次根據允許的收集時間,優先回收價值最大的Region,從而保證了在有限時間內獲得更高的收集效率。
G1 收集器工作工程分為4個步驟,包括:-
初始標記(Initial Mark)
初始標記與CMS一樣,標記一下GC Roots能直接關聯到的物件, -
併發標記(Concurrent Mark)
併發標記從GC Root開始標記存活物件,這個階段耗時比較長,但也可以與應用執行緒併發執行, -
最終標記(Final Mark)
最終標記也是為了修正在併發標記期間因使用者程式繼續運作而導致標記產生變化的那一部分標記記錄, -
篩選回收(Live Data Counting and Evacuation)
最後在篩選回收階段對各個Region回收價值和成本進行排序,根據使用者所期望的GC暫停時間來執行回收。
-
垃圾收集器引數
引數 | 描述 |
---|---|
-XX:+UseSerialGC | 序列收集器 |
-XX:+UseParallelGC | 並行收集器 |
-XX:+UseParallelGCThreads=8 | 並行收集器執行緒數,同時有多少個執行緒進行垃圾回收,一般與CPU數量相等 |
-XX:+UseParallelOldGC | 指定老年代為並行收集 |
-XX:+UseConcMarkSweepGC | CMS收集器(併發收集器) |
-XX:+UseCMSCompactAtFullCollection | 開啟記憶體空間壓縮和整理,防止過多記憶體碎片 |
-XX:CMSFullGCsBeforeCompaction=0 | 表示多少次Full GC後開始壓縮和整理,0表示每次Full GC後立即執行壓縮和整理 |
-XX:CMSInitiatingOccupancyFraction=80% | 表示老年代記憶體空間使用80%時開始執行CMS收集,防止過多的Full GC |
-XX:+UseG1GC | G1收集器 |
-XX:MaxTenuringThreshold=0 | 在年輕代經過幾次GC後還存活,就進入老年代,0表示直接進入老年代 |
為什麼會堆記憶體溢位?
在年輕代中經過GC後還存活的物件會被複制到老年代中。當老年代空間不足時,JVM會對老年代進行完全的垃圾回收(Full GC)。如果GC後,還是無法存放從Survivor區複製過來的物件,就會出現OOM(Out of Memory)。
OOM(Out Of Memory)異常常見有以下幾個原因:
1)老年代記憶體不足:java.lang.OutOfMemoryError:Javaheapspace
2)永久代記憶體不足:java.lang.OutOfMemoryError:PermGenspace
3)程式碼bug,佔用記憶體無法及時回收。
OOM在這幾個記憶體區都有可能出現,實際遇到OOM時,能根據異常資訊定位到哪個區的記憶體溢位。
可以通過添加個引數-XX:+HeapDumpOnOutMemoryError,讓虛擬機器在出現記憶體溢位異常時Dump出當前的記憶體堆轉儲快照以便事後分析。
熟悉了JAVA記憶體管理機制及配置引數,下面是對JAVA應用啟動選項調優配置:
JAVA_OPTS="-server -Xms512m -Xmx2g -XX:+UseG1GC -XX:SurvivorRatio=6 -XX:MaxGCPauseMillis=400 -XX:G1ReservePercent=15 -XX:ParallelGCThreads=4 -XX:
ConcGCThreads=1 -XX:InitiatingHeapOccupancyPercent=40 -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:../logs/gc.log"
-
設定堆記憶體最小和最大值,最大值參考歷史利用率設定
-
設定GC垃圾收集器為G1
-
啟用GC日誌,方便後期分析
小結
-
選擇高效的GC演算法,可有效減少停止應用執行緒時間。
-
頻繁 Full GC 會增加暫停時間和 CPU使用率,可以加大老年代空間大小降低 Full GC,但會增加回收時間,根據業務適當取捨。