1. 程式人生 > >JVM 垃圾回收(GC)機制

JVM 垃圾回收(GC)機制

目錄

一、背景

二、 哪些記憶體需要回收?

1、引用計數演算法

2 、可達性分析演算法

三、 四種引用狀態

1、強引用

2、軟引用

3、弱引用

4、虛引用

物件死亡(被回收)前的最後一次掙扎

方法區如何判斷是否需要回收

四、垃圾收集演算法

1、標記-清除(Mark-Sweep)演算法

2、複製(Copying)演算法

3、標記-整理(Mark-Compact)演算法

4、分代收集演算法

五、垃圾收集器

1、Serial收集器

2、ParNew收集器

3、Parallel Scavenge收集器

4、Serial Old收集器

5、Parallel Old收集器

6、CMS收集器

7、G1收集器

8、常用的收集器組合

六、理解GC日誌

七、GC是什麼時候觸發的(面試最常見的問題之一)

7.1 Scavenge GC

7.2 Full GC


一、背景

垃圾回收(GC),大部分人都把這項技術當做Java語言的伴生產物。事實上,GC的歷史比Java久遠,早在1960年Lisp這門語言中就使用了記憶體動態分配和垃圾回收技術。

二、 哪些記憶體需要回收?

JVM的記憶體結構包括五大區域:程式計數器、虛擬機器棧、本地方法棧、堆區、方法區。其中程式計數器、虛擬機器棧、本地方法棧3個區域隨執行緒而生、隨執行緒而滅,因此這幾個區域的記憶體分配和回收都具備確定性,就不需要過多考慮回收的問題,因為方法結束或者執行緒結束時,記憶體自然就跟隨著回收了。而Java堆區和方法區則不一樣,這部分記憶體的分配和回收是動態的,正是垃圾收集器所需關注的部分。

垃圾收集器在對堆區和方法區進行回收前,首先要確定這些區域的物件哪些可以被回收,哪些暫時還不能回收,這就要用到判斷物件是否存活的演算法!

1引用計數演算法

1.1 、演算法分析

引用計數是垃圾收集器中的早期策略。在這種方法中,堆中每個物件例項都有一個引用計數。當一個物件被建立時,就將該物件例項分配給一個變數,該變數計數設定為1。當任何其它變數被賦值為這個物件的引用時,計數加1(a = b,則b引用的物件例項的計數器+1),但當一個物件例項的某個引用超過了生命週期或者被設定為一個新值時,物件例項的引用計數器減1。任何引用計數器為0的物件例項可以被當作垃圾收集。當一個物件例項被垃圾收集時,它引用的任何物件例項的引用計數器減1。

1.2 、優缺點

優點:引用計數收集器可以很快的執行,交織在程式執行中。對程式需要不被長時間打斷的實時環境比較有利。

缺點:無法檢測出迴圈引用。如父物件有一個對子物件的引用,子物件反過來引用父物件。這樣,他們的引用計數永遠不可能為0。

在vm options處加入-XX:+PrintGCDetails

/**
 * 虛擬機器引數:-verbose:gc
 */
public class ReferenceCountingGC
{
    private Object instance = null;
    private static final int _1MB = 1024 * 1024;
    
    /** 這個成員屬性唯一的作用就是佔用一點記憶體 */
    private byte[] bigSize = new byte[2 * _1MB];
    
    public static void main(String[] args)
    {
        ReferenceCountingGC objectA = new ReferenceCountingGC();
        ReferenceCountingGC objectB = new ReferenceCountingGC();
        objectA.instance = objectB;
        objectB.instance = objectA;
        objectA = null;
        objectB = null;
        
        System.gc();
    }
}

看下執行結果:

[GC 4417K->288K(61440K), 0.0013498 secs]
[Full GC 288K->194K(61440K), 0.0094790 secs]

這段程式碼是用來驗證引用計數演算法不能檢測出迴圈引用。最後面兩句將objectAobjectB賦值為null,也就是說objectAobjectB指向的物件已經不可能再被訪問,但是由於它們互相引用對方,導致它們的引用計數器都不為0,那麼垃圾收集器就永遠不會回收它們。

2 可達性分析演算法

這個演算法的基本思想是通過一系列稱為“GC Roots”的物件作為起始點,從這些節點向下搜尋,搜尋所走過的路徑稱為引用鏈,當一個物件到GC Roots沒有任何引用鏈(即GC Roots到物件不可達)時,則證明此物件是不可用的。

那麼問題又來了,如何選取GCRoots物件呢?在Java語言中,可以作為GCRoots的物件包括下面幾種:

(1). 虛擬機器棧(棧幀中的區域性變數區,也叫做區域性變量表)中引用的物件。

(2). 方法區中的類靜態屬性引用的物件。

(3). 方法區中常量引用的物件。

(4). 本地方法棧中JNI(Native方法)引用的物件。

下面給出一個GCRoots的例子,如下圖,為GCRoots的引用鏈。

由圖可知,obj8、obj9、obj10都沒有到GCRoots物件的引用鏈,即便obj9和obj10之間有引用鏈,他們還是會被當成垃圾處理,可以進行回收

三、 四種引用狀態

在JDK1.2之前,Java中引用的定義很傳統:如果引用型別的資料中儲存的數值代表的是另一塊記憶體的起始地址,就稱這塊記憶體代表著一個引用。這種定義很純粹,但是太過於狹隘,一個物件只有被引用或者沒被引用兩種狀態。我們希望描述這樣一類物件:當記憶體空間還足夠時,則能保留在記憶體中;如果記憶體空間在進行垃圾收集後還是非常緊張,則可以拋棄這些物件。很多系統的快取功能都符合這樣的應用場景。在JDK1.2之後,Java對引用的概念進行了擴充,將引用分為強引用、軟引用、弱引用、虛引用4種,這4種引用強度依次減弱。

1、強引用

程式碼中普遍存在的類似"Object obj = new Object()"這類的引用,只要強引用還存在,垃圾收集器永遠不會回收掉被引用的物件。

2、軟引用

描述有些還有用但並非必需的物件。在系統將要發生記憶體溢位異常之前,將會把這些物件列進回收範圍進行二次回收。如果這次回收還沒有足夠的記憶體,才會丟擲記憶體溢位異常。Java中的類SoftReference表示軟引用。

3、弱引用

描述非必需物件。被弱引用關聯的物件只能生存到下一次垃圾回收之前,垃圾收集器工作之後,無論當前記憶體是否足夠,都會回收掉只被弱引用關聯的物件。Java中的類WeakReference表示弱引用。

4、虛引用

這個引用存在的唯一目的就是在這個物件被收集器回收時收到一個系統通知,被虛引用關聯的物件,和其生存時間完全沒關係。Java中的類PhantomReference表示虛引用。

物件死亡(被回收)前的最後一次掙扎

即使在可達性分析演算法中不可達的物件,也並非是“非死不可”,這時候它們暫時處於“緩刑”階段,要真正宣告一個物件死亡,至少要經歷兩次標記過程。

  • 第一次標記:如果物件在進行可達性分析後發現沒有與GC Roots相連線的引用鏈,那它將會被第一次標記;
  • 第二次標記:第一次標記後接著會進行一次篩選,篩選的條件是此物件是否有必要執行finalize()方法。在finalize()方法中沒有重新與引用鏈建立關聯關係的,將被進行第二次標記。

第二次標記成功的物件將真的會被回收,如果物件在finalize()方法中重新與引用鏈建立了關聯關係,那麼將會逃離本次回收,繼續存活。

package com.demo;

/*
 * 此程式碼演示了兩點:
 * 1.物件可以再被GC時自我拯救
 * 2.這種自救的機會只有一次,因為一個物件的finalize()方法最多隻會被系統自動呼叫一次
 * */
public class FinalizeEscapeGC {
    
    public String name;
    public static FinalizeEscapeGC SAVE_HOOK = null;

    public FinalizeEscapeGC(String name) {
        this.name = name;
    }

    public void isAlive() {
        System.out.println("yes, i am still alive :)");
    }
    
    @Override
    protected void finalize() throws Throwable {
        super.finalize();
        System.out.println("finalize method executed!");
        System.out.println(this);
        FinalizeEscapeGC.SAVE_HOOK = this;
    }

    @Override
    public String toString() {
        return name;
    }

    public static void main(String[] args) throws InterruptedException {
        SAVE_HOOK = new FinalizeEscapeGC("leesf");
        System.out.println(SAVE_HOOK);
        // 物件第一次拯救自己
        SAVE_HOOK = null;
        System.out.println(SAVE_HOOK);
        System.gc();
        // 因為finalize方法優先順序很低,所以暫停0.5秒以等待它
        Thread.sleep(500);
        if (SAVE_HOOK != null) {
            SAVE_HOOK.isAlive();
        } else {
            System.out.println("no, i am dead : (");
        }

        // 下面這段程式碼與上面的完全相同,但是這一次自救卻失敗了
        // 一個物件的finalize方法只會被呼叫一次
        SAVE_HOOK = null;
        System.gc();
        // 因為finalize方法優先順序很低,所以暫停0.5秒以等待它
        Thread.sleep(500);
        if (SAVE_HOOK != null) {
            SAVE_HOOK.isAlive();
        } else {
            System.out.println("no, i am dead : (");
        }
    }
}

執行結果如下

leesf
null
finalize method executed!
leesf
yes, i am still alive :)
no, i am dead : 

由結果可知,該物件拯救了自己一次,第二次沒有拯救成功,因為物件的finalize方法最多被虛擬機器呼叫一次。此外,從結果我們可以得知,一個堆物件的this(放在區域性變量表中的第一項)引用會永遠存在,在方法體內可以將this引用賦值給其他變數,這樣堆中物件就可以被其他變數所引用,即不會被回收。

方法區如何判斷是否需要回收

方法區儲存內容是否需要回收的判斷是不一樣的。方法區主要回收的內容有:廢棄常量和無用的類。對於廢棄常量也可通過引用的可達性來判斷,但是對於無用的類則需要同時滿足下面3個條件:

  • 該類所有的例項都已經被回收,也就是Java堆中不存在該類的任何例項;
  • 載入該類的ClassLoader已經被回收;
  • 該類對應的java.lang.Class物件沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。

四、垃圾收集演算法

1、標記-清除(Mark-Sweep)演算法

這是最基礎的演算法,標記-清除演算法就如同它的名字樣,分為“標記”和“清除”兩個階段:首先標記出所有需要回收的物件,標記完成後統一回收所有被標記的物件。這種演算法的不足主要體現在效率和空間,從效率的角度講,標記和清除兩個過程的效率都不高;從空間的角度講,標記清除後會產生大量不連續的記憶體碎片, 記憶體碎片太多可能會導致以後程式執行過程中在需要分配較大物件時,無法找到足夠的連續記憶體而不得不提前觸發一次垃圾收集動作。標記-清除演算法執行過程如圖:

2、複製(Copying)演算法

複製演算法是為了解決效率問題而出現的,它將可用的記憶體分為兩塊,每次只用其中一塊,當這一塊記憶體用完了,就將還存活著的物件複製到另外一塊上面,然後再把已經使用過的記憶體空間一次性清理掉。這樣每次只需要對整個半區進行記憶體回收,記憶體分配時也不需要考慮記憶體碎片等複雜情況,只需要移動指標,按照順序分配即可。複製演算法的執行過程如圖:

不過這種演算法有個缺點,記憶體縮小為了原來的一半,這樣代價太高了。現在的商用虛擬機器都採用這種演算法來回收新生代,不過研究表明1:1的比例非常不科學,因此新生代的記憶體被劃分為一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor每次回收時,將Eden和Survivor中還存活著的物件一次性複製到另外一塊Survivor空間上,最後清理掉Eden和剛才用過的Survivor空間。HotSpot虛擬機器預設Eden區和Survivor區的比例為8:1,意思是每次新生代中可用記憶體空間為整個新生代容量的90%。當然,我們沒有辦法保證每次回收都只有不多於10%的物件存活,當Survivor空間不夠用時,需要依賴老年代進行分配擔保(Handle Promotion)。

3、標記-整理(Mark-Compact)演算法

複製演算法在物件存活率較高的場景下要進行大量的複製操作,效率很低。萬一物件100%存活,那麼需要有額外的空間進行分配擔保。老年代都是不易被回收的物件,物件存活率高,因此一般不能直接選用複製演算法。根據老年代的特點,有人提出了另外一種標記-整理演算法,過程與標記-清除演算法一樣,不過不是直接對可回收物件進行清理,而是讓所有存活物件都向一端移動,然後直接清理掉邊界以外的記憶體。標記-整理演算法的工作過程如圖:

4、分代收集演算法

分代收集演算法是目前大部分JVM的垃圾收集器採用的演算法。它的核心思想是根據物件存活的生命週期將記憶體劃分為若干個不同的區域。一般情況下將堆區劃分為老年代(Tenured Generation)和新生代(Young Generation),在堆區之外還有一個代就是永久代(Permanet Generation)。老年代的特點是每次垃圾收集時只有少量物件需要被回收,而新生代的特點是每次垃圾回收時都有大量的物件需要被回收,那麼就可以根據不同代的特點採取最適合的收集演算法。

大批物件死去、少量物件存活的(新生代),使用複製演算法,複製成本低;物件存活率高、沒有額外空間進行分配擔保的(老年代),採用標記-清理演算法或者標記-整理演算法

4.1 年輕代(Young Generation)的回收演算法

a) 所有新生成的物件首先都是放在年輕代的。年輕代的目標就是儘可能快速的收集掉那些生命週期短的物件。

b) 新生代記憶體按照8:1:1的比例分為一個eden區和兩個survivor(survivor0,survivor1)區。一個Eden區,兩個 Survivor區(一般而言)。大部分物件在Eden區中生成。回收時先將eden區存活物件複製到一個survivor0區,然後清空eden區,當這個survivor0區也存放滿了時,則將eden區和survivor0區存活物件複製到另一個survivor1區,然後清空eden和這個survivor0區,此時survivor0區是空的,然後將survivor0區和survivor1區交換,即保持survivor1區為空, 如此往復。

c) 當survivor1區不足以存放 eden和survivor0的存活物件時,就將存活物件直接存放到老年代。若是老年代也滿了就會觸發一次Full GC,也就是新生代、老年代都進行回收。

d) 新生代發生的GC也叫做Minor GC,MinorGC發生頻率比較高(不一定等Eden區滿了才觸發)。

4.2 年老代(Old Generation)的回收演算法

a) 在年輕代中經歷了N次垃圾回收後仍然存活的物件,就會被放到年老代中。因此,可以認為年老代中存放的都是一些生命週期較長的物件。

b) 記憶體比新生代也大很多(大概比例是1:2),當老年代記憶體滿時觸發Major GC即Full GC,Full GC發生頻率比較低,老年代物件存活時間比較長,存活率標記高。

4.3 持久代(Permanent Generation)的回收演算法

用於存放靜態檔案,如Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應用可能動態生成或者呼叫一些class,例如Hibernate 等,在這種時候需要設定一個比較大的持久代空間來存放這些執行過程中新增的類。持久代也稱方法區

物件優先在年輕態區中分配,若沒有足夠空間,Minor GC; 
大物件(需要大量連續記憶體空間)直接進入年老態;長期存活的物件進入年老態。如果物件在年輕態出生並經過第一次MGC後仍然存活,年齡+1,若年齡超過一定限制(15),則被晉升到年老態。

五、垃圾收集器

垃圾收集器就是上面講的理論知識的具體實現了。不同虛擬機器所提供的垃圾收集器可能會有很大差別,我們使用的是HotSpot,HotSpot這個虛擬機器所包含的所有收集器如圖:

上圖展示了7種作用於不同分代的收集器,如果兩個收集器之間存在連線,那說明它們可以搭配使用。虛擬機器所處的區域說明它是屬於新生代收集器還是老年代收集器。多說一句,我們必須明確一個觀點:沒有最好的垃圾收集器,更加沒有萬能的收集器,只能選擇對具體應用最合適的收集器。這也是HotSpot為什麼要實現這麼多收集器的原因。OK,下面一個一個看一下收集器。

1、Serial收集器

最基本、發展歷史最久的收集器,這個收集器是一個採用複製演算法的單執行緒的收集器,單執行緒一方面意味著它只會使用一個CPU或一條執行緒去完成垃圾收集工作,另一方面也意味著它進行垃圾收集時必須暫停其他執行緒的所有工作,直到它收集結束為止。後者意味著,在使用者不可見的情況下要把使用者正常工作的執行緒全部停掉,這對很多應用是難以接受的。不過實際上到目前為止,Serial收集器依然是虛擬機器執行在Client模式下的預設新生代收集器,因為它簡單而高效。使用者桌面應用場景中,分配給虛擬機器管理的記憶體一般來說不會很大,收集幾十兆甚至一兩百兆的新生代停頓時間在幾十毫秒最多一百毫秒,只要不是頻繁發生,這點停頓是完全可以接受的。Serial收集器執行過程如下圖所示:

說明:1. 需要STW(Stop The World),停頓時間長。2. 簡單高效,對於單個CPU環境而言,Serial收集器由於沒有執行緒互動開銷,可以獲取最高的單執行緒收集效率。

2、ParNew收集器

ParNew收集器其實就是Serial收集器的多執行緒版本,除了使用多條執行緒進行垃圾收集外,其餘行為和Serial收集器完全一樣,包括使用的也是複製演算法。ParNew收集器除了多執行緒以外和Serial收集器並沒有太多創新的地方,但是它卻是Server模式下的虛擬機器首選的新生代收集器,其中有一個很重要的和效能無關的原因是,除了Serial收集器外,目前只有它能與CMS收集器配合工作(看圖)。CMS收集器是一款幾乎可以認為有劃時代意義的垃圾收集器,因為它第一次實現了讓垃圾收集執行緒與使用者執行緒基本上同時工作。ParNew收集器在單CPU的環境中絕對不會有比Serial收集器更好的效果,甚至由於執行緒互動的開銷,該收集器在兩個CPU的環境中都不能百分之百保證可以超越Serial收集器。當然,隨著可用CPU數量的增加,它對於GC時系統資源的有效利用還是很有好處的。它預設開啟的收集執行緒數與CPU數量相同,在CPU數量非常多的情況下,可以使用-XX:ParallelGCThreads引數來限制垃圾收集的執行緒數。ParNew收集器執行過程如下圖所示:

3、Parallel Scavenge收集器

Parallel Scavenge收集器也是一個新生代收集器,也是用複製演算法的收集器,也是並行的多執行緒收集器,但是它的特點是它的關注點和其他收集器不同。介紹這個收集器主要還是介紹吞吐量的概念。CMS等收集器的關注點是儘可能縮短垃圾收集時使用者執行緒的停頓時間,而Parallel Scavenge收集器的目標則是打到一個可控制的吞吐量。所謂吞吐量的意思就是CPU用於執行使用者程式碼時間與CPU總消耗時間的比值,即吞吐量=執行使用者程式碼時間/(執行使用者程式碼時間+垃圾收集時間),虛擬機器總執行100分鐘,垃圾收集1分鐘,那吞吐量就是99%。另外,Parallel Scavenge收集器是虛擬機器執行在Server模式下的預設垃圾收集器

停頓時間短適合需要與使用者互動的程式,良好的響應速度能提升使用者體驗;高吞吐量則可以高效率利用CPU時間,儘快完成運算任務,主要適合在後臺運算而不需要太多互動的任務。

虛擬機器提供了-XX:MaxGCPauseMillis和-XX:GCTimeRatio兩個引數來精確控制最大垃圾收集停頓時間和吞吐量大小。不過不要以為前者越小越好,GC停頓時間的縮短是以犧牲吞吐量和新生代空間換取的。由於與吞吐量關係密切,Parallel Scavenge收集器也被稱為“吞吐量優先收集器”。Parallel Scavenge收集器有一個-XX:+UseAdaptiveSizePolicy引數,這是一個開關引數,這個引數開啟之後,就不需要手動指定新生代大小、Eden區和Survivor引數等細節引數了,虛擬機器會根據當前系統的執行情況手機效能監控資訊,動態調整這些引數以提供最合適的停頓時間或者最大的吞吐量。如果對於垃圾收集器運作原理不太瞭解,以至於在優化比較困難的時候,使用Parallel Scavenge收集器配合自適應調節策略,把記憶體管理的調優任務交給虛擬機器去完成將是一個不錯的選擇

4、Serial Old收集器

Serial收集器的老年代版本,同樣是一個單執行緒收集器,使用“標記-整理演算法”,這個收集器的主要意義也是在於給Client模式下的虛擬機器使用。

5、Parallel Old收集器

Parallel Scavenge收集器的老年代版本,使用多執行緒和“標記-整理”演算法。這個收集器在JDK 1.6之後的出現,“吞吐量優先收集器”終於有了比較名副其實的應用組合,在注重吞吐量以及CPU資源敏感的場合,都可以優先考慮Parallel Scavenge收集器+Parallel Old收集器的組合。執行過程如下圖所示:

6、CMS收集器

CMS(Conrrurent Mark Sweep)收集器是以獲取最短回收停頓時間為目標的收集器。使用標記 - 清除演算法,收集過程分為如下四步:

(1). 初始標記,標記GCRoots能直接關聯到的物件,時間很短。

(2). 併發標記,進行GCRoots Tracing(可達性分析)過程,時間很長。

(3). 重新標記,修正併發標記期間因使用者程式繼續運作而導致標記產生變動的那一部分物件的標記記錄,時間較長。

(4). 併發清除,回收記憶體空間,時間很長。

其中,併發標記與併發清除兩個階段耗時最長,但是可以與使用者執行緒併發執行。執行過程如下圖所示:

說明:1. 對CPU資源非常敏感,可能會導致應用程式變慢,吞吐率下降。2. 無法處理浮動垃圾,因為在併發清理階段使用者執行緒還在執行,自然就會產生新的垃圾,而在此次收集中無法收集他們,只能留到下次收集,這部分垃圾為浮動垃圾,同時,由於使用者執行緒併發執行,所以需要預留一部分老年代空間提供併發收集時程式執行使用。3. 由於採用的標記 - 清除演算法,會產生大量的記憶體碎片,不利於大物件的分配,可能會提前觸發一次Full GC。虛擬機器提供了-XX:+UseCMSCompactAtFullCollection引數來進行碎片的合併整理過程,這樣會使得停頓時間變長,虛擬機器還提供了一個引數配置,-XX:+CMSFullGCsBeforeCompaction,用於設定執行多少次不壓縮的Full GC後,接著來一次帶壓縮的GC。

7、G1收集器

G1是目前技術發展的最前沿成果之一,HotSpot開發團隊賦予它的使命是未來可以替換掉JDK1.5中釋出的CMS收集器。與其他GC收集器相比,G1收集器有以下特點:

(1). 並行和併發。使用多個CPU來縮短Stop The World停頓時間,與使用者執行緒併發執行。

(2). 分代收集。獨立管理整個堆,但是能夠採用不同的方式去處理新建立物件和已經存活了一段時間、熬過多次GC的舊物件,以獲取更好的收集效果。

(3). 空間整合。基於標記 - 整理演算法,無記憶體碎片產生。

(4). 可預測的停頓。能簡歷可預測的停頓時間模型,能讓使用者明確指定在一個長度為M毫秒的時間片段內,消耗在垃圾收集上的時間不得超過N毫秒。

在G1之前的垃圾收集器,收集的範圍都是整個新生代或者老年代,而G1不再是這樣。使用G1收集器時,Java堆的記憶體佈局與其他收集器有很大差別,它將整個Java堆劃分為多個大小相等的獨立區域(Region),雖然還保留有新生代和老年代的概念,但新生代和老年代不再是物理隔離的了,它們都是一部分(可以不連續)Region的集合。

8、常用的收集器組合

、理解GC日誌

在vm options處加入-XX:+PrintGCDetails

每種收集器的日誌形式都是由它們自身的實現所決定的,換言之,每種收集器的日誌格式都可以不一樣。不過虛擬機器為了方便使用者閱讀,將各個收集器的日誌都維持了一定的共性,來看下面的一段GC日誌:

[GC [DefNew: 310K->194K(2368K), 0.0269163 secs] 310K->194K(7680K), 0.0269513 secs] [Times: user=0.00 sys=0.00, real=0.03 secs] 
[GC [DefNew: 2242K->0K(2368K), 0.0018814 secs] 2242K->2241K(7680K), 0.0019172 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[Full GC (System) [Tenured: 2241K->193K(5312K), 0.0056517 secs] 4289K->193K(7680K), [Perm : 2950K->2950K(21248K)], 0.0057094 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap
 def new generation   total 2432K, used 43K [0x00000000052a0000, 0x0000000005540000, 0x0000000006ea0000)
  eden space 2176K,   2% used [0x00000000052a0000, 0x00000000052aaeb8, 0x00000000054c0000)
  from space 256K,   0% used [0x00000000054c0000, 0x00000000054c0000, 0x0000000005500000)
  to   space 256K,   0% used [0x0000000005500000, 0x0000000005500000, 0x0000000005540000)
 tenured generation   total 5312K, used 193K [0x0000000006ea0000, 0x00000000073d0000, 0x000000000a6a0000)
   the space 5312K,   3% used [0x0000000006ea0000, 0x0000000006ed0730, 0x0000000006ed0800, 0x00000000073d0000)
 compacting perm gen  total 21248K, used 2982K [0x000000000a6a0000, 0x000000000bb60000, 0x000000000faa0000)
   the space 21248K,  14% used [0x000000000a6a0000, 0x000000000a989980, 0x000000000a989a00, 0x000000000bb60000)
No shared spaces configured.

1、日誌的開頭“GC”、“Full GC”表示這次垃圾收集的停頓型別,而不是用來區分新生代GC還是老年代GC的。如果有Full,則說明本次GC停止了其他所有工作執行緒(Stop-The-World)。看到Full GC的寫法是“Full GC(System)”,這說明是呼叫System.gc()方法所觸發的GC。

2、“GC”中接下來的“[DefNew”表示GC發生的區域,這裡顯示的區域名稱與使用的GC收集器是密切相關的,例如上面樣例所使用的Serial收集器中的新生代名為“Default New Generation”,所以顯示的是“[DefNew”。如果是ParNew收集器,新生代名稱就會變為“[ParNew”,意為“Parallel New Generation”。如果採用Parallel Scavenge收集器,那它配套的新生代稱為“PSYoungGen”,老年代和永久代同理,名稱也是由收集器決定的。

3、後面方括號內部的“310K->194K(2368K)”、“2242K->0K(2368K)”,指的是該區域已使用的容量->GC後該記憶體區域已使用的容量(該記憶體區總容量)。方括號外面的“310K->194K(7680K)”、“2242K->2241K(7680K)”則指的是GC前Java堆已使用的容量->GC後Java堆已使用的容量(Java堆總容量)

4、再往後“0.0269163 secs”表示該記憶體區域GC所佔用的時間,單位是秒。最後的“[Times: user=0.00 sys=0.00 real=0.03 secs]”則更具體了,user表示使用者態消耗的CPU時間、核心態消耗的CPU時間、操作從開始到結束經過的牆鍾時間。後面兩個的區別是,牆鍾時間包括各種非運算的等待消耗,比如等待磁碟I/O、等待執行緒阻塞,而CPU時間不包括這些耗時,但當系統有多CPU或者多核的話,多執行緒操作會疊加這些CPU時間,所以如果看到user或sys時間超過real時間是完全正常的。

5、“Heap”後面就列舉出堆記憶體目前各個年代的區域的記憶體情況。

七、GC是什麼時候觸發的(面試最常見的問題之一)

由於物件進行了分代處理,因此垃圾回收區域、時間也不一樣。GC有兩種型別:Scavenge GC和Full GC。

7.1 Scavenge GC

一般情況下,當新物件生成,並且在Eden申請空間失敗時,就會觸發Scavenge GC,對Eden區域進行GC,清除非存活物件,並且把尚且存活的物件移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分物件都是從Eden區開始的,同時Eden區不會分配的很大,所以Eden區的GC會頻繁進行。因而,一般在這裡需要使用速度快、效率高的演算法,使Eden去能儘快空閒出來。

7.2 Full GC

對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進行回收,所以比Scavenge GC要慢,因此應該儘可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對於Full GC的調節。有如下原因可能導致Full GC:

a) 年老代(Tenured)被寫滿;

b) 持久代(Perm)被寫滿;

c) System.gc()被顯示呼叫;

d) 上一次GC之後Heap的各域分配策略動態變化;