1. 程式人生 > >為什麼新生代記憶體需要有兩個Survivor區

為什麼新生代記憶體需要有兩個Survivor區

在我的上一篇部落格中,介紹了JVM堆記憶體的結構以及在堆中進行的GC機制,連結是淺談JAVA GC機制與效能優化

那麼,在JVM的新生代記憶體中,為什麼除了Eden區,還要設定兩個Survivor區?

1 為什麼要有Survivor區

先不去想為什麼有兩個Survivor區,第一個問題是,設定Survivor區的意義在哪裡?
堆記憶體分類

如果沒有Survivor,Eden區每進行一次Minor GC,存活的物件就會被送到老年代。老年代很快被填滿,觸發Major GC(因為Major GC一般伴隨著Minor GC,也可以看做觸發了Full GC)。老年代的記憶體空間遠大於新生代,進行一次Full GC消耗的時間比Minor GC長得多。你也許會問,執行時間長有什麼壞處?頻發的Full GC消耗的時間是非常可觀的,這一點會影響大型程式的執行和響應速度,更不要說某些連線會因為超時發生連線錯誤了。

好,那我們來想想在沒有Survivor的情況下,有沒有什麼解決辦法,可以避免上述情況:

方案 優點 缺點
增加老年代空間 更多存活物件才能填滿老年代。降低Full GC頻率 隨著老年代空間加大,一旦發生Full GC,執行所需要的時間更長
減少老年代空間 Full GC所需時間減少 老年代很快被存活物件填滿,Full GC頻率增加

顯而易見,沒有Survivor的話,上述兩種解決方案都不能從根本上解決問題。

我們可以得到第一條結論:Survivor的存在意義,就是減少被送到老年代的物件,進而減少Full GC的發生,Survivor的預篩選保證,只有經歷16次Minor GC還能在新生代中存活的物件,才會被送到老年代。

2 為什麼要設定兩個Survivor區

設定兩個Survivor區最大的好處就是解決了碎片化,下面我們來分析一下。

為什麼一個Survivor區不行?第一部分中,我們知道了必須設定Survivor區。假設現在只有一個survivor區,我們來模擬一下流程:
剛剛新建的物件在Eden中,一旦Eden滿了,觸發一次Minor GC,Eden中的存活物件就會被移動到Survivor區。這樣繼續迴圈下去,下一次Eden滿了的時候,問題來了,此時進行Minor GC,Eden和Survivor各有一些存活物件,如果此時把Eden區的存活物件硬放到Survivor區,很明顯這兩部分物件所佔有的記憶體是不連續的,也就導致了記憶體碎片化


我繪製了一幅圖來表明這個過程。其中色塊代表物件,白色框分別代表Eden區(大)和Survivor區(小)。Eden區理所當然大一些,否則新建物件很快就導致Eden區滿,進而觸發Minor GC,有悖於初衷。
一個Survivor區帶來碎片化

碎片化帶來的風險是極大的,嚴重影響JAVA程式的效能。堆空間被散佈的物件佔據不連續的記憶體,最直接的結果就是,堆中沒有足夠大的連續記憶體空間,接下去如果程式需要給一個記憶體需求很大的物件分配記憶體。。。畫面太美不敢看。。。這就好比我們爬山的時候,揹包裡所有東西緊挨著放,最後就可能省出一塊完整的空間放相機。如果每件行李之間隔一點空隙亂放,很可能最後就要一路把相機掛在脖子上了。

那麼,順理成章的,應該建立兩塊Survivor區,剛剛新建的物件在Eden中,經歷一次Minor GC,Eden中的存活物件就會被移動到第一塊survivor space S0,Eden被清空;等Eden區再滿了,就再觸發一次Minor GC,Eden和S0中的存活物件又會被複制送入第二塊survivor space S1(這個過程非常重要,因為這種複製演算法保證了S1中來自S0和Eden兩部分的存活物件佔用連續的記憶體空間,避免了碎片化的發生)。S0和Eden被清空,然後下一輪S0與S1交換角色,如此迴圈往復。如果物件的複製次數達到16次,該物件就會被送到老年代中。下圖中每部分的意義和上一張圖一樣,就不加註釋了。
兩塊Survivor避免碎片化
上述機制最大的好處就是,整個過程中,永遠有一個survivor space是空的,另一個非空的survivor space無碎片

那麼,Survivor為什麼不分更多塊呢?比方說分成三個、四個、五個?顯然,如果Survivor區再細分下去,每一塊的空間就會比較小,很容易導致Survivor區滿,因此,我認為兩塊Survivor區是經過權衡之後的最佳方案。