1. 程式人生 > >JVM回收算法

JVM回收算法

rdquo 占用 當我 周期 hot 開啟 三種 對象 連接

  根搜索算法

  • 原理:設立若幹種根對象,當任何一個根對象到某一個對象均不可達時,則認為這個對象是可以被回收的。一般是對象持有的引用指向該對象不可達

  

  • 在JAVA語言中,可以當做GC roots的對象有以下幾種:

1、虛擬機棧中的引用的對象。

2、方法區中的類靜態屬性引用的對象。

3、方法區中的常量引用的對象。

4、本地方法棧中JNI的引用的對象。

第一和第四種都是指的方法的本地變量表,第二種表達的意思比較清晰,第三種主要指的是聲明為final的常量值。

  標記-清除算法

  • 因為我們在程序運行期間如果想進行垃圾回收,就必須讓GC線程與程序當中的線程互相配合,才能在不影響程序運行的前提下,順利的將垃圾進行回收。為了達到這個目的,標記/清除算法就應運而生了。它的做法是當堆中的有效內存空間被耗盡的時候,就會停止整個程序,然後進行兩項工作,第一項則是標記,第二項則是清除,完成後讓程序恢復運行。

標記:標記的過程其實就是,遍歷所有的GC Roots,然後將所有GC Roots可達的對象標記為存活的對象。

清除:清除的過程將遍歷堆中所有的對象,將沒有標記的對象全部清除掉。

缺點:

1、首先,它的缺點就是效率比較低(遞歸與全堆對象遍歷),而且在進行GC的時候,需要停止應用程序

2、第二點主要的缺點,則是這種方式清理出來的空閑內存是不連續的,這點不難理解,我們的死亡對象都是隨即的出現在內存的各個角落的,現在把它們清除之後,內存的布局自然會亂七八糟。而為了應付這一點,JVM就不得不維持一個內存的空閑列表,這又是一種開銷。而且在分配數組對象的時候,尋找連續的內存空間會不太好找。

  復制算法

  • 復制算法將內存劃分為兩個區間,在任意時間點,所有動態分配的對象都只能分配在其中一個區間(稱為活動區間),而另外一個區間(稱為空閑區間)則是空閑的。
  • 當有效內存空間耗盡時,JVM將暫停程序運行,開啟復制算法GC線程。接下來GC線程會將活動區間內的存活對象,全部復制到空閑區間,且嚴格按照內存地址依次排列,與此同時,GC線程將更新存活對象的內存引用地址指向新的內存地址。
  • 此時,空閑區間已經與活動區間交換,而垃圾對象現在已經全部留在了原來的活動區間,也就是現在的空閑區間。事實上,在活動區間轉換為空間區間的同時,垃圾對象已經被一次性全部回收。在下一次GC之後,左邊將會再次變成活動區間

復制算法彌補了標記/清除算法中,內存布局混亂的缺點。不過與此同時,它的缺點也是相當明顯的。

1、它浪費了一半的內存

2、如果對象的存活率很高,我們可以極端一點,假設是100%存活,那麽我們需要將所有對象都復制一遍,並將所有引用地址重置一遍。復制這一工作所花費的時間,在對象存活率達到一定程度時,將會變的不可忽視。

所以從以上描述不難看出,復制算法要想使用,最起碼對象的存活率要非常低才行,而且最重要的是,我們必須要克服50%內存的浪費。

  

  標記/整理算法

  • 標記/整理算法與標記/清除算法非常相似,它也是分為兩個階段:標記和整理。下面LZ給各位介紹一下這兩個階段都做了什麽。

標記:它的第一個階段與標記/清除算法是一模一樣的,均是遍歷GC Roots,然後將存活的對象標記.

整理:移動所有存活的對象,且按照內存地址次序依次排列,然後將末端內存地址以後的內存全部回收。因此,第二階段才稱為整理階段。

可以看到,標記的存活對象將會被整理,按照內存地址依次排列,而未被標記的內存會被清理掉。如此一來,當我們需要給新對象分配內存時,JVM只需要持有一個內存的起始地址即可,這比維護一個空閑列表顯然少了許多開銷。

不難看出,標記/整理算法不僅可以彌補標記/清除算法當中,內存區域分散的缺點,也消除了復制算法當中,內存減半的高額代價

不過任何算法都會有其缺點,標記/整理算法唯一的缺點就是效率也不高,不僅要標記所有存活對象,還要整理所有存活對象的引用地址。從效率上來說,標記/整理算法要低於復制算法。

  效率:復制算法>標記/整理算法>標記/清除算法(此處的效率只是簡單的對比時間復雜度,實際情況不一定如此)

內存整齊度:復制算法=標記/整理算法>標記/清除算法。

內存利用率:標記/整理算法=標記/清除算法>復制算法。

  分代搜集算法

   內存中的對象按照生命周期的長短大致可以分為三種,以下命名均為LZ個人的命名。

1、夭折對象:朝生夕滅的對象,通俗點講就是活不了多久就得死的對象。

例子:某一個方法的局域變量、循環內的臨時變量等等。

2、老不死對象:這類對象一般活的比較久,歲數很大還不死,但歸根結底,老不死對象也幾乎早晚要死的,但也只是幾乎而已。

例子:緩存對象、數據庫連接對象、單例對象(單例模式)等等。

3、不滅對象:此類對象一般一旦出生就幾乎不死了,它們幾乎會一直永生不滅,記得,只是幾乎不滅而已。

例子:String池中的對象(享元模式)、加載過的類信息等等。

  • 我們將上面三種對象對應到內存區域當中,就是夭折對象和老不死對象都在JAVA堆,而不滅對象在方法區由於不滅對象的生命周期過長,因此分代搜集算法就是針對的JAVA堆而設計的,也就是針對夭折對象和老不死對象。

  夭折對象:這類對象朝生夕滅,存活時間短,還記得復制算法的使用要求嗎?那就是對象存活率不能太高,因此夭折對象是最適合使用復制算法的。

小疑問:50%內存的浪費怎麽辦?

  • 答疑:因為夭折對象一般存活率較低,因此可以不使用50%的內存作為空閑,一般的,使用兩塊10%的內存作為空閑和活動區間,而另外80%的內存,則是用來給新建對象分配內存的。一旦發生GC,將10%的活動區間與另外80%中存活的對象轉移到10%的空閑區間,接下來,將之前90%的內存全部釋放,以此類推。

第一點是使用這樣的方式,我們只浪費了10%的內存,這個是可以接受的,因為我們換來了內存的整齊排列與GC速度。第二點是,這個策略的前提是,每次存活的對象占用的內存不能超過這10%的大小,一旦超過,多出的對象將無法復制。

為了解決上面的意外情況,也就是存活對象占用的內存太大時的情況,高手們將JAVA堆分成兩部分來處理,上述三個區域則是第一部分,稱為新生代或者年輕代。而余下的一部分,專門存放老不死對象的則稱為年老代。

  老不死對象:這一類對象存活率非常高,因為它們大多是從新生代轉過來的。就像人一樣,活的年月久了,就變成老不死了。

通常情況下,以下兩種情況發生的時候,對象會從新生代區域轉到年老帶區域。

1、在新生代裏的每一個對象,都會有一個年齡,當這些對象的年齡到達一定程度時(年齡就是熬過的GC次數,每次GC如果對象存活下來,則年齡加1),則會被轉到年老代,而這個轉入年老代的年齡值,一般在JVM中是可以設置的。

2、在新生代存活對象占用的內存超過10%時,則多余的對象會放入年老代。這種時候,年老代就是新生代的“備用倉庫”。

針對老不死對象的特性,顯然不再適合使用復制算法,因為它的存活率太高,而且不要忘了,如果年老代再使用復制算法,它可是沒有備用倉庫的。因此一般針對老不死對象只能采用標記/整理或者標記/清除算法。

  方法區的對象回收(不滅對象)

  • 以上兩種情況已經解決了GC的大部分問題,因為JAVA堆是GC的主要關註對象,而以上也已經包含了分代搜集算法的全部內容,接下來對於不滅對象的回收,已經不屬於分代搜集算法的內容。 不滅對象存在於方法區,在我們常用的hotspot虛擬機(JDK默認的JVM)中,方法區也被親切的稱為永久代,又是一個很貼切的名字不是嗎?
  • 其實在很久很久以前,是不存在永久代的。當時永久代與年老代都存放在一起,裏面包含了JAVA類的實例信息以及類信息。但是後來發現,對於類信息的卸載幾乎很少發生,因此便將二者分離開來。幸運的是,這樣做確實提高了不少性能。於是永久代便被拆分出來了。 這一部分區域的GC與年老代采用相似的方法,由於都沒有“備用倉庫”,二者都是只能使用標記/清除和標記/整理算法。

參考資料:左瀟龍博客

JVM回收算法