徹底理解JVM常考題之分級引用模型
本文通過探析Java中的引用模型,分析比較強引用、軟引用、弱引用、虛引用的概念及使用場景,知其然且知其所以然,希望給大家在實際開發實踐、學習開源專案提供參考。
Java的引用
對於Java中的垃圾回收機制來說,物件是否被應該回收的取決於該物件是否被引用。因此,引用也是JVM進行記憶體管理的一個重要概念。Java中是JVM負責記憶體的分配和回收,這是它的優點(使用方便,程式不用再像使用C語言那樣擔心記憶體),但同時也是它的缺點(不夠靈活)。由此,Java提供了引用分級模型,可以定義Java物件重要性和優先順序,提高JVM記憶體回收的執行效率。
關於引用的定義,在JDK1.2之前,如果reference型別的資料中儲存的數值代表的是另一塊記憶體的起始地址,就稱為這塊記憶體代表著一個引用;JDK1.2之後,Java對引用的概念進行了擴充,將引用分為強引用(Strong Reference)、軟引用(Soft Reference)、弱引用(Weak Reference)、虛引用(Phantom Reference)四種。
軟引用物件和弱應用物件主要用於:當記憶體空間還足夠,則能儲存在記憶體之中;如果記憶體空間在垃圾收集之後還是非常緊張,則可以拋棄這些物件。很多系統的快取功能都符合這樣的使用場景。
而虛引用物件用於替代不靠譜的finalize方法,可以獲取物件的回收事件,來做資源清理工作。
物件生命週期
無分級引用物件生命週期
前面提到,分層引用的模型是用於記憶體回收,沒有分級引用物件下,一個物件從建立到回收的生命週期可以簡單地用下圖概括:物件被建立,被使用,有資格被收集,最終被收集,陰影區域表示物件“強可達”時間:
物件生命週期(無分級引用)
有分級引用物件生命週期
JDK1.2引入java.lang.ref程式包之後,物件的生命週期多了3個階段,軟可達,弱可達,虛可達,這些狀態僅適用於符合垃圾回收條件的物件,這些物件處於非強引用階段,而且需要基於java.lang.ref包中的相關的引用物件類來指示標明。
軟可達
軟可達物件用SoftReference來指示標明,並沒有強引用,垃圾回收器會盡可能長時間地保留物件,但是會在丟擲OutOfMemoryError異常之前收集它。
弱可達
弱可達物件用WeakReference來指示標明,並沒有強引用或軟引用,垃圾回收器會隨時回收物件,並不會嘗試保留它,但是會在丟擲OutOfMemoryError異常之前收集它。
在物件回收階段中,該物件在major collection期間被回收,但是可以在minor collection期間存活
虛可達
虛可達物件用PhantomReference來指示標明,它已經被標記選中進行垃圾回收並且它的finalizer(如果有)已經執行。在這種情況下,術語“可達”實際上是用詞不當,因為您無法訪問實際物件。
物件生命週期(有分級引用)
物件生命週期圖中新增三個新的可選狀態會造成一些困惑。邏輯順序上是從強可達到軟,弱和虛,最終到回收,但實際的情況取決於程式建立的參考物件。但如果建立WeakReference但不建立SoftReference,則物件直接從強可達到弱到達最終到收集。
強引用
強引用就是指在程式程式碼之中普遍存在的,比如下面這段程式碼中的obj和str都是強引用:
只要強引用還存在,垃圾收集器永遠不會回收被引用的物件,即使在記憶體不足的情況下,JVM即使丟擲OutOfMemoryError異常也不會回收這種物件。
實際使用上,可以通過把引用顯示賦值為null來中斷物件與強引用之前的關聯,如果沒有任何引用執行物件,垃圾收集器將在合適的時間回收物件。
例如ArrayList類的remove方法中就是通過將引用賦值為null來實現清理工作的:
引用物件
介紹軟引用、弱引用和虛引用之前,有必要介紹一下引用物件,
引用物件是程式程式碼和其他物件之間的間接層,稱為引用物件。每個引用物件都圍繞物件的引用構造,並且不能更改引用值。
引用物件提供get()來獲得其引用值的一個強引用,垃圾收集器可能隨時回收引用值所指的物件。
一旦物件被回收,get()方法將返回null,要正確使用引用物件,下面使用SoftReference(軟引用物件)作為參考示例:
也就是說,使用時:
1、必須經常檢查引用值是否為null
垃圾收集器可能隨時回收引用物件,如果輕率地使用引用值,遲早會得到一個NullPointerException。
2、必須使用強引用來指向引用物件返回的值
垃圾收集器可能在任何時間回收引用物件,即使在一個表示式中間。
3、必須持有引用物件的強引用
如果建立引用物件,沒有持有物件的強引用,那麼引用物件本身將被垃圾收集器回收。
4、當引用值沒有被其他強引用指向時,軟引用、弱引用和虛引用才會發揮作用,引用物件的存在就是為了方便追蹤並高效垃圾回收。
軟引用、弱引用和虛引用
引用物件的3個重要實現類位於java.lang.ref包下,分別是軟引用SoftReference、弱引用WeakReference和虛引用PhantomReference。
軟引用
軟引用用來描述一些還有用但非必需的物件。對於軟引用關聯著的物件,在系統將要發生丟擲OutOfMemoryError異常之前,將會把這些物件列入回收範圍之內進行第二次回收。如果這次回收還沒有足夠的記憶體,才會丟擲OutOfMemoryError異常。在JDK1.2之後,提供了SoftReference類來實現軟引用。
下面是一個使用示例:
JDK文件中提到:軟引用適用於對記憶體敏感的快取:每個快取物件都是通過訪問的 SoftReference,如果JVM決定需要記憶體空間,那麼它將清除回收部分或全部軟引用對應的物件。如果它不需要空間,則SoftReference指示物件保留在堆中,並且可以通過程式程式碼訪問。在這種情況下,當它們被積極使用時,它們被強引用,否則會被軟引用。如果清除了軟引用,則需要重新整理快取。
實際使用上,要除非快取的物件非常大,每個數量級為幾千位元組,才值得考慮使用軟引用物件。例如:實現一個檔案伺服器,它需要定期檢索相同的檔案,或者需要快取大型物件圖。如果物件很小,必須清除很多物件才能產生影響,那麼不建議使用,因為清除軟引用物件會增加整個過程的開銷。
弱引用
弱引用也是用來描述非必需物件,但是它的強度比軟引用更弱一些,被弱引用關聯的物件只能生存到下一次垃圾收集傳送之前。當垃圾收集器工作時,無論當前記憶體是否足夠,都會回收掉只被弱引用關聯的物件。
在JDK1.2之後,提供了WeakReference類來實現弱引用。
可以看到被弱引用關聯的物件,在gc之後被回收掉。
有意思的地方是,如果把上面程式碼中的:
改為
程式將輸出
這是因為使用Java的String直接賦值和使用new區別在於:
new 會在堆區建立一個可以被正常回收的物件。
String直接賦值,會在Java StringPool(字串常量池)裡建立一個String物件,存於pergmen(永生代區)中,通常不會被gc回收。
WeakHashMap
為了更方便使用弱引用,Java還提供了WeakHashMap,功能類似HashMap,內部實現是用弱引用對key進行包裝,當某個key物件沒有任何強引用指向,gc會自動回收key和value物件。
程式輸出:
WeakHashMap比較適用於快取的場景,例如Tomcat的快取就用到。
引用佇列
介紹虛引用之前,先介紹引用佇列:
在使用引用物件時,通過判斷get()方法返回的值是否為null來判斷物件是否已經被回收,當這樣做並不是非常高效,特別是當我們有很多引用物件,如果想找出哪些物件已經被回收,需要遍歷所有所有物件。
更好的方案是使用引用佇列,在構造引用物件時與佇列關聯,當gc(垃圾回收執行緒)準備回收一個物件時,如果發現它還僅有軟引用(或弱引用,或虛引用)指向它,就會在回收該物件之前,把這個軟引用(或弱引用,或虛引用)加入到與之關聯的引用佇列(ReferenceQueue)中。
如果一個軟引用(或弱引用,或虛引用)物件本身在引用佇列中,就說明該引用物件所指向的物件被回收了,所以要找出所有被回收的物件,只需要遍歷引用佇列。
當軟引用(或弱引用,或虛引用)物件所指向的物件被回收了,那麼這個引用物件本身就沒有價值了,如果程式中存在大量的這類物件(注意,我們建立的軟引用、弱引用、虛引用物件本身是個強引用,不會自動被gc回收),就會浪費記憶體。因此我們這就可以手動回收位於引用佇列中的引用物件本身。
程式輸出:
虛引用
虛引用也稱為幽靈引用或者幻影引用,不同於軟引用和弱引用,虛引用不用於訪問引用物件所指示的物件,相反,通過不斷輪詢虛引用物件關聯的引用佇列,可以得到物件回收事件。一個物件是否有虛引用的存在,完全不會對其生產時間構成影響,也無法通過虛引用來取得一個物件例項。雖然這看起來毫無意義,但它實際上可以用來做物件回收時資源清理、釋放,它比finalize更靈活,我們可以基於虛引用做更安全可靠的物件關聯的資源回收。
finalize的問題
Java語言規範並不保證finalize方法會被及時地執行、而且根本不會保證它們會被執行
如果可用記憶體沒有被耗盡,垃圾收集器不會執行,finalize方法也不會被執行。
效能問題
JVM通常在單獨的低優先順序執行緒中完成finalize的執行。
物件再生問題
finalize方法中,可將待回收物件賦值給GC Roots可達的物件引用,從而達到物件再生的目的。
針對不靠譜finalize方法,完全可以使用虛引用來實現。在JDK1.2之後,提供了PhantomReference類來實現虛引用。
下面是簡單的使用例子,通過訪問引用佇列可以得到物件的回收事件:
比較常見的,可以基於虛引用實現JDBC連線池,鎖的釋放等場景。
以連線池為例,呼叫方正常情況下使用完連線,需要把連線釋放回池中,但是不可避免有可能程式有bug,造成連線沒有正常釋放回池中。基於虛引用對Connection物件進行包裝,並關聯引用佇列,就可以通過輪詢引用佇列檢查哪些連線物件已經被GC回收,釋放相關連線資源。具體實現已上傳github的caison-blog-demo倉庫。
總結
對比一下幾種引用物件的不同:
虛引用,配合引用佇列使用,通過不斷輪詢引用佇列獲取物件回收事件。
雖然引用物件是一個非常有用的工具來管理你的記憶體消耗,但有時它們是不夠的,或者是過度設計的 。例如,使用一個Map來快取從資料庫中讀取的資料。雖然可以使用弱引用來作為快取,但最終程式需要執行一定量的記憶體。如果不能給它足夠實際足夠的資源完成任何工作,那麼錯誤恢復機制有多強大也沒有用。
當遇到OutOfMemoryError錯誤,第一反應是要弄清楚它為什麼會發生,也許真的是程式有bug,也許是可用記憶體設定的太低。
在開發過程中,應該制定程式具體的使用記憶體大小,而已要關注實際使用中用了多少記憶體。大多數應用程式在實際執行負載下,程式的記憶體佔用會達到穩定狀態,可以用此來作為參考來設定合理的堆大小。如果程式的記憶體使用量隨著時間的推移而上升,很有可能是因為當物件不再使用時仍然擁有對物件的強引用。引用物件在這裡可能會有所幫助,但更有可能是把它當做一個bug來進行修復。
歡迎工作一到五年的Java工程師朋友們加入Java填坑之路:860113481
群內提供免費的Java架構學習資料(裡面有高可用、高併發、高效能及分散式、Jvm效能調優、Spring原始碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用自己每一分每一秒的時間來學習提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!