JVM--標記-清除演算法Mark-Sweep

阿新 • • 發佈：2018-11-21

前言

垃圾自動回收機制的出現使程式設計更加的簡單，使得我們不需要再去考慮記憶體分配和釋放的問題，而是更加的專注在我們產品功能的實現上。但是我們還是需要花時間去了解下垃圾收集機制是怎麼工作的，以便後面能夠更好的進行我們應用的效能調優等。
目前最基本的垃圾收集演算法有四種,標記-清除演算法(mark-sweep),標記-壓縮演算法(mark-compact),複製演算法(copying)以及引用計數演算法(reference counting).而現代流行的垃圾收集演算法一般是由這四種中的其中幾種演算法相互組合而成，比如說，對堆(heap)的一部分採用標記-清除演算法，對堆(heap)的另外一部分則採用複製演算法等等。今天我們主要來看下標記-清除演算法的原理。

基本概念

在瞭解標記-清除演算法前，我們先要了解幾個基本概念。
1.首先是mutator和collector，這兩個名詞經常在垃圾收集演算法中出現，collector指的就是垃圾收集器，而mutator是指除了垃圾收集器之外的部分，比如說我們應用程式本身。mutator的職責一般是NEW(分配記憶體),READ(從記憶體中讀取內容),WRITE(將內容寫入記憶體)，而collector則就是回收不再使用的記憶體來供mutator進行NEW操作的使用。
2. 第二個基本概念是關於mutator roots(mutator根物件),mutator根物件一般指的是分配在堆記憶體之外，可以直接被mutator直接訪問到的物件，一般是指靜態/全域性變數以及Thread-Local變數(在Java中，儲存在java.lang.ThreadLocal中的變數和分配在棧上的變數 - 方法內部的臨時變數等都屬於此類).
3.第三個基本概念是關於可達物件的定義，從mutator根物件開始進行遍歷，可以被訪問到的物件都稱為是可達物件。這些物件也是mutator(你的應用程式)正在使用的物件。

演算法原理

顧名思義，標記-清除演算法分為兩個階段，標記(mark)和清除(sweep).
在標記階段，collector從mutator根物件開始進行遍歷，對從mutator根物件可以訪問到的物件都打上一個標識，一般是在物件的header中，將其記錄為可達物件。
而在清除階段，collector對堆記憶體(heap memory)從頭到尾進行線性的遍歷，如果發現某個物件沒有標記為可達物件-通過讀取物件的header資訊，則就將其回收。
從上圖我們可以看到，在Mark階段，從根物件1可以訪問到B物件，從B物件又可以訪問到E物件，所以B,E物件都是可達的。同理，F,G,J,K也都是可達物件。到了Sweep階段，所有非可達物件都會被collector回收。同時，Collector在進行標記和清除階段時會將整個應用程式暫停(mutator)，等待標記清除結束後才會恢復應用程式的執行，這也是Stop-The-World這個單詞的來歷。

接著我們先看下一般垃圾收集動作是怎麼被觸發的，下面是mutator進行NEW操作的虛擬碼：

New():
    ref <- allocate()  //分配新的記憶體到ref指標
    if ref == null
       collect()  //記憶體不足，則觸發垃圾收集
       ref <- allocate()
       if ref == null
          throw "Out of Memory"   //垃圾收集後仍然記憶體不足，則丟擲Out of Memory錯誤
          return ref

atomic collect():
    markFromRoots()
    sweep(HeapStart,HeapEnd)
 

而下面是對應的mark演算法:

markFromRoots():
    worklist <- empty
    for each fld in Roots  //遍歷所有mutator根物件
        ref <- *fld
        if ref != null && isNotMarked(ref)  //如果它是可達的而且沒有被標記的，直接標記該物件並將其加到worklist中
           setMarked(ref)
           add(worklist,ref)
           mark()
mark():
    while not isEmpty(worklist)
          ref <- remove(worklist)  //將worklist的最後一個元素彈出，賦值給ref
          for each fld in Pointers(ref)  //遍歷ref物件的所有指標域，如果其指標域(child)是可達的，直接標記其為可達物件並且將其加入worklist中
          //通過這樣的方式來實現深度遍歷，直到將該物件下面所有可以訪問到的物件都標記為可達物件。
                child <- *fld
                if child != null && isNotMarked(child)
                   setMarked(child)
                   add(worklist,child)
 

在mark階段結束後，sweep演算法就比較簡單了，它就是從堆記憶體起始位置開始，線性遍歷所有物件直到堆記憶體末尾，如果該物件是可達物件的（在mark階段被標記過的），那就直接去除標記位（為下一次的mark做準備），如果該物件是不可達的，直接釋放記憶體。

sweep(start,end):
    scan <- start
   while scan < end
       if isMarked(scan)
          setUnMarked(scan)
      else
          free(scan)
      scan <- nextObject(scan)

缺點

標記-清除演算法的比較大的缺點就是垃圾收集後有可能會造成大量的記憶體碎片，像上面的圖片所示，垃圾收集後記憶體中存在三個記憶體碎片，假設一個方格代表1個單位的記憶體，如果有一個物件需要佔用3個記憶體單位的話，那麼就會導致Mutator一直處於暫停狀態，而Collector一直在嘗試進行垃圾收集，直到Out of Memory。

轉載：https://www.cnblogs.com/fengjian/p/4917785.html

JVM--標記-清除演算法Mark-Sweep

前言垃圾自動回收機制的出現使程式設計更加的簡單，使得我們不需要再去考慮記憶體分配和釋放的問題，而是更加的專注在我們產品功能的實現上。但是我們還是需要花時間去了解下垃圾收集機制是怎麼工作的，以便後面能夠更好的進行我們應用的效能調優等。目前最基本的垃圾收集演算法有四種,標記-清除

JVM垃圾回收集演算法 —— 標記-清除演算法、複製演算法、標記-整理演算法

標記-清除演算法 1、執行過程：如同它的名字一樣，演算法分為“標記”和“清除”兩個階段：首先標記出所有需要回收的物件，在標記完成後統一回收所有被標記的物件 2、該演算法是回收演算法中最基礎的演算法，其他的演算法都是基於該演算法進行改進的 3、缺點：（1）效率問題：標記和清

垃圾收集演算法——標記-清除演算法

此垃圾收集演算法分為“標記”和“清除”兩個階段：　　首先標記出所有需要回收的物件，在標記完成後統一回收所有被標記物件，它的標記過程前面已經說過——如何判斷物件是否存活/死去　　死去的物件就會被標記，然後被清除。它主要有兩點不足：　　一個是效率問題，標記和清除兩個過程的效率都不高；　　另一個

垃圾回收之垃圾回收演算法比較（標記-清除演算法、複製演算法、標記-整理演算法、分代整理演算法）

標記-清除演算法：第一階段：對符合回收標準的物件進行標記， &nbs

GC演算法精解（複製演算法與標記/整理演算法）目前的兩種主流演算法，基於標記清除演算法而來

refer to http://www.cnblogs.com/zuoxiaolong/p/jvm5.html 在說以下兩種演算法前，說說他們的進化源——標記清除有什麼問題。第二點尤甚 1、首先，它的缺點就是效率比較低（遞迴與全堆物件遍歷），而且在進行GC的時候

jvm 三種垃圾回收演算法：標記-清除、複製演算法、標記-整理

標記-清除：先標記出GC Roots能關聯到的物件，然後清除這些被標記的物件，剩下的就是存活的物件了。缺點： 1、清除需要被清理的物件後剩下的記憶體都是破碎的，如果要建立大物件，可能會因為找不到足夠的記憶體而再次觸發垃圾收集。 2、標記和清除的效率相對於其他演算法來說都不高，標記的原理

JVM 之（4）垃圾回收演算法（標記 -清除、複製、標記-整理、分代收集）

1、標記 -清除演算法（Mark-Sweep）“標記-清除”演算法，如它的名字一樣，演算法分為“標記”和“清除”兩個階段：首先標記出所有需要回收的物件，在標記完成後統一回收掉所有被標記的物件。之所以說它是最基礎的收集演算法，是因為後續的收集演算法都是基於這種思路並對其缺點進行

JVM--18 【垃圾回收演算法】標記-整理演算法和分代收集演算法

前言：複製收集演算法在物件存活率較高時就要進行大量的複製操作，效率將會變低。更關鍵的是，如果不想浪費50%的空間，就需要額外的空間進行分配擔保，以應對被使用的記憶體中所有物件都100%存活的極端情況，所以在老年代一般不能直接選用複製演算法。標記-整

各種演算法-標記-壓縮（Mark-Compact）自適應

原理：第一階段標記活的物件，第二階段把為標記的物件壓縮到堆的其中一塊，按順序放。優點：1、避免標記掃描的碎片問題；2、避免停止複製的空間問題。具體使用什麼方法GC，Java虛擬機器會進行監視，如果所有物件都很穩定，垃圾回收器的效率低的話，就切換到“標記-掃描”方式；同樣，J

java垃圾回收演算法之-標記清除

java垃圾回收演算法之-引用計數器，這個演算法其中一個優點便是，實時性，只要物件的引用計數器的值為0，則立刻回收。接下來介紹的標記清除演算法，當物件的引用計數器的值為0時，不會立刻被回收的。概念介紹 root物件在標記清除演算法中，會把如

了解CMS(Concurrent Mark-Sweep)垃圾回收器

最短簡單查看用戶行動 idt 虛擬解決嘗試 http://www.iteye.com/topic/1119491 1.總體介紹： CMS(Concurrent Mark-Sweep)是以犧牲吞吐量為代價來獲得最短回收停頓時間的垃圾回收器。對於要求服務器響應速度的

python垃圾回收三之標記清除

gpo 指向標記清除 hab 但是原來說明 class color #第一組循環引用# a = [1,2] b = [3,4] a.append(b) b.append(a) del a ## #第二組循環引用# c = [4,5] d = [5,6] c.a

菜鳥學習JVM——垃圾回收演算法

Java垃圾回收演算法所有的垃圾回收演算法都是為了解決三個問題：哪些記憶體需要回收什麼時候回收怎麼回收引用計數法（Reference Counting）引用計數法原理很簡單，給每個物件分配一個計數器，當被引用時就加一，引用失效就減一。

Mark Sweep GC

目錄標記清除演算法標記階段深度優先於廣度優先清除階段分配 First-fit、Best-fit、Worst-fit三種分配策略合併優點實現簡單與

深入理解JVM之GC演算法與垃圾收集器[轉]

概述說起垃圾收集（Grabage Collection，GC），我們需要考慮GC需要完成的三件事情：哪些記憶體需要回收？什麼時候回收？如何回收？為什麼我們要求瞭解GC呢和記憶體分配呢？答案很簡單：當需要排查各種記憶體溢位、記憶體洩露問題時，當垃圾收整合為系

jvm 垃圾收集演算法

標記-清除演算法最基礎的演算法是“標記-清除”演算法，如它的名字一樣，演算法分為“標記”和“清除”兩個階段:首先標記出所有需要回收的物件,在標記完成後統一回收所有被標記的物件。它的標記過程其實在前一節講述物件標記判定時已經基本介紹過了。之所以說它是最基礎的收集演算法,是因為後續的收集演算法都是基

線性迴歸及RANSAC異常值清除演算法案例

線性迴歸及RANSAC異常值清除演算法案例 1、常規線性迴歸 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import numpy as np from sklearn.linear_mo

JVM垃圾回收演算法與引數配置

★引用計數法這是個古老而經典的垃圾收集演算法，其核心就是在物件被其他所引用時計數器+1，而當引用失效時-1，但是這種方式有非常嚴重的問題：無法處理迴圈引用的情況，還有就是每次進行加減操作比較浪費系統性能。 ★標記清除法分為標記和清除兩個階段進行處理記憶體中的物件，當然

JVM - HotSpot 的演算法實現（HotSpot 虛擬機器如何優化演算法實現）

前面文章中從理論上介紹了物件存活判定（這裡為可達性分析演算法）和垃圾收集演算法，而在HotSpot虛擬機器上實現這些演算法時，必須對演算法的執行效率有嚴格的考量，才能保證虛擬機器高效執行。 HotSpot虛擬機器在發生GC時所產生的問題以及解決這些問題的方案問題提出一（時間）： 1.

圖解系列之垃圾收集標記-清除算法

51cto color mar tex alt img http shadow vpd 圖解系列之垃圾收集標記-清除算法

JVM--標記-清除演算法Mark-Sweep

前言

基本概念

演算法原理

缺點

相關推薦