1. 程式人生 > >故事:走進JVM的世界(圖文並茂)

故事:走進JVM的世界(圖文並茂)

  1. 注意!本文較長,建議先收藏再閱讀。更多文章可以關注作者公眾號:碼上實戰
  2. 你也可以 star 我的 GitHub上本文所屬倉庫:https://github.com/flyhero/MarkNote
  3. 說明:本文在 Java 8 Hotspot 64位作業系統下構思

小強是一個工作3年有餘的開發工程師,從他的髮量你就可以知道,小強資歷還尚淺。

最近公司沒什麼事,他也開始無聊起來了。這天下午,同事們在激烈的討論這業務,但他沒有參與,於是他決定學習些什麼知識,無聊的翻著各個網頁,發現JVM是各位大神們推薦過的知識,於是決定好好看一看。

5分鐘過後……

小強感到這知識有些枯燥乏味,怪不得是大神們能看的!又看了幾分鐘,小強倦意襲來,揉了揉睡眼惺忪的眼睛。

然而就在這一刻,他突然發現周圍同事激烈討論的聲音聽不到了,安靜到了極致。

1. 入界

小強努力的睜開眼睛,才發現自己竟然身處一個白茫茫的空間中,嚇得一跳,心想我這是怎麼了,穿越了?但穿越也得穿越到一個人間如畫,美女如雲的地方啊……,這境地……

突然前方走來一個白鬍子老頭,小強正想開口,老頭捷足先登:你好,我是這個JVM世界的締造者,你可以叫我 “HotSpot”,不過這無所謂,因為我所創造的這個世界,是按照 “JVM規範” 來完成的。我正在休息時,發現來了一位客人,原來是你。

小強:我是想問……

老頭: 不用問,我知道,你是想了解一下我創造的這個世界吧!跟我來吧。

這老頭,我還沒說話,這就結束了!好吧,跟你看看且說。

老頭邊走邊道:JVM 的世界 空間是有限的,我們堅持一個原則 : 各司其職,不留無用之人!

小強: 啊!好殘酷。

老頭: 不,這不是殘酷,我們這個世界生來就是為客戶提供服務,為客戶發光發熱的,每個人奉獻出了自己的能力就是圓滿完成任務,退出舞臺是理所應當的,也是他們最好的歸宿。

小強:也是,我學的程式設計就是這個道理啊,我怎麼這麼不開竅呢……

2. 佈局

過來,帶你先看看我們世界的整體組成和中心區如何佈局。

先來看看我們最主要的日常工作區(執行時資料區),為了讓我們工作起來更有效率,我們將世界空間劃分為這幾個板塊。

居住區-堆

這裡是人們工作外的居住區,居住區我們基於人們的年齡也進一步分出了,伊甸區,倖存者區,老年區。

工作區-棧

每個任務來臨時,都會在工作區單獨開闢出一個地方來用於完成這個任務。

記錄者-程式計數器

由於我們同時能做的任務有限,所以我們需要為不同的任務劃分出不同的時間片,我們在切換任務的時候,需要一個記錄者,能夠記錄我們這個任務做到了哪裡,下次回來能夠繼續做。

倉庫管理區-方法區

這裡存放著工人的模板以及常用的不變的工具等。

3. 生與死

這裡工作的人們都會經歷生與死,大部分人們活不到老年,但這不重要,重要的是他為我們做出了貢獻。

3.1 出生

老頭:這裡的每個人都有一個模板(類),看到那個正在居住區休息的高個嗎?他叫張三,他是根據外部客戶給定的模板 “ User Class” 創造的,他可是客戶最喜愛的工人了。你知道客戶的這些模板(類)是如何進入的到我們的世界中的嗎?

小強:這個我知道點,之前看過一點點。這個過程還是有些複雜的,客戶的模板(類)是通過一個翻譯工廠(編譯器) 將它翻譯成class 位元組碼,因為你們這個世界只認識位元組碼,然後有你們的載入系統將它們載入到這裡。

載入過程中有這些階段:

其中載入階段是由載入器來完成的。

老頭:是的,我們提供了三種工廠,啟動類載入器,擴充套件類載入器,應用類載入器,當然客戶也可以自定義載入器。

小強:他們遵循著雙親委派模型,但是我一直不太理解這個詞!

老頭: 這是由於你們語言翻譯的問題導致,這個模式叫 “parents delegation”,知道了吧!它是指有你的父輩們來幫你完成。

小強:那雙親委派模式 有什麼好處呢?

老頭:

  1. 具有優先順序層次的關係可以避免模板(類)的重複載入
  2. 安全考慮可以防止Java核心api被替換

老頭繼續道:那連線過程中的三步,你知道是做什麼嗎?

小強:具體的我就不知道了哎……

老頭笑了笑:對於客戶定義的模板(類),我們可不是來者不拒的,為了我們這個世界的安全以及能提供更好的服務,我們會對模板做一些驗證及後續操作。

驗證包括格式驗證,元資料驗證,位元組碼驗證,符號驗證。當驗證通過後,我們會為模板所依賴的東西(類變數)分配空間,最後將符號引用替換為直接引用。

老頭看了看小強眉頭緊皺,於是繼續補充:你可能不瞭解什麼是符號引用和直接引用!

符號引用就是在編譯時,並不知道模板(類)所依賴的其他東西,會在我們的空間中的哪個位置,只能用符號來表示。

直接引用就是 所有東西被載入到這裡後會有自己的真實空間地址,然後去替換符號引用。這樣執行時就能找到它們所依賴的東西了。

最後就是初始化了,這個階段主要是對類變數初始化,是執行類構造器的過程。

小強:我怎麼沒看到這些模板呢?

老頭:這些模板我把他們隱藏在世界的後方,大多數人是見不到的,他們統稱為 Klass。

小強:不對啊!你是不是搞錯了?不應該叫 Class嗎?

老頭:哈哈!我剛才說了,大多數人見不到,你就是其中之一啊!你們平時見到的 Class只是對 Klass的一種封裝而已,真正記錄模板中的具體元資訊的就是 Klass。這回要記住了,年輕人。

3.2 工人

小強: 為什麼你的工人是等量差的身高呢?

老頭:你的觀察還是挺仔細的嘛!是的,他們確實是等量差的,想要知道為什麼,要先了解這些工人有哪些部分組成。


它們頭部大小是固定的,身體大小是由自己的屬性資料決定的,而最後的腳部卻是我來決定的,如果前面兩個資料的大小沒有達到 8 的倍數,那麼我就會來填充,所以就是這裡的填充使得他們擁有了等量的身高差(記憶體對齊)。

我是基於兩點原因來這個締造他們的:

  1. 平臺原因:不是所有的硬體平臺都能訪問任意地址上的任意資料的;某些硬體平臺只能在某些地址處取某些特定型別的資料,否則丟擲硬體異常。
  2. 效能原因:中央大腦(CPU)訪問記憶體是有記憶體訪問粒度的,就是每次訪問記憶體的長度是固定的,如果不這樣做,那麼中央大腦起需要訪問兩次記憶體,而對齊後只需要一次。

小強:嗯,明白了!那能給我說說這些工人在居住區為什麼要不斷的搬遷呢?

3.3 成長

老頭:經過長時間的觀察,我發現每個工人的生命長短是不一樣的。所以我把居住區分為新生代,老年代,然後讓他們合理的搬遷,這樣能有效的利用空間而且讓垃圾小分隊工作更有效率。

工人誕生後會分配到Eden區,當Eden區人員快滿時,垃圾小分隊會來清掃,清掃後如果工人還活著,那麼他們將搬遷至Survivor區中的其中一個,當這個Survivor快滿時,垃圾小分隊會將還活著的工人搬遷至另一個Survivor區中,就這樣重複著,每經歷一次垃圾小分隊的清掃,活著的工人就會長大一歲,直到工人的年齡達到15歲,到達後會將他們搬遷至老年代生活的地方。但也有例外,如果某個工人吃的太胖,新生代容不下他,那麼他將直接去老年代住下。當老年代快住滿時,將會有垃圾大掃除(full gc)。

小強:原來如此啊!從此我再也不是隻知道堆區棧區的菜鳥啦!哈哈哈哈……

老頭:小夥子,不要高興太早!你到目前為止所瞭解的仍是九牛一毛。

3.4 死亡證明

小強:如何確定工人是否到達生命的盡頭呢?

第一種:引用計數法

給每個工人新增一個引用計數器,就是隻要有人需要這個工人幫忙,那麼就給這個工人的計數加1,反之,別人不再需要這個工人的幫忙,那麼計數就減1,直到這個計數為0,那麼表示這個工人生命到了盡頭。

但這種方法有個問題:如果A工人和B工人相互需要幫忙,但沒有任何其他工人或任務需要他們兩個,那麼他們兩個會永遠活下!所以這種方法我們不會採取的。

第二種:可達性分析法

我們找出被稱為 “GC roots”的工人作為起點,依次尋找他們工作中依賴的工人,這就可以知道哪些工人是沒有必要在存在下去了。

小強:我怎麼知道哪些是 “GC roots”工人呢?

老頭:

  1. 工作區(棧)中的需要用到的工人
  2. 倉庫(方法區)中模板(類)本身需要的工人(靜態,常量)
  3. 世界後方(native方法)需要的工人

小強:Got it!

4. 回收

老頭:下面我帶你去認識一下垃圾小分隊的人物吧!不過在認識他們之前你最好了解一下,垃圾清除的基本方法論。

4.1 基本方法論

收集垃圾遵循的基本方法論有以下幾種:

  • 標記-清除

    首先標記出所有需要回收的工人(物件),在標記完成後統一回收所有被標記的工人。

    但這個有兩個缺點:1. 效率不高 2. 會產生許多碎片空間

  • 複製

    將可用的空間一分為二,每次只使用其中一塊,當快使用完時,小分隊回收,然後將活著的工人搬遷至另一塊。

    這雖然解決了標記-清除的效率問題,但此種方法卻縮小了一半空間。

  • 標記-整理

    首先標記出所有需要回收的工人(物件),然後將存活的工人移動到空間的一端,然後清理掉邊界以外的工人。

小強笑了笑:原來是這三種演算法啊!我知道!

老頭:既然知道,那跟我來認識一下垃圾清掃隊的人吧!

4.2 主要成員

垃圾清掃隊有好幾個小隊組成,客戶喜歡哪個小隊可以指定讓誰來工作,他們各個隊伍的清掃方式各不相同也各有優劣。

我給你介紹一下兩個主要成員吧,CMS,G1兩個小隊出列。

CMS:到,我們是CMS分隊,全稱叫 “Concurrent Mark Sweep”,顧名思義,我們是採用標記清除演算法的併發小分隊,我們以獲取最短回收停頓時間為目標。

小強:那你說說你們是如何工作的?

CMS:我們主要分四個步驟工作,1. 初始標記 2.併發標記 3.重新標記 4.併發清除

小強:算啦,這麼多步驟太需要時間來了解了,我現在知道你的優點了,那你的缺點有什麼呢?

CMS:這怎麼還帶揭人傷疤的……

老頭這時嚴肅的咳嗽了兩聲,其意CMS立馬捕獲到了,委屈的說:

我有三個缺點:

  1. 當資源不是很充足時,佔用過多的資源,導致任務變慢
  2. 無法處理浮動垃圾,我們清理的時候,工人同時也在工作,我們標記後,正好有些工人不在需要了
  3. 我們分隊遵循的是“標記-清除”演算法,所以會產生大量碎片空間,導致世界大掃除(full gc)提前到來

心直口快的小強來了句:原來你的問題這麼嚴重,老頭竟然沒把你們小分隊辭掉……

CMS:你…… 想當年我們分隊可是紅極一時的……

那麼我猜G1是不是可以彌補CMS的不足呢?

G1: 說實話,我們分隊的目標就是替換CMS分隊…… (JDK14 CMS正式落下帷幕)

小強不懷好意的笑了起來,哈哈……,CMS翻著白眼躲到一旁的角落暗自傷感去了。


小強:那G1說說你的能耐吧!

G1: 我們隊是基於標記整理演算法的,因此不會產生大量碎片空間

  • 我們同時引入了分割槽的思路,弱化了分代的概念

  • 我們的停頓時間是可控的,可避免雪崩現象

  • 我們也能充分利用客戶給我們的資源,減少停頓時間

這是我們隊的優勢,接下來我給你詳細介紹下我們隊的情況……

小強:好的!你繼續……

迴歸

就在小強聽的興趣濃濃時,天空中突然出現一隻巨大無比的手向他襲來,小強躲閃不開,啊……

小強捂著自己的頭,有點恍惚,抬頭一看,擦,技術總監……你怎麼也在這?

總監:我不在這我在哪?在家睡大覺嗎!

這時小強才回過神來,原來自己還在辦公室,大事不妙啊!

總監:小強,回家多爽,明天就不用來了吧!

小強一慌,腦袋靈機一動:總監,知道我剛才在做什麼嗎?那可不是在睡覺,我有一個故事你且聽聽再做決定。

吧啦吧啦……

最後我將本文知識總結成了思維導圖: