jvm之棧、堆
阿新 • • 發佈:2020-07-09
## 1. Java Virtual Machine
人群當中,一位叫java的小夥子正向周圍一眾人群細數著自己取得的榮耀與輝煌。就在此時,c老頭和c++老頭緩步走來,看著被眾人圍住的java,c老頭感嘆地對著身旁的c++說道:“原以為你就可以挑起我的樑子一直走下去的。”
c++笑著迴應道:“江山代有才人出,這世界以後總會是90後甚至00後的天下!”
察覺到c和c++的java連忙走出人群,說道:“兩位前輩謙虛了,這世界可還離不開兩位前輩,我只不過是站在了兩位前輩的肩上罷了。”
“你這小子可是解決了我們不少的問題啊,像指標、多繼承、記憶體管理......那時,可是有很多程式設計師對我們抱怨頗深!”c++誇讚道。
“還有Java Virtual Machine,真的是一個不錯的想法!”一旁的c補充道。
......
Java虛擬機器,一直都是都是我們在學習Java的過程中反覆提及的一個東西,那麼JVM具體是怎樣的呢?請看下圖:
![2jvm.png](https://img2020.cnblogs.com/other/1218435/202007/1218435-20200709202304675-1943122488.png)
簡單說來,JVM的工作就是通過類載入系統將位元組碼檔案載入到記憶體當中去,載入到記憶體當中的資料,就從邏輯上形成了我們看到的圖中的執行時資料區(記憶體模型),
隨後執行引擎操作/排程記憶體模型中資料執行程式。
現在看到記憶體模型裡面的東西,大家是否有些眼熟呢?現在回想起自己面試時,遇到的JVM面試題是不是全是關於記憶體模型裡面的東西。比如:棧、堆、Eden、Survivor、GC等等。
## 2. 舉個小栗子
```java
public class Example{
public int add(){
int a = 3;
int b = 4;
int c = a + b;
return c;
}
public static void main(String[] args){
Example e1 = new Example();
e1.add();
//.......
}
//......
}
```
這個栗子是在幹啥,不用多說吧!今天我們就要來慢慢地剝開它,以往剝開吃得太快就沒有什麼感覺了。
## 3. 棧
棧,全稱為Java 虛擬機器棧,執行緒私有,生命週期和執行緒一致。描述的是 Java 方法執行的記憶體模型:每個方法在執行時都會床建立一個棧幀(Stack Frame)用於儲存`區域性變量表`、`運算元棧`、`動態連結`、`方法出口`等資訊。每一個方法從呼叫直至執行結束,就對應著一個棧幀從虛擬機器棧中入棧到出棧的過程。
怎樣解釋上面的話呢?那就需要開始剝栗子了!刀來(大喝一聲)!
當栗子開始執行時,由於只有一個main執行緒,因而JVM只需要為main執行緒分配好棧區的記憶體(話句話說如果有多個執行緒,自然就會有多個棧區,並且為各自執行緒私有)。OK! main繼續執行,就會遇到main()方法,遇到之後呢!JVM又會在棧區當中再劃出一個小塊來存放main()方法執行過程的資料,這一小塊區域也就是棧幀。main()方法執行過程中又有一個add()方法出現了,同樣地,JVM又會再為add()分配一個棧幀,同時壓入到棧區,以後再遇到其他方法也是如此。當然,方法在執行完成之後,便會彈出並釋放記憶體,當執行緒中棧區的所有方法都返回之後,程式也就算是執行完畢了。
那麼棧幀又是何許物業?咦,我刀呢?算了,手撕吧。
當我們扯開棧區,撕開棧幀,一不小心,區域性變量表、運算元棧、動態連結、方法出口......嘩啦啦地散落一地。
![3zz.png](https://img2020.cnblogs.com/other/1218435/202007/1218435-20200709202305356-2040285997.png)
撿起add()棧幀的區域性變量表和運算元棧就可以看到這樣一個畫面,在執行栗子中add()方法中的三行程式碼時,區域性變量表和運算元棧的一個變化過程:首先,執行`int a = 3;`區域性變量表中會分配出一個int區域,表示為a;同時iconst命令使得運算元棧中壓入了常量3,然後再由istore命令將3彈出,賦值給區域性變量表中a。同樣,`int b = 4;` 這一行程式碼也是如此。然後,`int c = a + b;`從右往左開始,先執行`a + b`,也就是iload命令從區域性變數中取出a、b對應的值,再將iadd後的值push進運算元棧中,剩下的便是`int c = 7`的操作了。
通過上面的栗子,就很容易明白;區域性變量表,顧名思義就是存放每個方法中的區域性變數(即編譯器可知的各種基本型別(boolean、byte、char、short、int、float、long、double)、物件引用(reference 型別)和 returnAddress 型別(指向了一條位元組碼指令的地址))所在處,如圖中的a、b。運算元棧,也就是存放的就是方法當中的各種運算元的臨時空間,又如栗子中的3、4。
動態連結:Class檔案的常量池中存在有大量的符號引用,位元組碼中的方法呼叫指令就以指向常量池的引用作為引數,而將部分符號引用在執行期間轉化為直接引用,這種轉化即為**動態連結**。這個解釋當中會涉及到許多概念,比如常量池、符號引用等,要想理解這些概念,就需要去了解class檔案的結構,內容太多就不在這裡詳細描述了。
方法出口:簡單來說,就是用於標記當前方法執行完成之後,應該返回到下一條指令執行位置。比如就上面的栗子而言,add()在執行完畢之後,就應該返回到e1.add()之後繼續執行main()後面的程式碼。
## 4. 堆
對於絕大多數應用來說,這塊區域是 JVM 所管理的記憶體中最大的一塊。執行緒共享,主要是用於存放物件例項和陣列。除此之外,堆區還涉及到JVM中一個非常重要的工作--GC(Garbage Collection)。
![4dui.png](https://img2020.cnblogs.com/other/1218435/202007/1218435-20200709202305546-149053341.png)
從圖中就可以看出棧和堆之間的關係,對於new的物件,棧中區域性變量表只會存放在堆中的地址引用,具體例項變數的空間分配都在堆中。
而堆中的記憶體區域又會劃分為年輕代和老年代兩部分,其中一般情況下年輕代佔1/3記憶體,老年代佔2/3記憶體;年輕代又被劃分為Eden區(伊甸園區)和兩個Survivor區(倖存區),各自分別佔年輕代空間的8/10、/1/10、1/10。也就是說如果堆記憶體區域有600M,那麼年輕代200M、老年代400M、Eden區160M、S0區20M、S1區20M。
這樣劃分區域的目的是什麼呢?這個回答就關係到JVM的GC機制了。
首先,程式一開始,所有的例項物件都會生成在Eden區中,當Eden區滿了的時候,這時就會觸發minor gc,jvm使用gc roots的查詢方式將**非**垃圾物件移動(複製演算法)到S0區域中去,並且將Eden區中的其他物件視為垃圾物件,清空Eden區。
當例項物件再次充滿Eden區時,又會觸發minor gc;但是這次是將Eden區**和**S0區中的所有非垃圾物件移動到S1中,並清空Eden區和S0區;同樣下次minor gc時,就是將Eden區和S1區中的非垃圾物件轉移到S0中......當然,這個左手倒右手過程並不是無休止的。在反覆minor gc的過程中,每個物件身上還有一個叫做分代年齡的屬性,每次minor gc物件的分代年齡就會加1,當達到15(預設情況)時,這個物件就會被放到老年代中去,成為長期存在的物件。除此之外,還有一種情況,即是當從Eden區複製內容到Survivor區時,複製內容大小超過S0或S1任一區域一半大小,也會直接被放入到老年代中,所以老年代才會需要那麼大的區域,不然怎麼抗得住這些年輕人這樣搞~~。
雖然老年代空間很大,但總會有滿了的時候,這時麻煩的事情就出現了——full gc。在full gc時,jvm會先觸發STW(Stop-The-World),也就是暫停其他所有的java程序,回收整個記憶體模型當中的記憶體資源,從而造成使用者響應超時或者是系統無響應,這對於併發程式比較高的系統(比如秒殺活動)影響程度是極其之大的。
**通過gc機制,我們就可以得出一個簡單有效的JVM優化辦法,那就是減少full gc的次數,如何減少呢?只需要調整老年代和年輕代的記憶體空間分配使得在minor gc的過程中儘可能的消除大部分的垃圾物件。比如這種`java -Xmx3072 -Xms3072M -Xmn2048M -Xss1M`**
-Xmx3072M:設定JVM最大可用記憶體為3072M。
-Xms3072M:設定JVM初始記憶體為3072M。此值可以設定與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配記憶體。
-Xmn2048M:設定年輕代大小為2G。增大年輕代後,將會減小年老代大小。不過此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8。
-Xss1M:設定每個執行緒的堆疊大小。JDK5.0以後每個執行緒堆疊大小為1M,以前每個執行緒堆疊大小為256K。更具應用的執行緒所需記憶體大小進行調整。在相同實體記憶體下,減小這個值能生成更多的執行緒。
**GC Roots:**在上面的gc過程中,我們還提到了JVM是如何判斷垃圾物件的。簡單地來說,就是從gc roots的根出發(即區域性變量表中的引用物件),一路沿著引用關係找,凡是能夠被找到的物件都是非垃圾物件,並且會被移動到下一個它應該去的區域中。剩下的物件,會在區域清空時,一同被清理掉而無須關心。
## 5. 小結
除了棧、堆之外,還有程式計數器、方法區(元空間)、本地方法棧,這些相對比較容易理解。
程式計數器:用來記錄當前指令執行完成後下一條指令的位置,由執行引擎來完成相應的修改操作。
方法區(元空間):存放常量、靜態變數、類資訊等。
本地方法棧:與java虛擬機器棧類似,不過存放的是native方法執行時的區域性變數等資料存放位置。因為native方法一般不是由java語言編寫的,常見的就是**.dll**檔案當中的方法(由C/C++編寫),比如` Thread`類中`start()`方法在執行時就會呼叫到一個`start0()`方法,檢視原始碼時就會看到`private native void start0();`這個方法就是一個本地方法。本地方法的作用就相當於是一個“介面”,用來連線java和其他語言的介面。
另外,對於new出來的物件,無論是在棧的區域性變量表還是在方法區中的空間中,存放的都只是物件在**堆**中的地址(引用),具體的空間分配是在堆中。
---
公眾號:良許Linux
### 有收穫?希望老鐵們來個三連擊,給更多的人看到這