1. 程式人生 > 實用技巧 >JVM系列之:String,陣列和集合類的記憶體佔用大小

JVM系列之:String,陣列和集合類的記憶體佔用大小

目錄

簡介

之前的文章中,我們使用JOL工具簡單的分析過String,陣列和集合類的記憶體佔用情況,這裡再做一次更詳細的分析和介紹,希望大家後面再遇到OOM問題的時候不再抱頭痛哭,而是可以有章可循,開始吧。

陣列

先看下JOL的程式碼和輸出:

//byte array
log.info("{}",ClassLayout.parseInstance("www.flydean.com".getBytes()).toPrintable());

輸出結果:

INFO com.flydean.CollectionSize - [B object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 22 13 07 00 (00100010 00010011 00000111 00000000) (463650)
12 4 (object header) 0f 00 00 00 (00001111 00000000 00000000 00000000) (15)
16 15 byte [B.<elements> N/A
31 1 (loss due to the next object alignment)
Instance size: 32 bytes
Space losses: 0 bytes internal + 1 bytes external = 1 bytes total

注意,本文的結論都在64位的JVM中執行得出了,並且開啟了COOPs壓縮物件指標技術。

可以看到陣列物件的物件頭大小是16位元組,再加上陣列裡面的內容長度是15位元組,再加上1位補全。最後得到的大小是32位元組。

同樣的,我們計算存有100個物件的陣列,可以得到下面的結論:

注意最後面的Object陣列,如果陣列中儲存的不是基礎型別,那麼實際上儲存的是執行該物件的指標,該指標大小是4個位元組。

String

String是一個非常特殊的物件,它的底層是以byte陣列儲存的。

注意,在JDK9之前,String的底層儲存結構是char[],一個char需要佔用兩個位元組的儲存單位。

因為大部分的String都是以Latin-1字元編碼來表示的,只需要一個位元組儲存就夠了,兩個位元組完全是浪費。

於是在JDK9之後,字串的底層儲存變成了byte[]。

同樣的我們還是用JOL來分析:

//String
log.info("{}",ClassLayout.parseInstance("www.flydean.com").toPrintable());

輸出結果:

INFO com.flydean.CollectionSize - java.lang.String object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 77 1a 06 00 (01110111 00011010 00000110 00000000) (399991)
12 4 byte[] String.value [119, 119, 119, 46, 102, 108, 121, 100, 101, 97, 110, 46, 99, 111, 109]
16 4 int String.hash 0
20 1 byte String.coder 0
21 1 boolean String.hashIsZero false
22 2 (loss due to the next object alignment)
Instance size: 24 bytes
Space losses: 0 bytes internal + 2 bytes external = 2 bytes total

可以看到String中的物件頭是12位元組,然後加上4位元組的指標指向一個byte陣列。再加上hash,coder,和hasIsZero屬性,最後的大小是24位元組。

我這裡使用的是JDK14的String版本,不同的版本可能有所不同。

當然這只是這個String物件的大小,不包含底層陣列的大小。

我們來計算一下String物件的真實大小:

String物件的大小+byte陣列的大小=24+32=56位元組。

ArrayList

我們構建一個非常簡單的ArrayList:

//Array List
log.info("{}",ClassLayout.parseInstance(new ArrayList()).toPrintable());

輸出結果:

INFO com.flydean.CollectionSize - java.util.ArrayList object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 87 81 05 00 (10000111 10000001 00000101 00000000) (360839)
12 4 int AbstractList.modCount 0
16 4 int ArrayList.size 0
20 4 java.lang.Object[] ArrayList.elementData []
Instance size: 24 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total

畫個圖來直觀的表示:

這裡modCount和size的初始值都是0。

HashMap

因為文章篇幅的限制,這裡就不把程式碼列出來了,我只貼個圖上來:

HashSet

LinkedList

treeMap

來個比較複雜的TreeMap:

總結

本文用圖形的形式形象的展示了集合物件,陣列和String在記憶體中的使用情況。

後面的幾個集合我就沒有一一計算,有興趣的朋友可以在下方回覆你計算的結果喲。

本文作者:flydean程式那些事

本文連結:http://www.flydean.com/jvm-collections-size/

本文來源:flydean的部落格

歡迎關注我的公眾號:程式那些事,更多精彩等著您!