1. 程式人生 > >對 Java String 常量池的理解。

對 Java String 常量池的理解。

640?wx_fmt=gif

String:字串常量池

作為最基礎的引用資料型別,Java 設計者為 String 提供了字串常量池以提高其效能,那麼字串常量池的具體原理是什麼,我們帶著以下三個問題,去理解字串常量池:

  • 字串常量池的設計意圖是什麼?

  • 字串常量池在哪裡?

  • 如何操作字串常量池?

字串常量池的設計思想

  1. 字串的分配,和其他的物件分配一樣,耗費高昂的時間與空間代價,作為最基礎的資料型別,大量頻繁的建立字串,極大程度地影響程式的效能

  2. JVM為了提高效能和減少記憶體開銷,在例項化字串常量的時候進行了一些優化

    • 為字串開闢一個字串常量池,類似於快取區

    • 建立字串常量時,首先堅持字串常量池是否存在該字串

    • 存在該字串,返回引用例項,不存在,例項化該字串並放入池中

  1. 實現的基礎

    • 實現該優化的基礎是因為字串是不可變的,可以不用擔心資料衝突進行共享

    • 執行時例項建立的全域性字串常量池中有一個表,總是為池中每個唯一的字串物件維護一個引用,這就意味著它們一直引用著字串常量池中的物件,所以,在常量池中的這些字串不會被垃圾收集器回收

程式碼:從字串常量池中獲取相應的字串

String str1 = “hello”;
String str2 = “hello”;

System.out.printl("str1 == str2" : str1 == str2 ) //true  

字串常量池在哪裡

在分析字串常量池的位置時,首先了解一下堆、棧、方法區:

640?wx_fmt=png

儲存的是物件,每個物件都包含一個與之對應的class

JVM只有一個堆區(heap)被所有執行緒共享,堆中不存放基本型別和物件引用,只存放物件本身

物件的由垃圾回收器負責回收,因此大小和生命週期不需要確定

每個執行緒包含一個棧區,棧中只儲存基礎資料型別的物件和自定義物件的引用(不是物件)

每個棧中的資料(原始型別和物件引用)都是私有的

棧分為3個部分:基本型別變數區、執行環境上下文、操作指令區(存放操作指令)

資料大小和生命週期是可以確定的,當沒有引用指向資料時,這個資料就會自動消失

方法區

靜態區,跟堆一樣,被所有的執行緒共享

方法區中包含的都是在整個程式中永遠唯一的元素,如class,static變數

字串常量池則存在於方法區

程式碼:堆疊方法區儲存字串

String str1 = “abc”;
String str2 = “abc”;
String str3 = “abc”;
String str4 = new String(“abc”);
String str5 = new String(“abc”);

640?wx_fmt=jpeg

字串物件的建立

面試題:String str4 = new String(“abc”) 建立多少個物件?

  1. 在常量池中查詢是否有“abc”物件

  • 有則返回對應的引用例項

  • 沒有則建立對應的例項物件

在堆中 new 一個 String("abc") 物件

將物件地址賦值給str4,建立一個引用

所以,常量池中沒有“abc”字面量則建立兩個物件,否則建立一個物件,以及建立一個引用

根據字面量,往往會提出這樣的變式題:

String str1 = new String("A"+"B") ; 會建立多少個物件? 
String str2 = new String("ABC") + "ABC" ; 會建立多少個物件?

str1:
字串常量池:"A","B","AB" : 3個
堆:new String("AB") :1個
引用: str1 :1個
總共 : 5個

str2 :
字串常量池:"ABC" : 1個
堆:new String("ABC") :1個
引用: str2 :1個
總共 : 3個

程式碼:基礎型別的變數和常量,變數和引用儲存在棧中,常量儲存在常量池中

int a1 = 1;
int a2 = 1;
int a3 = 1;

public static int INT1 =1 ;
public static int INT2 =1 ;
public static int INT3 =1 ; 

640?wx_fmt=jpeg

操作字串常量池的方式

  • JVM例項化字串常量池時

String str1 = “hello”;
String str2 = “hello”;

System.out.printl("str1 == str2" : str1 == str2 ) //true
  • String.intern()

通過new操作符建立的字串物件不指向字串池中的任何物件,但是可以通過使用字串的intern()方法來指向其中的某一個。java.lang.String.intern()返回一個保留池字串,就是一個在全域性字串池中有了一個入口。如果以前沒有在全域性字串池中,那麼它就會被新增到裡面

// Create three strings in three different ways.
String s1 = "Hello";
String s2 = new StringBuffer("He").append("llo").toString();
String s3 = s2.intern();

// Determine which strings are equivalent using the ==
// operator
System.out.println("s1 == s2? " + (s1 == s2)); // false
System.out.println("s1 == s3? " + (s1 == s3)); // true

補充:字面量和常量池初探

字串物件內部是用字元陣列儲存的,那麼看下面的例子:

String m = "hello,world";
String n = "hello,world";
String u = new String(m);
String v = new String("hello,world");
  1. 會分配一個11長度的char陣列,並在常量池分配一個由這個char陣列組成的字串,然後由m去引用這個字串

  2. 用n去引用常量池裡邊的字串,所以和n引用的是同一個物件

  3. 生成一個新的字串,但內部的字元陣列引用著m內部的字元陣列

  4. 同樣會生成一個新的字串,但內部的字元陣列引用常量池裡邊的字串內部的字元陣列,意思是和u是同樣的字元陣列

使用圖來表示的話,情況就大概是這樣的(使用虛線只是表示兩者其實沒什麼特別的關係):

640?wx_fmt=png

測試demo:

String m = "hello,world";
String n = "hello,world";
String u = new String(m);
String v = new String("hello,world");

System.out.println(m == n); //true 
System.out.println(m == u); //false
System.out.println(m == v); //false
System.out.println(u == v); //false 

結論:

  • m和n是同一個物件

  • m,u,v都是不同的物件

  • m,u,v,n但都使用了同樣的字元陣列,並且用equal判斷的話也會返回true