1. 程式人生 > >理解String 及 String.intern()的區別

理解String 及 String.intern()的區別

一、String設計的初衷:

Java中的String被設計成不可變的,出於以下幾點考慮:

1. 字串常量池的需要。字串常量池的誕生是為了提升效率和減少記憶體分配。可以說我們程式設計有百分之八十的時間在處理字串,而處理的字串中有很大概率會出現重複的情況。正因為String的不可變性,常量池很容易被管理和優化。

2. 安全性考慮。正因為使用字串的場景如此之多,所以設計成不可變可以有效的防止字串被有意或者無意的篡改。從java原始碼中String的設計中我們不難發現,該類被final修飾,同時所有的屬性都被final修飾,在原始碼中也未暴露任何成員變數的修改方法。(當然如果我們想,通過反射或者Unsafe直接操作記憶體的手段也可以實現對所謂不可變String的修改)。

3. 作為HashMap、HashTable等hash型資料key的必要。因為不可變的設計,jvm底層很容易在快取String物件的時候快取其hashcode,這樣在執行效率上會大大提升。

二、關於String的基本知識

       1. 首先String不屬於8種基本資料型別,String是一個物件。 
     因為物件的預設值是null,所以String的預設值也是null;但它又是一種特殊的物件,有其它物件沒有的一些特性。 

  2. new String()和new String(“”)都是申明一個新的空字串,是空串不是null; 

  3. String str=”kvill”; 
    String str=new String (“kvill”);的區別: 

  在這裡,我們不談堆,也不談棧,只先簡單引入常量池這個簡單的概念。 
  常量池(constant pool)

指的是在編譯期被確定,並被儲存在已編譯的.class檔案中的一些資料。它包括了關於類、方法、介面等中的常量,也包括字串常量。 

看例1: 

String s0=”kvill”; 
String s1=”kvill”; 
String s2=”kv” + “ill”; 
System.out.println( s0==s1 ); 
System.out.println( s0==s2 );

結果為: 

true 
true

  首先,我們要知道Java會確保一個字串常量只有一個拷貝。 
  因為例子中的s0和s1中的”kvill”都是字串常量,它們在編譯期就被確定了,所以s0==s1為true;而”kv”和”ill”也都是字串常量,當一個字串由多個字串常量連線而成時,它自己肯定也是字串常量,所以s2也同樣在編譯期就被解析為一個字串常量,所以s2也是常量池中”kvill”的一個引用。 
  所以我們得出s0==s1==s2; 


  用new String() 建立的字串不是常量,不能在編譯期就確定,所以new String() 建立的字串不放入常量池中,它們有自己的地址空間。

例2:

String s0=”ab”; 
String s1=new String(”ab”); 
String s2=”a” + new String(“b”); 
System.out.println( s0==s1 ); 
System.out.println( s0==s2 ); //false
System.out.println( s1==s2 );

        
String s3="a"+"b";
System.out.println("s0==s3:"+(s0==s3));//true

String temp=new String("b");
String s4="a"+ temp;
System.out.println("s0==s4:"+(s0==s4));//fasle

結果為: 

false 
false 
false

s0==s3:true
s0==s4:false

例2中s0還是常量池中”ab”的應用,s1因為無法在編譯期確定,所以是執行時建立的新物件”ab”的引用,s2因為有後半部分new String(“b”)所以也無法在編譯期確定,所以也是一個新建立物件”ab”的應用;s3雖然是動態拼接出來的字串,但是所有參與拼接的部分都是已知的字面量,在編譯期間,這種拼接會被優化,編譯器直接幫你拼好,因此String s3 = "a" + "b";在class檔案中被優化成String s3 = "ab";

注:字串直接常量相加的時候,例如: String c = "ab" + "cd";  其中的ab/cd只要有任何一個不是字串字面常量形式,都不會在常量池生成"abcd". 且此時jvm做了優化,不會同時生成"ab"和"bcd"在字串常量池中。

三、String.intern() 

       當呼叫 intern 方法時,如果池已經包含一個等於此 String 物件的字串(用 equals(Object) 方法確定),則返回池中的字串。否則,將此 String 物件新增到池中,並返回此 String 物件的引用。 
      它遵循以下規則:對於任意兩個字串 s 和 t,當且僅當 s.equals(t) 為 true 時,s.intern() == t.intern() 才為 true。 

      使用String.intern()得到的是常量池的字串,也就是說兩個String物件只要值相等,intern()返回的值就相等。

注:
  存在於.class檔案中的常量池(像String name="king",則是直接在編譯期間就將常量字串"king"加入到class檔案的常量池中),在執行期被JVM裝載,並且可以擴充。String的intern()方法就是擴充常量池的一個方法;執行時常量池相對於CLass檔案常量池的另外一個重要特徵是具備動態性,Java語言並不要求常量一定只有編譯期才能產生,也就是並非預置入CLass檔案中常量池的內容才能進入方法區執行時常量池,執行期間也可能將新的常量放入池中,這種特性被開發人員利用比較多的就是String類的intern()方法。當一個String例項str呼叫intern()方法時,Java查詢常量池中是否有相同Unicode的字串常量,如果有,則返回其的引用,如果沒有,則在常量池中增加一個Unicode等於str的字串並返回它的引用;

例3

String s0= “kvill”; 
String s1=new String(”kvill”); 
String s2=new String(“kvill”); 
System.out.println( s0==s1 ); 
System.out.println( “**********” ); 
s1.intern(); 
s2=s2.intern(); //把常量池中“kvill”的引用賦給s2 
System.out.println( s0==s1); 
System.out.println( s0==s1.intern() ); 
System.out.println( s0==s2 );

結果為: 

false 
********** 
false //雖然執行了s1.intern(),但它的返回值沒有賦給s1 
true //說明s1.intern()返回的是常量池中”kvill”的引用 
true

最後我再破除一個錯誤的理解:   

  有人說,“使用String.intern()方法則可以將一個String類的儲存到一個全域性String表中,如果具有相同值的Unicode字串已經在這個表中,那麼該方法返回表中已有字串的地址,如果在表中沒有相同值的字串,則將自己的地址註冊到表中“如果我把他說的這個全域性的String表理解為常量池的話,他的最後一句話,“如果在表中沒有相同值的字串,則將自己的地址註冊到表中”是錯的:   

String s1=new String("kvill"); 
String s2=s1.intern(); 
System.out.println( s1==s1.intern() ); 
System.out.println( s1+" "+s2 ); 
System.out.println( s2==s1.intern() );

結果:

false 
kvill kvill 
true

在這個類中我們沒有聲名一個”kvill”常量,所以常量池中一開始是沒有”kvill”的,當我們呼叫s1.intern()後就在常量池中新添加了一個”kvill”常量,原來的不在常量池中的”kvill”仍然存在,也就不是“將自己的地址註冊到常量池中”了。 
  s1==s1.intern()為false說明原來的“kvill”仍然存在; 
  s2現在為常量池中“kvill”的地址,所以有s2==s1.intern()為true。 

參考連結: