理解String 及 String.intern()的區別
一、String設計的初衷:
Java中的String被設計成不可變的,出於以下幾點考慮:
1. 字串常量池的需要。字串常量池的誕生是為了提升效率和減少記憶體分配。可以說我們程式設計有百分之八十的時間在處理字串,而處理的字串中有很大概率會出現重複的情況。正因為String的不可變性,常量池很容易被管理和優化。
2. 安全性考慮。正因為使用字串的場景如此之多,所以設計成不可變可以有效的防止字串被有意或者無意的篡改。從java原始碼中String的設計中我們不難發現,該類被final修飾,同時所有的屬性都被final修飾,在原始碼中也未暴露任何成員變數的修改方法。(當然如果我們想,通過反射或者Unsafe直接操作記憶體的手段也可以實現對所謂不可變String的修改)。
3. 作為HashMap、HashTable等hash型資料key的必要。因為不可變的設計,jvm底層很容易在快取String物件的時候快取其hashcode,這樣在執行效率上會大大提升。
二、關於String的基本知識
1. 首先String不屬於8種基本資料型別,String是一個物件。
因為物件的預設值是null,所以String的預設值也是null;但它又是一種特殊的物件,有其它物件沒有的一些特性。
2. new String()和new String(“”)都是申明一個新的空字串,是空串不是null;
3. String str=”kvill”;
String str=new String (“kvill”);的區別:
在這裡,我們不談堆,也不談棧,只先簡單引入常量池這個簡單的概念。
常量池(constant pool)
看例1:
String s0=”kvill”;
String s1=”kvill”;
String s2=”kv” + “ill”;
System.out.println( s0==s1 );
System.out.println( s0==s2 );
結果為:
true
true
首先,我們要知道Java會確保一個字串常量只有一個拷貝。
因為例子中的s0和s1中的”kvill”都是字串常量,它們在編譯期就被確定了,所以s0==s1為true;而”kv”和”ill”也都是字串常量,當一個字串由多個字串常量連線而成時,它自己肯定也是字串常量,所以s2也同樣在編譯期就被解析為一個字串常量,所以s2也是常量池中”kvill”的一個引用。
所以我們得出s0==s1==s2;
用new String() 建立的字串不是常量,不能在編譯期就確定,所以new String() 建立的字串不放入常量池中,它們有自己的地址空間。
例2:
String s0=”ab”;
String s1=new String(”ab”);
String s2=”a” + new String(“b”);
System.out.println( s0==s1 );
System.out.println( s0==s2 ); //false
System.out.println( s1==s2 );
String s3="a"+"b";
System.out.println("s0==s3:"+(s0==s3));//true
String temp=new String("b");
String s4="a"+ temp;
System.out.println("s0==s4:"+(s0==s4));//fasle
結果為:
false
false
false
s0==s3:true
s0==s4:false
例2中s0還是常量池中”ab”的應用,s1因為無法在編譯期確定,所以是執行時建立的新物件”ab”的引用,s2因為有後半部分new String(“b”)所以也無法在編譯期確定,所以也是一個新建立物件”ab”的應用;s3雖然是動態拼接出來的字串,但是所有參與拼接的部分都是已知的字面量,在編譯期間,這種拼接會被優化,編譯器直接幫你拼好,因此String s3 = "a" + "b";在class檔案中被優化成String s3 = "ab";
注:字串直接常量相加的時候,例如: String c = "ab" + "cd"; 其中的ab/cd只要有任何一個不是字串字面常量形式,都不會在常量池生成"abcd". 且此時jvm做了優化,不會同時生成"ab"和"bcd"在字串常量池中。
三、String.intern()
當呼叫 intern 方法時,如果池已經包含一個等於此 String 物件的字串(用 equals(Object) 方法確定),則返回池中的字串。否則,將此 String 物件新增到池中,並返回此 String 物件的引用。
它遵循以下規則:對於任意兩個字串 s 和 t,當且僅當 s.equals(t) 為 true 時,s.intern() == t.intern() 才為 true。
使用String.intern()得到的是常量池的字串,也就是說兩個String物件只要值相等,intern()返回的值就相等。
注:
存在於.class檔案中的常量池(像String name="king",則是直接在編譯期間就將常量字串"king"加入到class檔案的常量池中),在執行期被JVM裝載,並且可以擴充。String的intern()方法就是擴充常量池的一個方法;執行時常量池相對於CLass檔案常量池的另外一個重要特徵是具備動態性,Java語言並不要求常量一定只有編譯期才能產生,也就是並非預置入CLass檔案中常量池的內容才能進入方法區執行時常量池,執行期間也可能將新的常量放入池中,這種特性被開發人員利用比較多的就是String類的intern()方法。當一個String例項str呼叫intern()方法時,Java查詢常量池中是否有相同Unicode的字串常量,如果有,則返回其的引用,如果沒有,則在常量池中增加一個Unicode等於str的字串並返回它的引用;
例3
String s0= “kvill”;
String s1=new String(”kvill”);
String s2=new String(“kvill”);
System.out.println( s0==s1 );
System.out.println( “**********” );
s1.intern();
s2=s2.intern(); //把常量池中“kvill”的引用賦給s2
System.out.println( s0==s1);
System.out.println( s0==s1.intern() );
System.out.println( s0==s2 );
結果為:
false
**********
false //雖然執行了s1.intern(),但它的返回值沒有賦給s1
true //說明s1.intern()返回的是常量池中”kvill”的引用
true
最後我再破除一個錯誤的理解:
有人說,“使用String.intern()方法則可以將一個String類的儲存到一個全域性String表中,如果具有相同值的Unicode字串已經在這個表中,那麼該方法返回表中已有字串的地址,如果在表中沒有相同值的字串,則將自己的地址註冊到表中“如果我把他說的這個全域性的String表理解為常量池的話,他的最後一句話,“如果在表中沒有相同值的字串,則將自己的地址註冊到表中”是錯的:
String s1=new String("kvill");
String s2=s1.intern();
System.out.println( s1==s1.intern() );
System.out.println( s1+" "+s2 );
System.out.println( s2==s1.intern() );
結果:
false
kvill kvill
true
在這個類中我們沒有聲名一個”kvill”常量,所以常量池中一開始是沒有”kvill”的,當我們呼叫s1.intern()後就在常量池中新添加了一個”kvill”常量,原來的不在常量池中的”kvill”仍然存在,也就不是“將自己的地址註冊到常量池中”了。
s1==s1.intern()為false說明原來的“kvill”仍然存在;
s2現在為常量池中“kvill”的地址,所以有s2==s1.intern()為true。
參考連結: