String-----JDK 6和JDK 7中substring的原理及區別
JDK 6和JDK 7中substring的原理及區別
String是Java中一個比較基礎的類,每一個開發人員都會經常接觸到。而且,String也是面試中經常會考的知識點。String有很多方法,有些方法比較常用,有些方法不太常用。今天要介紹的substring就是一個比較常用的方法,而且圍繞substring也有很多面試題。
substring(int beginIndex, int endIndex)
方法在不同版本的JDK中的實現是不同的。瞭解他們的區別可以幫助你更好的使用他。為簡單起見,後文中用substring()
代表substring(int beginIndex, int endIndex)
substring() 的作用
substring(int beginIndex, int endIndex)
方法擷取字串並返回其[beginIndex,endIndex-1]範圍內的內容。
String x = "abcdef"; x = x.substring(1,3); System.out.println(x);
輸出內容:
bc
呼叫substring()時發生了什麼?
你可能知道,因為x是不可變的,當使用x.substring(1,3)
對x賦值的時候,它會指向一個全新的字串:
然而,這個圖不是完全正確的表示堆中發生的事情。因為在jdk6 和 jdk7中呼叫substring
JDK 6中的substring
String是通過字元陣列實現的。在jdk 6 中,String類包含三個成員變數:char value[]
,int offset
,int count
。他們分別用來儲存真正的字元陣列,陣列的第一個位置索引以及字串中包含的字元個數。
當呼叫substring方法的時候,會建立一個新的string物件,但是這個string的值仍然指向堆中的同一個字元陣列。這兩個物件中只有count和offset 的值是不同的。
下面是證明上說觀點的Java原始碼中的關鍵程式碼:
//JDK 6 String(int offset, int count, charvalue[]) { this.value = value; this.offset = offset; this.count = count; } public String substring(int beginIndex, int endIndex) { //check boundary return new String(offset + beginIndex, endIndex - beginIndex, value); }
JDK 6中的substring導致的問題
如果你有一個很長很長的字串,但是當你使用substring進行切割的時候你只需要很短的一段。這可能導致效能問題,因為你需要的只是一小段字元序列,但是你卻引用了整個字串(因為這個非常長的字元陣列一直在被引用,所以無法被回收,就可能導致記憶體洩露)。
在JDK 6中,一般用以下方式來解決該問題,原理其實就是生成一個新的字串並引用他。
x = x.substring(x, y) + "";
關於JDK 6中subString的使用不當會導致記憶體系列已經被官方記錄在Java Bug Database中:
記憶體洩露:在電腦科學中,記憶體洩漏指由於疏忽或錯誤造成程式未能釋放已經不再使用的記憶體。 記憶體洩漏並非指記憶體在物理上的消失,而是應用程式分配某段記憶體後,由於設計錯誤,導致在釋放該段記憶體之前就失去了對該段記憶體的控制,從而造成了記憶體的浪費。
JDK 7 中的substring
上面提到的問題,在jdk 7中得到解決。在jdk 7 中,substring方法會在堆記憶體中建立一個新的陣列。
Java原始碼中關於這部分的主要程式碼如下:
//JDK 7 public String(char value[], int offset, int count) { //check boundary this.value = Arrays.copyOfRange(value, offset, offset + count); } public String substring(int beginIndex, int endIndex) { //check boundary int subLen = endIndex - beginIndex; return new String(value, beginIndex, subLen); }
以上是JDK 7中的subString方法,其使用new String
建立了一個新字串,避免對老字串的引用。從而解決了記憶體洩露問題。
所以,如果你的生產環境中使用的JDK版本小於1.7,當你使用String的subString方法時一定要注意,避免記憶體洩露。