Java 字符串
java提高篇(十四)-----字符串
首先我們要明確,String並不是基本數據類型,而是一個對象,並且是不可變的對象。查看源碼就會發現String類為final型的(當然也不可被繼承),而且通過查看JDK文檔會發現幾乎每一個修改String對象的操作,實際上都是創建了一個全新的String對象。
字符串為對象,那麽在初始化之前,它的值為null,到這裏就有必要提下””、null、new String()三者的區別。null 表示string還沒有new ,也就是說對象的引用還沒有創建,也沒有分配內存空間給他,而””、new String()則說明了已經new了,只不過內部為空,但是它創建了對象的引用,是需要分配內存空間的。打個比方:一個空玻璃杯,你不能說它裏面什麽都沒有,因為裏面有空氣,當然也可以把它弄成真空,null與" "、new String()的區別就象真空與空氣一樣。
在字符串中存在一個非常特殊的地方,那就是字符串池。每當我們創建一個字符串對象時,首先就會檢查字符串池中是否存在面值相等的字符串,如果有,則不再創建,直接放回字符串池中對該對象的引用,若沒有則創建然後放入到字符串池中並且返回新建對象的引用。這個機制是非常有用的,因為可以提高效率,減少了內存空間的占用。所以在使用字符串的過程中,推薦使用直接賦值(即String s=”aa”),除非有必要才會新建一個String對象(即String s = new String(”aa”))。
對於字符串的使用無非就是這幾個方面:
1、字符串比較
equals() ------判斷內容是否相同。
compareTo() ------判斷字符串的大小關系。
compareToIgnoreCase(String int) ------在比較時忽略字母大小寫。
== ------判斷內容與地址是否相同。
equalsIgnoreCase() ------忽略大小寫的情況下判斷內容是否相同。
reagionMatches() ------對字符串中的部分內容是否相同進行比較(詳情請參考API)。
2、字符串查找
charAt(int index) ------返回指定索引index位置上的字符,索引範圍從0開始。
indexOf(String str)------從字符串開始檢索str,並返回第一次出現的位置,未出現返回-1。
indexOf(String str,int fromIndex);------從字符串的第fromIndex個字符開始檢索str。
lastIndexOf(String str)------查找最後一次出現的位置。
lastIndexOf(String str,int fromIndex)----從字符串的第fromIndex個字符查找最後一次出現的位置。
starWith(String prefix,int toffset)-----測試此字符串從指定索引開始的子字符串是否以指定前綴開始。
starWith(String prefix)------測試此字符串是否以指定的前綴開始。
endsWith(String suffix)------測試此字符串是否以指定的後綴結束。
3、字符串截取
public String subString(int beginIndex)------返回一個新的字符串,它是此字符串的一個子字符串。
public String subString(int beginIndex,int endIndex)------返回的字符串是從beginIndex開始到endIndex-1的串。
4、字符串替換
public String replace(char oldChar,char newChar)。
public String replace(CharSequence target,CharSequence replacement)------把原來的etarget子序列替換為replacement序列,返回新串。
public String replaceAll(String regex,String replacement)------用正則表達式實現對字符串的匹配。註意replaceAll第一個參數為正則表達式,鄙人曾經深受其害。
二、StringBuffer
StringBuffer和String一樣都是用來存儲字符串的,只不過由於他們內部的實現方式不同,導致他們所使用的範圍不同,對於StringBuffer而言,他在處理字符串時,若是對其進行修改操作,它並不會產生一個新的字符串對象,所以說在內存使用方面它是優於String的。
其實在使用方法,StringBuffer的許多方法和String類都差不多,所表示的功能幾乎一模一樣,只不過在修改時StringBuffer都是修改自身,而String類則是產生一個新的對象,這是他們之間最大的區別。
同時StringBuffer是不能使用=進行初始化的,它必須要產生StringBuffer實例,也就是說你必須通過它的構造方法進行初始化。
在StringBuffer的使用方面,它更加側重於對字符串的變化,例如追加、修改、刪除,相對應的方法:
1、append():追加指定內容到當前StringBuffer對象的末尾,類似於字符串的連接,這裏StringBuffer對象的內容會發生改變。
2、insert:該類方法主要是在StringBuffer對象中插入內容。
3、delete:該類方法主要用於移除StringBuffer對象中的內容。
三、StringBuilder
StringBuilder也是一個可變的字符串對象,他與StringBuffer不同之處就在於它是線程不安全的,基於這點,它的速度一般都比StringBuffer快。與StringBuffer一樣,StringBuider的主要操作也是append與insert方法。這兩個方法都能有效地將給定的數據轉換成字符串,然後將該字符串的字符添加或插入到字符串生成器中。
上面只是簡單的介紹了String、StringBuffer、StringBuilder,其實對於這三者我們應該更加側重於他們只見到的區別,只有理清楚他們之間的區別才能夠更好的使用他們。
四、正確使用String、StringBuffer、StringBuilder
我們先看如下表格:
這裏對於String是否為線程安全,鄙人也不是很清楚,原因:String不可變,所有的操作都是不可能改變其值的,是否存在線程安全一說還真不好說?但是如果硬要說線程是否安全的話,因為內容不可變,永遠都是安全的。
在使用方面由於String每次修改都需要產生一個新的對象,所以對於經常需要改變內容的字符串最好選擇StringBuffer或者StringBuilder.而對於StringBuffer,每次操作都是對StringBuffer對象本身,它不會生成新的對象,所以StringBuffer特別適用於字符串內容經常改變的情況下。
但是並不是所有的String字符串操作都會比StringBuffer慢,在某些特殊的情況下,String字符串的拼接會被JVM解析成StringBuilder對象拼接,在這種情況下String的速度比StringBuffer的速度快。如:
String name = ”I ” + ”am ” + ”chenssy ” ;
StringBuffer name = new StringBuffer(”I ”).append(” am ”).append(” chenssy ”);
對於這兩種方式,你會發現第一種比第二種快太多了,在這裏StringBuffer的優勢蕩然無存。其真實的原因就在於JVM做了一下優化處理,其實String name = ”I ” + ”am ” + ”chenssy ” ;在JVM眼中就是String name = ”I am chenssy ” ;這樣的方式對於JVM而言,真的是不要什麽時間。但是如果我們在這個其中增加一個String對象,那麽JVM就會按照原來那種規範來構建String對象了。
對於這三者使用的場景做如下概括(參考:《編寫搞質量代碼:改善java程序的151個建議》):
1、String:在字符串不經常變化的場景中可以使用String類,如:常量的聲明、少量的變量運算等。
2、StringBuffer:在頻繁進行字符串的運算(拼接、替換、刪除等),並且運行在多線程的環境中,則可以考慮使用StringBuffer,例如XML解析、HTTP參數解析和封裝等。
3、StringBuilder:在頻繁進行字符串的運算(拼接、替換、刪除等),並且運行在多線程的環境中,則可以考慮使用StringBuffer,如SQL語句的拼裝、JSON封裝等(貌似這兩個我也是使用|StringBuffer)。
更多有關於他們之間區別,請參考:http://www.cnblogs.com/zuoxiaolong/p/lang1.html。鄙人就不畫蛇添足了。
五、字符串拼接方式
對於字符串而言我們經常是要對其進行拼裝處理的,在java中提高了三種拼裝的方法:+、concat()以及append()方法。這三者之間存在什麽區別呢?先看如下示例:
public class StringTest { /** * @desc 使用+、concat()、append()方法循環10W次 * @author chenssy * @data 2013-11-16 * @param args * @return void */ public static void main(String[] args) { //+ long start_01 = System.currentTimeMillis(); String a = "a"; for(int i = 0 ; i < 100000 ; i++){ a += "b"; } long end_01 = System.currentTimeMillis(); System.out.println(" + 所消耗的時間:" + (end_01 - start_01) + "毫米"); //concat() long start_02 = System.currentTimeMillis(); String c = "c"; for(int i = 0 ; i < 100000 ; i++){ c = c.concat("d"); } long end_02 = System.currentTimeMillis(); System.out.println("concat所消耗的時間:" + (end_02 - start_02) + "毫米"); //append long start_03 = System.currentTimeMillis(); StringBuffer e = new StringBuffer("e"); for(int i = 0 ; i < 100000 ; i++){ e.append("d"); } long end_03 = System.currentTimeMillis(); System.out.println("append所消耗的時間:" + (end_03 - start_03) + "毫米"); } } ------------ Output: + 所消耗的時間:19080毫米 concat所消耗的時間:9089毫米 append所消耗的時間:10毫米
從上面的運行結果可以看出,append()速度最快,concat()次之,+最慢。原因請看下面分解:
(一)+方式拼接字符串
在前面我們知道編譯器對+進行了優化,它是使用StringBuilder的append()方法來進行處理的,我們知道StringBuilder的速度比StringBuffer的速度更加快,但是為何運行速度還是那樣呢?主要是因為編譯器使用append()方法追加後要同toString()轉換成String字符串,也就說 str +=”b”等同於
str = new StringBuilder(str).append("b").toString();
它變慢的關鍵原因就在於new StringBuilder()和toString(),這裏可是創建了10W個StringBuilder對象,而且每次還需要將其轉換成String,速度能不慢麽?
(二)concat()方法拼接字符串
public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } char buf[] = new char[count + otherLen]; getChars(0, count, buf, 0); str.getChars(0, otherLen, buf, count); return new String(0, count + otherLen, buf); }
這是concat()的源碼,它看上去就是一個數字拷貝形式,我們知道數組的處理速度是非常快的,但是由於該方法最後是這樣的:return new String(0, count + otherLen, buf);這同樣也創建了10W個字符串對象,這是它變慢的根本原因。
(三)append()方法拼接字符串
public synchronized StringBuffer append(String str) { super.append(str); return this; }
StringBuffer的append()方法是直接使用父類AbstractStringBuilder的append()方法,該方法的源碼如下:
public AbstractStringBuilder append(String str) { if (str == null) str = "null"; int len = str.length(); if (len == 0) return this; int newCount = count + len; if (newCount > value.length) expandCapacity(newCount); str.getChars(0, len, value, count); count = newCount; return this; }
與concat()方法相似,它也是進行字符數組處理的,加長,然後拷貝,但是請註意它最後是返回並沒有返回一個新串,而是返回本身,也就說這這個10W次的循環過程中,它並沒有產生新的字符串對象。
通過上面的分析,我們需要在合適的場所選擇合適的字符串拼接方式,但是並不一定就要選擇append()和concat()方法,原因在於+根據符合我們的編程習慣,只有到了使用append()和concat()方法確實是可以對我們系統的效率起到比較大的幫助,才會考慮,同時鄙人也真的沒有怎麽用過concat()方法。
Java 字符串