1. 程式人生 > >java 豎線分割字串的問題

java 豎線分割字串的問題

java 豎線分割字串的問題

例1:
 String[] paraStr = "6010;320100;A".split(";");
 System.out.println(Arrays.toString(paraStr));
輸出:[6010, 320100, A]

Ok

例2:
 String[] paraStr = "6010|320100|A".split("|");
 System.out.println(Arrays.toString(paraStr));
輸出:[, 6, 0, 1, 0, |, 3, 2, 0, 1, 0, 0, |, A]

NO,和期望值相差甚遠

例3:
 String[] paraStr = "6010+320100+A".split("+");
 System.out.println(Arrays.toString(paraStr));
輸出:
Exception in thread "main" java.util.regex.PatternSyntaxException: Dangling meta character '+' near index 0
+
異常!

有現象,才能總結出結論:

使用String.split方法時要注意的問題 
 在使用String.split方法分隔字串時,分隔符如果用到一些特殊字元,可能會得不到我們預期的結果。
我們看jdk doc中說明
public String[] split(String regex)
Splits this string around matches of the given regular expression. 
引數regex是一個 regular-expression的匹配模式而不是一個簡單的String,他對一些特殊的字元可能會出現你預想不到的結果:
1.用豎線 | 分隔字串,你將得不到預期的結果。
2.用 * 分隔字串執行將丟擲java.util.regex.PatternSyntaxException異常,用加號 + 也是如此。

顯然,| + * 不是有效的模式匹配規則表示式,用"\\*" "\\+"轉義後即可得到正確的字串結果。
"|" 分隔串時雖然能夠執行,但是卻不是預期的目的,得到的是每個字元的分割,而不是字串,"\\|"轉義後即可得到正確的字串結果。
還有如果想在串中使用"\"字元,則也需要轉義.首先要表達"a\b"這個串就應該用"a\\b",如果要分隔就應該這樣才能得到正確結果:
String[] aa = "aaa\\bbb\\bccc".split("\\\\");

注意:除了使用“\\|”外,也可以用"[.]" 進行分隔!
如:
String[] paraStr = "6010|320100|A".split("[|]");
String[] paraStr = "6010.320100.A".split("[.]");