java 中的split效能分析
阿新 • • 發佈:2019-01-22
java中的split函式對於字串操作有時很有用,但由於效率問題,大家都是望而卻步。下面看看常用的split方法:
1)String.split函式
2)使用StringTokenizer進行
3)使用org.apache.commons.lang.StringUtils.split 函式
測試程式碼:
public class splitTest { private static final String SPLITSTR = " "; public static String generateStr(int words) { StringBuilder sb = new StringBuilder(words * (" String".length()) + 1); for (int i = 0; i < words; i++) { sb.append(" String"); } return sb.toString(); } public static long orginalsplitperformance(String str) { long begin = System.nanoTime(); for (int i = 0; i < 100000; i++) { @SuppressWarnings("unused") List<String> list = Arrays.asList(str.split(SPLITSTR)); } long end = System.nanoTime(); return end - begin; } public static long strtokensplitperformance(String str) { long begin = System.nanoTime(); for (int i = 0; i < 100000; i++) { StringTokenizer token = new StringTokenizer(str, SPLITSTR); List<String> list = new ArrayList<String>(); while (token.hasMoreTokens()) list.add(token.nextToken()); } long end = System.nanoTime(); return end - begin; } public static long apachesplitformance(String str) { long begin = System.nanoTime(); for (int i = 0; i < 100000; i++) { @SuppressWarnings("unused") List<String> list = Arrays.asList(StringUtils.split(str, SPLITSTR)); } long end = System.nanoTime(); return end - begin; } public static void main(String[] args) { String str = " Swift集成了 現代程式語言思想,以及A pple工程文化的 智慧。編譯器是按照 效能優化的,而語言是為開發優化的,無需互相折中。(by gashero)可以從 開 始 學起並過渡到整個系統。所有這 些使得Swift成為Apple軟體開發者創新的源泉。"; System.out.println(orginalsplitperformance(str)); System.out.println(strtokensplitperformance(str)); System.out.println(apachesplitformance(str)); }
一次執行結果:
265431698
227020193
128523573
究其原因,String.split函式使用的事正則表示式,所以效率比較低。StringTokenizer方法在構造中進行了處理,減少了時間消耗。而apache的StringUtils.split(string,char)直接code,效率最高。我們還可以對中間結果進行快取進行效能改進,或者對於使用正則表示式的,可以對正則進行一次
編譯,多次使用。
當然我們測試時間可能受別的因素的影響不是十分的準確,如果要得到公正的結果可以採用jmh library。但是這些足以說明問題。