java java中subString、split、stringTokenizer三種擷取字串方法的效能比較

阿新 • • 發佈：2018-11-07

面試的時候，string 基本上是必須問的知識

突然想起面試的時候曾經被人問過：都知道在大資料量情況下，使用String的split擷取字串效率很低，有想過用其他的方法替代嗎？用什麼替代？我當時的回答很斬釘截鐵：沒有。

google了一下，發現有2中替代方法，於是在這裡我將對這三種方式進行測試。

測試的軟體環境為：Windows XP、eclipse、JDK1.6。

測試用例使用類ip形式的字串，即3位一組，使用”.”間隔。資料分別使用：5組、10組、100組、1000組、10000組、100000組。

實現

閒話不說，先上程式碼：

[java] view plain

copy print ?

package test.java.lang.ref;
import java.util.Random;
import java.util.StringTokenizer;
/**
* String測試類
* @author xiaori.Liu
*
*/

public class StringTest {
public static void main(String args[]){
String orginStr = getOriginStr(10);

//////////////String.splic()表現//////////////////////////////////////////////
System.out.println("使用String.splic()的切分字串");
long st1 = System.nanoTime();
String [] result = orginStr.split("\\.");
System.out.println("String.splic()擷取字串用時：" + (System.nanoTime()-st1));
System.out.println("String.splic()擷取字串結果個數：" + result.length);
System.out.println();
//////////////StringTokenizer表現//////////////////////////////////////////////
System.out.println("使用StringTokenizer的切分字串");
long st3 = System.nanoTime();
StringTokenizer token=new StringTokenizer(orginStr,".");
System.out.println("StringTokenizer擷取字串用時:"+(System.nanoTime()-st3));
System.out.println("StringTokenizer擷取字串結果個數：" + token.countTokens());
System.out.println();
////////////////////String.substring()表現//////////////////////////////////////////
long st5 = System.nanoTime();
int len = orginStr.lastIndexOf(".");
System.out.println("使用String.substring()切分字串");
int k=0,count=0;
for (int i = 0; i <= len; i++) {
if(orginStr.substring(i, i+1).equals(".")){
if(count==0){
orginStr.substring(0, i);
}else{
orginStr.substring(k+1, i);
if(i == len){
orginStr.substring(len+1, orginStr.length());
}
}
k=i;count++;
}
}
System.out.println("String.substring()擷取字串用時"+(System.nanoTime()-st5));
System.out.println("String.substring()擷取字串結果個數：" + (count + 1));
}
/**
* 構造目標字串
* eg：10.123.12.154.154
* @param len 目標字串組數(每組由3個隨機陣列成)
* @return
*/
private static String getOriginStr(int len){
StringBuffer sb = new StringBuffer();
StringBuffer result = new StringBuffer();
Random random = new Random();
for(int i = 0; i < len; i++){
sb.append(random.nextInt(9)).append(random.nextInt(9)).append(random.nextInt(9));
result.append(sb.toString());
sb.delete(0, sb.length());
if(i != len-1)
result.append(".");
}
return result.toString();
}
}

改變目標資料長度修改getOriginStr的len引數即可。

5組測試資料結果如下圖：

下面這張圖對比了下，split耗時為substring和StringTokenizer耗時的倍數：

好吧，我又花了點兒時間，做了幾張圖表來分析這3中方式的效能。

首先來一張柱狀圖對比一下這5組資料擷取所花費的時間：

從上圖可以看出StringTokenizer的效能實在是太好了(對比另兩種),幾乎在圖表中看不見它的身影。遙遙領先。substring花費的時間始終比split要少，但是耗時也在隨著資料量的增加而增加。

下面3張折線圖可以很明顯看出split、substring、StringTokenizer3中實現隨著資料量增加，耗時的趨勢。

split是變化最大的，也就是資料量越大，擷取所需要的時間增長越快。

substring則比split要平穩一點點，但是也在增長。

StringTokenizer則是表現最優秀的，基本上平穩，始終保持在5000ns一下。

結論

最終，StringTokenizer在擷取字串中效率最高，不論資料量大小，幾乎持平。substring則要次之，資料量增加耗時也要隨之增加。split則是表現最差勁的。

究其原因，split的實現方式是採用正則表示式實現，所以其效能會比較低。至於正則表示式為何低，還未去驗證。split原始碼如下：

[java] view plain copy print ?

public String[] split(String regex, int limit) {
return Pattern.compile(regex).split(this, limit)

本文來自 HH-i 的CSDN 部落格，全文地址請點選：https://blog.csdn.net/u013938165/article/details/23173309?utm_source=copy

java java中subString、split、stringTokenizer三種擷取字串方法的效能比較

面試的時候，string 基本上是必須問的知識突然想起面試的時候曾經被人問過：都知道在大資料量情況下，使用String的split擷取字串效率很低，有想過用其他的方法替代嗎？用什麼替代？我當時的回答很斬釘截鐵：沒有。 google了一下，發現有2中替代方法，於

Java中substring、split、StringTokenizer三種擷取字串方法的效能比較

最近在閱讀java.lang下的原始碼，讀到String時，突然想起面試的時候曾經被人問過：都知道在大資料量情況下，使用String的split擷取字串效率很低，有想過用其他的方法替代嗎？用什麼替代？我當時的回答很斬釘截鐵：沒有。 Google了一下，發現有2種替代方法，於是

Java中 List的遍歷及三種遍歷方法

Java List遍歷方法及其效率對比 package com.zbalpha.test; import java.util.ArrayList; import java.util.Iterator; import java.util.List;

java多執行緒---順序列印ABC的三種實現---join方法

使用join方法，讓三個執行緒之間存在等待關係程式碼如下： package com.zcj.join; public class JoinTest { public static voi

簡單談談我對Java 中 Class.forName()、Class.class、例項物件.getClass() 三種獲取位元組碼物件的理解？(內含程式碼分析和總結)

首先得明白的知識點: 1靜態屬性初始化載入類的時候初始化( 只會初始化一次),而非靜態屬性的初始化就是new類例項物件的時候初始化的 2三種獲取位元組碼物件的共同點就是都會預先的判斷記憶體是否已經載入此類,弱沒有載入,則會把.class檔案裝入到記憶體,若是載入了,則會根據class檔案生成例

Java 8 中 Date與LocalDateTime、LocalDate、LocalTime互轉

Java 8中 java.util.Date 類新增了兩個方法，分別是from(Instant instant)和toInstant()方法 // Obtains an instance of Date from an Instant object. public stat

HotSpot虛擬機器在java堆中物件的分配、佈局和訪問

一.物件的建立二.物件的記憶體佈局（一個物件在記憶體中是怎樣儲存的）在HotSpot虛擬機器中，物件在記憶體中儲存的佈局可以分為3塊區域：物件頭、例項資料和對齊填充 HotSpot虛擬機器的物件頭包括兩部分資訊：第一部分是用於儲存物件自身的執行時資料，如雜湊碼、

Java JDK中的靜態代理、動態代理&Cglib動態代理

代理模式代理模式是常用的java設計模式，他的特徵是代理類與委託類有同樣的介面，代理類主要負責為委託類預處理訊息、過濾訊息、把訊息轉發給委託類，以及事後處理訊息等。代理類與委託類之間通常會存在關聯關係，一個代理類的物件與一個委託類的物件關聯，代理類的物件本

Java類中的靜態屬性、靜態程式碼塊塊、非靜態屬性、非靜態程式碼塊塊、建構函式在初始化時的執行順序

序言前幾天在複習J2SE的時候，看到了這個Java類在new的過程中，靜態域、靜態塊、非靜態域、非靜態塊、建構函式的執行順序問題。就想著自己總結寫一下，便於以後查閱總結：以下是我整理好的結果；在java類new一個物件的過程中，它們的執行順序如下：（當

StringTokenizer、split、substring對比

對String進行分割,JDK提供了三種方法:分別是 java.lang.String的 split方法和substring方法,以及java.util.StringTokenizer類. 最常用的就String自帶的兩種方法,StringTokenizer極

ElasticSearch學習（十一）在Java應用中實現聚合查詢、query string查詢

//聚合查詢 @Test public void test20() throws Exception { //指定ES叢集 Settings settings = Settings.builder().put("clus

java學習中對泛型、Map、Collectiongs的一些理解

泛型： 1、泛型定義，一種安全機制。表明引數或者介面或者類的資料型別，般是 < > 表示泛型，是在1.5之後才產生的，一般JDK“進化” 會更安全，更高效，更完整。在1.5之前，沒有泛型都是用利用多型的思想強制轉化成某個型別再得到想要的值，使用

盤點2019年Java開發中7項主流、熱門的IT技術！

作為歷史最為悠久的程式語言，Java歷經數十年依然盤踞在程式設計榜前三的位置，與它強大的功能和廣泛的運用分不開。Java技術的更新

在java領域，表現層技術主要有三種：jsp、freemarker、velocity

jsp是大家最熟悉的技術優點： 1、功能強大，可以寫java程式碼 2、支援jsp標籤（jsp tag） 3、支援表示式語言（el） 4、官方標準，使用者群廣，豐富的第三方jsp標籤庫 5、效能良好。jsp編譯成class檔案執行，有很好的效能表現缺點： jsp沒有明顯缺

Java模擬最短作業優先、時間片輪轉、最高響應比三種程序排程演算法

本次試驗是使用程式來模擬作業系統中程序排程的三種不同的排程策略，分別為最短作業有限、時間片輪轉、最高響應比。模擬的情況下，程序數為8，程序所需執行時間為隨機產生的整數，單位為1S，預設程序同時到達。以下是實驗的程式碼： Process.java是測試類，用於生成程序列表

C#幾種擷取字串的方法（split 、Substring、Replace、remove）

C#截圖字串常用的方法有 split 、Substring、Replace、remove等。 split的使用： 1. Split( Char ()) 返回的字串陣列包含此例項中的子字串（

【Java】字串三種空字串null、new String()、""的區別

今天寫個DEMO的時候碰到了個小麻煩，有關於題目所說的字串這三者的區別，我覺得我真的是夠了，居然會用得這麼細，不過會了也好，碰到相關的問題就可以一言不合程式碼就開寫！既然研究，那就從結果說起，來看測試程式碼和輸出結果： // 測

Java併發庫（五、六、七）：執行緒範圍內共享資料、ThreadLocal、共享資料的三種方法

深切懷念傳智播客張孝祥老師，特將其代表作——Java併發庫視訊研讀兩遍，受益頗豐，記以後閱 05. 執行緒範圍內共享變數的概念與作用執行緒範圍內共享資料圖解：程式碼演示： class ThreadScopeShareData { 三個模組共享資料，主執

java中創建線程的三種方法以及區別

sta tar ati 定義 callable main ring 我們 () Java使用Thread類代表線程，所有的線程對象都必須是Thread類或其子類的實例。Java可以用三種方式來創建線程，如下所示： 1）繼承Thread類創建線程 2）實現Runnable接口

dd、split、csplit命令

sys /dev/ 上下文其中 print /tmp 文章系列文章還需本文目錄： 1.1 dd命令 1.2 split命令 1.3 csplit命令在Linux最常用的文件生成和切片工具是dd，它功能比較全面，但無法以行為單位提取文件數據，也無法直接將文件按大

java java中subString、split、stringTokenizer三種擷取字串方法的效能比較

實現

結論

相關推薦