String字串效能優化的幾種方案

阿新 • • 發佈：2020-02-04

String字串是系統裡最常用的型別之一，在系統中佔據了很大的記憶體，因此，高效地使用字串，對系統的效能有較好的提升。

針對字串的優化，我在工作與學習過程總結了以下三種方案作分享：

一.優化構建的超大字串
　　驗證環境：jdk1.8 　　反編譯工具：jad 1.下載反編譯工具jad，百度雲盤下載：連結：https://pan.baidu.com/s/1TK1_N769NqtDtLn28jR-Xg 提取碼：ilil 2.驗證先執行一段例子1程式碼：

1 public class test3 {
2     public static void main(String[] args) {
3         String str="ab"+"cd"+"ef"+"123";
4     }
5 }

執行完成後，用反編譯工具jad進行反編譯：jad -o -a -s d.java test.class 反編譯後的程式碼：

 1 // Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.
 2 // Jad home page: http://www.kpdus.com/jad.html
 3 // Decompiler options: packimports(3) annotate 
 4 // Source File Name:   test.java
 5 package example;
 6 public class test
 7 {
 8     public test()
 9     {
10     //    0    0:aload_0         
11     //    1    1:invokespecial   #1   <Method void Object()>
12     //    2    4:return          
13     }
14     public static void main(String args[])
15     {
16         String str = "abcdef123";
17     //    0    0:ldc1            #2   <String "abcdef123">
18     //    1    2:astore_1        
19     //    2    3:return          
20     }
21 }

案例2：

1 public class test1 {
2     public static void main(String[] args)
3     {
4         String s = "abc";
5         String ss = "ok" + s + "xyz" + 5;
6         System.out.println(ss);
7     }
8 }

用反編譯工具jad執行jad -o -a -s d.java test1.class進行反編譯後：

 1 // Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.
 2 // Jad home page: http://www.kpdus.com/jad.html
 3 // Decompiler options: packimports(3) annotate 
 4 // Source File Name:   test1.java
 5 
 6 package example;
 7 
 8 import java.io.PrintStream;
 9 
10 public class test1
11 {
12     public test1()
13     {
14     //    0    0:aload_0         
15     //    1    1:invokespecial   #1   <Method void Object()>
16     //    2    4:return          
17     }
18     public static void main(String args[])
19     {
20         String s = "abc";
21     //    0    0:ldc1            #2   <String "abc">
22     //    1    2:astore_1        
23         String ss = (new StringBuilder()).append("ok").append(s).append("xyz").append(5).toString();
24     //    2    3:new             #3   <Class StringBuilder>
25     //    3    6:dup             
26     //    4    7:invokespecial   #4   <Method void StringBuilder()>
27     //    5   10:ldc1            #5   <String "ok">
28     //    6   12:invokevirtual   #6   <Method StringBuilder StringBuilder.append(String)>
29     //    7   15:aload_1         
30     //    8   16:invokevirtual   #6   <Method StringBuilder StringBuilder.append(String)>
31     //    9   19:ldc1            #7   <String "xyz">
32     //   10   21:invokevirtual   #6   <Method StringBuilder StringBuilder.append(String)>
33     //   11   24:iconst_5        
34     //   12   25:invokevirtual   #8   <Method StringBuilder StringBuilder.append(int)>
35     //   13   28:invokevirtual   #9   <Method String StringBuilder.toString()>
36     //   14   31:astore_2        
37         System.out.println(ss);
38     //   15   32:getstatic       #10  <Field PrintStream System.out>
39     //   16   35:aload_2         
40     //   17   36:invokevirtual   #11  <Method void PrintStream.println(String)>
41     //   18   39:return          
42     }
43 }

根據反編譯結果，可以看到內部其實是通過StringBuilder進行字串拼接的。再來執行例3的程式碼：

 1 public class test2 {
 2     public static void main(String[] args) {
 3         String s = "";
 4         Random rand = new Random();
 5         for (int i = 0; i < 10; i++) {
 6             s = s + rand.nextInt(1000) + " ";
 7         }
 8         System.out.println(s);
 9     }
10 }

用反編譯工具jad執行jad -o -a -s d.java test2.class進行反編譯後，發現其內部同樣是通過StringBuilder來進行拼接的：

 1 // Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.
 2 // Jad home page: http://www.kpdus.com/jad.html
 3 // Decompiler options: packimports(3) annotate 
 4 // Source File Name:   test2.java
 5 package example;
 6 import java.io.PrintStream;
 7 import java.util.Random;
 8 public class test2
 9 {
10     public test2()
11     {
12     //    0    0:aload_0         
13     //    1    1:invokespecial   #1   <Method void Object()>
14     //    2    4:return          
15     }
16     public static void main(String args[])
17     {
18         String s = "";
19     //    0    0:ldc1            #2   <String "">
20     //    1    2:astore_1        
21         Random rand = new Random();
22     //    2    3:new             #3   <Class Random>
23     //    3    6:dup             
24     //    4    7:invokespecial   #4   <Method void Random()>
25     //    5   10:astore_2        
26         for(int i = 0; i < 10; i++)
27     //*   6   11:iconst_0        
28     //*   7   12:istore_3        
29     //*   8   13:iload_3         
30     //*   9   14:bipush          10
31     //*  10   16:icmpge          55
32             s = (new StringBuilder()).append(s).append(rand.nextInt(1000)).append(" ").toString();
33     //   11   19:new             #5   <Class StringBuilder>
34     //   12   22:dup             
35     //   13   23:invokespecial   #6   <Method void StringBuilder()>
36     //   14   26:aload_1         
37     //   15   27:invokevirtual   #7   <Method StringBuilder StringBuilder.append(String)>
38     //   16   30:aload_2         
39     //   17   31:sipush          1000
40     //   18   34:invokevirtual   #8   <Method int Random.nextInt(int)>
41     //   19   37:invokevirtual   #9   <Method StringBuilder StringBuilder.append(int)>
42     //   20   40:ldc1            #10  <String " ">
43     //   21   42:invokevirtual   #7   <Method StringBuilder StringBuilder.append(String)>
44     //   22   45:invokevirtual   #11  <Method String StringBuilder.toString()>
45     //   23   48:astore_1        
46 
47     //   24   49:iinc            3  1
48     //*  25   52:goto            13
49         System.out.println(s);
50     //   26   55:getstatic       #12  <Field PrintStream System.out>
51     //   27   58:aload_1         
52     //   28   59:invokevirtual   #13  <Method void PrintStream.println(String)>
53     //   29   62:return          
54     }
55 }

綜上案例分析，發現字串進行“+”拼接時，內部有以下幾種情況： 1.“+”直接拼接的是常量變數，如"ab"+"cd"+"ef"+"123"，內部編譯就把幾個連線成一個常量字串處理； 2. “+”拼接的含變數字串，如案例2："ok" + s + "xyz" + 5，內部編譯其實是new 一個StringBuilder來進行來通過append進行拼接； 3.案例3迴圈過程，實質也是“+”拼接含變數字串，因此，內部編譯時，也會建立StringBuilder來進行拼接。對比三種情況，發現第三種情況每次做迴圈，都會新建立一個StringBuilder物件，這會增加系統的記憶體，反過來就會降低系統性能。因此，在做字串拼接時，單執行緒環境下，可以顯性使用StringBuilder來進行拼接，避免每迴圈一次就new一個StringBuilder物件；在多執行緒環境下，可以使用執行緒安全的StringBuffer，但涉及到鎖競爭，StringBuffer效能會比StringBuilder差一點。這樣，起到在字串拼接時的優化效果。 2.如何使用String.intern節省記憶體？在回答這個問題之前，可以先對一段程式碼進行測試： 1.首先在idea設定-XX:+PrintGCDetails -Xmx6G -Xmn3G，用來列印GC日誌資訊，設定如下圖所示： 2.執行以下例子程式碼：

 1 public class test4 {
 2     public static void main(String[] args) {
 3         final int MAX=10000000;
 4         System.out.println("不用intern："+notIntern(MAX));
 5 //      System.out.println("使用intern："+intern(MAX));
 6     }
 7     private static long notIntern(int MAX){
 8         long start = System.currentTimeMillis();
 9         for (int i = 0; i < MAX; i++) {
10             int j = i % 100;
11             String str = String.valueOf(j);
12         }
13         return System.currentTimeMillis() - start;
14     }
15 /*
16     private static long intern(int MAX){
17         long start = System.currentTimeMillis();
18         for (int i = 0; i < MAX; i++) {
19             int j = i % 100;
20             String str = String.valueOf(j).intern();
21         }
22         return System.currentTimeMillis() - start;
23     }*/
24

未使用intern的GC日誌：

 1 不用intern：354
 2 [GC (System.gc()) [PSYoungGen: 377487K->760K(2752512K)] 377487K->768K(2758656K), 0.0009102 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 3 [Full GC (System.gc()) [PSYoungGen: 760K->0K(2752512K)] [ParOldGen: 8K->636K(6144K)] 768K->636K(2758656K), [Metaspace: 3278K->3278K(1056768K)], 0.0051214 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 4 Heap
 5  PSYoungGen      total 2752512K, used 23593K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000)
 6   eden space 2359296K, 1% used [0x0000000700000000,0x000000070170a548,0x0000000790000000)
 7   from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000)
 8   to   space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000)
 9  ParOldGen       total 6144K, used 636K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000)
10   object space 6144K, 10% used [0x0000000640000000,0x000000064009f2f8,0x0000000640600000)
11  Metaspace       used 3284K, capacity 4500K, committed 4864K, reserved 1056768K
12   class space    used 359K, capacity 388K, committed 512K, reserved 1048576K

根據列印的日誌分析：沒有使用intern情況下，執行時間為354ms，佔用記憶體為24229k;

使用intern的GC日誌：

 1 使用intern：1515
 2 [GC (System.gc()) [PSYoungGen: 613417K->1144K(2752512K)] 613417K->1152K(2758656K), 0.0012530 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 3 [Full GC (System.gc()) [PSYoungGen: 1144K->0K(2752512K)] [ParOldGen: 8K->965K(6144K)] 1152K->965K(2758656K), [Metaspace: 3780K->3780K(1056768K)], 0.0079962 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
 4 Heap
 5  PSYoungGen      total 2752512K, used 15729K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000)
 6   eden space 2359296K, 0% used [0x0000000700000000,0x0000000700f5c400,0x0000000790000000)
 7   from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000)
 8   to   space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000)
 9  ParOldGen       total 6144K, used 965K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000)
10   object space 6144K, 15% used [0x0000000640000000,0x00000006400f1740,0x0000000640600000)
11  Metaspace       used 3786K, capacity 4540K, committed 4864K, reserved 1056768K
12   class space    used 420K, capacity 428K, committed 512K, reserved 1048576K

日誌分析：沒有使用intern情況下，執行時間為1515ms，佔用記憶體為16694k; 綜上所述:使用intern情況下，記憶體相對沒有使用intern的情況要小，但在節省記憶體的同時，增加了時間複雜度。我試過將MAX=10000000再增加一個0的情況下，使用intern將會花費高達11秒的執行時間，可見，在遍歷資料過大時，不建議使用intern。因此，使用intern的前提，一定要考慮到具體的使用場景。到這裡，可以確定，使用String.intern確實可以節省記憶體。接下來，分析一下intern在不同JDK版本的區別。在JDK1.6中，字串常量池在方法區中，方法區屬於永久代。在JDK1.7中，字串常量池移到了堆中。在JDK1.8中，字串常量池移到了元空間裡，與堆相獨立。分別在1.6、1.7、1.8版本執行以下一個例子：

 1 public class test5 {
 2     public static void main(String[] args) {
 3         
 4         String s1=new String("ab");
 5         s.intern();
 6         String s2="ab";
 7         System.out.println(s1==s2);
 8 
 9 
10         String s3=new String("ab")+new String("cd");
11         s3.intern();
12         String s4="abcd";
13         System.out.println(s4==s3);
14     }
15 }

1.6版本執行結果： fasle false 分析：執行第一部分時： 1.程式碼編譯時，先在字串常量池裡建立常量“ab"；在呼叫new時，將在堆中建立一個String物件，字串常量建立的“ab"儲存到堆中，最後堆中的String物件返回一個引用給s1。 2.s.intern()，在字串常量池裡已經存在“ab”,便不再建立存放副本“ab"； 3.s2="ab"，s2指向的是字串常量池裡”ab"，而s1指向的堆中的”ab"，故兩者不相等。該示意圖如下：執行第二部分： 1.兩個new出來相加的“abcd”存放在堆中，s3指向堆中的“abcd"; 2.執行s3.intern()，在將“abcd"副本的存放到字串常量池時，發現常量池裡沒有該”abcd"，因此，成功存放； 3.s4="abcd"指向的是字串常量池裡已有的“abcd"副本，而s3指向的是堆中的"abcd"，副本"abcd"的地址和堆中“abcd"地址不相同，故為false; 1.7版本 false true 執行第一部分：這一部分與jdk1.6基本類似，不同在於，s1.intern()返回的是引用，而不是副本。執行第二部分： 1.new String("ab")+new String("cd")，先在常量池裡生成“ab"和”cd"，再在堆中生成“abcd"; 2.執行s3.intern()時，會把“abcd”的物件引用放到字串常量池裡，發現常量池裡還沒有該引用，故可成功放入。當String s4="abcd"，即把字串常量池中”abcd“的引用地址賦值給s4，相當於s4指向了堆中”abcd"的地址，故s3==s4為true。 1.8版本 false true 參考網上一些部落格，在1.8版本當中，使用intern()時，執行原理如下：若字串常量池中，包含了與當前物件相當的字串，將返回常量池裡的字串；若不存在，則將該字串存放進常量池裡，並返回字串的引用。綜上所述，可見三種版本當中，使用intern時，若字串常量池裡不存在相應字串時，存在以下區別：例如： String s1=new String("ab"); s.intern(); jdk1.6:若字串常量池裡沒有“ab"，則會在常量池裡存放一個“ab"副本，該副本地址與堆中的”ab"地址不相等； jdk1.7:若字串常量池裡沒有“ab"，會將“ab”的物件引用放到字串常量池裡，該引用地址與堆中”ab"的地址相同； jdk1.8:若字串常量池中包含與當前物件相當的字串，將返回常量池裡的字串；若不存在，則將該字串存放進常量池裡，並返回字串的引用。 3.如何使用字串的分割方法？在簡單進行字串分割時，可以用indexOf替代split，因為split的效能不夠穩定，故針對簡單的字串分割，可優先使用indexOf代替；

String字串效能優化的幾種方案

String字串效能優化的幾種方案

進行前端效能優化幾種常用的方法。

String字串效能優化的探究

web端文字轉語音的幾種方案

springMVC中處理靜態資源的幾種方案

權限管理的幾種方案-寫備忘

java 字串擷取的幾種方式

MySQL叢集的幾種方案

字串反轉的幾種實現方式？陣列反轉

java字串拼接的幾種方式

js深拷貝的幾種方案（有更多意見的可以評論在下方，我可以整理在一起）

PHP程式碼加密的幾種方案

C/C++ 中 int 轉 string，string 轉 int 的幾種方法

Shell指令碼中計算字串長度的幾種方法

非線性優化-幾種優化方法的比較（1）

java:StringBuffer和String相互轉換的幾種用法

python字串複製的幾種方法

C/C++ 字串反轉的幾種方法

String字串反轉的兩種方法藉助byte[]

Mysql中字串處理的幾種處理方法concat、concat_ws、group_concat

String字串效能優化的幾種方案

相關推薦