Java中的逃逸分析
在Java的編譯體系中,一個Java的原始碼檔案變成計算機可執行的機器指令的過程中,需要經過兩段編譯,第一段是把.java檔案轉換成.class檔案。第二段編譯是把.class轉換成機器指令的過程。
第一段編譯就是javac
命令。
在第二編譯階段,JVM 通過解釋位元組碼將其翻譯成對應的機器指令,逐條讀入,逐條解釋翻譯。很顯然,經過解釋執行,其執行速度必然會比可執行的二進位制位元組碼程式慢很多。這就是傳統的JVM的直譯器(Interpreter)的功能。為了解決這種效率問題,引入了 JIT(即時編譯) 技術。
引入了 JIT 技術後,Java程式還是通過直譯器進行解釋執行,當JVM發現某個方法或程式碼塊執行特別頻繁的時候,就會認為這是“熱點程式碼”(Hot Spot Code)。然後JIT會把部分“熱點程式碼”翻譯成本地機器相關的機器碼,並進行優化,然後再把翻譯後的機器碼快取起來,以備下次使用。
由於關於JIT編譯和熱點檢測的內容,我在深入分析Java的編譯原理中已經介紹過了,這裡就不在贅述,本文主要來介紹下JIT中的優化。JIT優化中最重要的一個就是逃逸分析。
關於逃逸分析的概念,可以參考物件並不一定都是在堆上分配記憶體的一文,這裡簡單回顧一下:
逃逸分析的基本行為就是分析物件動態作用域:當一個物件在方法中被定義後,它可能被外部方法所引用,例如作為呼叫引數傳遞到其他地方中,稱為方法逃逸。
例如以下程式碼:
public static StringBuffer craeteStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb;
}
public static String createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb.toString();
}
第一段程式碼中的sb
就逃逸了,而第二段程式碼中的sb
就沒有逃逸。
使用逃逸分析,編譯器可以對程式碼做如下優化:
一、同步省略。如果一個物件被發現只能從一個執行緒被訪問到,那麼對於這個物件的操作可以不考慮同步。
二、將堆分配轉化為棧分配。如果一個物件在子程式中被分配,要使指向該物件的指標永遠不會逃逸,物件可能是棧分配的候選,而不是堆分配。
三、分離物件或標量替換。有的物件可能不需要作為一個連續的記憶體結構存在也可以被訪問到,那麼物件的部分(或全部)可以不儲存在記憶體,而是儲存在CPU暫存器中。
在Java程式碼執行時,通過JVM引數可指定是否開啟逃逸分析,
-XX:+DoEscapeAnalysis
: 表示開啟逃逸分析
-XX:-DoEscapeAnalysis
: 表示關閉逃逸分析 從jdk 1.7開始已經預設開始逃逸分析,如需關閉,需要指定-XX:-DoEscapeAnalysis
在動態編譯同步塊的時候,JIT編譯器可以藉助逃逸分析來判斷同步塊所使用的鎖物件是否只能夠被一個執行緒訪問而沒有被髮布到其他執行緒。
如果同步塊所使用的鎖物件通過這種分析被證實只能夠被一個執行緒訪問,那麼JIT編譯器在編譯這個同步塊的時候就會取消對這部分程式碼的同步。這個取消同步的過程就叫同步省略,也叫鎖消除。
如以下程式碼:
public void f() {
Object hollis = new Object();
synchronized(hollis) {
System.out.println(hollis);
}
}
程式碼中對hollis這個物件進行加鎖,但是hollis物件的生命週期只在f()方法中,並不會被其他執行緒所訪問到,所以在JIT編譯階段就會被優化掉。優化成:
public void f() {
Object hollis = new Object();
System.out.println(hollis);
}
所以,在使用synchronized的時候,如果JIT經過逃逸分析之後發現並無執行緒安全問題的話,就會做鎖消除。
標量(Scalar)是指一個無法再分解成更小的資料的資料。Java中的原始資料型別就是標量。相對的,那些還可以分解的資料叫做聚合量(Aggregate),Java中的物件就是聚合量,因為他可以分解成其他聚合量和標量。
在JIT階段,如果經過逃逸分析,發現一個物件不會被外界訪問的話,那麼經過JIT優化,就會把這個物件拆解成若干個其中包含的若干個成員變數來代替。這個過程就是標量替換。
public static void main(String[] args) {
alloc();
}
private static void alloc() {
Point point = new Point(1,2);
System.out.println("point.x="+point.x+"; point.y="+point.y);
}
class Point{
private int x;
private int y;
}
以上程式碼中,point物件並沒有逃逸出alloc
方法,並且point物件是可以拆解成標量的。那麼,JIT就會不會直接建立Point物件,而是直接使用兩個標量int x ,int y來替代Point物件。
以上程式碼,經過標量替換後,就會變成:
private static void alloc() {
int x = 1;
int y = 2;
System.out.println("point.x="+x+"; point.y="+y);
}
可以看到,Point這個聚合量經過逃逸分析後,發現他並沒有逃逸,就被替換成兩個聚合量了。那麼標量替換有什麼好處呢?就是可以大大減少堆記憶體的佔用。因為一旦不需要建立物件了,那麼就不再需要分配堆記憶體了。
標量替換為棧上分配提供了很好的基礎。
在Java虛擬機器中,物件是在Java堆中分配記憶體的,這是一個普遍的常識。但是,有一種特殊情況,那就是如果經過逃逸分析後發現,一個物件並沒有逃逸出方法的話,那麼就可能被優化成棧上分配。這樣就無需在堆上分配記憶體,也無須進行垃圾回收了。
這裡,還是要簡單說一下,其實在現有的虛擬機器中,並沒有真正的實現棧上分配,在物件並不一定都是在堆上分配記憶體的中我們的例子中,物件沒有在堆上分配,其實是標量替換實現的。
關於逃逸分析的論文在1999年就已經發表了,但直到JDK 1.6才有實現,而且這項技術到如今也並不是十分成熟的。
其根本原因就是無法保證逃逸分析的效能消耗一定能高於他的消耗。雖然經過逃逸分析可以做標量替換、棧上分配、和鎖消除。但是逃逸分析自身也是需要進行一系列複雜的分析的,這其實也是一個相對耗時的過程。
一個極端的例子,就是經過逃逸分析之後,發現沒有一個物件是不逃逸的。那這個逃逸分析的過程就白白浪費掉了。
雖然這項技術並不十分成熟,但是他也是即時編譯器優化技術中一個十分重要的手段。
4