JVM系列之:再談java中的safepoint說明

阿新 • • 發佈：2020-09-15

safepoint是什麼

java程式裡面有很多很多的java執行緒，每個java執行緒又有自己的stack，並且共享了heap。這些執行緒一直執行呀執行，不斷對stack和heap進行操作。

這個時候如果JVM需要對stack和heap做一些操作該怎麼辦呢？

比如JVM要進行GC操作，或者要做heap dump等等，這時候如果執行緒都在對stack或者heap進行修改，那麼將不是一個穩定的狀態。GC直接在這種情況下操作stack或者heap，會導致執行緒的異常。

怎麼處理呢？

這個時候safepoint就出場了。

safepoint就是一個安全點，所有的執行緒執行到安全點的時候就會去檢查是否需要執行safepoint操作，如果需要執行，那麼所有的執行緒都將會等待，直到所有的執行緒進入safepoint。

然後JVM執行相應的操作之後，所有的執行緒再恢復執行。

safepoint的例子

我們舉個例子，一般safepoint比如容易出現在迴圈遍歷的情況，還是使用我們之前做null測試用的例子：

public class TestNull {

 public static void main(String[] args) throws InterruptedException {
  List<String> list= new ArrayList();
 list.add("www.flydean.com");
  for (int i = 0; i < 10000; i++)
  {
   testMethod(list);
  }
  Thread.sleep(1000);
 }

 private static void testMethod(List<String> list)
 {
  list.get(0);
 }
}

執行結果如下：

JVM系列之:再談java中的safepoint說明

標紅的就是傳說中的safepoint。

執行緒什麼時候會進入safepoint

那麼執行緒什麼時候會進入safepoint呢？

一般來說，如果執行緒在競爭鎖被阻塞，IO被阻塞，或者在等待獲得監視器鎖狀態時，執行緒就處於safepoint狀態。

如果執行緒再執行JNI程式碼的哪一個時刻，java執行緒也處於safepoint狀態。因為java執行緒在執行原生代碼之前，需要儲存堆疊的狀態，讓後再移交給native方法。

如果java的位元組碼正在執行，那麼我們不能判斷該執行緒是不是在safepint上。

safepoint是怎麼工作的

如果你使用的是hotspot JVM，那麼這個safepoint是一個全域性的safepoint，也就是說執行Safepoint需要暫停所有的執行緒。

如果你使用的是Zing，那麼可以線上程級別使用safepoint。

我們可以看到生成的組合語言中safepoint其實是一個test命令。

test指向的是一個特殊的記憶體頁面地址，當JVM需要所有的執行緒都執行到safepint的時候，就會對該頁面做一個標記。從而通知所有的執行緒。

我們再用一張圖來詳細說明：

JVM系列之:再談java中的safepoint說明

thread1在收到設定safepoint之前是一直執行的，在收到訊號之後還會執行一段時間，然後到達Safepint暫停執行。

thread2先執行了一段時間，然後因為CPU被搶奪，空閒了一段時間，在這段時間裡面，thread2收到了設定safepoint的訊號，然後thread2獲得執行權力，接著繼續執行，最後到達safepoint。

thread3是一個native方法，將會一直執行，知道safepoint結束。

thread4也是一個native方法，它和thread3的區別就在於，thread4在safepoint開始和結束之間結束了，需要將控制器轉交給普通的java執行緒，因為這個時候JVM在執行Safepoint的操作，所以任然需要暫停執行。

在HotSpot VM中，你可以在組合語言中看到safepoint的兩種形式：'{poll}' 或者 ‘{poll return}' 。

總結

本文詳細的講解了JVM中Safepoint的作用，希望大家能夠喜歡。

補充知識：JVM原始碼分析之安全點safepoint

上週有幸參加了一次關於JVM的小範圍分享會，聽完R大對虛擬機器C2編譯器的講解，我的膝蓋一直是腫的，能記住的實在有點少，能聽進去也不多

1、什麼時候進行C2編譯，如何進行C2編譯（這個實在太複雜）

2、C2編譯的時候，是對整個方法體進行編譯，而不是某個方法段

3、JVM中的safepoint

一直都知道，當發生GC時，正在執行Java code的執行緒必須全部停下來，才可以進行垃圾回收，這就是熟悉的STW（stop the world），但是STW的背後實現原理，比如這些執行緒如何暫停、又如何恢復？就比較疑惑了。

然而這一切的一切，都涉及到一個概念safepoint，openjdk的實現位於

openjdk/hotspot/src/share/vm/runtime/safepoint.cpp

什麼是safepoint

safepoint可以用在不同地方，比如GC、Deoptimization，在Hotspot VM中，GC safepoint比較常見，需要一個數據結構記錄每個執行緒的呼叫棧、暫存器等一些重要的資料區域裡什麼地方包含了GC管理的指標。

從執行緒角度看，safepoint可以理解成是在程式碼執行過程中的一些特殊位置，當執行緒執行到這些位置的時候，說明虛擬機器當前的狀態是安全的，如果有需要，可以在這個位置暫停，比如發生GC時，需要暫停暫停所以活動執行緒，但是執行緒在這個時刻，還沒有執行到一個安全點，所以該執行緒應該繼續執行，到達下一個安全點的時候暫停，等待GC結束。

什麼地方可以放safepoint

下面以Hotspot為例，簡單的說明一下什麼地方會放置safepoint

1、理論上，在直譯器的每條位元組碼的邊界都可以放一個safepoint，不過掛在safepoint的除錯符號資訊要佔用記憶體空間，如果每條機器碼後面都加safepoint的話，需要儲存大量的執行時資料，所以要儘量少放置safepoint，在safepoint會生成polling程式碼詢問VM是否要“進入safepoint”，polling操作也是有開銷的，polling操作會在後續解釋。

2、通過JIT編譯的程式碼裡，會在所有方法的返回之前，以及所有非counted loop的迴圈（無界迴圈）回跳之前放置一個safepoint，為了防止發生GC需要STW時，該執行緒一直不能暫停。另外，JIT編譯器在生成機器碼的同時會為每個safepoint生成一些“除錯符號資訊”，為GC生成的符號資訊是OopMap，指出棧上和暫存器裡哪裡有GC管理的指標。

執行緒如何被掛起

如果觸發GC動作，VM thread會在VMThread::loop()方法中呼叫SafepointSynchronize::begin()方法，最終使所有的執行緒都進入到safepoint。

// Roll all threads forward to a safepoint and suspend them all
void SafepointSynchronize::begin() {
 Thread* myThread = Thread::current();
 assert(myThread->is_VM_thread(),"Only VM thread may execute a safepoint");
 
 if (PrintSafepointStatistics || PrintSafepointStatisticsTimeout > 0) {
  _safepoint_begin_time = os::javaTimeNanos();
  _ts_of_current_safepoint = tty->time_stamp().seconds();
 }

在safepoint實現中，有這樣一段註釋，Java threads可以有多種不同的狀態，所以掛起的機制也不同，一共列舉了5中情況：

1、執行Java code

在執行位元組碼時會檢查safepoint狀態，因為在begin方法中會呼叫Interpreter::notice_safepoints()方法，通知直譯器更新dispatch table，實現如下：

void TemplateInterpreter::notice_safepoints() {
 if (!_notice_safepoints) {
  // switch to safepoint dispatch table
  _notice_safepoints = true;
  copy_table((address*)&_safept_table,(address*)&_active_table,sizeof(_active_table) / sizeof(address));
 }
}

2、執行native code

如果VM thread發現一個Java thread正在執行native code，並不會等待該Java thread阻塞，不過當該Java thread從native code返回時，必須檢查safepoint狀態，看是否需要進行阻塞。

這裡涉及到兩個狀態：Java thread state和safepoint state，兩者之間有著嚴格的讀寫順序，一般可以通過記憶體屏障實現，但是效能開銷比較大，Hotspot採用另一種方式，呼叫os::serialize_thread_states()把每個執行緒的狀態依次寫入到同一個記憶體頁中，實現如下：

// Serialize all thread state variables
void os::serialize_thread_states() {
 // On some platforms such as Solaris & Linux,the time duration of the page
 // permission restoration is observed to be much longer than expected due to
 // scheduler starvation problem etc. To avoid the long synchronization
 // time and expensive page trap spinning,'SerializePageLock' is used to block
 // the mutator thread if such case is encountered. See bug 6546278 for details.
 Thread::muxAcquire(&SerializePageLock,"serialize_thread_states");
 os::protect_memory((char *)os::get_memory_serialize_page(),os::vm_page_size(),MEM_PROT_READ);
 os::protect_memory((char *)os::get_memory_serialize_page(),MEM_PROT_RW);
 Thread::muxRelease(&SerializePageLock);
}

通過VM thread執行一系列mprotect os call，保證之前所有執行緒狀態的寫入可以被順序執行，效率更高。

3、執行complied code

如果想進入safepoint，則設定polling page不可讀，當Java thread發現該記憶體頁不可讀時，最終會被阻塞掛起。在SafepointSynchronize::begin()方法中，通過os::make_polling_page_unreadable()方法設定polling page為不可讀。

if (UseCompilerSafepoints && DeferPollingPageLoopCount < 0) {
  // Make polling safepoint aware
  guarantee (PageArmed == 0,"invariant") ;
  PageArmed = 1 ;
  os::make_polling_page_unreadable();
}

方法make_polling_page_unreadable()在不同系統的實現不一樣

linux下實現

// Mark the polling page as unreadable
void os::make_polling_page_unreadable(void) {
 if( !guard_memory((char*)_polling_page,Linux::page_size()) )
  fatal("Could not disable polling page");
};

solaris下實現

// Mark the polling page as unreadable
void os::make_polling_page_unreadable(void) {
 if( mprotect((char *)_polling_page,page_size,PROT_NONE) != 0 )
  fatal("Could not disable polling page");
};

在JIT編譯中，編譯器會把safepoint檢查的操作插入到機器碼指令中，比如下面的指令：

0x01b6d627: call 0x01b2b210 ; OopMap{[60]=Oop off=460}
;*invokeinterface size
; - Client1::main@113 (line 23)
; {virtual_call}
0x01b6d62c: nop ; OopMap{[60]=Oop off=461}
;*if_icmplt
; - Client1::main@118 (line 23)
0x01b6d62d: test %eax,0x160100 ; {poll}
0x01b6d633: mov 0x50(%esp),%esi
0x01b6d637: cmp %eax,%esi

test %eax,0x160100 就是一個檢查polling page是否可讀的操作，如果不可讀，則該執行緒會被掛起等待。

4、執行緒處於Block狀態

即使執行緒已經滿足了block condition，也要等到safepoint operation完成，如GC操作，才能返回。

5、執行緒正在轉換狀態

會去檢查safepoint狀態，如果需要阻塞，就把自己掛起。

最終實現

當執行緒訪問到被保護的記憶體地址時，會觸發一個SIGSEGV訊號，進而觸發JVM的signal handler來阻塞這個執行緒，The GC thread can protect some memory to which all threads in the process can write (using the mprotect system call) so they no longer can. Upon accessing this temporarily forbidden memory,a signal handler kicks in。

再看看底層是如何處理這個SIGSEGV訊號，實現位於

hotspot/src/os_cpu/linux_x86/vm/os_linux_x86.cpp
// Check to see if we caught the safepoint code in the
// process of write protecting the memory serialization page.
// It write enables the page immediately after protecting it
// so we can just return to retry the write.
if ((sig == SIGSEGV) &&
  os::is_memory_serialize_page(thread,(address) info->si_addr)) {
 // Block current thread until the memory serialize page permission restored.
 os::block_on_serialize_page_trap();
 return true;
}

執行os::block_on_serialize_page_trap()把當前執行緒阻塞掛起。

執行緒如何恢復

有了begin方法，自然有對應的end方法，在SafepointSynchronize::end()中，會最終喚醒所有掛起等待的執行緒，大概實現如下：

1、重新設定pooling page為可讀

if (PageArmed) {
  // Make polling safepoint aware
  os::make_polling_page_readable();
  PageArmed = 0 ;
 }

2、設定直譯器為ignore_safepoints，實現如下：

// switch from the dispatch table which notices safepoints back to the
// normal dispatch table. So that we can notice single stepping points,// keep the safepoint dispatch table if we are single stepping in JVMTI.
// Note that the should_post_single_step test is exactly as fast as the
// JvmtiExport::_enabled test and covers both cases.
void TemplateInterpreter::ignore_safepoints() {
 if (_notice_safepoints) {
  if (!JvmtiExport::should_post_single_step()) {
   // switch to normal dispatch table
   _notice_safepoints = false;
   copy_table((address*)&_normal_table,sizeof(_active_table) / sizeof(address));
  }
 }
}

3、喚醒所有掛起等待的執行緒

// Start suspended threads
  for(JavaThread *current = Threads::first(); current; current = current->next()) {
   // A problem occurring on Solaris is when attempting to restart threads
   // the first #cpus - 1 go well,but then the VMThread is preempted when we get
   // to the next one (since it has been running the longest). We then have
   // to wait for a cpu to become available before we can continue restarting
   // threads.
   // FIXME: This causes the performance of the VM to degrade when active and with
   // large numbers of threads. Apparently this is due to the synchronous nature
   // of suspending threads.
   //
   // TODO-FIXME: the comments above are vestigial and no longer apply.
   // Furthermore,using solaris' schedctl in this particular context confers no benefit
   if (VMThreadHintNoPreempt) {
    os::hint_no_preempt();
   }
   ThreadSafepointState* cur_state = current->safepoint_state();
   assert(cur_state->type() != ThreadSafepointState::_running,"Thread not suspended at safepoint");
   cur_state->restart();
   assert(cur_state->is_running(),"safepoint state has not been reset");
  }

對JVM效能有什麼影響

通過設定JVM引數 -XX:+PrintGCApplicationStoppedTime，可以打出系統停止的時間，大概如下：

Total time for which application threads were stopped: 0.0051000 seconds 
Total time for which application threads were stopped: 0.0041930 seconds 
Total time for which application threads were stopped: 0.0051210 seconds 
Total time for which application threads were stopped: 0.0050940 seconds 
Total time for which application threads were stopped: 0.0058720 seconds 
Total time for which application threads were stopped: 5.1298200 seconds
Total time for which application threads were stopped: 0.0197290 seconds 
Total time for which application threads were stopped: 0.0087590 seconds

從上面資料可以發現，有一次暫停時間特別長，達到了5秒多，這在線上環境肯定是無法忍受的，那麼是什麼原因導致的呢？

一個大概率的原因是當發生GC時，有執行緒遲遲進入不到safepoint進行阻塞，導致其他已經停止的執行緒也一直等待，VM Thread也在等待所有的Java執行緒掛起才能開始GC，這裡需要分析業務程式碼中是否存在有界的大迴圈邏輯，可能在JIT優化時，這些迴圈操作沒有插入safepoint檢查。

以上這篇JVM系列之:再談java中的safepoint說明就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

JVM系列之:再談java中的safepoint說明

JVM系列之:再談java中的safepoint

JVM系列之:再談java中的safepoint說明

JVM系列之:詳解java object物件在heap中的結構

JVM系列之:JIT中的Virtual Call

JVM系列之:JIT中的Virtual Call介面操作

JVM系列之:JIT中的Virtual Call介面

淺談Java中的JVM

淺談Java中的網路程式設計

淺談java中的反射

淺談Java中真的只有值傳遞麼

淺談Java 中的引用型別

淺談Java中是否直接可以使用enum進行傳輸

JVM系列之String.intern的效能解析

淺談java中BigDecimal類的簡單用法

深入理解JVM（③）再談執行緒安全

JVM系列之:String,陣列和集合類的記憶體佔用大小

淺談java中位元組與字元的區別

JVM系列之:Contend註解和false-sharing

JVM系列之:String.intern和stringTable

WPF之再談MVVM

JVM系列之:再談java中的safepoint說明

相關推薦