1. 程式人生 > 其它 >JDK成長記15:從0分析你不知道的synchronized底層原理(上)

JDK成長記15:從0分析你不知道的synchronized底層原理(上)

前幾節你應該已經瞭解和掌握了Thread、ThreadLocal、Volatile這幾個併發基礎知識的底層原理。這一節,你可以跟我一起深入瞭解下synchronized關鍵字的底層原理和其涉及的基礎知識。看完這篇成長記,你可以獲取到如下幾點:

synchronized預備知識:

  • 理解什麼是CAS?
  • synchronized會形成幾種鎖的型別
  • HotspotJVM虛擬機器Java物件記憶體中的佈局結構是什麼,markword是鎖的關鍵欄位?
  • 作業系統中使用者態和核心態的資源操作和程序是什麼意思?

synchronized核心流程及原理:

  • 從3個層面初步分析sychronized的核心流程和原理

好了,讓我們一起開始吧!

HelloSychronized

HelloSychronized

我們來寫一個多執行緒i++的程式,體驗一下,多執行緒如果是併發的修改一個數據,會有什麼樣的執行緒併發安全問題。

剛才說過了,volatile,解決的對一個共享資料,有人寫,有人讀,多個執行緒併發讀和寫的可見性的問題,而多個執行緒對一個共享資料併發的寫,可能會導致資料出錯,產生原子性的問題。

volatile為什麼不能保證原子性? 從JMM記憶體模型就可以看出來,多個執行緒同時修改一個變數,都是在自己本地記憶體中修改,volatile只是保證一個執行緒修改,另一個執行緒讀的時候,發起修改的執行緒是強制重新整理資料主存,過期其他執行緒的工作記憶體的快取,沒法做到多個執行緒在本地記憶體同時寫的時候,限制只能有一個執行緒修改,因為執行緒自己修改自己記憶體的資料沒有發生競爭關係。而且之後會給各自寫入主記憶體,當然就保證不了只能有一個執行緒修改主記憶體的資料,做不到原子性了。

為了解決這個問題,可以使用syncrhonized給修改這個操作加一把鎖,一旦說某個執行緒加了一把鎖之後,就會保證,其他的執行緒沒法去讀取和修改這個變數的值了,同一時間,只有一個執行緒可以讀這個資料以及修改這個資料,別的執行緒都會卡在嘗試獲取鎖那兒。這樣也就不會出現併發同時修改,資料出錯,原子性問題了。

synchronized鎖一般有兩類,一種是對某個例項物件來加鎖,另外一種是對這個類進行加鎖。相信大家很熟悉了,這裡用一個Hello synchronized的小例子,舉一個簡單物件加鎖的例子。

程式碼如下:

  public class HelloSynchronized {
    public static void main(String[] args) {
      Object o = new Object();
      synchronized (o){
      }
    }
  }

對類加鎖和對例項物件的更多例子這裡就不舉例了,我們更多的是研究synchronized它的底層原理。基本的使用相信你一定可以自己學習到。

在分析sychronized原理期間,需要不斷的補充一些基礎知識。

學習sychronized先決條件(Prerequisites)

學習sychronized先決條件(Prerequisites)

  • sychronized鎖的概念

在JDK 早期 sychronized 使用的時候,直接建立的重量級鎖,效能很不好。

在之後JDK新的版本中,sychronized優化了鎖,分為了4種,無鎖態、偏向鎖、自旋鎖(輕量鎖)、重量鎖,會根據情況自動升級鎖。

這四種鎖分別表示什麼意思呢?

無鎖態表示第一次對剛建立的物件或者類加鎖時的狀態。我發現只有一個執行緒在操作程式碼塊的資源,壓根不需要加鎖。此時會處於無鎖態。

偏向鎖,類似於貼標籤,表示這個資源暫時屬於某個執行緒,偏向它所有了。打個比方,就好比一個座位只能做一個人,你坐下後,在座位上貼上了你自己的標籤。別人發現已經有標籤了,肯定就不會在坐了。

輕量鎖(自旋鎖):輕量鎖,底層是CAS自旋的操作,所以也叫自旋鎖。這裡簡單普及下自旋CAS的操作流程,之後將Aotmic類的時候會仔細講下。CAS自旋流程如下:

最後我們來聊下什麼是重量級鎖?這又要牽扯另一個知識了。在Linux作業系統層面,由於需要限制不同的程式之間的訪問能力, 防止他們獲取別的程式的記憶體資料, 或者獲取外圍裝置的資料, 併發送到網路, CPU劃分出兩個許可權等級使用者態和核心態。用於表示程序執行時所處狀態。

你可以簡單理解,一個程式啟動後會有對應的程序,它們操作的資源分為兩種,屬於使用者態的資源或者核心態的資源。

使用者態是不能直接操作核心態中資源的,只能通知核心態來操作。這個在硬體級別也有對應的指令級別(比如Intel ring0-ring3級別的指令,ring0級別一般對應的就是使用者態程序可以操作的指令,ring3對應的是核心態程序可以發起的指令)。

如下圖所示:

這個和synchronized有什麼關係呢?因為synchronized加重量級鎖的操作,是對硬體資源的鎖指令操作,所以肯定是需要處於核心態的程序才可以操作,JVM的程序只是處於使用者態的程序,所以需要向作業系統申請,這個過程肯定會很消耗資源的。

比如,synchronized的本質是JVM使用者空間的一個程序(處於使用者態)向作業系統(核心態)發起一個lock的鎖指令操作 。

C++程式碼如下:

  //Adding a lock prefix to an instruction on MP machine
  \#define LOCK_IF_MP(mp) "cmp $0, " #mp "; je 1f; local; 1 : "

如下圖右邊所示:

  • sychronized鎖狀態的記錄

瞭解了sychronized的鎖的幾種型別後,怎麼標識是什麼樣的synchronized鎖呢?這個就要聊到Java的物件在JVM的記憶體中的結構了。不同虛擬機器結構略有差別,這裡講一下HotSpot虛擬機器中的物件結構:

synchronized鎖狀態的資訊就記錄在markword中。markword在64位的作業系統上,8位元組,64位大小的空間的區域。

不同的鎖的標記在如下圖所示:

這個表你不用背下來,你只要知道,synchronized的輕量鎖和重量鎖通過2位即可以區分出來,偏向鎖和無鎖需要3位。

有了上面的基礎知識後,就可以開始研究synchronized的底層原理了。

位元組碼層面的synchronized

synchronized

sychronized在Java程式碼層面就如上面Hello Synconized那個最簡單的例子所示,我們來看下它的位元組碼層面是什麼樣子的?

上面main方法的位元組碼如下:

0 new #2 <java/lang/Object>
 3 dup
 4 invokespecial #1 <java/lang/Object.<init>>
 7 astore_1
 8 aload_1
 9 dup
 10 astore_2
 11 monitorenter
 12 aload_2
 13 monitorexit
 14 goto 22 (+8)
 17 astore_3
 18 aload_2
 19 monitorexit
 20 aload_3
 21 athrow
 22 return

new、dup、invokespecial、 astore_1這些指令是學習volatile的時候你應該很熟悉了。我這裡需要關注的是另外 2個核心的JVM指令:monitorenter、monitorexit

這個表示sychronized加鎖的同步程式碼塊的進入和退出。為什麼有兩個monitorexit呢?一個是正常退出,一個丟擲異常也會退出釋放鎖。

JVM層面的synchronized

JVM層面的synchronized

那麼,當 JVM的HotSpot實現中,當遇到這兩個JVM指令,又是如何執行的呢?讓我們來看一下。

在JVM HotSpot的C++程式碼實際執行過程中,執行了一個InterpreterRuntime:: monitorenter方法,程式碼如下:

  IRT_ENTRY_NO_ASYNC(void, InterpreterRuntime::monitorenter(JavaThread* thread, BasicObjectLock* elem))

  \#ifdef ASSERT
   thread->last_frame().interpreter_frame_verify_monitor(elem);
  \#endif

   if (PrintBiasedLockingStatistics) {
    Atomic::inc(BiasedLocking::slow_path_entry_count_addr());
   }

   Handle h_obj(thread, elem->obj());

  assert(Universe::heap()->is_in_reserved_or_null(h_obj()),
       "must be NULL or an object");
   if (UseBiasedLocking) {
    // Retry fast entry if bias is revoked to avoid unnecessary inflation
    ObjectSynchronizer::fast_enter(h_obj, elem->lock(), true, CHECK);
   } else {
    ObjectSynchronizer::slow_enter(h_obj, elem->lock(), CHECK);
   }

   assert(Universe::heap()->is_in_reserved_or_null(elem->obj()),

       "must be NULL or an object");

  \#ifdef ASSERT

   thread->last_frame().interpreter_frame_verify_monitor(elem);

  \#endif

  IRT_END

你可以看下上面的方法的脈絡(不懂C++也沒有關係,懂if-else就行)。它的核心有兩個if。

第一個if根據變數名字PrintBiasedLockingStatistics可以判斷出應該是列印偏向鎖的統計資訊,明顯不是最重要的。

第二個if同理,UseBiasedLocking表示了是否使用了偏向鎖,如果是呼叫了ObjectSynchronizer::fast_enter否則

ObjectSynchronizer::slow_enter。

很明顯,第二個if中是synchronized加鎖的核心程式碼。我們還需要繼續看下它們的脈絡。

程式碼如下:synchronizer.cpp

void ObjectSynchronizer::fast_enter(Handle obj, BasicLock* lock, bool attempt_rebias, TRAPS) {

    if (UseBiasedLocking) {
      if (!SafepointSynchronize::is_at_safepoint()) {
       BiasedLocking::Condition cond = BiasedLocking::revoke_and_rebias(obj, attempt_rebias, THREAD);

       if (cond == BiasedLocking::BIAS_REVOKED_AND_REBIASED) {
        return;
       }

      } else {
       assert(!attempt_rebias, "can not rebias toward VM thread");
       BiasedLocking::revoke_at_safepoint(obj);
      }
      assert(!obj->mark()->has_bias_pattern(), "biases should be revoked by now");
    }
  
    slow_enter (obj, lock, THREAD) ;

    }

可以看到fast_enter方法,核心脈絡除了取消偏向和重新偏向的邏輯(從變數明和註釋可以看出來,這裡暫時不重要,先忽略),最後核心脈絡還是呼叫了slow_enter方法。讓我們來看下:

void ObjectSynchronizer::slow_enter(Handle obj, BasicLock* lock, TRAPS) {

   markOop mark = obj->mark();
   assert(!mark->has_bias_pattern(), "should not see bias pattern here"); 

   if (mark->is_neutral()) {
    // Anticipate successful CAS -- the ST of the displaced mark must
    // be visible <= the ST performed by the CAS.
    lock->set_displaced_header(mark);
    if (mark == (markOop) Atomic::cmpxchg_ptr(lock, obj()->mark_addr(), mark)) {
     TEVENT (slow_enter: release stacklock) ;
     return ;
    }
    // Fall through to inflate() ...
   } else

   if (mark->has_locker() && THREAD->is_lock_owned((address)mark->locker())) {
    assert(lock != mark->locker(), "must not re-lock the same lock");
    assert(lock != (BasicLock*)obj->mark(), "don't relock with same BasicLock");
    lock->set_displaced_header(NULL);
    return;
   }


  \#if 0
   // The following optimization isn't particularly useful.
  if (mark->has_monitor() && mark->monitor()->is_entered(THREAD)) {
    lock->set_displaced_header (NULL) ;
    return ;
   }
  \#endif   

   // The object header will never be displaced to this lock,
   // so it does not matter what the value is, except that it
   // must be non-zero to avoid looking like a re-entrant lock,
   // and must not look locked either.
   lock->set_displaced_header(markOopDesc::unused_mark());
   ObjectSynchronizer::inflate(THREAD, obj())->enter(THREAD);

  }

上面這一段是sychronized加鎖,核心中的核心,可以發現很多有意思的地方:

1) 從註釋可以看出,鎖會有膨脹過程,物件頭會記錄鎖的相關資訊。

2) Atomic::cmpxchg_ptr體現了ompare and exchange (CAS)操作,是輕量級鎖。

3) mark->has_locker() && THREAD->is_lock_owned((address)mark->locker()體現了synchronized是可重入鎖

4) 最後的ObjectSynchronizer::inflate意思為膨脹為重量級鎖。

C++的程式碼有很多細節和知識,你開始學習的時候不要想著全部搞清楚,一定要有之前學到的思想,先脈絡後細節。搞清楚脈絡再說研究細節的部分。

所以,通過初步看過synchronized的HotSpot C++程式碼實現,重點的脈絡就是鎖升級的過程和原理,接下來重點分析一下這個過程。

synchronized鎖升級的過程

synchronized鎖升級的過程

前面通過從位元組碼層面到JVM層面初步瞭解了synchronized的實現,結合之前說的sychronized的鎖的幾種型別。最終可以分析出來synchronized鎖會有一個升級的過程。過程如下圖所示:

這個圖非常重要,大家一定要牢記住。下一節會花費整整一節來講在這個圖。

本文由部落格群發一文多發等運營工具平臺 OpenWrite 釋出