1. 程式人生 > >Java之執行緒實現原理

Java之執行緒實現原理

 併發不一定依賴多執行緒(如PHP中很常見的多程序併發),但在Java裡談併發,大多數都與執行緒脫不了關係。執行緒是一種比程序更輕量級的排程執行單位,執行緒的引入,可以把一個程序的資源分配和排程執行分開,各個執行緒既可以共享程序資源(記憶體地址、檔案I/O等),又可以獨立排程(執行緒是CPU排程的基本單位)。

1、執行緒的實現

 Java提供了在不同硬體和作業系統平臺下對執行緒操作的統一處理,每個已經執行start且還未結束的java.lang.Thread類的例項就代表了一個執行緒。Thread類與大部分的Java API有顯著的差別,它的所有關鍵方法都是宣告為Native的。在Java API中,一個native方法往往意味著這個方法沒有使用或無法使用平臺無關的手段來實現(當然也可以是為了執行效率而使用Native方法,不過,通常最高效率的手段也是平臺相關的手段)。

1.1、使用核心執行緒實現

 核心執行緒就是直接使用作業系統核心(下稱核心)支援的執行緒,這種執行緒由核心來完成執行緒切換,核心通過操縱排程器對執行緒進行排程,並負責將執行緒的任務對映到各個處理器上。每個核心執行緒可視為核心的一個分身,這樣操縱系統就有能力處理多件事情,支援多執行緒的核心就叫做多執行緒核心。
 程式一般不會直接去使用核心執行緒,而是去使用核心執行緒的一種高階介面——輕量級程序,輕量級程序就是我們通常意義上所講的執行緒,由於每個輕量級程序都由一個核心執行緒支援,因此只有先支援核心執行緒,才能有輕量級程序。這種輕量級程序與核心執行緒之間1:1的關係稱為一對一的執行緒模型。

 由於核心執行緒的支援,每個輕量級程序都成為了一個獨立的排程單元,即使有一個輕量級程序在系統呼叫中阻塞了,也不會影響整個程序繼續工作,但是輕量級程序具有它的侷限性:首先,由於是基於核心執行緒實現的,所以各種執行緒操作,如建立、析構及同步,都需要進行系統呼叫。而系統呼叫代價相對較高,需要在使用者態和核心態中來回切換。其次每個輕量級程序都需要一個核心執行緒的支援,因此輕量級程序要消耗一定的核心資源(如核心的棧空間),因此一個系統支援輕量級程序的數量是有限的。

1.2、使用使用者執行緒實現

 從廣義上講,一個執行緒只要不是核心執行緒,就可以認為是使用者執行緒,因此,從這個定義上來講,輕量級程序也屬於使用者執行緒,但輕量級程序的實現始終是建立在核心之上的,許多操作都要進行系統呼叫,效率會受到限制。
 而狹義上的使用者執行緒指的是完全建立在使用者空間的執行緒庫上,系統核心不能感知執行緒存在的實現。使用者執行緒的建立、同步和排程完全在使用者狀態中完成,不需要核心的幫助。如果程式實現得當,這種執行緒不需要切換到核心狀態,因此作業系統可以非常快速且抵消耗的,也可以支援規模更大的執行緒數量。這種程序與使用者執行緒之間1:N的關係被稱為一對多的執行緒模型。

 使用使用者執行緒的優勢在於不需要系統核心支援,劣勢也在於沒有系統核心的支援,所有的執行緒操作都需要使用者程式自己處理。執行緒的建立、切換和排程都是需要考慮的問題,而且由於作業系統只把處理器資源分配到程序,那諸如“阻塞如何處理”、“多處理器系統中如何將執行緒對映到其他處理器上”這類問題解決起來將會異常困難,甚至不可能完成。因而使用使用者執行緒實現的程式一般都比較複雜。除了以前在不支援多執行緒的作業系統中的多執行緒程式與少數有特殊需求的程式中,現在使用使用者執行緒的程式越來越少了。

1.3、使用使用者執行緒加輕量級程序混合實現

 執行緒除了依賴核心執行緒實現和完全由使用者程式自己實現以外,還有一種將核心執行緒與使用者執行緒一起使用的實現方式。在這種混合實現下,既存在使用者執行緒,也存在輕量級程序。使用者執行緒還是完全建立在使用者空間中,因此使用者執行緒的建立、切換、析構等操作依然廉價,並且可以支援大規模的使用者執行緒併發。而作業系統提供支援的輕量級程序則作為使用者執行緒和核心執行緒之間的橋樑,這樣可以使用核心提供的執行緒排程功能及處理器對映,並且使用者執行緒的系統呼叫要通過輕量級程序來完成,大大降低了整個程序被完全阻塞的風險。在這種混合模式中,使用者執行緒與輕量級程序的數量比是不定的,即為N:M的關係。

1.4、Java執行緒的實現

 Java執行緒在JDK1.2之前是基於稱為“綠色執行緒”的使用者執行緒實現的,而在JDK1.2中,執行緒模型替換為基於作業系統原生執行緒模型來實現。因此,在目前的JDK版本中,作業系統的支援怎樣的執行緒模型,在很大程度上決定Java虛擬機器的執行緒是怎樣對映的,這點在不同的平臺上沒辦法達成一致,虛擬機器規範中也並未限定Java執行緒需要使用哪種執行緒模型來實現。執行緒模型只對執行緒的併發規模和操作成本產生影響,對Java程式的編碼和執行過程來說,這些差異都是透明的。
 對於Sun JDK來說,它的Window版和Linux版都是使用一對一執行緒模型實現的,一條Java執行緒就對映到一條輕量級程序之中,因為Window和Linux系統提供的執行緒模型就是一對一的。

2、Java執行緒排程

 執行緒排程是指系統為執行緒分配處理器使用權的過程,主要排程方式有兩種,分別是協同式執行緒排程和搶佔式執行緒排程。

  • 使用協同式排程的多執行緒系統,執行緒的執行時間由執行緒本身控制,執行緒把自己工作執行完畢後,要主動通知系統切換到另外一個執行緒上。協同式多執行緒的最大好處是實現簡單,而且由於執行緒要把自己的事情幹完後才會進行執行緒切換,切換操作對執行緒自己是可知的,所以沒什麼執行緒同步問題。
  • 如果使用搶佔式排程的多執行緒系統,那麼每個執行緒將由系統來分配執行時間,執行緒的切換不由執行緒本身來決定(在Java中,Thread.yield()可以讓出執行時間,但是要獲取執行時間的話,執行緒本身是沒有什麼辦法的)。在這種實現執行緒排程的方式下,執行緒的執行時間是系統可控的,也不會有一個執行緒導致整個程序阻塞的問題,Java使用的執行緒排程方式就是搶佔式排程。

3、執行緒的狀態切換

 Java定義了5種執行緒狀態,在任意一個時間點,一個執行緒只能有且只有其中的一種狀態,這5中狀態分別如下。

  • 新建(New):建立後尚未啟動的執行緒處於這種狀態

  • 執行(Runable):Runable包括了作業系統執行緒狀態中的Running和Ready,也就是處於此狀態的執行緒有可能正在執行,也有可能正在等待著CPU為它分配執行時間

  • 無限期等待(Waiting):處於這種狀態的執行緒不會被分配CPU執行時間,它們要等待被其他執行緒顯示地喚醒。以下方法會讓執行緒陷入無限期的等待狀態。

    • 沒有設定Timeout引數的Object.wait()方法
    • 沒有設定Timeout引數的Thread.join()方法
    • LockSupport.part()方法
  • 限期等待(Timed Waiting):處於這種狀態的執行緒也不會被分配CPU執行時間,不過無須等待其他執行緒顯示地喚醒,在一定時間之後它們會由系統自動喚醒。以下方法會讓執行緒進入限期等待狀態:

    • Thread.sleep()方法。
    • 設定了Timeout引數的Object.wait()方法
    • 設定了Timeout引數的Object.join()方法
    • LockSupport.partNanos()方法
    • LockSupport.parkUntil()方法
  • 阻塞(Blocked):執行緒被阻塞了,“阻塞狀態”與“等待狀態”的區別是:“阻塞狀態”在等待著獲取到一個排他鎖,這個事件將在另外一個執行緒放棄這個鎖的時候發生;而“等待狀態”則是等待一段時間,或者喚醒動作的發生。在程式等待進入同步區域的時候,執行緒將進入這種狀態。

  • 結束(Terminated):已終止執行緒的執行緒狀態,執行緒已經結束執行。

 上面五種狀態在遇到特定事件發生的時候將會相互轉換,轉換關係如圖。