1. 程式人生 > >為什麼要使用執行緒池;常見的建立執行緒池的4種方式

為什麼要使用執行緒池;常見的建立執行緒池的4種方式

1. 為什麼使用執行緒池

諸如 Web 伺服器、資料庫伺服器、檔案伺服器或郵件伺服器之類的許多伺服器應用程式都面向處理來自某些遠端來源的大量短小的任務。請求以某種方式到達伺服器,這種方式可能是通過網路協議(例如 HTTPFTP 或 POP)、通過 JMS 佇列或者可能通過輪詢資料庫。不管請求如何到達,伺服器應用程式中經常出現的情況是:單個任務處理的時間很短而請求的數目卻是巨大的。

構建伺服器應用程式的一個簡單模型是:每當一個請求到達就建立一個新執行緒,然後在新執行緒中為請求服務。實際上對於原型開發這種方法工作得很好,但如果試圖部署以這種方式執行的伺服器應用程式,那麼這種方法的嚴重不足就很明顯。每個請求對應一個執行緒(

thread-per-request)方法的不足之一是:為每個請求建立一個新執行緒的開銷很大;為每個請求建立新執行緒的伺服器在建立和銷燬執行緒上花費的時間和消耗的系統資源要比花在處理實際的使用者請求的時間和資源更多。

除了建立和銷燬執行緒的開銷之外,活動的執行緒也消耗系統資源。在一個 JVM 裡建立太多的執行緒可能會導致系統由於過度消耗記憶體而用完記憶體或切換過度。為了防止資源不足,伺服器應用程式需要一些辦法來限制任何給定時刻處理的請求數目。

執行緒池為執行緒生命週期開銷問題和資源不足問題提供瞭解決方案。通過對多個任務重用執行緒,執行緒建立的開銷被分攤到了多個任務上。其好處是,因為在請求到達時執行緒已經存在,所以無意中也消除了執行緒建立所帶來的延遲。這樣,就可以立即為請求服務,使應用程式響應更快。而且,通過適

當地調整執行緒池中的執行緒數目,也就是當請求的數目超過某個閾值時,就強制其它任何新到的請求一直等待,直到獲得一個執行緒來處理為止,從而可以防止資源不足。

2. 使用執行緒池的風險

雖然執行緒池是構建多執行緒應用程式的強大機制,但使用它並不是沒有風險的。用執行緒池構建的應用程式容易遭受任何其它多執行緒應用程式容易遭受的所有併發風險,諸如同步錯誤和死鎖,它還容易遭受特定於執行緒池的少數其它風險,諸如與池有關的死鎖、資源不足和執行緒洩漏。

2.1 死鎖

任何多執行緒應用程式都有死鎖風險。當一組程序或執行緒中的每一個都在等待一個只有該組中另一個程序才能引起的事件時,我們就說這組程序或執行緒 死鎖了。死鎖的最簡單情形是:執行緒 

持有物件 的獨佔鎖,並且在等待物件 的鎖,而執行緒 持有物件 的獨佔鎖,卻在等待物件 的鎖。除非有某種方法來打破對鎖的等待(Java 鎖定不支援這種方法),否則死鎖的執行緒將永遠等下去。

雖然任何多執行緒程式中都有死鎖的風險,但執行緒池卻引入了另一種死鎖可能,在那種情況下,所有池執行緒都在執行已阻塞的等待佇列中另一任務的執行結果的任務,但這一任務卻因為沒有未被佔用的執行緒而不能執行。當執行緒池被用來實現涉及許多互動物件的模擬,被模擬的物件可以相互發送查詢,這些查詢接下來作為排隊的任務執行,查詢物件又同步等待著響應時,會發生這種情況。

2.2 資源不足

執行緒池的一個優點在於:相對於其它替代排程機制(有些我們已經討論過)而言,它們通常執行得很好。但只有恰當地調整了執行緒池大小時才是這樣的。執行緒消耗包括記憶體和其它系統資源在內的大量資源。除了 Thread 物件所需的記憶體之外,每個執行緒都需要兩個可能很大的執行呼叫堆疊。除此以外,JVM 可能會為每個 Java 執行緒建立一個本機執行緒,這些本機執行緒將消耗額外的系統資源。最後,雖然執行緒之間切換的排程開銷很小,但如果有很多執行緒,環境切換也可能嚴重地影響程式的效能。

如果執行緒池太大,那麼被那些執行緒消耗的資源可能嚴重地影響系統性能。線上程之間進行切換將會浪費時間,而且使用超出比您實際需要的執行緒可能會引起資源匱乏問題,因為池執行緒正在消耗一些資源,而這些資源可能會被其它任務更有效地利用。除了執行緒自身所使用的資源以外,服務請求時所做的工作可能需要其它資源,例如 JDBC 連線、套接字或檔案。這些也都是有限資源,有太多的併發請求也可能引起失效,例如不能分配 JDBC 連線。

2.3 併發錯誤

執行緒池和其它排隊機制依靠使用 wait()  notify() 方法,這兩個方法都難於使用。如果編碼不正確,那麼可能丟失通知,導致執行緒保持空閒狀態,儘管佇列中有工作要處理。使用這些方法時,必須格外小心。而最好使用現有的、已經知道能工作的實現,例如 util.concurrent 包。

2.4 執行緒洩漏

各種型別的執行緒池中一個嚴重的風險是執行緒洩漏,當從池中除去一個執行緒以執行一項任務,而在任務完成後該執行緒卻沒有返回池時,會發生這種情況。發生執行緒洩漏的一種情形出現在任務丟擲一個 RuntimeException 或一個 Error 時。如果池類沒有捕捉到它們,那麼執行緒只會退出而執行緒池的大小將會永久減少一個。當這種情況發生的次數足夠多時,執行緒池最終就為空,而且系統將停止,因為沒有可用的執行緒來處理任務。

有些任務可能會永遠等待某些資源或來自使用者的輸入,而這些資源又不能保證變得可用,使用者可能也已經回家了,諸如此類的任務會永久停止,而這些停止的任務也會引起和執行緒洩漏同樣的問題。如果某個執行緒被這樣一個任務永久地消耗著,那麼它實際上就被從池除去了。對於這樣的任務,應該要麼只給予它們自己的執行緒,要麼只讓它們等待有限的時間。

2.5 請求過載

僅僅是請求就壓垮了伺服器,這種情況是可能的。在這種情形下,我們可能不想將每個到來的請求都排隊到我們的工作佇列,因為排在佇列中等待執行的任務可能會消耗太多的系統資源並引起資源缺乏。在這種情形下決定如何做取決於您自己;在某些情況下,您可以簡單地拋棄請求,依靠更高級別的協議稍後重試請求,您也可以用一個指出伺服器暫時很忙的響應來拒絕請求。

3. 有效使用執行緒池的準則

只要您遵循幾條簡單的準則,執行緒池可以成為構建伺服器應用程式的極其有效的方法:

不要對那些同步等待其它任務結果的任務排隊。這可能會導致上面所描述的那種形式的死鎖,在那種死鎖中,所有執行緒都被一些任務所佔用,這些任務依次等待排隊任務的結果,而這些任務又無法執行,因為所有的執行緒都很忙。

在為時間可能很長的操作使用合用的執行緒時要小心。如果程式必須等待諸如 I/O 完成這樣的某個資源,那麼請指定最長的等待時間,以及隨後是失效還是將任務重新排隊以便稍後執行。這樣做保證了:通過將某個執行緒釋放給某個可能成功完成的任務,從而將最終取得某些進展。

理解任務。要有效地調整執行緒池大小,您需要理解正在排隊的任務以及它們正在做什麼。它們是 CPU 限制的(CPU-bound)嗎?它們是 I/O 限制的(I/O-bound)嗎?您的答案將影響您如何調整應用程式。如果您有不同的任務類,這些類有著截然不同的特徵,那麼為不同任務類設定多個工作佇列可能會有意義,這樣可以相應地調整每個池。

4. 執行緒池的大小設定

調整執行緒池的大小基本上就是避免兩類錯誤:執行緒太少或執行緒太多。幸運的是,對於大多數應用程式來說,太多和太少之間的餘地相當寬。

請回憶:在應用程式中使用執行緒有兩個主要優點,儘管在等待諸如 I/O 的慢操作,但允許繼續進行處理,並且可以利用多處理器。在運行於具有 個處理器機器上的計算限制的應用程式中,線上程數目接近 時新增額外的執行緒可能會改善總處理能力,而線上程數目超過 時新增額外的執行緒將不起作用。事實上,太多的執行緒甚至會降低效能,因為它會導致額外的環境切換開銷。

執行緒池的最佳大小取決於可用處理器的數目以及工作佇列中的任務的性質。若在一個具有 N 個處理器的系統上只有一個工作佇列,其中全部是計算性質的任務,線上程池具有 或 N+1 個執行緒時一般會獲得最大的 CPU 利用率。

對於那些可能需要等待 I/O 完成的任務(例如,從套接字讀取 HTTP 請求的任務),需要讓池的大小超過可用處理器的數目,因為並不是所有執行緒都一直在工作。通過使用概要分析,您可以估計某個典型請求的等待時間(WT)與服務時間(ST)之間的比例。如果我們將這一比例稱之為 WT/ST,那麼對於一個具有 個處理器的系統,需要設定大約 N*(1+WT/ST) 個執行緒來保持處理器得到充分利用。

處理器利用率不是調整執行緒池大小過程中的唯一考慮事項。隨著執行緒池的增長,您可能會碰到排程程式、可用記憶體方面的限制,或者其它系統資源方面的限制,例如套接字、開啟的檔案控制代碼或資料庫連線等的數目。

5. 常用的幾種執行緒池

5.1 newCachedThreadPool

建立一個可快取執行緒池,如果執行緒池長度超過處理需要,可靈活回收空閒執行緒,若無可回收,則新建執行緒。

這種型別的執行緒池特點是:

  • 工作執行緒的建立數量幾乎沒有限制(其實也有限制的,數目為Interger. MAX_VALUE), 這樣可靈活的往執行緒池中新增執行緒。
  • 如果長時間沒有往執行緒池中提交任務,即如果工作執行緒空閒了指定的時間(預設為1分鐘),則該工作執行緒將自動終止。終止後,如果你又提交了新的任務,則執行緒池重新建立一個工作執行緒。
  • 在使用CachedThreadPool時,一定要注意控制任務的數量,否則,由於大量執行緒同時執行,很有會造成系統癱瘓。

示例程式碼如下:

複製程式碼
 1 package test;
 2 import java.util.concurrent.ExecutorService;
 3 import java.util.concurrent.Executors;
 4 public class ThreadPoolExecutorTest {
 5  public static void main(String[] args) {
 6   ExecutorService cachedThreadPool = Executors.newCachedThreadPool();
 7   for (int i = 0; i < 10; i++) {
 8    final int index = i;
 9    try {
10     Thread.sleep(index * 1000);
11    } catch (InterruptedException e) {
12     e.printStackTrace();
13    }
14    cachedThreadPool.execute(new Runnable() {
15     public void run() {
16      System.out.println(index);
17     }
18    });
19   }
20  }
21 }
複製程式碼

5.2 newFixedThreadPool

建立一個指定工作執行緒數量的執行緒池。每當提交一個任務就建立一個工作執行緒,如果工作執行緒數量達到執行緒池初始的最大數,則將提交的任務存入到池佇列中。

FixedThreadPool是一個典型且優秀的執行緒池,它具有執行緒池提高程式效率和節省建立執行緒時所耗的開銷的優點。但是,線上程池空閒時,即執行緒池中沒有可執行任務時,它不會釋放工作執行緒,還會佔用一定的系統資源。

示例程式碼如下:

複製程式碼
package test;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
public class ThreadPoolExecutorTest {
 public static void main(String[] args) {
  ExecutorService fixedThreadPool = Executors.newFixedThreadPool(3);
  for (int i = 0; i < 10; i++) {
   final int index = i;
   fixedThreadPool.execute(new Runnable() {
    public void run() {
     try {
      System.out.println(index);
      Thread.sleep(2000);
     } catch (InterruptedException e) {
      e.printStackTrace();
     }
    }
   });
  }
 }
}
複製程式碼

因為執行緒池大小為3,每個任務輸出indexsleep 2秒,所以每兩秒列印3個數字。
定長執行緒池的大小最好根據系統資源進行設定如Runtime.getRuntime().availableProcessors()。

5.3 newSingleThreadExecutor

建立一個單執行緒化的Executor,即只建立唯一的工作者執行緒來執行任務,它只會用唯一的工作執行緒來執行任務,保證所有任務按照指定順序(FIFO, LIFO,優先順序)執行。如果這個執行緒異常結束,會有另一個取代它,保證順序執行。單工作執行緒最大的特點是可保證順序地執行各個任務,並且在任意給定的時間不會有多個執行緒是活動的

示例程式碼如下:

複製程式碼
package test;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
public class ThreadPoolExecutorTest {
 public static void main(String[] args) {
  ExecutorService singleThreadExecutor = Executors.newSingleThreadExecutor();
  for (int i = 0; i < 10; i++) {
   final int index = i;
   singleThreadExecutor.execute(new Runnable() {
    public void run() {
     try {
      System.out.println(index);
      Thread.sleep(2000);
     } catch (InterruptedException e) {
      e.printStackTrace();
     }
    }
   });
  }
 }
} 
複製程式碼

5.4 newScheduleThreadPool

建立一個定長的執行緒池,而且支援定時的以及週期性的任務執行支援定時及週期性任務執行。

延遲3秒執行延遲執行示例程式碼如下:

複製程式碼
package test;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;
public class ThreadPoolExecutorTest {
 public static void main(String[] args) {
  ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(5);
  scheduledThreadPool.schedule(new Runnable() {
   public void run() {
    System.out.println("delay 3 seconds");
   }
  }, 3, TimeUnit.SECONDS);
 }
}
複製程式碼

表示延遲1秒後每3秒執行一次定期執行示例程式碼如下:

複製程式碼
package test;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;
public class ThreadPoolExecutorTest {
 public static void main(String[] args) {
  ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(5);
  scheduledThreadPool.scheduleAtFixedRate(new Runnable() {
   public void run() {
    System.out.println("delay 1 seconds, and excute every 3 seconds");
   }
  }, 1, 3, TimeUnit.SECONDS);
 }
}