Java 執行緒池詳解
構造一個執行緒池為什麼需要幾個引數?如果避免執行緒池出現OOM?Runnable
和Callable
的區別是什麼?本文將對這些問題一一解答,同時還將給出使用執行緒池的常見場景和程式碼片段。
基礎知識
Executors建立執行緒池
Java中建立執行緒池很簡單,只需要呼叫Executors
中相應的便捷方法即可,比如Executors.newFixedThreadPool(int nThreads)
,但是便捷不僅隱藏了複雜性,也為我們埋下了潛在的隱患(OOM,執行緒耗盡)。
Executors
建立執行緒池便捷方法列表:
方法名 | 功能 |
---|---|
newFixedThreadPool(int nThreads) | 建立固定大小的執行緒池 |
newSingleThreadExecutor() | 建立只有一個執行緒的執行緒池 |
newCachedThreadPool() | 建立一個不限執行緒數上限的執行緒池,任何提交的任務都將立即執行 |
小程式使用這些快捷方法沒什麼問題,對於服務端需要長期執行的程式,建立執行緒池應該直接使用ThreadPoolExecutor
的構造方法。沒錯,上述Executors
方法建立的執行緒池就是ThreadPoolExecutor
。
ThreadPoolExecutor構造方法
Executors
中建立執行緒池的快捷方法,實際上是呼叫了ThreadPoolExecutor
的構造方法(定時任務使用的是ScheduledThreadPoolExecutor
// Java執行緒池的完整建構函式 public ThreadPoolExecutor( int corePoolSize, // 執行緒池長期維持的執行緒數,即使執行緒處於Idle狀態,也不會回收。 int maximumPoolSize, // 執行緒數的上限 long keepAliveTime, TimeUnit unit, // 超過corePoolSize的執行緒的idle時長, // 超過這個時間,多餘的執行緒會被回收。 BlockingQueue<Runnable> workQueue, // 任務的排隊佇列 ThreadFactory threadFactory, // 新執行緒的產生方式 RejectedExecutionHandler handler) // 拒絕策略
竟然有7個引數,很無奈,構造一個執行緒池確實需要這麼多引數。這些引數中,比較容易引起問題的有corePoolSize
, maximumPoolSize
, workQueue
以及handler
:
corePoolSize
和maximumPoolSize
設定不當會影響效率,甚至耗盡執行緒;workQueue
設定不當容易導致OOM;handler
設定不當會導致提交任務時丟擲異常。
正確的引數設定方式會在下文給出。
執行緒池的工作順序
If fewer than corePoolSize threads are running, the Executor always prefers adding a new thread rather than queuing. If corePoolSize or more threads are running, the Executor always prefers queuing a request rather than adding a new thread. If a request cannot be queued, a new thread is created unless this would exceed maximumPoolSize, in which case, the task will be rejected.
corePoolSize -> 任務佇列 -> maximumPoolSize -> 拒絕策略
Runnable和Callable
可以向執行緒池提交的任務有兩種:Runnable
和Callable
,二者的區別如下:
- 方法簽名不同,
void Runnable.run()
,V Callable.call() throws Exception
- 是否允許有返回值,
Callable
允許有返回值 - 是否允許丟擲異常,
Callable
允許丟擲異常。
Callable
是JDK1.5時加入的介面,作為Runnable
的一種補充,允許有返回值,允許丟擲異常。
三種提交任務的方式:
提交方式 | 是否關心返回結果 |
---|---|
Future<T> submit(Callable<T> task) |
是 |
void execute(Runnable command) |
否 |
Future<?> submit(Runnable task) |
否,雖然返回Future,但是其get()方法總是返回null |
如何正確使用執行緒池
避免使用無界佇列
不要使用Executors.newXXXThreadPool()
快捷方法建立執行緒池,因為這種方式會使用無界的任務佇列,為避免OOM,我們應該使用ThreadPoolExecutor
的構造方法手動指定佇列的最大長度:
ExecutorService executorService = new ThreadPoolExecutor(2, 2, 0, TimeUnit.SECONDS, new ArrayBlockingQueue<>(512), // 使用有界佇列,避免OOM new ThreadPoolExecutor.DiscardPolicy());
明確拒絕任務時的行為
任務佇列總有佔滿的時候,這是再submit()
提交新的任務會怎麼樣呢?RejectedExecutionHandler
介面為我們提供了控制方式,介面定義如下:
public interface RejectedExecutionHandler { void rejectedExecution(Runnable r, ThreadPoolExecutor executor); }
執行緒池給我們提供了幾種常見的拒絕策略:
拒絕策略 | 拒絕行為 |
---|---|
AbortPolicy | 丟擲RejectedExecutionException |
DiscardPolicy | 什麼也不做,直接忽略 |
DiscardOldestPolicy | 丟棄執行佇列中最老的任務,嘗試為當前提交的任務騰出位置 |
CallerRunsPolicy | 直接由提交任務者執行這個任務 |
執行緒池預設的拒絕行為是AbortPolicy
,也就是丟擲RejectedExecutionHandler
異常,該異常是非受檢異常,很容易忘記捕獲。如果不關心任務被拒絕的事件,可以將拒絕策略設定成DiscardPolicy
,這樣多餘的任務會悄悄的被忽略。
ExecutorService executorService = new ThreadPoolExecutor(2, 2, 0, TimeUnit.SECONDS, new ArrayBlockingQueue<>(512), new ThreadPoolExecutor.DiscardPolicy());// 指定拒絕策略
獲取處理結果和異常
執行緒池的處理結果、以及處理過程中的異常都被包裝到Future
中,並在呼叫Future.get()
方法時獲取,執行過程中的異常會被包裝成ExecutionException
,submit()
方法本身不會傳遞結果和任務執行過程中的異常。獲取執行結果的程式碼可以這樣寫:
ExecutorService executorService = Executors.newFixedThreadPool(4); Future<Object> future = executorService.submit(new Callable<Object>() { @Override public Object call() throws Exception { throw new RuntimeException("exception in call~");// 該異常會在呼叫Future.get()時傳遞給呼叫者 } }); try { Object result = future.get(); } catch (InterruptedException e) { // interrupt } catch (ExecutionException e) { // exception in Callable.call() e.printStackTrace(); }
上述程式碼輸出類似如下:
執行緒池的常用場景
正確構造執行緒池
int poolSize = Runtime.getRuntime().availableProcessors() * 2; BlockingQueue<Runnable> queue = new ArrayBlockingQueue<>(512); RejectedExecutionHandler policy = new ThreadPoolExecutor.DiscardPolicy(); executorService = new ThreadPoolExecutor(poolSize, poolSize, 0, TimeUnit.SECONDS, queue, policy);
獲取單個結果
過submit()
向執行緒池提交任務後會返回一個Future
,呼叫V Future.get()
方法能夠阻塞等待執行結果,V get(long timeout, TimeUnit unit)
方法可以指定等待的超時時間。
獲取多個結果
如果向執行緒池提交了多個任務,要獲取這些任務的執行結果,可以依次呼叫Future.get()
獲得。但對於這種場景,我們更應該使用ExecutorCompletionService,該類的take()
方法總是阻塞等待某一個任務完成,然後返回該任務的Future
物件。向CompletionService
批量提交任務後,只需呼叫相同次數的CompletionService.take()
方法,就能獲取所有任務的執行結果,獲取順序是任意的,取決於任務的完成順序:
void solve(Executor executor, Collection<Callable<Result>> solvers) throws InterruptedException, ExecutionException { CompletionService<Result> ecs = new ExecutorCompletionService<Result>(executor);// 構造器 for (Callable<Result> s : solvers)// 提交所有任務 ecs.submit(s); int n = solvers.size(); for (int i = 0; i < n; ++i) {// 獲取每一個完成的任務 Result r = ecs.take().get(); if (r != null) use(r); } }
單個任務的超時時間
V Future.get(long timeout, TimeUnit unit)
方法可以指定等待的超時時間,超時未完成會丟擲TimeoutException
。
多個任務的超時時間
等待多個任務完成,並設定最大等待時間,可以通過CountDownLatch完成:
public void testLatch(ExecutorService executorService, List<Runnable> tasks) throws InterruptedException{ CountDownLatch latch = new CountDownLatch(tasks.size()); for(Runnable r : tasks){ executorService.submit(new Runnable() { @Override public void run() { try{ r.run(); }finally { latch.countDown();// countDown } } }); } latch.await(10, TimeUnit.SECONDS); // 指定超時時間 }
執行緒池和裝修公司
以運營一家裝修公司做個比喻。公司在辦公地點等待客戶來提交裝修請求;公司有固定數量的正式工以維持運轉;旺季業務較多時,新來的客戶請求會被排期,比如接單後告訴使用者一個月後才能開始裝修;當排期太多時,為避免使用者等太久,公司會通過某些渠道(比如人才市場、熟人介紹等)僱傭一些臨時工(注意,招聘臨時工是在排期排滿之後);如果臨時工也忙不過來,公司將決定不再接收新的客戶,直接拒單。
執行緒池就是程式中的“裝修公司”,代勞各種髒活累活。上面的過程對應到執行緒池上:
// Java執行緒池的完整建構函式 public ThreadPoolExecutor( int corePoolSize, // 正式工數量 int maximumPoolSize, // 工人數量上限,包括正式工和臨時工 long keepAliveTime, TimeUnit unit, // 臨時工遊手好閒的最長時間,超過這個時間將被解僱 BlockingQueue<Runnable> workQueue, // 排期佇列 ThreadFactory threadFactory, // 招人渠道 RejectedExecutionHandler handler) // 拒單方式
總結
Executors
為我們提供了構造執行緒池的便捷方法,對於伺服器程式我們應該杜絕使用這些便捷方法,而是直接使用執行緒池ThreadPoolExecutor
的構造方法,避免無界佇列可能導致的OOM以及執行緒個數限制不當導致的執行緒數耗盡等問題。ExecutorCompletionService
提供了等待所有任務執行結束的有效方式,如果要設定等待的超時時間,則可以通過CountDownLatch
完成。