1. 程式人生 > >40個Java多線程問題總結

40個Java多線程問題總結

維護 基礎 rep 核數 截圖 是否 更新 服務器 lmap

前言

Java多線程分類中寫了21篇多線程的文章,21篇文章的內容很多,個人認為,學習,內容越多、越雜的知識,越需要進行深刻的總結,這樣才能記憶深刻,將知識變成自己的。這篇文章主要是對多線程的問題進行總結的,因此羅列了40個多線程的問題。

這些多線程的問題,有些來源於各大網站、有些來源於自己的思考。可能有些問題網上有、可能有些問題對應的答案也有、也可能有些各位網友也都看過,但是本文寫作的重心就是所有的問題都會按照自己的理解回答一遍,不會去看網上的答案,因此可能有些問題講的不對,能指正的希望大家不吝指教。

40個問題匯總

1、多線程有什麽用?

一個可能在很多人看來很扯淡的一個問題:我會用多線程就好了,還管它有什麽用?在我看來,這個回答更扯淡。所謂”知其然知其所以然”,”會用”只是”知其然”,”為什麽用”才是”知其所以然”,只有達到”知其然知其所以然”的程度才可以說是把一個知識點運用自如。OK,下面說說我對這個問題的看法:

(1)發揮多核CPU的優勢

隨著工業的進步,現在的筆記本、臺式機乃至商用的應用服務器至少也都是雙核的,4核、8核甚至16核的也都不少見,如果是單線程的程序,那麽在雙核CPU上就浪費了50%,在4核CPU上就浪費了75%。單核CPU上所謂的”多線程”那是假的多線程,同一時間處理器只會處理一段邏輯,只不過線程之間切換得比較快,看著像多個線程”同時”運行罷了。多核CPU上的多線程才是真正的多線程,它能讓你的多段邏輯同時工作,多線程,可以真正發揮出多核CPU的優勢來,達到充分利用CPU的目的。

(2)防止阻塞

從程序運行效率的角度來看,單核CPU不但不會發揮出多線程的優勢,反而會因為在單核CPU上運行多線程導致線程上下文的切換,而降低程序整體的效率。但是單核CPU我們還是要應用多線程,就是為了防止阻塞。試想,如果單核CPU使用單線程,那麽只要這個線程阻塞了,比方說遠程讀取某個數據吧,對端遲遲未返回又沒有設置超時時間,那麽你的整個程序在數據返回回來之前就停止運行了。多線程可以防止這個問題,多條線程同時運行,哪怕一條線程的代碼執行讀取數據阻塞,也不會影響其它任務的執行。

(3)便於建模

這是另外一個沒有這麽明顯的優點了。假設有一個大的任務A,單線程編程,那麽就要考慮很多,建立整個程序模型比較麻煩。但是如果把這個大的任務A分解成幾個小任務,任務B、任務C、任務D,分別建立程序模型,並通過多線程分別運行這幾個任務,那就簡單很多了。

2、創建線程的方式

比較常見的一個問題了,一般就是兩種:

(1)繼承Thread類

(2)實現Runnable接口

至於哪個好,不用說肯定是後者好,因為實現接口的方式比繼承類的方式更靈活,也能減少程序之間的耦合度,面向接口編程也是設計模式6大原則的核心。

3、start()方法和run()方法的區別

只有調用了start()方法,才會表現出多線程的特性,不同線程的run()方法裏面的代碼交替執行。如果只是調用run()方法,那麽代碼還是同步執行的,必須等待一個線程的run()方法裏面的代碼全部執行完畢之後,另外一個線程才可以執行其run()方法裏面的代碼。

4、Runnable接口和Callable接口的區別

有點深的問題了,也看出一個Java程序員學習知識的廣度。

Runnable接口中的run()方法的返回值是void,它做的事情只是純粹地去執行run()方法中的代碼而已;Callable接口中的call()方法是有返回值的,是一個泛型,和Future、FutureTask配合可以用來獲取異步執行的結果。

這其實是很有用的一個特性,因為多線程相比單線程更難、更復雜的一個重要原因就是因為多線程充滿著未知性,某條線程是否執行了?某條線程執行了多久?某條線程執行的時候我們期望的數據是否已經賦值完畢?無法得知,我們能做的只是等待這條多線程的任務執行完畢而已。而Callable+Future/FutureTask卻可以獲取多線程運行的結果,可以在等待時間太長沒獲取到需要的數據的情況下取消該線程的任務,真的是非常有用。

5、CyclicBarrier和CountDownLatch的區別

兩個看上去有點像的類,都在java.util.concurrent下,都可以用來表示代碼運行到某個點上,二者的區別在於:

(1)CyclicBarrier的某個線程運行到某個點上之後,該線程即停止運行,直到所有的線程都到達了這個點,所有線程才重新運行;CountDownLatch則不是,某線程運行到某個點上之後,只是給某個數值-1而已,該線程繼續運行

(2)CyclicBarrier只能喚起一個任務,CountDownLatch可以喚起多個任務

(3)CyclicBarrier可重用,CountDownLatch不可重用,計數值為0該CountDownLatch就不可再用了

6、volatile關鍵字的作用

一個非常重要的問題,是每個學習、應用多線程的Java程序員都必須掌握的。理解volatile關鍵字的作用的前提是要理解Java內存模型,這裏就不講Java內存模型了,可以參見第31點,volatile關鍵字的作用主要有兩個:

(1)多線程主要圍繞可見性和原子性兩個特性而展開,使用volatile關鍵字修飾的變量,保證了其在多線程之間的可見性,即每次讀取到volatile變量,一定是最新的數據

(2)代碼底層執行不像我們看到的高級語言—-Java程序這麽簡單,它的執行是Java代碼–>字節碼–>根據字節碼執行對應的C/C++代碼–>C/C++代碼被編譯成匯編語言–>和硬件電路交互,現實中,為了獲取更好的性能JVM可能會對指令進行重排序,多線程下可能會出現一些意想不到的問題。使用volatile則會對禁止語義重排序,當然這也一定程度上降低了代碼執行效率

從實踐角度而言,volatile的一個重要作用就是和CAS結合,保證了原子性,詳細的可以參見java.util.concurrent.atomic包下的類,比如AtomicInteger。

7、什麽是線程安全

又是一個理論的問題,各式各樣的答案有很多,我給出一個個人認為解釋地最好的:如果你的代碼在多線程下執行和在單線程下執行永遠都能獲得一樣的結果,那麽你的代碼就是線程安全的

這個問題有值得一提的地方,就是線程安全也是有幾個級別的:

(1)不可變

像String、Integer、Long這些,都是final類型的類,任何一個線程都改變不了它們的值,要改變除非新創建一個,因此這些不可變對象不需要任何同步手段就可以直接在多線程環境下使用

(2)絕對線程安全

不管運行時環境如何,調用者都不需要額外的同步措施。要做到這一點通常需要付出許多額外的代價,Java中標註自己是線程安全的類,實際上絕大多數都不是線程安全的,不過絕對線程安全的類,Java中也有,比方說CopyOnWriteArrayList、CopyOnWriteArraySet

(3)相對線程安全

相對線程安全也就是我們通常意義上所說的線程安全,像Vector這種,add、remove方法都是原子操作,不會被打斷,但也僅限於此,如果有個線程在遍歷某個Vector、有個線程同時在add這個Vector,99%的情況下都會出現ConcurrentModificationException,也就是fail-fast機制

(4)線程非安全

這個就沒什麽好說的了,ArrayList、LinkedList、HashMap等都是線程非安全的類

8、Java中如何獲取到線程dump文件

死循環、死鎖、阻塞、頁面打開慢等問題,打線程dump是最好的解決問題的途徑。所謂線程dump也就是線程堆棧,獲取到線程堆棧有兩步:

(1)獲取到線程的pid,可以通過使用jps命令,在Linux環境下還可以使用ps -ef | grep java

(2)打印線程堆棧,可以通過使用jstack pid命令,在Linux環境下還可以使用kill -3 pid

另外提一點,Thread類提供了一個getStackTrace()方法也可以用於獲取線程堆棧。這是一個實例方法,因此此方法是和具體線程實例綁定的,每次獲取獲取到的是具體某個線程當前運行的堆棧,

9、一個線程如果出現了運行時異常會怎麽樣

如果這個異常沒有被捕獲的話,這個線程就停止執行了。另外重要的一點是:如果這個線程持有某個某個對象的監視器,那麽這個對象監視器會被立即釋放

10、如何在兩個線程之間共享數據

通過在線程之間共享對象就可以了,然後通過wait/notify/notifyAll、await/signal/signalAll進行喚起和等待,比方說阻塞隊列BlockingQueue就是為線程之間共享數據而設計的

11、sleep方法和wait方法有什麽區別

這個問題常問,sleep方法和wait方法都可以用來放棄CPU一定的時間,不同點在於如果線程持有某個對象的監視器,sleep方法不會放棄這個對象的監視器,wait方法會放棄這個對象的監視器

12、生產者消費者模型的作用是什麽

這個問題很理論,但是很重要:

(1)通過平衡生產者的生產能力和消費者的消費能力來提升整個系統的運行效率,這是生產者消費者模型最重要的作用

(2)解耦,這是生產者消費者模型附帶的作用,解耦意味著生產者和消費者之間的聯系少,聯系越少越可以獨自發展而不需要收到相互的制約

13、ThreadLocal有什麽用

簡單說ThreadLocal就是一種以空間換時間的做法,在每個Thread裏面維護了一個以開地址法實現的ThreadLocal.ThreadLocalMap,把數據進行隔離,數據不共享,自然就沒有線程安全方面的問題了

14、為什麽wait()方法和notify()/notifyAll()方法要在同步塊中被調用

這是JDK強制的,wait()方法和notify()/notifyAll()方法在調用前都必須先獲得對象的鎖

15、wait()方法和notify()/notifyAll()方法在放棄對象監視器時有什麽區別

wait()方法和notify()/notifyAll()方法在放棄對象監視器的時候的區別在於:wait()方法立即釋放對象監視器,notify()/notifyAll()方法則會等待線程剩余代碼執行完畢才會放棄對象監視器

16、為什麽要使用線程池

避免頻繁地創建和銷毀線程,達到線程對象的重用。另外,使用線程池還可以根據項目靈活地控制並發的數目。

17、怎麽檢測一個線程是否持有對象監視器

我也是在網上看到一道多線程面試題才知道有方法可以判斷某個線程是否持有對象監視器:Thread類提供了一個holdsLock(Object obj)方法,當且僅當對象obj的監視器被某條線程持有的時候才會返回true,註意這是一個static方法,這意味著“某條線程”指的是當前線程

18、synchronized和ReentrantLock的區別

synchronized是和if、else、for、while一樣的關鍵字,ReentrantLock是類,這是二者的本質區別。既然ReentrantLock是類,那麽它就提供了比synchronized更多更靈活的特性,可以被繼承、可以有方法、可以有各種各樣的類變量,ReentrantLock比synchronized的擴展性體現在幾點上:

(1)ReentrantLock可以對獲取鎖的等待時間進行設置,這樣就避免了死鎖

(2)ReentrantLock可以獲取各種鎖的信息

(3)ReentrantLock可以靈活地實現多路通知

另外,二者的鎖機制其實也是不一樣的。ReentrantLock底層調用的是Unsafe的park方法加鎖,synchronized操作的應該是對象頭中mark word,這點我不能確定。

19、ConcurrentHashMap的並發度是什麽

ConcurrentHashMap的並發度就是segment的大小,默認為16,這意味著最多同時可以有16條線程操作ConcurrentHashMap,這也是ConcurrentHashMap對Hashtable的最大優勢,任何情況下,Hashtable能同時有兩條線程獲取Hashtable中的數據嗎?

20、ReadWriteLock是什麽

首先明確一下,不是說ReentrantLock不好,只是ReentrantLock某些時候有局限。如果使用ReentrantLock,可能本身是為了防止線程A在寫數據、線程B在讀數據造成的數據不一致,但這樣,如果線程C在讀數據、線程D也在讀數據,讀數據是不會改變數據的,沒有必要加鎖,但是還是加鎖了,降低了程序的性能。

因為這個,才誕生了讀寫鎖ReadWriteLock。ReadWriteLock是一個讀寫鎖接口,ReentrantReadWriteLock是ReadWriteLock接口的一個具體實現,實現了讀寫的分離,讀鎖是共享的,寫鎖是獨占的,讀和讀之間不會互斥,讀和寫、寫和讀、寫和寫之間才會互斥,提升了讀寫的性能。

21、FutureTask是什麽

這個其實前面有提到過,FutureTask表示一個異步運算的任務。FutureTask裏面可以傳入一個Callable的具體實現類,可以對這個異步運算的任務的結果進行等待獲取、判斷是否已經完成、取消任務等操作。當然,由於FutureTask也是Runnable接口的實現類,所以FutureTask也可以放入線程池中。

22、Linux環境下如何查找哪個線程使用CPU最長

這是一個比較偏實踐的問題,這種問題我覺得挺有意義的。可以這麽做:

(1)獲取項目的pid,jps或者ps -ef | grep java,這個前面有講過

(2)top -H -p pid,順序不能改變

這樣就可以打印出當前的項目,每條線程占用CPU時間的百分比。註意這裏打出的是LWP,也就是操作系統原生線程的線程號,我筆記本山沒有部署Linux環境下的Java工程,因此沒有辦法截圖演示,網友朋友們如果公司是使用Linux環境部署項目的話,可以嘗試一下。

使用”top -H -p pid”+”jps pid”可以很容易地找到某條占用CPU高的線程的線程堆棧,從而定位占用CPU高的原因,一般是因為不當的代碼操作導致了死循環。

最後提一點,”top -H -p pid”打出來的LWP是十進制的,”jps pid”打出來的本地線程號是十六進制的,轉換一下,就能定位到占用CPU高的線程的當前線程堆棧了。

23、Java編程寫一個會導致死鎖的程序

第一次看到這個題目,覺得這是一個非常好的問題。很多人都知道死鎖是怎麽一回事兒:線程A和線程B相互等待對方持有的鎖導致程序無限死循環下去。當然也僅限於此了,問一下怎麽寫一個死鎖的程序就不知道了,這種情況說白了就是不懂什麽是死鎖,懂一個理論就完事兒了,實踐中碰到死鎖的問題基本上是看不出來的。

真正理解什麽是死鎖,這個問題其實不難,幾個步驟:

(1)兩個線程裏面分別持有兩個Object對象:lock1和lock2。這兩個lock作為同步代碼塊的鎖;

(2)線程1的run()方法中同步代碼塊先獲取lock1的對象鎖,Thread.sleep(xxx),時間不需要太多,50毫秒差不多了,然後接著獲取lock2的對象鎖。這麽做主要是為了防止線程1啟動一下子就連續獲得了lock1和lock2兩個對象的對象鎖

(3)線程2的run)(方法中同步代碼塊先獲取lock2的對象鎖,接著獲取lock1的對象鎖,當然這時lock1的對象鎖已經被線程1鎖持有,線程2肯定是要等待線程1釋放lock1的對象鎖的

這樣,線程1″睡覺”睡完,線程2已經獲取了lock2的對象鎖了,線程1此時嘗試獲取lock2的對象鎖,便被阻塞,此時一個死鎖就形成了。代碼就不寫了,占的篇幅有點多,Java多線程7:死鎖這篇文章裏面有,就是上面步驟的代碼實現。

24、怎麽喚醒一個阻塞的線程

如果線程是因為調用了wait()、sleep()或者join()方法而導致的阻塞,可以中斷線程,並且通過拋出InterruptedException來喚醒它;如果線程遇到了IO阻塞,無能為力,因為IO是操作系統實現的,Java代碼並沒有辦法直接接觸到操作系統。

25、不可變對象對多線程有什麽幫助

前面有提到過的一個問題,不可變對象保證了對象的內存可見性,對不可變對象的讀取不需要進行額外的同步手段,提升了代碼執行效率。

26、什麽是多線程的上下文切換

多線程的上下文切換是指CPU控制權由一個已經正在運行的線程切換到另外一個就緒並等待獲取CPU執行權的線程的過程。

27、如果你提交任務時,線程池隊列已滿,這時會發生什麽

如果你使用的LinkedBlockingQueue,也就是無界隊列的話,沒關系,繼續添加任務到阻塞隊列中等待執行,因為LinkedBlockingQueue可以近乎認為是一個無窮大的隊列,可以無限存放任務;如果你使用的是有界隊列比方說ArrayBlockingQueue的話,任務首先會被添加到ArrayBlockingQueue中,ArrayBlockingQueue滿了,則會使用拒絕策略RejectedExecutionHandler處理滿了的任務,默認是AbortPolicy。

28、Java中用到的線程調度算法是什麽

搶占式。一個線程用完CPU之後,操作系統會根據線程優先級、線程饑餓情況等數據算出一個總的優先級並分配下一個時間片給某個線程執行。

29、Thread.sleep(0)的作用是什麽

這個問題和上面那個問題是相關的,我就連在一起了。由於Java采用搶占式的線程調度算法,因此可能會出現某條線程常常獲取到CPU控制權的情況,為了讓某些優先級比較低的線程也能獲取到CPU控制權,可以使用Thread.sleep(0)手動觸發一次操作系統分配時間片的操作,這也是平衡CPU控制權的一種操作。

30、什麽是自旋

很多synchronized裏面的代碼只是一些很簡單的代碼,執行時間非常快,此時等待的線程都加鎖可能是一種不太值得的操作,因為線程阻塞涉及到用戶態和內核態切換的問題。既然synchronized裏面的代碼執行得非常快,不妨讓等待鎖的線程不要被阻塞,而是在synchronized的邊界做忙循環,這就是自旋。如果做了多次忙循環發現還沒有獲得鎖,再阻塞,這樣可能是一種更好的策略。

31、什麽是Java內存模型

Java內存模型定義了一種多線程訪問Java內存的規範。Java內存模型要完整講不是這裏幾句話能說清楚的,我簡單總結一下Java內存模型的幾部分內容:

(1)Java內存模型將內存分為了主內存和工作內存。類的狀態,也就是類之間共享的變量,是存儲在主內存中的,每次Java線程用到這些主內存中的變量的時候,會讀一次主內存中的變量,並讓這些內存在自己的工作內存中有一份拷貝,運行自己線程代碼的時候,用到這些變量,操作的都是自己工作內存中的那一份。在線程代碼執行完畢之後,會將最新的值更新到主內存中去

(2)定義了幾個原子操作,用於操作主內存和工作內存中的變量

(3)定義了volatile變量的使用規則

(4)happens-before,即先行發生原則,定義了操作A必然先行發生於操作B的一些規則,比如在同一個線程內控制流前面的代碼一定先行發生於控制流後面的代碼、一個釋放鎖unlock的動作一定先行發生於後面對於同一個鎖進行鎖定lock的動作等等,只要符合這些規則,則不需要額外做同步措施,如果某段代碼不符合所有的happens-before規則,則這段代碼一定是線程非安全的

32、什麽是CAS

CAS,全稱為Compare and Swap,即比較-替換。假設有三個操作數:內存值V、舊的預期值A、要修改的值B,當且僅當預期值A和內存值V相同時,才會將內存值修改為B並返回true,否則什麽都不做並返回false。當然CAS一定要volatile變量配合,這樣才能保證每次拿到的變量是主內存中最新的那個值,否則舊的預期值A對某條線程來說,永遠是一個不會變的值A,只要某次CAS操作失敗,永遠都不可能成功。

33、什麽是樂觀鎖和悲觀鎖

(1)樂觀鎖:就像它的名字一樣,對於並發間操作產生的線程安全問題持樂觀狀態,樂觀鎖認為競爭不總是會發生,因此它不需要持有鎖,將比較-替換這兩個動作作為一個原子操作嘗試去修改內存中的變量,如果失敗則表示發生沖突,那麽就應該有相應的重試邏輯。

(2)悲觀鎖:還是像它的名字一樣,對於並發間操作產生的線程安全問題持悲觀狀態,悲觀鎖認為競爭總是會發生,因此每次對某資源進行操作時,都會持有一個獨占的鎖,就像synchronized,不管三七二十一,直接上了鎖就操作資源了。

34、什麽是AQS

簡單說一下AQS,AQS全稱為AbstractQueuedSychronizer,翻譯過來應該是抽象隊列同步器。

如果說java.util.concurrent的基礎是CAS的話,那麽AQS就是整個Java並發包的核心了,ReentrantLock、CountDownLatch、Semaphore等等都用到了它。AQS實際上以雙向隊列的形式連接所有的Entry,比方說ReentrantLock,所有等待的線程都被放在一個Entry中並連成雙向隊列,前面一個線程使用ReentrantLock好了,則雙向隊列實際上的第一個Entry開始運行。

AQS定義了對雙向隊列所有的操作,而只開放了tryLock和tryRelease方法給開發者使用,開發者可以根據自己的實現重寫tryLock和tryRelease方法,以實現自己的並發功能。

35、單例模式的線程安全性

老生常談的問題了,首先要說的是單例模式的線程安全意味著:某個類的實例在多線程環境下只會被創建一次出來。單例模式有很多種的寫法,我總結一下:

(1)餓漢式單例模式的寫法:線程安全

(2)懶漢式單例模式的寫法:非線程安全

(3)雙檢鎖單例模式的寫法:線程安全

36、Semaphore有什麽作用

Semaphore就是一個信號量,它的作用是限制某段代碼塊的並發數。Semaphore有一個構造函數,可以傳入一個int型整數n,表示某段代碼最多只有n個線程可以訪問,如果超出了n,那麽請等待,等到某個線程執行完畢這段代碼塊,下一個線程再進入。由此可以看出如果Semaphore構造函數中傳入的int型整數n=1,相當於變成了一個synchronized了。

37、Hashtable的size()方法中明明只有一條語句”return count”,為什麽還要做同步?

這是我之前的一個困惑,不知道大家有沒有想過這個問題。某個方法中如果有多條語句,並且都在操作同一個類變量,那麽在多線程環境下不加鎖,勢必會引發線程安全問題,這很好理解,但是size()方法明明只有一條語句,為什麽還要加鎖?

關於這個問題,在慢慢地工作、學習中,有了理解,主要原因有兩點:

(1)同一時間只能有一條線程執行固定類的同步方法,但是對於類的非同步方法,可以多條線程同時訪問。所以,這樣就有問題了,可能線程A在執行Hashtable的put方法添加數據,線程B則可以正常調用size()方法讀取Hashtable中當前元素的個數,那讀取到的值可能不是最新的,可能線程A添加了完了數據,但是沒有對size++,線程B就已經讀取size了,那麽對於線程B來說讀取到的size一定是不準確的。而給size()方法加了同步之後,意味著線程B調用size()方法只有在線程A調用put方法完畢之後才可以調用,這樣就保證了線程安全性

(2)CPU執行代碼,執行的不是Java代碼,這點很關鍵,一定得記住。Java代碼最終是被翻譯成匯編代碼執行的,匯編代碼才是真正可以和硬件電路交互的代碼。即使你看到Java代碼只有一行,甚至你看到Java代碼編譯之後生成的字節碼也只有一行,也不意味著對於底層來說這句語句的操作只有一個。一句”return count”假設被翻譯成了三句匯編語句執行,完全可能執行完第一句,線程就切換了。

38、線程類的構造方法、靜態塊是被哪個線程調用的

這是一個非常刁鉆和狡猾的問題。請記住:線程類的構造方法、靜態塊是被new這個線程類所在的線程所調用的,而run方法裏面的代碼才是被線程自身所調用的。

如果說上面的說法讓你感到困惑,那麽我舉個例子,假設Thread2中new了Thread1,main函數中new了Thread2,那麽:

(1)Thread2的構造方法、靜態塊是main線程調用的,Thread2的run()方法是Thread2自己調用的

(2)Thread1的構造方法、靜態塊是Thread2調用的,Thread1的run()方法是Thread1自己調用的

39、同步方法和同步塊,哪個是更好的選擇

同步塊,這意味著同步塊之外的代碼是異步執行的,這比同步整個方法更提升代碼的效率。請知道一條原則:同步的範圍越小越好

借著這一條,我額外提一點,雖說同步的範圍越少越好,但是在Java虛擬機中還是存在著一種叫做鎖粗化的優化方法,這種方法就是把同步範圍變大。這是有用的,比方說StringBuffer,它是一個線程安全的類,自然最常用的append()方法是一個同步方法,我們寫代碼的時候會反復append字符串,這意味著要進行反復的加鎖->解鎖,這對性能不利,因為這意味著Java虛擬機在這條線程上要反復地在內核態和用戶態之間進行切換,因此Java虛擬機會將多次append方法調用的代碼進行一個鎖粗化的操作,將多次的append的操作擴展到append方法的頭尾,變成一個大的同步塊,這樣就減少了加鎖–>解鎖的次數,有效地提升了代碼執行的效率。

40、高並發、任務執行時間短的業務怎樣使用線程池?並發不高、任務執行時間長的業務怎樣使用線程池?並發高、業務執行時間長的業務怎樣使用線程池?

這是我在並發編程網上看到的一個問題,把這個問題放在最後一個,希望每個人都能看到並且思考一下,因為這個問題非常好、非常實際、非常專業。關於這個問題,個人看法是:

(1)高並發、任務執行時間短的業務,線程池線程數可以設置為CPU核數+1,減少線程上下文的切換

(2)並發不高、任務執行時間長的業務要區分開看:

a)假如是業務時間長集中在IO操作上,也就是IO密集型的任務,因為IO操作並不占用CPU,所以不要讓所有的CPU閑下來,可以加大線程池中的線程數目,讓CPU處理更多的業務

b)假如是業務時間長集中在計算操作上,也就是計算密集型任務,這個就沒辦法了,和(1)一樣吧,線程池中的線程數設置得少一些,減少線程上下文的切換

(3)並發高、業務執行時間長,解決這種類型任務的關鍵不在於線程池而在於整體架構的設計,看看這些業務裏面某些數據是否能做緩存是第一步,增加服務器是第二步,至於線程池的設置,設置參考(2)。最後,業務執行時間長的問題,也可能需要分析一下,看看能不能使用中間件對任務進行拆分和解耦。

40個Java多線程問題總結