Linux 的多執行緒程式設計的高效開發經驗
背景
Linux 平臺上的多執行緒程式開發相對應其他平臺(比如 Windows)的多執行緒 API 有一些細微和隱晦的差別。不注意這些 Linux 上的一些開發陷阱,常常會導致程式問題不窮,死鎖不斷。本文中我們從 5 個方面總結出 Linux 多執行緒程式設計上的問題,並分別引出相關改善的開發經驗,用以避免這些的陷阱。我們希望這些經驗可以幫助讀者們能更好更快的熟悉 Linux 平臺的多執行緒程式設計。
我們假設讀者都已經很熟悉 Linux 平臺上基本的執行緒程式設計的 Pthread 庫 API 。其他的第三方用以執行緒程式設計的庫,如 boost,將不會在本文中提及。本文中主要涉及的題材包括執行緒開發中的執行緒管理,互斥變數,條件變數等。程序概念將不會在本文中涉及。
Linux 上執行緒開發 API 的概要介紹
多執行緒開發在 Linux 平臺上已經有成熟的 Pthread 庫支援。其涉及的多執行緒開發的最基本概念主要包含三點:執行緒,互斥鎖,條件。其中,執行緒操作又分執行緒的建立,退出,等待 3 種。互斥鎖則包括 4 種操作,分別是建立,銷燬,加鎖和解鎖。條件操作有 5 種操作:建立,銷燬,觸發,廣播和等待。其他的一些執行緒擴充套件概念,如訊號燈等,都可以通過上面的三個基本元素的基本操作封裝出來。
執行緒,互斥鎖,條件在 Linux 平臺上對應的 API 可以用表 1 歸納。為了方便熟悉 Windows 執行緒程式設計的讀者熟悉 Linux 多執行緒開發的 API,我們在表中同時也列出 Windows SDK 庫中所對應的 API 名稱。
表 1. 執行緒函式列表
物件 | 操作 | Linux Pthread API | Windows SDK 庫對應 API |
---|---|---|---|
執行緒 | 建立 | pthread_create | CreateThread |
退出 | pthread_exit | ThreadExit | |
等待 | pthread_join | WaitForSingleObject | |
互斥鎖 | 建立 | pthread_mutex_init | CreateMutex |
銷燬 | pthread_mutex_destroy | CloseHandle | |
加鎖 | pthread_mutex_lock | WaitForSingleObject | |
解鎖 | pthread_mutex_unlock | ReleaseMutex | |
條件 | 建立 | pthread_cond_init | CreateEvent |
銷燬 | pthread_cond_destroy | CloseHandle | |
觸發 | pthread_cond_signal | SetEvent | |
廣播 | pthread_cond_broadcast | SetEvent / ResetEvent | |
等待 | pthread_cond_wait / pthread_cond_timedwait | SingleObjectAndWait |
多執行緒開發在 Linux 平臺上已經有成熟的 Pthread 庫支援。其涉及的多執行緒開發的最基本概念主要包含三點:執行緒,互斥鎖,條件。其中,執行緒操作又分執行緒的建立,退出,等待 3 種。互斥鎖則包括 4 種操作,分別是建立,銷燬,加鎖和解鎖。條件操作有 5 種操作:建立,銷燬,觸發,廣播和等待。其他的一些執行緒擴充套件概念,如訊號燈等,都可以通過上面的三個基本元素的基本操作封裝出來。
Linux 執行緒程式設計中的 5 條經驗
儘量設定 recursive 屬性以初始化 Linux 的互斥變數
互斥鎖是多執行緒程式設計中基本的概念,在開發中被廣泛使用。其呼叫次序層次清晰簡單:建鎖,加鎖,解鎖,銷燬鎖。但是需要注意的是,與諸如 Windows 平臺的互斥變數不同,在預設情況下,Linux 下的同一執行緒無法對同一互斥鎖進行遞迴加速,否則將發生死鎖。
所謂遞迴加鎖,就是在同一執行緒中試圖對互斥鎖進行兩次或兩次以上的行為。其場景在 Linux 平臺上的程式碼可由清單 1 所示。
清單 1. Linux 重複對互斥鎖加鎖例項
1
|
Linux 互斥變數這種奇怪的行為或許對於特定的某些場景會所有用處,但是對於大多數情況下看起來更像是程式的一個 bug 。畢竟,在同一執行緒中對同一互斥鎖進行遞迴加鎖在尤其是二次開發中經常會需要。
這個問題與互斥鎖的中的預設 recursive 屬性有關。解決問題的方法就是顯式地在互斥變數初始化時將設定起 recursive 屬性。基於此,以上程式碼其實稍作修改就可以很好的執行,只需要在初始化鎖的時候加設定一個屬性。請看清單 2 。
清單 2. 設定互斥鎖 recursive 屬性例項
1
|
注意 Linux 平臺上觸發條件變數的自動復位問題
條件變數的置位和復位有兩種常用模型:第一種模型是當條件變數置位(signaled)以後,如果當前沒有執行緒在等待,其狀態會保持為置位(signaled),直到有等待的執行緒進入被觸發,其狀態才會變為復位(unsignaled),這種模型的採用以 Windows 平臺上的 Auto-set Event 為代表。其狀態變化如圖 1 所示:
圖 1. Windows 的條件變數狀態變化流程
第二種模型則是 Linux 平臺的 Pthread 所採用的模型,當條件變數置位(signaled)以後,即使當前沒有任何執行緒在等待,其狀態也會恢復為復位(unsignaled)狀態。其狀態變化如圖 2 所示:
圖 2. Linux 的條件變數狀態變化流程
具體來說,Linux 平臺上 Pthread 下的條件變數狀態變化模型是這樣工作的:呼叫 pthread_cond_signal() 釋放被條件阻塞的執行緒時,無論存不存在被阻塞的執行緒,條件都將被重新復位,下一個被條件阻塞的執行緒將不受影響。而對於 Windows,當呼叫 SetEvent 觸發 Auto-reset 的 Event 條件時,如果沒有被條件阻塞的執行緒,那麼條件將維持在觸發狀態,直到有新的執行緒被條件阻塞並被釋放為止。
這種差異性對於那些熟悉 Windows 平臺上的條件變數狀態模型而要開發 Linux 平臺上多執行緒的程式設計師來說可能會造成意想不到的尷尬結果。試想要實現一個旅客坐計程車的程式:旅客在路邊等計程車,呼叫條件等待。計程車來了,將觸發條件,旅客停止等待並上車。一個計程車只能搭載一波乘客,於是我們使用單一觸發的條件變數。這個實現邏輯在第一個模型下即使出租車先到,也不會有什麼問題,其過程如圖 3 所示:
圖 3. 採用 Windows 條件變數模型的計程車例項流程
然而如果按照這個思路來在 Linux 上來實現,程式碼看起來可能是清單 3 這樣。
清單 3. Linux 計程車案例程式碼例項
1
|
清單 4. 程式結果輸出
1
|
圖 4. 採用 Linux 條件變數模型的計程車例項流程
通過對比結果,你會發現同樣的邏輯,在 Linux 平臺上執行的結果卻完全是兩樣。對於在 Windows 平臺上的模型一, Jack 開著計程車到了站臺,觸發條件變數。如果沒顧客,條件變數將維持觸發狀態,也就是說 Jack 停下車在那裡等著。直到 Susan 小姐來了站臺,執行等待條件來找出租車。 Susan 搭上 Jack 的計程車離開,同時條件變數被自動復位。
但是到了 Linux 平臺,問題就來了,Jack 到了站臺一看沒人,觸發的條件變數被直接復位,於是 Jack 排在等待佇列裡面。來遲一秒的 Susan 小姐到了站臺卻看不到在那裡等待的 Jack,只能等待,直到 Mike 開車趕到,重新觸發條件變數,Susan 才上了 Mike 的車。這對於在排隊系統前面的 Jack 是不公平的,而問題癥結是在於 Linux 平臺上條件變數觸發的自動復位引起的一個 Bug 。
條件變數在 Linux 平臺上的這種模型很難說好壞。但是在實際開發中,我們可以對程式碼稍加改進就可以避免這種差異的發生。由於這種差異只發生在觸發沒有被執行緒等待在條件變數的時刻,因此我們只需要掌握好觸發的時機即可。最簡單的做法是增加一個計數器記錄等待執行緒的個數,在決定觸發條件變數前檢查下該變數即可。改進後 Linux 函式如清單 5 所示。
清單 5. Linux 計程車案例程式碼例項
1
|
注意條件返回時互斥鎖的解鎖問題
在 Linux 呼叫 pthread_cond_wait 進行條件變數等待操作時,我們增加一個互斥變數引數是必要的,這是為了避免執行緒間的競爭和飢餓情況。但是當條件等待返回時候,需要注意的是一定不要遺漏對互斥變數進行解鎖。
Linux 平臺上的 pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex) 函式返回時,互斥鎖 mutex 將處於鎖定狀態。因此之後如果需要對臨界區資料進行重新訪問,則沒有必要對 mutex 就行重新加鎖。但是,隨之而來的問題是,每次條件等待以後需要加入一步手動的解鎖操作。正如前文中乘客等待計程車的 Linux 程式碼如清單 6 所示:
清單 6. 條件變數返回後的解鎖例項
1
|
Linux 對於 Windows 的這一點額外解鎖的操作區別很重要,一定得牢記。否則從 Windows 移植到 Linux 上的條件等待操作一旦忘了結束後的解鎖操作,程式將肯定會發生死鎖。
等待的絕對時間問題
超時是多執行緒程式設計中一個常見的概念。例如,當你在 Linux 平臺下使用 pthread_cond_timedwait() 時就需要指定超時這個引數,以便這個 API 的呼叫者最多隻被阻塞指定的時間間隔。但是如果你是第一次使用這個 API 時,首先你需要了解的就是這個 API 當中超時引數的特殊性(就如本節標題所提示的那樣)。我們首先來看一下這個 API 的定義。 pthread_cond_timedwait() 定義請看清單 7 。
清單 7. pthread_cond_timedwait() 函式定義
1
|
假設我們指定相對的超時時間引數如 dwMilliseconds (單位毫秒)來呼叫和超時相關的函式,這樣就需要將 dwMilliseconds 轉化為 Linux 下的絕對時間引數 abstime 使用。常用的轉換方法如清單 8 所示:
清單 8. 相對時間到絕對時間轉換例項
1
|
正確處理 Linux 平臺下的執行緒結束問題
在 Linux 平臺下,當處理執行緒結束時需要注意的一個問題就是如何讓一個執行緒善始善終,讓其所佔資源得到正確釋放。在 Linux 平臺預設情況下,雖然各個執行緒之間是相互獨立的,一個執行緒的終止不會去通知或影響其他的執行緒。但是已經終止的執行緒的資源並不會隨著執行緒的終止而得到釋放,我們需要呼叫 pthread_join() 來獲得另一個執行緒的終止狀態並且釋放該執行緒所佔的資源。 Pthread_join() 函式的定義如清單 9 。
清單 9. pthread_join 函式定義
1 |
|
呼叫該函式的執行緒將掛起,等待 th 所表示的執行緒的結束。 thread_return 是指向執行緒 th 返回值的指標。需要注意的是 th 所表示的執行緒必須是 joinable 的,即處於非 detached(遊離)狀態;並且只可以有唯一的一個執行緒對 th 呼叫 pthread_join() 。如果 th 處於 detached 狀態,那麼對 th 的 pthread_join() 呼叫將返回錯誤。
如果你壓根兒不關心一個執行緒的結束狀態,那麼也可以將一個執行緒設定為 detached 狀態,從而來讓作業系統在該執行緒結束時來回收它所佔的資源。將一個執行緒設定為 detached 狀態可以通過兩種方式來實現。一種是呼叫 pthread_detach() 函式,可以將執行緒 th 設定為 detached 狀態。其申明如清單 10 。
清單 10. pthread_detach 函式定義
1 |
|
另一種方法是在建立執行緒時就將它設定為 detached 狀態,首先初始化一個執行緒屬性變數,然後將其設定為 detached 狀態,最後將它作為引數傳入執行緒建立函式 pthread_create(),這樣所創建出來的執行緒就直接處於 detached 狀態。方法如清單 11 。
清單 11. 建立 detach 執行緒程式碼例項
1
|
總結與補充
本文以上部分詳細介紹了 Linux 的多執行緒程式設計的 5 條高效開發經驗。另外你也可以考慮嘗試其他一些開源類庫來進行執行緒開發。
1. Boost 庫
Boost 庫來自於由 C++ 標準委員會類庫工作組成員發起,致力於為 C++ 開發新的類庫的 Boost 組織。雖然該庫本身並不是針對多執行緒而產生,但是發展至今,其已提供了比較全面的多執行緒程式設計的 API 支援。 Boost 庫對於多執行緒支援的 API 風格上更類似於 Linux 的 Pthread 庫,差別在於其將執行緒,互斥鎖,條件等執行緒開發概念都封裝成了 C++ 類,以方便開發呼叫。 Boost 庫目前對跨平臺支援的很不錯,不僅支援 Windows 和 Linux ,還支援各種商用的 Unix 版本。如果開發者想使用高穩定性的統一執行緒程式設計介面減輕跨平臺開發的難度, Boost 庫將是首選。
2. ACE
ACE 全稱是 ADAPTIVE Communication Environment,它是一個免費的,開源的,面向物件的工具框架,用以開發併發訪問的軟體。由於 ACE 最初是面向網路服務端的程式設計開發,因此對於執行緒開發的工具庫它也能提供很全面的支援。其支援的平臺也很全面,包括 Windows,Linux 和各種版本 Unix 。 ACE 的唯一問題是如果僅僅是用於執行緒程式設計,其似乎顯得有些過於重量級。而且其較複雜的配置也讓其部署對初學者而言並非易事。