wait函式返回值總結
之前在學習wait和waitpid函式的時候,就對使用巨集WIFEXITED來檢查獲取的程序終止狀態產生過疑惑:一般我們在程式中是呼叫的exit或者_exit函式來退出的,那麼wait和waitpid函式獲取的終止狀態直接就是我們傳遞給exit的引數不就OK了嗎?
後來瞭解到是我考慮簡單了,因為程式退出不僅僅只有我們顯示地呼叫exit這麼簡單,還會有異常退出等情況(關於程式終止的討論請參考APUE 8.5小節),本文就對wait函式獲取的狀態做個總結!
先來對wait status做個整體總結,一般我們通過wait status可以判定子程序發生了以下事件:
(1)子程序通過傳遞一個整形引數給exit(或者_exit)而正常退出
(2)子程序被一個訊號終止
(3)子程序被一個訊號暫停(呼叫waitpid時需指定WUNTRACED標誌)
(4)暫停的子程序被訊號SIGCONT恢復(呼叫waitpid時需指定WCONTINUED標誌)
平時我們說的程序termination status指的只是前兩個wait status(shell中可以通過特殊引數$?來檢視程序的termination status)。
那麼wait status是如何表示這些事件的呢? —— 具體如何表示的,不同的平臺有不同的定義,因為POSIX並沒有對實現做出詳細的定義,這也是為什麼推薦使用巨集來檢查wait status的原因,主要是考慮到程式可移植問題。本文針對x86平臺32位。
通過上圖可以發現,雖然wait status是int型的,但實際上只使用了它的低2個位元組。
高8位用來記錄正常退出狀態,這也正解釋了為什麼程式退出狀態的範圍總是0~255。
低8位用來記錄訊號。
好了,現在來看看這些巨集具體是如何實現的吧!
在/usr/include/i386-linux-gnu/sys/wait.h中
在/usr/include/i386-linux-gnu/bits/waitstatus.h中
接下來我們簡單分析下這幾個巨集:
WIFEXITED/WEXITSTATUS:當程式是正常退出時則WIFEXITED(status)為真,這種情況下WEXITSTATUS(status)返回子程序的退出狀態。
WIFEXITED最後可以簡寫為:
#define WIFEXITED(status) (((status) & 0x7f) == 0)
當WIFEXITED(status)為真則表示((status) & 0x7f)為0,意思是:程式退出不是訊號導致的退出,那麼就是正常退出了。
WEXITSTATUS(status)可以簡寫為:
#define WEXITSTATUS(status) (((status) & 0xff00) >> 8)
先將低8位清零,然後右移8位,則取得高8位數值,即程式正常退出狀態。
WIFSTOPPED/WSTOPSIG:當子程序是因為被一個訊號暫停而返回時則WIFSTOPPED(status)為真,在這種情況下WSTOPSIG(status)返回這個暫停子程序訊號的編號。
WIFSTOPPED(status)可以簡寫為:
#define WIFSTOPPED(status) (((status) & 0xff) == 0x7f)
當wait status低八位數值是0x7f時,則表明子程序是被訊號暫停而返回的。
WSTOPSIG(status)可以簡寫為:
#define WSTOPSIG(status) (((status) & 0xff00) >> 8)
可以發現,在這種情況下,WSTOPSIG(status)與WEXITSTATUS(status)取值方式是一樣的。
WIFCONTINUED:當一個暫停的子程序被訊號SIGCONT喚醒而返回狀態,則WIFCONTINUED(status)為真,否則為假。
WIFCONTINUED(status)可以簡寫為:
#define WIFCONTINUED(status) ((status) == 0xffff)
當wait status低兩個位元組數值為0xfff時,表明一個暫停的子程序被SIGCONT訊號喚醒。
WIFSIGNALED/WTERMSIG/WCOREDUMP:當程式異常終止時WIFSIGNALED(staus)為真,這種情況下WTERMSIG(status)返回終止程序的訊號編號。並且程式異常終止時產生了core檔案的話,則WCOREDUMP(status)為真,否則為假。
WIFSIGNALED(status)可以簡寫為:
#define WIFSIGNALED(status) (((signed char)((status) & 0x7f + 1) >> 1) > 0)
這個巨集的寫法是這些巨集當中最難理解的一個,以下是我的簡單分析過程,對錯還請批評指正!
(status) & 0x7f 的範圍是0 ~ 127
(status) & 0x7f + 1 的範圍是0 ~ 128
那麼(signed char)((status) & 0x7f + 1) 的範圍是1 ~ 127 和一個-128
由此推出:(signed char)((status) & 0x7f + 1) >> 1的範圍是0 ~ 63 和一個-64
由此得出當wait status的低7位數值是0x7f時是不符合要求的,即巨集WIFSIGNALED(status)的這種寫法其實是排除了wait status的低7位數值是0x7f的。因為當低7位是0x7f(第8位為0)時表示的是子程序被訊號暫停。其實現有的平臺的訊號編號也沒有達到127的。
我們知道訊號編號是從1開始的(kill函式對訊號編號0有特殊的處理)。右移一位相當於除以2的操作,1除以2在程式中是等於0的,所有其中的加1操作其實很有技巧性,既利用了訊號編號從1開始這個特性,又排除了127這個數值。
這個巨集還可以如下實現:
#define WIFSIGNALED(status) (!WIFSTOPPED(status) && !WIFEXITED(status))
這樣就好理解了,既不是訊號暫停,又不是正常退出,那麼肯定也不是被訊號SIGCONT喚醒,那就肯定是被訊號終止的情況了,哈哈。
WTERMSIG(status)可以簡寫為:
#define WTERMSIG(status) ((status) & 0x7f)
這個就不用解釋了吧
WCOREDUMP(status)可以簡寫為:
#define WCOREDUMP(status) ((status) & 0x80)
這個也很好理解,就是檢測第8位是否為1,是1,則生成core檔案,否則不生成。
綜上,可以發現APUE的pr_exit函式實現的不夠全,下面給個全面的如下:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/wait.h>
void pr_exit(const char *msg, int status)
{
if (msg)
printf("%s ", msg);
if (WIFEXITED(status)) {
printf("normal termination, exit status = %d\n", WEXITSTATUS(status));
} else if (WIFSIGNALED(status)) {
printf("abnormal termination, signal number = %d(%s)%s\n",
WTERMSIG(status), strsignal(WTERMSIG(status)),
#ifdef WCOREDUMP
WCOREDUMP(status) ? " (core file generated)" : "");
#else
"");
#endif
} else if (WIFSTOPPED(status)) {
printf("child stopped, signal number = %d(%s)\n",
WSTOPSIG(status), strsignal(WSTOPSIG(status)));
}
#ifdef WIFCONTINUED
else if (WIFCONTINUED(status)) {
printf("child continued by SIGCONT signal\n");
}
#endif
else { /* Should never happen */
printf("what happened to this child? (status=%x)\n",
(unsigned int) status);
}
}
PS:C標準對一個有符號數值並且是負數時的右移操作的說明是未實現的,我試了gcc,結果還是負數,對這塊瞭解的不是很多,還請諒解。
參考連結:
參考書籍:
《The Linux Programming Interface》